[211018] CS, CRM/ 감성분석, 챗봇 서비스

[211018] CS, CRM/ 감성분석, 챗봇 서비스

1. CRM(customer relationship management): 고객 정보를 IT 기술을 이용하여 수집, 분석한 뒤 활용하는 마케팅 방법

- 고객을 분석하여 실제적인 이익을 창출하고자 하는 목적 (고객의 목적을 정확히 파악 가능)

- 군집화가 아닌 정보를 (더욱 세분화된) 개인화 시킬 수 있다.

(1) CRM 기술

- 빈도 분석: 정형 데이터(수치)에서 통계값을 낸다.

- 감성 분석: 사용자의 만족에 대한 긍정/ 부정/ 중도 등

(2) 주요 연관 키워드 분석

- 고유명사 분석/ 인간이 인식하고 외울 수 있는 단어의 최대치가 존재하기 때문에 수많은 데이터 자체에서는 인사이트를 찾아낼 수 없다. 때문에 인간이 categorize 해준다. (군집화는 단순히 집단을 생성해 나눠줄 뿐 그것이 어떤 집단인지까지 도출해내기는 힘들다.)

(3) 층화 추출 (성별, 나이, 지역, 사용중인 서비스 등)

(4) JAVA> Python 코드 변환을 위해 JPype를 사용해준다.

(5) encoding

*CP-949, EUC-KR= 이 둘은 둘 다 ANSI

*단 UTF-8은 호환 불가

2. 텍스트 마이닝

3. 감성분석

(1) VOC용 감성단어 선정

(2) Encoder를 통해 pilot 문서 내 소속 단어를 긍정/ 부정 나누기

(3) 감성단어 사전에 추가/ 제외 반복 (긍정적 단어 +1, 부정적 단어 -1 등 감성점수 계산)

*sigmoid 함수를 사용하여 값을 0~1 사이로 정규화하는 방법도 존재

*비정형 데이터 machine learning= 문서 행렬 document term matrix 이용= DTM

4. 챗봇

챗봇의 구조

(1) 형태소 분석기 사용하여 분석

(2) 검증 데이터를 통해 중간 검증, 테스트 데이터를 통해 최종 검증 (train_test_split 사용)

(3) 데이터 변환 후 tokenizing, data padding (<데이터의 길이를 고정시켜 준다. 길이를 고정하여 텐서의 크기를 맞춰준다.)

data padding

(4) one-hot encoding (숫자로 치환된 label이 다중분류 시 알맞은 곳에 표시될 수 있게. 패딩 0 고려)

(5) train, test data 준비

(6) 모델 구성 및 설계

(7) compile& train model

(8) 모델 성능 확인

(9) 숫자 label을 답변에 맞게 치환

from http://devlvup8253.tistory.com/15 by ccl(A) rewrite - 2021-10-21 21:27:49