Skip to content

[NLP] 한국외국어대학교 캡스톤 프로젝트 (최우수상) / 고객의 소리 자동 분석 시스템 - 우아한프렌즈팀

Notifications You must be signed in to change notification settings

somi198/Uplus-VOC-Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

고객의 소리 자동 분석 시스템

본 프로젝트에서 개발한 모델은 리뷰 분석 플렛폼으로 데이터 수집부터 결과 시각화까지 자동화하여 서비스한다. 데이터 수집 대상은 LGU+ 관련 어플리케이션의 리뷰이고, 수집된 데이터를 이용해 자체적으로 fine-tuning한 BERT모델인 ELBERT의 감성 분류를 사용하여 부정 리뷰만을 추출한다. 이후 LDAvis를 이용해 topic별로 분류한 결과를 대시보드 형식으로 시각화하여 사용자에게 인사이트를 제공한다.

1. 데이터 수집

구글 플레이스토에 있는 U+ 고객센터, U+ 멤버스, U+ 모바일 TV, U+ 뮤직벨링, U+ 스마트홈 총 5개 어플에서 리뷰를 추출

  • U+ 멤버스: 약 14397개
  • U+ 모바일 TV: 약 16361개
  • U+ 고객센터: 약 13149개
  • U+ 뮤직벨링: 약 7571개
  • U+ 스마트홈: 약 2148개

=> 총 5개의 어플 중 U+ 고객센터 앱만으로 학습 진행

  • 라벨링 기준


2. 감성 분류

=> ELBERT (Elegant Friends BERT) 자체 모델 생성


3. 클러스터링

  • 전처리

    1. 문법 교정
    2. 단어 치환 (치환 사전 구축)
    3. 토큰화 (Mecab 사용)
    4. 불용어 처리 (불용어 사전 구축)
  • gensim을 활용한 LDA 모델 학습

    • 토픽 수 결정

      1. 그래프 상에서 처음으로 가장 급격한 경사가 나타나는 점을 기준으로 토픽 수를 정함
      2. 클러스터 결과를 확인하며 수치를 조정하여 최종적으로 토픽 수 확정
    • 토픽 벡터 시각화

      image


4. 시각화

  • 엑셀 대시보드를 활용

    • 분기별 리뷰 데이터 추이
    • 분기별 긍정/부정/기타 비율
    • 클러스터 비율
    • 클러스터별 등장 빈도수가 높은 단어
    • 분기별 클러스터 추이

    U+고객센터 앱의 2016년도 1분기 ~ 2021년도 1분기까지의 리뷰에 대한 정보를 담고 있는 대시보드이다. 필터가 있어 분기별, 주제별로 원하는 정보를 선택적으로 얻을 수 있다. 분기 별 불만 사항으로 앞으로 어떤 문제를 해결해야 하는지의 방향성을 도출할 수 있다.

한국외국어대학교 컴퓨터전자시스템공학부 우아한프렌즈팀
팀원: 김소미, 이승윤, 제서윤, 최석원

About

[NLP] 한국외국어대학교 캡스톤 프로젝트 (최우수상) / 고객의 소리 자동 분석 시스템 - 우아한프렌즈팀

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published