-
Notifications
You must be signed in to change notification settings - Fork 7
Cold start 문제 개선
thkyang324 edited this page Feb 7, 2023
·
30 revisions
사용하는 추천모델의 입력과 출력은 모두 아이템입니다.
기존 방식 보기
- 오늘의 집의 "집들이" 글을 통해 이미지와 스타일 라벨 수집
- 스타일 별로 5개의 이미지를 무작위로 선택 (스타일 카테고리 개수 11개 * 무작위 5개 = 55개의 이미지)
- 회원가입 시 55개의 이미지를 유저에게 보여주고, 5개 이상의 취향에 맞는 이미지를 선택
- 유저가 고른 이미지에서 사용된 상품 중 소파, 선반처럼 유저의 취향이 반영되어 있는 카테고리의 상품을 유저의 Default 데이터로 활용
저희는 새로운 유저에 대한 추론 데이터셋을 다음과 같이 구성했습니다.
만약 55개의 이미지 중 사용자 취향에 맞지 않는 이미지가 보여진다면 어떨까요?
기존 방식의 문제점
기존 방식에선 스타일이라는 라벨을 통해 보여지는 이미지를 구분했습니다. 뭐가 문제일까요?
스타일 라벨 별 데이터 분포가 고르지 못한것을 볼 수 있습니다. 이러한 불균형을 포함한 데이터를 신뢰하긴 힘들어 보입니다.
왼쪽은 내추럴로 분류되어 있는 이미지입니다. 저는 모던이라고 생각하는데.. 어떠신가요?
스타일은 이처럼 주관적인 생각이 많이 반영됩니다. 스타일 라벨만으로 이미지를 구분하긴 어려워 보이네요.
오른쪽 사진들을 스타일별로 구분하긴 힘들어 보입니다. 특히 사람이 등장하는 이미지는 인테리어보단 재미있게 짐볼을 타는 귀여운 아이들에 시선이 쏠리네요.
- 사람이 등장하면 시선이 분산됩니다. 필터링을 진행하겠습니다.
- 스타일이 아닌 다른 방법으로 이미지를 나누어 봅시다.