Check out Wrap Up Report at Link
- 대회 내용 : Movie Recommendataion(사용자의 영화 시청 이력 데이터를 바탕으로 사용자가 다음에 시청할 영화 및 좋아할 영화를 예측)
- 평가지표 : Recall@10
- Ml_item2attributes.json : 영화(item)에 대한 속성을 담은 json 파일
- directors.tsv : 영화(item)에 대한 감독 데이터
- genres.tsv : 영화(item)에 대한 장르 데이터
- titles.tsv : 영화(item)에 대한 제목 데이터
- writers.tsv : 영화(item)에 대한 작가 데이터
- years.tsv : 영화(item)에 대한 연도 데이터
- train_ratings : 31,360명의 사용자(user)가 6,807개의 영화(item)를 시청한 데이터
- EDA
- user의 시청기록 분석
- 이상치 제거
- user가 시청한 영화 장르에 따른 clustering
- Feature Engineering
- 추가한 feature
- 각 feature 추가/제거 실험
- 모델
- General model : EASE, ADMMSLIM, RecVAE, NCEPLRec
- Context-aware model : xDeepFM, FM, FFM
- Sequential model : S3Rec, SASRec
- 하이퍼 파라미터 튜닝
- HyperOpt, Ray, WandB
- Ensemble