RecommendU ์๋น์ค์์ ์ถ์ฒ์์คํ ๋ชจ๋ธ๋ง ๊ณผ์ ์ ํฌ๊ฒ ๋ ๊ฐ๋ก ๋๋ฉ๋๋ค.
- ์ ์ -์๊ธฐ์๊ฐ์ ๋ฌธํญ๊ฐ ์ํธ์์ฉ ๋ฐ์ดํฐ ์์ง์ ์ํ Content-based Filtering ๋ชจ๋ธ๋ง ๊ณผ์
- ๊ฐ์ธํ๋ ์ถ์ฒ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ Model-based Collaborative Filtering ๋ชจ๋ธ๋ง ๊ณผ์
์ด ์ค ๋ ๋ฒ์ ๋ชจ๋ธ๋ง์ ์งํํ๋ฉฐ ๊ฐ์ฅ ์ ๊ฒฝ์ผ๋ ๋ถ๋ถ์ ์ถ์ฒ์ ์ ๊ณตํ๋ ๊ณผ์ ์ ๋ํ ์ฌ์ฉ์์ ๋งฅ๋ฝ๊ณผ latency์ ๋๋ค. ์ด๋ฅผ ๋ฐ์ํ๊ธฐ ์ํด์๋ ์ถ๋ก ํด์ผํ ์๊ธฐ์๊ฐ์ ๋ฌธํญ์ ์ค์ด๋ Retrieval ๊ณผ์ ์ด ํ์์์ต๋๋ค.
๊ฒฐ๊ณผ๊ฐ์ ๋ด์ผํ ์์ดํ ์๋ฅผ ์ค์ด๋ Retrieval ๊ณผ์ ์ ๊ฐ ๋ฐฐํฌ ๋จ๊ณ ๋ชจ๋ ๋์ผํ ์๋ฆฌ๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, ์์ดํ ๊ฐ์ ์์๋ฅผ ์ ํด์ฃผ๋ Ranking ๊ณผ์ ์์์ ์ฐจ์ด๊ฐ 1์ฐจ ๋ฐฐํฌ์ ๋ํ ๋ชจ๋ธ๊ณผ 2์ฐจ ๋ฐฐํฌ์ ๋ํ ๋ชจ๋ธ์์ ๋๋๊ฒ ๋ฉ๋๋ค.
Retrieval: ์ ์ ์ ๊ด์ฌ ํ์ฌ, ๊ด์ฌ ๋ถ์ผ, ๊ด์ฌ ์ง๋ฌด, ์ง๋ฌธ์ ๋ฐ๋ผ ์๋ก ๋ค๋ฅด๊ฒ ์ ์ฉ๋ ๊ฐ์ค์น๋ฅผ ๋ฐ๋ผ์ ์ ๋ ฌ ํ, Top N๊ฐ๋ก ์ถ๋ ค๋ ๋๋ค.
Model workflow Content-based Filtering
Ranking
- ๋ต๋ณ์ด ์๋ ๊ฒฝ์ฐ: 1์ฐจ ๋ฐฐํฌ๋ ์ ์ ๋ค์ด ๋ค์ํ ์๊ธฐ์๊ฐ์ ๋ฌธํญ๊ณผ์ ์ํธ์์ฉ์ ์์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๊ณ ์ ํ๊ธฐ ๋๋ฌธ์, ์ถ๋ ค์ง ์๊ธฐ์๊ฐ์ ๋ฌธํญ์ random samplingํ์ฌ ์ ์ ์๊ฒ ์ถ์ฒํฉ๋๋ค.
- ๋ต๋ณ์ด ์๋ ๊ฒฝ์ฐ: ๋ต๋ณ์ด ์กด์ฌํ ๋, ๋ต๋ณ๊ณผ ์ ์ฌํ ์๊ธฐ์๊ฐ์๋ฅผ ์ถ์ฒํด์ฃผ๋ ๊ฒ์ด ์ฐ์ ์ด์๊ธฐ์, ๋ต๋ณ๊ณผ ์ถ๋ ค์ง ๋ฌธํญ๋ค ๊ฐ์ ์ฝ์ฌ์ธ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ดํ ์ฝ์ฌ์ธ ์ ์ฌ๋ ์์ผ๋ก ์ ๋ ฌํ์ฌ ์ ์ ์๊ฒ ์ถ์ฒํฉ๋๋ค.
Model workflow Model-based Collarboratve Filtering
Ranking
- ๋ต๋ณ์ด ์๋ ๊ฒฝ์ฐ: ์ ์ ์ ์๊ธฐ์๊ฐ์ ๋ฌธํญ๊ฐ ๊ด๊ณ๋ฅผ ํ์ตํ GBDT ๊ณ์ด์ CatBoost๋ฅผ ํ์ฉํ๋ค. ๋ต๋ณ์ด ์กด์ฌํ์ง ์์ ๊ฒฝ์ฐ, ์ถ๋ ค์ง ์๊ธฐ์๊ฐ์ ๋ฌธํญ์ ํ๋ฅ ๊ฐ์ผ๋ก ์์๋ฅผ ๋งค๊ฒจ ์์๋ฅผ ์ ํ ํ ์ ์ ์๊ฒ ์ถ์ฒํฉ๋๋ค.
- ๋ต๋ณ์ด ์๋ ๊ฒฝ์ฐ: ๊ณ์ฐ๋ ์ฝ์ฌ์ธ ์ ์ฌ๋์ CatBoost์ ํ๋ฅ ๊ฐ์ ๋ํ์ฌ ์์๋ฅผ ๋งค๊ฒจ ์ ์ ์๊ฒ ์ถ์ฒํฉ๋๋ค.