Dags Crawl-Extract-Transform-Load pipeline
RecommendU์ ํต์ฌ ๋ฐ์ดํฐ๋ ์ทจ์ ํฌํธ ์ฌ์ดํธ์ ํฉ๊ฒฉ ์๊ธฐ์๊ฐ์๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ๋ ์ง์์ ์ผ๋ก ์ ๋ฐ์ดํธ๋๊ฑฐ๋ ์ญ์ ๋๊ธฐ ๋๋ฌธ์, RecommendU ์๋น์ค์์ ์ด ๋ณํ๋ฅผ ๋ฐ์ํ๋ฉด ์ฌ์ฉ์๋ค์ด ์ทจ์ ์์ฅ์ ๋ํฅ, ์ ๊ท ์ง๋ฌธ ํญ๋ชฉ ๋ฐ ๊ธฐ์ ์๊ตฌ์ฌํญ์ ๋์ฑ ๋น ๋ฅด๊ฒ ๋์ํ ์ ์์ต๋๋ค. ์ด๋ฅผ ์ํด, Apache Airflow๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์์ง๋ถํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ ์ฌ๊น์ง์ ๊ณผ์ ์ ์๋ํํ๋ฉฐ, ๋ฐฐ์น ํ๋ก์ธ์ค๋ฅผ ๊ตฌ์ถํ์ต๋๋ค.
- ๋ฐ์ดํฐ ํฌ๋กค๋ง
- raw data๋ก๋ถํฐ ๋ฐ์ดํฐ ์ถ์ถ
- ์ถ์ฒ์์คํ ๊ฒฐ๊ณผ ๋ฐ์์ ์ํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ ์ฌ