- Porto Seguro’s Safe Driver Prediction 경진대회
- Metadata 정의 및 데이터프레임화
- 캐글은 어렵다..
- Bike Sharing Demand 경진대회
- 데이터 사이언스 입문당시 DSSCHOOL에서 배운내용.
- 시계열 데이터에대한이해 및 예측
- Web을 뒤지다가 나온 XGBoost 이해를 돕기위한 자료
- 디시젼트리 -> 랜덤포레스트 -> XGBoost 형태로 진화.
- 실제 B2B 식자재 유통 기업의 데이터를 제공받아 분석
- 유사도 개념정립 및 전처리.
- qty에 초점을 맞춰서 추천시스템 설계 하려다가 실패함. 그게 중요한게 아니었음.
- 수량단위가 BoX, EA, 등등 너묵 각양각색이었기때문
- 기존에 있던 대회를 재구성하여 캐글코리아 측에서 진행한 대회
- 상품을 지급해주는 순위권안에 들어서 TF 후드티 받을예정 :)
- LGBM을 아주 장시간 오래오래 학습시키는 무모한 짓으로 순위에 듬.
- 추후 알게된것은 Linear Transformation 테크닉의 하나인 Matrix Rotation을 적용하면 성능이 향상된다더라..
- 파이썬 역사
- low level vs high level programming language
- 데이터 타입 및 변수
- list, tuple, dictionary, set
- 연산자
- 흐름제어
- 사용자 정의 함수
- 일반인자, 키워드 인자
- 내장,
- 머신러닝 기반 텍스트분석 프로세스 순서
- Bag of Word (BoW)
- TF-IDF