Skip to content

shoman2/ds_study_materials

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

55 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

데이터싸이언스(데싸)

1.Introduction 및 잡담 (생략)

2.Kaggle 공부

  • Porto Seguro’s Safe Driver Prediction 경진대회
  • Metadata 정의 및 데이터프레임화
  • 캐글은 어렵다..

3.Kaggle 공부

  • Bike Sharing Demand 경진대회
  • 데이터 사이언스 입문당시 DSSCHOOL에서 배운내용.
  • 시계열 데이터에대한이해 및 예측

4.Bagging vs. Boosting

  • Web을 뒤지다가 나온 XGBoost 이해를 돕기위한 자료
  • 디시젼트리 -> 랜덤포레스트 -> XGBoost 형태로 진화.

5.실데이터를 활용한 추천시스템 설계

  • 실제 B2B 식자재 유통 기업의 데이터를 제공받아 분석
  • 유사도 개념정립 및 전처리.
  • qty에 초점을 맞춰서 추천시스템 설계 하려다가 실패함. 그게 중요한게 아니었음.
  • 수량단위가 BoX, EA, 등등 너묵 각양각색이었기때문

6. 캐글코리아 2nd Competition 시애틀 King's County 집값 예측

  • 기존에 있던 대회를 재구성하여 캐글코리아 측에서 진행한 대회
  • 상품을 지급해주는 순위권안에 들어서 TF 후드티 받을예정 :)
  • LGBM을 아주 장시간 오래오래 학습시키는 무모한 짓으로 순위에 듬.
  • 추후 알게된것은 Linear Transformation 테크닉의 하나인 Matrix Rotation을 적용하면 성능이 향상된다더라..

7. Python 문법기초1

  • 파이썬 역사
  • low level vs high level programming language
  • 데이터 타입 및 변수
  • list, tuple, dictionary, set

7.1 Python 문법기초2

  • 연산자
  • 흐름제어

7.1 Python 문법기초3

  • 사용자 정의 함수
  • 일반인자, 키워드 인자
  • 내장,

8. 텍스트분석 기초 정리

  • 머신러닝 기반 텍스트분석 프로세스 순서
  • Bag of Word (BoW)
  • TF-IDF

9. Linear Regression (Bike Sharing Demand)

10. 데이터 사이언스 포트폴리오

About

데싸 공부내용 정리

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published