- Template directory for datascience competitions.
- Data is stored in PostgreSQL on Docker🐳 container and the data is reproducibule/reusable 😄🎉
git clone [email protected]:kiccho1101/datascience-template.git
cd kaggle-template
Download them from https://www.kaggle.com/c/titanic
All you have to do is run init.sh. It will create PostgreSQL container with input data! 🎉
sh init.sh
make kfold {CONFIG_NAME}
# Example
make kfold basic
make feature [FEATURE_NAME]
# Example
make feature FamilySize
make cv {EXP_NAME}
# Example
make cv exp1
make predict {EXP_NAME}
# Example
make predict exp1
docker-compose up -d pgweb
make pgweb
make jupyter
make run python xxx.py
make format
まさに特徴量管理に疲弊していたときに見つけたスライド。すごくわかりやすいです。
クラスの書き方でかなり参考にさせていただきました。
このディレクトリを作ろうと思ったきっかけになったディレクトリ。