库中比较完整的保存了整个项目过程,因此文件较多,但其中有11个关键文件,分别是:
- proposal.md:开题报告md格式
- proposal.pdf:开题报告pdf格式
- report.md:最终报告md格式
- report.pdf:最终报告pdf格式
- submit-final.csv:最终模型测试集输出结果
- process-1.ipynb:评审前最终模型的训练文件
- process-6.ipynb:根据评审反馈意见重新调整的代码
- Visual.ipynb:可视化的文件
- robust-1.ipynb:验证健壮性的文件
- rossmann.model:最终模型
- dtest.buffer:存储测试集的DMatrix
- dtrain.buffer:存储训练集的DMatrix
- dval.buffer:存储验证集的DMatrix
这些文件放在了百度网盘中:https://pan.baidu.com/s/10_1CR9VEfuk-YXudnp_1aw
- numpy
- sklearn
- xgboost
- matplotlib
- pandas
- time
- IPython.display
Python 3.6.5 | packaged by conda-forge | (default, Apr 6 2018, 13:44:09) [GCC 4.2.1 Compatible Apple LLVM 6.1.0 (clang-602.0.53)] on darwin
MacBook Pro (13-inch, 2017, Two Thunderbolt 3 ports) 处理器 2.3GHz Intel Core i5 内存 16GB 2133MHz LPDDR3 显卡 Intel Iris Plus Graphics 640 1536 MB 系统 macOS High Sierra v10.13.4
- 5928s
- 1.65h