shiFu/ # 我们的github1项目
my_project/ # 存放我们的项目代码
data.py # 生成data_loader
data_process.py # 数据预处理,split,generate hd5
engine.py # 封装train,val,predict方法
models_engine.py # 工厂模式,封装engine.py和model/...py
utils.py # 一些有用的方法
train.py # main方法
config.py # 运行的所有配置
model/ # 存放模型.py
xDeepFM.py
...
baseline/ # 已经公开的源代码
FM/
xDeepFM/
export/ # 数据探索&可视化(存放jupyter或者html数据探索文件)
data/
track1/ # 第一个赛道的数据,大约40G
... # 各种csv(原始数据)
track2/ # 第二个赛道的数据,大概5G
...
cache/
track1/
checkpoints/ # 用来存放模型文件
runs/ # 用来存在运行的记录(比如说tensorboard可视化文件)
result/ # 存放提交的csvfile
tmp/ # 存放data_process.py分离的train, val数据
...
hd5/ # 存放hd5大文件
track2/
checkpoints/ # 用来存放模型文件
runs/ # 用来存在运行的记录(比如说tensorboard可视化文件)
result/ # 存放提交的csvfile
tmp/ # 存放data_process.py分离的train,val数据
...
hd5/ # 存放hd5大文件
step one
查看config.py
文件,选择运行track1
还是track2
的数据。
step two
python data_process.py # 切分成train-val(8:2),生成hd5文件
step three
python train.py
你只需要在model/
文件夹下添加你的模型文件和在config.py
添加模型配置就可以了。
接口...
config.py