arXiv: 1609.04938
这个代码是根据arXiv: 1609.04938进行改编的,去除attention后的模型。encoder为multi-CNN,decoder为RNN。
_att为原文中加了attention的模型。
具体参数见params.py。
python main.py --train
python main_att.py --train
在训练之前,需对formula进行分割。分割后的formula在Dataset中。含有.norm的均为分割后的formula.
原文给出的实验结果如下,需要大量的数据样本作为支撑。可以看到,在training set size为10k时,test accuracy为25%左右。
本文采用的training set size为1000,vocab_size为278,实验结果如下
bleu = 0.034904671179405385
edit_distance = 0.18055868438837575
可以看出,由于实验所用training set size过小,导致训练结果比原文差。