2017_im2latex_original

arXiv: 1609.04938

这个代码是根据arXiv: 1609.04938进行改编的，去除attention后的模型。encoder为multi-CNN，decoder为RNN。
_att为原文中加了attention的模型。

训练和参数

具体参数见params.py。

python main.py --train
python main_att.py --train

在训练之前，需对formula进行分割。分割后的formula在Dataset中。含有.norm的均为分割后的formula.

原文给出的实验结果如下，需要大量的数据样本作为支撑。可以看到，在training set size为10k时，test accuracy为25%左右。

本文采用的training set size为1000，vocab_size为278，实验结果如下

bleu = 0.034904671179405385
edit_distance = 0.18055868438837575

可以看出，由于实验所用training set size过小，导致训练结果比原文差。

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
Dataset		Dataset
Evaluation		Evaluation
logs		logs
src		src
src_att		src_att
vocab		vocab
.DS_Store		.DS_Store
README.md		README.md
main.py		main.py
main_att.py		main_att.py