Requirements

The implementation of Parameter Differentiation based Multilingual Neural Machine Translation.

Requirements

pip install fairseq==0.10.2
conda install scikit-learn
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch

Usage

Prepare data following fairseq:

unzip data-bpe.zip

mkdir -p data-bin && cut -f1 data-bpe/bpe.vocab | tail -n +4 | sed "s/$/ 100/g" > data-bin/dict.en.txt

for lang in es pt; do
    fairseq-preprocess --source-lang en --target-lang $lang \
        --trainpref data-bpe/train.en-$lang \
        --validpref data-bpe/valid.en-$lang \
        --testpref  data-bpe/test.en-$lang  \
        --destdir data-bin \
        --srcdict data-bin/dict.en.txt \
        --tgtdict data-bin/dict.en.txt 
done

Training:

Multilingual NMT:

fairseq-train data-bin --user-dir . --max-tokens 4096 --max-update 20000 \
    --task multilingual_translation --lang-pairs es-en,pt-en  \
    --arch parameter_differentiation_tiny_model --share-all-embeddings --share-encoders --share-decoders  \
    --lr-scheduler inverse_sqrt --optimizer adam --lr 0.0015 --validate-interval 4

Parameter differentiation based MNMT

fairseq-train data-bin --user-dir . --max-tokens 4096 --max-update 20000  \
    --task parameter_differentiation_task --lang-pairs es-en,pt-en  \
    --arch parameter_differentiation_tiny_model --share-all-embeddings  \
    --lr-scheduler inverse_sqrt --optimizer adam --lr 0.0015 --validate-interval 4

Decoding

fairseq-generate data-bin --user-dir . --max-tokens 4096 --quiet \
    --task parameter_differentiation_task --lang-pairs es-en,pt-en \
    --remove-bpe sentencepiece --source-lang es --target-lang en \
    --path checkpoints/checkpoint_last.pt

fairseq-generate data-bin --user-dir . --max-tokens 4096 --quiet \
    --task parameter_differentiation_task --lang-pairs es-en,pt-en \
    --remove-bpe sentencepiece --source-lang pt --target-lang en \
    --path checkpoints/checkpoint_last.pt

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
__init__.py		__init__.py
data-bpe.zip		data-bpe.zip
model.py		model.py
readme.md		readme.md
task.py		task.py
view.py		view.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Requirements

Usage

About

Releases

Packages

Languages

voidmagic/parameter-differentiation

Folders and files

Latest commit

History

Repository files navigation

Requirements

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages