GitHub - Pehlevan-Group/inf_transformer_limits: Transformers at Infinite Width and Depth

Implementation of vision and language model transformers from the paper https://arxiv.org/abs/2405.15712.

This also contains modification to the Allen AI OLMo codebase https://github.com/allenai/OLMo to allow for infinite width and depth limits when training on C4.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
OLMO_LLM		OLMO_LLM
LICENSE		LICENSE
README.md		README.md
early_conv_vit_sweeps.py		early_conv_vit_sweeps.py
language_expts.ipynb		language_expts.ipynb
learn_gates_scaling.ipynb		learn_gates_scaling.ipynb
run_C4_sweep.sh		run_C4_sweep.sh
run_cifar_sweep.sh		run_cifar_sweep.sh
run_early_conv_cifar.sh		run_early_conv_cifar.sh
simple_gating_NN.ipynb		simple_gating_NN.ipynb
train_C4.py		train_C4.py
train_vit_cifar.py		train_vit_cifar.py
train_vit_vary_depth_cifar.py		train_vit_vary_depth_cifar.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

License

Pehlevan-Group/inf_transformer_limits

Folders and files

Latest commit

History

Repository files navigation

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages