CommonLit Readability Prize

4th place solution code for the CommonLit Readability prize hosted on Kaggle (August 2021) https://www.kaggle.com/c/commonlitreadabilityprize

The writeup can be found here: https://www.kaggle.com/c/commonlitreadabilityprize/discussion/258148

Setup

Edit src/config.py to reflect the input and output locations on your machine

Training

To train a single model using a config listed in hyperparams.yml run:

python train.py --config <config_name>

To run a 5-fold cross validation, using 5 different seeds, use the shell script train.sh. This script will also run infer.py and generate out-of-fold (OOF) predictions for stacking models.

sh train.sh <config_name>

Inference

The final submission code that was used for inference in a Kaggle notebook is in the submissions folder

submission.py - Public RMSE: 0.451, Private RMSE: 0.447
submission_netflix.py - Public RMSE: 0.452, Private RMSE: 0.446

Name		Name	Last commit message	Last commit date
Latest commit History 82 Commits
notebooks		notebooks
src		src
submissions		submissions
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
agg_scores.py		agg_scores.py
hyperparams.yml		hyperparams.yml
infer.py		infer.py
requirements.txt		requirements.txt
submission_checker.sh		submission_checker.sh
train.py		train.py
train.sh		train.sh
upload_data.py		upload_data.py
writeup.md		writeup.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CommonLit Readability Prize

Setup

Training

Inference

About

Releases

Packages

Languages

License

Anjum48/commonlitreadabilityprize

Folders and files

Latest commit

History

Repository files navigation

CommonLit Readability Prize

Setup

Training

Inference

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages