ChangyuChen347

ChangyuChen347

Popular repositories Loading

MaskedThought MaskedThought Public

[ACL 2024] Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models

Python 15 1
semi-offline-RL semi-offline-RL Public

Semi-Offline Reinforcement Learning for Optimized Text Generation

Python 8
RL4LM RL4LM Public

Forked from allenai/RL4LMs

A modular RL library to fine-tune language models to human preferences

Python
COMET-VAE COMET-VAE Public