BRAC+: Improved Behavior Regularized Offline Reinforcement Learning

This repository is the official implementation of BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning.

Requirements

We high recommend that you create a new Python environment to test our code

Conda Environment

conda create -n bracp python=3.8

To install requirements:

Python package

pip install -r requirements.txt

D4RL library

pip install git+https://github.com/rail-berkeley/d4rl@master#egg=d4rl

rlutils library

pip install rlutils-python==0.0.3

Training

python d4rl_bracp.py train --env_name halfcheetah-medium-v0 --seed 110

The script will first pretrain the behavior policy and the initial policy that minimize the KL divergence.

Logging

The logs will be placed at data/d4rl_results/

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
ablation.ipynb		ablation.ipynb
ablation.py		ablation.py
bracp.py		bracp.py
d4rl_bracp.py		d4rl_bracp.py
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BRAC+: Improved Behavior Regularized Offline Reinforcement Learning

Requirements

Conda Environment

Python package

D4RL library

rlutils library

Training

Logging

About

Releases

Packages

Contributors 2

Languages

License

vermouth1992/bracp

Folders and files

Latest commit

History

Repository files navigation

BRAC+: Improved Behavior Regularized Offline Reinforcement Learning

Requirements

Conda Environment

Python package

D4RL library

rlutils library

Training

Logging

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages