reinforcement-learning-experiments

Experiments and implementations of various reinforcement learning algorithms. References Sutton & Barto.

nonstationary-k-armed-bandit

An experiment to demonstrate the difficulties that sample-average methods have for non-stationary problems.

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
.devcontainer		.devcontainer
nonstationary-k-armed-bandit		nonstationary-k-armed-bandit
planning-to-monte-carlo		planning-to-monte-carlo
reinforce-with-baseline		reinforce-with-baseline
semi-gradient-td-function-approximation-tc-nn		semi-gradient-td-function-approximation-tc-nn
true-online-sarsa-tile-coding		true-online-sarsa-tile-coding
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt