Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md
main.py		main.py

Repository files navigation

Q-Learning - Exercício

Considere o ambiente 3 x 2 onde a posição 6 é o estado terminal

Assuma que as ações UP, DOWN, LEFT e RIGHT são determinísticas

Recompensas:

+10 no estado 6 -10 se bater na parede -1 nos outros casos

Aplicar o Q-learning sequencialmente usando as seguintes trajetórias:

Estado inicial 1, sequência U,U,U,R

Estado inicial 5: sequência R,R,L,U

Inicialize a matriz Q com zeros e assuma alpha = 0.5 e gamma = 0.8

About

Q-learning algorithm

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%