ml-double-q-learning
Library implementing the double-q-learning algorithm.
paper: https://papers.nips.cc/paper/3964-double-q-learning.pdf
Install
npm install ml-double-q-learning
DoubleQLearningAgent
Memory (from ml-q-learning)
Pick action strategy (from ml-q-learning)
randomPickAction
greedyPickAction
epsilonGreedyPickAction
decayingEpsilonGreedyPickAction
softmaxPickAction
epsilonSoftmaxGreedyPickAction
decayingEpsilonSoftmaxGreedyPickAction
Example use
Maze escape
P - Player
# - Wall
. - Nothing
X - Trap = -200
R - Treasure = 200
F - Finish = 1000
Start maze[ [ 'P', '.', '.', '#', '.', '.', '.', '#', 'R' ], [ '.', '#', '.', '#', '.', '.', '.', '#', '.' ], [ '.', '#', '.', '#', '.', '#', '.', '#', '.' ], [ '.', '#', 'X', '#', '.', '#', '.', '.', '.' ], [ '.', '#', '#', '#', 'F', '#', '.', '.', '.' ], [ '.', '#', '.', '#', '#', '#', '.', '#', 'X' ], [ '.', '.', 'X', '.', '.', '.', '.', '#', '.' ], [ '.', '.', '.', '.', '#', '.', '.', '#', 'R' ] ] ...many plays... ------------------------------- numberOfPlay: 35702, score: 1168 episode: 3322672 memorySize: 968------------------------------- [ [ '.', '.', '.', '#', '.', '.', '.', '#', '.' ], [ '.', '#', '.', '#', '.', '.', '.', '#', '.' ], [ '.', '#', '.', '#', '.', '#', '.', '#', '.' ], [ '.', '#', 'X', '#', '.', '#', '.', '.', '.' ], [ '.', '#', '#', '#', 'P', '#', '.', '.', '.' ], [ '.', '#', '.', '#', '#', '#', '.', '#', 'X' ], [ '.', '.', 'X', '.', '.', '.', '.', '#', '.' ], [ '.', '.', '.', '.', '#', '.', '.', '#', 'R' ] ]