Push上去的版本没有带学习好的参数,每次都是从头学习,首次跑数百没问题,AI学了1小时候跑到1k分。
后面的错误很难重现,所以学习速度变慢,目前还没到2048,不过比另外一个AI(http://mvirkkunen.github.io/Flappy-2048-AI/)强。
围观AI玩: http://catx.me/Q-Learning-Flappy-2048/
原理: http://catx.me/2014/03/20/beat-flappy-2048-with-q-learning/
后面的错误很难重现,所以学习速度变慢,目前还没到2048,不过比另外一个AI(http://mvirkkunen.github.io/Flappy-2048-AI/)强。
围观AI玩: http://catx.me/Q-Learning-Flappy-2048/
原理: http://catx.me/2014/03/20/beat-flappy-2048-with-q-learning/