本文是对《A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)》的转载。写的太好太清晰了!禁不住转载一下!!!原链接
Q-learing 的核心算法思想是 Q表格————基于R表格及其自身搭建。 搭建的公式是 $Q(s,a) = R(s,a) + γ * max\{Q(s’,a’)\}$