本书以理论和实践相结合的形式深入浅出地介绍强化学习的历史、基本概念、经典算法和一些前沿技术,共分为三大部分:第壹部分(1~5章)介绍强化学习的发展历史、强化学习的基本概念以及一些经典的强化学习算法;第二部分(6~9章)在简要回顾深度学习技术的基础上着重介绍深度强化学习的一些前沿实用算法;第三部分(很后一章)以五子棋为例详细讲解战胜了人类很好围棋选手的Alpha Zero算法的核心思想。叶强,医学博士、计算机科学硕士,先后毕业于上海交通大学和蒙特利尔大学。长期从事眼科临床工作,主要科研方向为视觉神经细胞的计算模型和医学信息学。获国家发明一项,实用新型多项,软件著作权多项。在靠前次规范、系统地实现了移动客户端自助视力检查软件系统。近年来,主要研究方向为人工智能技术及其在临床医学和医学信息学中的应用。
|