随机学习与优化在现代工程、社会、金融问题中具有广泛的应用。《随机学习与优化:基于灵敏度的方法》以一个统一的框架,涵盖了离散事件动态系统的摄动分析、马尔可大决策过程、强化学习、辨识和自适应控制等学习和优化的不同学科;并利用基于性能差分公式的简单方法介绍马尔可夫决策过程理论,通过该方法能求得以长期平均代价为准则的n阶偏差优化策略以及无折扣的Blackwell优化策略。《随机学习与优化:基于灵敏度的方法》还包含有最近发展出来的基于事件的优化方法,它为利用系统的特性来克服或减轻维数灾的研究开辟了个新方向。《随机学习与优化:基于灵敏度的方法》强调以样本路径的构造为基础的物理解释,物理上的直观认识可以为完善已有的优化方法提供新思路。 为帮助读者理解掌握书中的内容,《随机学习与优化:基于灵敏度的方法》提供r大量的示例和丰富的习题。 《随机学习与优化:基于灵敏度的方法》适合作为相关专业的研究生教材,学生可从一门课程中学到原本属于多个不同学科的内容。《随机学习与优化:基于灵敏度的方法》有助于促进学习和优化领域中各学科之间的合作,对该领域的研究人员也大有裨益。
|