首页 - 正文
本书主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。本书主要关注规划和强化学习,其中一些技术涉及监督学习和优化。书中的算法是用Julia编程语言实现的,并配有大量图表、示例和练习题。
管理学院案例获评2025年MPAcc优秀教学案例
管理学院赴大连理工大学、北京航空航天大学开展科研团队建设专题调研
管理学院师生赴长江证券开展研学共建
管理学院召开课程组建设中期检查汇报会
管理学院举办2025—2026学年度教师教学竞赛初赛
管理学院教授团队研究成果同时获得SFA及EFA两大金融协会会议论文奖项