《多智能体机器学习--强化学习方法》[69M]百度网盘|pdf下载|亲测有效

基本信息

商品名称：多智能体机器学习--强化学习方法
作者：(加拿大)霍华德M.施瓦兹|译者:连晓峰//谭励
定价：69
出版社：机械工业
ISBN号：9787111569602

其他参考信息（以实物为准）

出版时间：2017-07-01
印刷时间：2017-07-01
版次：1
印次：1
开本：16开
包装：平装
页数：185
字数：228千字

内容提要

。。。

作者简介

。。。

译者序
原书前言
**章监督式学习概述
1.1 LS算法
1.2 RLS算法
1.3 LMS算法
1.4 随机逼近法
参考文献
第2章单智能体强化学习
2.1 简介
2.2 n臂赌博机问题
2.3 学习结构
2.4 值函数
2.5 *优值函数
2.5.1 网格示例
2.6 MDP
2.7 学习值函数
2.8 策略迭代
2.9 时间差分学习
2.10 状态一行为函数的时间差分学习
2.11 Q学习
2.12 资格迹
参考文献
第3章双人矩阵博弈学习
3.1 矩阵博弈
3.2 双人矩阵博弈中的纳什均衡
3.3 双人零和矩阵博弈中的线性规划
3.4 学习算法
3.5 梯度上升算法
3.6 WoLF IGA算法
3.7 PHC算法
3.8 WoLF PHC算法
3.9 矩阵博弈中的分散式学习
3.10 学习自动机
3.11 线性回报一无为算法
3.12 线性回报一惩罚算法
3.13 滞后锚算法
3.14 LR滞后锚算法
3.14.1 仿真
参考文献
第4章多人随机博弈学习
4.1 简介
4.2 多人随机博弈
4.3 极大极小Q学习算法
4.3.1 2x2网格博弈
4.4 纳什Q学习算法
4.4.1 学习过程
4.5 单纯形算法
4.6 Lemke Howson算法
4.7 纳什Q学习算法实现
4.8 朋友或敌人Q学习算法
4.9 无限梯度上升算法
4.10 PHC算法
4.11 WoLF.PHC算法
4.12 网格世界中的疆土防御问题
4.12.1 仿真和结果
4.13 LR滞后锚算法在随机博弈中的扩展
4.14 EMAQ学习算法
4.15 EMAQ学习与其他方法的仿真与结果比较
4.15.1 矩阵博弈
4.15.2 随机博弈
参考文献
第5章微分博弈
5.1 简介
5.2 模糊系统简述
5.2.1 模糊集和模糊规则
5.2.2 模糊推理机
5.2.3 模糊化与去模糊化
5.2.4 模糊系统及其示例
5.3 模糊Q学习
5.4 FACL
5.5 疯狂司机微分博弈
5.6 模糊控制器结构
5.7 Q(A)学习模糊推理系统
5.8 疯狂司机博弈的仿真结果
5.9 双车追捕者一逃跑者博弈中的学习算法
5.10 双车博弈仿真
5.11 疆土防御微分博弈
5.12 疆土防御微分博弈中的形成回报
5.13 仿真结果
5.13.1 一个防御者对一个人侵者
5.13.2 两个防御者对一个人侵者
参考文献
第6章群智能与性格特征的进化
6.1 简介
6.2 群智能的进化
6.3 环境表征
6.4 群机器人的性格特征
6.5 性格特征的进化
6.6 仿真结构框架
6.7 零和博弈示例
6.7.1 收敛性
6.7.2 仿真结果
6.8 后续仿真实现
6.9 机器人走出房间
6.10 机器人跟踪目标
6.11 小结
参考文献

多智能体机器学习--强化学习方法 pdf下载

内容简介

基本信息

其他参考信息（以实物为准）

内容提要

作者简介

目录

多智能体机器学习--强化学习方法 pdf下载

内容简介

基本信息

其他参考信息（以实物为准）

内容提要

作者简介

目录

相关推荐

神秘的程序员什么塑造了今天的编程世界漫画编程历史大事件

Paracraft编程入门李西峙

新书CAN总线应用层协议J轻松入门J协议工程机械应用技术教程书籍故障实例

AIGC新纪元：洞察ChatGPT与智能产业革命AIGC的技术沿革与应用改变世界的能力边界