搜索结果: 1-3 共查到“程序设计及其语言 学习”相关记录3条 . 查询时间(0.5 秒)
苏州科技大学电子与信息工程学院程序设计及C语言(基础篇)课件 循环语句学习。
基于局部合作的RoboCup多智能体Q-学习
马尔可夫决策 Q-学习 局部合作
2009/8/19
针对多智能体Q-学习中存在的联合动作指数级增长问题,采用一种局部合作的Q-学习方法,在智能体之间有协作时才考察联合动作,否则只进行简单的个体智能体的Q-学习,从而减少学习时所要考察的状态-动作对值。在机器人足球仿真2D平台上进行的实验表明,该方法比常用多智能体强化学习技术具有更高的效率。