機器人足球賽中基于增強學(xué)習的任務(wù)分工

發(fā)布時(shí)間:2010-3-3 14:48    發(fā)布者:irobot
關(guān)鍵詞: 分工 , 機器人 , 任務(wù) , 學(xué)習 , 足球賽
摘要:本文研究了機器人足球賽中利用增強學(xué)習進(jìn)行角色分工的問(wèn)題,通過(guò)仿真試驗和理論分析,指出文[1]中采取無(wú)限作用范圍衰減獎勵優(yōu)化模型(infinite—horizon discounted model)的Q學(xué)習算法對該任務(wù)不合適,并用平均獎勵模型(average—reward model)對算法進(jìn)行了改進(jìn),實(shí)驗表明改進(jìn)后學(xué)習的收斂速度以及系統的性能都提高了近一倍。

PDF下載: 機器人足球賽中基于增強學(xué)習的任務(wù)分工.pdf (373.53 KB)
本文地址:http://selenalain.com/thread-8772-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页