機器人足球賽中基于增強學(xué)習的任務(wù)分工

發(fā)布時(shí)間：2010-3-3 14:48 發(fā)布者：irobot

關(guān)鍵詞：分工 , 機器人 , 任務(wù) , 學(xué)習 , 足球賽

摘要：本文研究了機器人足球賽中利用增強學(xué)習進(jìn)行角色分工的問(wèn)題，通過(guò)仿真試驗和理論分析，指出文[1]中采取無(wú)限作用范圍衰減獎勵優(yōu)化模型(infinite—horizon discounted model)的Q學(xué)習算法對該任務(wù)不合適，并用平均獎勵模型(average—reward model)對算法進(jìn)行了改進(jìn)，實(shí)驗表明改進(jìn)后學(xué)習的收斂速度以及系統的性能都提高了近一倍。

PDF下載：

機器人足球賽中基于增強學(xué)習的任務(wù)分工.pdf (373.53 KB)

本文地址：http://selenalain.com/thread-8772-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

相關(guān)視頻

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页