学报简介

    智能系统学报(CAAI Transactions on Intelligent Systems)由中国人工智能学会和哈尔滨工程大学联合主办,是中国人工智能学会会刊之一。主要刊登神经网络与神经计算、智能信息处理、自然语言理解、智能 ...

学报详情

刊名: 智能系统学报
CAAI Transactions on Intelligent Systems
主办:  中国人工智能学会;哈尔滨工程大学
周期:  双月
出版地:黑龙江省哈尔滨市
语种:  中文
开本:  大16开
ISSN: 1673-4785
CN:   23-1538/TP
复合影响因子: 0.874
综合影响因子: 0.479
历史沿革:
现用刊名:智能系统学报
创刊时间:2006
中文核心期刊(2014)

02

您所在的位置:首页 > 学报导读 > 2020 > 02 >

深度强化学习中状态注意力机制的研究

作者:申翔翔 侯新文 尹传环

关键词: 深度学习; 强化学习; 注意力机制; A3C算法; 星际争霸Ⅱ迷你游戏; 智能体; 微型操作;

摘要:

虽然在深度学习与强化学习结合后,人工智能在棋类游戏和视频游戏等领域取得了超越人类水平的重大成就,但是实时策略性游戏星际争霸由于其巨大的状态空间和动作空间,对于人工智能研究者来说是一个巨大的挑战平台,针对Deepmind在星际争霸Ⅱ迷你游戏中利用经典的深度强化学习算法A3C训练出来的基线智能体的水平和普通业余玩家的水平相比还存在较大的差距的问题。通过采用更简化的网络结构以及把注意力机制与强化学习中的奖励结合起来的方法,提出基于状态注意力的A3C算法,所训练出来的智能体在个别星际迷你游戏中利用更少的特征图层取得的成绩最高,高于Deepmind的基线智能体71分。

上一篇:基于反卷积和特征融合的SSD小目标检测算法
下一篇:一种高效的稀疏卷积神经网络加速器的设计与实现