工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 1-7 共查到计算机科学技术 深度强化学习相关记录7条 . 查询时间(0.3 秒)
CAA会士面对面系列活动是中国自动化学会为学会会士量身打造的高端学术交流平台,每期活动邀请1位或数位学会会士进行专题报告,围绕国际科技热点,聚焦国家创新发展战略需求,前瞻学科领域发展新方向,积极发挥学术引领和科技智库作用,展现重大学术咨询研究成果,引导社会尊崇科学思想和方法,促进公众提升科学意识和素养。
作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning,RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning,DL)结合,深度强化学习(Deep reinforcement learning,DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略...
为了模拟人眼的视觉注意机制,快速、高效地搜索和定位图像目标,提出了一种基于循环神经网络(Recurrent neural network,RNN)的联合回归深度强化学习目标定位模型.该模型将历史观测信息与当前时刻的观测信息融合,并做出综合分析,以训练智能体快速定位目标,并联合回归器对智能体所定位的目标包围框进行精细调整.实验结果表明,该模型能够在少数时间步内快速、准确地定位目标。
组合优化问题广泛存在于国防、交通、工业、生活等各个领域,几十年来,传统运筹优化方法是解决组合优化问题的主要手段,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化算法面临着很大的计算压力,很难实现组合优化问题的在线求解.近年来随着深度学习技术的迅猛发展,深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力。
多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proxim...
近日,中国科学院沈阳自动化研究所与英国爱丁堡机器人中心合作研究取得新进展,提出了一种在动态、非结构环境下基于深度强化学习的移动机械臂自主作业方法,将最新的人工智能学习理论成功应用于真实的复杂移动机械臂控制。相关研究成果发表于期刊Sensors。
强化学习通过与环境的交互学得任务的决策策略,具有自学习与在线学习的特点。但“交互试错”的机制也往往导致了算法的运行效率较低、收敛速度较慢。知识包含了人类经验和对事物的认知规律,利用知识引导智能体(agent)的学习,是解决上述问题的一种有效方法。该文尝试将定性规则知识引入到强化学习中,通过云推理模型对定性规则进行表示,将其作为探索策略引导智能体的动作选择,以减少智能体在状态-动作空间探索的盲目性。...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...