搜索结果: 1-2 共查到“计算机科学技术 云推理”相关记录2条 . 查询时间(0.122 秒)
基于云推理模型的深度强化学习探索策略研究
云推理 深度强化学习 知识 探索策略
2018/5/21
强化学习通过与环境的交互学得任务的决策策略,具有自学习与在线学习的特点。但“交互试错”的机制也往往导致了算法的运行效率较低、收敛速度较慢。知识包含了人类经验和对事物的认知规律,利用知识引导智能体(agent)的学习,是解决上述问题的一种有效方法。该文尝试将定性规则知识引入到强化学习中,通过云推理模型对定性规则进行表示,将其作为探索策略引导智能体的动作选择,以减少智能体在状态-动作空间探索的盲目性。...