人工智能一大技术：强化学习（RL）,强化学习,人工智能技术-智能制造网

人工智能一大技术：强化学习（RL）

来源：智能制造网: 编辑：今夕何夕

2020/12/22 14:47:57: 48074

导读：机器学习技术你可能听过，强化学习你知道是什么技术吗？

　　智能制造网讯人工智能技术进步的速度越来越快，每种细分技术所创造的价值正日益得到展现。

　　2013年，DeepMind发明了DQN算法，成功将深度学习和强化学习结合起来，开启了深度强化学习的新纪元。此后数年，强化学习的成果日新月异，很多非常困难的问题都被深度强化学习算法解决。

　　2016年，谷歌阿尔法围棋以4:1战胜围棋世界、职业九段棋手李世石，不仅让深度学习为人们所知，而且掀起了人工智能的“大众热”，大家由此更加关注强化学习这一技术要点。

　　使用强化学习的一个很好的例子是让机器人学习如何走路。机器人首先向前迈出一大步然后跌倒。这一大步和摔倒是强化学习系统关注的响应点。由于反馈是负面的，所以继续调整，系统会根据多个负反馈的比对终确定机器人应该把步子迈的小一点，不停地小，直到机器人走路不会摔倒为止。

　　通过强化学习，Boston Dynamics公司的机器人已经掌握了托举、后空翻、跳上窗台的要点。而迪斯尼幻想工程已经把这一点带到了一个新的层面，那就是让人形机器人来执行玩命的特技。

　　有业内人士指出，强化学习和其他的人工智能技术有一个很大的差异，那就是它的学习范式和其它技术不太一样。它不需要我们去收集数据，也不需要我们去做任何标记，而是我们把称之为智能体(Agent)，放在一个环境里，就像动物或者我们自己生存的一个环境里，它会和环境自己打交道，自己学会在环境里如何完成一个任务，解决一个问题。

　　强化学习主要由智能体(Agent)、环境(Environment)、状态(State)和动作(Action)、奖励(Reward)组成。智能体将在环境的当前状态下，根据奖励信号做出动作，从而达到环境中的不同状态并得到奖励。

　　除了强化学习外，机器学习也备受关注。机器学习是AI的一个子集，是通过不同场景中的经验来训练系统的能力。随着车辆变得越来越自动化，开发人员可以使用机器学习训练系统来识别对象，并用更少的数据更好地解释其环境。

　　再来看一下深度学习。深度学习就是从有限样例中通过算法总结出一般性的规律，并可以应用到新的未知数据上。例如，我们可以从一些历史病例的集合中总结出症状和疾病之间的规律。这样，当有新的病人到来时，我们可以利用总结出来的规律来判断这个病人得了什么疾病。

　　那么，强化学习、机器学习、深度学习三者的区别是什么？简单说，人工智能范围大，涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成孩子大脑，那么机器学习是让孩子去掌握认知能力的过程，而深度学习是这种过程中很有效率的一种教学体系。

　　由强化学习、机器学习等技术构成的人工智能，其良好的发展前景引人期待。从全国来看，据艾瑞咨询测算，2022年国内人工智能核心产业规模有望达到1573亿元，复合增速达58%，产业将持续快速增长。如此广阔的市场空间，吸引着社会各界投资者的关注。

　　值得一提的是，发展“以人为本”的人工智能是全社会的课题，需要政府、商界、学界及所有利益相关方共担责任，协力推动。作为技术应用与推广的主体，企业负有不可推卸的社会责任。在研究强化学习相关技术时，企业要自觉遵守法规制度和社会公约，以此促进其有序、可持续应用。

　　未来，的可持续发展越来越依赖于数据创造的价值，而人工智能是数字经济中应用十分广泛的技术之一。或许再过几年，AI将在精准农业、智能家居、远程医疗、自动驾驶等领域发挥更加重要的作用。

资讯中心

人工智能一大技术：强化学习（RL）

热门评论

相关新闻