原创 余凯:大脑系统才是未来机器人的关键

2016-5-4 13:57 1277 24 24 分类: 机器人/ AI
在4月28日举行的GMIC全球智能机器人大会上,地平线机器人技术创始人兼首席执行官余凯作了《无处不在的“AI Inside”》演讲。他表示,人工智能将带来第四次产业革命,人工智能的核心特征就是自主决策的行为。未来Robot的关键在于大脑系统,而这来自大数据和深度学习结合所带来的变化。

20160504135733283.jpg

地平线希望在无处不在的AI Inside时代,构建一个平台。余凯称,这个平台首先是一个操作系统,是对深度神经网络一个专门的支撑,下面是一个深度神经网络处理器的架构,上面能够开放出来,去支撑很多很多的垂直应用,这些应用开放出来给整个生态。

以下为演讲全文:

大家下午好!我们很多人说这次可能是一个新的产业革命,第四次产业革命。从蒸汽机时代到电器时代到信息时代,我们这次是人工智能时代。为什么说这是一次新的产业革命呢?我们觉得回顾过去10几年20年的历史,从PC互联网到移动互联网,到我们现在,比如说我们叫AR、VR的时代,我们看到很多的信息、内容、服务,包括物理世界所存在的这些实体,比如说嘀嘀打车把每个出租车,什么司机,哪个车号,现在在哪个地方,往哪个地方走,都线上化了。所谓物理世界和虚拟世界的界限也比较的虚化了。

比如说我们思考AlphaGo这件事情,它跟我们以前技术的进展很大的不一样是,过去所有的进展实际上都是以人为中心,去延展你的体力、脑力,使你走得更快,看得更远。但是今天AlphaGo是跟你下棋,它是自主做决策,这样一个自主行为的实体。这样的话是一个新的物种,它的一个核心特征就是这种自主决策的行为。在生活、生产很多的方面,它在逐步替代人的一些简单的工作。比如说我们会看到,如果是一个人大概花3个月到6个月的时间能够学习到的技能,这样的技能在未来5到10年的时间都会被机器所替代。比如说驾驶,过去可能少数人具有一个专车司机,未来每个人都会等效的有一个专车司机,因为每一个车在15年到20年的时间里面应该都是自动驾驶的。

我们把Robot翻译成机器人,你在这个机器后面承载的一个人的概念,这个概念它实际上跟Robot的本意有可能不一样。比如说我们查剑桥的辞典,我们查Robot这个词讲的是什么意思?讲的是它可以自动完成一定任务计算机控制下面的机器。所以Robot讲的是智能机器,它跟人这个词并没有一个必然的关联。

我们想有没有机器人这样一个词?其实是有的,我相信在座的各位用的手机的操作系统是安卓的,我们查安卓这个词,意思是长得像人的Robot。安卓是一个人形机器人,它实际上是在一个很宽泛概念里面非常小的一个领域,但是在更宽广的语境下面讲的是智能机器,智能机器当然有各种各样的多样化的。在中国的语境下面有的时候你会问这样一个问题,这个是Robot?这个它当然是一个机器人,它可以自主的跟你交互。长城会的兄弟们放了一个机器人在我们公司,我调戏了它一个礼拜。如果你在它周围走动的时候,它眼睛会一直看着你,跟着产生很有意思的互动。它显然是机器人,它也是Robot。

我问大家这个问题,这个是不是一个Robot?这个是不是一个安卓?我记得日本的石黑浩教授每年都会来我们这个会场,至少一次,带着他的美女机器人,我们很多的记者也会去报道,说日本的机器人技术怎么样怎么样了。我在这里面想澄清一点,就是我们有一些媒体记者需要更新他们的知识。如果你稍微了解一下,实际上在台子后面的某一个小房间里面,有一个小女生坐在电脑面前,它实际上所有的交互都是这个小女生来控制的。它的语音识别,甚至它的反馈,都是后面的小女生来完成的。所以这样的一个形态的东西,它完完全全是一个木偶。

这些机器人它没有人的形状,但是它们能和你交互,可能成为你生活中的陪伴,或者是家庭里面的一个中控。这样一个智能交互的设备它当然是Robot,但是它不是安卓的。

我们看这些玩具,这些所有的品类在生活中无处不在。它们在今天我们叫功能型,但是未来它应该装上传感器,配上算法,有控制系统,它可以自主地行为决策。未来所有这些品类,它们都会变成Robot,都会变成无处不在的自主的机器。所以这是一个大的趋势。在移动互联网以后,比移动互联网更大的未来,是无处不在的万物互联,无处不在的万物智能。所以AI Inside它将无处不在。

这样两个图像放在一起,你们有什么感想?在几个星期前有一个新闻,当然全世界都在关注,就是关于AlphaGo。在那个礼拜关于同一家公司谷歌有另外一个新闻,在座的各位可能也关注到了,谷歌在考虑把他们的一个公司给卖掉,谷歌为什么会做出这样的选择?我们比较这两个图像,另外一边是人类的近亲,它的骨骼,它的肌肉,它更强大,更灵活,但是它还在丛林里面找香蕉吃。人类已经征服太空。人类有非凡的大脑,使人类变得卓越,变得不同。

大脑的系统无疑是未来Robot的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力。这些核心实际上离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。

深度学习的算法和传统的AI的算法有一个很大的不同,AI的算法到数据大到一定程度的时候,不一定效果不断的变好,但是深度神经网络的算法,你可以看到它不断的提升。比如说AlphaGo它产生数千万盘棋局的数据,通过它不断的学习深度神经网络,从职业的二段也不知道到职业的多少段,据说是职业13段这样的水平,它的水平在不断的提高,这就是大数据和深度学习结合所带来的变化。

我们看到因为深度学习的发展,过去在图像领域,在语音领域所引领的,不断去突破它的极限,使它的识别错误率不断的降低。这是语音识别深度神经网络代替深学模型,后来端到端的学习带来语音识别率继续的提升。这是我们看到最近在端到端的深度神经网络在语意的处理和理解上面所取得的进展。

前面我们看到很多感知方面的进展,从AlphaGo我们看到,从感知到行为决策,深度学习进入后一个十年发展的趋势。如果你只是感知,不做任何决策,其实你并不改变这个世界,只有在环境中不断的做决策,去调整,去优化你长期的收益,这个机器才能变成自主行为,并且改变世界的技术。

同样的技术不光是在棋的对局,自动驾驶可以看作是汽车和环境的博弈。这样一个博弈你在每时每刻在连续地做决策,比如说你是加速,你是左还是右。因为你每一次决策,你周围的环境会发生改变,这些你需要连续做决策,最后优化的是一个长期的收益,就是从A地到B地足够的高效,足够的安全。

未来机器人大脑的构架,一种想法完全在云端处理,但是这样会带来问题,比如一个汽车在行使过程中突然有小孩横穿马路,你把数据传到云端,云端处理回来,如果这个网络不稳定怎么办?说到这种实现和处理,我们自然会想到用什么处理器。我们手机和电脑上都有CPU,我们刚才讲的无处不在的人工智能所需要的这些感知、认知和控制,它需要这些东西是些专用的处理器。你会问,你这个问题有点奇怪,人类的大脑看起来是一个通用的处理器,在座的各位我不知道多少会认为大脑是通用还是专用处理器?认为大脑是通用处理器的举个手?是专用处理器的举个手?就更少了。

如果说是通用处理器,人类的大脑能不能回答这样的问题?这个问题对绝大部分来讲是很复杂的,但是对于CPU来讲是这么的简单,实际上大脑所有的功能都是为咱们几十万年作为一个种群的繁衍、生存专门优化的那些功能,实际上大脑是一个专用的处理器。这就是在硬件设计里面很一般的规律,如果你做专用设计,你对专用设计的问题会有2到3个数量级效能的提升,如果你是特别通用,就像CPU这样的,它非常通用,但是它的效能会降低。

地平线机器人希望做的是什么呢?我们希望在万物智能的一个时代,在无处不在的AI Inside时代,我们希望构建这样一个平台,首先它是一个操作系统,是对深度神经网络一个专门的支撑,下面是一个深度神经网络处理器的架构,上面能够开放出来,去支撑很多很多的垂直应用,这些应用应该开放出来给整个生态去做。

我们现在主要去针对的是两个应用场景,第一个场景是针对Andersen Platform,在这个平台上怎么样定义智能的功能,实际上是我们的客户去定义的,我们的操作系统支持这样的一些能力。包括我们面向自动驾驶提供的功能,开发的深度神经网络自动驾驶的方案,基于单个的摄像头,包括精确的估计车的距离。

像地平线这样一个单个摄像头估计车的距离的这样的方案,现在已经被国际上面著名的供应商所采用,所以这是一个非常非常了不起的成就。

还有更加复杂的一些情况,这是在复杂的路况里面,对复杂的车和行人,最下面是地平线的一个方案,上面是UCSD媒体经常报道的,世界上最好的行人检测的方案。你可以看到,行人检测,红色的那个框就是左上角的那个图,他们检测有很多的误检,包括检测也不稳定。这是在中关村这样一个非常复杂的路况所展现的成果。比较国际上的同行和地平线的结果,这里面最显著的不同是什么呢?你会发现,国外的路上面就是没有人,它就是没有行人,以前我在百度的时候负责自动驾驶项目的时候,我经常说,我们在五道口这样的环境下面如果开发出来的自动驾驶技术,一定是全世界的,在美国和欧洲开发的自动驾驶技术在中国一定不行。所以在中国我觉得我们在PC互联网到移动互联网,经历了模式创新、产品创新,一定会迎来一个技术创新的时代。

我们怎么看未来?如果我们看今天手机这样的一个市场,今天中国平均每个人有一台手机,这样的市场我们有MTK、有展讯、有华为,在手机上我们有小米、华为有很多大大小小的公司,包括上面支撑的各种移动应用。在美国有苹果、高通,包括谷歌的安卓。但是未来10年里面,我们认为每个人平均需要用10个AI Inside,或者说宽的意义上的Robot。这里面有单个的品类,比如说汽车本身比手机还要大,在这样的一个市场里面,我们认为去构建一个平台性的这样的一个产品,这样的一个业务,它有一个非常宏大的一个市场机会。

未来是一个人机共存的世界,归根结底它是属于会做机器人的人。谢谢大家!
PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
24
关闭 站长推荐上一条 /3 下一条