孟庆虎,香港中文大学电子工程系教授;峰会主旨报告《真的要机器换人吗?》。下面是孟庆虎的演讲内容:
各位尊敬的院士,专家,和机器人圈的朋友。今天特别感兴机器人峰会主委会让我有机会把我工作和科研的工作跟大家稍微分享一下。
我今天讲的题目是《真的要机器换人吗?》。这里有两想法,一个是机器人换人是20年以前的概念,那么现在的机器人发展到今天这一步的时候,机器人换人这个事是不是在每个场合都合适,第二现在真的可以机器人换人吗?机器人能够替代人吗?我们从这个角度跟大家分享一下。
我们机器人历史也不长,机器人这个词是1920年出来的。你这个ROB这个词在1920年是没有的。机器人学是科幻小说1941年提出来的所以历史很短暂,1941年查这个文献是没有的。
我们看看研究的成果,有一种比较快的方法看,就是从数据库里面看,我们把传统机器人和机器人学,图象处理、自动化、信息、能源做一个比较,1985年之 前,这个数据库搜集是这样的,就是机器人非常的少,传统的行业,像能源、控制系统工程文章特别多。后面的十年,增长相当的快,大家看到这个机器人增长相对快,但是1995年到2004年是这样的增长。如果用倍数来看,机器人增长是倍数最多。我们在机器人本身这个行业里比的话,我们协作机器人、仿真机器人,机器人感知,微小型机器人、还有工业机器人、服务机器人,1985 年之前没有这方面的文章。从1985年到1994年大家有关注,包括人性机器人,协作机器人有了,突破了0。1995年到2004年的增长,可以看到这个 仿真机器人进展还是非常快的。但是还不行。截止到2015年人机合作文章还是比较少。只有500多篇,仿真机器人多一点。原来是0,所以是放大倍数是无穷 大,所以人机合作有很大的余地。真的想要机器人融入我们的生活,我们要克服的就是让机器人和人能够共同的生存,共同的工作。那么,机器人换人一个先决条件就是说机器人要能够跟人共同生存。所以说,从这样一个角度,我们觉得应该稍微看一下机器人的发展史。
1960年的时候,第一次用机器人上了鸡尾酒,所以这两个人结缘。还有1961年第一台机器人卖JM。当时是处理锻造舰的运输。当时并不是做装配的事。历史上还有一件非常重要的事情就是 1968年,在斯坦福研究了机器人控制的机械臂,这个机械臂后来变成了斯坦福R,这成为第一个真正计算机控制的机械臂,这个计算机控制的机械臂,工业机器人,那么真正到了市场,就是到1978年的事,所以这个成为了第一个利用自由度,完全计算机控制的机器人。所以这个历史非常的短暂。但是,我们看传统的工业装配机器人有 一些特点,第一个就是它运行速度非常的高,第二个就是说它的运行精度非常的高。因为他们是不具备任何的智能和传感这样的功能的。所以说必须要靠精确的编成完成所有的任务,这个就是这样的。也没有协作。所以当时的装配线要评比起来,不能让人进来,因为机器人没有智力,也不知道有没有人这样的事情。这样的装配 线现在逐渐被人机协调的装配线替代掉,这个是宝马最新的生产线,可以看到,现在的概念是让人做人最擅长的事,让机器人做机器人最擅长的事。大家发挥优势,能够让效率提高得非常好。而且在一些非常笨重,人做起来费劲,不愿意做,非常困难的事让机器人做,相对容易的事,而且用机器人来做相对困难的事,这个时候 我们用人来做。所以说,人和机器人的协调,真正的开始从工业进入。要让这样机器人和人一块合作首先有一个非常重要的条件,那就是说机器人必须知道人的存在,这样的工作让人知道非常简单,灵巧,而且不用太消耗太多的体力就可以完成。但是,你要用机器人来做,这样的事相对来说效率非常的低。这就是目前的一种 趋势。那么,这个要求就是我刚才要说的,一定要让机器人有一定的智能,和人打交道的能力,这样可以让机器人进入这个环境。
就是说我们现在从机械方面来说,除了装配线上机器人,这里就是说想替代单位的工人。这个就是一个小的工房,小型的企业,如果有个别岗位需要有一个比较能够替代人的工作,希望用这样的机器人,这样的机器人跟的传统的机器人有一个区别,就是它速度不是特别高,精度不是特别高。但是,有很高的智能,有很多传感信息。所以 说,能够知道怎么样,知道怎么跟人合作,不会伤到人,可以看到人做什么,学习起来非常容易,手把手教他就可以自动的编程,而且这样的机器人成本不是特别,特别适合中小企业,或者单工位替工,但是这样的机器人是不是真的能够换人呢?我们看一个简单的视频,这个事让人做相对容易多了,但是我 们用单工位机器人做起来还是非常费劲的。如果要让他来叠衣服的话还没有准备好。我们也是做了很多非常先进,酷的机器人,包括仿人的,说老实话,在从硬件设备商来说,已经达到了登峰造极的水平了,就是人类对于用一个钢铁模仿柔体的生物获得了一定的程度,即便这样的技术上非常高,然后为什么我们做一些有时候看 起来非常简单的事情,反而还是不了呢?这个时候我们就是需要给他做一些改进。比如我们看这个的话,这个是我们中国的香港大学李一兵机械狗。
从硬件上要做这样一个狗,当时李一兵他们团队没花太多的时间和金钱做出来,而且得到了非常高的赞扬。就是说硬件上面我们要想做一件事情,实际上并不 是那么难,但是为什么当你要执行一个任务的时候就会变成这样难呢?我们再看看这个去年的DAPRPA。这个代表了现在最高的水平,当他们完全单相指标的时 候都是非常的精彩,当让他们完成人类非常简单可以做到的任务的时候反而他们做不到。从这些例子里面我们可以吸取什么经验教训,可以看到什么问题,引发我们什么思考,我们做机器人研究的时候,技术研究的时候,我们应该注重哪些方面呢?所以这些事情我们就想引出我们下面的一些话题。
首先我们来比较一下,人和机器人。我们从几个方面比较一下的话。如果我们说它移动性能,我们说机器人的移动性能的确可以做到跟人差不多。有时候比人强。 所以再看灵活性,人绝对没有问题的,机器人现在还不是那么完美。尽管我们有柔性关节等等,但是我们机器人主要还是钢铁,钢铁机器人的时候,跟我们柔性还是有严重的区别的,那么操作性,大家都是差不多的。有的时候机器人可以更精确,可以更快,传感能力呢?也应该是差不多。而且机器人有时候会比我们传感能力更 强。但是智能方面机器人差得比较多。这样一比,我们发现两个地方,一个是灵活性,一个是智能。这里面是分别是硬件和软件的问题。大家都有努力。这个实验室
的教授就是在做。里面是用这种驱动,仿人的肌肉,韧带驱动来做的,这个说老实话有很长的路要走。那么,这个我们先说和人打交道,首先要知道人智能怎么样。 我们有视觉系统,90%的信息是视觉来的,还有嗅觉,听觉。我们还有一个触觉,这个不仅装在手腕上,遍布我们所有的皮肤,这些角度来说,人类尽管装配传感器不是那么多,但是这些传感器非常有效的发挥作用。我们人脑的能力超出异常,我们每秒钟可以处理1万亿比特的信息。我们大脑每一秒钟可以搜集4千亿比特信息, 大家觉得可能这个数据不靠谱,我们大脑每一秒搜集4千亿比特,但是原因我们可能只对其中两千条关注,其中七条有记忆。你搜集到的信息只有7条有记忆。最快
只能对其中一条做出反映,比如我现在问大家,大厅里面有多少个出口,大家说不知道。但是你回头一看,这个信息一直在那。但是我们没有关注它,我们只关注其 中有用的最多7条。这个我们是怎么关注的?我们人记忆有选择性的。就是说因为我们有选择性,根据我们的知识,根据我们的情节,根据我们做出判断,这个我们根据我们经验就会说圆或方。我们有时候给你不相干的东西,让你看的时候你不知所措,不知道往哪看,当我问你这个图片里这个人腰带的颜色是什么的时候,再打 开的时候,大家第一个关注的点就是它的皮带,这就是人的视觉,和人的大脑对于信息能够进行分割处理,实际上是交集的方式,不至于我们大脑累死。所以用机器人,人工智能做信息处理的时候,我们往往没有这样的能力,比如说,有TOPDOWN的功能,比如我儿子看到这个苍蝇的时候,第一次,他不知道什么事。但是他见过蜜蜂,他就说这是一个蜜蜂,你告诉他这不是蜜蜂,是苍蝇,他就更新他的记忆,他下一次看到苍蝇的的时候就说是苍蝇不是说蜜蜂。这是人保护自己的一个 判断。还有BOTTOMUP,这获取高级知识的方式,我们这个可以根据经验说是圆还是方。然后这个图形我们根据人经验是人在骑马,这样图象,大家有时候也能够判断出来要么一个狗在走。根据我们经验,根据我们判断,这样的图象我们都能处理,但是作为机器人就是处理不了。人和机器人有好多的互补性。人我们好处 的就是90%的信息是眼睛获取的,我们传达,表达出来的信息90%通过语言来表达的。所以说我们语音方面做得相当不错的。但是图象识别方面还是做得很差。
这是一个小女孩,看到一个照片以后可以解释出来这里边是什么现象。
这个是斯坦福大学人工智能的一个教授。
大家可以看到跟一个3岁小孩比还有很大的差距。那么就是和这样的思路和想法,我举个我们科研的例子。
第一个就是说大家做这个我们叫ACTIVE,这个就是我们用摄像机看的东西都是被动的,静态的。我们捕捉的东西一个要观测物和被观测物他们之间的关系,我们往往建立这样的东西,这个东西建立好以后什么东西都好做了,如果只是一个摄象头,就能够感知环境,感知你要操作的对象,但是放在移动平台上就是被动 的,因为你改变了摄象头的状态。不断改变观测的角度和位置,而且能够把被观测对象同时改变,达到更好的效果。这是第一个,我们小的例子。
第二个讲的例子,我们开发的一个非常简单OFFICE ROB,这个一起人就是成本很低,就三千块钱,可以自平衡,可以升降,这个OFFICE ROB就是能够自己上电梯,还能够到达他想去的楼层,同时能够进出自如。所以要具备一些目标和人辨识的功能,同时对这个按纽和楼梯的显示这个功能。
最后一个就功能是里面有人,他按不到按纽,他需要用简单的语音交流。就是帮我按一下三楼的电梯按键,如果他出不去,人多的时候,他会说去借过让我出去。 我们就是用非常简单限定环境和限定任务的事情来验证机器人的智能,如果我们把它限制在一个特定的范围里以后我们可以做得非常好了。所以说这个就是来验证这样一个观点。那么因为时间的关系我不再把它继续讲下去了。
这些东西我们要把它造得便宜,我们就是要把这些好多处理的能力,分类的能力, 和智能决策能力反到云端,因为连接到网络是非常简单的事情,我们在网络上可以把最先进的,和最聪明的算法放在这个地方,所有的加起来就可以给我们提供完美的任务,那么其中,今天我想强调一点就是说我们在做KN的时候,硬件的东西会逐渐变成生产能力特别强企业在做。一些小型的东西,打印机可以打的除外。基本上大家如果要是做小批量的硬件的话,以后大家不会有太多的市场。大量的市场在什么地方?就是感知、人工智能、视觉智能等等。然后大量就是软件的事情,就是 在云端的决策和专家系统等等,大数据。还有一个东西对我们非常有帮助的就是物联网。将来物联网真的是到处都是的话,机器人辨识东西的能力就会大幅度提高,我们不需要费劲去认这是一个什么东西。这个物联网会告诉我们所有的事情来简化我们计算机操作,到了那个时候机器人变成了社会的一部分,这个时代就真正到来 了。今天简单跟大家汇报就这么多。谢谢。