人形机器人对应的算法:
导航类:类似人腿的走动,市场上双足机器人不到30%,其余更多的机器人靠导航移动;
肢体类:扭头,扭手,扭胳膊
视觉类:看,感知
听说类:语音交互,语言表达
导航类的算法:
国内和国外的差距没有很大,就像1+1的加法
肢体控制类:
运动学算法,动力学算法,纯算法模型上,国内外差距不大。
NLP算法:
国内外差距很大,22年年底,国外出现ChatGPT出现,被视为“第三次工业革命”,是新的NLP领域算法。在传统NLP领域,科大讯飞等国内厂商跟国外差距不大,但GPT出现,拉大了国内外在NLP算法上的差距。NLP上,国内落后国外很多。
视觉类算法:
2020年作为分界点,CV上,图像的处理是用大模型的处理,能同时处理很多图片。当图片数据足够多,用大模型进行训练,大模型就能慢慢拥有人的智能。而国内外的大模型差距很明显。
导航类做的很成熟的例子:
京东500-1000台的小型机器人,给机器人设置了目标点,让他们在交错的环境中避开彼此的碰撞,达到目标点,已经攻克了。
肢体控制类例子:
翻跟头,可能只有美国的公司才能做到,国内公司做不到。翻跟头对力矩的要求是很高的,不是算法能做到就够了。国内机器人停留在初级阶段,走走路,不会翻跟头。目前,在翻跟头上,力矩突然输出能承受身体重量的力(电机是在模仿人的肌肉,瞬间能输出爆发性的力),只能用伺服电机或液压电机。波士顿也是经历过从伺服电机到液压电机的,所以机器人要承受大的重力,要瞬间输出比较大的力,未来的路径肯定是选择液压电机。
液压电机是不是有噪音?
是有,但是在工程学上,先解决有无的问题,再解决好坏的问题。解决翻跟头问题,是解决有无的问题,液压电机再去克服噪音的问题,是克服好坏的问题,这个去除噪音是有很多方法的。
市场为啥没有做会翻跟头的机器人?
市场并不需要机器人一定会翻跟头,再加上翻跟头这个动作很难,所以企业并不会就去调账这么高难度的动作。如果之后有需求了,肯定会倒闭企业去把机器人做成有翻跟头功能的样子。
视觉算法:
定目,动目。定目,是机器人眼睛固定在一处,去观察物体的状态;动目,在机器人自身有移动,或者抓取的物体有移动的时候,机器人做的不是非常好。
视觉算法上,哪些厂商做的比较好?
国外,英特尔,SDK一体化方案,基本软硬件都能提供,有传感器,有算法,1个眼睛,2个眼睛,英特尔的摄像头,它可以调教的非常好,给下游的整机厂商会节省非常多精力,因为英特尔积累了很多年的摄像头调试经验。另一方面,英特尔借用自身的优势和下游厂商合作,能积累在不同场景的调试经验,这就是英特尔的壁垒所在,也是国内厂商难以颠覆的点所在。
软件架构设计?
英特尔SDK方案,是提供一些API接口,是需要调用才能打造公司自身的摄像头。英特尔的SDK就类似Python中的Pythoch,不同的行业大模型都是基于Pythoch算法底座打造出来的。
特斯拉是做车的,为什么做机器人?
特斯拉做车的一些零部件,在做机器人时候也适用。特斯拉的优势,在自动驾驶领域,视觉方案肯定是行业前三,它现在有硬件架构,算力架构,软件架构,特斯拉在高速上识别移动的物体能做的很好,这个也是机器人视觉算法的需求,所以特斯拉做机器人是必须的。
在车领域和机器人领域,视觉算法的差异?
在多传感器融合上,自动驾驶比机器人走得更远。自动驾驶上,多传感得融合已经实现了,多个摄像头得配合,但是在机器人领域,多传感器融合,并没有做的很好。
机器人完成抓取水杯得这个动作是怎样实现得?
首先,人类抓取水杯的动作交给机器人,完成初步算法训练;然后,不断优化算法,不断让机器人去尝试抓取水杯的动作,如果某次抓取成功,就记为1,没成功,记为0。从而不断寻来你机器人完成抓取水杯的任务。
为什么未来机器人翻跟头是刚需了?
几年前,机器人是原地翻滚,当有高度差的时候,可能有翻滚;当有障碍物,直接过不去的时候,需要翻滚。翻滚也是电机能提供瞬时爆发力的一种情况,未来机器人的力矩能瞬时输出爆发力,是必然要去达到的。
如果机器人做咖啡的任务之星失败了,大可能是哪里出现了问题?
一个关节的精度误差在零点几毫米,6个关节组合在一起,精度误差只有零点几cm,所以如果机器人完成制造咖啡的任务,出现问题,90%的概率是视觉算法上出现了问题,而不是关节操控出现了问题。