tag 标签: 机器人视觉逻辑

相关博文
  • 热度 5
    2024-3-20 16:50
    437 次阅读|
    0 个评论
    如果说2023年是全球AI大模型大爆发,图文生成元年的话,那2024年则为AI视频生成和多模态大模型元年。 可以说,从ChatGPT到Sora,AI对每个个人、每个行业的现实影响与改变都在加速发生。 已有业界大佬畅想,Sora的发布预示着机器人领域将迎来广阔发展。 1. AI,作为智能机器人的大脑和灵魂,代表着机器人感知、认知世界并与之交互的“软实力”。 因此,AI技术的每一次技术突破和能力飞跃都将为智能机器人的商业化推进提供更为强大的动力。 2. Sora大模型正好展现了AI对客观世界理解力的跃升。 一如英伟达科学家Jim Fan的评论,Sora不再是创意的“玩具”,而是数据驱动的物理引擎。 OpenAI就Sora的官方技术报告中也明确提出,“通过扩大视频生成模型的规模,我们有望构建出能够模拟物理世界的通用模拟器,这无疑是一条极具前景的发展道路。” 3. 在人形机器人、陪伴机器人等细分领域中,尽管具体的场景和需求不同,但就当前发展来看,皆处于“感知-认知”的技术瓶颈一直没有得到突破的阶段。 它们都需要对服务对象的需求能够正确感知并结合物理世界的规律做出相应的任务执行。 a. 比如,能够感知到一杯水的重量并以合适的力度去抓取和送达; b. 比如,根据服务对象的语言语气等感知到陪伴需求并提供相应的服务等。 感光现象一直追踪机器人领域,艾迈斯欧司朗的不少光电、传感好技术也都赋能其中,未来已来,不同细分机器人行业状况如何?