tag 标签: 公司

相关帖子
相关博文
  • 2024-9-10 11:12
    6 次阅读|
    0 个评论
    「 地平线从来都是个非典型 芯片公司 。 」 地平线创始人余凯的这句话,说出了这家公司的底色。 今年 4 月,地平线举办 2024 智驾科技产品发布会,当时地平线对外发布了一套 硬件 和一套 软件 : 硬件是征程 6 系列芯片,软件是地平线城区 智能驾驶 解决方案 Horizon SuperDrive(HSD)。 彼时大多数人还不知道这对于地平线意味着什么,但从此之后地平线的软件色彩开始更浓厚了。 8 月底,地平线邀请媒体公开测评这套 HSD 方案,一定程度上也意味着地平线的软件战略已经走向了成熟期, 要摘果子了 。 更深一层思考,征程 6 和 HSD 的陆续落地,似乎在向外界宣告,软件和硬件从来都不冲突。 如果把这个观点放在历史维度里,会发现硅谷成熟的商业公司大多也秉承着这样的脉络: 硬件做得好,软件大概率也不会差 。 苹果的壁垒不仅在于 iPhone,更在于 iOS,所以到了 2024 年 iPhone16 还在复刻自我的时候,依旧有许多用户前仆后继为苹果的软件生态买单。 同理, 特斯拉 与 Autopilot、Sony 和 Playstation 同样遵循这个逻辑。目前,特斯拉的 FSD 订阅量正在持续增长,Playstation 作为 Sony 的游戏平台,月活用户达到 1.1 亿。 以前长期困扰着中国创业者的一个问题是,软件生态不成熟,很难通过软件赚钱。金山软件 5 次上市,5 次被打回,最后花了 8 年时间,才在港交所敲钟。 智驾软件渗透率仍处于缓慢爬升的状态中。地平线用 HSD 说明了通过软硬一体可以提升高阶智驾解决方案的体验,更有为高阶智驾渗透率击破天花板。 01、 智驾要「无聊」,其实很难 评判智驾系统好坏的维度其实很多,包括接管率、博弈成功率、障碍物识别率等等。 接管率是最为关键且粗暴的数据。目前行业内最强的接管率是 Waymo,2023 年 Waymo 平均每 3 万英里发生一次干预。 但 Waymo 的 无人驾驶 赛道与城区智驾不属于一个概念,前者一次人工干预就有可能是一次重大事故,而后者现阶段的核心在于人机共驾,除了最核心的安全、效率之外,还 必须要保证 用户体验 。 如果再加上用户体验这个极为主观的因素,就变得更加难以捉摸。 过去一年,我们曾多次测试城区 NOA,有的风格过于激进、有的却常常触发接管,只有少数表现出众,对比之后再来看地平线的 HSD,很容易就会得出一个结论: 地平线做出了一套成熟的高阶智驾解决方案 。 这次体验我们选在北京晚高峰的闹市区,后装测试车辆采用 11 个 摄像头 +1 颗 激光雷达 ,全程 13 公里有一次接管,HSD 的驾驶风格就像在激进与保守中找到了平衡感,四个字形容—— 优雅、不怂 。 不怂听起来很容易做到,无非是在博弈时更大胆,对车距的设置更紧凑,但事实上媒体测评时可以把接管条件的调整得极为宽松,心理承受能力很高,可以给系统更长的博弈时间。但回归现实世界,从用户角度出发,一次极端接管就有可能会严重影响用户对智驾使用频率。 用户对智驾的初始信任感十分宝贵,智驾过于激进或保守的动作,都有浪费了这种得来不易的信任感。 地平线 HSD 并不激进、但也不怂。 有一个让我很深刻的案例,当车后方出现一辆 电动车 后,系统并没有直接刹停,而是在轻微向右绕行后减速。回看这段视频还是会让人感叹,HSD 的风格与一般司机的脚法已经难以分辨。 同时 HSD 还很优雅,把优雅具象起来就是: 能绕行就不减速、能减速就不刹停,避开一切会让人类感觉不舒适的驾驶行为 。 要减速还是绕行,系统有人类预判的逻辑在里面。比如我们遇到前车突然刹停,但刚开始前车没有打灯,系统就判断出可能是要停车,于是连续绕行了前车和突然冒出来的两轮车。 从用户角度来看,一个智驾系统最好不要有什么存在感。 在此之前,大众中国 CEO 贝瑞德和余凯也曾经在北京的一个雨天试乘 HSD,余凯评价:「 坐起来真的挺无聊的 」。 做到无聊,没有存在感,才是智驾的基操。 如果一套智驾系统存在感过强,就意味着系统更让人带来紧张与不安感,反而会降低用户对智驾系统的使用频率和付费意愿。 此外,连接用户和智驾的桥梁也至关重要。过去怎么判断一个系统是数据驱动还是规则驱动的方法很模糊——数据驱动开起来更像人,规则驱动顿挫感更明显,像沿着火车轨道行驶。 HSD 把这种抽象的思考 具象化到了 HMI 上。 在 车机 屏幕里,任何博弈、绕障都能够被事无巨细呈现出来,让用户直观看到系统反应。如果说,过去心脏的跳动只是波形图,那升级后的 HMI 就相当于把波形图变成了三位彩超,直观、形象更容易理解。 视觉上,3D 地图将信息量提升到了高维世界实际上地平线 HSD 的 HMI 是目前为止做得最精细的,甚至超越了此前以小鹏为 MONA M03 开发的 HMI。 在 HSD 中,渲染了栏杆、异型车、树木,甚至连地面裂纹也可以显示,而且这套 HMI 所占用的 算力 极小,大约只占用到了一台小米平板算力的不到 10%。 02、 打造智驾样板间, 平衡的艺术 余凯把 HSD 这套方案形容为智驾样板间,这里面有三层意思: 第一层:地平线可以把软件打磨得很好; 第二层:芯片+软件能发挥更大的效能; 第三层:地平线本来就是家软硬一体的公司。 余凯认为,地平线 HSD 就像楼盘里的样板房,不仅要卖房、还要展示出来一个房子的天花板有多高。 代入一下,HSD 打造智驾样板间的目的就在于撑开智驾的想象力,把行业的天花板再拉得高一些。 为了实现这些地平线的打造 HSD 时有两个技术主脉络: Scale out 和 Scale up 。 给智驾水平画一个坐标系: Scale up 是 Y 轴,指的是 系统性能提升 。 在这个层面,Waymo 是目前行业公认的标杆,何小鹏前段时间去北美测试时,也曾公开提起性能上要向 Waymo 对齐。 解决 Scale up 的性能难题有两种技术路径:一种是 基于规则的 自动驾驶 ,一种是 最近大热的端到端 。 前期,大多数自动驾驶公司的策略都是基于规则堆叠来实现稳定的自动驾驶,类似于打补丁, 工程师 写得代码越多系统就更稳定,但规则无法穷尽现世界的 Corner case,因此, 基于规则的系统保证了系统下限可控,但限制了系统性能的上限。 而端到端系统则是通过 神经网络 模仿大量的人类驾驶数据来提升驾驶水平,它保证了自动驾驶模块化之间信息无损传输,把自动驾驶性能上限抬高了。 但问题是端到端是黑盒系统,人类驾驶会「走神」,类似地端到端也会出现不可预测的风险,拉低性能的下限。 用规则系统守住系统下限、用端到端提高系统上限,就是地平线 HSD 提高系统性能的打法。 地平线采用了「端到端+少部分规则算法安全兜底来做双擎驱动,给端到端加入了 hybrid planner 作第二双眼睛,通过数据与少量安全规则的博弈,保证决策的正确性。 Scale out 是 X 轴,指的是 系统可泛化性 。 虽然 Waymo 性能很好,但是目前由于 传感器 、算法等限制因素,目前无法大规模推广,只能在凤凰城、旧金山等 4 个城市运营。在泛化性上特斯拉是标杆,全美都可以开启。 为了提升系统泛化性,地平线部署了一套端到端技术的感知 Transformer 网络,用世界模型来理解整个场景中动静态目标的位置和速度,甚至可以通过态势感知来和车流保持一致,达到优雅、不怂的效果。 世界模型最大的变化就是可以根据多个信息源的输入来理解周围的世界,再去做出决策。 地平线智驾系统架构师刘景初举例,在高精地图时代,地图会作为一种先验信息提前输入到系统里,但系统实时感知到的路况若与高精地图不符合,就会退出接管,但人类开车是按照实际看到的场景开,因此世界模型对于提升系统理解能力至关重要。 目前,地平线的 HSD 较传统轨迹,类人性提升 50%,路口通行效率提升 67%、城区场景覆盖 100%,预计今年年底地平线 HSD 就会陆续有量产车型官宣。 让人颇感意外的是,这套系统是地平线组建了 1000 人团队的在九个月之内完成的方案,相当于用目前国内梯队三分之一分的人力和速度,做出了接近第一梯队的效果。 03、 不要忽略软硬一体的潜力 「地平线 HSD 只卖软件/芯片,可以吗?」。 余凯委婉地回答「取决于对方想要什么」。 原因是地平线从最开始就以开放的面目示人,即便是做出来一整套解决方案,也仍然拥抱不同层次的、不同程度的合作。当然,这家主打软硬一体为公司,也意识到了自己的核心优势。 当 HSD 与地平线芯片深度融合时,会释放出芯片更大的效能。 过去有一个问题一直困扰智驾行业:高阶城区智驾究竟需要一颗怎么样的芯片? 业内普遍的困扰是,目前市面上大部分的 自动驾驶芯片 均是在 Transformer 出现之前设计的, 对 T ransformer 的支持并不友好 。所以大多数厂商都在积极寻求折中方案,比如对算子重新适配,优化网络架构和底层软件、改善带宽要求。 现在地平线有一个新定位,最了解高阶智驾的芯片需求的人,也可以是智驾软件的创造者。 当地平线这样的公司同时知道自己要什么、造什么的时候,就把握了软硬一体的核心要义。 换句话说, 只有软硬一体,才能够发挥出芯片最大能力 。 举个例子,征程 6P 搭载了地平线专门为大参数量 Transformer 而生的纳什架构。相比于最早的伯努利架构,纳什架构使得征程 6 计算性能在 CNN 上提升了 200 倍 ,在 Transformer 性能上提升了 20 倍 。 其实,地平线平衡端到端性能与成本的思路就是,以领先的 总线 架构,让算力和存储单元发挥真正的能力和效果。 地平线芯片产品规划与市场总经理尹凌冰讲过,有些芯片算子只占计算网络里 5% 的计算量,但是从计算难度上来看,却要花费计算时间 30%。因此地平线团队着重优化了这些算子,依托软硬结合的方式对算子进行硬件加速,使得其计算时间与计算量相匹配。 从一颗指甲盖大小的芯片,在到智驾系统上车的体验,是从硬件到软件的变化。但软硬件一体的灵魂一直都没变化过。 曾经一位业内人士向汽车之心表示, 未来真正的护城河并不是「算法」 。 他解释,其实目前主流的 transformer、端到端等前沿技术、前沿技术论文都是公开可查的,是可以通过大力出奇迹的方式去追赶的。 真正难的是基础设施建设,譬如算力、工程化能力。 余凯的观点也与之相似,在这次 HSD 体验分享会上,他提到,如果是能够放进教科书里面的技术,其实是每个公司都能掌握的。 真正的区分在于很多细致的细节打磨 。 地平线确实做了把智驾软件作为一套成熟的产品来打磨。 在商业世界里,能获得大众青睐的公司大抵分三种: 一类 以运营见长 ,把质量、成本和效率控制地很好,比如沃尔沃,连续 10 年成为全球营业收入最大的公司。 第二类 企业则擅长构建亲密关系 , 华为 和蔚来都是其中的优秀企业。 第三类就是 凭借出色的产品牢牢构建用户心智 ,比如苹果,不断打磨细节追求产品卓越。 地平线决心成为的就是第三类企业,以产品为企业的生长脉络。按照这样的思路再回头思考,就理解了为什么地平线 HSD 要做精致细腻的 HMI,为什么要强调软硬一体。 即便是非前装量产车的一次测评,地平线为了保证产品体验仍然坚持做了后装车底盘与 HSD 的精准联调,用工程化能力保证了产品最终体验。 现实很残酷,一款细腻成熟的产品靠得不止是工程师脑海中一个灵感,而是无数的脏活、累活。 截至目前,地平线芯片出货量已经突破600万片,在全阶计算方案市场市占率第一。 眼下,地平线正在迎来双响炮。一炮是 HSD 的正式上车,据汽车之心了解,地平线 HSD 首个量产项目会在今年年底、明年年初亮相。 另一炮是地平线即将登录港股,迎来上市曙光。如无意外,已经提交招股书的地平线将在备案出具的一年内赴港敲钟。 明年年初或许是地平线最重要的时刻,但借用余凯在地平线向港交所递交了招股书当晚在朋友圈所写下的话:This is not the end. It is not even the beginning of the end.But it is,perhaps,the end of the beginning。 尽管前路漫漫,但地平线已经跨出了最关键的两步。
  • 2023-10-22 20:19
    0 个评论
    文/侯煜 编辑/罗卿 10月17日,百度世界大会2023在北京召开,百度集团创始人、董事长兼CEO李彦宏亮相,发布文心大模型4.0及一系列AI原生应用。 “欢迎来到生成式人工智能时代”。李彦宏张开双臂,颇为兴奋地开始了演讲内容。不难看出, 他的情绪与今年3月发布文心一言时明显不同,更加自信和游刃有余。 值得一提的是,在1小时15分钟的宣讲中, 李彦宏全部采用了现场演示的方式向与会者展示实际的AI应用,而非此前文心一言发布会的PPT,似乎是以此来颠覆文心一言发布之初糟糕的评价。 此次发布会的重点无疑是文心大模型4.0,现场演示的文心一言、百度新搜索、百度新地图、百度网盘等应用全部基于新的大模型重新构建,在理解、生成、逻辑和记忆方面均有巨大提升。 “文心大模型4.0的综合水平跟GPT4相比也毫不逊色!” 李彦宏自信地说道。从现场的实际来看,文心一言4.0的确聪明了不少,目前已经开始邀请测试。 文心一言4.0亮相 “丰富的AI原生应用才是大模型的价值所在”。李彦宏强调,所以在发布会上他没有过多讲解大模型的技术原理和亮点,而是将重点放在应用上。作为中国最初一批的互联网巨头之一,百度的优势自然是已经深入用户生活的应用,比如搜索、地图等等,通过应用来展现百度AI的性能,更容易让用户感受到AI技术的实际作用。 李彦宏在现场着重介绍了文心一言4.0大模型的四大能力,全部采用现场提问的方式。比如他向文心一言提供了一张汽车图片,并要求文心一言生成两张以春天生机勃勃为背景、体现汽车飞驰感的广告海报。很快,文心一言4.0便生成了符合描述的照片,没有出现老版本“画不达意”的失误。 以搜索引擎起家的百度自然是选择以大模型重构百度搜索, 李彦宏表示,百度新搜索的特性是:极致满足、推荐激发和多轮交互。 正如字面意思,百度新搜索会通过AI学习,对搜索内容产生更深层次的理解,并通过文字、图片等内容展现,目的是让用户一步获取最佳答案,而不再是从海量的链接中一个个寻找。“生成式AI与搜索是天作之合,未来将打破端的限制,全程陪伴。”李彦宏这样总结道。 百度GBI(生成式商业智能)则是一个全新的产品,旨在解决商业场景的问题。基于文心大模型4.0,GBI能够生成更准确的商业执行计划,包括财务分析、项目交互、用户分析等数据,提升商业决策的效率。“掌握先进工具的人不会在AI时代被取代,还会升职加薪。”李彦宏这样“带货”GBI。 在传统的“One More Thing”的环节,李彦宏拿出了百度研发多年的Apollo智能驾驶技术。在文心大模型4.0的加持下,智能驾驶的能力将被提升为“10秒钟预警,10分钟完成救援”,提供更智能的驾驶体验。“未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界。自动驾驶就是视觉大模型重构物理世界的一个典型应用。”李彦宏最后总结了AI未来发展的方向。 用AI实现自我改造 在互联网1.0时代,百度以搜索起家,很快占据了国内市场。但在移动互联网普及后,百度应用并不及竞争对手强势,错失了移动支付、外卖等市场。而在AI时代,李彦宏显然不想再次错过机遇, 于是在今年5月宣布百度旗下所有产品都进行重构,用AI思维做出AI原生应用。 据悉,在今年文心一言发布之后,百度随即在5月将其升级为3.5版本,并开始升级现有的搜索、文库、地图、广告服务等产品。 发布会上,李彦宏以百度网盘为例,实际演示了文心一言如何增强其多模态信息的理解能力。重构之后,网盘云一朵功能可以通过语音快速搜索到具体视频中的某一帧,还可以按用户要求提炼视频内容并生成文稿,展现了AI的上下文理解能力。 李彦宏表示,云一朵用户目前已经突破2000万。 在AI平台方面,百度飞桨AI Studio已有超480万开发者加入,拥有600+项目和22万+数据集。 基于文心一言大模型的AI应用将会越来越多,并被应用在商务、服务、教学、创作等方方面面。在全面发力于AI的情况下,百度今年Q2业务表现有所提升,营收和归母利润分别增长15%和44%,超过市场预期。 对于百度如何将AI技术有效转化成百度变现能力的问题,李彦宏这样回答:“我们刚才提到 AI原生思维,这样的思维非常重要,能重构用户的搜索体验。” 大模型要与产业在一起 在发布会的演讲中,李彦宏多次提到“生成式人工智能”和“AI原生应用”两个重点,其演示的十几款应用也几乎涵盖了用户生活中的各个场景,不论是辅导孩子做题,还是导航订酒店、旅游咨询、广告创作或是商业分析报告,李彦宏希望百度的AI原生应用能够渗透到用户的生活中。不难看出,百度希望借助AI夺回失去的移动互联网市场。 从“人工智障”到人工智能,近年来AI技术的发展不可谓不激进。 ChatGPT火到出圈,让人们开始相信AI真的能够改变生活。市场调研机构Grand View Research报告称:由大模型支撑的人工智能市场规模在未来 7 年会以 35.6% 的复合增长率实现增长,达到1094 亿美元。麦肯锡的报告则显示,至2025年中国生成式AI市场复合增速将达到84%,占全球市场规模(2,170亿美元)的14%。对于百度来说,显然是一个抢先占领市场的好机会。 目前,全球各大科技公司也已经开始布局AI市场,主要方向分为两类。一是通过AI重构自家应用,比如微软近日对Windows 11进行了更新,在Copilot助手中加入AI功能,通过语音对电脑进行操作,或是生成想要的内容;谷歌则发布了基于大模型重构的地图和Gmail;Adobe则在Photoshop中融入图像生成能力,并在近日发布了三个全新的Firefly模型。 中国公司方面,除了百度的全面重构和全新AI原生应用,腾讯在数字大会上发布了混元大模型,以此重构腾讯云、腾讯广告、腾讯游戏、腾讯文档等产品和业务;网易有道则利用大模型,推出了口语私教业务;另外还有字节跳动、华为、科大讯飞等企业已经通过了国家备案,未来会将大模型技术融入到自家应用中。 另外,还有一些公司在寻求通过AI大模型寻找新应用、开辟新的市场 ,包括个人助手类应用,如 OpenAI的ChatGPT Plus 和百度的文心一言;或是将大模型用于社交应用、游戏内社交功能的案例,如Character.AI。出售大模型服务也是一个方向,微软Azure、百度云、腾讯云等,都旨在帮助用户构建自己的大模型平台。 或许,李彦宏在此次发布会上的自信表现,代表着百度押宝“AI原生应用”的正确性。回顾整个互联网行业的发展历程,1.0的门户网站和搜索、2.0的社交媒体以及3.0时期基于移动设备的应用,在当时都是创新的存在。而在AI时代,你问我答的“人工智障”显然无法满足需求,大模型带来具备人类思维逻辑的生成式内容才是用户需要的。那么,文心一言4.0是否能够比肩Chat GPT,相信很快就会有答案。
  • 热度 8
    2022-4-22 08:08
    1295 次阅读|
    0 个评论
    ​ 转载-- 8号线攻城狮 2022-02-22 07:21 来自|ittbank ​ ​ ​ ​ ​ ​ ​ ​ 声明: 本号对所有原创、转载文章的陈述与观点均保持中立,推送文章仅供读者学习和交流。文章、图片等版权归原作者享有。 —— The End—— ​
相关资源