原创 李彦宏:开发大模型,百度踩了无数坑,交了高昂学费

2024-4-16 17:53 271 3 3 分类: 消费电子

文/侯煜

编辑/吴妍

今日,Create 2024百度AI开发者大会在粤港澳大湾区举办。面对现场来了5000多位开发者和科技爱好者。百度集团创始人李彦宏跟创业者、开发者交流,分享了自己对大模型和生成式AI的洞见。

大模型和生成式AI,将彻底改变开发者

李彦宏认为,过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。

“这一天并不遥远,我们看到,因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了”。

李彦宏举例,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。

李彦宏对开发者说:“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

基于大模型,百度开发各种应用工具

作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具。具体来说,就是提供1个强大的基础模型系列,就是文心大模型系列,这包括旗舰版的ERNIE3.5, ERNIE4.0, 也包括轻量版的ERNIE Speed、Lite、Tiny等等。

李彦宏介绍,百度还提供基于大模型来开发各种应用的工具,包括:

Ø 智能体开发工具AgentBuilder,

Ø AI原生应用开发工具AppBuilder,

Ø 各种尺寸的模型定制工具ModelBuilder。

以上这三个工具,都代表了先进生产力。

文心一言用户突破2亿

文心一言从去年3月16日发布,到今天是一年零一个月的时间。其用户数突破了2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。(详见:《文心一言毁誉参半,却成为百度业绩增长新杠杆》)

李彦宏指出,文心一言正在改变更多人的工作和生活。

支撑文心一言的基座模型,就是文心大模型。过去一年,文心一言经历了从3.0版本到3.5,再到4.0版本的进化。文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。

近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。

今天,我们正式发布文心大模型4.0的工具版,现在,大家可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。

不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。媒体可能不会因为成本下降99%而兴奋。但是企业也好,开发者也好,一旦用起来,最关注的就是效果和成本。

我们能在提升性能的同时,把推理成本降到1%,正是因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用。

李彦宏特别强调,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。百度在过去一年大模型的实践中,踩了无数的坑,交了高昂的学费。(详见:《敢打仗的景鲲离场,百度硬件生态战略该叫停!》)之后李彦宏向开发者分享了基于大模型开发AI原生应用的具体思路和工具。

Ø 第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,这都是有技术含量的,要针对应用的不同场景做匹配。

Ø 第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。百度Speed,Lite、Tiny三个轻量模型的原因。

Ø 第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,我们已经开发出来了,并且向开发者全面开放。

在MoE、小模型、智能体这三个方向上,百度都已经给大家做好了“开箱即用”的工具。分别是:智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

Apollo视觉感知大模型应用到了制图领域

李彦宏介绍,基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。

百度地图也率先将视觉感知大模型应用到了制图领域。现在,全球最大规模的车道级地图数据,已经上线全国360座城市。只要百度地图导航能去的地方,智驾就都能开。(详见:《四维图新诉百度侵权案落锤,地图生意单打独斗有多难?》)

李彦宏介绍,今年春节后,百度的萝卜快跑实现了万里长江“第一跨”, 已经把服务从长江的北岸延伸到了南岸,在武汉的部分区域,百度已经实现了7X24小时的全天候运营,还计划年内在武汉部署1000台无人驾驶车辆。

李彦宏认为,这是自动驾驶走向真正商业化的一个标志性事件,它不再仅仅是区域性的示范,而是进入到了城市级应用示范的新阶段。目前,萝卜快跑在武汉覆盖了3000多平方公里、770万人口,是全球范围内最大规模的自动驾驶运营区域。

李彦宏在现场展示了百度文心大模型系列,以及三个开发工具——AgentBuilder、AppBuilder、ModelBuilder,“他们组成了一个工具箱,你们可以马上打包带走,随取随用。”李彦宏介绍称。

文章评论0条评论)

登录后参与讨论
我要评论
0
3
关闭 站长推荐上一条 /2 下一条