原创 中国大模型,有了“压舱石”

2025-1-17 11:43 48 0 分类: 机器人/ AI


 

新年伊始,讯飞旋即召开最新的模型发布会,距离上次重大更新仅过去不到一个季度,这次发布会上,讯飞带来三个大招: 

1)推出深度推理模型讯飞星火X1,作为全国产算力平台上唯一的深度推理大模型,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景;

2)升级星火4.0Turbo 底座能力升级,进一步拓展多模态的边界; 

3)发布同传大模型,最快语音同传时延小于5秒。 

讯飞速度,让我们看到全国产化AI大模型的能力擢升的希望之路。当下脱钩断链的时空背景下,自主可控有了更深刻的现实意义,中国AI产业也有了真正意义的压舱石,未来不管形势如何变化,我们都已有从容自主应对的底气:中国大模型技术未来发展安全可控,商业化落地路径也愈发清晰可见。 

01从“星火发布会窗口”看全栈国产AI的成色

大部分人都非常关心基于全国产的芯片、算子、算法的大模型之路,究竟是否能够走得通。一直以来,讯飞星火坚持走全国产化路线,因此其发布会也成为业内人士观察全栈国产AI进展的关键窗口。 

在此之前,2023 年 10 月首个国产万卡算力集群“飞星一号”平台上线,后升级为国产超大规模智算平台“飞星二号”,2024年1月,讯飞通过国产算力平台训练出的千亿参数模型讯飞星火V3.5正式发布,性能指标处于国内领先水平,初步验证了这条路能行得通。 

而这次发布会,是观察这条路能否走得好的关键切面。 

【1】迭代速度保持领先

从23年首发至最新的发布会,我们观察到星火模型的迭代速度非常快,完全不用担心国产底座成为技术发展的掣肘。从近2年来关键的时间节点来看: 

2023年5月6日,在AI全球爆火后不到2个月,讯飞星火大模型正式发布,且具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。 

2023年10月24日,为实现完全的国产化,讯飞与华为携手自研算力底座,并于联合发布了国内首个全国产算力平台“飞星一号”,常态化支持万亿参数的大模型训练。

2024年1月30日,首个基于全国产算例训练的讯飞星火V3.5发布,同时发布的还有星火语音大模型,首批支持37个主流语种。

2024年6月27日,科大讯飞发布讯飞星火V4.0,七大核心能力全面升级,在8个国际主流测试集中排名第一。

2024年10月24日,基于“飞星一号”平台,星火大模型已升级为4.0 Turbo版本,根据真实数据的测试,其七项核心能力在中文领域全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o。

2025年1月15日,科大讯飞持续深入大模型国产化“无人区”,正式发布星火深度推理模型X1,同时首发星火语音同传大模型;此外,讯飞星火4.0Turbo底座能力+行业能力再次升级。

讯飞大模型的迭代速度和频率,均与全球第一梯队厂商保持一致,直接证明了基于国产算力和算法的大模型之路深度可靠。 

【2】能力上比肩全球第一梯队

在过去两年的百模大战之后,AI从2025年开始进入推理时代,所以这次讯飞发布会,最引起我们关注的,自然是当前业界全国产算力平台上唯一的深度推理模型——星火深度推理模型X1。 

发布会上,科大讯飞研究院依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现,X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。 

通过解题的案例,也首次揭秘星火X1的三大特点:化繁为简,能将复杂问题分步拆解简化;进行自我探索反思验证;依据答案正确与否进行强化训练。这种能力相对通用大模型,是一种更为接近人类的“慢思考”方式。 

这种方式是X1能力突出的关键。星火深度推理模型X1近期还参加了小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项考试,交出了一份非常亮眼的“考试成绩单”:用更少的算力,达到业界一流效果,多项指标位居国内第一。 

另外值得一提的是,推理阶段相对训练而言,是更加追求成本效用的,便宜好用是商业化落地的最大前提。

水滴石穿非一日之功。这次发布会上推理模型X1的惊艳表现,离不开科大讯飞从成立之初就保持对AI的专注,以及近些年持续大手笔加大对研发的投入。 

图:科大讯飞研发费用 

除此之外,讯飞的底座星火4.0 Turbo能力也迎来全新升级,此前的七大核心能力得到全面提升,对标或者超越OpenAI 最新版的GPT-4o。 

更引起我们重视的是,此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。比如数学能力上,星火X1的高质量合成数据,让讯飞星火4.0 Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等发挥更大的作用。 

整体来说,星火4.0 Turbo成为更懂行业的通用大模型,为赋能千行百业提供有力支持。

在地缘冲突不断加剧的当下,掌握科技革命的底层资产是应对未知的重中之重。 AI大模型的底层资产,就是算力和算法。 讯飞星火,成为了奇点爆发后,现阶段唯一掌握底层资产的大模型。 由于采用全国产算力,科大讯飞逐渐成长为中国人工智能“国家队”。 

“全栈中国算力”的意义并不仅仅仅是为应对偶发性的地缘冲突,更是证明技术不会被卡脖子,安全可控,开发者可以继续沿着这条路奋力耕耘。另外发布会的一条暗线是,星火大模型正在朝着应用落地方向快速成熟,意味着应用者未来可以在国产生态中繁荣。 

02 掌握自主“know how”,是国产模型的新内核

【1】成为大模型国家队的前提是know-how

我们没有发明计算机,但是我们依托摩尔定律成为全世界最大的计算机制造商,我们没有发明互联网,但是我们依托高带宽成为全球领先的移动应用市场。 

但过往的荣光根植于渐行渐远的全球化时代,那时我们只要完成产业链分工的一个环节即可。当时当下,不管是脱钩断链、小院高墙,都力证全栈自主化的紧迫性和必要性。 

在AI大模型的竞争中,英伟达向全球AI参与者输出了工程能力,依托CUDA和英伟达的解决方案,市面上所有的玩家只要有钱,都可以构建百卡、千卡乃至万卡的计算集群。我们可以依托英伟达做出更强的模型,更强的应用,只不过底层的Know-how和产业运行逻辑还是掌握在英伟达、OpenAI们手里。 

另外,现阶段AI的发展,越来越受限于数据安全。毕竟大模型的训练依托的就是优秀的数据、语料,而对于企业而言,数据是最核心的生产要素之一。对于国家安全、产业自主来说,拥有一套属于自主可控的模型,也越发重要。 

算力即国力的后半句应该是,模型安全即国家安全。 随着美国对大模型出口也开始严格限制,这层窗户纸已经被捅破。因此,现阶段我国真正需要的是,掌握AI大模型最底层的Know-how,掌握AI从基础算力层到应用层全部的运行逻辑,包含每一颗芯片、每一行代码、每一个数据。

【2】如此,才能成为产业放心的基座

对国计民生的重要行业、尤其是中国国企阵营而言,我们需要一支具备中国科技发展结晶的国家队来为企业AI转型护航。 

在大模型之前,科大讯飞就承担了国家发改委、工信部、科技部和中科院的多项国家战略任务。而近两年来,全栈国产化的“讯飞星火”大模型,速度和能力都持续领跑业界,因此自然成为央国企转型AI时的首选。 

2024年10月14日,中国海油携手科大讯飞、中国电信打造的“海能”人工智能模型正式发布,为解决央企在垂直领域核心痛点问题,共推出具有海油特色的5个专业场景模型和6个通用场景模型. 

专业场景模型针对海上油田稳产增产、安全钻井、海工制造、设备维护、LNG(液化天然气)贸易、油气销售等场景,构建数据驱动、业务协同的新模式,进一步提升产业数智化水平。通用场景模型针对招标采办、员工健康、辅助办公等需求推出智能应用,助力业务管理和办公效率提升。 

其实不仅仅是中海油,中国移动、交通银行等等行业标杆性的央国企都选择与科大讯飞合作共建大模型。 截至目前,讯飞已经与央国企及20多个行业的头部企业一起发布行业大模型,覆盖300多个应用场景。 在积累百余个行业应用经验之后,讯飞星火4.0Turbo的行业能力也将再次升级,懂得了更多的行业know-how,成为“最懂行业”的大模型。 

第三方数据显示:在2024年大模型的招投标中,科大讯飞的中标数量(91个中标项目)和中标金额(8.5亿元)均位居第一,成为2024年度大模型中标项目的“标王”,涵盖了通信、金融、能源、教科、政务、医疗等多个行业,且主要以央国企客户为主。 

03 星火X1带动中国率先进入深度推理时代

过去,科大讯飞一直坚持“技术顶天,应用立地”的发展战略,引领大模型规模化应用落地,以期早日达成AI生态的闭环。早在公司2023年的年报中,公司就用一张“业务全景示意图”,描绘了讯飞对于其AI生态的愿景规划:基于全栈自主化的核心AI技术,赋能C端、B端、G端,最终实现共赢。 

图:业务全景示意图 来源:公司2023年年报 

从时间维度上应用落地的紧迫性正在与日俱增。2025年随着AI正式进入推理纪年,全行业都需要回答该如何收回天量的投资,答案是唯有应用。而星火X1的重磅推出,正在将讯飞在一年前擘画的愿景,描绘成清晰的应用落地商业化路线。 

比如在讯飞传统优势的教育、医疗行业,星火X1起到了点睛的作用。 

去年,讯飞就联合中国教育科学研究院,发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。目前,星火X1已经部署上述试点区域,X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色,得到一线老师的高度认可。 

我们也不难推断,在讯飞的拳头产品AI学习机上,具备“慢思考能力与深度推理能力”的星火X1,马上将成为学生和家长的得力助手,AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰。 

医疗领域,讯飞星火X1的模型策略已取得初步验证成效,专科辅助诊断和复杂病历内涵质控的准确率均达90%,发布会上,讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,在更大范围为医生提供更专业更高水平的辅助。 

不仅仅是教育和医疗,X1大幅提升了讯飞的AI引力,加速AI生态的成形: 

B端,X1能够加速在教育、医疗、汽车等已有场景的的商业价值闭环,此外还能提升其他垂直行业的用户体验和产品渗透率,去展望更大的想象空间;

C端,学习机、文档、翻译等标准化产品更贴近使用习惯,将惠及更多的消费者。

G端和央国企侧,X1还能帮助讯飞做深做透,实现更好的降本增效。 

技术迭代,产品落地,并实现了多端共振的正反馈,商业化路径自然会逐渐清晰。 

04 中国AI国家队的星火征程

AI是历史级的科技革新,没有人能够躲过时代的浪潮,我们能做的只是顺势而为、踏浪前行。从2023年爆发至今AI的突飞猛进满打满算不到2年,未来精彩只会更多,当然风浪也会越大。 

历史总是在风雨飘摇中前行,有幸的是,这一次我们抓住了船舵,掌握自己的命运,同时也有了竞争的底气。星火燎原的征程,我们已经和讯飞一起开拔。 

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
我要评论
0
0
关闭 站长推荐上一条 /3 下一条