公元2023年,“百模争流”。从中关村到硅谷,创新之火,如火如荼,赤诚可鉴却优伪难辨。
维特根斯坦说:凡是能够说的,都能够说清楚;凡是不能说的,必须保持沉默。
在一重产业革命级别的技术范式转折之中,识别真正的硬核创新者,识别大模型时代产业趋势,我们须摒弃能说会道的投机者,去跟随如维特根斯坦所说的这类既可以自证又懂得沉默的盗火者。
在审读过多数AI公司之后,在我们看来,商汤是其中更被低估的盗火者之一。直到大模型火焰点燃中国千行百业之后,更多的人将骤然领悟,它为何必然是新周期里那个中国的“普罗米修斯”式AI公司之一。
01AI原生时代盗火者蒸汽机,交流电,互联网,每一次工业革命级技术发轫之后,平均都至少将用50年时间,划分出一个指数级的经济增长时代。这其中,最重要的一重现象,就是新企业的进入与老企业的退出。
图:1980年至2010年信息技术革命黄金30年内美国新老企业进入与退出率。来源:《美国增长的起落》
特别是在颠覆性技术交替的5-10年内,产业界的新旧势力碰撞将异常激烈。这一过程,便是新技术原生代登上历史舞台的窗口时刻。
通常来说,在此之后,主导产业经济的力量,将从属于新技术原生时代的力量集群们。一如汽车诞生之后,马车在社会分类消费支出的份额之中迅速归零(见下图),马车夫和车行老板们在经济系统里的荣耀,在历经几个世纪的稳态后,一朝泯灭。
图: 1 869 年至 2 013 年美国部分大类耐用品在社会分类消费支出份额中的变化。来源:《美国增长的起落》
这警示着我们,每当新一轮技术革命肇始之际,我们务必将眼界与筹码投向从属于新周期的原生型公司之上,而勿要沉湎于过往的线性经济逻辑中——这便如:我们不能指望马车夫和马车行老板们造出汽车一样。
换言之,在方兴未艾的大模型时代,我们更须着眼于AI原生时代的盗火者。它们至少存在以下几个显著特征:
1.具备前瞻的算力思维。
2.具备智能算力工程能力。
3.具有智能算法技术池积累。
4.具备以算力、算法统筹千行百业不同特质的数据之能力,并可以快速迭代设配,具有为不同产业至少带来数量级效益增厚的潜力甚至能力。
这四点不难理解:算力(算力工程能力)是AI原生时代所有商业模式的第一性,算力思维是与互联网时代流量思维最大优先级的区别特征。算力思维同时也是算法技术的根基,驱动着智能在通用以及专用领域的持续涌现。唯有具备软硬一体(算力与算法的统一)思维能力基础,才能在智能革命竞争中走得更远,直至融入千行百业之中胜出。(该系列逻辑已在此前系列研究报告中,不复赘述。)
通观海内外AI业界,具备这四项能力的AI原生力量实则比我们认为的要少很多,而来自中国的商汤则是其中之一:
1、前瞻性:最早布局AIDC人工智能超算中心的AI公司。
商汤2018年筹备落子的AIDC,于2022年正式于上海临港投用,基于2.7万块GPU实现对外输出算力突破5.0 exaFLOPS,可支持最多20个千亿参数量超大模型并行训练。
某种意义上,这是中国人工智能从单一场景应用正式转向通用人工智能的标志。在此之前,全球范围内规模性算力中心多以传统串行计算为主、并行计算为辅。
商汤此举意味良多——
彼得蒂尔在移动互联网时代总结道:每个通向伟大的公司都有自己的“秘密”。商汤究竟在2018年时看到了什么,因何最早敢为天下先,以数十亿真金百亿投向AIDC这一通用人工智能基础设施,正是其得以从容不迫地穿越至AI原生时代的关键秘密。
关乎商业竞争的秘密不足为外人道,但我们已能看到日日新大模型体系顺遂地落地,并以天为单位不断进化。更重要的是,商汤的AIDC本身已经成为一个可以产生现金流的生意——通过并行算力的对外服务,以及对产业的赋能,已经使它在AI原生时代初期即手握两个关键商业模式:
●算力即服务;
●模型即服务。
比较起2023年前诸多在行业场景里摸爬滚打,最终却不得不接受数以亿计沉没成本的1.0代AI公司,商汤有效地将在1.0时期募集的资金高效留存并顺利地过度到了2.0时代。这是证明这家公司拥有超级AI战略视角的关键佐证。
2、可靠性:领先的智算工程能力。
关于智算工程能力,商汤的可靠程度在整个中国AI大模型领域应是最不容指摘的公司之一:
(1)AIDC这一万卡(GPU)级别的智能计算中心,本身即是智算工程的产物。AIDC历时数年的设计建设,亦是智算工程能力进一步磨砺的过程。
(2)以数据说话:商汤针对新大模型的自动化数据标注服务目前已将智能标注效率提升百倍;大模型推理部署服务可将大模型推理效率提高600%;大模型并行训练服务支持单集群3200卡5000亿稠密参数模型训练。
而这也衍生出了商汤在AI原生时代第三个关键商业模式:
●工程能力即服务。
可以预期的是,随着大模型在千行百业的不断渗透,将衍生出海量的基于AI大模型的创业公司。届时,它们远不必从零到一的在大模型服务上苦思冥想,以商汤为代表的中国AGI先行者,已经集结了算力底座-MaaS-算力工程调优维护等全流程生产力平台工具——如果说算力是水电,MaaS是房屋,那么工程能力便是物业维护,全程护航中国AI原生时代的不断进取与突破。
3、可信性:600多篇顶级学术论文,超过12000件人工智能专利及专利申请积累。
根据我们的最新统计,商汤科技自2014年成立以来,在各项全球竞赛中已获得70多项冠军,发表了600多篇顶级学术论文,并拥有超过12000件人工智能专利及专利申请。
专利与学术论文是技术的影子,它不是事实本身,却映射事实的轮廓。透过这样的商汤这一放之全行业亦不遑多让的AI技术能力轮廓,我们大致可以看到:
(1)从所谓AI四小龙之一,到AIDC战略的落地,再到最先穿越至AI原生时代,以及更高效率地落地日日新大模型,AI工程能力逐日擢升,商汤AI技术能力的演进并最终脱颖而出,是一个一步一个脚印、可逐帧回溯的过程,具有充分的可信性。
(2)商汤从单一场景通向通用原生时代,整个过程中投向研发的钱,都以技术为载体实现了逐一落地,并也因此高效地全程支撑了其超级AI战略视角的执行,并保障了其迄今为止的技术领先性。
4、领先性:大模型的迭代适配能力。
谈到技术领先性,除了超级AI战略视角,以及在专利技术领域投下的影子,更重要的还体现在大模型的不断迭代适配,对于关键实体产业的真实赋能能力之上:
商汤已在通用模型领域,实现语言模型、图像模型、多模态模型与AIGC(内容生成)“四箭齐发”,同时据商汤2022年年报显示,截至去年年末,在专用模型领域,则已累计对外输出商业模型达6.7万个。以中国当前产业高质量转型阶段的关键抓手——智能汽车制造领域为例,商汤的智能汽车整车厂合作伙伴超过30家,AI模型及技术服务渗透涉及车辆超过800万辆。
一言以蔽之,商汤已率产业之先拿到了通向AI原生时代的那张船票。
02不要听他怎么说,而要看他怎么做中国的AI原生时代盗火者正在砥砺而行。但必须事实求是地是,当前而言,我们仍处于大模型的“盲人摸象”阶段,每一个角度似乎都是真相,但其实又只是拼图。
正因为远景的模糊,使得噪音不断。故而识别其中的趋势,一个简单的方法论在于:不要听他怎么说,而要看他怎么做,以及做的怎么样。
根据最朴素的经济学原理,AI能给产业带来什么价值,无非是从供给需求两个维度去看:即,供给端能有什么效率提升;需求端能有什么效用收获。
从商汤科技的系列动作值中,我们其实可以清晰看到针对系列问题的求解逻辑与路径:
什么是优质供给?基础算力基座+大模型体系+生成式AI应用
什么是有效需求?从专用,走向通用,再走向专用。
【1】什么是大模型时代的优质供给?
当一个供给不够优质的时候,谈论需求无异于缘木求鱼。智能手机的iPhone,新能源汽车的Model 3,之所以被人反复咀嚼就是由于其在供给端做出了划时代的贡献。
AI其实并不新,作为一个发展了数十年的行业,之所以在2023年引起全球的高度关注,就是由于ChatGPT让人看到大模型带来的奇点效应。但大模型仅仅只是开始质变的原点,未来真正的优质供给仍在紧锣密鼓的构建中。大模型时代,亟待赋能的是千行百业,真正优质的供给需要动态体系化的AI基础设施。
该怎么理解动态体系?
1)大模型时代的基础设施需要成体系
算力无疑是资本市场最火的投资赛道,但目前市场讲的算力概念有所偏狭,仅局限于IDC,服务器,甚至是GPU。
但实际的AI算力基础是“算力、数据、基础算法”三位一体的,智能算力必须靠体系才能发挥作用,而不是简单的硬件堆砌,不然IDC企业岂不是这一轮AI的领航员?可以作为佐证的是,最近随着大家抢着下单完英伟达的A100后,发现高质量的数据竟然是更高的门槛,而算法大部分人还只能依托于开源。
根据商汤联合创始人杨帆的阐述:算法当然可能体现基模型、计算法,或者说体现成一些AI运算的一些工具。算力呈现的不仅是硬件的资源,还包括一整套的基础软件体系,是不是能够把几千张卡连在一起去做一个训练。数据也不仅是数据本身的积累,还包括处理数据的能力、整合数据的能力、使用数据的know-how。
商汤从成立之初便在这三要素上蓄力,比如前瞻性的扩容智能算力(AIDC)就是一大佐证,公司当前AIDC运行GPU接近3万片,能够输出高达5000p的总算力,跻身国内智能算力第一梯队。
显然供公司的布局不限于此,伴随着 AI技术的升级,商汤开始尝试将自己这些先进的能力提炼出来,定义成一个AI基础设施——AI大装置SenseCore。这个大装置不仅成为公司迭代大模型的核心引擎,而且也能为业内提供一个足够低成本、低门槛的服务。
图:商汤 A I大装置 S enseCre为大模型体系提供算力支持
2)大模型时代“喜新厌旧”,需要及时动态迭代
由于要面对千行百业,大模型现在离人们的期待还有着巨大的差距,根据用户/客户进行及时的优化,是模型迭代的最优路径。或者说,客户就是最好的产品经理,而这对于更新提出了近乎变态的要求,毕竟传统企业的产品最快也是按年为计量单位来进行迭代的。
商汤于2023年4月份,基于其AI大装置SenseCore,推出了“日日新SenseNova”大模型体系,包括语言大模型,以及文生图、2D/3D数字人生成、大场景/小物体生成大模型。这个大模型体系的名字就隐含了动态迭代的愿景。
那么一个季度后,他们做的如何呢?商汤首席科学家王晓刚的访谈中对市场关切的这一问题做出了明确的回应:“我们的这种更新,每天也都是不断的去接到用户的调用,还有很多客户,实际上是对我们模型有全方位的测试和评估,也会给出我们方向的建议,所以我们收到反馈以后,其实每隔几天都会进行一个快速的更新。”
简单来说,“日日新”大模型的更新周期,是以天为单位的,也的确符合这个模型的“出厂设定”。正是由于这样的更新速度,基于“日日新”这一生成式大模型,目前公司通用大模型已经覆盖视觉、语言、多模态、内容生产四大领域。这种大模型快速开发、迭代能力,反映的就是很强的AI系统工程能力——
据7月7日,第六届世界人工智能大会(WAIC 2023)期间,商汤带来的最新分享显示,“商汤日日新SenseNova”大模型体系,已于日前再度实现了重大迭代升级:
●千亿级参数的自然语言处理模型商汤商量SenseChat 2.0版本,突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可无缝适配移动端、云端等不同终端及场景的应用需求,降低部署成本。
●生成式大模型商汤秒画SenseMirage 3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。
●如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。
●3D内容生成平台琼宇SenseSpace 2.0的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成(1200 TFLOPS/秒算力支持)。
●另一3D内容生成平台格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。
于AI玩家而言,锻造优质供给的最终目的,就是为了让 AI技术更加低成本、低门槛、高效率的进入到各个场景里面。在绝大部分企业还在三要素—“算力、数据、算法”—中顾此失彼的时候,商汤“大算力+大模型”的AGI战略,在供给侧无疑取得了得天独厚的先发优势。
【2】什么是大模型时代的有效需求?
7月18日,Microsoft在合作伙伴大会上官宣Copilot的定价为:每用户每月额外支付30美元。随着微软吹响AI+办公应用落地的发令枪,AI的商业化探索,正式成为每一个头部AI供应者现在需直面的头等大事。
但到底什么是有效的需求,目前的争议远远大于供给侧的技术路线之争。我们认为,大模型时代的有效需求,是先解决用户的通用性问题,然后再解决用户的专用性问题。这就像计算机的发明,首先解决的是计算这个通用性刚需,然后再是垂直向下解决如办公、娱乐、画图、视频等专用个性化需求。
为了解决通用性问题,AI的供应商,需要提供牢靠的通用性量子能力,比如行业的文本能力已相对成熟,但视频、图像等能力尚待突破,最终必然要构建多模态能力。而针对专用问题,势必要下沉到行业中去,与行业的专用数据和产业规律浸泡在一起,寻找最短路径的解决方案。
图:突破供给瓶颈后, A I 将在需求侧解决 “通用”和“专用”两个层次的问题
1)从专用走向通用
追本溯源,AI以前没有进入大众生活最重要的原因,就是由于其不够通用。在上一轮AI热潮中,我们还是只能用相对比较高昂的代价解决某些特定的问题,比如人脸识别、拍照防抖、自动驾驶。就好像专业的运动员,只能在特定的项目上表现优异,而人们期待的是一个“全能选手”。简单来说,以前的AI的智能不够通用。
大模型促使AI时代跃迁到AGI时代,其中的G就是通用的意思。正是由于大模型时代的到来,使得AI终于有了“人”的影子,我们便可以畅想,AI能够替代或者帮助人去做哪些事情。
具体来说,2023 年起的大模型涌现,标志着AI已经从专用任务转向通用任务,或是以自然语言人机接口的方式呈现,能让机器遵循人的主观意志实现更广泛的功能。比如在算法方面,大模型的表达能力越来越强、规模越来越大,自主学习能力越来越强,从专用向通用趋势显著,你可以让AI扮演你的老师、助手、伙伴。
回归到商业模型视角,不管是to B还是to C,大模型不再局限于某一个垂类,而是提供通用型的量子能力,解决“刚需”,比如文本、图像、视频等跨模态的需求。用专业一点的话来讲,大模型需要演化成MaaS(Model-as-a-Service,模型即服务),利用大模型的通用能力,提供泛化的服务。
一体两面,判断一个公司的大模型是否靠谱,最简单的方法就是看其模型能否提供通用的服务。而这无疑,是一个高阶的要求,因为从专用走向通用,需要积累大量的 know-how。
大部分人对商汤的印象还停留在机器视觉龙头公司的阶段,实际上过去8年,商汤靠专用积累实现蜕变,将技术迭代泛化到通用,多模态和多场景已然不然话下。
我们以智能汽车这一大家高度关注的领域为例。这一场景对智能的要求是方方面面的,细分场景包括驾驶域、坐舱、车路等,交互又包括语音、文本、触控等多种方式,非常复杂。对于这一问题,商汤的绝影智能汽车提出了“驾、舱、云”三位一体的战略,规划未来在智能汽车领域成为通用人工智能核心供应商。
仅仅在座舱,公司打造的车舱大脑就分为四个层次:
1)车端,包括摄像头和各种感知硬件,感知车控包括娱乐在内的各种车内状态,以及各种长短的记忆模块;
2)云端,在强大的AIDC基础设施和日日新大模型的加持下,发挥云端决策和推理能力,协同调动车内资源,去控制车内各部分和APP,输出强大丰富的内容,生成车内智能化的操作系统;
3)往上附加,绝影智能车舱支撑了十多项各种应用,大大提升驾乘安全性,丰富娱乐功能,提供智能化教育服务,最终大幅度提升在车内的各种操作,还有工作效率;
4)另外,通过虚拟助手的方式,跟乘客实现拟人化的交互。
商汤作为一家to b企业,做大模型需要更多的考虑AI的泛化能力,更高的泛化能力意味着解决某一领域全栈需求的能力及整体解决方案的壁垒越强。
图:商汤面向客户提供多种 M aaS 服务
2)从通用再次下沉专用
但为了更好的让AI提高各行各业的渗透率,除了极强的通用能力外,还要结合行业的专业知识,即“从群众中来,到群众中去”。AI供应商需要利用大模型的通用能力去应对多样化、碎片化的应用场景,这一步需要积累众多的行业大量的know-how。
对商汤而言,在日日新大模型体系下,生成式AI应用就是降维的事情。当前公司已经推出的商量SenseChat(语言大模型)、秒画SenseMirage(文生图创作平台)、如影SenseAvatar(AI数字人视频生产平台)、琼宇SenseSpace(3D场景生成平台)、格物SenseThings(3D内容生成平台)等,正高效嵌入千行百业之中:
1)在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效。
2)在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力。
3)移动终端,依托商汤大模型的轻量化版本,轻松实现在移动终端的部署和运行,带来多种智能交互解决方案,包括针对信息获取的问答交互,针对生活场景的知识交互,针对语言和图像生成的内容交互等。
4)线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。基于琼宇2.0的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率。在珠宝行业,依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。
以上可见,商汤正积极通过大模型的多模态能力组合赋能产业升级,并为中国的AI原生时代带来诸多引领行业的全新突破。
03结语AI 已然成为数字经济时代的新基建,硬核创新者,已经在锤炼供给——落地需求——优化供给——升级需求的正循环中,转动了智慧的飞轮。我们有幸看到大模型时代产业趋势的盗火者,已经手捧火炬接棒未来。
作者: 锦缎研究院, 来源:面包板社区
链接: https://mbb.eet-china.com/blog/uid-me-4010282.html
版权声明:本文为博主原创,未经本人允许,禁止转载!
文章评论(0条评论)
登录后参与讨论