tag 标签: 科大讯飞

相关博文
  • 热度 3
    2023-2-19 19:01
    577 次阅读|
    0 个评论
    本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 当AI以一个特定的主题,在30秒内完成一篇文章 的写作,并在高中甚至大学某个年级的课堂里获得第一名的最终评价时,我们知道,对于我们的下一代来说,这个世界已经永远改变了。 不止是写作。当时当下,在全球各地各个产业领域内,一场以生成式AI为内核的人工智能革命,正在以不可逆的态势深入蔓延。ChatGPT为代表的生成式AI,已成为全球科技竞争的制高点。 随之而来的是关键命题是:中国AI科技领域,谁将是这场全球性科技竞赛的中坚破局力量? 这个问题的答案,出离不了算力、算法以及数据三个维度构成的产业规律。那些在人工智能领域持续耕耘的中国科技公司们,凛冬之后,终于捱到了自己的黄金时代。 比如 科大讯飞 (SZ:002230)。 作为ChatGPT主题研究的第二篇,本文将以讯飞为样本,透视中国生成式AI产业的当下与未来。 01 中国AI进入无人区 “在做通用AI范式的时候可以想象站在一个沼泽地上,四面没有光,也没有手电,这时候咱都不说走多远,往哪边走都是个问题。这种情况下大家都选择了相对光明的道路,就是专用AI范式。不得不佩服美国人,他把这个事情 (AGI,通用人工智能) 从0到1的道路硬生生的走出来了。”这是日前一场专家电话会中,一位产业人士对于ChatGPT及其背后的OpenAI团队的感慨。 从专用AI到通用AI,即使OpenAI已成功闯关,但对中国的AI公司来说挑战仍然巨大,说是走入无人区毫不为过。不信你瞧谷歌: ChatGPT火爆之后,被触及商业模式核心利益的谷歌最为着急。单纯从理论上来看,它做这个事情好像不难。毕竟就连ChatGPT的底层架构Transformer模型,都是来自谷歌。 但现实很残酷。谷歌的类ChatGPT项目Bard出师不利,员工通过内部论坛Memegen批评管理层最近推出的Bard:仓促、拙劣、毫无谷歌风范 (un-Googley) 。 ChatGPT的通关之路难度可见一斑。 但即使如此国内参与者也不得不跟。因为ChatGPT会对众多产业带来颠覆性变革,包括且不限于: 1)改变现有人机交互模式。 2)改变现有信息分发获取模式。 3)改变内容生产模式。 4)加速“AI for Science”的发展。 直观一点来说,互联网的核心价值是连接,ChatGPT代表的生成式AI的核心价值则是嵌入。如果嵌入至制造业,生成式AI的强大远景——存、算、编码生成一体化所带来的“随心所欲”效应,无疑意味着人类生产力能力文明级的跨越。但在这个质变发生 (在以制造业为核心的工业领域,质变发生仍受制于材料与能源) 过程中,生成式AI作为机器智能超算,最大化价值的用途还是嵌入到科研领域,将在基础学科研究、新材料、新能源、新药物的研发过程中扮演关键角色。 02 科大讯飞的比较优势 目前诸多中国科技公司都在加紧布局类ChatGPT项目。所有谋局者之中,科大讯飞是比较优势较为突出的一个。主要体现在以下几个方面: 【1】数据卡位 前文我们提到,谷歌Bard背靠海量数据出师不利,反观ChatGPT当前最具产业价值的编程能力,很大功劳来自于GitHub。OpenAI在ChatGPT中引入了它830G代码文本,那是一亿程序员的智慧涌现,编程能力不强才怪。 图:GitHub的用户增长曲线,来源:网络 科大讯飞凭什么布局ChatGPT?OpenAI上述产业实践,以及在医疗领域的突破,也许能得出一些启示,那就是数据质量的重要性。 目前国内参与者在算法、算力上跟ChatGPT是有差距,但优质数据在一定程度上弥补了这个差距。比如ChatGPT最近通过美国执业医师资格考试,它在考试三个部分得分在52.4%-75%之间。而与医疗机构紧密合作的科大讯飞,其“智医助理”系统2017年就通过国家执业医师资格考试综合笔试测试,答对76%的题目 (满分600分,考了456分) 。目前“智医助理”作为全科医生助手已可以诊断1200多种常见病,累计提供5.5亿次AI辅诊建议。 放眼整个行业,长期布局AI技术的同时,又掌握医疗、教育等专业数据端口的公司是稀缺的,这是科大讯飞布局类ChatGPT项目的底气之一。 【2】算法与成本曲线 大模型的训练是一件烧钱的事。ChatGPT的诞生与用户广泛应用,离不开它对成本曲线改造:过去两年半时间,GPT-3模型的训练成本下降了80%以上,目前仅需要140万美元 (首次训练约1200亿美元) 。而成本曲线的降低离不开算法进步。道理很简单:同样是训练一次大模型,算法能力提升意味着成本曲线的降低。 OpenAI的成功在于算法迭代,GPT3比之GPT2在算法层面有本质提升 (于是它不开源了) 。所以创立8年烧钱不断的它还能获得资金支持,并终于等到ChatGPT横空出世。 回头看国内玩家,虽然公司间横向的算法直接对比没法做,这是商业秘密,但从侧面还是能看到一些端倪: 科大讯飞在GitHub上开源模型比较受追捧。具体而言,其开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万。 与此同时,科大讯飞承建了认知智能国家重点实验室。AI技术可简单分为识别 (图像识别、语音合成与识别等) 和认知 (语义理解、常识推理、知识图谱、阅读理解等) 两大类,承建认知智能国家重点实验室是官方对科大讯飞算法技术实力的背书。 图:科大讯飞 A I 里程碑,来源:国信证券 【3】算力战争 据最新的投资者关系交流会议显示,科大讯飞2009年至今,已建成4城7中心深度学习计算平台,自建业界一流的AI数据中心奠定大模型训练的硬件基石。在技术层面实现百亿参数大模型推理效率近千倍加速,为认知智能大模型经济实惠的规模化提供可能性。目前来看,基本满足类ChatGPT项目的布局。 但从长期看,科大讯飞乃至整个中国布局类ChatGPT项目的玩家,还是得大力加强算力的提升。从产业的发展趋势看,算力是企业乃至当前世界最关键的竞争资源。残酷的事实是,超级算力中心建设资金门槛已经在ChatGPT出现后,已经推向百亿之上 (在微软的支持下) ,而运营与维护成本更是天文数字。 基于优质数据卡位,算法能力和商业化策略 (下文详述) ,科大讯飞在算力维度至少有一点可以抓紧做:推动企业间的分布式计算协作。强如OpenAI亦绑定微软这个算力巨头,2月8日微软更是宣布将ChatGPT整合进其搜索引擎,未来随着类ChatGPT玩家的布局行至中场,合作的机会少不了。 03 AI界的一股清流 在真实的商业世界,技术的硬实力永远不是全部,它无法具现一个组织看不到的软实力。事实上,对比绝大多数的AI公司,科大讯飞的软实力更为突出。 过去很长时间,科大讯飞一直是A股市场上的AI独苗。围绕其业绩的质疑声音一直没断过。直到背负巨额亏损的AI新势力们上市,外界方看到了其自力更生的难能可贵。 图:科大讯飞的净利润,来源: choi ce 与后进的AI新锐们不同,科大讯飞以语音识别起家,这条路线对于早期AI公司可能比较友好。众所众知,2006年Hinton利用预训练方法得出神经网络局部最优解,将隐含层推到了7层,神经网络真正上有了“深度”,由此揭开深度学习热潮。 所谓“深度”并没有固定数值,在语音识别中4层网络就能被认为是较深的 (例如谷歌产品voicesearch) 。在效果一定的同时,层数越小,难度越低,计算量越少,它有利于打通技术与商业化的双轮驱动,这对于AI从实验室走向产业的起步阶段非常重要。 AI的科技含量再高,它也是一门生意,先把商业的帐算清楚。任何商业的基本规律就是创造现金流、创造真金白银的产业附加值才能持续发展。组织能自负盈亏,才能稳健的进入其它技术分支——科大讯飞先是拥有我国唯一的“语音及语言国家工程实验室”,后来国家唯一的“认知智能国家重点实验室”也设在科大讯飞——一步步扩大公司的护城河。 之所以说科大讯飞更契合商业基本规律,因为这是一目了然的事情:你看所有布局类ChatGPT的玩家,只有它比较明确的开始讲应用讲商业,“1+N”架构的行业应用已经规划好了。 “1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业、汽车等多个行业领域的专用大模型版本。例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。 运营节奏之外,科大讯飞是少数能做到既懂B端又懂C端的科技公司。 在中国既能服务企业、又能服务用户的科技公司屈指可数。科大讯飞服务C端,不仅指智能硬件销售,还有教育领域学生以年费形式订阅个性化学习手册和英语听说业务等。目前“个册”覆盖1400多所学校,口语业务2022年新增12个地市的中考和2个地市的高考。 科大讯飞有可能在医疗等板块打造C端应用的标杆,恰如ChatGPT的编程。当然,这是比较乐观的预期,C端能力的潜在可能性。关于可能性我们不再多谈,因为目前还为时尚早,期待科大讯飞的产品上线。 以上,成立于1999年的科大讯飞,23年风雨兼程之后,终于进入了自己的黄金时代,正成为布局ChatGPT玩家里的中坚力量。ChatGPT作为第四次工业革命开始的标志,世界商业秩序正面临剧变,没有人可以置身事外——如果改变世界的那个人/组织不是你,至少要和科大讯飞们站在一起。
  • 热度 3
    2017-7-21 21:27
    3549 次阅读|
    0 个评论
    最近A股市场人工智能板块异常火爆,因此笔者特意去研究了一下人工智能板块龙头科大讯飞这家公司。科大讯飞一家做语音的企业,股票代码002230。本文尝试从科大讯飞的招股说明书、年报、财务报表、管理层、员工构成等方面去解读科大讯飞这家公司。 财务报表 对于一家企业的研究,最直观的就是去看公司的财务报表。 下表时科大讯飞过去九年的营业收入以及对应的股东利润变化情况。从表中可以明显看出公司过去九年营业收入和利润一直保持很稳定的增长。第一感觉是这家公司好像还可以。 主营业务变迁 从2008年至2016年主营业务变化查看公司的核心竞争力。 2008年至2011年公司主营业务为:语音支撑软件、语音行业应用产品/系统、信息工程与运维服务。到了2012年公司新增教育教学业务,教育业务主要包括普通话水平智能测试系统、中高考英语听说智能测试系统等。公司在2015年推出的人工智能时代的人机交互平台AIUI,引领中国人工智能产业继续向前。到2016年公司业务包括以客服行业产品和解决方案和人机交互产品和解决方案所构成的支撑软件及产品;教育行业产品和服务;互联网产品和增值运营;公共安全行业产品和智慧城市行业应用; 通信数据分析应用和大数据广告平台的大数据产品和服务;和系统工程和音视频监控的系统集成业务以及其他业务构成。 沿着公司主营业务发展轨迹可以看出,公司一直坚持在智能语音产业的最前沿,一直按照顶天立地的企业战略在执行,所谓的顶天立地战略中顶天是指在产业技术保持在国际领先,成为全球著名的语音和语言研究高地(顶天),而立地是指将研究成果进行大规模的产业化,推动语音产业进入亿万家庭,实现真正意义上地落地(立地)。 以智能语音产业为中心构成的人工智能生态圈,科大讯飞深耕18载造就了今天强大的技术壁垒。后来者要想超越是很难的。因此公司在投资者会议上称公司对标的企业是谷歌、微软。科大讯飞确实有这样的底气。 管理人员 刘庆峰,公司董事长兼总裁,44岁,过去九年来一直担任公司的一把手,中国科学技术大学信号与信息处理专业博士,中国科技大学兼职教授,语音和语音信息处理国家工程实验室主任。 科大讯飞上市九年来取得的成就已经能够看出刘庆峰的能力了,这里就不再赘述,况且他才44岁正值中年。 员工构成 公司员工总数5940,其中博士54人,硕士研究生1261人,本科学历3742,专科及以下883人。可以看出公司员工本科及以上学历所占比重超过85%,可见公司员工教育背景良好,高层次人才相对充足。 总结 从公司过往9年财务报表可以看出公司过去九年一直保持着稳定的增长态势,并且在这一两天收益于人工智能产业爆发在即,公司业绩也将迎来拐点,有望进入快出道。再者从公司过去业务变迁可以看出公司在智能语音产业已经建立了深厚的竞争壁垒,在过去18年一直坚持在人工智能领域,不论行业好快,不离不弃,这样的企业值得敬重,现在终于等到人工智能的春天到来,期待科大讯飞能够腾飞。最后从公司领导人以及员工构成都能看出这是一家绝对的高科技企业,未来在同国际巨头的技术竞争中依然具有可持续的竞争优势。 从企业到产业到人员三方面来看,科大讯飞确实值得期待。去年2016年NVIDIA的股价上涨超过200%。对于科大讯飞的股价也可以粗略算下从2017年1月3号股价27.08元,到2017年7月17号股价40.02元,累计涨幅达到47%。个人觉得这样的涨幅不会是终点,毕竟第三第四季度才是科大讯飞的营收旺季。加上今年人工智能被第一次写入政府工作报告,人工智能产业爆发在即,智能语音作为人工智能产业的突破口会率先爆发。 如果你是投资者,现在你会买科大讯飞的股票吗? 风险:智能语音产业爆发不如预期