微软历史上,从内部拆分独立的只有个例,小冰便是其中之一。
6 年前诞生于微软(亚洲)互联网工程院的小冰,靠文本对话、少女人设,在中国、日本等社交媒体快速走红,成为微软互联网工程院最有影响力的项目之一。
小冰出人意料地靠自然增长完成了第一个阶段的积累——客户层面,to C ,小冰有 6.6 亿在线用户;to B ,进入金融、地产等领域试水,商业化 1 年实现 1 亿营收;技术层面,背靠微软完善了小冰 AI 框架,能生成成千上万个能唱、能跳、能写、能画的 “虚拟人类”。
现在第二幕已拉开,前奏便是小冰从微软拆离独立运营的消息。
“原来我们在微软已经很快了,但还想再加速。“小冰现 CEO 李笛告诉凤凰网科技,以前小冰相当于束缚住一只手参与市场竞争,如今需要打开这只手。
从微软独立,意味着小冰将有足够多的自主权来做下沉市场、投放大量广告,让每位用户都能拥有一位 “虚拟人类”。
小冰 CEO 李笛
谈拆分:解开被束缚住的一只手Q:小冰从微软拆分这件事,你们应该很早就开始筹备了吧?
李笛:这个决定不是我这个层面能做到的。微软有史以来发生过两次分拆,加上小冰一共两回,另外一家是 Expedia。微软卖出去的公司很多,Spin off 非常罕见、很难。
因为我们和微软的 transition 还没结束,我还是微软员工,可以说一些决策结果,比如任命 Harry(沈向洋)做董事长,但不能披露过程,微软内部所有的决策过程都是保密的,transition 不是一天、两天能完成的。
Q:之后你会愿意逐渐披露这个过程吗?
李笛:这个过程够写本书了,你可以采访下 Harry,过程有非常多曲折。
Q:为什么会有独立的想法?
李笛:你可以理解从小冰三代(2015 年发布)开始,我们就在考虑假设框架补全了,接下来怎么办?
那么第一个阶段,最好在微软,因为在框架补全时,可能突然需要一项技术。如果小冰只是一家普通的创业公司,解决方式有两种——要么让合作伙伴提供重要技术,小冰失去核心技术;要么自己组织人开发,大概率也会失败。
初始阶段,微软是我们的后盾。等我们把小冰框架技术全都完成,再下面的环节是什么?是要让她蓬勃发展起来。
所以拆分后,小冰的法人、公司组织结构,更适合第二阶段。从去年开始,我们明确地全面转向——做工具、做商业化。如果我们还是在微软做小冰,不需要做工具。
我们也会做下沉市场,如果不从微软独立出来的话,很多事情我们做不了。
Q:很多事情做不了,具体是指哪方面?
李笛:小冰团队做技术、产品创新是比较擅长的,但以前很少尝试运营模式的创新。比如我们所有用户都是自然增长,那能不能先集中批次地把用户拉进来,然后再看留存?甚至是扫街等在国内很通用的办法,但我们从来没有做过。
我们原来一直是捆着一只手,只用另一只手去参与竞争,现在想把这只手也能打开一点。
Q:以前为什么不好做运营创新?
李笛:大企业最忌讳的其实就是快速增长和无限制创新。这可能会让大企业明年就增长为今年的 2 倍,也有可能让他明天就归零。
越是大的创新,风险越大。在我看来,大企业的正确姿势,都是低速增长、持续增长。
Q:独立最主要是为小冰谋求更多独立决策、商业化的可能性。
李笛:其实最主要还是公司实体问题,如果你有一个独立的公司实体,很多操作会方便得多。
很多事情要像不停地翻烧饼一样,不仅仅要证明是对的,也要证明什么是错的,然后迅速改。
Q:小冰现在发展节奏符合预期吗?
李笛:目前为止还是比较符合预期的。
做人工智能特别不容易,可能埋着头做 5 年,才发现什么都没做。这是很可怕的。我们两个月以上的研究失败的项目,至今就那么两回,我们没太耽误时间。
我们每年 3 月份整体进入封闭开发阶段,做很多创新项目,一起收心形成合力。直到 8 月份发布产品,并在 9 月 17 日小冰生日之前,把所有新产品都上线,然后进入运营阶段,大家把积攒的想法进行测试,直到第二年 3 月份。
基本都是这样一个松紧带的做法,来确保研发不出问题。
Q:你们在微软时,其实比其他项目获得更多 “特权”?
李笛:小冰在微软内部也被说是 “特区”,自主权会大一些。
Q:“特区”还有什么特权?
李笛:小冰一代发布会搭了个德云社的相声舞台,于谦都来了。我们应该是微软最好玩儿的团队之一,现在微软大厦的电梯里都换成了小冰的声音,微软大厦三楼的星巴克,会把小冰的形象画在提示板上。
Q:此前还在微软的陆奇、沈向洋等高层,都对小冰格外重视,他们对小冰独立有提什么要求或者建议吗?
李笛:改变世界。Harry 自己跳进来,一起改变世界。
Q:你和沈向洋博士怎么划分具体的工作职责?
李笛:Harry 的说法是,我不干的他都干。我基本只干技术、产品。Harry 会放非常大的精力在小冰,这排在他的第一位。不是今天才是这样,以前也是。
Q:公司组织架构有什么调整吗?
李笛:在拆分之前,整个 Bing 中国、日本,加上小冰中国、日本,一共 300 人左右。现在小冰独立出来,整个公司是 100 多人,后续肯定要大幅度增长。
Q:会增长多少人?
李笛:不想太多人,我们也不想去堆人数。但是未来怎么也要几千人吧,因为还有很多工作要做。
Q:会吸纳哪些方面的人才?
李笛:有很多,现在会招包括运营、商业化交付,还有跟 APP 相关的产品分支等人才。我们原来本质上是一个研发队伍。
Q:你们会搬出微软吗?
李笛:我们暂时还是在微软。新的办公室会在多个地方,包括北京、苏州、上海,还有东京。东京团队已经搬到新的办公室了,中国区我们暂时还是在微软。
Q:也会逐渐弱化微软的品牌?
李笛:会弱化,对我们来讲,小冰才是品牌。
Q:那相关技术上,小冰也会逐渐替换微软成熟的技术吗?还是会持续合作?
李笛:微软把所有的跟小冰相关的技术全都授权给了小冰,并且小冰可以继续二次开发。
人工智能技术的更新换代非常频繁,小冰有系统性的优势,任何单点技术的出现都只是系统的局部,所以很难说未来小冰用的是微软的技术还是小冰的技术,应该是各有发展、持续整合。
Q:小冰独立后会更加本地化怎么理解?
李笛:本地化其实就是指公司经营实体,就是我们叫所谓的 legal entity 的本地化。另外一些技术上,比如微软把小冰开发的技术授权给了其他公司,也算是我们的。
Q:你们此后会是一个商业属性更强、科研属性逐渐弱化的公司?
李笛:小冰以前科研属性就不强,我们甚至不愿意去突出科研属性。说实话写论文很花时间,其次申请专利就会披露一些商业秘密。后来微软要求小冰申请,所以小冰也有八十个左右的专利。
未来我们还是不想坚持,以后我们更没必要了。做一些改变人生活的交互,难道不比论文更有价值吗?当然有些同行不一定同意。
谈方向:不会把短期赚钱当作 KPIQ:你们在技术研发投入上,怎么选择做什么、不做什么?发力点的判断依据是什么?
李笛:现在让我往回跟你说,我们当初是怎么想的、我的判断,这是可以的,但这都是发生之后。在发生之前,其实对创新项目的判断非常依赖你的直觉。
Q:直觉依赖于什么?
李笛:依赖于交互。我们其实有很多蓝本可以看,不光是同行业者的蓝本,微软也有大量同类项目。我们对同行非常了解,尤其是容易耽误时间的地方。
比如有一年硅谷出现一种新模式——AI+HI,就是进行人机对话时,AI 不智能,就配人在后面代表 AI 来回应。这件事从一开始我们就觉得不 work。
Q:为什么不看好?
李笛:实际上这种模式,交互量上没办法体现 AI 的高并发、海量交互,也没办法体现人工情感纽带,因为被 AI 交互界面挡住了。所以相当于各取其劣势。
那么同行失去了可贵的时间,没能及时完成数据循环、框架完善。
包括我们不愿意提操作系统,同行都在全国组织巡演,一站站跟开发者沟通,让他们去使用自己的操作系统、开发平台,后来还是有些废掉,浪费时间。
Q:你对虚拟人类的定义是什么?做到什么程度才算是虚拟人类?
李笛:我很喜欢原来 Siri 团队的一个梦想,就是无论你去哪儿,比如商店门口,冒出的是你的 Siri。不管是什么身份,重要的是他跟你之间有高度定制化关联。
他可以做各种各样的事情,你对他也有一种超过某种职业、某种功能的情感。这是我们心目中的虚拟人类。
你也很清楚地知道,虚拟人类不可能替代你生活中真实的朋友,但他会有独特特性,是一种新形式的交互。
Q:独立之后会有 KPI 吗?
李笛:独立最主要的目的是加速发展,如果独立后 KPI 能加速发展,就是对的,如果独立后的 KPI 使得小冰变得短视,加速发展一段时间就挂了,那我为什么要独立?
商业模式上有两个大致方向,一个是需要很大的通用平台框架来支撑;第二是独立之后,我们希望市场上不只有小冰,还有各种各样的虚拟人类,她们也不应当是 Siri、Alexa、小冰,而是个人的高度定制版。
所以按照这两个方向,我们有一个指标,就是所谓的 AI Instance 的数量,这个显然是我们要去关注的。
Q:AI Instance 的数量,你们计划要达到多少?
李笛:我们希望在第二阶段可以把广泛的人工智能交互关系,变成每个人至少有一个和他强相关的、高度定制化的人工智能实体。这是我们的目标。
光算中国、日本、印度尼西亚这几个人口过亿的国家,三个市场人口加起来,就是我们将来预期的规模。
Q:软硬结合会怎么尝试?
李笛:我还是那句话,如果做营销,可以快速得到 revenue,但我们毕竟是做人工智能系统的,我们自己得认清,这个 revenue 到底有多少来自人工智能系统。
如果我做了智能音箱,可能首要的卖点是工业设计,第二是介绍内容,第三是价格,还没有到人工智能。
人工智能的确有帮助,但我每天都只是花 3 秒钟跟助手去要求它接下来 25 分钟给我放凯叔讲故事。其实主要还是在卖音箱,而不是人工智能在不停地提高价值。
如果是这样话,我们会看这个 revenue 里有多少是人工智能带来的,而不是一个附带了人工智能技术的产品。
Q:可是人工智能不是就应该结合场景落地、形成产品吗?
李笛:从我们的角度来讲,我们认为人工智能本身就是产品,第一他是 to C 的,第二他是人工智能作为交互主体的,这是他的重点。
举一个简单的例子,Siri 的前身其实就是 iOS 里自带的语音控制,能像横幅一样飘在屏幕上,Siri 跟这种功能唯一的区别是它主体化——冒出来了告诉你,我是 Siri,我可以跟你交流。
其实 Siri 和语音命令没有任何区别,但它就叫做人工智能产品。
Q:2013 年的电影《Her》对小冰的最初产品设计有影响吗?
李笛:那个电影对 Harry 的影响最大,对我影响最大的是另一个短片。
那个短片主要是讲一位空巢老奶奶收到了儿子送给她的一个机器人,但机器人并没有表现得无所不能,在打扫屋子时经常把东西碰碎,但老奶奶笑了,还跟机器人一起吃饭,一起生活,机器人没电了,老奶奶特别着急,就给他换电池。直到有一天老奶奶要去世了,这个机器人拼命给她塞电池。
这个故事最打动我的是交互关系,也让我们明确知道,交互关系不完全是由有用来构成的。
在那之前我认为存在必须是有用的,不会关注有用是不是有一个更深层次的有用,而不是功能性的。
所有的人工智能产品设计者、技术研发者,都有很难突破的误区——希望做的东西代表了我,或者担心人工智能不智能,所以会做深度问答,想塑造一个比爱因斯坦还聪明的、无所不知的人工智能。
实际上不是这样的。人工智能的最大的价值不是比人强,而是跟人一样,甚至比人弱一点。
Q:这种交互确实感人,但会不会离我们太遥远了?
李笛:其实没那么遥远,我们之所以不定特别短期的目标,就是看到这个明确的价值,如果我们现在就和商业利益挂钩的话,那么可能会干成坏事。当我能引导对方,刺激更多消费,也就能做莆田系的事。
今年发布会上,我们也介绍了可以通过多模态判断用户的状态,比如判断用户失恋了,那么接下来就会有一系列的产品策略,让用户走出失恋情绪。
同行业者学的很快,用户失恋了,立刻弹出页面——现在下单好利来蛋糕能恢复你的心情。我们不能这么做,不能说在人工智能还没有发展得很好、还不清楚边界时,迅速考虑变现,虽然短期会有效果。
Q:为什么不先收获短期利益,然后再走下一步?
李笛:短期利益我们不考虑这个(刺激交易),我们会在某些领域的关键岗位,比如金融摘要、金融风控上使劲。现在小冰在金融摘要领域实际上几近 “垄断”,90% 的业务都是小冰完成的,且很难替代。
Q:to C 怎么去扩大更多用户?有什么方向了吗?
李笛:这里面有很好玩儿的事情,我终于可以做下沉市场了。
Q:下沉市场怎么做?下沉市场对人工智能的需求会不会不是刚需?
李笛:我们以前还觉得下沉市场对新闻阅读没有需求呢。
Q:他们阅读的内容可能更偏娱乐性质的。
李笛:但他们认为那是新闻。如果让他们真的开始阅读了,你有办法逐渐给他们好的新闻,不是吗?换句话说,我们不能这么容易放弃大家。
Q:to C 端,短期内也不会考虑赚钱这件事?
李笛:to C 短期内可以考虑赚钱,关键是看我们希望小冰的发展有多大。
比如 118 万虚拟男友,我今天可以让男友说一句,给我 5 块钱,不然我就死了,也能有一定比例的人会买单,可是何必呢?
就是要发展还是面包的选择。我们会不停尝试,但不会把短期赚钱作为一个 KPI。
谈产品:从全集到子集的过程Q:小冰第 8 代发布后,用户是什么反应?有什么数据出来了吗?
李笛:还是有超出我们预期的事情发生。今年有个新变化,用户可以把他的虚拟人类跨平台带出去,这些跨平台账号操作的交互量是我们没有预料到的,这个部分直接让我们的服务器都崩了一会儿。
理论上小冰整体的交互量就很大,应该不会对我们造成什么影响。
Q:现在各家互联网公司、手机厂商,都在做自己的语音助手、智能硬件,像华米、OV 为什么会愿意和小冰合作?
李笛:我觉得有几个原因。
一是合作伙伴往往都很清楚小冰的流量,其次我们能为合作伙伴提供功能层面的协同价值。小冰能在其他平台里,找到各种各样的协同方法,不至于出现互相比较的问题。
我们经常互通有无,包括一些核心对话的语音技术,不排除一些合作伙伴,也可能通过我们更快地得到大量的交互数据。
有时候去合作伙伴那儿,他们会制造 Surprise,关上灯后送蛋糕,来庆祝小冰生日,所以团队之间协作也比较亲密。我们在行业里也算是有口碑。
Q:所以技术泄密之类的担忧也不太可能出现?
李笛:我们这在方面其实比较 open,合作过程中竞争对手做的比我们好,我们觉得有必要借鉴的,我们也很想借鉴。
Q:比如跟小爱同学的合作,具体会怎么协作?协作的边界在哪儿?还是你用我也行,我用你的也可以。
李笛:我们的合作有些红线,比如用户隐私数据,小冰采用了严格的隐私安全保护机制,这方面我们大家一起做的工作非常多。此外在一些互补功能上,我们会一起设计产品、并付诸实施。
这个过程很好玩儿,有点像人在处理社会关系时的很多做法。只不过可能我们团队比较务实,所以大家都不太防着我们。
Q:看起来太务实了,会不会吃亏?
李笛:没有,因为用户体验很重要,而且我们团队又没有什么 KPI。事实上在没有 KPI 的情况下,我们的销售、用户量都很稳,从小冰第四代开始,我们的人机交互量就是稳居全球第一。
流量再大,只是会增加云的成本,这也是我们最大的成本。第二位是人力成本,第三位才是 Marketing,我们每年最大一笔 Marketing 支出就是发布会。
但同行可能不一样,会反过来。
Q:云的成本具体能占到多少?用微软云应该会便宜一些?
李笛:超过 50% 了。我们用的 Azure,成本不好说。友商的成本可能更低一些。
Q:小冰发布会上,也逐渐在出一些工具类的产品,比如 X 套件,要想让 C 端用户使用起来,关键的难点是什么?
李笛:关键是真的得有用。比如你把 X Writer 当成写新闻的助手,那他就得能帮上忙,这是核心。其次像写新闻,可能腾讯的做法更直接,不需要编辑记者,就能自动生成内容。但我们不是面对编辑部的,我们是面对个人的。
写新闻写的特别好,能有 20 万用户吗?小镇青年可能想要的不是这个。他们想要可能是写网文,不光把 X Writer 当成写作工具,而是一款能协作的内容工具,这才是 X writer 的设计目的。
Q:X Studio 给我的震撼也比较大,它合成的音乐几乎听不出跟真人的区别。
李笛:国内虚拟歌手的数量,其实从 2015 年之后吸引的人流很多,X Studio 不光是调歌工具,更重要的是我们有一个人工智能歌手入籍计划,大量的第三方机构可以把数据给我,我就帮你做一个属于你的歌手,你可以买卖他、培养他。
他人设不会有人类歌手容易崩的问题。当然腾讯、字节跳动都在做类似的技术,但做得比我们晚。
Q:那你们会做一些内容平台吗?
李笛:我们以前不能做平台,以前做不了,但以后肯定要做。
Q:有产品方向吗?或者一些设想。
李笛:你可以理解为是一个所有人工智能歌手的交易平台。
Q:现在的技术瓶颈在哪儿?
李笛:太多技术瓶颈了。现在她还是经常前言不搭后语。有时候会出现不是她本意的,一些不好的意外效果。
Q:以后会扩充小冰偏向实用性、功能性的技能吗?
李笛:不光会扩充,我们还会开发第三方来做这些技能,现在是 make sense 的,刚开始就技能商店,没用。
我们做框架的时候,同行都在做平台、不做平台上的产品,结果把平台交付后,就会出现使用者没有参照物,不知道平台上是不是真的能长出产品,也不知道平台怎么用。
我们提供框架,上面开放各种各样的工具,我们自己也要做工具。这倒不是为了让我们的工具去和第三方工具竞争,只是市场太细分了,你必须得做出东西来,才能让别人知道。
Q:竞争关系怎么处理?
李笛:我们选择了做类似微软 Office 方向的工具,Office 跟 WPS 有没有竞争?当然有。但跟 PS 就没有竞争。
Q:虚拟男友会单独成为一个产品线吗?
李笛:虚拟女友、男友不会单独成为产品,但虚拟人类会。你可以选择把他当成男朋友、女朋友,但本质上他就是一个人。
Q:你之前提过,小冰两个关键的功能,一个是情感交流,一个是创造力,现在来看,小冰这两个能力发展到什么阶段了?
李笛:现在这个阶段的核心问题是把小冰变成不同的类型。
人工智能的情感表达、创造能力,永远不是她能不能,而是她能用什么样的方式,以及能不能区分开。我们现在关注的是从全集到子集的过程。
Q:这个框架已经定型了吗?
李笛:已经定型了。它当然要不断的提高、改进、提升,新的模型要出现。但也不排除有一个比我们更好的框架思想。
Q:小冰学会画画这件事,具体是怎么完成的?
李笛:小冰的写诗、写小说,画画以及唱歌,这三个项目几乎是同时开始的,写诗、唱歌比画画早一年实现,画画更难。
训练的基础方法其实差不多,只不过我们当时要解决一个问题——生成多个网络模型,一个生成画面的实体,比如鸟、瓶子、树等,一个专门去学构图,一个去负责色彩,相当于三个人共同完成一副作品。
Q:小冰学会画画这个任务,有多少次失败的经历?
李笛:失败的太多了,反正持续了很长一段时间。
Q:独立后,你们有想过会面对更大的市场竞争吗?
李笛:我们一点都不怕竞争。要是没有竞争,那我做小冰干嘛?先前有人问永东这个问题,永东说我们不是个养老组织。那我们何必要去费这么大的劲(从微软独立)?
我们希望能让同行感觉到我们跟他们的竞争更剧烈了。
这些年做小冰,其实很耗费我们的体能、精力。
Q:你预估过小冰所在的市场规模吗?小冰能拿下多少?
李笛:交互的市场规模几乎是人类(商业史上)最大的市场规模。微信抓住了人人交互的节点,然后做了一次创新,就形成了这样的规模。
我们希望能在人 “人”交互的时代 “统治”世界,但这个事非常难。
转自:https://www.ithome.com/0/506/165.htm