原创 叫板ARM、MIPS,可配置处理器走向何方?

2009-3-29 20:52 3281 10 10 分类: 工程师职场
与市场上大名鼎鼎的ARM、MIPS相比,Tensilica(泰思立达)公司还是个小角色。其位于北京南湖东园博泰国际40平米左右的办公室里,只有寥寥数人。初次见到其中国区代表李冉,显得形单影只。让人不禁联想到ARM中国区总裁谭军2002年时的样子。

  与ARM所做的固定架构处理器不同的是,Tensilica力推 “可配置处理器”的概念。这个并不为中国大多数工程师所熟知的技术,在ARM几乎成了代名词的IP圈里,却公然称“性能更高,应用更广”。


  然而,不可否认的是, ARM仍然占有相当市场份额,“可配置”这样一个全新的技术,究竟能否撬开中国市场?


固核也可调,可配置多余?


  中国的IP商业模式,ARM是第一人。因此,其强大的市场份额得益于大众市场对其熟识度和由此形成的开发工程师社群,杰得微电子董事长欧阳合博士曾说过“我知道其它内核供应商的解决方案能提供比ARM更低的功耗,但对我们而言,选用ARM可更容易找到熟练软件开发工程师,从而更快地完成软件开发任务。”同时,20年前由美国斯坦福大学John Hennessy博士开发出来的MIPS架构,随着时间的推移已经发展成为面向嵌入式应用的领先高端处理器架构,并在很多领域已经成为事实标准。但因在中国没有如ARM一样庞大社群做支撑,自从2007年收购Chipidea之后,内部管理、处理器发展相对比较动荡。在2008年8月,该公司宣布将在完成压缩成本1.031亿美元后,裁员15%。 即便这样,对于市场处于襁褓期的“可配置处理器”而言,却也是不得不提的劲敌之一。


  而且,在我们惯有的概念中,因为面市时间的缘故,各就各位,不同产品针对不同功能似乎是理所当然,固定架构刚好也满足了这种需求。提到“可配置”反而显得过于“烦琐”。


  然而,随着20世纪70年代第一代处理器的诞生,其技术飞速发展。早期处理器因面积大、功能简单等瓶颈已被抛入历史,同时,处理器的面积越来越小,承载的东西越来越多,竞争越来越追求创新、差异化。那么,突破处理器不能修改的局限,使企业能量身设计自己产品的需求,便为“可配置处理器”带来了机会。


  其实,可配置概念早在90年代中期就已诞生,关注的公司并不只有Tensilica一家,很多国外公司都在发展这项技术。但在实际过程中却遇到了困难,什么样的功能可以定制?针对不同应用又该如何扩展?这样一系列的问题导致当时的产品只允许用户在最简单的层次上通过选择菜单来实现,但初期的形态成功造就了一批可配置处理器公司,如Tensilica、ARC、Stretch、PACT XPP、IpFlex、Rapport、IBM Cell和Morphing Machines等。


  同时,这样的新鲜市场,ARM当然也不会轻易放弃,也曾经尝试往可配置处理器方向发展,李冉认为“最终效果并不理想。”然而,在近日接受记者的采访中,谭军表示ARM也关注可配置处理器,但对可配置处理器的应用领域更多聚焦在移动调制解调器(Modem)中,因为移动解决方案的多波段、多模需要更多的差异化,而对于已经比较通用的控制领域,固定体系结构更符合市场情况。因此,竞争的焦点仍然集中在可配置与固定体系结构上。


  顾名思义,可配置处理器希望能使客户根据需要定制处理器。如果想要低功耗,可以通过平衡处理器的结构,把不需要的东西都去掉;如果需要高性能,还可以根据需要增加乘法器数量。然而,ARM也是可调的,其处理器内部有很多要素:包括一套基本的指令集、很多的存储接口,这些接口有很多的参数,ARM能够改变其中有限的参数,但硬核是改不了的。


  与Tensilica看好多核心技术不同,MIPS强调的是多执行绪优势,并认为它是未来处理器的发展趋势。但是ARM似乎也不以为然。多核心和多执行绪是不同的技术,侧重点不同。多执行绪是有意义的,但其意义只是针对一些特殊应用,例如网络。而且多执行绪带来的好处是有限的,但是带来的处理器设计复杂性、功耗面积开销,以及软件除错的复杂性增加都是非常明显的。而Tensilica则坚定地认为,多核心是其发展方向。


  众所周知,任何一个体系架构在最初设计时是强调某一方面需求的:MIPS最初针对工作站,着重性能;ARM针对低功耗、便携产品。当然,初衷不同,架构侧重点自然也不一样。然而,产品的架构兼容又是厂商提供产品时必须考虑的问题。这个时候的兼容性就成了厂商的“包袱”,因为如果要保证兼容性,就需要在相对比较稳定的架构下进行设计,即使发现原来的架构有或多或少不便,商家也不会轻易放弃原有架构,其间牵扯到用户接受时间、软件重新编译等等。ARM在ARM9、ARM11之后,又推出了Cortex系列,便可窥见一斑。“因为ARM原来的架构不合适,这种架构没有办法保证兼容性,”李冉分析。对此,谭军也坦言,是因为原来的架构很难实现差异化,而Cortex系列则是专门为应用而定制的。可见,固定体系结构的厂商也在行动,只是方式不一样罢了。


  因为,随着后PC时代对处理器架构的需求却是千变万化的,有人需要低功耗,有人需要高质量音频,有人就要处理基带,没有一个固定体系结构的CPU可以完全满足这些变化。“ARM虽然也做许多其他东西,但还以处理控制功能为主;DSP厂商也许强调某类应用,但终归没有办法实现差异化的目标。体系结构的变化总是根据实际需要发展而变化的。


可配置固化,妥协?扩张?


  既然这种变化是必然的,为什么不将其变成一个根据需要定制的处理器体系结构呢?


  正是看到了这种需求,硅谷的计算机体系结构和芯片专家克里斯?罗文(Chris Rowen)开发出可配置处理器技术,并于1997年创建了Tensilica公司。初识Tensilica的人不会将这样一个温婉的名字和硬生生的电路扯上关系,但解释起来很简单。“‘Silica’指‘硅’,‘Ten’指‘Tensile’,即可延展,二者联合,刚好构成了Tensilica初创时的理想——设计一款灵活、可扩展的硅。


  一个完整的可配置处理器工具集包括一个预先定义好的处理器核和一个设计工具环境两部分。其中,可扩展处理器可以让系统设计人员能够为处理器增加指令,原先的处理器体系结构设计人员从来没有考虑过或者想象过这些指令。添加高度量身定做的指令能够非常适合特殊的应用,使得可配置处理器在性能上可以同RTL设计方法相匹敌,同时得到预先经过验证的IP(知识产权)的优势。同时设计工具环境允许设计人员对基本处理器核进行大幅度修改以满足特殊应用的需求。典型的配置形式包括添加、删除和更新存储器、外部总线宽度、总线握手协议以及公共的处理器外设部件。“如果安插一个处理器用40%的工作量,软件工作量可能要占60%,”李冉介绍。


  然而,相比SoC设计最发达的北美和日本,固核似乎正符合中国的特征,一个新兴的对立概念被市场接受终归不是一件容易的事。被客户的接纳程度、对专业技术的掌握、应用实例的支持都是个问号。可配置处理器在中国似乎没法使得其厂商赚的满钵金。于是,面对着仍然固定体系架构大施拳脚的市场,可配置处理器厂商也按捺不住了。


  Tensilica先后于2006年、2007年推出了第一代、第二代Diamond(钻石)系列处理器。Diamond处理器的推出,更多地像是一种妥协,对固态体系结构的妥协。然而,李冉却不这么认为,他称Diamond使原来从不使用可配置处理器的厂商了解Tensilica,并使Tensilica有机会在市场上第一次提供硬核。这也成为Tensilica以自己的方式向客户推销他们熟悉的方案,从而扩大了客户群。


  其创始人 Chris Rowen认为,“所有的客户都希望他们的产品与竞争性产品相比具有差异性,Diamond系列可以帮助他们从软件方面实现这一点,而这正是在亚太地区和中国从事SoC设计的人员所熟悉的方案。” 诚然,国外公司的设计经验一般而言要高于国内设计公司,而Tensilica已经在国外有了很多成功案例。其中包括例如思科利用200颗Tensilica 的可配置处理器内核做成的SPP路由芯片,并用于2003年就开始在其产品中销售。同时Tensilica在日本、欧洲也有很多客户。但是因为这些客户都是差异化的产品,而差异化往往意味着比较封闭、不通用。而客户想要学习Tensilica的案例,会发现找不到太多的资料做参考。而ARM是通用的,通用意味着很多人使用它做芯片,因此学习、试验都很容易。差异化的策略在国外已经取得了比较好的效果,获得了比较大公司的认可。但是还是有大部分的客户习惯传统的方式,直接使用定制好的IP,这种情况更多集中在亚太区。


  “如果连ARM都不知道怎么用,怎么去推广可配置处理器呢?”李冉一下子道出了问题的关键。当大家对可配置的概念还有一些疑虑:包括对技术的熟悉,需要多长时间能掌握,自动化生成是否可靠或者项目时间表是否允许等,固定架构处理器依然是不二选择。


  Diamond处理器也正瞄准了这个市场,该系列处理器涵盖了从低端CPU到高端CPU,从音频、视频到通讯基带DSP等各个方面。其中音、视频方案是钻石系列比较突出的应用,HiFi2音频处理器已经应用在英特尔针对互联网络CE终端设备的处理器CE3100(此前CE3100处理器被称为Canmore)。当然Tensilica通用CPU在知名度上还与已经在业界打拼多年的ARM、MIPS有很大差距,


  然而,差异化一向是可配置处理器技术的卖点。正是由于差异化,早在2004年底,LG公司在短短6个月的时间里,就研发出世界首款DMB数字多媒体广播手机,即世界第一台DMB手机,正因为使用了可Tensilica的配置处理器技术。2007年,新岸线(Nufront)公司选用Tensilica的 Xtensa可配置技术,成功实现了高性能和超低功耗(第三方手机电视国标功耗测试结果为30mw)的T-MMB手机电视基带芯片,并最终在TSMC一次量产成功。新岸线是做TMMB的,此前没有做过SOC。而传统意义上做SOC首先需要找一个RISC CPU ,再放一些硬件逻辑。但他们不擅长写RTL,但算法和软件的能力很强,这就需要一款高性能,低功耗的DSP来完成这个功能,评估后,“我们用1/10的频率就可以做到同样的性能,”李冉至今提起来还不时地流露出激动的神情。因为Tensilica的体系结构可变,不但可以把冗余的配置去掉,还可以添加所需的架构特征。最后的芯片在40M的频率就可以跑下来,而功耗只有30mW,而竞争对手的芯片可能需要150M的频率。当时新岸线的后端设计,没有几家服务公司敢接,因为对时间表要求太严格了,这么短的时间要做出这个芯片是不可能的。“最后Synopsys的销售胆子比较大些,接下了这个项目,”李冉笑称。从设计到生产到量产,所有参与的人都觉得是“神话”。


  与固定体系结构的ARM专注于便携领域、MIPS占据数字电视领域市场相比,可配置处理器的应用似乎更“上得厅堂,下得厨房”,从高端的网络处理器、手机音视频到相对比较低端的MP3、MP4等都有涉及。可配置处理器的应用并不像ARM那样集中,而是更多地应用在ARM、或者DSP不能解决的领域,高端不足矣养活一个产业,因此,低端也是其瞄准的方向。比如CISCO用200个Tensilica内核制成的网络处理器、ATI用两个处理器做的手机里的音视频、Intel下一代MID产品,Epson用处理器快速搭建的打印机芯片。其中,更多的应用集中在网络通讯、便携多媒体,同时也在不断扩展。


  然而,正如Intel的成功源于其抓住了处理器这根救命稻草,ARM的成功更多归功于便携市场一样,某一个突出的应用领域会带领一批企业的崛起。同时如Dram之类的应用也会拖垮一批企业。可配置处理器这样分散的、无所不能的应用,在带来分散风险的好处同时,能否争得一席之地,还是让人不免有些疑问的。


  ARM谭军更是直接指出,处理器架构的可配置,更多地是一个芯片对应一个系统厂商的产业链,如果系统厂商需要另外一个芯片厂商提供的产品,代码则需要重新改写,所以市场是可配置处理器遇到的较大问题。


  李冉也坦陈:“可配置处理器技术所占的市场份额依然很小。如果要获得市场认可,是‘需要一些与众不同的地方的’”。


工艺与设计的鸿沟


  单从Tensilica亚太区的销售额来看,固定体系结构的Diamond仍比较多。李冉也坦陈:“在对你的体系结构没有了解的情况下,推可配置处理器是一个很困难的事情。”相信这是大多数可配置处理器厂商在中国的境况。盘子小,自然各个分食者赚钱也相对困难。但是这些都是很动态的事情,一旦产生某个新兴应用,非可配置处理器不可,一下子扭转乾坤也不无可能。市场调研公司Semico Research曾预估,2005~2010年固定体系架构与可配置处理器的年成长率分别为10%与40%,可配置处理器增长速度远远高于固定处理器,在2010年时,使用可配置处理器核的soc器件出货量可望达10亿颗。


  而使得李冉更津津乐道的是Tensilica可配置处理器自动产生的处理器RTL代码的功能。该功能可以和现在的SOC设计流程无缝结合,用于逻辑综合。处理器产生器还可建立与产生的处理器相匹配的系统软件。


   “我觉得SOC是未来发展方向,”李冉强调。SOC一般指芯片里比较高级的、复杂的芯片,将一些原来有分立器件的系统都集成起来。早在两、三年前,行业巨头Intel并不认可 SOC,认为SOC太复杂了,开发起来很困难,甚至在2006年把XScale生产线卖给Marvell。但他们后来也改变了看法。因为不管集成度、面积、功耗等,SOC都可以很好的实现,但是IC设计本身也面临着很多竞争:随着芯片规模越来越大,工艺以摩尔定律成长,设计能力的弱势就显现出来,其中有很多因素:包括设计难度越来越大、EDA工具发展远远落后于工艺的发展。


  “就像造了一个很大的船,货物却没有那么多”李冉说。我们需要往船上放一箱箱设备,但是这个设备生产速度很慢(设计人员设计速度非常慢),对产能的应用很不充分,这是个问题。工艺很好,可以集成很多晶体管,但是用RTL、Verilog语言设计很慢。如何能够快速设计成了业内公认的难题,也有很多公司从不同角度去解决这个问题,EDA公司在努力,很多初创公司也在努力。


  Tensilica也是其中之一。依靠自动产生的处理器RTL代码功能,可以帮助较大程度缩短设计时间。比如用硬件写一个MMP(移动多媒体中断呢),验证一般要花费三个月时间,还有很多其他模块;而用Tensilica整个出来也就用这么短的时间,一般而言可以提高4~5个月,但是产生的芯片要大一些。


  在这个成本为先的市场,芯片面积的增大,意味着成本的增加。对此,李冉解释,由于工艺变得集成度越来越高,成本的增加就没有那么显著。如果是在一个很差的工艺,一下子多几个平方毫米的硅面积的话,成本就会很高,但是如果工艺很高,多出零点几平方毫米的硅面积,成本的增加不是那么显著。但是由于现在没有更好的方法,EDA公司也没有革命性的突破,大家也在不断探索更好、更快、有效的ESL设计方法,来解决目前遇到的设计周期长,验证困难的问题。


在铲平的世界中……


  正如当DOS是主流平台时,名不见经传的微软能够一跃成功,很多事情的成功是需要一些历史机遇的。ARM恰恰抓住了这个机遇,但在中国的IP授权市场上,可配置处理器技术及厂商还是后来者。


  而且ARM所提出的在一个“铲平的世界”中提供服务的思想也深入人心。首先是专利授权费用,这是客户采用ARM专利时一次性付给ARM的费用;其次是按照一定比例收取客户产品的版权费,即客户每卖出一片芯片,就收取同等比例的费用。对于资金并不是很充裕的本土企业似乎第二项政策显得尤为重要。


   “这也正是IP商业模式本身的意义所在,”李冉解释,因为随着半导体产业的分工越来越细,一个大的半导体公司囊括从头到尾设计的做法已越来越难。而且,单一公司的技术,因为竞争的原因,只能在企业内部使用。而IP则保证了世界的平等,不论大公司、小公司,都有机会参与竞争。


  同时,“IP的价值在于Layout(设计),”该公司亚太区总监黄启弘在他的个人博客中写道。以帮助工程师更快开发性能更高、功耗更低的自主知识产权设计为使命的可配置处理器正在中国努力成长。但正如新生儿的成长要经历很多坎坷一样,一个新的技术最终获得大众市场的认可,并不是一件很容易的事。而最终可以检验的,唯有时间。

文章评论0条评论)

登录后参与讨论
我要评论
0
10
关闭 站长推荐上一条 /2 下一条