其中,深鉴科技因7月份正式被美国Xilinx公司收购而广受关注,其创始人姚颂在会上分享了自己关于人工智能芯片的思考,姚颂表示:
1、AI芯片适用于不同种类,它的开发难度、开发周期、实用性应用场景可能是千差万别的;
2、芯片的发展趋势,以英伟达为例,已经不再是一个GPU公司,而是一个系统公司、软件公司,从应用需求定义系统架构,代表了整个行业思路的变化;
3、当大家说芯片的时候一定不要只看芯片这两个字,不然这个公司会死掉的。 (辛苓)
AI芯片现在非常火,火了一年多,今年大家都很关注。这个领域细节非常多,大家经常搞不清楚,感觉随便来一个公司,不说是AI公司就没法儿在市场上混。又来一个新的AI公司,不做芯片也没有办法在市场上混。这里面的坑其实非常多,回到最根本的还是要搞清楚一个概念,什么叫AI?
AI芯片是什么?
AI是一个非常广的概念,如果从做AI芯片的角度看,最通用是CPU,所有人工智能算法都能跑,这也是一种人工智能芯片。如果只跑机器学习,或者只跑深度学习,深度学习也分两个阶段,一个叫训练,一个应用,可以只跑训练,也可以只跑应用,还可以跑一种神经网络,也可以跑多种神经网络,现在被大家糅杂起来,这些都叫做AI芯片。当大家看到这样一个概念的时候,需要认真思考,你支持的是怎样的功能?你支持的是机器学习?是应用学习?是多种算法还是一种算法?因为它的开发难度、开发周期、实用性应用场景可能是千差万别的。
做芯片新趋势:不止做芯片
做AI芯片比开发传统芯片还要困难,以CPU的公司为例,比如ARM和英特尔会开发处理器的设计,他们不生产芯片,而是以IP和软的形式授权给客户,他也不开发操作系统,不开发私语言环境,这些东西都交给下游公司去开发。英特尔可以更多的往下走一步,可以把芯片实际生产出来。为什么可以做到?因为指令集是一个非常好的接口,CPU要求什么东西都可以跑,当你定义了中间这样一层,就可以专注做好这件事情。
回到刚才那个问题。AI到底可以做什么。如果做一个什么东西都能跑的芯片,可以把芯片的设计和应用区分开。而作为一家小公司,你不可能有一个像Windows公司来开发,也没有wintel联盟,更没有开发一个编程的环境,自己去开发软件,也没有公司给你开发上层的App或者软件——也就是说,没有形成像英特尔、ARM这样的生态系统。
我们再往下看,如果我只做IP核,大家想ARM一年的收入是多少,一年卖出几十个亿台设备,最后收购的估值也就300亿美金,总收入也是不高的。为什么?卖一个芯片25美金,IP核授权给客户生产,收入产生会很慢。ARM做了好几十年才慢慢到了现在这样的地步。如果你作为AI芯片公司,需要考虑到底是做哪几层,如果只做到IP核层面,不把芯片做出来,一个是收入规模严重不足,量很少,每一个芯片收的钱也少;另一点是收入滞后,当芯片生产出来已经一年以后了。当生产出来的芯片被系统和解决方案公司的用到产品里去,又一年过去了,从芯片设计完成到实际收入需要两年,这时候你就要考虑,是不是把芯片做了,把IP做了,把系统也做了。你的指令集没有人开发Windows,都没有人做这个谁来开发软件?你要有很漂亮的原来的案例,这时候你说是不是得把算法库,把一些应用的案例也做了。这是一个非常复杂的问题。你得把芯片、系统、软件甚至把算法和解决方案全都给做了。
另外一个事情是,怎么把商业做好?也就是说产品,从技术到产品又是另外一个阶段的事情。我做了一个自己觉得芯片性能特别好,但是它并不一定是客户想要的。你要花很多时间去理解客户,接触到客户真实的需求,最终把客户绑定到产品上。让用户爱用,芯片要有比较完整的开发流程。买任何一个GPU上面的软件是不用改的,就像买任何一宽英特尔的CPU上一样,三年前写的GPU也能够在现在的GPU上跑的很好。哪怕是一个菜鸟,用GPU跑一些程序,可能过几周就已经用的很熟了,用户体验就非常棒。
第三点,是用户到底需要什么?我原来提供了一些想法,尽量的减少客户的开发以及能够尽可能的增加收入,这一页也不太展开的去讲。
第四点,芯片公司和软件算法应用公司是分开的,这就导致我如果要做一个芯片,很多人会有不一样的需求和打算,我不知道芯片到底能不能满足他们,或者在满足各种要求时做的特别好。比如英特尔一个竞争优势也是历史最大的包袱,它兼容过往几十年的架构,变得越来越臃肿,这是一个包袱。现在有一些公司开发芯片特别迅猛,比如谷歌在开发TPU的芯片,他们大概2014、2014年做芯片,几年时间就能跟英伟达打平了。就是因为谷歌在开发芯片时,只需适用自家的东西,限定了范围。我们这边在做的很多事情也是,把算法和芯片放在一起做一个完整优化的呈现。
我们公司非常核心的一个技术叫深度压缩。一个简单的启发式的想法:据不同研究,人脑有300亿到800亿个不等的神经元的数量,但是在人的真正日常思考中,你的大脑只有5%左右的神经元是激活的,其实大脑95%的部分是在休眠,这个概念也可以被延伸到所谓的深度学习人工神经网络里面。当芯片功能启用时,其实里面大部分参数对于实际结果没有影响,我们可以把无关的参数删除。然后再考虑上层的芯片架构如何设计,这两个结合在一起可以取得好的效果。
从老牌芯片公司变革看新趋势
还以英伟达举例,这到底是一个GPU公司,是软件公司还是一个平台公司?这个定义非常重要。今年1月份,英伟达公开了基本没有GPU的芯片,叫做DriveXavier。这一款对外公开说30个T,这里面有10个DLA,是一个深度学习加速器,它不是GPU,有1.3个TFLOPS,有20个tensorCoreTOPS,整个芯片里面只有510个CUDA,里面的GPU除了做车辆的屏幕显示以后,基本上是不做计算的,所有的计算都是针对AI设计的芯片。你会发现,英伟达已经不再是一个GPU公司,而是一个系统公司,软件公司。从应用需求定义系统架构,这代表了整个行业思路的一种变化。
我们的投资方也是收购方,我们的母公司Xilinx,大家印象中这是一个老牌芯片公司,他们今年1月份做了一个非常大的变动,换了一个CEO,这是一个标志性的事件。他上台以后,Xilinx的口号发生变化了,现在主动去做各种各样的软件,主动寻找合作方,面向不同行业的解决方案,开始做电路板,把整体的板卡都做了,有点在学英伟达的思路——必须要超脱芯片本身才可能有竞争力,才可能做出用户真正需要的东西。
做芯片不能只看到“芯片”
最后想讲一个行业的新思维。现在大家老是在说AI芯片,有两个最根本的问题值得关注。第一点,大家经常误判芯片的研发难度和研发周期。高通开发一款芯片的平均周期是五年,芯片是有一定固有周期的行业,任何一款芯片开发,算上基础研发是三年、四年,是一个周期很长的行业。由于有了长时间的周期,而在人工智能这样一个算法迭代无比迅速的行业,新的芯片做出来一定就落伍了,这是一个非常大的问题。这里面的解决方案,包括我们自己公司原来一直在尝试的事情,我们必须要认真的走到行业里面去,走到你的应用层面去,真正看到应用是什么,要从一个芯片公司变成一个系统公司,变成一个解决方案的公司,这样你掌握了整条堆栈的时候,你才能确保芯片被产品给用起来。
第二点,靠芯片能够活得很好的公司,可能只3家公司,ARM、英伟达和英特尔。大家觉得高通做的非常好,芯片毛利润非常多,其实更多的收入来自于授权补贴。大家如果想做系统的公司有哪些?我觉得数量可能会比这个多,比如IBM等等,大的整体规模也会比做芯片更大。很多公司在尝试往上走,从一个芯片公司走成一个系统公司,这样可能活的更长久,收入更高,利润更高,更有黏性。
另外一个例子是TPU,系统肯定是卖给某些公司,把数据库的系统卖给谷歌、Facebook,现在人家自己做芯片卖到服务里面了,服务是最终的收入来源,这个格局又发生了一些问题。英特尔也在尝试兼云服务。对于大家来说,首先技术难度已经很高了,芯片要做到跟英伟达真的有竞争力是相当难的事情,大家不要相信PR的新闻稿,不要相信BP里面写的那些数字。要把芯片做好还得把芯片本身做好,把系统做好,把软件做好,商务得找到一个垂直的东西,这是一个非常困难的事情。这里面所有的公司都要做非常充足的准备。包括深鉴,最开始我们从压缩的算法,从一些架构开发,也一步一步做到板卡,做硬件,做软件,最后在客户那边拿到了一些订单,也是这样一步一步走来的。当大家说芯片的时候一定不要只看芯片这两个字,如果只看芯片这两个字,这个公司会死掉的。