深鉴科技被收购后,姚颂解读AI芯片:只看芯片这两个字,公司会死掉的

深鉴科技被收购后,姚颂解读AI芯片:只看芯片这两个字,公司会死掉的

编辑 | 都保杰

来源 | AI星球(ai_xingqiu)

今年7月,全球最大FPGA芯片厂商Xilinx(赛灵思)宣布收购中国人工智能创业公司深鉴科技。这当然一方面被解读为中国科技创业史上的里程碑事件,另一方面,对于AI芯片领域如何“弯道超车”这件事,也引发了更多的思考。8月8日,在今夏热门科技读物《未来版图》的品读会上,深鉴科技创始人姚颂分享了从被收购中得出来的“领悟”。

以下为姚颂演讲实录,经编辑整理:

大家都把我们叫做人工智能芯片公司,其实这个概括比较粗略。

最近的一个大事情是我们在7月18日宣布公司正式被美国Xilinx收购,行业内也给了非常多的评价,包括业内另外一家公司寒武纪的陈云霁老师也说,这可能是中国科技史上比较正面、积极的一个范例。

AI芯片是当前非常非常火的一个话题,火了一年多,又因为今年的一些热点事件大家也更为关注这个领域。因为这个领域技术细节非常多,大家会经常搞不清楚,感觉随便来了一个公司,不是AI公司就没法儿在这个市场上混,又来一个新的AI公司,不做芯片也没办法在市场上混了,这里面的坑确实非常多。

回到最根本的问题上还是要搞清楚一个概念,什么叫AI?我们今天在谈论AI的时候,可能更多讲到的是机器学习、深度学习,甚至再往下又有深度强化学习等等,AI实际上是一个非常宽泛,非常虚的一个概念,我们需要更深入地看它到底用哪些机器学习的方法,目前最核心的,效果最好的是深度学习,深度学习又分为推理、应用,我们用大数据去算一个算法,拿这个算法做一些实际的应用,算法有成千上万种数不清的神经网络,再加上其它的算法运行框架,又可以搭建不同的运用,AI的范围实在是太过于广阔了。

如果从一个做AI芯片的角度,直接看坐标轴,最左边是最通用,比如常说的CPU,所有的人工智能算法都能够跑。如果在中间,比如只跑机器学习,我也可以说只跑深度学习,深度学习也分两个阶段,一个叫训练,一个应用,可以只跑训练,也可以只跑应用,芯片可以跑一种神经网络,也可以跑多种神经网络,所有的这些现在被大家糅杂起来叫做AI芯片。

因此当大家看到这样一个概念的时候,需要认真的问一问,你支持的是怎样的功能,你支持的是机器学习,还是应用学习,是多种算法还是一种算法,因为它的开发难度、开发周期、实用性应用场景可能会千差万别。

01

大家经常说这是一个所谓的弯道超车的机会,但实际上做这个东西非常困难,我们公司发展其实分了好几个阶段,这个为什么比开发传统的芯片还要更为困难呢?我举一个例子。

以CPU的公司为例,谈到CPU公司的时候,大家想ARM和英特尔公司,ARM会开发处理器的设计,但不会把这个芯片生产出来,它是以一个IP的形式授权给客户,客户把它生产出来,它也不会开发操作系统,也不会开发私语言的环境,这些东西交给下游公司去开发,把指令集协议做好,把架构设计好,除此之外不是它必要的。

英特尔更多的往下走了一步,可以把芯片实际生产出来,为什么它可以做这样的一个事情呢,因为指令集是一个非常好的接口。CPU要求的是什么东西都可以跑,当你定义了中间这样一层东西的时候,只需把握中间核心这一层,CPU的公司就可以专注的做好这件事情。

如果是一个什么东西都能跑的芯片,可以把芯片的设计和应用区分开。但作为一个小的芯片公司,你不可能有一个像Windows的公司来支持开发,没有一个wintel联盟,也没有开发一个编程的环境自己去开发软件,也没有公司说给你开发上层的APP或者软件,没有形成像英特尔、ARM这样的生态系统。

如果我只做IP核,大家想ARM一年的收入是多少,一年卖出几十个亿台设备,最后收购的估值也就300亿美金,离英特尔特别大。哪怕一年全球几十亿的设备,总收入也是不高的,为什么?IP核授权给客户生产,把IP交付给客户,也就是说收入产生会很慢,ARM这样一个公司也是做了好几十年才慢慢到了现在这样的地位。

所以我们发现,如果你作为AI芯片公司,你要考虑到底是做哪几层,如果只做到IP核层面,不把芯片做出来,一个是收入规模严重不足,量也很少,每一个芯片收的钱也非常少,收入会非常滞后,把芯片生产出来已经一年以后了,让生产出来的芯片被系统和解决方案公司用到他们的产品里面又一年过去了,当你的芯片设计完到实际收入产生可能起码就两年了,这时候你需要考虑是不是把芯片做了,把IP做了,把系统也做了。因为你的指令集没有人开发Windows,都没有人做这个谁来开发软件?

你得给客户看到很漂亮的案例,这时候你说是不是得把算法库,找一些应用的案例来做,这是一个非常复杂的问题,你得把芯片、系统、软件甚至把算法和解决方案全都给做了。

另外一个事情是,我们要探索怎么去把商业这个事情做好,从技术到产品、到商品又是另外一个阶段的事情。比如我做了一个自己觉得性能特别好的芯片,但它可能不一定是客户想要的,因此你很多时间要去理解客户,能够接触到客户真实的需求,才能最终把客户绑定到产品上。

2

我做了一个产品的分层:第一层是可用的产品,第二层叫好用的产品,第三层叫用户爱用的产品,第四层是客户离不开的产品。

用支付宝举一个例子,比如说支付宝可用,什么叫可用?满足一些基本的功能,只要支付宝能够绑定信用卡、银行卡来付钱就已经是可用的。什么叫好用呢?能够保证支付的环节是安全的,不会有人偷窥到帐号信息、密码信息,这样的一个过程是顺畅的,不会出现BUG这是一个好用的产品。如何让用户有一个非常好的用户体验?比如现在扫二维码,这样的时候还没有很强的用户联系,因为支付宝可以扫描,微信支付也可以,随时就切换了,于是支付宝又做了很多其它的功能。比如芝麻信用,利用这样一个信用体系可以租房、贷款,可以有很多行业应用,也放了很多理财、买基金等等各种应用,把钱放在上面的时候还会钱生钱,比放在银行好,这时用户才会真正离不开它。

对于AI芯片来讲也存在这样一个问题,但一些人只关注了最基本的东西,我的芯片能够跑人工智能算法,而且能够跑的很不错,这样的产品是毫无竞争力的。

首先要让用户好用的话,必须要有一个比较好的开发流程。有两个特别典型的GPU公司对比,一个叫英伟达,一个叫AMD,在人工智能时期英伟达追着AMD打,AMD要跑人工智能,所有代码得手写,这个流程比英伟达差太远了,根本没有一个人性化的开发流程,用户都不能说这个芯片好用,只是说性价比还可以。

英伟达的GPU有自己的开发流程,买任何一个GPU上面的软件是不用改的,就像买任何一宽英特尔的CPU一样,三年前写的GPU程序也能在现在的GPU上跑的很好,哪怕是一个菜鸟,怎么用GPU跑一些程序,可能几周就能用的很熟了,用户体验非常棒。

为什么英伟达在人工智能芯片领域占据了99%的份额呢?有一些巧合的因素,也有不断沉淀的因素。大家看到当时第一个深度学习的神经网络突破,深度学习开发的软件,一个学生做的现在在Facebook,正因为它好用大家就开始用,在开源网站上进行了无数个开源项目,积累了非常好的经验,在这样的条件下,用户就真的很难离开它了,英伟达在这个行业里也占据了非常强的竞争力。

我个人的观点,在很多采访的时候也说过,不可能做一家公司正面挑战英伟达,除非用一个壁垒性的东西把它挡在门外,能做的是要找到英伟达的社区,英伟达的壁垒还没有设立那么高的垂直特定行业,或者英伟达优势发挥不出来的特定场景,在这样的范畴里你才有可能打败它。

3

用户到底需要的是什么,这是一个非常有意思的事情。包括当时我们在谈天使轮融资的时候,深鉴科技都是我们原来在清华、斯坦福的一帮人写了一个BP,我们做了一个技术,这个技术好,可能被用在ABCD等等这样的环节。

所有做技术创业的,很多人都是从底往上思考,但是如果你真的在行业看的话,最终的这个产品用到哪个环节,这里面跟你设想提供的产品方案可能差的非常多。

以安防行业为例,最终的用户是政府和公安,政府和公安需要做一个智慧城市的项目,做一个智慧监控的项目,这样一个大的系统里面分很多东西,比如要采购摄像头的硬件,要采购服务器,采购视频管理软件,中间还有一个东西叫NVR,所有的视频99%可能是存储在本地的,如果小区的视频可能存在小区的保安室,芯片可能是被用在服务器里面,可能会被用在NVR里面,可能会被用在摄像头里面,但在那里面肯定不止AI计算这样一个功能,肯定还要有降噪,有数据传输接口,要提供完整AI模块,视频总得传到芯片上,人脸识别算法把硬件做好还得有一个软件,这里面差了非常多层。

离最终用户越近一定是收入越多的,当然难度也越高,要做的系统整合工作也越多,如果你离客户越远,产品出来到真正大规模收入回来的时期越长,要做到尽量的减少客户的开发以及能够尽可能的增加收入。

另外一部分事情,大家会发现芯片开发的过程中会有一个很奇怪的事情。芯片公司是芯片公司,软件算法应用公司是软件算法应用公司,这就导致我如果要做一个芯片,能被更多的人用起来,好多人会有不一样的需求和打算,我不知道芯片到底能不能满足他们,或者又在满足他们各种要求的情况下,我的芯片不能够做的特别好。

比如说英特尔一个竞争优势也是历史最大的包袱,它的兼容支持过往几十年的英特尔的架构,变得越来越臃肿,大家说就是在挤牙膏。于是开始有一些公司开发芯片特别的迅猛,比如谷歌开发的TPU芯片,TPU芯片一出来,这个性能这么好,他们大概2014年做芯片,几年时间就能跟英伟达打平了,这个趋势就是因为大家开始考虑我做芯片是不是不用支持所有的东西。

英特尔开发的芯片要考虑各种各样的应用,谷歌在开发芯片的时候只需要满足自己应用的东西,限定了范围。告诉你我只能用哪些算法,是针对哪些算法来优化的,包括我们在做的很多事情也是,我们把算法和芯片放在一起做一个完整优化的呈现,大家发现这样做出来的效果整体是最好的。

我们公司非常核心的一个技术叫深度压缩。一个简单的启发式的想法,据不同研究,人脑有300亿到800亿个不等的神经元的数量,但是在人的真正日常思考中,你的大脑只有5%左右的神经元是激活的,其实大脑95%的部分是在休眠的,这个概念也可以被延伸到所谓的深度学习人工神经网络里面。当你具体应用的时候,你会发现,其实里面大部分的参数对于实际结果没有影响的,我们可以把无关的参数删除,删除以后就变得不像是芯片日常见到的那种文件格式计算的方式,这个时候再考虑上层的芯片架构再如何设计,这两个结合在一起可以取得非常好的效果。

4

大家印象中的英伟达公司到底是一个怎样的公司?是一个GPU公司,还是一个显卡公司。我们有一个合伙人韩松的导师是英伟达的首席科学家,号称GPU之父,我自己当面问了这个问题,大家叫你GPU之父这个词对不对,他说还是不对的,应该叫GPU计算之父。其实,英伟达现在的核心竞争力完全不只是在芯片这一侧了。

首先,你去开发AMD,它是没有一套开发指令集给你随便写程序的,英伟达的GPU就有,你可以自己写程序,任意的在上面加速,但是能做这样一个开发的人很少,还是需要学很多底层的知识,所以它做了各种各样的“图书馆”,专门用来做神经网络,当你需要做神经网络比如说某一层的计算,底层只要调一下CUDA(CUDA™是由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题)即可。

怎么样把它普及到各种小白客户呢?比如说Caffe 、DL4J等等。这个时候我们可以看到,哪怕高中学过一点计算机编程的,或者大一、大二刚接触的同学,照他的指导把驱动安装好,就跑起来了,已经非常非常方便了。包括在自动驾驶领域,硬件传感器都布置好了,把英伟达的东西买过来简单写几行代码就能跑起来了,所有人都觉得这个非常好用。

大家在想英伟达到底是一个GPU公司还是一个软件公司还是一个平台公司,这个定义是非常重要的。当时我问Bill Dally(NVIDIA 首席科学家)一个问题,芯片和软件的比重是几比几,他说我不能告诉你。我们跟英伟达的高管们私人关系还很好,当时我判断英伟达会在两年内卖一个没有GPU的芯片,在今年1月份英伟达就公开了基本没有GPU的芯片,这就是Drive Xavier,它有10个DLA,是一个深度学习加速器,它不是GPU,有1.3个TFLOPS,有20个tensor Core TOPS,整个芯片里面只有510个CUDA,所有的计算都是针对于AI设计的芯片。你会发现英伟达已经不再是一个GPU公司,已经是一个系统公司,已经是一个软件公司,从应用需求定义系统架构,这代表了整个行业思路的一种变化。

我们的投资方也是收购方,我们的母公司Xilinx,大家印象中这是一个老牌芯片公司,他们今年1月份做了一个非常大的变动。1月份换了一个CEO叫Victor Peng,八年在Xilinx负责的软件开发工作,这是一个标志性的事件。他上台以后大家发现,Xilinx的口号发生变化了,现在主动去做各种各样的软件,主动寻找合作方,面向不同行业的解决方案,包括开始做电路板,把整体的板卡都做了。

必须要超脱芯片本身才可能有竞争力,才可能是被用户真正需要的一个东西。

5

最后想讲一个行业的新思维。现在整个行业老是在说AI芯片,大家会产生一个很大的问题,我觉得最根本的问题有两点。

首先,大家经常误判芯片的研发难度和研发周期,我觉得这是很多非芯片行业的人来做创业的非常大的问题。

高通开发一款芯片的平均周期是五年,芯片是有一定固有周期的行业,任何一款芯片开发,哪怕不算基础研发两年,算上基础研发是三年、四年,是一个周期很长的行业。由于有了芯片长时间的周期,而在人工智能这样一个算法迭代无比迅速的行业,新的芯片一定做出来就落伍了,这是一个非常大的问题。

这里面的解决方案,包括我们自己公司原来一直在尝试的事情,我们必须要认真的走到行业里面去,走到你的应用层面去,真正看到应用是什么,要从一个芯片公司变成一个系统公司,变成一个解决方案的公司,这样你掌握了整条堆栈的时候,你才能确保芯片被产品给用起来。

所以一个正常的做芯片的思路是怎样的呢?这边可以给大家举一个小的例子。像大基金投了一家打印机相关的,耗材还有设备的公司纳思达,为什么集成电路大基金会投打印相关的公司呢?因为这家公司发现一年要用几千万颗打印机耗材芯片,任务是比较明确的,自己把这个东西做成芯片不就好了吗,节约了成本,效果也变得更好,所以真的就把芯片做出来了。

这是一个市场上原来开发芯片更常见的方式,也是人工智能行业一直存在的问题,大家一直在拿着锤子找钉子,貌似整个市场也诟病人工智能行业落地难,收入不足,因为没有沉到真正的商业逻辑中把产业链打通,把产业链打通是非常困难的,而且难度在一步一步提升。

其次,大家去想,做的非常好的单一芯片能够活得很好的公司有哪些?可能只3家公司,ARM、英伟达和英特尔,其它做的特别大的并没有。大家觉得高通做的非常好,高通的芯片毛利润非常低,更多的收入来自于授权补贴。大家如果想做系统的公司有哪些?我觉得数量可能会比这个多,比如说IBM等等,整体规模也会比做芯片更大。很多芯片公司确实在尝试往上走,从一个芯片公司走成一个系统公司,这样可能活的更长久,收入更高,利润更高,更有黏性。

对于大家来说,首先芯片的技术难度已经很高了,芯片要做到跟英伟达相比真的有竞争力是相当难的事情,大家不要相信很多PR的新闻稿,不要相信BP里面写的那些数字。

要把芯片做好还得把芯片本身做好,把系统做好,把软件做好,商务还得真找到一个垂直的东西,这是一个非常困难的事情。所有的公司都要做非常充足的准备,包括深鉴,最开始我们从压缩的算法,从一些架构开发,也一步一步做到板卡,做硬件,做软件,最后在客户那边拿到了一些订单,也是这样一步一步走来的。

当大家说芯片的时候一定不要只看芯片这两个字,如果只看芯片这两个字,这个公司会死掉的。

相关领域
人物