翊翎资本范维肖:人工智能投资的“棱镜法则”
7 月 28 日,由 3W 企服和企服头条主办的 Open Forum 活动——AI 企业应用专场“人工智能技创业与投资趋势”在北京东升国际科学园成功举行。
翊翎资本合伙人范维肖就“人工智能投资的棱镜法则:资本角度如何看待 AI 技术的成熟到产业融合”话题展开了干货分享。
翊翎资本合伙人范维肖
范维肖谈到, 2015 年,翊翎资本围绕人工智能在投资策略上做了一个思考,总结起来叫“棱镜法则”。
从物理学上讲,就是一束白色的光,发生两次折射,形成光谱。这两次的折射,最重要的两次折射的点一个叫数据增益的过程,一个叫场景增益过程。如何更好的理解这两次增益,其实是 AI 能否先行的落地和开展的一个很重要的原因。
以下内容为范维肖演讲实录,企服行业头条(微信ID:wwwqifu)略有删改。
我自己做了 15 年的程序员,2013 年开始,做音乐方面的创业,过程中需要一些更好的技术去快速的替代人来分析东西,后来到 2015 年,我们有一个思考,如何参与人工智能大的过程?
人工智能是大的趋势,不像 2C 级的产品,不是机会型的产品的话,要花 20~30 年的时间准备,所以我和我的合伙人一起做了一个翊翎资本。
2015 年,我们围绕人工智能在投资策略上做了一个思考,总结起来叫棱镜法则,从物理学上讲,就是一束白色的光,发生两次折射,形成光谱。这两次折射其实很好的反映了在人工智能领域的两次思考过程。
我认为这两次的折射,最重要的两次折射的点一个叫数据增益的过程,一个叫场景增益过程。如何更好的理解这两次增益,其实是 AI 能否先行的落地和开展的一个很重要的原因。
中间的这条红线,我们叫做灰色地带,这个灰色地带是什么?
比如说春运场景,有所有的交通数据,知道高速公路、航运、海运、汽车、高铁、火车等等,所有的数据我都有,但即使我们拥有这样的数据,也很难得到一种算法和得到一种结果,使得春运达到一个很好的状况,叫做“不再拥堵”,这是不可能的。
为什么?因为铺设了那么多资源进去,只解决了 365 天中几天的问题,这是对资源极大的消耗。
找到一个场景增益和增益场景的时候,这两个场景结合在一起,更容易把AI的结果放大。像数据领域,医疗 AI 为什么在中国发展出现了一个瓶颈?它其实是一个停滞的状态,没有大踏步的往前走。
英国政府花了很多钱买必要的数据,再花很多的钱找人做标注,做好了标注以后,英国政府把这些数据开放出来,我们就看到了从原始数据到一个标注好的数据,再到开放数据。
AI 的基础是大数据,大数据在中国过去 5 年间发展地如火如荼,大数据给我们更好的思考:它是成本还是什么?好多大数据只是体量大,其实没有很好的被标注出来,但是开放数据相对比较好,像今年 MIT 也逐渐开放它们在自动驾驶方面的开放数据,中国做数据标注的公司也参与了这个过程。
场景增益的问题还是比较关键的。这一代 AI 走到今天,通过海量的数据去训练出一个 AI 结果来,但是这使得样本数据永远不可能覆盖所有的空间和范围,就使得我们的算法不可能达到 100%,只能无限的接近 100%,这是这个行业的逻辑。
我曾经看到一个朋友跟我聊天,他说我看到一个项目,这个项目在做自动跟随婴儿车,它在婴儿车上放一个摄像头,就跟着妈妈走了。他问我,这样的项目如何给估值?
我们看一个项目的时候,要看它这个市场是不是大?节奏有没有到啊?可是回答这类问题的时候,我们思考的是哪个妈妈敢用这个?
哪怕 1% 的错误率,这个妈妈可能会带来终身的遗憾。开开心心带着孩子上街了,然后回家带着别人的孩子回来了,所以一定要找到一个合理的落地场景。
过去两年里,很多大的政府、国企采购里, AI 科技、智能化的部分越来越强,但是采购的过程中,大家都发现了一个点,就是没有看到效果。
比如说一家国家的大型媒体机构采购过一个算法,帮它过滤掉有负面的内容,像成人内容、反动内容等不能在网上出现。这些内容就要自动过滤掉,这个算法确实很难。
围绕 LP、LU 算法的演进可能还需要三年,但即使这个算法到了 99% 的准确率,要知道,要去过滤 1 亿张图片,或者 1 亿份文字的信息内容,只要有 1% 的错误率,就意味着有 100 万的疏漏。
每一篇内容都有 1% 的机会出错,所以意味着这 1 亿份内容每个都有 1% 的机会出错。绝对不会允许这种情况发生的,所以它需要再人工筛查一遍。有没有降低成本?没有,所以大家对于数据准确率的理解一定要放到场景中理解。
这些都是我们 2015 年定的一些思考方式,今天 2018 年,今年能感受到资本环境还是相对比较弱一点。从年初开始,新的《资管新规》的出现,一级市场在逐渐的收缩,比前两年要差了很多。
大家都在把速度放缓,但是翊翎资本却要发力,在逆市的环境中布局,为什么?人工智能发展到今天,进入第二个战场。
我们来看,这是一条曲线,一个上扬型的曲线,我用这个曲线来讲述人工智能发展的三个阶段。到达行业高点的时候就是现在的阶段,我们正在进入人工智能这个阶段,未来是这个阶段。
过去几年里面我们非常关注算法,全世界一共就 100 人,把 90 人关在我的笼子里面,那么我的笼子就是值钱的,这是大家一个简单的逻辑。
所以当时经历过大数据时代的中国,有了丰富的数据,在这些领域里面大家去确定这些算法的准和不准?决定了这个公司是不是有价值?这其实是第一代的创业。
这个非常简单,就是科研能力强不强?用没有科学家?我们换一个角度来看,当年我们做网站,这网站值不值钱?有多少用户?多少 UV ?有多少流量?大家关心你网站上挂广告能收益吗?所以这个时候算法的行与不行,研发能力的强与不强是一个公司估值能否上去的原因。
那么在人脸识别的领域里面, 2017 年旷视领衔的这几家公司,总公司融资 100 亿人民币。算法的能力推到了高点,但是今年出现了一个小的变化,李飞飞教授在谷歌发布了一个东西,叫自助化机器学习,我个人叫傻瓜式学习。
怎么理解呢? AI 可以取代人, AI 各种行业,但是 AI 最应该干的一件事帮助算法科学家来解决编程的问题,因为人研发算法是需要成本的。如果是一个自动化的 AI ,我们只要把标注好的数据给到机器,然后给到科学家,算法就能够得出来的时候,那么算法可能在 25~35 分钟之内完成。
它的准确率可能没有那么高,但是基本可用了,能够把算法的获取时间和金钱成本大大降低的时候,这个技术就开始与更多的场景融合,去做垂直细分领域的解决问题的小工具。
那么当应用和技术开始了双向驱动的时候,我们孵化了一家公司,百度 AI 开发者大会上,李彦宏讲了一分钟的视频,讲的是利用计算机视觉的技术来做木地板的检测。整个过程当中是没有任何一个科学家参与的。有一个近千人的标注团队,是标注团队两天时间标注完两万张图片,传到模型里面,25 分钟之后得到算法模型,然后把模型做出来放到我们双摄像头上,然后就跑起来了。
这件事帮助了什么呢?不是帮助这家 100 亿市值的公司去使用了 AI ,而是在木地板生产领域,过去 20 年当中,只有木地板检测是靠人工,不是靠全线作业的,当它全线作业的时候,就使得它的储货量大幅度增加,这就是效率提升。这为什么要替代人?为的是提升效率。
但是人走到今天也遇到一些问题,瓶装水、啤酒、盒装奶,上面的吸管、日期,全部要靠人来做的,这个非常枯燥,每天要工作 12 个小时。进入新的时代,大家宁愿离开江苏的镇江、丹阳去到福建、上海去送快递、外卖,也不愿意在本地拿着更高的薪水做这个枯燥的工作。
人是一个非常重要的因素,人际结构的变迁,导致了工厂原来的生产方式和测定已经不适合整个社会了。
我们一直在讲生产力和生产关系这两者的驱动,大家在用 AI 解决问题的时候,我们先看到的不是要去替代谁,写更多的是看现在的产业,现在高市值的上市公司里面,他们在社会发展这个不可逆规律下,它遇到的问题,这种本质下如何解决?
所以在木地板公司里面,以前做质检的工人,他们现在工作的时间更少、更轻松,同时出货量更大。但他们又有了新的工作,他们会花一定的时间帮助我投资的几家公司去完善木地板标注过程中的审核工作,这需要行业知识,所以这是一个升级,我觉得这也算 AI 培训中的一部分。
回过头来我们看,当工程能力开始放大的时候, AI 进入到了产业,它能够产生价值,当它产生价值的时候,产业跟它融合就更强。但是光有一个木地板检测就行吗?不够的。当把一个企业从信息化向智能化的迈进过程,需要一定的工程与它的信息化结合起来,才能够把这个事提升效率。
这件事反应了一个认知,叫做回归到场景和产业里面。我们看到工业领域,在中国别说自动化生产了,就是这些机器,我们人的生产,它的切割精度和效率都不算高,这个过程当中大踏步迈进一定会出现问题,这个客观规律是存在的,我们只能加快一步一步走,但是很难跨越它。
围绕这个过程我们也是一直在思考,要把工程、边缘计算的硬件,以及更多人力的配合,全部都用起来。
在这个阶段里面,工具型技术的产品,像混合云、边缘计算这一类的产品,开始与 AI 融合的更紧密。这样的公司,开始在落地,真正的行业场景落地的过程中,体现出非常大的价值来,大家对算法的价值是不直观的。但是工程的好坏这对客户是最直观的感受,像我们谈恋爱一样,一定要给到一个最直观的感受。
再往后,当科技、工程和线上场景热烈融合的时候,这时候会催发出一个增量出来, AI 很容易能降成本、提升效率。
我们再离开 AI 的场景回来看这三个板块,大家还记得刚从互联网开始的时候,我们最早接触的是 PC 互联网, PC 互联网的本质是什么?我们在玩游戏,用 Office 等等软件,很多的创业者大家早期用过 ICQ 等,都是技术出身。这些技术出身和现在算法科学家出身是一样的,这个行业里参与的第一波。
但是移动互联网不一样了,移动互联网早期的参与者往往是技术出身,但是他们有很强的运营能力,没有很强的运营能力的就被刷下来了。大家看看美团的王兴、微信的张小龙他们有很强的产品运营能力,他很清楚移动互联网流量价值,流量能否转化?转化能否变成现金?这个现金能否达到最大值?
做运营是一件更重要的事,大家知道 Facebook 在中国的一家公司成立了,它一定要找还没有被 Facebook 挖掘的市场,再去做增量。所以运营能力是移动互联网时期非常重要的,在这个阶段工程能力也是一样的,有好的工程能力的人会变得更重要。
AI 再往下发展是什么?我觉得是产品能力。在 AI 的公司里面越来越多的核心产品把控强的人来直接把控,我们讲究体验,本质是什么?其实还是流量的问题,所以我们要在整个延展和变化的过程中,去找到这个核心。
这也是我们回过头来再看现在的创业,大家往往会想我解决客户一个什么样的痛点上?有时候会说,我们要做中国什么样的公司?我们要做中国的 Facebook ,做中国的谷歌,这是现在创业过程我们看到的一个转折点。
以前总是希望人在事之上,我们希望成为某一样的人,很希望我的公司成为某一形态的公司。人在事之上我们很难理解我们的行业,很难理解我们的渠道,更难感知这个渠道发生的改变。
进入到 AI 行业的时候,我们开始为别人,为我们的企业级客户去赋能。发展到今天,人是否在事之下?我们对这个事还是要有一些敬畏之心,人在事之下的时候,去看这个事,看这个行业怎么发展会有很好的感触,这个感触体现出来的才叫产品能力。在这个产品能力之下,才会更精细的去运作。
效率、成本、增量变成一个核心飞轮的时候,公司赚钱停不下来。创业公司都希望能够上市,但是现在有没有一家大数据公司?没有,国家也在喊,总理也在喊,有没有?没有,A股上一代很多高市值的公司代表了那一代创业者的收官之作,我做了一辈子,干了 20 年,我最后上市了,我给兄弟一个交代,给团队一个交代,这叫收官之作。
但是现在的创业者,我们技术创业,人的价值会不会更出来?A股总是看财务报表,看事,现在有没有人看人啊?还没有。
AI 的公司可以快速的赚钱,当它开始赚钱的时候,它不需要别人的钱了。所以 2C 的逻辑是 A 轮 B 轮 C 轮 F 轮,然后 Pre-IPO 轮,然后再走上市。
到了 2B 领域的时候,两轮之后大家不见得再能参与的进去,这时候当A股开始代表中国先进生产力的时候,大家更没有机会了,一二级市场的套利差已经没有了。所以我们再去看 IPO 的项目都没有了,这个套利差是 0 ,所以只能参与到早期里面去做东西。这也是我们翊翎资本资本思考怎么做投资布局?我们围绕早期做了一个方案。
围绕人工智能按产业链来投资。
我们不会再单一的领域里边去撒项目投资,像社交产品来了, Facebook 、微信这样的产品,只要跟社交相关的我全部投资,反正便宜嘛,撒钱的模式,现在我们是要一个产业链,规避单一市场的单一投资风险。
在教育里面,我们投了新人群,一土学校等等。还有实习生,这是中国最大的实习生招聘平台这是我们围绕未来教育行业的,在去投资布局的东西。
人工智能里面,我们这里面投的最大的是360企业安全, AI 以后与工程领域的结合一定是涉及到安全的。
2015 年我们就只投数据,不投算法和其他的公司,今天我们投的数据公司里面,已经具备 3.5 亿日活消费者的数据到这个体量上面。
2016 年开始投算法,投了算法公司,像云脑科技、超卓科技。算力领域我们在硅谷也投了一家芯片的公司。芯片领域我们在中国看了半年,我们觉得没有值得去投的,所以我们在硅谷找到了一些华人,这些常年在国外的华人,我们投了他们。
我们更希望把这样的芯片能够带回国内,在中国更好的落地和发展。所以这也是一个投资机构,作为一个中国的投资机构,我认为应该从另一个方面为现在国家的科技发展做出贡献的地方。
在 2015、2016 年我们自己也开始在做平台, CELLA 是我们自己架构的一家公司,按照 AI 落地,如何帮助 AI 更好与产业产品结合这条路走,它更像是一个产业公司做的事。所以围绕到应用里面来讲,中国最大的医药行业 ERP 的厂商,以及腾讯出来创业的这些公司,还有供应链的科技公司。这些我们叫做行业应用,在行业应用里面,只要在垂直场景里面我们也投。
所以过去 2015、2016、2017 年做技术投资布局,同时做应用的布局,如果产业里面如果没有出现像样性的公司,我们就自己孵化。
以上就是今天的分享,谢谢大家!
▼