百度黄爽:百度金融用大数据优势赋能金融科技

百度黄爽:百度金融用大数据优势赋能金融科技

中新网10月21日电 10月21日,百度副总裁、主管消费金融业务的黄爽在出席台湾金融科技创新论坛时表示,大数据已经成为推动金融科技发展的新动能,消费金融则成为科技创新的高地。目前,消费金融市场面临着信用下沉、风控线上化、获客成本增加和产品差异化程度低四大困境,而百度金融科技则能够帮助用户、合作伙伴和金融行业实现三方面破题。比如,以大数据征信扩大授信范围、打破身份区隔,让用户享受金融获得感,通过人工智能等前沿技术,关注客户微小需求,拓展合作伙伴潜在市场,并与金融行业一起解决新时代消费金融遇到的问题。

百度黄爽出席2016台湾金融科技创新论坛

以下是演讲实录:

刚才主持人介绍我的背景是金融机构的,最早在美国Capital One,其实也是一个以数据决策和数据分析著名的公司。美国有本非常著名的书叫《大数据》,它里面主要就是讲的Google和Capital One这两家公司。后来回国是在外商大公司创业,后来去了陆金所,前不久到百度。

接收到这个邀请的时候,希望我们来讲讲大数据,我们觉得也是一个非常有意义的命题,因为其实这是金融科技一个非常重要的组成部分,也可能和百度看到的互联网的下一幕息息相关。我们的创始人和CEO李彦宏也在很多场合都提到过,互联网的下一幕是人工智能。当大数据和深度学习结合起来的时候,就是让人工智能开始了很多的可能性,今天借此机会跟大家分享。

首先“金融科技”其实是一个老词,它并不是一个特别新生的事物,它已经存在了很多年。金融其实一直都是有非常强大的科技后台,只是在近年来,第一它的发展速度确实是爆发性的增长,第二其实它不仅仅是一个后台的职能,越来越多的走到了前台来,让用户能够感知到这样的一些流程。具体举例,在Robot-Advisor这个行业,实际上就是大数据本身,或者是金融科技本身,让这个行业开始有了飞速的增长。

在大陆其实这样的趋势也非常明显,9月份毕马威发布的《中国领先金融科技50》企业里面,大数据是一个热门的部分,实际上它的增长速度也和全球保持了一个比较合的节拍。讲大数据,在这样一个新型的环境里面,我们不太去讲1.0具体是一个什么样的组成部分,可能更多的是在讲,在2.0里面我们看到的是什么样的东西驱动它的方向。一个是讲数量,以前我们是讲YB,后来是DB,后来讲TB,我们讲兆、千兆和兆兆。第二个就是说速度,我们今天讲数据的处理达到实时,特别是在复杂数据处理的时候,其实是非常难做的事情。第三个是在讲数据的种类,特别是从结构化到非结构化,当你可以去处理一个非结构化数据的时候,其实可以使用的数据突然间就变得非常多了。

大家知道百度是一个非常大的搜索引擎,也还有很多其他的生态。比如说地图,贴吧,还有糯米等等。糯米其实是类似于一个点评生活的O2O产品,就是说你可能需要在附近去购买商品、去商户、去餐馆、去看电影,跟消费有关系。百度其实也开始了一些支付的尝试,有一个叫百度钱包的APP。这些东西加在一起的时候,它的数据种类就非常的繁多了,处理的数量都是亿级、百亿级和万亿级的。举个例子,因为百度地图的国际化做得还不错,在今年10月1日当天,百度的地图有500亿次的调起,就是大概占大陆70%的份额,这在以前是不可想像的。

当这些都加在一起的时候,我们认为百度是一个有大数据基因的公司,也在把大数据基因注入到金融里面。其实讲到金融,最底层的还是安全。所以其实做大数据也好,做金融科技的底层还是希望有非常高效的数据中心,希望我们的服务器是虚拟化的。我们会制造一个机器学习的平台,现在我们有一个平台叫Paddle,就是除了我们自己可以使用,也邀请所有的Coder可以用的这样的一个平台来机器学习,建立机理学习的模型,进行模型的训练。这样的东西慢慢的就开始应用到了百度金融里面。

在金融的领域我们的愿景是什么?我们其实是希望成为一个真正意义的金融科技公司,利用人工智能等等的技术优势升级传统金融,我们没有想说要颠覆传统的金融,就是金融科技的本质还是金融,而是升级从而实现普惠金融的梦想。

总体来说,我们觉得人工智能、大数据加上深度算法实现的时候,从今天来看,已经有很多方向是可以得到一些比较实际的应用。比如说身份识别、大数据风控,就是在整个的风控流程里面和决策里面有什么样的作用。智能投顾就是大家熟悉的Robot-Advisor,怎么把这种投资的行为和人平时会去形成的观点、建议能够应用在财富管理的大环境里面。量化投资其实一直是一个流派,它可能在整体的投资领域的占比并不高,但是它和大数据、人工智能结合的时候,是不是可以走得更远?最后就是金融云,当它能够大规模的储存的时候,它就可以大规模的输出了。所以是希望这些人工智能也好,大数据风控也好,还有智能和量化也好,其实是在生态的基础上跟大家分享。我们知道,其实有些金融技术真的只是在分享的时候、在一个共生的生态里面才是最有用的。只有我们有一个非常好的生态和非常好的联盟的时候,这样的金融科技才能够真正发挥它的作用。

作为一家金融科技公司,我觉得金融是一个非常庞杂的体系,不是输出一个简单的技术和一个简单的解决方案,而是说技术怎么和金融去结合。所以在结合的方面,和很多的互联网产品也相似,就是说我们也是需要把它工程化、然后把它产品化,让我们的用户和客户都知道怎么样最简单的去使用它。就好像我们的BI,Business intelligence,在以前能把一个数据分析清楚就不错了,但是现在其实大部分的BI软件都是有非常好的可视化的功能,给大家使用BI或者普及BI提供了更多的可能。所以我们的自我探索,是为了让用户体验也好,深度场景的结合也好都能够得到更多的发展,希望和大家来开放合作。

具体到今天,我稍微讲一讲消费金融,因为这也是一个非常大的可以去使用大数据的领域。消费金融在中国大陆是一个万亿级的市场。在近年来,跟场景相关的就是互联网+金融,可能会+场景,或者产业,是我们看到的一个比较新的趋势。但是即使是在这样一个量级的市场里面,它真正触达到的人还是很少。在整个央行征信系统收录的8.7亿的通常我们讲的信用人口,但是实际上我们有信贷记录的人也只有3亿多人,所以还是有5亿人,实际上普惠金融对于他们来说仍然是距离没有那么近的。

如果我们想要去解决这些问题,其实是面临着比较多的挑战。第一是说,金融所有的这种尝试过的业务边界和风险边界是建立在那3.7亿人上的,当超出这个边界的时候,其实要做很多的探索。因为金融不是一个随便试错的行业,当信用下沉的时候,怎样去试错,或者怎样去把控这个风险是一个非常值得去探讨的命题。

第二是说,如果我想增强效率,其实我就需要线上化,我尽量的把很多流程,不管是后台的还是前台的都要线上化。但是我们也知道,实际上在2015年以前我觉得,在中国大陆有一个普遍的观点是说,我在资金端是可以线上化的,陆金所最先开始也是在资金端线上化的。美国的Lending club不太一样,他们其实是资产端线上化的比较早。但是我觉得包括像读秒这样的产品的涌现,还有很多这种新的探索,也慢慢的可以让在资产端可以把这种资产的获取线上化了,或者至少部分线上化了。现在我们可以看到很多这种全线上化或者是部分线上化的产品也是给普惠金融(带来可能)。当你扩充了效率边界,其实就扩充了风险边界,因为可以用同样的定价去触达到更多的人。

第三个就是获客成本的增加,百度有很多流量,我相信有很多金融机构在大陆都是使用这个流量来获客。但是随着市场的参与越来越多,获客的成本也是增加了很多。怎么把这几个因素加在一起,仍然可以扩充我们的业务边界?

最后其实说起来,普惠金融我们探索了这么多年,但是看到产品的差异化还比较少的,我们怎么能够通过金融科技来逐步的实现一些产品的差异化,最终实现这个产品和客户之间的智能匹配,我想这样才是效率最大化。。

从信用下沉或者是刚才的第一个挑战来说,我们觉得非常重要的就是传统的数据要和新兴的数据结合。百度刚开始的时候也是比较重视自己的数据,因为自己已经是最有效的,储存最多的大数据公司之一。如果我们今天想要去给更多的人提供普惠金融,首先我们要知道什么样的数据是最有效的。所以其实是要在内部生态和外部生态里面去寻找那些最有效的数据,外部的数据有很多其实是被证明了的,除了我们的征信数据之外,像运营商的数据就是手机的数据和手机通讯录的数据,其实已经被逐步的证明是非常有效的风险差异化的工具。政府部门的数据,像蚂蚁金服的花呗,还有京东的白条是典型的用线上的交易数据来进行信贷的。逐渐的有交易的数据被证明是可以做信贷决策的。

我们有时候开玩笑说,其实你在微信朋友圈里面发的可能是你想成为的那个人,但是你在搜索的时候告诉你的,其实是你最内心、最真实,也有可能是最黑暗的东西,但是最真实比较重要。百度相对来说是一个比较全面的生态,我们希望通过内部和外部的结合,逐步能够提高我们信贷的覆盖率,我们知道中国今年是28%,美国是85%,这个中间的路还有很长。但是只要我们沿着这个道路走下去,金融的获得感一定会有所提升。

其实大家讲大数据的时候讲的比较少的一点,但是我觉得非常重要,就是说,其实数据的处理能力是非常重要的。比如说建模,什么样的数据,什么样的决策,建什么样的模型是比较重要的。比如说反欺诈,可能你的深度学习是比较有把握的,因为他没有什么分布的,你不知道黑产从什么时候来,他也是需要一个实时的,可能是秒级的监测的。黑产攻击我们的时候,通常都是在节假日,就是十一,春节,这都是非常典型的可能要加班加岗的时候。所以我们模型的迭代速度非常重要。我是三年前就离开银行机构的,那个时候我们的模型,大概就是要一年左右Update一次可能就差不多了,因为毕竟是一个逻辑模型,你可能也需要积累足够多的Y值,积累足够大的X值才能去更新迭代一个模型。现在,你是可以加上深度学习,可以加上机器学习,去进行反欺诈也好,催收也好,黑名单也好,还有很多风控策略,可以用更快的这种机器处理的能力,快速迭代模型,数据处理的能力得到一个极大的加强。

第二就是去找客户,就是在金融里面,“你找他”和“他找你”其实是两个非常迥然不同的业务模式,风险水准也是非常不一样。其实微粒贷就是典型的“我找他”的产品,就是有一个白名单,想要想好这个白名单是什么,可能加上定价、对逾期率的预测、对这个人的了解,然后你才把他加入这个白名单里面,然后给他一个机会。因为互联网提供了一个广泛触达的可能性,所以这样的一个产品,它的风险表现通常会比“他找你”的表现要好很多。因为大家知道,“他找你”其实他是非常需要钱的,所以当平均下来,在大法法则的情况下,“你找他”和“他找你”,其实还是有非常大的区隔。百度其实也是在非常注重的去升级自己的帐号,希望能够把帐号加强到可以达到的一个预授信过程是我找他的这样一个地步。所以在这样的情况,大数据风控就会让这样的一些东西变为可能。

第三讲讲秒级和异地的预批。小伙子在北京念书,然后家乡是在贵州,念完了书以后也没想好是不是要留北京,因为大家知道,在北京和上海的生活成本还是很高的,还是要回家乡。但是呢,他学的专业又不是他想学的专业,所以回家思考了半天,最后就申请了一笔百度的教育贷款,最终是去重庆的一个IT的这样一个职业教育的学校去学H5的设计。所以我觉得就是,其实现在实实在在的大数据风控已经让这个秒级或者异地的普惠金融变为了可能。

刚才讲到了产品的差异化,其实也是一个挑战。以前在我们金融机构我们都希望产品的底层结构是相对简单,因为如果你换了一个变量,其实这个产品的风险表现会有很大的不同。就是因为这样,其实我们不太愿意去尝试在很多领域的创新,特别是产品结构的创新。但是我觉得由于互联网的反馈弧相对比较快,所以其实我们会在一个有限的范围里面去尝试可不可以针对这个客户去有一些新的东西。比如说我们给年轻人或者是在校的学生,如果是快毕业了,他想去学一门职业的技能,他这个时候还没有收入,我们会给他一个X+Y的产品,就是在前几个月,实际上他的利息什么都是比较短的,但是后面会比较长。一般金融机构不会做这个,我们还会给他利用小额的循环的生活服务,但是等他毕业之后,就会给他现金贷或者是租房贷。所以这种产品的定制化让他变为了可能。

我想选实际的例子给大家分享一下。爱空间是一个网上的装修的机构,它现场的用户日均到场,因为使用了百度的信贷产品,能够提升日均到场50%以及签单量日均的34%。这些数据都是非常可观的。

最后回到我们最先开始的命题,是说我们的大数据风控也好,人工智能也好是希望做一个生态的。除了自我探索,也会对外输出。对外输出可能有不同的引擎,就是比如说信用评分、反欺诈、定价、催收。重点讲讲几个东西是我们最近大概9月份开始在自己的产品上尝试的,一个就是人脸识别,大家能看出来谁是刘德华,谁是刘德华的替身吗?机器也能看得出来。所以基本上人脸识别百度在很多评比里面都是世界第一的,我们也希望通过这样的技术,在人脸的验证上,比如说在金融机构的开户流程中能够更多的使用。这个是在讲语音的识别,一方面其实现在大家用百度搜索的话,其实是可以用语音直接搜索,但是语音识别的技术也可以用在金融领域,比如说交易的控制,我们是要求声纹的密码。虽然指纹也是很不错的,但是指纹第一是受硬件的限制,第二当的硬件被窃的时候,或者如果可能是一个不方便使用硬件的场景,那其实声纹还是比较不错的,而且声纹识别的准确率和召回率也会比指纹还要高,所以这个也是在我们9月份推出的现金贷的产品中进行了尝试。活体识别是指,其实黑产也是一个非常高效的产业,当线上风控的时候,实际上人脸虽然被识别出来了,但是也有可能是别人拿着你的身份证,或者是为了证明这不是一个静态的图像,我们很多时候会要求大家做一个动作,比如说眨一个眼睛或者什么,这样活体的识别,也可以帮助我们能够进一步有效的把这个线上的风控变为现实。

今天时间还是比较有限,所以我的演说就到这里。但是基本上我们是希望我们这种金融科技能够越来越快的渗透到实际的应用场景当中,也邀请大家一起和我合作。

相关领域
人物