2017年5月25日-28日,中国国际大数据产业博览会(简称数博会)在贵阳市举行。
5月27日的“人工智能赋能产业升级”专场,探讨大数据和人工智能在实际应用中存在的问题,以及如何利用大数据提高人工智能在具体行业中的应用。嘉宾包括:亿欧-联合创始人-王彬、雅森科技-创始人-陈晖、中云投资-董事长-王钢、金山云-AI技术总监-张东进、明略数据-CTO-冯是聪、量化派-副总裁-牛峰、百融金服-副总裁-陈浪仙、因果树-创始合伙人-滕放、传化智联-副总裁-项天成。
明略数据联合创始人、总裁兼CTO冯是聪博士进行了“行业大数据与人工智能产业结合,实现企业效率变革”的主题演讲,冯是聪认为:
1)大数据与人工智能只有深入到行业中才能实现“赋能”价值;
2)公安领域:结合人工智能技术可以让警察办案更加高效,通过数学模型可以固化警察的阅历、经验和知识;
3)金融领域:结合人工智能技术可以让行业专家更敏锐,更有效地实现实时控制风险;
4)工业领域:结合人工智能技术可以让工程师更精益,做到故障实时监测,实时诊断与预测。
以下内容根据演讲速记进行整理(有部分删减):
首先介绍一下明略数据,明略是做行业大数据和行业人工智能的解决方案提供商,围绕大数据挖掘平台DataInsight、数据工程平台MDP、关联分析平台SCOPA等核心产品,提供一系列数据深度分析平台和软件,帮助公安、金融、工业等客户,在安全可靠的环境下,整理、分析、利用不同来源的结构化和非结构化数据,挖掘数据间的关联价值。
明略核心业务有三个板块:公安、金融、工业。下面,我将围绕“明略如何将大数据与人工智能赋能到上述三个板块”进行介绍。
明略认为,无论是大数据还是人工智能,一定要深入到某一个行业,了解行业的规律和业务,才能真正的赋能行业。
大家知道,一个技术如果不能解决实际问题,那仅仅就是炫技。明略很多时候是针对一个公司、一个政府的特定问题提出具体的解决方案。这个方案有两个特征:第一个就是跟这个行业密切相关的,并可复制的。如果明略服务的每一个公司都是个性化的,那就没有办法高速增长。第二个特征就是能够解决具体问题,如果解决不了问题,像刚才讲的,一点用都没有,顶多就是一个PPT。
下面来说一下行业大数据与人工智能产业结合,实现企业效率变革的几个具体应用:
产业结合一:公安+人工智能=让智慧的警察更高效
公安的需求是很旺盛的,大家知道公安要保护人民的安全。在公安这一领域,明略面临的问题是:面对公安行业严重的条块分割,例如,公安里面有很多警种,情报、技侦、网安、国保等等,每个警种都有自己的数据,如何建立统一的大数据模型?
倘若突然发生一起重大的凶杀案,首先是刑侦去勘察,然后化验室化验,把各种数据调出来,他的身份证,邻居是谁,整个研判过程跨多个警种,需要花费大量的时间。智能公安可以把跨警种的所有数据整合到一起,建一个庞大的网络,常见的社交网络就是这个网络的子集。
我们有了这个巨大网络干什么呢。首先是知识的表达,然后做推理。
比如说我知道张三,张三爸爸的儿子有可能是张三,也可能是张三的兄弟。明略算法最大的特点是,所做的模型一定要有可解释性,并且可解释性是第一位的。什么是可解释性呢?
假设收集到某个人的诡异行为,比如说以前的收入水平很低的,突然一下子暴富了,高消费了,又或者这个人晚上出去,白天回来,许多单独看来并不反常的行为,综合起来判断很可能就构成了一个犯罪分子的行为特征,这种逻辑推理的过程就依赖于模型的可解释性,在研判中可以发挥巨大的价值。
大数据模型是可以基于规则的,为什么要规则呢?
很多时候,某些场景拥有许多数据,老刑警做了一辈子侦查工作,能根据数据的关联快速地判断出是好人还是坏人,因为他心里面有他自己一辈子的工作经验。
此时大数据模型最主要的工作就是把刑警脑子里面的经验和知识沉淀出来,数字化、程序化,最终可以复用。我们收集大量的数据,利用这些数据进行训练,将破案率准确性提高到80%,甚至90%,这是非常可观的,所以对于大数据模型来讲,是一个混合模型,早期的模型可以基于规则,这样可以克服早期数据不足的问题。在模型使用一段时间之后,就可以收集到一定数量的训练数据,这个时候就可以进行机器学习了。所以,我们的模型通常都是混合模型,规则加机器学习。
由于知识的沉淀,行业的洞悉,明略也会将模型规则迁移到其他警种,比如将贩毒吸毒模型规则的知识用在其他领域。
在某一个地点发生了肇事逃逸,只要我们拥有足够的技术能力把公安各警种的数据放在一起关联研判,几分钟几秒钟可以把这个车的整个行动轨迹传输出来。再比如,民警短短一天就可以抓很多逃犯,但仅仅这样很难将犯罪分子背后的团伙连根拔起;如果我们让分析师基于犯罪团伙的行动轨迹建一个模型,通过大数据分析研判,就有机会能找出几十个团伙,交给刑侦,一网打尽。
以上是明略数据模型在公安里面的应用。
产业结合二:金融+人工智能=让智慧的金融行业专家更敏锐
在金融里面做实时风控,基本上客户就是金融公司的风控部门。做一个简单的场景,比如在座每一个人在每个地方消费的时候,通过刷卡的细节,数据模型就可以知道这个消费是正常的还是异常的,这一点明略可以有很多的数据模型来判断。
例如,通常消费者在北京、上海,今天到贵阳出差了,位置变化很大。再比如,平常消费金额是几百几千块,突然消费了几万块,这就是诡异的。让大家放心的做法就是突然中断交易,客服马上给你打电话:“某某先生,或者某某女士,这个消费是不是您消费的?”如果不是您的消费就马上终止。
传统的做法,是把行为数据拿出来,跑几个小时,再上线几个小时,时间就这样过去了。可是网络诈骗,钱从一个帐户到另外一个帐户,几秒钟转80次手续,最远是转到境外,因为中国警察和很多国家没有引渡条例,在海外没有执法权,这样做研判的时候明明知道是谁骗的,但是没有办法逮回来。
通过将人工智能与金融相结合,可以让金融专家更敏锐,这就是利用大数据技术创新,提升金融机构风控与营销效率。
产业结合三:工业+人工智能=让智慧的工程师更精益
明略做的基本上是设备故障的诊断和预测。
诊断这一块是非常有意思的。明略做了很多场景,比如说高铁,是明略最大的客户之一。高铁在铁路上跑的时候,很快很方便,为了避免高铁发生安全事故,不管这个车有没有问题,每个月都需要拉去检修厂检修,这样做成本就很高。那么能不能通过算法进行预测,发生故障的可能性比较大的时候再去检修?
明略把通讯、照明,牵引等系统的数据收集回来,把故障进行预测,告诉相关部门这个阈值是多大,过了这个阈值就去检修。
大数据模型现在做的第一步就是做故障的一个诊断,以前的方法是,找老专家把零件发生故障时候的波形画出来,纯人工的模式。但是现在,是用数据做判断,然后给专家一个建议。比如说做一个高铁的轮子,生产的时候埋了很多的传感器,轮子表面看不见的缺陷,内部裂缝了等等,都可以用这个传感器可以把数据收集起来,通过数据分析这个里面的压力压强,各种各样的系数,分析这个轮子出事的概率多大,提前检修,这是非常有意义的。
总结:
简单总结一下,明略第一个标签是行业人工智能解决方案商,并且每一个行业做得都非常深。
第二个标签是,明略做的是规则引擎加机器学习的混合模型。
第三个标签是,所有模型的可解释性。在医疗里面,模型需要判断病人为什么病了,在公安工业里面一样的道理,需要解释为什么嫌疑人有问题,这也是很大的课题,我认为这是大数据模型里面必须要克服的一个难点,光有关联性是不够的,必须要有可解释性。
第四个就是跟很多公司相比,明略在行业人工智能解决方案上面有自己的核心产品,由这些产品构成自己的解决方案,并且明略做的解决方案和技术在很多行业都可以复制应用。不是像传统的项目实施那样,每个项目必须铺大量的人力,产业结合就是希望通过软件、技术把可复制的东西复制下来,固化下来,这是我们跟很多项目制实施公司或者系统集成公司的区别,谢谢大家。