2017年5月25日-28日,第三届中国国际大数据产业博览会(简称数博会)在贵州贵阳举行。
金山云AI技术总监张东进出席了博览会并发表了以“ 金山云助力AI+”为主题的演讲。
张东进在演讲中指出:
1)到2020年时全球AI行业的产值超过100亿美元,同时中国AI产业到2018年达到千亿级别的市场规模;
2)利用好大数据可以帮助企业做精细化的运营和决策,帮助企业进行产品服务优化和创新,但是如何利用好大数据是很难也是很现实的课题。
3)深度学习能真正对非结构化的高危化大数据进行有效处理,推动AI行业的发展。
4)企业必须抓住机遇去做混合经济,用开源生态提升企业技术的能力,把企业数据作为核心资产,作为一个导向去研发企业面临未来的核心的竞争力。
以下为演讲速记整理:
非常感谢各位嘉宾和亿欧主办方,今天讲一下金山云是如何帮助人工智能在行业落地。
我本人有10年的互联网从业经验,过去10年我参加过许许多多的大数据和人工智能相关会议。这两年有一个非常明显的感受是什么呢?
就是说我们的人工智能,还有大数据正在从互联网企业和科技企业出来,去到行业领域去,渗透到各行各业,这次贵阳数博会的感受尤其明显。我们发现大量的传统企业,开始分享大数据在行业里面的应用,这是一个十分令人欣喜的现象,表明国家的大数据战略开始真正的落地了。
人工智能和大数据是什么关系呢?我们企业该如何去抓住人工智能的机遇去迎接挑战呢?我给大家介绍一下我们金山云在这方面的探索和努力。
自从创业以来,金山云在云计算市场,我们在全球构建了基础设施,包括遍布全球的19个数据中心和节点,在全球管理超过8万台数据服务器,目前已经是全国TOP 3的企业。
另外,针对游戏、视频、企业、政务、金融等行业推出行业解决方案,帮助行业企业更好、更快地拥抱云计算。经过这么多年的发展,金山云平台累计了大量的数据。
目前,金山云每天新增的数据超过500PB(编者注:单位“拍”,1024TB=1PB),我们知道数据本身是有非常大的价值的。那么我们利用好大数据可以帮助我们企业做精细化的运营和决策,帮助企业进行产品的服务优化和创新,但是如何利用好大数据是很难又很现实的课题。
我们发现整个大数据生态是欣欣向荣的。目前金山云在太原已经有上百的大数据相关的组件和服务。这些组件特性各异,他们在稳定性、性能、兼容性和安全性存在这样那样的问题和差异。那么企业如何去进行优化、整合、并将其真正地部署和应用到行业和领域,这是一个复杂而充满挑战的任务。
可以看到我们企业必须有这样的能力做这样的事情,那么这是金山云帮我们的企业做的一个工作。
我们金山云去年推出了一个KMR—金山云大数据服务,它是基于云主机的大数据产品。配合我们的云存储为企业提供“单到单”的大数据云计算方案。当企业面临一个流量突增和数据扩张的时候,可以在金山云平台上获得一个相适配的运算能力。同时结合金山云的方案,可以帮顾客节省超过75%的成本。同时金山云是托管云部署,为企业微信码和兼容性的要求提供了支持。
在KMR的平台上,企业用简短的步骤可以有一个大数据服务。经过大半年的发展,平台累计了数十家重大型的企业客户,包括像当当这样大型的电商类企业。大数据里面最主要的数据是非结构化数据,那么目前随着移动互联网发展,这个趋势又更进步了。
当前数据不仅从互联网,而是各个方向涌现出来,包括呼叫中心、交通卡口、客户部门、生产线,交通工具以及医疗设备等等,每天都在产生海量的大数据,那么这些数据有一个非常明显的特征,就是它的高危性。
新产生的数据,包括语音、影像、视频都是高危大数据,我们传统大数据在这些数据的处理上很难获得一个较好的效果,我们需要掌握一个更新更好技术。
那么这个技术就是深度学习,那么其实深度学习不是一个新的概念,最早的可以追溯到上世纪60年代,那个时候神经网络已经提出来,我们学界和产业界通常把2012年作为一个深度学习的元年。因为在这一年我们深度学习才真正大放异彩,并且引领了AI这个行业的超常规发展。就是在这一年开始,有一个叫AlexNet的神经网络横空出世,他让图像识别的错误率下降了40%。我们发现深度学习技术开始逐渐取代一些传统技术处理,包括一些高危大数据了。2012年的时候我们的神经网络正确率有8成,等到2016年的时候我们的图像识别的准确率超过了人眼识别,这是一个标志性的事件。
另外,我们发现深度学习不仅是在图象识别领域。它在我们的视频、语音、自然语言包括一些人际交往方面达都到了一个类似的效果。可以看到,深度学习真正对我们非结构化的高危化大数据进行有效处理,推动AI行业的发展。
这是一个国外权威机构做的一个AI行业产业规模预测,我们发现到2020年时我们全球AI行业产值超过100亿美元,同时我们中国官方的AI产业到2018年达到千亿级别的市场规模,这个市场是十分巨大的。截至去年底,全球已经陆续创立了超过1500家AI企业,融资规模累计超过了90亿美元,这个规模是非常巨大的。
另一方面我们注意到,AI不仅仅是科技企业,或者是互联网企业的一个机遇,它也是我们传统行业,传统企业的机遇。
AI正在为传统行业的水电煤,金融、电信、医疗、教育等等方面提供了非常好的产品和新能力。那么传统企业必须发展构建面向未来的核心竞争力。但是AI技术由于其复杂性和一定程度的神秘性,成为传统企业应用的一个障碍。
万幸的是,人工智能开源社区其实已经在悄然发展起来,并且构成了一个完整的生态,包括我们的一个开放性的技术社区、论坛、论文的分享,以及相关开源的生态框架,开放的深度学习模型,这都是极大的降低了深度学习的门槛和人工智能的门槛,促进人工智能迅速普及。企业必须抓住机遇去做混合经济,用开源生态提升企业技术的能力,把企业数据作为核心资产,作为一个导向去研发企业面临未来的核心的竞争力。
在这样一个背景下,我们云计算企业一如既往为我们企业和行业提供基础性的平台,帮助我们企业落地大数据和云计算过程中遇到的难题,帮助企业更快更好的去落实人工智能。
这就是金山云推出的深度学习的服务,包括两个方面,包括硬件级别的超算平台,可以为企业提供计算能力和储存能力。然后是研发平台,为企业提供端到端的深度应用学习服务,帮助企业很快的实现深度学习的落地。
同时将深度学习与我们的金山云潜在云进行有机整合,在我们的平台上帮助我们解决人工智能服务周边的全套一个需求,包括储存、计算、数据的导入导出,相应的预处理整个环节,实现人工智能的全战略的服务。
金山云平台具有灵活的存储方式,面向一些科技企业和互联网企业,我们通常都是以公有云的形式展开,金山云提供了公有、托管、混合云和私有云,从而帮助企业解决合规性、安全性、监管、审计等方面需求,从而帮助企业应用人工智能和大数据扫清一个后顾之忧,帮助我们企业更快的去实现这种人工智能的落地。
首先我们看一下金山云的这一平台,我们可以为企业提供高性能的计算机系统,并且提供毫秒的计算能力,并且为企业提供生命全周性的加速,包括预测到训练,包括隐性的预测,提供相应的全套方案。
这是金山云总体的一个产品结构,金山云平台的计算性能突出,单机可以提供高达6T的计算能力,可以为企业提供10万M的网络,加速整个集群的梯度和参数的传递。那么金山云平台最高可以提供200多台机器,帮助我们企业深度学习,达到数量级的性能提升。
这是我们平台介绍,这是我们最新的一个GPU,是上一代GPU的1.4倍,超过3倍的计算能力,同时我们可以为客户提供超过三种选型,帮助我们应对不同的计算场景,解决不同计算场景的需求。
金山云深度学习平台可以构建在底层运算上的服务,它可以更深度地应用,去帮助企业解决深度学习的一个问题。它可以降低整体应用的门槛,提高我们企业应用效率,并且是为企业量身定制的内部提供高级别的安全性。可以推动我们AI在传统企业真正的去落地。
这是整体的一个产品结构,那么底层是基于金山云强健的一个高存储、高性能集群,上层通过资源调度系统,为大数据和深度运算提供源源不断的动力。帮助企业非常方便的使用平台提供的能力。
希望企业通过金山云平台,帮助客户解决成本、效率、安全、性能等四方面的门槛和障碍,去实现企业更快的AI的落地。
在未来,希望不仅看到会有更多的人工智能企业出现在中国,出现世界级的企业。也希望出现越来越多人工智能+传统家企业,这是我们的一个愿景,也是一个使命吧。谢谢大家,今天的分享就到这儿。