百度向海龙:视频时代到来,AI给百度提供了这两大武器

2018年05月22日,主题为“新生态,联未来”的2018百度联盟生态峰会在海口召开。峰会上,百度高级副总裁、百度搜索公司总裁向海龙以“新‘视’代”为题发表了主题演讲。

向海龙表示,技术的发展让视频成为最直接最高效的沟通方式,全民视频大爆发时代已经来临,百度依托AI能力,能够让复杂视频的生产更容易、视频的内容检索更简单。百度已经准备好跟合作伙伴们一起,全面拥抱视频时代。

视频已经可以成为主流记录方式

具有想象力的大脑和知识的沉淀和传承,是人类以并不强壮的身躯成为万物之灵的原因。向海龙表示,整个人类的进化史实际上就是知识传承方式的革命史。

从远古时期人类通过口语和手势进行无法留存的沟通,到文字和纸张被发明,人类的文明和知识才得以一代代被传承。直到近代,视频让人类沟通重新回归原始的“指手画脚”的沟通模式,同时突破了时间和空间限制,将信息实现更高效、更广阔的传递。很多例子都能够证明,视频是最高效的沟通和表达方式。

但在近几年之前,视频依然只是文字之外的一种补充方式,未能成为主流信息记录模式,是源于视频应用的四个难点:生产难——视频生产需要专业设备,存储难——需要很大的存储空间,传输难——传输速度慢和流量资费贵使得传输成本高,检索难——基于语义理解和字面匹配的传统检索技术难以在视频这种信息载体上直接应用。 

随着智能手机、云端存储、4G网络、wifi、AI的视觉识别及语音识别等各个领域的技术革新陆续出现,原来视频不能成为记录主流模式的障碍已基本被打破。向海龙认为,因为视频的便利性,我们将进入一种“新原始”时代,让人们重新回归传统的沟通和表达方式,全民视频大爆发的时代已经到来,视频将充斥我们工作和生活的方方面面。百度将依托深耕多年的AI优势,赋能复杂视频生产和视频检索——百度AI将让全民视频时代更简单。

AI帮助优化视频制作与搜索过程

当然,这一系列对于视频内容的背景介绍,引出的是百度对视频内容领域的进一步关注与AI赋能。

向海龙提到,拍摄一个高质量视频,特效是必不可少的,而以前视频中的高级效果大多是通过专业的后期制作实现的。如今通过AI技术,任何人都能轻易实现这些酷炫的效果。基于百度AI技术具备的人体识别、形体美化、人景分离、语音识别、语音合成等能力。

他在现场分别演示了“瘦身”、“分身术”、“变声”的特效示例视频,呈现了百度如何让生产复杂视频更简单。

接下来,他又介绍了百度如何让检索视频更准确高效——通过对视频的全景扫描,利用语音识别、人脸识别、物体识别等技术完整分析视频中的内容,将视频背景、人物、语言等信息进行组合,百度可以给每个视频生成一个独特的指纹,大幅提升视频检索的效率和准确率。

现场演示视频充分展示了百度的AI技术让利用语音快速检索视频成为可能。向海龙还指出,当视频具有丰富标签,未来直接通过文字、语音或图像,都可以快速实现大规模的视频检索。“哪怕突然有一首歌想不起来了,只要能哼唱一段,百度就能检索出这首歌曲的MV。”

百度也同样期待5G时代的到来

演讲的最后,向海龙还介绍了百度对5G时代的期待。随着5G时代即将来临,人们的生活也将产生日新月异的变化。未来医疗和教育资源将更加均衡,精密的手术可以远程操作、高端教育课程可以随时随地进行,游戏的体验和真实生活将融为一体。

而随着5G到来,传输速度上升后,人们的沟通方式也可能将全面进入视频时代,新的“视频时代”存在无限可能,既是挑战,也是巨大的机会。

相关领域
商业