“搜狗分身”技术亮相乌镇,携手新华社发布全球首个AI合成主播
搜狐科技/林国振
11月7日,第五届世界互联网大会在浙江乌镇拉开帷幕,在开幕当天,搜狗公司CEO王小川、新华社副社长刘思扬、搜狗公司智能语音事业部总经理王砚峰和著名主持人邱浩联合带来了一场跨界产品发布会:搜狗与新华社合作开发、全球第一个“AI合成主播”正式亮相。而随着“AI合成主播”的发布,搜狗人工智能的核心技术“搜狗分身”也终于浮出水面,成为大会开幕日的最大亮点之一。
据了解,“搜狗分身”技术可以让机器以更逼真自然的形象呈现在用户面前,而不是冷冰冰的“机器人”。 该技术能通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行联合建模训练后,生成与真人无异的AI分身模型。这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,与真人几乎一致。以“AI合成主播”为例,用户只需要输入新闻文本,AI合成主播就能用和真人一样的声音进行播报,而在播报的过程中唇形、面部表情等也能与真人主播完全吻合,效果惟妙惟肖。除此之外,“搜狗分身”技术还能仅靠少量用户真实音视频数据,即可快速定制出高逼真度的分身模型,显著降低了个性化定制成本,进而帮助人类提高信息表达和传递的效率。
据搜狗公司智能语音事业部总经理王砚峰介绍,“搜狗分身”技术是搜狗人工智能的核心技术之一,诞生于搜狗“自然交互+知识计算”这一人工智能理念之下。依托“搜狗分身”技术创新的信息传播形式,能够帮助媒体在融媒体转型、新闻时效性和跨语种传播能力等方面再上台阶,增强中国传媒业的国际影响力和全球竞争力。
未来,“搜狗分身”技术将在娱乐、医疗、健康、教育、法律等多个领域提供个性化的内容,显著提高社会生产和服务效率。在解放行业生产力的同时,“搜狗分身”技术给予用户更好的个性化音视频效果,用AI科技来切实的提高人们的生活体验。