场景化的智能语音交互 ——门罗公园专访思必驰CMO龙梦竹
2017年9月7日,苏州思必驰信息科技有限公司(以下简称思必驰)在北京召开发布会,正式推出DUI开放平台。DUI,全称为Dialogue User Interface,是思必驰首个全链路对话定制平台,提供基于思必驰智能语音交互技术的对话系统定制服务。那么,DUI到底有哪些优势?语音交互技术会对我们的生活带来哪些影响?为此,门罗记者采访到了思必驰CMO龙梦竹女士,请她分享了自己的见解与看法。
思必驰CMO龙梦竹女士
思必驰CMO龙梦竹女士,负责思必驰语音技术在物联网领域(车载、家居、机器人)的市场渠道合作,专注智能语音技术在智能硬件市场的应用方向和前沿发展,擅长整合行业资源和市场需求分析对语音技术的运用领域和交互体验有非常深刻的理解。智能硬件物联网资深人士,知名的投资顾问和咨询专家,多次受邀参与T圈、创业邦、网易、机器之心等主办的专业论坛并做分享。
开放的定制语音平台
目前,市场上以智能音箱为代表的智能语音产品正呈现出一种井喷的态势,各种新产品层出不穷,而思必驰在此时推出全链路的智能对话定制平台——DUI,可说是恰逢其会。那么,DUI平台有怎么样独特的优势呢?
门罗公园原创漫画形象:思必驰龙梦竹
面对记者的提问,龙梦竹女士用六个关键词总结了DUI平台的优势:“全链路定制”、“开放心态”、“丰富的第三方资源”、“高可用匹配”、“以对话为核心”和“定制规模化”。龙女士谈到,通过思必驰多年的技术研发与积累,DUI平台能针对语音交互技术的不同环节提供个性化定制,让平台使用更加灵活与高效。同时,思必驰还秉承着开放的心态,通过与众多友商合作,极大的提升了平台功能和内容的深度与广度,由此也让DUI平台可以适配更多不同类型、不同平台的产品。除此之外,DUI平台还始终坚持以对话为核心,围绕着对话这一中心点,整合语音、文字、图形图像等多种控件,为用户提供更多样化的交互模式。
而在谈到“定制规模化”时,龙梦竹表示这一点是DUI平台最大的特色:“不同的客户和产品,可能会提出很多个性化的定制的需求,而现在行业主要的一个难点在于技术提供商的定制效率,和客户对产品个性化与版本迭代的速度是不吻合的,为了解决这个问题,我们会向客户提供完善的语音语言交互技术、技能服务和内容服务,把定制的过程交给客户自己去处理。这样一来,可以让产品迭代更加快捷、更具效率。”
龙梦竹告诉记者,目前思必驰正在和阿里巴巴、小米、联想等科技企业合作,天猫精灵X1、小米互联网音箱、“小爱同学”、联想智能音箱等多款产品都使用了思必驰的语音技术。
2017思必驰DUI开放平台发布会
技术要与市场及产品相结合
既然有了技术和平台,如何让才能让技术与市场、与使用场景、与产品进行良好的结合,更好的符合市场的需求呢?面对记者的疑问,龙梦竹分享了她的观点。在她看来,目前市场对语音交互技术的需求热点更多的集中在自然语言理解,但语音交互是一个环节众多的整体过程,要得到更好的自然语言理解效果,对语音的识别率,以及反馈时的语音合成都有较高的要求。这是一个整体性的问题,不应该分开来看,所以“我们才提出了‘定制规模化’这种办法。”通过各环节的定制,来满足不断变化的市场需求。
当然,要满足市场的需求,必须有相应的产品来对应市场中存在的使用场景。在龙梦竹看来,在大的方向上,目前有两个使用场景可以称为刚需,一是车载,二是家居。原因在于,首先这两个场景目前已经在逐渐被广大消费者所接受,对这两个场景中的语音交互也有比较明显的需求。其次是这两个场景在实际使用中产品可以有较强的通用性,所以这两个方向上的智能语音产品发展较快,已经推出了后视镜、车机、音箱、电视等多种类型的产品来满足消费者的需求。
思必驰办公区
智能语音产品会越来越好
目前,市场上已经出现了大量的带语音交互功能的AI产品,以Echo为例的智能音箱尤其火热,但是这些产品在使用体验上还不太完美。对此,龙梦竹认为这个问题应该辩证地看。首先,国内的智能语音产品起步较晚,尚不成熟,但Echo等产品已经经历了较长时间的迭代和升级,产品已经具备较高的成熟度。其次,国内的使用场景与国外都有较大的区别,同时在生态的开放性和内容源(例如音乐版权)上也有不同。再次,中文语音交互与英文语音交互相比,存在门槛高,技术难度更大等一些问题。“我们应该保持乐观的态度,随着产品不断迭代升级,使用体验肯定会越来越好。”龙梦竹如此说到。
天猫精灵X1
智能语音交互还有很长的路要走
在采访接近尾声的时候,门罗记者抛出了准备已久的问题:智能语音交互在逐渐成熟并落地的过程中,需要经历哪些阶段和难关呢?
面对的提问,龙梦竹谈到,技术从来没有完完全全的成熟,一旦一项技术完全成熟,它就将面临被更新的技术取代的命运。所以,具体到智能语音交互上,技术一直在进步、在成熟,之所以会出现一些问题,并不意味着技术本身存在很大问题,而在于从技术到产品再到与使用场景的结合上,还存在一些较大的难关。因为用户只能用产品作为评判标准,而产品本身的软硬件配置、内容的成熟度、与使用场景的契合能力、不同的用户群体,都会对用户评价造成巨大的影响。而从技术来看,不同的使用场景和用户群体对应的“点”各不相同,现在的技术还不能很好的应所有的“点”,所以可以这样总结:“在未来很长的一段时间内,智能语音交互一定是基于场景化的,而从单体智能到整体智能的路也还很长,大家还需要耐心等待。”
门罗点评
在采访的过程中,门罗记者发现龙梦竹女士对国内智能语音交互市场有着深入的认识和研究,对目前市场上存在的难点和发展态势也有自己独到的观点与看法。相信这些观点和看法能让大家更深入的了解国内智能语音交互市场,从而获得更多的收获与成长。
延伸阅读
苏州思必驰信息科技有限公司是致力于自然语言人机交互的移动互联网公司,专注于将领先的系列智能语音技术应用于移动互联、智能设备、客户联络中心等行业,拥有自主知识产权的人机对话、语音识别、语义理解、语音合成、声纹识别等综合语音技术,人机对话和语音识别性能处于业界领先水平。