门罗专访|智慧生活,说说就有——方得智能CEO彭黔平

门罗专访|智慧生活,说说就有——方得智能CEO彭黔平

随着智能语音技术的不断发展,它已被广泛应用于人工智能相关的各个领域中。去年,智能音箱界更是掀起了“百箱大战”。那么又经过了近一年的时间,智能语音在真实应用场景中的落地与发展又是怎样?近日,门罗公园拜访了一家专注于智能语音交互技术与产品研发的企业——杭州方得智能科技有限公司,并对其CEO彭黔平先生进行了专访,请他就智能语音产品与技术等进行一次分享。

门罗公园(Menlo Park)

门罗公园是门罗机器人科技旗下的新媒体平台,专注于人工智能与机器人,围绕AI+Robot产业提供着专业的媒体服务,并为读者带来最新最潮的人工智能及机器人资讯。

方得智能CEO彭黔平先生

门罗公园原创漫画形像:方得智能CEO彭黔平先生

门罗公园:彭总,您好!据我们了解,方得智能正准备发布一款智能音箱——爱芽智家。请问与市场上众多的智能音箱相比,它有哪些特色?

彭黔平:您好!是这样的,“爱芽智家”是业内第一个以多轮交互为主要交互形式的智能音箱,可为消费者提供家居控制、娱乐、出行、购物和跨场景应用等服务。该音箱有轻交互、轻享受、轻改造和轻智能四个特色。

在轻交互方面,它可以方便快捷地满足用户需求,如减少唤醒次数和一次性完成多个任务等。在轻享受方面,“爱芽智家”依托我们自有的多轮对话技术,以多轮交互的形式为消费者提供诸如语音叫车、语音买票等服务。而依托轻改造的特色,它具备全屋智能的消费级解决方案。用户只需要安装LifeSmart和BroadLink等厂商的智能硬件后,它就能全方位智能升级居住空间,让消费者的生活更便利……

“爱芽智家”智能音箱

门罗公园:在这款智能音箱的特色背后,有什么样的技术平台在做支撑?

彭黔平:首先,这款产品的核心技术是“爱芽智能助理”(又称为“FitME个人智能助理”)云平台智能助理引擎。它承担着在不同终端、不同场景及时满足每个人个性化需求的重任。其角色定位是每个人都可以拥有的高效率工具。

其次,支持“爱芽智能助理”的是我们的“爱芽故事线开放平台”。它是“爱芽智能助理”的技能开发平台和运营平台,是目前国内唯一一个可以同时支持多轮对话交互设计、主动服务设计和复杂任务流设计等多种场景类型的功能平台。在今年年中,该平台将面向广大的开发者及合作伙伴开放,使大家对于智能助理的各种创意都能够快速地变现。

另外,我们基于“爱芽智能助理”这款云平台智能助理引擎,还推出了手机端的APP。这款APP不仅仅是相关智能硬件的管理和配置中心,还是“爱芽智家”音箱的显示中枢和支付中枢。

门罗公园梳理:产品与后台技术的关系图

门罗公园:那你们是如何打造核心技术——“爱芽智能助理” 的?有什么优势支撑其研发团队完成了这款智能音箱?

彭黔平:我们认为助理包括“帮助”和“打理”两个层面的意思,所以我们对于个人智能助理的理解是:它是一个为用户提供极致管家式服务的效率工具。这就要求智能助理不仅仅可以语音控制、语音搜索和聊天,更为重要的是要能够感知用户、懂用户,随时随地主动或被动地给用户提供个性化的贴心服务。能够帮助人们提升处理日常事务的效率,让人们生活得更轻松,这才是智能助理的真正价值。所以我们一直在个性化、自主学习、智能场景联动和主动感知等方面持续发力,尽力为用户打造完美的智能助理产品。

同时,“爱芽智家”的研发团队具有坚实的自然语言理解和深度学习的技术实力。他们摆脱了传统的对话系统Pipeline式的处理工作流,取而代之的是采用全套端到端的神经网络引擎,来高效地让机器学习任务型多轮对话,以及处理序列化的多模输入。这些能力使这款智能音箱在任务多轮交互的可用性上,相对于其他同类产品有明显的优势。

方得智能团队

门罗公园:听您解读了贵公司的产品、技术及团队后,我们很想知道它是如何为硬件厂商开展ODM/OEM服务的?在行业中具有哪些竞争优势?

彭黔平:基于研发的产品以及研发经验,我们为硬件厂商提供包括智能助理引擎、技能接入和硬件产品等一站式的解决方案。同时,由于智能助理系统的复杂性,我们还为客户提供智能助理代运营的服务。

凭借“爱芽故事线开放平台”,我们已经显著降低了具有业务价值的深度功能的研发周期和研发成本。譬如我们已经将诸如预订火车票这样复杂的多轮交互功能的开发成本降低到了仅需5万元左右。我们的技术体系和成果在性价比、功能深度、功能多样性,以及功能开发难易程度等方面,较现有的一些平台更具竞争优势。

定制化服务

门罗公园:方得智能致力于智能语音技术的研发,那您认为目前的自然语言理解技术处于什么样的阶段?而方得智能语音交互平台的特色又是什么?

彭黔平:我认为目前的自然语言理解技术还处在早期阶段。人与人的高效交流依赖于大量的知识、共识、目标、妥协以及多感官的情景洞察和逻辑把握等。但是当前的自然语言理解技术还停留在槽值的抽取和意图的分类。在用深度学习研发自然语言理解技术时,还没有一种高效可靠的方法可以把上述特征有效地加入进去,这也就导致了机器暂时还无法精准地理解用户的表达和行为。

方得智能的语音交互技术主打多轮交互、多模输入以及序列化决策。现阶段重点关注的是多任务场景下交互的逻辑性,以及任务的完成度。在这样的目标下,我们的语音交互技术还要保障交互的流畅性,所以我们抛弃了传统的Pipeline的处理方式,进而选择了利用海量数据端到端地训练机器去掌握这些不同业务的场景逻辑和对话流程。同时,机器采用了多任务学习的方式进行学习,从而使机器能够自主把握动态的主题切换、主题漂移以及任务之间的关联关系。这样的语音交互平台极大地简化了传统多轮对话技能开发的复杂度,是对传统多轮系统的一种颠覆。

方得智能办公场景

门罗公园:您对目前智能语音在真实应用场景中的落地与发展有哪些看法?

彭黔平:我认为如果智能语音仅仅完成控制、搜索和聊天等非必要性的简单任务,那么从2017年就热闹起来的智能音箱风潮接下来就可能会遭遇滑铁卢。所以2018年将会是各家智能语音产品的价值再发现年,具体体现在技能的深度、实用性以及智能化水平。在真实的应用场景中,越来越多的品质消费者一定会为他们的时间和体验买单,所以从信息传输速率的角度来考虑,如何在并不高效的语音交互中协助用户高效地满足需求,是各家产品竞争的重中之重。以客厅场景为例,当我对智能音箱说我想看今天的新闻联播时,除了它自己,是否还能与电视等进行联动播放也很重要。

所以在真实的应用场景中,智能语音只是交互媒介之一,智能音箱或智能助理真正的生命力来自于背后的实时感知、数据融合、场景联动以及决策辅助。这些才是给用户生活带来显著改善的东西。最后,感谢门罗公园的采访,也感谢大家能倾听我的分享,谢谢!

场景落地示例

门罗观点:

方得智能在智能语音领域中有着自己明确的主攻方向,而旗下的产品覆盖了B端企业和C端消费者,其核心产品智能助理也正逐渐切入人们的家居生活。我们有理由相信,在彭黔平先生及其团队的共同努力下,方得智能将为大家带来一种说说就有的智慧生活。

精彩预告:

“爱芽智家”将于今年四月上市。门罗机器人评测实验室即将对它展开评测工作。敬请各位读者和厂商合作伙伴关注,谢谢!

延伸阅读:

杭州方得智能科技有限公司成立于2015年,主要经营面向个人用户的智能助理服务研发和运营,以及生产和销售搭载智能助理的智能硬件产品。公司总部位于杭州青山湖科技城,并在杭州梦想小镇设有运营中心。目标是研制能够显著提高生活智能化水平的智能助理产品,并最终使通用人工智能驱动的“美好生活,说说就有”成为可能。

相关领域
人物