Facebook和杜比加入了亚马逊的语音互操作性计划

去年9月,亚马逊推出了语音互操作性计划,该计划旨在确保具有语音功能的产品(如智能扬声器和显示器)允许用户在多个语音助手中进行选择。今天,该公司宣布增加38个新成员,其中包括杜比,Facebook,Garmin和小米,使成员公司总数达到77个。(谷歌仍然明显不在名单中。)为了纪念这一里程碑,亚马逊发布了所谓的“Multi-Agent设计指南”,这是一份白皮书,概述了语音互操作性计划成员在构建多助手产品时应使用的设计建议。

语音互操作性倡议围绕四个核心原则进行组织,其中第一个原则是开发语音服务,该语音服务与其他人“无缝”协作,同时表面上保留隐私。(特别是在语音隐私方面,亚马逊的记录不尽人意,但该公司声称近几个月来取得了长足进步。)会员寻求构建可搭载多名助手的设备,以加快对话式AI研究的速度。目标是使用户能够在单个平台上利用Alexa,Cortana和其他服务提供的功能。

Facebook和杜比加入了亚马逊的语音互操作性计划

新发布的《 Multi-Agent设计指南》涵盖了三个关键主题领域,特别是(1)客户选择和代理调用,(2)多代理体验以及(3)隐私和安全性。它建议使用多助手产品来帮助客户探索助手的功能,并为座席转移和通用设备命令(UDC)提出建议,以解决用户不召唤另一位助手无法满足的用户请求。(UDC是任何助手都可以识别的命令,即使不使用助手来启动体验,例如音量和计时器控件。)

在具有代理转移和UDC的设备中,要求Alexa使用Google Duplex预订餐厅(Alexa无法访问的服务)可能会自动召唤Google Assistant,而要求Google Assistant停止计时器可能会影响Alexa启动的计时器。“设计指南中解释说:“在代理商转移期间,[用户]向无法直接履行其要求的代理商(代理商1)发出请求(例如“我不能那样做”)。“但是,如果代理1知道设备上的另一个代理(代理2)很可能会满足该请求,则代理1可以召集另一个代理来协助客户。在传输过程中,不会在代理之间传递任何数据或上下文,并且[用户]直接向代理2重复其请求,而无需说出唤醒字。”

除此之外,《 Multi-Agent设计指南》还建议并存代理通过视觉和声音提示传达至少三个核心注意力状态(听,思考或说)。它说,这种范例将使用户更容易查看正在收听哪些助手以及他们的状态何时改变。

在微软和亚马逊将Alexa和Cortana引入美国所有Echo扬声器和Windows 10用户的一年之后,语音互操作性计划的发起是在2017年微软首席执行官Satya Nadella和亚马逊首席执行官Jeff宣布首次公开宣布建立合作伙伴关系之后贝索斯。每个助手都为桌子带来了鲜明的特色。例如,Cortana可以安排使用Outlook召开会议或使用LinkedIn来向您介绍下一次会议的人员。亚马逊拥有超过100,000种语音应用程序,可以解决各种用例。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除。