Alexa将很快获得听起来更自然的语音 并会识别多人讲话的时间

今天,在几乎首次举行的年度9月硬件活动中,亚马逊宣布了其Alexa开发人员工具和框架产品组合的更新。这些功能与Alexa的一系列新功能同时出现,其中包括Reading Sidekick,该功能使Alexa可以与孩子们一起读书。同时宣布的还有用于儿童的Alexa语音配置文件,它可以自动识别儿童的语音并切换到儿童友好模式,并改进了Alexa的会话和家庭监视功能。

流行病使语音平台的使用量增加了,这种情况已经在上升。根据NPR和Edison Research的一项研究,从2020年初到4月初,每天至少使用一次命令的启用语音的设备所有者的百分比上升了。略超过三分之一的智能扬声器所有者表示,他们从设备上收听音乐,娱乐和新闻的声音比以前更多,所有者报告称,今年他们的助手平均每周请求10.8项任务,而2019年则为9.4项任务。

Alexa将很快获得听起来更自然的语音 并会识别多人讲话的时间

从接下来的几周开始,亚马逊表示Alexa将询问用户问题,以帮助助手更好地理解他们的意思。例如,Alexa将能够记住“爸爸的阅读模式”是指将客厅的灯光设置为60%的亮度并打开空调。它针对个人客户进行了个性化设置,亚马逊表示,它将在扩展到其他领域之前,先从智能家居概念和行动开始。

基于亚马逊在神经文本语音转换技术方面的进步,Alexa很快还将能够根据来回对话的上下文来改变语调。Alexa副总裁兼首席科学家Rohit Prasad表示,从接下来的几个月开始,助理将强调某些单词,甚至插入停顿和呼吸。

自然转弯

同时,即将在2018年推出的后续模式的增强功能将使多个人可以加入与Alexa的对话,而不必每次说话都使用唤醒词。这被称为自然转向— Alexa将利用听觉,语言甚至视觉提示来确定是否针对请求进行定向,Prasad说。

三种AI模型与动力自然转向功能并行运行,该功能最初仅在明年某个时间推出时才以英语提供。一个可以将背景语音和噪声与用于Alexa的命令区分开。第二种方法是使用语音识别功能将语音转换为文本,以便可以在子单词级别进行分析。至于第三个,它使用来自设备摄像机的信号(如果有的话)来决定所讲的内容是否直接指向设备。

“对于带有摄像头的[Echo]设备,该摄像头可用于检测您所看位置的姿势-无论您是在看着其他人还是在朝Alexa设备看,” Prasad在电话采访中告诉VentureBeat。他指出,Natural Turn Take建立在Alexa Conversations的基础上,Alexa Conversations是今年早些时候在Beta版中推出的功能,可为开发人员提供基于深度学习的方式来创建自然感觉的应用程序。“视频和语音在本地进行处理,然后使用[神经网络]融合并确定您的语音是否用于Alexa。”

需要明确的是,自然转弯不需要配备摄像头的设备-它也可以在没有摄像头的设备上使用。但是如果没有亚马逊的AZ1神经边缘芯片,它可能不支持较旧的设备,普拉萨德表示,在带摄像头的设备上它将更加准确。

声音检测和Alexa Guard

Alexa的声音检测功能也在不断扩展,可以识别婴儿哭泣,吠叫和打呼sound等声音。今年晚些时候,客户将可以选择设置例程,这些例程可以在Alexa检测到其中一种声音时启动。

亚马逊表示,自推出以来,已有超过200万的客户选择了Alexa Guard,并且该公司预计至少会有一部分用户加入Alexa Guard Plus,这是一种新的高级产品。每月只需​​支付4.99美元,Alexa Guard Plus即可添加对脚步声,门关闭和打开等声音的检测,以及可通过紧急热线进行的24/7监控。

一项名为Alexa Care Hub的免费功能可让客户与家人添加“高级”关系,以获取活动提要,该提要显示他们与智能家居设备进行交互时的情况。亚马逊将其视为一种检查那些有流动性和健康问题的人的方法;亚马逊智能家居副总裁丹尼尔·劳斯(Daniel Rausch)表示,Alexa现在与14万种产品兼容,并且客户已经设置了超过1亿个设备与Alexa配合使用。

新的Alexa命令使用户可以快速删除Alexa曾经记录的所有内容。说“ Alexa,删除我曾经说过的所有内容”将删除与亚马逊帐户关联的所有语音片段,亚马逊通常保留这些片段以提高Alexa各种系统的性能。除此之外,Alexa现在支持与最多八个朋友或家庭成员进行群组音频和视频通话;Zoom和Amazon Chime电话;通过命令“ Alexa,分享这首歌”通过Echo设备进行音乐分享。

这些新工具和功能紧随7月份在亚马逊的Alexa Live活动中推出的其他工具和功能之后而来。该公司在那里推出了深度神经网络,旨在使Alexa自然语言对自定义应用程序的理解更加准确,以及一个API,该API允许使用网络技术为特定的Alexa设备构建游戏应用程序。亚马逊还在Beta版中推出了Alexa Conversations,这是一种基于深度学习的方法,可帮助开发人员使用更少的代码行创建更多自然的应用程序。它在预览中首次推出一项新服务-Alexa for Apps-使Alexa应用程序可以触发诸如在智能手机应用程序中进行搜索之类的操作。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除。