研究人员声称掩盖马弗语音 但不足以阻碍语音识别

包括美国疾病控制与预防中心,世界卫生组织和英国国家卫生局在内的卫生组织主张戴口罩以防止感染的传播。但是,遮罩会削弱语音,这会影响语音识别系统(如Google Assistant,Alexa和Siri)的准确性。为了量化面罩材料对声学的影响程度,伊利诺伊大学的研究人员进行了一项研究,总共检查了12种不同类型的面罩。他们发现,透明口罩与医用口罩和布口罩相比,声学效果最差,但是大多数口罩对翻领麦克风的影响很小,这表明现有系统也许能够毫无问题地识别出闷声。

虽然可以很直观地认为,蒙版变形的语音对语音识别具有挑战性,但到目前为止,证据还很复杂。教育测试服务(ETS)发布的研究得出的结论是,尽管口罩佩戴者的录音与英语水平考试中不戴着口罩的录音之间存在差异,但这种失真并未导致自动考试评分出现“显着”变化。在另一项研究中,昆山杜克大学,联想大学和武汉大学的科学家发现,可以对AI系统进行训练,以从人声低沉的声音中检测出某人是否戴着口罩。

研究人员声称掩盖马弗语音 但不足以阻碍语音识别

谷歌发言人告诉VentureBeat,自大流行开始以来,戴口罩变得越来越普遍,对公司的语音识别系统没有产生可衡量的影响。亚马逊还表示,它还没有观察到与戴着口罩有关的语音识别准确性的变化。

伊利诺伊大学的研究人员研究了聚丙烯外科口罩,N95和KN95呼吸器,六个由不同织物制成的布口罩,两个带有透明窗户的布口罩以及一个塑料屏蔽罩的声学效果。他们在一个“经过声学处理”的实验室中使用头形扬声器和一名人类志愿者进行了测量,他们俩都在他们的翻领,脸颊,额头和嘴上和附近放置了麦克风。(由胶合板制成的头形扬声器使用了一个两英寸的驱动器,其模式接近于人类扬声器。)

在没有面罩的情况下进行测量以建立基线后,研究人员将扬声器放在转盘上并旋转以捕获测试面罩的各种角度。然后,对于每个口罩,他们让志愿者以恒定的音量以三个30秒的增量发言。

结果表明,大多数面罩在1kHz以下的频率下具有“很小的作用”,但在较高的频率下具有不同程度的消音效果。手术口罩和KN95呼吸器的峰值衰减约为4dB,而N95的高频衰减约为6dB。至于布料口罩,材料和编织是关键变量-100%棉质口罩的声学性能最佳,而由紧密编织的牛仔布和床单制成的口罩性能最差。透明遮罩在高频下被阻挡在8dB至14dB之间,是迄今为止最差的。

对于所有测试过的面罩,声音衰减在前面最强。研究人员在一篇论文中描述了他们的工作。研究人员在一篇论文中描述了他们的工作。这些结果表明,面具可能会将声能偏转到侧面,而不是吸收声能。因此,可以使用放置在面罩侧面的麦克风来增强声音。”

研究人员建议避免使用棉氨纶口罩来获得最清晰明快的语音,但他们指出,翻领麦克风捕获的录音显示出“小”和“均匀”的衰减,即识别系统可以轻松校正的那种衰减。例如,亚马逊最近推出了Alexa的“耳语模式”,该模式利用经过专业语音录音库训练的AI来通过耳语来回应耳语(即低分贝)的语音。亚马逊发言人没有透露是否使用Whisper Mode来提高掩盖语音的性能,但他们告诉VentureBeat,当Alexa语音识别系统的信噪比由于客户戴着口罩而降低时,工程团队能够解决通过积极的学习渠道使信心发生波动。

无论如何,假设伊利诺伊大学的研究结果可以接受同行评审,那么它们对于智能扬声器,智能显示器和其他由语音驱动的智能设备来说是一个好兆头。下次您举起手机来召唤Siri时,您不必抛弃面具。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除。