Nvidia研究人员详细介绍了AI驱动的临床语音转录系统

在今年几乎举行的2020年医学成像机器智能会议上,Nvidia的研究人员发表了一篇论文,描述了捕获和转录临床患者语音的AI系统。该系统可以识别临床单词并将单词映射到标准化的健康数据库中,研究人员说,这项任务可以减轻临床医生在与大流行相关的过度劳累中的压力。

合著者建议远程医疗是该系统的一种潜在用途,在冠状病毒大流行期间,该领域已出现了前所未有的需求。根据弗若斯特(Frost)和沙利文(Sullivan)的研究,3月份虚拟健康咨询增加了50%,今年的一般在线医疗访问量有望达到2亿。

Nvidia研究人员详细介绍了AI驱动的临床语音转录系统

研究人员系统的核心是基于BERT的语言模型,该模型以自我监督的方式在文本数据集上进行了预训练。(自我监督式学习是一种训练模型以执行任务而无需提供标记数据的方法。)Bio-Megatron,具有3.45亿个参数的模型(模型内部的配置变量),是从PubMed提取的61亿个单词中提取并学习的模式,搜索生命科学主题摘要的搜索引擎。

经过预训练后,该模型在由前美国国立卫生研究院(NIH)资助的国家生物医学计算中心协议创建的临床自然语言处理数据集上进行了微调。然后,它被合并到自动语音识别组件中,该组件执行单词识别并根据统一医学语言系统(UMLS)中的概念检查单词,该语言由NIH国家医学图书馆开发。

在Nvidia V100和T4显卡上运行的实验中,研究人员报告说,考虑到精度和召回率,Bio-Megatron在处理1毫秒后达到了92.05%的精度。他们写道:“这在对患者,临床医生和研究人员的响应至关重要的系统中打开了重要的新功能……可以从临床对话中提取和关联关键临床概念的自动语音识别模型非常有用。”“我们希望我们的贡献将有助于实现更快更好的患者反应,最终改善患者的护理。”

在微软合著者提出了一种称为“PubMedBERT”的“最先进”生物医学语言模型之后,Nvidia对研究界做出了贡献。他们声称他们在包括命名实体识别,基于证据的医学信息提取,文档分类等任务上管理了行业领先的结果。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除。