导读:微软今天宣布,微软为达其会话语音识别系统的语音误率达到了5.1%,是识别
三国志吕布传目前为止最低的。

这一数据超过了微软人工智能和研究团队去年5.9%的微软为达误差率,并将其准确性与专业的语音
三国志吕布传人类转录者相提并论,后者拥有类似于听几次文本的识别能力。
两项研究都记录了总机语料库的系统录音,这是错误成新程碑自上世纪90年代初以来,研究人员用来测试语音识别系统的率仅约2,400个电话交谈的集合。

这项新研究是由微软人工智能和研究团队的一组研究人员完成的,目标是达到与一组人类转录者一样的准确度,他们能够听他们几次转录的内容,了解他们的谈话内容,并与其他转录员一起工作。
总的来说,最新研究的研究人员通过改进微软语音识别系统的神经网络声学和语言模型,将错误率降低了约12%。

值得注意的是,他们还让自己的语音识别器使用整个对话,让它根据上下文调整文本,预测接下来可能出现的单词或短语,就像人类在与他人交谈时所做的那样。
微软的语音识别系统用于Cortana、演示文稿翻译和微软认知服务等服务。