blog

微软的语音识别软件现在是一个更好的倾听者

<p>尽管它具有潜在的广泛应用,但创建一种语音识别软件能够消除口语中的细微差别和变化,这一过程充满了不完整的成功</p><p>许多公司努力的目标是创建一个能够识别对话中的单词以及人类意志的软件 - 这是真正身临其境的人工智能体验的关键要素</p><p>在这项努力取得重大突破后,微软周二宣布,它已经创造了一项技术,使语音识别系统能够以与人类同行相同的错误率转录对话</p><p>微软首席演讲科学家黄学东在一份声明中说:“我们达到了人类平价</p><p>” “这是一项历史性的成就</p><p>”为了实现这一目标,微软的研究人员使用了一种名为Computational Network Toolkit的东西 - 一种可通过GitHub上的开源许可证获得的本土系统</p><p>该工具包能够跨多台计算机处理深度学习算法,再加上循环神经网络的优化,使微软团队能够实现人类平等</p><p>然而,值得注意的是,微软的语音识别系统并不完美,但后来也不是人类</p><p>正如该公司在声明中所解释的那样,该系统的单词错误率为5.9% - 与专业转录员相同,他们也设法错过他们听到的5.9%</p><p> “即使是五年前,我也不会想到我们能够做到这一点</p><p>我不会想到这是可能的,“微软人工智能和研究小组执行副总裁Harry Shum在声明中说</p><p>微软计划在Cortana中使用改进的技术 - 它是Windows和Xbox的个人语音助手</p><p> “这将使Cortana变得更强大,使真正的智能助手成为可能,”Shum补充道</p><p>该公司表示,下一步将是确保语音识别软件在真实环境中运行良好,其中存在大量背景噪音</p><p>最终,它旨在创建不仅可以转录语音,

查看所有