Siri,你怎么就听不懂我说话?

[摘要]Siri在IPhone上发布不久,苏格兰人在网上抗议Siri无法识别他们的口音。一个月后,这些差评还在:上周还是收到Siri不能处理好南方口音的抱怨,印度口音也是。

Siri 现在还在和口音作斗争。什么时候,怎么样,这种情况才能有所好转?

很多时候人们都会因为有口音而伤自尊。最开始,很多生人都会说他们永远也听不懂你在讲什么。细数下来,在我们现代社会,正是由于那些有口音的人的无能为力促使了他们的语音识别技术的产生。Siri在IPhone上发布不久,苏格兰人在网上抗议Siri无法识别他们的口音。一个月后,这些差评还在:上周还是收到Siri不能处理好南方口音的抱怨,印度口音也是。

5670448620111210194605052 Siri,你怎么就听不懂我说话?

也有好消息,据一些专家说,Siri和其他的语音识别软件一定会在口音识别上做得更好。尽管口音的识别给语音识别带来了一定的困难,但研究还在继续,数据库存的不断增加表明Siri会随着时间不断改进。“所有的识别器都在逐年改进”,Siri也是如此,Dan Jurafsky,一名斯坦福语言和计算机专业教授,是这样跟Fast Company讲的。

语音识别软件是怎样准确识别口译的呢?通常,语音识别技术要先收集一种语言标准发音的大量数据。然后研究人员建立一个“字典”,把单词和发音联系起来,叫做”phones.” 一旦这个标准字典建立起来,Jurafsky说,有一个多步骤的过程来改善口音的问题:1)尽可能多的收集口音的发音;2)将大量的标准发音和少量的口音发音结合起来,然后3)给口音创建一个修正后的发音字典。然后会有最后两个步骤如果一个特殊用户和软件开始相互作用了:4)定义这个用户的口音,以及5)运用适应技术,讲你的模型转化成用户的口音。

看过一些苏格兰Siri不满者在YOUTUBE的视频后,Jurafsky说他怀疑“这个问题可能是由于那些口音发音太重的人的字典的原因引起的。”Jurafsky怀疑公司想要跳过上述五个步骤中的第三步:创建修正后的字典。尽管Apple公司拒绝对次发表评论,但Siri常见问题页中提供了一些含混的信息。一方面,它说“Siri运用语音识别算法把你的声音归类成它能识别的方言和语音。”另一方面它参考的似乎是独立统一的“英式”和“美式”英语—-这就为那个理论提供了证明,它可能没有深入的详尽的各个地区的口音发音字典。

可以确定Siri有在口音上做过努力收集数据,但是,毕竟Siri使用的的语音识别技术是Nuance公司提供的。(“对于我们和Apple的关系我们不能说太多,”Nuance公司的Peter Mahoney说,“我们只能说我们给Apple公司提供技术。”)在Nuance,这部分,采用了美国八种不同的常见的英语语言模型:东北、南方、中部、东南亚、印度、英国、西班牙,甚至还有“一个通用的童音模型”,都有应用到Nuance的产品Dragon NaturallySpeaking中,对个人电脑提供语音控制。

Siri的另一个特点让它在口音方面得到快速改善成为可能:它的云属性的手机。Nuance的Dargon Naturallyspeaking软件是依托在硬盘上的,这让它运行更快,但却限制了它获取数据的数据库。因此,Siri在不断的收集口音数据,不只是你一个人的,而是成百上千的和你口音相似的人的口音信息。“像Siri这样的云属性系统,这样的系统大部分都是自适应系统,”Mahoney说,“越多的人使用它,它就越智能。我们得到越来越多的口音信息,并可以从中提取更多精辟的关于口音的观点,因此它会随时间而越来越准确。”一个语音识别的新型领域的研究,用Mahoney的话说,就是“基本创新方法就在于更多的使用和更庞大的数库。”

数据不是存在于真空中的,可是,Mahoney和Jurafsky说:研究人员的贡献和心得是需要不断利用这些数据使技术得到不断的改进。但是在口音的问题上有很多分岔,恐怕要拿到博士学位才会开始了解吧:Nuance发言人Rebecca Paquette说“每个认知和理解方面的问题:特征提取,统计声学建模,发音建模,语言建模,语法和语义分析,会话管理,以及其他”都在研究中。

问及一篇他参与调查的关于上海普通话的论文(PDF格式),Jurafsky说“要我说,它没有改变世界。”但他所倡导的一种技术–区分每个人说话声音的口音而不是所有这种口音的信息–带来了快速的改善。这并不是一个“革命性的突破”,Jurafsky说,但相当于“这里能将误差减半,那里也能将误差减半。”拥有很多的小成功,你就可以开发出一款测试性产品;拥有足够的小成功,你就能满足最挑剔的客户的需要。

不过,目前为止,苏格兰人也只是想用语音识别来完成一些非关键性任务。甚至在Siri发布之前,苏格兰喜剧组合Connell 和Florence 就认为依靠Siri 这样的技术是不明智的,例如电梯。




免责声明:

本站系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系, 来信: liujun@soft6.com 我们将在收到邮件后第一时间删除内容!

[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权。