不论是布拉格还是北京,伦敦还是利马,华沙或者武汉,如果您想订一件舒适的客房,最简单的办法就是登陆我们的欧洲猎珍。欧洲猎珍和柏林酒店预定系统公司ehotel达成合作,为读者提供便捷,高效的预定服务...
来自莱比锡认知及神经科学马普所和伦敦大学学院威尔康姆神经成像中心的科学家们建立的一套数学模型能够明显地改善机械设备对有声语言的感知和处理能力。该模型以人脑的语音识别体制为榜样。与此前出现的语音识别软件不同的是,新的研究成果不仅以音频特征作为参照对象,更加会针对时间次序对语音进行分析。
大脑把信号分类
在像我们今天经常使用的热线电话这样的自动语音系统中,语音识别通常很容易失败。过快或者过慢的语速、杂音或者使用者的方言都会加大语音识别系统的工作难度。项目参与者Stefan Kiebel说:“我们在对环境的感知过程中,很多刺激都可以说来自时间顺序。”他介绍说,我们所讲的语言与音乐一样,都是建立在彼此基础上的,有级别关系的段落组成的。科学家认为,人类的大脑会把不同的信号分类。而这里指的信号既包括会快速发生变化的小信号,例如单个的声音和音节,也包括变化缓慢的信息,例如话题。
语言被简化
专家解释说:“我们的大脑在不停地寻找环境中的时间结构,以便从中推导出下一步会发生什么。”通过这种方式,人脑就能利用像话题这样变化缓慢的信息预测出下面的音节和单词。而莱比锡的科学家们建立的模型也具有这种功能。只不过在利用软件对数学模型进行全方位测试的时候,这种“语言”被简化了——它只由四个元音组成。Kiebel表示:“第一步重要的是,检验这种原则性的假设是否成立。”
与大脑的流程相同
以后人们还可以把辅音加入其中,并且在音节和声音之外为单词和句子装入其他的等级层次。这样一来,这个模型就可以被用于识别自然语言。Kiebel表示:“对于神经专家来说最重要的是,该软件的反应方式与我们能在真正的人脑中观察到的方式相似。”这也表明,这个模型真正符合大脑中的工作流程 ,并且将对机械语音识别领域的进一步发展有所帮助。
图片:pixelio/marika k.
出处:Pressetext