前言:声音识别的迅速发展以及高效可靠的应用软件的开发,使声音识别系统在很多方面得到了应用、这种系统可以用声音指令拟应用特定短句实现“不用手”的数据采集、其最大特点就是不用手和眼睛,这对那些采集数据同时还要完成手脚并用的工作场合尤为适用。由于每个人的声音千差万别,因此声音可以用作安全认证的依据之一。
别人可以模仿你的签字,猜测你的密码,甚至能留下你的指纹,但要模仿你的声音就有点太苛刻了。美国的一座智能化大厦就采用了声音识别的方式。到达公司门口,你必须通过安全检查。电子声控门卫将问候“早上好!”你也该回答“你好!”或“早上好!”之类的礼貌用语。此时电子门卫通过你的声音来辨别你是不是该公司的工作人员,如果确认你是,它将主动为您打开门,但如果不是,电子门卫将客气地将你“拒之门外”。
如果你视力不好或行走不便,声控设备也可助一臂之力。比如,你可以通过说话控制洗衣机、电视机、电脑等设备。让它们执行开启、关闭等简单的任务。装有声控设备的电脑还能为你朗读新收到的电子邮件,告诉你最新的消息。荷兰飞利浦公司还研制出了一种新型音响设备,如果你想听音乐,不用走到音响前找按钮,也用不着遥控器,目口使你在厨房,只要喊一声“开始放音乐吧!”远在客厅的音响就能自动开启,再说出歌曲的名字,音响就能在几秒钟之内找到这首歌自动播放。更为神奇的是,如果你想不起来歌曲的名字,只要哼几句歌曲的旋律,音响就能辨别出是哪首歌,然后播放给你听。
在2003年9月的CeBIT大展上,SONY亮出了他们QRIO家庭娱乐机器人。为强化对话功能,这款机器人配备了专门用于声音识别与声音合成的CPU。这样,在原机型“SDR-4X”中通过外部PC实现的大词汇量连续声音识别可以由机器人独立完成。机器人可使用的词汇量约2万条。为扩展记忆对话功能,不仅能记住对话者的面部与姓名,还能记住对话者在对话寸使用的单词。因此,当新款机器人与同一个人第二次碰面寸,不仅能认出对方是谁,还能想起过去的对话内容。这样就能对曾经遇到过的人“产生一定的感情”,原型号的机器人只能想起面部与姓名。
美国中央情报局一直在秘密开发“声音自动处理系统”,并用“经典故事”来命名代替。这是一种可以“实寸自动鉴别语言、说话人和武器平台”的系统,这种系统不需要人工的介入,也不管说话人的语言是什么,即可以通过语音识别技术确认该人的身份,并锁定他说话时所在的地理位置。
每个人的声音束、嘴型、喉咙、鼻道以及发音肌肉都各不相同,这些有差异的物理特性,决定了每个人声音的独一性。声音识别也是一种非接触的识别技术,用户可以很自然地接受。但声音识别和其他的行为识别技术一样,声音因为变化的范围太大,故而很难进行一些精确的匹配;声音会随着音量、速度和音质的变化(例如当你感冒时)而影响到采集与比对的结果。为此,近年来美国中情局在识别声音时还采用了声纹技术,将声音信号以时间、频率及振幅的形式显示出来,极大地提高了识别效率。