语音识别技术属于多维模式识别和智能计算机接口的范畴,其实现过程是在计算机或嵌入式设备中首先建立特定人、特定词的语音特征库,然后将人的语音控制数据和特征库相匹配,即把人类的语音信号转变为相应的文本或命令的技术。目前在PDA、智能手机、智能家电、工业现场、智能机器人等方面,语音识别技术都有着广阔的应用前景。
常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)等。DTW是较早的一种模式匹配和模型训练技术,它应用动态规划的思想成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。
虽然HMM模型和ANN在连续语音大词汇量语音识别系统优于DTW,但由于DTW算法计算量较少、无需前期的长期训练,也很容易将DTW算法移植到嵌入式设备上实现,而且能满足实时性要求,故其在孤立词语音识别系统中仍然得到了广泛的应用。
将语音识别技术在嵌入式手持设备上进行编程实现,并搭建相应软硬件平台,将该技术应用于远程电源控制系统,达到远程遥控电源设备开关的目的。
通过语音控制远程设备是未来智能设备的基本要求,越来越多的解决方案在不断被提出和验证。本文先从理论上研究了语音识别技术,并详细探讨在嵌入式平台上如何编程实现,最后构建实验验证平台,验证了系统的稳定性和可靠性。