随着电子技术的迅速发展,家用电器及其他电子产品日趋人性化。为了实现语音处理和语音控制,这里设计了基于凌阳单片机的通用型语音控制系统。该系统主要用来完成语音识别、语音控制和语音播放等综合功能,使家用电器及其他电子产品实现语音的自动控制。目前国内还没有此类设计方案。该方案主要分为语音识别模块设计、语音播放模块设计和语音控制模块设计,只采用单片芯片就可实现语音处理和控制功能。此外,通过对一整套图形化的通用型语音集成软件进行开发,可使用户只需要输入语音素材的有关参数,即可实现代码的自动生成。下面介绍通用型语音控制系统的设计方案。
1 通用型语音控制系统设计方案
图1给出通用型语音控制系统方框图。
语音识别模块的主要作用是完成语音辨识,本设计采用特定发音人识别模式。语音识别功能采用语音识别电路,并通过软件编程来实现。语音播放模块的主要作用是完成语音播放。语音播放功能采用语音播放电路,并通过软件编程来实现。语音控制模块的主要作用是使语音识别和语音播放实现自动控制。语音控制功能采用语音控制电路,并通过软件编程来实现。主控制器部分的主要作用是将语音控制系统嵌入到家电产品及其他电子产品中后,使电子产品的所有功能实现语音的自动控制。
1. 1 凌阳单片机SPCE061A简介
SPCE
1.2 通用型语音集成软件
开发了一套通用型语音集成软件,用户无需进行代码修改,只需要输入语音素材的相关参数,即可实现代码的自动生成。如图2所示,是通用型语音集成软件vO.1版的操作界面。
2 语音播放模块设计
语音处理大致可以分为A/D、编码处理、存储、解码处理以及D/A等。然而,麦克风输入所生成的WAVE文件,其占用的存储空间很大,对于单片机来说想要存储大量的信息显然是不可能的,而凌阳SPCE
3 语音识别模块设计
3.1 语音识别原理
语音识别系统包括学习训练过程和识别过程2大部分,基本原理如图3所示。
(1)预处理。包括预加重、加窗分帧、端点检测等处理过程,在预处理之前还有语音信号的数字化处理过程。其中,包括反混叠滤波、模/数转换自动增益等用以去除声门激励、口鼻辐射、高于1/2采样率的高频信号和噪声信号的影响,以实现语音信号的数字化。
(2)声学特征分析提取。经过预处理后的语音信号,要对其进行特征提取,即特征参数分析。该过程就是从原始语音信号中抽取能够反映语音本质的特征参数,以形成特征矢量序列。目前语音识别所用的特征参数主要有2种类型:线性预测倒谱系数(LPCC)和美尔频标倒谱系数(MFCC)。LPCC系数主要是模拟人的发声模型,未考虑人耳的听觉特性。MFCC系数考虑到了人的听觉特性,但要计算傅里叶变换将耗费大量宝贵的计算资源。因此,在嵌入式语音识别系统中一般都选用LPCC系数。语音特征提取是分帧提取的,每帧特征参数一般构成一个矢量。为此,有必要采用很有效的数据压缩技术方法对数据进行压缩。
(3)参考模板。参考模版时将一个或多个说话者多次重复的语音参数经过训练得到,它是声学参数模版,在系统识别使用前获得并存储起来。
(4)判定识别。模式识别是将输入的待识别语音特征参数与训练得到的参考语音模式进行逐一比较分析,获得的最佳匹配参考模式便为识别结果。目前常用的语音识别算法主要有动态时间规则、离散隐马尔可夫模型、连续隐马尔可夫模型及人工神经网。