dsp语音信号处理

2025-04-23 版权声明 我要投稿

dsp语音信号处理(精选7篇)

dsp语音信号处理 篇1

第一章 绪

论.........................................................................................................1

1.1课程设计的目的及意义..................................................................................1 1.2设计要求..........................................................................................................1 1.3 研究内容.........................................................................................................1

第二章 语音信号处理理论基础........................................................................3

第三章

系统方案论证.....................................................................................5 第四章

GUI设计实现.....................................................................................6

4.1 图形用户界面概念.........................................................................................6 4.2用户界面设计..................................................................................................6

4.2.1 GUI设计模板........................................................................................6 4.2.2 GUI设计窗口........................................................................................6 4.2.3 GUI设计窗口的基本操作....................................................................6 4.2.4 语音的录入与打开................................................................................9 4.3课程设计的软件实现....................................................................................9

4.3.1语音信号的短时谱.................................................................................9 4.3.2 自相关方法估计语音信号的声道参数..............................................10 4.3.3 基音周期检测......................................................................................12 4.4 GUI实验箱操作界面设计............................................................................14 第五章 心得体会..................................................................................................15 参考文献...................................................................................................................16

语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科,是一门新型的学科,是在多门学科基础上发展起来的综合性技术,它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉,它是“语言语音学”与“数字信号处理”两个学科相结合的产物。

语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天,传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧,功耗低的数字化语音存储与回放系统,可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。

本文提出了语音信号处理课程建设的实验环节中的一些考虑,作为专业课程的学习,实验内容不能仅仅停留在验证性实验上,还应增加实验延伸的设计要求,是学生加深对理论分析认识的同时,强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现,不仅易于语音信号处理的实现,更易引导学生完成实验延伸的设计。

第一章 绪

1.1课程设计的目的及意义

在我们的现实生活中从磁带、录像带到CD、VCD、DVD;从黑白电视机、彩色电视机、高清晰度电视机到具有数字信号处理功能的电视机;从留声机、录音机到语音信箱;现在正出在模拟信息到数字信息的变革之中,传统的磁带语音录放系统因其体积大,使用不便,在电子与信息处理的使用中受到许多限制。

虽然,目前广播电视系统尚未实现真正的数字化,相信在不久的将来,真正的数字电视、数字收音机、数字收录机将进入家庭。所以,研究音频信号的数字化存储、处理和回放系统有着很重要的现实意义。

通过设计语音信号实验箱可以对语音信号实现各种形式的变换,因此学会对语音信号的处理,也可自行研究将此语音处理技术应用到现实生活中。

语音信号处理的一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段,通过语言相互传递信息是人类最重要的基本功能之一,语音是人类特有的功能,它是创造和记载几千年来人类文明史的根本手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域刚也涉及面很广的交叉学科。

1.2设计要求

(1)学会MATLAB的使用,掌握MATLAB的程序设计方法;(2)掌握在windows环境下语音信号的采集方法;(3)掌握数字信号处理的基本概念,基本理论和基本方法;(4)掌握MATLAB设计方法;

(5)学会用MATLAB对信号进行分析和处理。

1.3 研究内容

1.理论依据

根据设计要求分析系统功能,掌握设计中所需理论(采样频率、采样位数的

概念,采样定理; 时域信号的FFT分析;数字滤波器设计原理和方法,各种不同类型滤波器的性能比较),阐明设计原理。2.信号采集

采集语音信号,并对其进行FFT频谱分析,画出信号的时域波形图和频谱图。3.构造受干扰信号并对其进行FFT频谱分析

对所采集的语音信号加入干扰噪声,对语音信号进行回放,感觉加噪前后声音的变化,分析原因,得出结论。并对其进行FFT频谱分析,比较加噪前后语音信号的波形及频谱,对所得结果进行分析,阐明原因,得出结论。4.数字滤波器设计

根据待处理信号特点,设计合适数字滤波器,绘制所设计滤波器的幅频和相频特性。5.信号处理

用所设计的滤波器对含噪语音信号进行滤波。对滤波后的语音信号进行FFT频谱分析。画出处理过程中所得各种波形及频谱图。

对语音信号进行回放,感觉滤波前后声音的变化。比较滤波前后语音信号的波形及频谱,对所得结果和滤波器性能进行频谱分析,阐明原因,得出结论。6.设计图形用户界面

设计处理系统的用户界面,在所设计的系统界面上可以选择滤波器的参数,显示滤波器的频率响应,选择信号等。

第二章 语音信号处理理论基础

语音采集原理是,人耳能听到的声音是一种范围为20Hz—20kHz,而一般语音频率最高为3.4kHz。语音的采集是指语音声波信号经麦克风和高频放大器转换成有一定幅度的模拟量电信号,然后再转换成数字量的全过程。

本次设计的基本原理是对语音的录音和放音进行数字化控制。其中,关键技术在于:为了增加语音存储时间,提高存储器的利用率,采用了非失真压缩算法对语音信号进行压缩后再存储,而在回放时再进行解压缩;同时,对输入语音信号进行数字滤波以抑制杂音和干扰,从而确保了语音回放的可靠质量。

通过设计一个GUI实验箱,并添加相应的控制控件,添加一个声音文件,通过MATLAB编程,使其通过各种按钮实现语音信号处理的各种功能,最后做成一个完整的语音信号处理实验箱。

语音检测算法是现在语音信号处理研究的一个热点。近些年来,语音信号处理技术伴随着人们对通讯技术升级的需求得到了迅猛的发展。IP电话已经走向大规模产业化应用,并以其低廉的成本和满意的话音质量成为通讯供应商竞争的利器,大有取代传统电话的趋势。语音识别技术也已经实现了与说话者无关的大词汇量连续语音识别,并试图从试验研究走向商用。说话者识别技术作为一个新一代的门禁安防技术也已经出现商业应用。很多单工的通讯设备可以通过语音检测技术的应用实现收发状态的自动转换而以比较小的代价达到双工设备的功能。语音检测技术作为这些语音处理算法中的核心预处理单元,成为这些技术能否走向成熟商业应用的关键技术之一。实际通讯环境中会遇到各种不同类型、不同强度的噪声。它们各自在时域或频域中有互不相同的特点,没有一致的统计参数。语音信号本身也是一个时变的复杂信号。不同的语言,不同的音位(语音中的最小发声单位)各不相同。

总之,实际中的噪声和语音信号都是复杂的时变信号。如果不是面向特定背景噪声的应用,通过寻找噪声的共同特征以构建一个噪声信号与语音信号的区分函数是不现实的。语音信号处理本身是一个涉及到传统数字信号处理、统计信号处理、模式识别与建模、发声学、语音语言学等多学科的综合技术。论文在前人研究的基础上,从语音信号的形制机理出发,对语音信号中的基本成分—轻音和浊音的特征进行了深入的研究。Source-Filter模型在语音信号建模中有着广泛的应用,论文在基于Source-Filter模型求取语音信号的LPC谱中发现,语音的短时稳定性(short time stationary)在LPC谱中有着不同于噪声信号的鲜明体现,从而提出了基于音位共振峰轨迹跟踪的语音检测新方法。论文对新算法与国际电信联盟(ITU)的G729B推荐语音检测标准算法进行了对比验证,证明在强背景噪声环境下新算法的性能有20%左右的提高。同时新算法也体现出比G729B更

强的背景噪声适应能力。在算法的实现中,局部大能量的噪声会形成LPC谱中的局部极大值点,它具有类似语音共振峰的特征。为了消除噪声极大值点对音位共振峰轨迹跟踪的不良影响,论文提出了一个共振峰的形态判别标准—音位共振峰的幅值峰谷比原则,并通过大量的试验研究确定了峰谷比的优化量值。试验证明,此方法是剔除局部噪声极值点的有效方法。论文工作将新算法在一个基于TI TMS320C6711的数字信号处理器平台上实时实现。在实现过程中,使用了幅值、步长的分段拟合和插值算法,大大降低了复杂数学函数的运算时间,满足了算法了实时性要求。

第三章

系统方案论证

在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时,则采样之后的数字信号完整的保留了原始信号中的信号,一般实际应用中保证采样频率为信号最高频率的5—10倍;采样定理又称奈奎斯特定理。

一、采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调、衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也就越精确,采样频率与声音频率之间有一定的关系,根据奈奎斯特理论,只有采样频率高于声音信号最高频率的2倍的时候,才能把数字信号表示的声音还原成为原来的声音,这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

二、采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时候使用数字声音信号的二进制为数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

三、采样位数和采样频率对于音频接口来说是最为重要的两个基本指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机。显然采样率越高,计算机提取的声音越多,对于原始的还原也越加精确。

第四章

GUI设计实现

4.1 图形用户界面概念

图形用户界面或图形用户接口是指采用图形方式显示的计算机操作环境由用户接口。与早期计算机使用的命令行界面相比,图形界面对于用户来说更为简便易用。

GUI是MATLAB提供的图形用户界面开发环境,提供了一系列用于创建图形用户界面的工具,从而简化界面布局和编程工作。

4.2用户界面设计

4.2.1 GUI设计模板

在MATLAB主窗口中,选择File菜单中的New菜单项,再选择其中的GUI命令,就会显示图形用户界面的设计模板。

MATLAB为GUI设计一共准备了四个模板,分别是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。

当用户选择不同的模板时,在GUI设计模板界面的右边就会显示出与该模板对应的GUI图形。

4.2.2 GUI设计窗口

在GUI设计模板中选中一个模板,然后单击OK按钮,就会显示GUI设计窗口,选择不同的GUI设计模式时,在GUI设计窗口中显示的结果是不一样的。

GUI设计窗口由菜单栏、工具栏、空间工具栏以及图形对象设计区等部分组成。GUI设计窗口的菜单栏有File、Edit、View、Layout、Tools和Help六个菜单项,使用其中的命令可以完成图形用户界面的设计操作。

4.2.3 GUI设计窗口的基本操作

(1)前面板的设计:在GUI设计窗口创建图形对象后,通过双击该对象,就会显示该对象的属性编辑器。如下图所示。例如,创建一个Push Button对象,并设计该对象的属性值。

图4-1 按钮属性编辑器

通过以上的按钮属性编辑器可以根据个人情况对按钮的名称、颜色、大小等方面的属性进行修改,使按钮在视觉上变的更加完美。

(2)按钮功能的实现:在GUI设计窗口创建按钮后,通过右键单击按钮,选择View callbacks下的callback对相应的按钮进行编程,使按钮实现相应的功能,如下图所示对按钮的响应功能进行设置。

图4-2 按钮功能编辑器

进入到按钮程序编辑窗口,通过编程即可实现按钮的相应功能,如下图:

图4-3 按钮的编程实现界面

通过对各个按钮控件的修改,和对m文件程序的添加就完成对GUI窗口的设计,最后得到的图形化操作界面如下图所示:

图4-4 图形化操作界面

4.2.4 语音的录入与打开

在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于读取语音,采样值放在向y中,fs表示采样频率,bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值。

Suond(x,fs,bits);用于对声音的回放,向量y则就代表了一个信号也就是说可以像处理一个信号表达式一样处理这个声音信号。

4.3课程设计的软件实现

4.3.1语音信号的短时谱

周期性声门波可表示为:

(4-1)其中,g[n]是声门波的单周期的波形,p[n]是间隔为P的周期采样序列。当u[n]通过线性非时变声道,且该声道的单位冲击响应为h[n]时,声道输出为:

(4-2)为了观察一段语音,需要降生到输出乘以一个一时刻τ 为中心的窗函数 w[n,τ] ,即得到:

(4-3)

这段语音信号的频域表达式为:

即语音信号的谱包络为

(4-4)

语谱图就是现实时变频谱幅度特征的图形表达式为:

(4-5)

将语音信号短时谱程序写入到MATLAB中得到单色语谱图的波形如下:

图4-5 语音信号单色语谱图

4.3.2 自相关方法估计语音信号的声道参数

由均方预测误差最小的得到正则方程:

其中,在最佳解时的误差为

在自相关法中式4-6,式4-8变为

(4-10)由式4-9和式4-10可列出方程组式4-11 10

(4-6)(4-7)(4-8)(4-9)

(4-11)

解方程组式4-9求出线性预测系数,通过误差式4-11可求出增益G

(4-12)

加窗后信号频谱图如下:

图4-6 加窗后信号频谱图

通过以上的方法,改变参数分别求得4极点模型频率响应和6极点模型频率响应,6极点波形如下图所示:

图4-7 六极点波形图

最后通过以上方法用一个函数分别实现以上三个功能,三个波形显示在一个界面,通过观察图形,查看它们之间的分别。三者比较所得到的波形如下:

图4-8 三者比较波形图

4.3.3 基音周期检测

数据为浊音语音信号speech1_10k(10000样点/秒)用25ms的汉明窗对语音信号speech1_10k进行加窗处理,并画出所得到的加窗信号的自相关函数,再用根据中心消波法及三电平中心消波法原理改进程序,最后对比中方法基音检测的效果并分析结果。

实验原理及方法

相关检测原理:对于离散的数字语音信号序列x(n),如果周期N,则自相关函数也是同周期的周期函数。即:x(n)=x(n+N)。清音信号没有周期性,他的自相关函数也没有周期。浊音新海具有准周期性。自相关基音检测正是利用这一性质对语音信号进行基音检测的。

中心消波法检测原理:中心消波处理是使用如下图所示的中心消波函数进行处理的:

图4-9 中心消波检测图

三电平消波法原理:为了减少自相关计算中的乘法运算,可以把上述中心消

波以后的信号y(n)的自相关用两个信号的互相关代替,其中一个信号是y(n)另一个信号是对y(n)进行三电平量化产生的结果。且这个信号有三种可能的取值,因而这里的互相关计算只需要做加减法,而这个互相关序列的周期性与y(n)的自相关序列是近似相同的。

三电平法对语音信号处理得到的波形如下:

图4-10 三电平法波形图

中心消波法得到的波形如下图:

图4-11 中心消波法波形图

4.4 GUI实验箱操作界面设计

通过对各个控件的编程和对参数的设计,最后得到的GUI实验箱操作界面如下图所示,通过界面上的各个按钮即可实现相应的功能。

图4-12 GUI实验箱操作界面

第五章 心得体会

通过本次课程设计完成了对语音信号的读取与打开,与课题的要求十分相符;初略的完成了界面的设计,但也存在相当的不足,达到了打开语音文件,显示已定波形。语音信号处理时语音学与数字信号处理技术相结合的交叉学科,将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,体现了数字信号处理技术。

本次课程设计时希望将数字信号处理技术应用与某一实际领域,这里就是指对语音的处理。作为存储与计算机中的语音信号,其本身就是离散化了的向量,我们只需要将这些离散的量提取出来美酒可以对其进行处理了。

本次课设,用到了处理数字信号的强有力工具MATLAB,通过MATLAB李的几个命令函数的调用,很轻易的在实际化语音与数字信号的理论之间搭了一座桥。

最后,还利用了MATLAB的另一强大功能——GUI界面设计。设计出了一个建议的用户应用界面,可以让人实现界面操作。

通过本次课程设计让我更加了解了语音信号处理在现实中的强大的应用空间,同时查阅了很多相关的资料,应用MTALAB软件来完成,熟练掌握了MATLAB软件,本次课程设计要求用GUI设计模块,查阅了很多资料,更加深刻的陆奥了了这方面知识。

本次课程设计,我明白了理论的学习需要在实践中才能得到巩固。在课程设计中,只有动手慢慢研究,才能真正了解MATLAB软件平台中可以直接设计数字滤波器的各个函数的调用,对设计GUI实验箱的所有函数的运用有了比较好的认识。

通过这个课程设计,我学到了很多MATLAB和语音信号的知识,提高了自己在语音信号设计方面的知识能力,动手能力和思维能力都得到了一定的提升,希望自己以后可以更多的继续学习这一门课程设计方面的知识。

参考文献

[1]陈怀琛.MATLAB及在电子信息课程中的应用【M】.北京电子工业出版社.2008.1 [2]张文.基于MATLAB的语音信号的滤波域实现【M】.山西电子技术.2008.2 [3]徐靖涛.基于MATLAB的语音信号分析与处理【M】.重庆科技学院学报.2008.1 [4]张威.MATLAB基础与编程入门【M】.西安电子科技大学出版社,2006. [5]周渊,王炳和,刘斌胜.基于MATLAB的噪声信号采集和分析系统的设计【J】.噪声控制.2004(7):52-54.

dsp语音信号处理 篇2

语音信号作为一个重要的研究领域, 20世纪60年代中期形成的一系列数字信号处理方法和技术, 如数字滤波器、快速傅里叶变换等成为语音信号数字处理的理论和技术基础。在方法上, 随着电子计算机的发展, 以往的以硬件为中心的研究逐渐转化为以软件为主的处理研究。之后逐步发展起来的动态时间规整技术、线性预测技术、矢量量化技术和隐马尔科夫模型等相继被应用于语音信号处理, 并经过不断改进与完善, 使得语音信号处理技术产生了突破性的进展。目前, 语音信号处理发展日趋成熟, 并被细化为语音识别、语音编码、语音合成、语音增强等不同学科深入研究。设计一款基于DSP的数字语音信号处理系统对语音信号处理有重要意义。

2 系统硬件设计方案

DSP语音处理系统主要由DSP芯片及其外围电路、AD转换电路和USB模板电路三部分组成。首先系统利用语音输入设备 (麦克) 将采集的模拟语音信号送入A/D (TLC320AD50C) 转换电路, 将其转换成便于DSP处理的数字信号, 并将转换所得数字信号送入DSP等待处理;其次, 编制程序完成滤波和端点检测等语音信号处理的算法, 并通过PC机或语音输出设备展示处理后的语音信号。系统结构框图如图1所示。

3 FIR数字滤波器算法的DSP实现

本设计中采用窗函数法设计FIR滤波器。TMS320vc5410在指令集和硬件结构上, 对滤波器算法的实现, 有专门的考虑。首先是在指令中设置了MACD指令, 它的功能是将数据区的两个数相乘以后, 再与累加器中的值累加, 运算结果仍保留于累加器中, 而为下一次操作准备;其次在硬件上, 设计了间接寻址时的循环寻址功能, 即将滤波器系数保存于一个可循环寻址的数据缓冲区, 寻址指针由低地址自动增长, 当达到缓冲区顶部时, 自动返回低地址重新寻址, 这样, 配合单指令重复指令RPT, 就可以快速实现卷积操作。程序设计流程图如图2所示。

4 FIR滤波语音信号端点检测

语音信号一般可分为无声段、清音段和浊音段。无声段是背景噪声段, 平均能量最低;浊音段为声带振动发出对应的语音信号段, 平均能量最高;清音段是空气在口腔中的摩擦、冲击或爆破而发出的语音信号段, 平均能量居于前两者之间。清音段和无声段的波形特点有明显的不同, 无声段信号变化较为缓慢, 而清音段信号在幅度上变化剧烈, 穿越零电平次数也多。经验表明, 通常清音段过零率最大。端点检测就是首先判断“有声”还是“无声”, 如果有声, 则还要判断是“清音”还是“浊音”。为正确地实现端点检测, 一般综合利用短时能量和过零率两个特征, 采用“双门限检测法”。

对经滤波后的语音信号进行端点检测, 采用了双门限检测法。图3为孤立词“民院”的语音信号处理结果。

5 结论

文中设计了一种基于DSP的数字语音信号处理系统, 该系统可以对语音信号进行分析处理, 实验结果较理想, 因此该系统的设计具有重要的应用价值。

摘要:本文以TMS320VC5410芯片为核心, 设计了一种基于DSP的数字语音信号处理系统。系统主要包括DSP及其外围电路、模拟数字转换电路和USB模板电路。利用该系统可实现模拟语音数字化, 并对16阶FIR滤波和语音信号的端点检测仿真。仿真结果表明数字语音信号处理系统性能达到了设计要求。

dsp语音信号处理 篇3

在语音控制技术中,语音识别是技术的核心,而语音识别具有大的运算量,需要较大的存储空间,对硬件平台的要求较高。目前,嵌入式应用中,对于语音识别技术的硬件实现平台,DSP较为常见。DSP具有运算速度快,结构独特等特点,可以对一些信号如语音、视频、音乐等进行最优化实时检测、处理和产生,可实现复杂的算法。DSP是运算型处理器,控制功能并不强,特别是针对多传感器信号输入时,CPU对各信号的处理也会增加诸多开销及等待时间。

基于此,本文研究设计将μC/OS-II实时内核植入DSP,通过操作系统管理与配置DSP的内存,决定系统资源供需的优先次序,对语音信号采集、语音识别、识别结果输出、控制算法运算、控制命令输出、显示等多任务进行有效调理,使DSP的所有资源最大限度地发挥作用。另外,DSP因为操作系统的植入,可增加系统的控制功能,一些开发成熟的算法也将很容易地运用于DSP中,大大地减少软件系统的开发难度。

一、系统硬件设计

μC/OS-II是一种免费公开源代码、结构小巧、具有可剥夺实时内核的实时操作系统。其绝大部分代码是用C语言编写的,CPU 硬件相关部分则用汇编语言编写的,总量约200行的汇编语言部分被压缩到最低限度,可方便地移植到各种CPU 上。μC/OS-II其最小内核可编译至2kB,具有执行效率高、占用空间小、实时性能优良和可扩展性强等特点。

本文选用TI公司的TMS320F28335作为核心处理器,将μC/OS-II移植到TMS320F28335的片内FLASH中,通过μC/OS-II管理TMS320F28335的CPU、内存、通信接口等硬件资源。

TMS320F28335是TI公司推出的高于F2812的一款浮点型DSP,具有16通道的ADC输入,12位的AD转换器,线性度可以达到1.5%,片内FLASH 大小为256k,具有诸如SPI、SCI、CAN等多种通信接口。此芯片最高运行主频为150MHz,硬件资源丰富,选用此芯片作为处理器,将μC/OS-II植入其中,可以满足语音信号采集、语音识别、水温调节、水流量控制、信息显示等多任务的实时性要求。

硬件电路设计中,电路主要包括传感器驱动及信号调理电路、TMS320F28335电路、复位电路、时钟电路、LED显示电路、信号输出驱动电路和电源电路。系统的电路原理如图1所示。

图1 系统电路原理框图

图1中,信号调理电路包括传感器驱动电路和信号滤波放大电路两部分。传感器驱动电路主要为前端电容式声音传感器提供12V恒压驱动,为流量传感器和温度传感器转接电源;信号滤波放大电路则为前端传感器感应输出的信号进行滤波、放大及极性转换,从而输出适合DSP采集的模拟信号,信号电压范围为0~3V,滤波范围为300~3400Hz的抗混叠滤波。电源变换电路将交流电220V转换为直流24V,将24V电压再转换为5V,同时,将5V转换为3.3V和1.9V供F28335的IO和内核使用。另外,24V电源还将输入至信号调理模块与信号输出驱动模块。信号输出驱动电路将DSP输出的数字信号转换为模拟信号(4~20mA),再将转换的模拟信号输出至执行机构(电磁阀),电磁阀根据信号输入值调节阀门开度。

二、系统软件设计

系统的语音控制分为两个阶段,阶段1为淋浴前的水预加热;阶段2为淋浴时的出水量及液位控制。系统根据语音传感器输入的声音信号诸如“我要洗澡了,烧水”,“水太冷,调高到某度”,“水太热,降到某度”,“水太小,加大”等进行语音识别,识别时,对话语中的关键字进行提取识别,并且使用者话语与系统中存储的话语相似率达80%以上时,系统执行相应的控制操作。

系统软件部分的设计主要包括四部分:μC/OS-II的移植,信号采集,语音识别程序、显示及控制输出。软件系统结构图如图2所示。

1.μC/OS-II的移植

本文中μC/OS-II使用了V2.76版本,编译环境为DSP的开发环境CCS3.3。

μC/OS-II移植到其他微处理器,仅需修改OS_CPU.H、OS_CPU_C.C和OS_CPU_A.ASM与处理器特性相关的部分。移植到F28335中主要有以下工作:

(1)设置与处理器相关的常量、宏及类型,以形成OS_CPU.H文件。TMS320F28335的堆栈入口宽度为16位,堆栈的声明为Typedef INT16U OS-STK。因TMS320F28335堆栈的增长方向是递增的,故定义堆栈增长方向是从下向上,即

#defineOS_STK_GROWTH0

(2)根据F28335的主要堆栈结构,定义堆栈初始函数OSTaskInit()的主要代码。OSTaskInit()为OS_CPU_C.C文件中的必要函数。

(3)编写OS_CPU_A.ASM文件中的四个汇编语言函数:OSStartHighRdy(),OSCtxSw(),OSIntCtxSw(),OSTickISR()。这四个汇编言函数都涉及对寄存器的处理,需要实现使就绪态中最高优先级的任务运行、任务级任务切换、中断级任务切换和时钟节拍中断ISR。

2.信号采集

系统信号采集分为语音信号采集、水温度采集、水的输入输出流量采集。此三种信号的采集通过F28335的片内ADC实现。三种信号实时采集,各信号采样率的设置均在初始化程序中完成。语音信号的采样率设为10K。信号采集程序的流程如图3所示。

图3信号采集程序流程图

3.语音识别

淋浴系统的使用者非特定,本文选用采用HMM方法实现语音识别。系统语音识别的流程如图4所示。

如图4所示,系统语音识别分为模型训练阶段与系统应用阶段,通过训练HMM模型,得到使用阶段的语音识别参考模板,从而进行辨别决策,输出对应的语音控制操作命令。

(1)端点检测

对量化后的语音信号进行分帧和加窗。选取帧长为512点,帧移160,采用512点Hamming窗对信号加权,综合利用短时平均幅度和短时平均过零率对语音命令进行端点检测。

(2)特征参数提取

本文选择12阶的Mel频率倒谱系数(MFCC)与其一阶差分构成24维MFCC特征参数。根据式(1)、式(2),由N点的语音数据得出美尔频域滤波器组成Hm、DCT系数矩阵Dk,即12阶MFCC参数。最后将静态MFCC与其一阶差分合并得到24MFCC特征参数。

(1)

(2)

式中,M为滤波器个数;Wm为窗函数。

(3)连续隐马尔可夫模型

本文采用连续隐马尔可夫模型作为语音模型,选用包含3个混合高斯元的多元高斯概率密度函数作为B参数,可通过计算高斯概率密度函数计算出语音特征向量相对于连续HMM的概率输出。选取概率最大的作为识别结果。

采用Baum-Welch算法训练得到优化的模型参数。该算法利用新旧HMM模型参数之间的函数关系反复迭代运算,直至模型参数不再明显变化。迭代运算中使用的重估公式由式(3)~式(5)给出:

(3)(4)(5)

4.显示及控制输出

系统中,显示部分主要显示温度、加热、液位等信息,通过LED实现。

控制部分包括液位控制、加热控制、出水流量温度控制。液位控制主要为水箱监控,防干烧。加热控制为开关量控制,即将实时加热水箱的水,当温度达到指定值时,停止加热。

淋浴系统的出水分为冷水和热水,出水温度的控制根据冷水与热水的流量进行比例控制。DSP根据识别结果查找存储器中的与该结果对应的温度、流量值。DSP再根据该值输出驱动冷水阀门和热水阀门开度的数字信号。最后,电磁阀调节阀门开度,实现出水流量与温度的控制。出水流量控制采用逐步增减的方式,当系统收到加大水流量的命令后,按照固定水量等间距增加或减小,收到命令一次,加水一次。

三、集成与实验

以上各节为系统的硬件和软件设计,下面对系统进行集成,为各子程序设立在μC/OS-II的任务优先级,根据控制系统的要求,优先级分配如下:

采集任务优先级为4,语音识别任务优先级为5,加热任务优先级为3,液位控制任务优先级为2,出水流量温度控制任务优先级为6,显示任务优先级为7,硬件系统参数初始化任务Init Task优先级为8。

各程序任务优先级分配完毕,则对程序进行编译连接和下载。TI代码产生工具所产生的目标文件是一种模块化文件格式——COFF格式,即.out文件。程序中的代码和数据在COFF格式文件中以段形式形成,不同的段存放不同类型的内容。因此,编写连接器命令文件(.cmd)将本系统中各程序段正确地分配到DSP的地址空间,DSP集成开发环境CCS经编译链接之后,生成.out文件和.map文件,而后可通过仿真器将程序烧写到DSP的片内Flash中。另外,程序要实现上电自举,在程序中添加自引导程序,使系统上电自起动。

本文利用在线仿真,进行系统语音识别实验,在程序中设置断点,观察识别结果和处理时间。将计算机训练好的HMM模型,应用于系统中。

通过采集20人(10男10女)的语音信号进行识别,语音命令为:a—“我要洗澡了,烧水”,b—“水太冷,调高到55度”,c—“水太热,降到45度”,d—“水太小,加大”。读取的“水太小,加大”的语音信号及频谱图,如图5所示。各识别结果及识别平均响应时间如表1所示。

图5 语音命令d的波形图及频谱图

通过表1所示数据可知,4个命令中,各命令的处理时间均在300~450ms,完全可以满足系统的实时性要求。对于系统的识别率,选取的20人中,每一种命令至少有一人无法识别,识别率较高,但因样本容量较少,因此,应该加大测试样本,进一步测试系统的识别率。但就结果表明,该系统可应用于家用淋浴系统。

dsp语音信号处理 篇4

实现一个典型的多DSP并行处理结构,各处理器的三大总线要全部相连。图2给邮一个基本的多处理器系统结构图。在多系统中,某一时刻总线由主处理器控制,并且主处理器驱动所总线。由于民多处理器后,包括片内存储器以及IOP寄存器在内的所有地址空间是统一编址的,因此事实

上只有两个节点(处理器或外设)在同时刻在总线上活动,而此刻总线对于其它节点来谙阻塞的。这,其它接口点能通过链路口或者FLAG标志口进行点对点通信来交换数据和消息。

在多处理器系统中,各控制线上除主DSP外的其它所有节点都属于负载,所以对于每一根控制线来说都是一个多负载的连接,必须在每个DSP附近接串接电阻以增强驱动能力,否则会由于驱动能力不足而导致所进行的操作失效。另外在所有低电平有效的一上应接上拉电阻,以保证在没有进行操作时从DSP以及外接不会接收到虚假的指令。由于本系统是一个独立的结构,并没有与外部主机相连,故主机接口控制线在各DSP相连的情况下,应像其它未用管脚一样根据ADI技术文档的要求进行处理。而本结构与外部的通信可以通过同步串口工者在总线上挂接一片双端口RAM来进行。

另外多处理器系统的时钟、复位步问题一个决定系统工作正常与否的关键问题,各DSP的复位信号可同时接到看门狗的输出端。时钟信号必须在阻抗可控的传输线中传输,为保证各DSP的时钟信号之间不存在相位差,或者说相位差在系统允许的范围内,一般应采取始端连接的方式。图3给出串联传线分配时钟的例子,它允许在不同的路径中存在延时,每个设备必须在线的终端。传路径必须均匀分布,以使各路径上的传输延迟相互匹配。匹配的反相器必须在同一IC上,且相互之间的时间滞后差必须小于1ns。

并行处理系统的硬件结构搭建好后,如何才能很好地发挥其超强的处理能力,则要靠软件的设计来实现。为适应计算任务的多样性,可以采用1片ADSP-21161N作任务管理器,另外5片ADSP-21161N作运算器的主、从式拓扑结构。这样做还有利于实现指令间的流水处理,提高执行效率。而软件实现是可以根据具体的要求来完成,考虑到系统的高速、高效、实时性,软件可采用ADSP-21161N汇编语言进行编程。

dsp语音信号处理 篇5

目前,计算量过大仍然是制约许多有效的ATR算法实时实现的个主要因素。ATR算法在分布式多处理器并行系统上实时实现是一个很有潜力的研究领域,特别在地基和天基雷达信号处理系统中有广阔的应用前景。分布式多处理器并行系统的连接方式有线形、树形、星形、网孔和超立方体结构等。树形和星形网络的优点是网络管理容易、数据通信进寻径简单;缺点是树形网络的根节点处理器和星形网络的中央节点处理器的输入/输出吞吐量大,易造成通信瓶颈。所以树形和星形网络不适合ATR算法各个任务数据通信量较大的应用场合。

在分布式多处理器并行系统中并行实现ATR算法目前还处于研究的初始阶段,在编写并行算法程序应当重点考虑两个方面:

(1)各处理器任务的均衡分配

在分布式多处理器并行系统中处理器的数目通常较多,

只有合理地对众多的处理器均衡地分配任务,才能最大地发挥并行系统的总体性能,提高并行系统的加速比。

(2)处理器节点间的高效通信

语音信号的数字化噪声抑制技术 篇6

关键词:噪声抑制 阈值 延时时间 PCM编解码 CPLD器件

语音信号的噪声抑制技术是基于人耳的声音屏蔽效应的,即当有较强的声音信号时,较小的噪声信号将被屏蔽而不易被听到。

在具有噪声抑制功能的语音通信设备中,没有语音信号时噪声抑制电路将信道关闭,使噪声信号不能到达语音终端,避免了噪声出现;语音信号来到时,噪声抑制电路自动打开信道,这时虽然噪声语音一起送到语音终端,但由于声音屏蔽效应,噪声的存在可以忽略。

模式式的噪声抑制电路直接对语音模拟信号进行处理,通常主要由取样放大器、模拟比较器、模拟开关、阻容延时器件等组成。因其集成度低、参数调整困难、设定的噪声抑制参数易受环境因素影响而漂移,使得噪声抑制性能难以得到保证。

在为某国孙工程研制新一代语音指挥通信设备时,为了避免模拟式噪声抑制技术的缺点,采用了数字化的噪声抑制技术。这一技术,是在对模拟语音信号进行PCM编码后,再用CPLD(复杂可编程逻辑器件)对PCM码流进行数字化噪声抑制处理,然后将PCM信号解码还原为模拟语音信号。结果,不仅获得了优良的噪声抑制效果,而且能够用软件调节噪声抑制参数,设备的集成主和稳定性都有显著提高。

(本网网收集整理)

1 噪声抑制电路的主要技术参数

噪声抑制电路的主要技术参数为:噪声抑制阈值、前道时时间、后延时时间。

噪声抑制阀值是指打开语音信道的门限电平值。在阈值之下的信号认为是噪声,关闭语音信道;在阈值之上的信号则认为是语音,打开语音信道。这一阈值可根据环境噪声的大小、外来干扰的严重程度及语音信号的幅度而进行设置。例如,当语音信噪比为30dB时,噪声抑制阈值可设为32mV左右。

由于语音和噪声两种信号并不总是能够完全区分开的,因此在信号幅度超过噪声抑制阈值或回落到阈值之下时,需要分别进行延时和后延时。

前延时时间是指语音信号在超过阈值后到语音信道打开的延时时间。这一时间太长将造成语音的起始音素被切除(称为“头切”),是不能允许的。但这一时间又不能太短,太短的话任何幅度超过噪声抑制阈值的突发的短暂干扰都会立刻打开语音通道并将这干扰送到语音终端,破坏静音效果。为尽可能地吸收这类干扰又不至于造成“头切”,根据语音声学特征的有关统计资料与经验数值,前延时时间可在0.5――4ms之间选择。

后延时时间是指在噪声抑制门限被打开并自己传送语音时,从语音信号幅度回落至噪声抑制阈值之下到语音信道关闭的延时时间。由于语音信号波形的动态范围很大,讲话时又随着语气的变化而起伏停顿,因此后延时时间太短会造成语音的断续,影响语音传送质量。后延时时间太长,则造成语音停顿时噪声拖尾,同样影响语音质量。为兼顾这两方面,后延时时间的量值范围约为0.05――0.5s左右。

由于语音特点因人而异,环境噪声和外界干扰情况又常有不同,所以上述的噪声抑制三参数经常需要在语音通信的过程中进行调节。在使用模拟噪声抑制电路时,这些参数是用电位器或开关来调节的。在使用模拟噪声抑制电路时,这些参数是用电位器或开关来调节的。采用数字化噪声抑制技术后,通过软件就可以设定和调节这些参数了。

基于DSP的语音录放系统的设计 篇7

信息技术和超大规模集成电路工艺的不断发展, 极大地推动了DSP的发展。DSP技术的应用领域也越来越广, 尤其在音频处理领域。目前, 在很多语音处理系统中都用到了语音录放模块, 采集现场的声音并存储起来供以后回放。语音处理系统的实时性、功耗、体积以及对语音信号的保真度都是影响系统性能的关键因素。该设计采用的高速54x DSP芯片, 最高频率能达到100 MIPS, 能够很好的解决系统的实时性;采用的数字编解码芯片TLC320AD50 (以下简称AD50) 具有16位采样精度, 最大功耗仅100 mW。因此, 该音频编解码芯片与54x DSP的结合是可移动数字音频录放系统、现场语音采集系统的理想解决方案[1]。

1系统总体设计

该文介绍的系统, 核心处理器是TI公司的TMS320VC5402 DSP, 数字编解码芯片TLC320AD50实现了模数转换和数模转换的功能。二者是通过DSP内部的多通道缓冲串口 (MCBSP0) 连接的, 系统框图如图1所示。

图1中, DSP作为主芯片实现各模块之间的通信, 其主要工作有:上电自举, 并初始化音频编码芯片AD50, 接收来自于AD50的数字信号, 将处理的数字信号送回AD50。AD50的输入音频信号通过音频线由计算机提供, 输出信号通过耳机或喇叭都能听到。CPLD (复杂可编程逻辑器件) 为整个系统提供时序。

2器件选择

2.1DSP芯片的选择

系统采用的主芯片是TI公司的一款16位定点DSP:TMS320VC5402 (简称C5402) , C5402还具有2个MCBSP多通道缓冲串口。该串口与SPI器件兼容, 提供多达128个发送和接收通道。这里采用其中的MCBSP0。与其他C54x DSP芯片一样C5402具有功耗低、运算速率高和性价比高的优点。另外C5402具有如下特点:当核电压为1.8 V时的工作频率可达到100 MIPS;能访问64 K数据存储空间64 K I/O空间、以及1 M程序存储空间[2,3]。

2.2语音编解码芯片的选择

从适应语音信号频率、满足实时性、降低成本和简化设计的要求出发, 该系统选择TLC320AD50芯片。该器件与C5402接口易于实现, 开发和使用更加方便。尤其适合应用于低比特率、高性能密集设备的话音增强, 识别及合成等的各种VOIP, 调制解调器和电话领域。

AD50集成了16位A/D和D/A转换器。使用过采样 (Over Sampling) 技术提供16位A/D和D/A低速信号转换, 该器件包括2个串行的同步转换通道 (用于各自的数据方向) , 工作方式和采样速率均可由DSP编程设置。其内部ADC之后有抽样滤波器, DAC之前有插值滤波器, 接收和发送可同时进行, 且输入输出增益控制可编程, 可工作在单端或差分方式[4]。

3系统硬件设计

硬件连接采用AD50为主控模式, 向C5402的MCBSP0 (从设备) 提供时钟信号, 并控制数据的传输过程。而AD50的MCLK上的时钟由C5402的晶振通过CPLD分频得到。MCLK提供AD50和C5402间的数据传输时钟和帧同步时钟。C5402与TLC320AD50的硬件连接如图2所示。

DSP与AD50的数据交换是通过串口0 (MCBSP0) 实现的。其中MCBSP多通道缓冲串口数据的接收是通过3级缓冲完成的, 即引脚DR上的数据先到达移位寄存器RSR, 当收到一个满字之后数据被装载到数据接收寄存器RBR中, 最后数据才被拷贝到接收数据寄存器DRR中。DSP通过串口0接收AD50采集的数字音频信号, 并将音频信号传送给AD50。

4系统软件设计

系统的软件开发环境是TI公司的DSP集成开发环境CCS 2.0。CCS提供了软件开发、程序调试和系统仿真环境。CCS不但能支持汇编语言, 而且还支持C/C++语言进行软件开发。CCS提供的C编译器能优化代码, 提高C程序的运行效率[5]。系统的软件流程图如图3所示。

AD50采用15位数据的传输格式, 因此VC5402收到AD50的数据后, 将最后一位 (最低位) 置0;而AD50要求VC5402发送数据时, 必须将最后一位置0后再发送。

VC5402的MCBSP0接收数据和发送数据采用的是查询法。具体的程序代码如下:

5结束语

采用音频线将计算机和AD50的音频信号输入端相连, 在计算机中采用音频播放器播放一首歌曲, 将耳机接到AD50的音频信号输出端, 运行程序可以通过耳机听到十分清晰的歌声, 达到了很好的效果。随着DSP技术的不断发展, 54x DSP与TLC320AD50结合的音频编码方案将会有更好的应用前景。

摘要:以数字信号处理器 (DSP) TMS320VC5402为核心处理器, 设计了一个语音录放系统。该系统采用的数字编解码模块是由TLC320AD50芯片完成的, 采用音频线, 通过DSP内部的多通道缓冲串口 (MCBSP) 将电脑中的音频信号送到DSP中, DSP再将音频信号进行处理, 通过TLC320AD50输出。最后, 音频信号从耳机或外置喇叭传出。

关键词:语音录放,DSP,多通道缓冲串口,模数转换,数模转换

参考文献

[1]何苏勤, 徐家艳.基于定点DSP语音录放系统的设计[J].微计算机信息, 2006, 22 (26) :148-150.

[2]乔瑞萍, 崔涛, 张芳娟.TMS320C54X DSP原理及应用[M].陕西:西安电子科技大学出版社, 2005.

[3]张雄伟.DSP芯片的原理与开发应用[M].北京:电子工业出版社, 2009.

[4]高海林, 钱满义.DSP技术及其应用[M].北京:北京交通大学电工电子教学基地, 2005.

上一篇:“四议两公开”工作法经验交流材料下一篇:小学青年班主任教师个人事迹材料