数字语音信号处理实验

2024-08-28 版权声明 我要投稿

数字语音信号处理实验(精选8篇)

数字语音信号处理实验 篇1

应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个wav文件做语音信号处理,程序始终现实如下错误提示:

??? Error using ==> wavread Error using ==> wavread Data compression format(IMA ADPCM)is not supported.我在查阅了很多资料,在网上也查阅相关信息,花费了大量时间也没找出结果,最后发现在WAV格式的语音文件有两种格式,即PCM格式和IMA ADPCM格式,而在MATLAB中用wavread函数进行语音处理时,并不能直接处理IMA ADPCM格式的语音信号,经过格式转换之后(选择PCM格式),我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解,于是我又翻出学过的数字信号处理课本,认真研究起各种滤波器了,这才使我明白了大多数滤波器是如何工作地,不再单单只是懂理论,理论与实际相结合是很重要的,只有理论知识是远远不够的,只有把所学的理论知识与实践相结合起来,从理论中得出结论。实验过程中,我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别,这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题,其实也是有很多东西可以发掘的,这需要我们在平时多积累,多思考,只有这样,才能取得更大的进步,才能学有所用,学有所长。

通过这次设计,进一步加深了对数字信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时只通过课堂上听讲得到的知识更加生动立体,跟让人记忆深刻。在设计的过程中,我发现同学间的互帮互助真的很重要。当我们有问题的时候,大家一起讨论,将自己的观点表达出来,当发现别人的观点与自己的不同的时候,我们通过查阅资料找到最终正确的答案,这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神,对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处,对以前所学过的知识理解得不够深刻,掌握得不够牢固。

数字语音信号处理实验 篇2

关键词:数字信号处理,语音信号,实验,改革

如今,数字信号处理已几乎涉及各行各业的每一个角落,是一门非常重要、实用的技术,因此,在高校中,几乎每个工科专业都会涉及与数字信号处理相关的教学内容,电类专业更是专门开设数字信号处理课程,甚至是现代数字信处理课程或是高级数字信处理课程。

数字信号处理课程的特点是理论性强,公式的推导与证明过程繁杂,在教学过程中如果处理不好,甚至会被当成一门数学课,从而导致学生学习兴趣下降。为了提高学习兴趣,提升学习效果,实验课程成为课堂教学的重要部分,是理论推导的有效补充,已经成为数字信号处理课程改革的一个重要内容与方向。[1,2,3,4,5]

笔者通过网络方式调查了近年来国内一部分重点高校的实验课程开设情况,包括实验内容、实验设备以及实验指导教材等。在实验内容上,各高校基本大同小异,均集中在频谱分析、滤波器设计等方面,与教学重点相吻合。这些基本的要点与重点已经在教学界达成了共识。在实验设备上,一部分引入Matlab W作为软件实验平台,一部分以DSP芯片构建硬件实验平台或是购买商品化硬件实验平台。实验指导教材对应于实验设备,包括已出版实验指导书(以Matlab为主),商品化硬件平台自带的实验指书。纵观各高校实验课程的开设,结合各专业具体学时安排与实际条件,所选择的设备与教材有所不同,各重点有所侧重,但基本体系已经相对完善,基本可以满足工科本科学生的基本学习需求。其中,硬件实验平台的缺点在于硬件成本高,不便于改动,灵活性较差,学生实验也更多地集中于硬件芯片的编程实现。而Matlab实验平台则具有更大的灵活性,可视性强,尤其是随着笔记本电脑的普及,更具有学习时间与学习地点的灵活性,而不必完全局限于上课时间于实验室内完成实验。在笔者多年的教学过程中发现,无论是硬件实验平台,还是软件实验平台,都只是实验方式与手段上的不同,在实验内容上基本一致。而实验内容才是影响学习效果的关键因素。而且现行实验内容存在的最大问题即实验对象简单抽象化。[5]例如,讲频谱分析时或滤波时,更多地采用的信号是由几个不同频率的正弦信号合成的。这些信号比较简单,物理意义也明确,但与实际信号联系不大,而从不容易上学习把理论与实践相联系。也有教师试图将实际信号与课程联系,例如王祖林和郭旭静[6]曾提出用通信信号为实例进行讲解,取得了不错的授课效果,但这类信号不易获取,对于非通信类专业的学习来说也存在理解困难等不足,因此,该方法在各高校的授课中并不多见。

1 实验内容改革设想

1.1 实验对象的选择

在实验课程中增加与日常生活密切相关的实例,已经成为实验课程改革中的一项共识。正是基于这一点,笔者提出以语音信号为实验课程的实验对象的设想。该设想是基于语音信号以下优点:(1)语音信号来源于日常生活,没有人会感觉到陌生;(2)语音信号易于获取,且每名学生都可以结合自身语音进行分析,实验对象即具有共性,又具有不同;(3)语音信号具有明确的时域频域物理意义,便于学习过程中对理论知识的理解;(4)语音信号处理是数字信号处理中的一个重要分支与科研热点,对学生而言又具有扩展性与探索性。

1.2 实验时间与地点的选择

传统的实验课程,都是在指定的时间到指定的实验室内,由1~2名教师或实验员带着几十个学生完成实验。由于实验场地与设备的局限性,在指定时间地点之外很难进行实验。如何突破这个局限,是实验课程改革中必须面对的问题。因此,笔者认为,实验内容与环节的设计上,可以考虑让学生拥有更大的时间与空间自由度。

1.3 考核方式的选择

在实验过程中让学生拥有更大的时间与空间的自由度,如果考核方式与制度还是保持传统不变,则可能是出现雷同等不良现象,反而降低了预期实验效果。在考核方式制定上,即要考虑到共性的部分,即对理论的理解,又要考虑到每名学生个性的部分,即在实际应用上的灵活性。

2 实验内容与实验环节设计

根据上述分析与设想,并根据多年的教学实践,在传统实验内容的基础上,对每个实验项目增加了选做的实验内容(见表1)。

在实验环节的设计上,把每一次实验的学时分为两部分,第一部分用于理解并完成部分实验内容,第二部分学时用于考核。例如一个2学时的实验课,分为1个学时用于实验,1个学时用于考核,且两部分学时不连续进行,进行考核的1个学时是在提交实验报告后进行。

在第一部分的学时上,对于传统的实验内容在实验课时详细讲解、演示,并要求学生同步跟随完成,对于增加的内容,提出问题与目标,引导学生思考,并不要求其在实验课内完成,而是鼓励学生在实验课时之外完成,鼓励学生通过查资料,讨论等方式完成,并且可以通过邮件等方式与授课老师进行讨论。

在增加的实验内容部分中,4个实验项目所用的声音信号可以为同一声音信号,以增强实验的连续性。

3 考核方式的改革

传统的实验课程的考核方式以提交实验报告为主,提交实验报告后即为该次实验的结束。笔者尝在上交实验报告并批阅完后,再进行第二部分学时的课程,请每位学生向全班学生讲解其实验结果(如果学时不足,或是人数过多,则可根据实验报告撰写的情况抽取部分学生讲解),针对出现的问题由教师现场答疑,并根据学生讲解的情况考察其是否独立完成,是否理解实验目标,对于有主动深化探索的学生,提高其考核成绩。每次实验的考核成绩包含实验报告成绩和现场讲解成绩两部分。通过强化考核力度,消除学生侥幸心理,引导学生重视自我学习与自主思考的能力,从而提升学习效果。

4 结束语

数字信号处理课程的实验内容是整门课程的重要组成部分,在现有实验条件不变的基础上,通过对实验内容的改进,重新设计实验环节与考核方式,强化实践过程,引导学生主动思考,提升学习兴趣,鼓励深化学习与探索精神。通过2年实验课程的教学实践,学生的动手能力有了很大的提高,自主学习与思考能力也有了提升,对数字信号处理理论知识的理解也更加清晰,有效地提升了数字信号处理课程的教学效果。本套实验内容与考核方式改革对于其他学校数字信号处理课程的教学均有一定的借鉴意义。

数字语音信号处理实验 篇3

摘 要: 分析了《数字信号处理》课程在实验教学和理论教学中存在的问题,为解决理论与实践相互脱节的问题,文中介绍了基于MATLAB的虚拟教学仿真软件的使用,讨论了在课堂教学中如何结合理论知识使用仿真软件,以达到理论与实验教学的一体化。

关键词:实验教学;理论教学;仿真软件;理论联系实际

中图分类号:TP319;G642.0 文献标识码:A 文章编号:

Research on the Integration of Experiment and Theory Teaching

Based on Digital Signal Processing Course

Dong Qinghe, Huang Xijun,Li Jun, Yang Qing

( School of Electronic Engineering and Automation, Guilin University of Electronic Technology, Guangxi Guilin, 541004, China)

Abstract: Analyzing the existed problems of experiment teaching and theory teaching in digital signal processing course, a virtual teaching simulation software based on MATLAB is introduced in this paper in order to solve the disjoint between the theory and practice. Combined with the corresponding theory knowledge, how to use this software in classroom teaching is discussed to accomplish the integration between the theory and experimental teaching.

Key words: experimental teaching; theory teaching; simulation software;

1引言

高等學校的教学分理论(课堂)教学和实验(实践)教学两大部分。传统的教学观念认为理论教学为主,实验教学为辅,两者相互补充,相互促进。在实际教学中,理论教学侧重于基本概念、原理和分析方法等理论知识的讲解,实验教学作为理论教学的补充,以验证性实验为主,按照规定的操作步骤和方法完成实验内容,通过观察实验现象、记录数据进行分析总结,从而加深对理论知识的理解和掌握[1]。调查发现,高校的实验教学与理论教学一般是分开设课,各自由不同的部门或老师负责,缺乏应有的交流机制。理论教师甚少会结合实验内容提前进行指导,实验老师一般也不会主动将实验中出现的问题进行及时反馈给理论教师,这种孤立的教学模式就造成了理论与实践相互脱节,难以达到通过实验对学生分析问题和解决问题能力的培养目标。

笔者长期担任《数字信号处理》课程的理论教学和部分实验教学工作,根据教学中出现的问题,对如何将课堂教学和实验教学有机地融合进行了研究,提出在课堂中采用虚拟仿真教学软件来辅助于理论教学,代替某些实验教学任务(尤其是验证性、软件类实验),从而淡化理论教学与实验教学的界限。

2教学中存在的问题

《数字信号处理》是我校电子信息类必修的一门专业基础课,课程理论性强,概念多,内容抽象,含有大量的公式或性质的推导和证明[2],需要学生要具有良好的数学功底。然而由于大学扩招之后,学生的基础水平普遍下降,而且传统教学中老师授课时一般以理论为主,强调公式和性质的推导及运用,常以习题的形式来强化学生的运算能力[3],对理论知识在实际中的应用介绍不足,学生普遍感到枯燥无味,抽象难懂,甚至产生了畏惧心理,不仅制约了教学效果,而且影响了学生学习的积极性。

实验教学是高等学校培养专门人才的重要实践性环节,在培养学生实践能力、创新能力和科学素养等方面具有理论教学不可替代的作用[4]。为加强学生对理论知识的理解和掌握,提高动手能力,很多课程都开设了对应的实验项目,其成绩作为最终课程成绩评定的一部分。《数字信号处理》课程所开设的实验项目有:信号与系统的时域表示和运算、信号与系统的频域表示、DFT&FFT、抽取和内插的频谱分析、FIR数字滤波器的设计、IIR数字滤波器的设计。这些实验均以MATLAB软件作为仿真平台,没有涉及到具体的硬件和测试仪器,通过调用MATLAB内部函数和简单的编程获得仿真图形,改变参数观察图形的变化,以达到对相关理论知识原理的分析和理解。由于是纯软件的程序设计性实验,据调查,很多同学都是直接拷贝程序应付结果,实验报告也是千篇一律,缺乏对结果应有的分析,对于出现的实验现象、问题和解决方法的原因鲜有学生进行深入的思考,根本无法达到实验的预期目标。

3 基于MATAB的虚拟教学仿真平台

为改变目前的教学现状,打破理论教学和实验教学人为而划分的界限,将两者有机地融合在一起,文中设计开发一基于GUIDE的《数字信号处理》教学仿真软件。 GUIDE(Graphics User Interface)是MATLAB为用户开发图形界面提供的一个方便高效的集成开发环境,利用此开发环境,用户不需要编写大量的代码,只需采用拖拉的形式将所需控件(如按键pushbutton、静态文本text、编辑框edit、坐标轴axes等)有序地放置于界面编辑面板,通过在属性编辑器(Property Inspector)中修改各控件的属性,调整好各控件位置后运行即可显示图形界面,并产生一包含GUI初始化和组件界面布局控制代码的M文件,进入对应的M文件编辑器中编写程序,主要是在相应控件的回调函数中添加代码来响应控件的行为[5]。界面设计方便简单,而且编程效率高。

如图1为仿真软件的总界面,点击“软件说明”按钮会在edit编辑框中显示出各控件的功能和操作说明。“退出”按钮用于退出整个界面,结束仿真软件的运行。点击其他按钮,即可进入软件子界面。比如点击“高分辨率和高密度谱”控件,即可进入图2所示的子界面。

图1 数字信号处理教学仿真软件主界面 图2 高分辨率和高密度谱的子界面

该软件集学习、设计、应用于一体,以原各实验项目为基础,对实验的深度和广度进行拓展,可安装在任何一台PC机上,通过设置不同的参数,观测和分析结果,从而取代原有的实验项目并打破了实验必须在实验室进行的传统。另外,软件还覆盖了该课程的所有重点和难点,可将抽象的内容直观化、形象化,在课堂上通过与现代化的多媒体教学手段有效地结合,可将大部分理论内容贯穿起来,有效地辅助学生学习。

4 理论教学与实验的融合

下面以频谱分析为例来说明如何依托于教学仿真软件将理论教学与实验教学进行有机地融合。

离散傅立葉变换DFT(Discrete Fourier Transform)是一种时域和频域均离散化的变换,适合于数值运算,是离散系统分析的重要工具。由于连续信号不便于直接用计算机进行计算处理,所以连续信号的频谱分析要用DFT进行近似处理[6]。然而在学习中遇到的傅里叶变换有CTFT、CTFS、DTFT、DFS、DFT,课堂教学中侧重于几种傅里叶变换的公式推导和证明,一般学生很难搞清和理解它们之间的区别和联系,尤其是对于用DFT对连续信号进行频谱分析缺乏直观认识 。

频谱分析的实验要求:对连续信号 进行频谱分析,其中采样频率设为fs = 32000,分别对模拟时域信号进行N=16点或256点抽样,并进行16点或256点的傅立叶变换,通过软件编程获得信号频谱?改变fs观察频谱变化?

实验中,学生只能在指定的时间和指定的实验室中进行,在MATLAB软件的M-editor编辑器中编写程序(如图3),而后保存运行,得到如图4所示波形,然后修改参数N、M、fs值,观察波形变化。该实验的目的是学习FFT的使用,掌握频谱分析的方法,考察抽样间隔对信号频谱的影响,理解高密度谱和高分辨率率谱的区别和影响原因。然而实际中学生只是简单地观察一下波形变化,而不知如何从中提取有用信息,对产生变化的原因甚少有学生进行深层次的挖掘思考,根本达不到实验的目的和要求。

图3 频谱分析原程序 图4 频谱结果图形窗

利用该教学仿真软件可在课堂教学中结合频谱分析的相关理论知识同时进行,通过提出问题,层层发问,步步深入的形式,引导学生不断去思考。比如:如何将连续信号转换为离散信号?时域抽样点数N为16和256的频谱图是什么样的?为什么不同?采样频率FS改变又会有什么变化?为什么?每提出一个问题,留出一定的时间给学生进行思考,而后在在软件edit框中输入参数,点击相应控件即可得出时域图形和频谱图(如图2所示)。这种一体化的教学方式形象直观,可提高学生学习的兴趣,通过现象看本质,不仅加深了学生对理论知识的理解和掌握,而且培养了学生分析和解决问题的能力。

为加强学生的工程实践能力,软件还提供了对语音信号的相关处理。通过实时调入一音频文件,可以对其添加不同类型的噪声[7],而后观察前后的时域波形和频谱图,播放音频文件,聆听前后声音的变换。图5是添加均匀分布噪声,从波形上看仍能看到原信号的轮廓,播放声音虽能听清原声音,但伴有“咝咝”的背景噪音。图6是将1500Hz的正弦信号作为噪声,从频谱图中也可以清晰地发现在1500Hz频率处有一尖峰,音频信号中混有一阵尖锐的“叮”声,从中可以清楚地判断出噪声频率,以便选取合适的滤波器进行滤除。此外,通过改变采样率来聆听声音的变化,来理解为什么采样率的选取要符合采样定理。

图5 添加均匀分布噪声音频信号频谱分析 图6 添加1500Hz的正弦信号噪声频谱分析

实践表明,采用这种现代化教学形式,不仅将实验内容与理论教学融为一体,而且活跃了课堂气氛,大大触动了学生的视觉和听觉系统,诱使学生不断地去发现问题、思考问题和解决问题,改变了传统的灌输式教育并向启发式教育的转换。

结论

教育的主体是学生,其目的就是激发学生学习的兴趣,诱发学生的求知欲望,使其始终带着饱满的热情参与到学习之中。借助于虚拟教学仿真软件并结合现代化多媒体教学手段,不仅使课堂教学形象化,并能有效地将理论教学与实验教学整合为一个有机的整体,培养了学生综合应用、独立分析和解决实际问题的能力,使学生从知识的拥有者转化为知识的使用者。

参考文献(Reference):

[1] 程敏熙,赵芝孟,颜巧莹. 简论高等学校理论教学与实验教学的关系[J],实验技术与管理,2001.18(2):186~189

[2] 刘大年,史旺旺,孙贵根等. “数字信号处理”课程的形象化教学方法探索[J]. 电气电子教学学报, 2006.8(4): 104-107

[3] 李强,明艳,陈前斌等. 基于Matlab的数字信号处理实验仿真系统的实现[J]. 实验技术与管理,2006.23(5):81-84

[4] 程金林,吴斌,靳晓枝等. 高校实验教学考核模式的改革与实践[J],实验室研究与探索,2005.24(4):76-78

[5] 施晓红, 周佳. 精通GUI图形界面编程[M]. 北京:北京大学出版社,2003

[6] 刘大年,史旺旺等. “数字信号处理”课程的形象化教学方法探索[J]. 电气电子教学学报, 2006.8(4): 104-107

[7] 申艳,陈后金,薛健等. 基于Matlab加噪语音的FIR滤波器设计[J],电气电子教学学报,2011.(4):41-44

作者简介:董庆贺(1978—),女,河南泌阳人,硕士,讲师,主要从事信号处理方面的理论教学与实验教学研究

数字基带信号实验报告 篇4

专业班级:

指导老师:李 敏

姓 名:

学 号:

实验一 数字基带信号

一、实验目的

1、了解单极性码、双极性码、归零码、不归零码等基带信号波形特点。

2、掌握AMI、HDB3码的编码规则。

3、掌握从HDB3码信号中提取位同步信号的方法。

4、掌握集中插入帧同步码时分复用信号的帧结构特点。

5、了解HDB3(AMI)编译码集成电路CD22103。

二、实验内容

1、用示波器观察单极性非归零码(NRZ)、传号交替反转码(AMI)、三阶高密度双极性码(HDB3)、整流后的AMI码及整流后的HDB3码。

2、用示波器观察从HDB3码中和从AMI码中提取位同步信号的电路中有关波形。

3、用示波器观察HDB3、AMI译码输出波形。

三、实验步骤

本实验使用数字信源单元和HDB3编译码单元。

1、熟悉数字信源单元和HDB3编译码单元的工作原理。接好电源线,打开电源开关。

2、用示波器观察数字信源单元上的各种信号波形。

用信源单元的FS作为示波器的外同步信号,示波器探头的地端接在实验板任何位置的GND点均可,进行下列观察:

(1)示波器的两个通道探头分别接信源单元的NRZ-OUT和BS-OUT,对照发光二极管的发光状态,判断数字信源单元是否已正常工作(1码对应的发光管亮,0码对应的发光管熄);

(2)用开关K1产生代码×1110010(×为任意代码,1110010为7位帧同步码),K2、K3产生任意信息代码,观察本实验给定的集中插入帧同步码时分复用信号帧结构,和NRZ码特点。

3、 用示波器观察HDB3编译单元的各种波形。

仍用信源单元的FS信号作为示波器的外同步信号。 (1)示波器的两个探头CH1和CH2分别接信源单元的NRZ-OUT和HDB3单元的AMI-HDB3,将信源单元的K1、K2、K3每一位都置1,观察全1码对应的AMI码(开关K4置于左方AMI端)波形和HDB3码(开关K4置于右方HDB3端)波形。再将K1、K2、K3置为全0,观察全0码对应的AMI码和HDB3码。观察时应注意AMI、HDB3码的码元都是占空比为0.5的双极性归零矩形脉冲。编码输出AMI-HDB3比信源输入NRZ-OUT延迟了4个码元。

(2)将K1、K2、K3置于0111 0010 0000 1100 0010 0000态,观察并记录对应的AMI(3)将K1、K2、K3置于任意状态,K4先置左方(AMI)端再置右方(HDB3)端,CH1码和HDB3码。 接信源单元的NRZ-OUT,CH2依次接HDB3单元的DET、BPF、BS-R和NRZ ,观察这些信号波形。观察时应注意:

HDB3单元的NRZ信号(译码输出)滞后于信源模块的NRZ-OUT信号(编码输入)8个码元。

DET是占空比等于0.5的单极性归零码。

BPF信号是一个幅度和周期都不恒定的准正弦信号,BS-R是一个周期基本恒定(等于一个码元周期)的TTL电平信号。

信源代码连0个数越多,越难于从AMI码中提取位同步信号(或者说要求带通滤波的Q值越高,因而越难于实现),而HDB3码则不存在这种问题。本实验中若24位信源代码中连零很多时,则难以从AMI码中得到一个符合要求的稳定的位同步信号,因此不能完成正确的译码(由于分离参数的.影响,各实验系统的现象可能略有不同。一般将信源代码置成只有1个“1”码的状态来观察译码输出)。若24位信源代码全为“0”码,则更不可能从AMI信号(亦是全0信号)得到正确的位同步信号。

四、 实验报告要求

1. 根据实验观察和纪录回答:

(1)不归零码和归零码的特点是什么?

(2)与信源代码中的“1”码相对应的AMI码及HDB3码是否一定相同?为什么?

答:1)不归零码特点:脉冲宽度 τ 等于码元宽度Ts归零码特点:τ <Ts

2)与信源代码中的“1”码对应的AMI码及HDB3码不一定相同。因信源代码中的“1”码对应的AMI码“1”、“-1”相间出现,而HDB3码中的“1”,“-1”不但与信源代码中的“1”码有关,而且还与信源代码中的“0”码有关。

2. 设代码为全1,全0及0111 0010 0000 1100 0010 0000,给出AMI及HDB3码的代码和波形。

答:信息代码 1 11 1111

AMI 1 -11-1 1 -1 1

HDB31 -11-1 1 -1 1

信息代码0 0 0 00 0 0 00 0 0 00

AMI 0 0 0 00 0 0 00 0 0 00

HDB30 0 0 1-1 0 0 1 -1 0 0 1 -1

信息代码 0 1 1 10 0 1 00 0 0 01 1 0 00 0 1 00 0 0 0

AMI0 1 -1 1 0 0 -1 0 0 0 0 01 -1 0 0 0 0 1 00 0 0 0

HDB3 0 1 -1 1 0 0 -1 0 0 0-1 0 1 -1 1 0 0 1 -1 0 0 0 –1 0

3. 总结从HDB3码中提取位同步信号的原理。

答:HDB3中不含有离散谱fS(fS在数值上等于码速率)成分。整流后变为一个占空比等于0.5的单极性归零码,其连0个数不超过3,频谱中含有较强的离散谱fS成分,故可通过窄带带通滤波器得到一个相位抖动较小的正弦信号,再经过整形、移相后即可得到合乎要求的位同步信号。

4. 试根据占空比为0.5的单极性归零码的功率谱密度公式说明为什么信息代码中的连0码越长,越难于从AMI码中提取位同步信号,而HDB3码则不存在此问题。

数字语音信号处理实验 篇5

数字图像处理,就是用数字计算机及其他有关数字技术,对图像进行处理,以达到预期的目的。随着计算机的发展,图像处理技术在许多领域得到了广泛应用,数字图像处理已成为电子信息、通信、计算机、自动化、信号处理等专业的重要课程。

数字图像处理课程设计是在完成数字图像处理的相关理论的学习后,进行的综合性训练课程,其目的主要包括:

1、使学生进一步巩固数字图像处理的基本概念、理论、分析方法和实现方法;

2、增强学生应用VC++编写数字图像处理的应用程序及分析、解决实际问题的能力;

3、尝试将所学的内容解决实际工程问题,培养学生的工程实践能力,提高工科学生的就业能力。

三.设计内容: 1.打开图像: 主要代码:

static char szFilter[]=“BMP文件(*.bmp)|*.bmp||”;//定义过滤文件的类型

CString filename;

int ret=dlg.DoModal();//运行打开文件对方框

if(ret==IDOK)

{

filename=dlg.GetFileName();

//获取所选择图像的路径

m_dib.LoadFromFile(filename);

//加载图像

if(!m_dib.m_bLoaded)

//判断是否加载图像成功

{ AfxMessageBox(“图像打不开”);

} return;

CFileDialog dlg(TRUE,“bmp”,NULL, OFN_HIDEREADONLY|OFN_OVERWRITEPROMPT,szFilter);//定义文件对话框对

效果图:

2.水平镜像:把图像的第一列和最后一列调转,第二列和倒数第二列换过来,以此类推下去,直到第nw/2为止。代码: int temp,i,j;

for(j=0;j

for(i=0;i

{

temp=m_dib.m_pdata[j*nw+i];

m_dib.m_pdata[j*nw+i]=m_dib.m_pdata[nw-i-1+j*nw];

m_dib.m_pdata[nw-i-1+j*nw]=temp;

} 效果图:

3.素描风格:先把灰度值与右下的作对比,如果差值大于一个值则说明这是轮廓,先把非轮廓的位置像素置为黑色,最后对所有像素进行底片化处理 代码: int temp,i,j;

for(j=0;j

for(i=0;i

{

temp=m_dib.m_pdata[j*nw+i]-m_dib.m_pdata[(j+1)*nw+i+1];

} if(temp<10)m_dib.m_pdata[j*nw+i]=0;

//黑色为0

for(j=0;j

for(i=0;i

{

int gray=m_dib.m_pdata[j*nw+i];

m_dib.m_pdata[j*nw+i]=255-gray;

}

图:

4图像雾化:在图像中引入一定的随机值,打乱图像中的像素值

代码:

int i,j,k,dat;

//i表示列,j表行

byte *ptemp=(byte *)new byte[nw*nh];

memset(ptemp,0,nw*nh);

for(j=0;j

for(i=0;i

{

k=rand()%8;//取任意的随机值

dat=j*nw+i+k;if(dat>=nw*nh)dat=nw*nh-1;ptemp[j*nw+i]=m_dib.m_pdata[dat];

} memcpy(m_dib.m_pdata,ptemp,nw*nh);效果图:

5.浮雕处理:通过勾画图象轮廓和降低周围像素色值,从而生成具有凹凸感的浮雕效果。其方法是生成一缓冲区,计算当前像素的左上角与右下角的像素值之差,再加上一个补值。将其存储到缓冲区。再将缓冲区的数据逐点替换到图像中并显示出来。代码:

int w=3,i,j;

//w为模板宽度

BYTE *p=new BYTE[nw*nh];

memcpy(p,m_dib.m_pdata,nw*nh);

for(j=w/2;j

for(i= w/2;i

{

p[j*nw+i]=m_dib.m_pdata[(j-1)*nw+i-1]*(1)+m_dib.m_pdata[(j+1)*nw+i+1]*(-1)+120;

}

memcpy(m_dib.m_pdata,p,nw*nh);

delete []p;效果图:

6.直方图均衡化 代码:

int n[256]={0},g[256]={0};//定义频数数组n,均衡化每个像素的灰度级的数组g

double f[256],t[256];//定义频率数组f,累加的频率数组t

int g_max=0,g_mim=255;

int i,j,k,z;

for(j=0;j

//统计灰度级的频数n for(i=0;i

z=m_dib.m_pdata[j*nw+i];

n[z]++;

}

for(k=0;k<=255;k++)

//统计每个灰度级出现的频率

f[k]=n[k]/(nw*nh*1.0);

//累计灰度级的频率

t[0]=f[0];for(k=1;k<=255;k++)

t[k]=t[k-1]+f[k];

for(j=0;j

for(i=0;i

g_max=w>g_max?w:g_max;//得到最大值

g_mim=w

}

for(k=0;k<=255;k++)

//利用公式求每个像素均衡化后的灰度级

g[k]=(int)((g_max-g_mim)*t[k]+g_mim+0.5);

for(j=0;j

//逐个替换

for(i=0;i

k=m_dib.m_pdata[j*nw+i];

m_dib.m_pdata[j*nw+i]=g[k];

}

for(j=0;j

//计算均衡化的直方图

{

//绘制原图像的直方图

for(i=0;i

{

BYTE temp=m_dib.m_pdata[j*nw+i];

m_hist[temp]++;} m_bHist=true;

CString str;int nh=m_dib.GetDIBHeight();int i;// 画坐标轴

// 绘制坐标轴

pDC->MoveTo(410,nh+20);//(410,nh+20)是直方图的左上角坐标

// 垂直轴

pDC->LineTo(410,nh+200);//(410,nh+200)是直方图的左下角坐标

// 水平轴

pDC->LineTo(710,nh+200);//(710,nh+200)是直方图的右下角坐标

// 写X轴刻度值

str.Format(“0”);pDC->TextOut(410, nh+200+10, str);str.Format(“50”);pDC->TextOut(460, nh+200+10, str);str.Format(“100”);pDC->TextOut(510, nh+200+10, str);str.Format(“150”);pDC->TextOut(560, nh+200+10, str);str.Format(“200”);pDC->TextOut(610, nh+200+10, str);str.Format(“255”);pDC->TextOut(665, nh+200+10, str);// 绘制X轴刻度 for(i = 0;i < 256;i += 25){

if((i & 1)== 0){

} // 10的倍数

pDC->MoveTo(i + 10, nh+200-2);pDC->LineTo(i + 10, nh+200+2);

}

else {

} // 10的倍数

pDC->MoveTo(i + 10, nh+200-2);pDC->LineTo(i + 10, nh+200+2);} // 绘制X轴箭头

pDC->MoveTo(705,nh+200-5);pDC->LineTo(710,nh+200);pDC->LineTo(705,nh+200+5);// 绘制y轴箭头

pDC->MoveTo(410,nh+20);pDC->LineTo(405,nh+20+5);pDC->MoveTo(410,nh+20);pDC->LineTo(415,nh+20+5);int max=0;for(i=0;i<256;i++)if(m_yuan[i]>max){

} max=m_yuan[i];

for(i=0;i<256;i++)pDC->MoveTo(410+i,nh+200);pDC->LineTo(410+i,nh+200-(m_yuan[i]*160/max));} if(m_bHist==true)//绘画新的直方图 {

CString str;int nh=m_dib.GetDIBHeight();int i;// 画坐标轴 // 绘制坐标轴

pDC->MoveTo(10,nh+20);//(10,nh+20)是直方图的左上角坐标

// 垂直轴

pDC->LineTo(10,nh+200);//(10,nh+200)是直方图的左下角坐标

// 水平轴

pDC->LineTo(310,nh+200);//(310,nh+200)是直方图的右下角坐标

// 写X轴刻度值 str.Format(“0”);

pDC->TextOut(10, nh+200+10, str);str.Format(“50”);pDC->TextOut(60, nh+200+10, str);str.Format(“100”);pDC->TextOut(110, nh+200+10, str);str.Format(“150”);pDC->TextOut(160, nh+200+10, str);str.Format(“200”);pDC->TextOut(210, nh+200+10, str);str.Format(“255”);pDC->TextOut(265, nh+200+10, str);// 绘制X轴刻度 for(i = 0;i < 256;i += 25){

if((i & 1)== 0){ // 10的倍数

} else {

// 10的倍数

pDC->MoveTo(i + 10, nh+200-2);pDC->LineTo(i + 10, nh+200+2);pDC->MoveTo(i + 10, nh+200-2);pDC->LineTo(i + 10, nh+200+2);} } // 绘制X轴箭头

pDC->MoveTo(305,nh+200-5);pDC->LineTo(310,nh+200);pDC->LineTo(305,nh+200+5);// 绘制y轴箭头 pDC->MoveTo(10,nh+20);pDC->LineTo(5,nh+20+5);pDC->MoveTo(10,nh+20);pDC->LineTo(15,nh+20+5);int max=0;for(i=0;i<256;i++)if(m_hist[i]>max){ max=m_hist[i];

for(i=0;i<256;i++)pDC->MoveTo(10+i,nh+200);pDC->LineTo(10+i,nh+200-(m_hist[i]*160/max));

} } 效果图:

四.心得体会:

通过这次数字图像处理的课程设计,对图片有了更深一层的认识,理解了对图像处理的一些原理,在这个课程设计过程中,需要自己去查阅资料,找资料,还需要理解所找到的资料,遇到问题独立去思考,或者去请教同学,给了我一个很好的锻炼机会,做事情一定要坚持,最后一定会有收获的。

五.参考文献:

《数字图像处理》 ——电子工业出版社

数字语音信号处理实验 篇6

摘要:介绍了一种甚低频低码率数字通信系统的实现方案,该方案中的软件采用混合编程的方法,硬件则用DSP实现,文章给出了整个系统的DSP软硬件调试方法,并通过调试结果表明该方案具有很好的可行性和实时性。

关键词:软件无线电;DSP;混合编程

1引言

现代通信系统已不断由模拟体制向数字化体制过渡,并越来越倾向于采用“软件无线电”的设计方案。即通过构造通用的硬件平台,以使各种相关的通信任务能够用软件完成,从而构成一个具有高度灵活性、开放性的通信系统。现代的DSP通用处理器为实现这一方案提供了极大的便利。

软件无线电的设计思想是:用一个通用、标准、模块化的硬件平台为依托,然后通过软件编程来实现无线电台的各种功能,从而取代基于硬件、面向用途的电台设计方法。功能的软件化实现势必要求减少功能单一、灵活性差的硬件电路,尤其是减少模拟环节,并把数字化处理?A/D、D/A?尽量靠近天线。软件无线电强调体系结构的开放性和全面可编程性。它通过软件的更新来改变硬件的配置结构,从而实现新的功能。软件无线电一般采用标准的、高性能的开放式总线结构,此结构利于硬件模块地不断升级和扩展。

本文介绍一种利用TMS320C31浮点型DSP芯片为核心来设计并实现甚低频低码率数字化语音通信系统的方法。这种通信系统是以DSP硬件为平台,并用硬件来实现系统的外围功能,而用软件来实现核心部分的数字化处理,从而完成整个系统的正常通信工作。

2DSP硬件平台

本通信系统的主要功能是实现语音的数字化传输,其系统功能图如图1所示。具体工作过程如下:

整个通信系统分为两大部分,其工作状态转换由外附的MCU控制。在发送时,语音通过克麦风之后进入语音压缩板进行采样量化及数字化压缩,压缩后的比特流从串口送入DSP内进行调制,调制信号依次通过信道DAC、平滑滤波和功放,然后发送出去;在接收时,前置放大部分送来的`信号再经过一次放大之后送往信道AD转换器,转换的数据FIFO通过中断方式送给DSP进行解调,在DSP内解调之后的数据仍然通过串口送往语音压缩板解压后经扬声器输出。

根据系统要求,本设计选定的DSP是TI公司的TMS320C31。信道AD转换器件选用ANALOGDE-VICE公司的AD7870,它是一个12bit的ADC,具有2μs的片上信号放大时间和8μs的转换时间,最高转换速率为100kHz,可以提供三种输出接口方式?12bit并行方式、字节方式和串行方式?。信道DAC选用的是TI公司的TLV5619,这是一种12bit单通道电压型DA转换器。系统中的ADC和DAC转换器都以并行12bit方式直接和FIFO相连。FIFO?FirstInFirstOut?采用的是双端口RAM构架,其读指针和写指针是完全分开的,可实现读写操作的完全独立,因此,这里选用CYPRESS公司的CY7C425。

3软件实现

本通信系统中的软件采用C语言和混合编程,其中主程序和一部分子程序用C语言编写,而一些运算量比较大的算法子程序则用汇编语言编写,这样,既容易进行调试,又可以提高软件的执行效率,可达到最佳利用DSP芯片的软硬件资源之目的。

整个软件的主程序由发送部分程序段和接收部分段两部分组成,主程序流程图见图2所示,每个程序段又分别是一个独立的程序体,可以独立的实现通信系统的发送和接收功能。

由于要求系统能够实时完成通信任务,故相应的程序须和硬件相互配合,它们各操作之间的同步协调要求很高。而本系统可充分利用DSP芯片所提供的中断和定时器资源来很好地实现系统功能。

串行口发送/接收中断子程序用于完成DSP对串口的发送和接收任务,发送定时器中断子程序流程图如图3所示,图4所示是串口接收中断子程序的流程图。

在系统实现过程中,由于采用了混合

编程,并对运算量比较大的算法用汇编程序来实现,因此,在对128点FFT算法采用汇编语言编程后,可经CCS仿真进行测试。汇编程序的执行时间为111113个时钟周期?2.78ms?,可在一帧时间内?30ms?完成5次FFT和IFFT的帧同步算法,而用C语言实现时的程序执行时间为1812409个时钟周期?45.3ms?。可见,用汇编程序的执行效率有明显的提高。

4结束语

语音信号处理虚拟实验平台设计 篇7

语音信号处理是以语音语言学和数字信号处理等为基础的涉及面很广的交叉学科, 是许多信息领域应用的核心技术之一。目前高校中的语音信号处理课程主要从基础理论、算法实现及实际应用等几个方面来展开教学。由于该课程的理论涵盖面广、数学公式推导较多, 学生学习理论知识会显得枯燥难懂, 且感觉理论和实际应用脱节。针对这种情况, 本文利用美国NI公司的图形化虚拟仪器开发平台Matlab/Simulink, 完成了语音信号处理的虚拟实验仿真平台设计。借助该平台, 学生能较为完整的深化学习该门课程的基础理论, 扎实掌握课程的知识网络结构, 探索语音信号处理算法的实现方法, 同时能将语音信号处理系统的各个部分内容有机地衔接起来, 极大地方便了学生进行语音信号处理的学习, 有利于学生对理论算法的理解, 加强了动手能力, 提高了学习的主动性, 有助于学生创新综合能力的培养。

二、实验平台总体设计

本实验平台采用图形化虚拟仪器开发平台Matlab/Simulink, 它是一种图标代替文本行创建应用程序的图形化编程语言, Matlab采用基于流程图的图形化编程方式, 它编程简单、易于理解、效率高, 针对数据采集、仪器控制、信号分析和数据处理等任务, 设计提供了丰富完善的功能图标, 且能解决极其复杂的数值运算。语音信号处理包含语音信号的数字表达方法、语音信号的数字处理的各种方法以及语音处理理论和技术应用等三个方面的内容。开发的实验平台结构框图如图1所示。

实验平台的语音信号采集由语音采集卡、调理电路和PC机接口组成, 也可由麦克风和声卡将接受的语音信号经COOL EDIT或Praat等语音编辑软件来完成, 以形成待处理的音频文件, 再进行预加重、端点检测等语音预处理, 然后完成语音信号分析、特征参数提取和语音信号处理及应用等实验。

三、实验平台功能实现举例

语音信号在Matlab下对信号分析算法和处理算法进行调试, 无误后导入matlab Script节点中。设计完成的虚拟实验平台界面如图2所示。

程序运行时, 用户可通过编辑设计用户菜单, 点击菜单栏中的下拉菜单选项, 程序会自动弹出相应的前面板, 选择好文件路径, 程序将对语音数据进行分析, 同时实时显示分析处理结果。

1. 端点检测实验的功能实现。

语音预处理的端点检测常用的方法是双门限法, 利用短时能量和短时过零率参数来实现。由于语音的起点可能是能量很弱的清辅音, 此时不能用能量来区别这种清辅音和无声, 必须采用过零率。搜索过零率的时间少于要一个语音帧的长度。图3为端点检测VI。当程序运行时选择待分析的语音信号, “验证数组操作”中显示信号时域波形, “短时能量”和“过零率”即为该语音的对应参数显示。利用短时能量检测的语音端点显示在“端点帧数”表格中。

2. 基音周期检测实验的功能实现。

根据语音信号的短时平均幅度差函数来确定基音周期, 图4为基音周期检测的前面板设计。“短时平均幅度差”显示语音信号的平均幅度差函数, 检测得到的浊音周期在“基音周期”表格中显示出来。

3. 倒谱分析实验的功能实现。

倒谱定义为信号短时振幅谱的对数傅里叶反变换, 倒谱域中基音信息与声道信息相对分离, 采取简单的倒滤波方法可以分离并恢复出声门脉冲激励和声道响应, 并求出基音周期和共振峰。图5为倒谱法求语音的共振峰的前面板。

4. 频谱分析实验的功能实现。

调用Matlab中的谱分析函数模块, 先对语音信号进行分帧, 再将分帧后的语音信号数据转换为波形数据类型, 采样率为8kHz。频谱子VI前面板, 如图6所示。

利用谱分析中的“STFT时频图”模块, 可对分帧语音信号进行联合时频分析, 通过改变前面板中频域窗长, 可实现宽带和窄带语谱图的仿真实现。

5. 孤立词识别实验的功能实现。

基于HMM模型的孤立词识别原理框图, 如图7所示。语音识别系统底层由语音输入模块、预处理模块、特征提取模块、识别模块以及训练模块等5部分组成。

在语音采集过程中, 以0~9这10个数字作为实验对象, 每个语音有200份样本, 分别来自10位男生和10位女生, 每个数字每人采集10份, 共得到2000个语音样本。同样将实验数据分为三组:第一组用于训练, 选择8位女生和7位男生作为参与训练的人, 每人每个数字取2份, 共计300份语音样本;第二组用于检测系统的识别率, 由15个参与训练的人的剩下的语音构成;第三组用于检测系统的识别率, 由未参与训练的5个人的语音组成。

实验中点击系统“语音识别”的二级菜单中的“输入语音”菜单, 可以通过麦克风录音, 如数字“0”;然后完成语音信号的分帧和端点检测等“预处理”;“特征提取”模块可完成对语音信号特征参数的提取, 本实验提取的是12维MFCC及其12维一阶导数, 共24维, 这样可以反映语音信号的静态和动态特征;“识别”模块完成对所录入的语音和模板库内的语音的匹配, 选择累计概率最大的一个作为识别结果。对录入数字“0”的识别结果的输出界面如图8所示。

重复上述过程, 可完成数字语音0~9的孤立词识别。通过实验分析, 可进一步完成系统对参与训练人的语音识别与第三组中未参与训练人的识别率的统计结果比较。

本文设计完成了一种运用Matlab图形化编程环境进行语音信号处理的虚拟实验平台, 能很好地结合学生的书本理论, 方便地完成对语音信号的采集、预处理、语音分析和语音处理等功能及其结果显示。系统具有用户界面简洁和易于扩展实验功能的特点。

摘要:针对语音信号分析与处理的特点, 利用Matlab开发了通用语音信号处理虚拟实验平台, 可完成语音信号的采集、预处理、语音分析和语音处理等功能及其结果显示。阐述了系统总体设计思路, 给出了多种语音分析和处理的功能实现举例。整个系统界面友好, 且具有易扩展的特点。实践证明, 该平台可使学生更好地理解和掌握课程的基本理论, 有利于提高学生的分析问题能力和综合实践能力, 培养学生创新意识。

关键词:语音处理,虚拟实验,Matlab,图形用户界面GUI

参考文献

[1]赵力.语音信号处理 (第2版) [M].北京:机械工业出版社, 2009.

[2]张志涌, 杨祖樱.MATLAB教程[M].北京:北京航空航天大学版社, 2010.

数字语音信号处理实验 篇8

我国目前有8000多万残障人员,其中盲人1600多万,是世界上盲人最多的国家,占世界盲人总数的1/5,而且85%生活在广大的农村,整体的生活水平低于社会平均发展水平。河南省是全国人口的大省,目前有身体残疾的人士450多万人,其中盲人107多万人。

盲人由于生理的缺陷,造成孤僻、多疑和敏感的个性以及强烈的自卑感,使得他们长期把自己封闭,不愿意参加各种社交活动,只能通过广播电台、电视台等获取信息, 满足精神上的需求。同时,他们同样面临着数字鸿沟问题。作为确保公众文化权利的公共图书馆,有责任帮助这些残疾人士缩小甚至消除数字带来的鸿沟,帮助他们平等地获取知识,得到平等发展的机会。如何加强公共图书馆的软硬件建设、建立盲人档案,提升对我省盲人读者服务的质量, 成为当前亟待解决的重要问题。

2 盲人数字图书馆的发展现状

2.1 国外发展现状。盲人数字图书馆是专门针对视力残疾人士整理、收集、控制和存储数字信息,并提供数字信息服务的机构。

在美国,美国国会图书馆(Library Congress,简称LC)从1999年开始,与美国国家盲人与残废人图书馆服务处( NLS)合作,通过了解盲人档案的有关信息,用网页点字系统为盲人用户服务。2001年进一步将网页点字系统拓展到点字杂志。在法国,着眼于因特网数字文献传递的潜力,大力发展盲人点字网工程,通过对盲人档案的调查与分析,确保了盲人的教育、学习、工作。在加拿大,国家盲人协会图书馆馆藏文献超过60000种,其中有30万种有声读物复本。同时,“That all may read”国家项目经费达3300万美元,主要用于基础设施和服务的数字化建设,致使馆藏翻倍,利用效率大幅提高。在韩国,2002年 8月 21日第一个盲人网上图书馆开放,有1.8万多种图书和200种多媒体资料,韩国数字鸿沟委员会将之命名为 “开放数字”。

2.2 国内发展现状。1996年3月,第 62届国际图联大会 (IFLA) 在北京召开,数字图书馆的概念被引入中国。同年,国家图书馆 “数字图书馆项目” 申请立项,开始了我国数字图书馆的建设。而盲人数字图书馆则更为晚些,2008年9月9日,国家图书馆盲人数字图书馆成立,是我国第一家盲人数字图书馆。中国盲人数字图书馆网站采用多种成熟的无障碍信息技术,通过对盲人档案所录信息需求,研发了读屏软件, 盲人可以收听到音乐欣赏、在线讲座、电子图书等数字内容。

3 盲人语音数字图书馆的建设目标

3.1 覆盖全省的服务平台。河南语音数字图书馆平台是目前国内首家在建立盲人档案的基础上,专门针对盲人用户的公益性语音服务平台,该平台的在使用的过程中不受时间、地点的限制,可覆盖河南省18个省辖市、158个县区。并通过方便快捷的接入方案,可以为单位、组织、个人提供数字语音图书服务。

3.2 服务便捷,操作简单。终端操作免培训,可以适用于农村的老人、儿童等知识层次低的人群;同时设备也要有支持盲文操作;可以实现24小时在线服务。

3.3 图书馆服务的有效延伸。后期通过开通call center自动语音提示系统来引导用户进一步了解和关注图书馆的相关服务,并可以通过电话查询相关信息。通过开发手机客户端等,盲人利用3G网络可以实现听书和查询,进一步延伸图书馆为盲人的服务。

3.4 建立盲人读者档案,提高盲文数字图书馆服务绩效。盲人读者档案是指盲文图书馆在使用图书馆资源、接受图书馆服务时所产生的一切与读者相关的资料,是盲人读者利用图书馆的原始记录。

笔者认为,盲人读者档案内容应该包括以下几个方面:

盲人读者个人资料:包括盲人读者姓名、性别、年龄、学历、职业、联系方式等,为提供针对性服务提供依据。

盲人读者借阅资料:记载盲人读者个人借阅资料的种类、数量、次数、时间,利用方式及利用后的满意程度,为进一步优化资料结构提供依据。

盲人读者咨询资料:记载盲人读者的具体提问、咨询和检索的内容、下载或录音的内容、对盲文图书馆的建议意见等。

盲人读者个性相关资料:记载盲人读者的利用目的、阅读倾向、阅读能力、阅读范围、阅读数量,个体的兴趣、爱好、习惯,为准确、快捷服务提供依据。

盲人读者特殊需求资料:根据盲人读者的特点、记载读者就医、就业、培训等特殊需求,为关心盲人读者的身心健康提供服务。

4 盲人语音数字图书馆的关键技术

4.1 语音合成技术。语音技术作为创建盲人语音数字图书馆的关键技术,主要包括语音识别技术和语音合成技术。语音合成,它又被称为文本转换(Text to Speech)技术,电脑能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴,现在语音合成技术已经相当成熟,在很多领域已得到广泛应用。

4.2 语音识别及检索技术。语音识别是指电脑分析人的语言,将之转化为文字输入电脑,从而实现以说话代替键盘的技术。语音识别技术是信息领域的标志技术,这项被科学家称为“比登月还难”的研究,在计算机飞速发展的带动下,有了重大突破,语音识别技术日臻成熟,目前正处于向产品化迈进的转折阶段,如苹果公司iPhone手机上的siri应用,用户可以通过手机进行对话沟通。如果把该应用移植到数字图书馆的应用,就可以突破传统数字图书馆只能通过计算机网络查询的限制,读者通过电话就可以获取图书馆的大量信息,使用户可以不受时间和地域限制,随时享用信息资源,可以极大地满足盲人读者在工作、学习和生活各方面的信息需求。

5 盲人语音数字图书馆的系统架构

5.1 盲人读者语音服务器。盲人读者语音服务器是整个系统的最重要的部分,它负责系统平台中所有通道的信令处理。采用电信级七号信令设备,配以外部接口模块,实现了高可靠性和高性能的七号信令系统。

5.2 数据库服务器。此服务器是整个系统的数据中心,它的主要功能如下:保存整个系统的运行数据、保存系统平台上的所有业务数据、保存整个系统的运行记录数据。数据库服务器为系统平台中的语音服务器提供数据服务,数据库系统采用Microsoft公司的SQL Server数据库系统。

5.3 外部网关服务器。设立此专用的外部网关服务器,以网关形式与外置数据库进行连接,一方面专用处理这种外部数据库访问,减轻IVR系统的负荷;另一方面可以保证系统的安全性。

5.4 计费工作站。本系统平台专门设立一台计费工作站,对于运营商用户,在进行一次呼叫时,由运营商的交换机进行通话费和信息费的计费。

5.5 其他应用服务器。为适应不断变化的IVR业务需求,系统随时可以扩展其他的应用服务器,以专门处理一种或多种应用业务,常用的应用服务器一般包括两种专业的语音辅助功能服务器:文本语音转换(TTS)服务器和语音识别服务器(ASR)。IVR系统平台以网关方式与这种应用服务器进行连接。

6 语音数字图书馆的资源栏目与服务

通过与有关机构协作,河南省图书馆对盲人进行了大量的调研,并对盲人的需求进行了归纳总结,系统主要包括10大类,33个栏目,2012年上线资源4300个节目,约12000小时。目前,河南省语音数字图书馆为河南全省入网用户提供的业务主要有多功能交友聊天室、点歌台、戏迷乐园、在线广播等,正在开发的功能主要有游戏天地、技能培训、广播图书、位置服务等模块。盲人读者可以通过拨打联通电话9602008收听相关资源节目。如“位置服务”,通过拨打9602008,用户可获取到自己的位置及周边的设施等情况,同时亲人也可以通过拨打亲情号及时地获得家人目前所处的详细位置,可以有效地解决目前老人走失、盲人外出迷路的问题。

7 结语

盲人在社会里是特殊群体之一,让这个群体跟上整个社会发展的步伐,是构建和谐社会一项重要的任务,也是公共图书馆的责任和义务。语音技术通过近年在公共图书馆中文化共享工程领域的创新应用,不仅为群众提供了新的服务渠道,大大扩展了文化共享工程的应用范围和服务能力,同时,也大大提高了盲人读者获取信息的能力,使其参与到社会经济建设中来,使盲人平等地获取更多知识,得到平等发展的机会。

上一篇:思修课期末复习下一篇:英语活动周开场白