4.1 语音WAV文件的格式及读取16 4.1.1 语音WAV文件的格式16 4.1.2 语音WAV文件的读取与绘制17 4.2 语音信号特征参数的提取18 4.2.1 语音信号频谱的提取与绘制18
4.1 语音WAV文件的格式及读取16
4.1.1 语音WAV文件的格式16
4.1.2 语音WAV文件的读取与绘制17
4.2 语音信号特征参数的提取18
4.2.1 语音信号频谱的提取与绘制18
4.2.2 语音信号倒谱的提取与绘制20
4.2.3 语音信号基音频率的提取与绘制21
4.3 语音波形的平移22
4.4 软件测试结果分析23
结论25
致谢26
参考文献27
1 绪论
1.1 本课题研究的背景及意义
生产的发展,科技的进步,带来了各种机械的发明和高速发展。语言的发展,更是极大的促进了人与机械机器的协调发展和融合,因此,发展语言,实现人机通话具有极其现实的意义。语言的发展,即是对其外在语音形式的发展,研究语音的标志、合成甚至压缩编码都是对语言信号的进行处理的方法[1],实现人机通信,达到既快速又准确的目的需要发展能相互识别的语言编码。其中,可通过发展机器对人语言的合成和分辨机制,以及进行压缩编码形成机器可识别的编码等,都可实现人机通信,如电话的广泛使用和发展。
语音信号处理是语音和数字处理技术融合发展的学科,不仅如此,它也与多种学科技术都有较强的相关性,例如智能识别、模式机制、心理健康认知能力等,都对人机通信技术的发展具有极大的促进作用,并且与语音信号处理技术相互发展[1]。
社会的进步引起计算环境的复杂多样,敦促着计算机向智能化、快捷化和便携化方向发展,输入方式的多样化满足了人们的需求,那么语音输入的自然和便捷化则需要脱离键盘的约束,使之更加人性化。利用汉语语音交互是人机交互的重要方式。
汉语声调、声调与基音频率有着紧密的关系,即声调因基频的变化而改变,声调随着基频的升高而升高,声调随着基频的降低而降低。由此可以应用于语音识别中,辨认声调的变化可以利用检测出的基音频率。
1.2 国内外研究现状
1.3 总体技术方案及其社会影响
本课题的技术解决方案是设计一个语音信号分析软件,该软件以WAV语音文件为研究对象,绘制其语音波形,通过计算语音信号的频谱和倒谱特征,显示频谱曲线、语谱图、倒谱曲线和基音频率变化曲线。此软件能对汉语的各种声调的基音变化的频率进行的曲线的绘制,和变化频率的分析和总结,让人们更好地分析两者之间的相关性,为汉语的语音识别和发展作出基础性研究。该技术方案应用VC++语言、Microsoft Visual Studio2010开发平台编写,对使用人员的健康是没有危害的并且是安全的,符合法律要求,同时用技术手段促进了汉语文化的发展并且普及汉语语音在社会发展中的广泛应用,促进社会可持续发展。
1.4 技术方案的经济因素分析
从经济角度看,本课题采用的技术方案是合理且性价高的。因为技术方案没有涉及很多实验仪器和设备,只需要一台电脑,开发平台可以从网络上免费下载,实验器材成本较低。技术方案设计的语音信号分析软件具有的功能多,不仅具有分析语音信号的功能,比如频谱分析、倒谱分析及绘制基音频率变化曲线,还有交互功能,比如平移和缩放,技术方案获得的成果较多。
1.5 论文章节安排
论文共四章,各章内容如下:
第一章是绪论,简单概括了本课题设置的目的、研究的进展、国内外的研究状况等,以及对汉语声调、声调与基音频率之间的关系进行了简单说明,阐述了几种提取基音频率的办法,对论文的研究内容进行了基本介绍。