谱减法智能摄像头的音频处理

使用的谱减法降噪算法是利用的功率谱减法,其中我们假定噪音和语音信号是互相不存在关联的并且噪音是均值为0的白色高斯分布,但是在我们的日常生活中,近乎不存在一种噪音是零均值的


摘要:本篇论文重点探讨了通过谱减法的原理和来进行音频的降噪处理,为了达到降低音频噪声,增强音质效果从而可以加强对其中信息的提取。S.Boll首先假定噪音是一种加性噪声。同时,这样的一种噪音是平缓且稳定的或者其变换的十分慢的。并且他在噪音和音频信号是互相不关联的情况下,提出了谱减法的这样一种降噪算法。利用这种方法能够有效的减弱周围环境的噪音对音频的影响,然而因为部分的平稳性的假定与我们平时的现实生活中的情况并不是完全符合的,因此利用这样的方法并不是特别理想。所以Berouti在基本谱减法的原理上增加了能够对噪音功率谱密度函数进行大小调节的技术,并且还有增加了语音信号功率谱密度函数的最小值的限制,提升了利用谱减法进行语音增强的性能。

在论文最后,根据在现实生活中的噪音和语音信号之间一般都会具有一定的互相关联的状况,我们提出了进一步的算法改进,并且对这一算法改进做出了数学推导,论证了这样的算法具有一定的可行性。

关键词:语音增强;谱减法;噪声估计;仿真实验;改进算法

Audio Processing of Smart Camera

Abstract: This paper mainly studies the principle of spectral subtraction and its implementation process and understands its application in speech enhancement. The purpose is to enhance speech quality, reduce speech distortion and improve its intelligibility. Mr. S. Boll proposes spectral subtraction (SS: Spectral Subtraction) assuming that the noise is a stationary or slowly varying additive noise, and that the speech signal and the noise signal are not correlated. This method can suppress the influence of background noise, but because the assumption of its local stability is not consistent with the actual situation, the effect is not ideal, and the residual music noise is large; Mr. Berouti adds a coefficient that adjusts the size of the noise power spectrum and a minimum limit of the enhanced speech power spectrum on the basis of traditional spectral subtraction, which improves the performance of spectral subtraction.

Finally, based on the actual situation that the noise and the speech have certain correlation, we proposed the further improvement idea of the algorithm, and made a mathematical derivation of this idea, and obtained the direction and feasibility of further improvement of the algorithm.

Keywords: Speech Enhancement; Spectral Subtraction; Noise Estimation; Simulation Experiments

目  录

1  引言 1

2  设计原理 2

2.1 噪音的生成及噪音的分类 2

2.2谱减法原理 4

2.3 谱减法建立的假设 7

3  谱减法的改良版算法 9

4  算法实现 10

5  设计结果和仿真波形 15

6  算法的比较 19

7  谱减法降噪的数学推导及进一步改进 20

致谢 22

参考文献 22

附录 23

1  引言

语言是人们最主要、直白和方便的互相交流和交换的方法之一。在近年来,科学技术随着时代的发展也正在飞速的进步,人类因此也不完全满足于通过计算机来进行交换人们之间交流的信息,由此人们希望能够用语音语言的方式从而控制计算机,并且通过这样的方式来摆脱使用繁复的键盘和鼠标操作。因此,为了顺应当下的时机和大众的诉求,由此产生了语音信号处理技术。

语音在传递和发送的过程中总是无法避免的一定会发生受到来自周遭环境和传播语音的物质工具而引入的噪声、有线和无线通讯设备中的内部噪声、甚至是周遭的人的说话声会产生的语音的干扰。例如:铁路运输车站、地铁站、游乐场等一系列公共场所,道路旁的公共电话亭中的公用电话、家用轿车中普遍使用的车载电话等都经常会受到噪声干扰,且普遍噪声声音都较为强烈,严重时会影响正常电话语音交流。当正在进行语音通话的双方或者多人的彼此距离都比较远的时候,在语音通讯中传输的能够在语音环境中提取出的有效的语音信息会受到通信的通道噪声和有线和无线通讯设备本身就会存在的噪声的干扰。而在这些噪声比较多比较嘈杂的情况下则需要对以上这些含有噪音的语音进行语音增强、提高语音的可识别能力的处理,从而减少和降低语音中的背景噪声,改进和提高语音的质量。除此以外在语音的识别系统和语音的编码系统中,这些语音系统一般主要都是针对的是没有噪声和杂音的语音来进行策划和编写设计。而这些系统在对含有噪音的语音音频进行识别和编码等处理的时候会影响和破坏这些系统中的各种功能和效用,严重的话还会导致这些系统不能正常使用。由此,我们更需要在做语音识别和语音编码前对含有噪音的语音进行语音降噪和语音增强的处理。