基于相位谱补偿的语音增强算法研究文献综述

 2023-09-25 08:23:53

文献综述

本课题的现状及发展趋势:

语言是人们日常生活中相互传递信息的重要载体,语音作为语言的一种声学表现,结合了声音和一定的意义,在信息的相互传递中扮演着重要的角色[1]。由于语音的应用环境往往不具备单一性,在语音通信及信息交换过程中,面临着多方面的干扰和噪声污染,这些干扰来源于外界环境、语音传输媒介等,同时其他来源的语音也是构成原语音污染的重要因素。这些噪声和干扰对于语音的特性会造成严重的破坏,不可避免的降低语音的质量和可懂度。语音增强作为语音信号处理中的一个研究难点和重点,对于它的研究一直备受学者的关注。其中具备结构简单、使用方便、性能优良的单通道语音增强方法具备十分重要的意义。在语音增强领域中,绝大多数的单通道语音增强方法都聚焦于语音幅度谱的估计,而让相位谱保持不变。目前,单通道语音增强主要可以分为以下几种:维纳滤波[2,3],信号子空间[4,5],谱估计统计模型[6,7]以及目前新兴的小波变换[8,9]和人工神经网络[10,11]等。维纳滤波方法具备算法复杂度较低的特点,但是它的有效性只能在平稳噪声环境下才能得到体现,对于非平稳噪声则无法有效消除背景噪声,同时,对于带噪语音的信噪比要求较高。信号子空间方法能够有效地消除音乐噪声,但是方法的有效性仅体现在对加性白噪声的消除上,同时也要求噪声与语音具备较高的相关性。对于新兴的语音增强算法,往往具备较高的算法复杂度,无法满足实时性的要求。例如,小波变换,除了计算量较大,对于其阈值的选择也没有严格的证明,难以确定。人工神经网络,不仅计算量较大,同时算法的稳定性也不能得到保证。之所以对语音信号进行这样的处理,是因为研究表明,人耳对信号相位并不敏感[12]。后来,人们发现了相位在语音增强中的重要性,M.Krawczyk在2012年提出了单通道语音增强下的相位改善算法[13]。此后,Timo Gerkmann等人在文献中详细的讨论了相位谱估计的重要性和可行性 [14]。之后又出现了基于相位谱补偿(PhaseSpectrum Compensation, PSC)的语音增强算法,基于短时傅里叶变换的相位重构算法,说明了只通过相位信息的重构,而保持幅度谱不变,也可以达到语音增强的目的.但是通过观察语谱图可以看出,仅对相位信息进行处理,只能捕捉到信号的细节信息,而语音的整体结构是通过频谱图所体现的。为了解决这种问题,王栋,贾海蓉等人又提出了一种改进的相位谱补偿的语音增强算法[15]。该算法考虑到之前的相位谱补偿算法不能根据噪声的大小来不同程度地对带噪语音进行补偿,提出一种基于计算每帧语音输入信噪比的相位谱补偿函数,并采用新的语音存在概率(Speech Presence Probability,SPP)的算法来估计噪声功率谱密度,通过维纳滤波与改进的相位谱补偿算法相结合,达到更好的增强效果,弥补了之前相位谱补偿算法信噪比提高不明显的问题。

本课题的价值:

实际环境中的噪声总会使语音识别和语音通信受到不同程度的影响,使语音识别和语音通信的质量下降,严重时甚至使得正常的语音被淹没在噪声中无法被识别。语音增强就是改进语音质量,尽可能的消除带噪语音中的噪音成分,提高语音的可懂度。基于相位谱补偿的语音增强算法是一种很实用的语音增强技术,相对于传统算法,具有更好处理效果,可以有效地去掉背景噪声。通过使用一种基于计算每帧语音输入信噪比的相位谱补偿函数,并采用新的语音存在概率(Speech Presence Probability,SPP)的算法来估计噪声功率谱密度,通过维纳滤波与改进的相位谱补偿算法相结合,达到更好的增强效果,弥补了信噪比提高不明显的问题。

参考文献:

[1] 胡航.语音信号处理.第三版.哈尔滨:哈尔滨工业大学出版社,2005,1-27.

[2] Amehraye A, Pastor D, and Tamtaoui A.Perceptual improvement of Wiener filtering. In Proc of IEEE Conf on theAcoustics, Speech, and Signal Processing, Las Vegas, 2009:2081-2084.

[3] 容强, 肖汉. 基于 MMSE 维纳滤波语音增强方法研究与 Matlab 实现[J]. 计算机应用与软件, 2015, 32(1): 153-156.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。