语音信号增强算法研究文献综述

 2023-11-26 19:02:55

文献综述

人们在语音通信的过程中将会不可避免的受到周围噪声环境的干扰,由于这些干扰噪声的存在,接收者收到的语音已不是纯净的语音信号。为了尽可能的避免噪声的干扰,基于语音信号增强处理的研究非常重要。然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳;二是提高语音可懂度,方便听者理解。这两个目的往往不能兼得,到目前为止还没有哪种语音增强系统可以同时很好地改善语音质量和可懂度这两个指标。目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著的降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。这是因为在实际环境中,语音总会受到外界环境噪声的干扰,这些噪声包括从周围环境,传输媒介中引入的噪声,电器设备的噪声以及其他说话人的干扰等等。环境噪声会影响语音质量,严重的情况下语音将完全淹没到噪声中,无法分辨。语音质量的下降会使语音处理系统的性能急剧恶化。比如,语音识别系统在实验室环境中可取得相当好的效果,但在噪声环境中,尤其是在强噪声环境中使用时,系统的识别率将受到严重影响。低速语音编码同样会受到噪声的影响。由于语音生成模型是低速率语音编码的基础,当语音受到噪声干扰时,提取的模型参数将很不准确,重建的语音质量急剧恶化。此时,采用语音增强技术进行预处理,将有效的改善系统性能。

随着计算机的出现,语音分析工作,得以在电子计算机上进行。在此基础上,语音信号处理的研究工作得到了计算机技术的帮助,取得了突破性的进展。且随着信息技术的不断发展,尤其是网络技术的日益普及和完善,语音信号处理技术正发挥着越来越重要的作用,并且出现了一些新的方向。(1)基于语音的信息检索。随着网络技术及数字图书馆技术的发展,针对于传统的基于文本信息的检索技术,基于语音识别的信息检索技术正成为当今的研究热点;(2)基于语音识别的广播新闻的自动文摘技术的研究。由于广播、电视中的发音较为标准规范,识别中避免了说话人发音的不规范,有利于语音识别系统性能的提高;(3)VOIP技术,它是通过TCP/IP网络,而不是传统的电话网络来传输语音的新的通信方式,通常称为IP电话技术。它是网络上对压缩的语音数据以及数据包的形式进行传输和识别。随着手机、PDA等移动电子设备的发展,嵌入式语音识别算法的研究已逐渐成为研究的热点;(4)语音训练与校正技术也是近年来语音信号处理的一个重要方向。

语音增强是在噪声环境下用以提高语音通信系统质量的一个重要技术。随着语音技术研究的深入和实际应用的增多,各种语音处理系统都面临着进一步提高性能的问题,语音增强是其中的关键技术之一,已有几十年的研究发展历史。其研究起与20世纪60年代,随着数字信号理论的成熟,在70年代曾形成一个理论高潮,取得了一些基础性成果,并使语音增强发展成为语音信号处理的一个重要分支。1978年,Lim和Oppenheim提出了基于维纳滤波的语音增强方法;1979年,Boll提出了谱相减方法来抑制噪声;1980年,Maulay和Malpss提出了软判决噪声抑制方法;1984年,Ephraim和Malah提出了基于MMSE短时幅度谱估计的语音增强方法;1987年,Paliwal把卡尔曼滤波引入语音增强领域;1995年Ephraim提出了基于信号子空间分解的语音增强方法。近年来,基于子空间的语音增强技术受到许多研究者的重视,该方法可减少信号的失真和人为噪声的引入。子空间技术将带噪语音信号看成向量空间的一部分,并将此向量空间划分成两个相互正交的子空间:信号子空间和噪声子空间。去除噪声子空间的信号分量可以提高带噪信号的语音质量,进一步从信号子空间中估计出高质量的语音信号。Ephraim and Van-Trees提出了一套有效的子空间语音增强系统,利用特征值分解(EVD)和卡维南-洛维(KLT)变换分解来进行信号空间的划分,并针对白噪声背景下的带噪语音,提出了有效的时域和频域的线性估计算法。

资料编号:[680713]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。