基于谱能量的语音端点检测算法研究文献综述

 2023-09-25 08:23:49

文献综述

一、文献综述与调研报告:(阐述课题现状及发展趋势,课题的价值、参考文献)

本课题的现状及发展趋势:

近年来随着通信技术及数字信号处理技术的飞速发展,语音端点检测用于区别语音和噪声,在语音处理系统中具有重要意义[1]。语音端点检测是指在背景噪声存在下,找到一个单词或语音段的起始点和结束点。它在语音识别、语音编码和语音传输等语音信号处理中起着重要作用[2]。一种有效的端点检测方法,不仅能正确标识语音端点,而且能减少数据处理时间、提高效率和节省数据存储空间。

传统的语音端点检测算法主要是依据语音信号的时频特性,它采用的主要参数是短时能量和短时平均过零率等。主要是: 短时能量法[3,4]、短时平均过零率法[5,6]、短时能零积法[7]。它们的基本思想就是对输入的语音信号进行相应数学计算,然后将它们与初始设定的门限阀值进行比较来判定有声段和无声段。

(1)传统的端点检测算法

1)短时能量检测方法

语音信号和噪声信号的主要区别在于它们的能量,语音段的能量比噪声段的大,语音段的能量是噪声段的能量与语音声波能量的和。所以如果环境噪声和系统输入的噪声比较小并保证系统一定信噪比的情况下,那么只要计算输入信号的短时能量(短时平均幅度) 就能通过设定门限把语音段和背景噪声段分开。

2)短时过零率检测方法

这种方法是在短时能量法的基础上将短时能量和短时平均过零率结合起来设置双门限进行语音端点检测。在离散时间语音信号中,如果相邻的采样点具有不同的代数符号就称发生了过零,由此可以计算得到过零的次数,那么单位时间内的过零次数就是过零率,因为语音信号是宽度信号,所以用平均过零率比较确切。而研究表明,清音的过零率较高,浊音和噪音次之且两者相当。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。