语音信号处理、语音信号分析

网友投稿 266 2022-10-31


语音信号处理、语音信号分析

1、语音信号倒谱??有什么用呢?它和 频谱有什么区别呢? 2、线性预测分析是预测什么呢?准确吗?

语音信号的倒谱分析就是求取语音倒谱特征参数的过 程,它可以通过同态处理来实现。 同态信号处理也称为同态滤波,它实现了将卷积关系 变换为求和关系的分离处理,即解卷。 对语音信号进行解卷,可将语音信号的声门激励信息 及声道响应信息分离开来,从而求得声道共振特征和 基音周期,用于语音编码、合成、识别等。 对语音信号进行解卷,求取倒谱特征参数的方法有两 种,一种是线性预测分析,一种是同态分析处理。

日常生活中遇到的许多信号,它们并不是加性信号(即 组成各分量按加法原则组合起来)而是乘积性信号或卷 积性信号,如语音信号、图像信号、通信中的衰落信号、 调制信号等。

些信号要用非线性系统来处理 而同态信号处理就是将非线性问题转化为线性问题的处 理方法。 按被处理的信号来分类,大体分为乘积同态处理和卷积 同态处理两种。 由于语音信号可视为声门激励信号和声道冲激响应的卷 积,所以这里仅讨论卷积同态信号处理。

同态信号处理的基本原理 1)不同信号的处理方法 加性信号:线性关系、叠加原理——处理方法成熟 乘性信号:加性信号 卷积信号:非线性关系、不能用叠加原理——处理困难 2)卷积同态系统*表示离散时间卷积运算

同态信号处理的基本原理

任何同态系统都可以表示为三个子系统的级联

同态信号处理的基本原理

同态信号处理的基本原理

复倒谱和倒谱

语音信号两个卷积分量的复倒谱

语音信号可看做是声门激励信号 和声道冲激响应两信号的卷积, 分别讨论这两个信号的复倒谱的 性质。

复倒谱和倒谱

相位卷绕的产生是由于相位的多值性问题,对 复倒谱的影响: 它会使后面由复倒谱恢复语音等运算存在不确定 性而产生错误。 对策: 改进算法,避开相位求和!微分法

MEL频率倒谱参数(MFCC)与普通实际频率倒谱分析不同,MFCC(Mel-Frequency Cepstral Coefficents,简称MFCC)的分析着眼于人耳的 听觉特性,因为,人耳所听到的声音的高低与声音的频 率并不成线性正比关系,而用Mel频率尺度则更符合人 耳的听觉特性。所谓Mel频率尺度,它的值大体上对应 于实际频率的对数分布关系。Mel频率与实际频率的具 体关系可表示为:

取每个三角形的滤波器频率带宽内所有信号幅度加 权和作为某个带通滤波器的输出——对所有滤波器输 出作对数运算——做离散余弦变换。(具体见P71)

语音信号的吸纳性预测分析 1947年维纳首次提出了线性预测 1967年板仓把线性预测技术应用到了语音分析和合成中 目前,线性预测普遍应用于语音信号处理的各个方面 线性预测分析的基本思想是:由于语音样点之间存在相 关性,所以可以用过去的样点值来预测现在或未来的样 点值,即一个语音的抽样能够用过去若干个语音抽样或 它们的线性组合来逼近。通过使实际语音抽样和线性预 测抽样之间的误差在某个准则下达到最小值来决定唯一 的一组预测系数。 而这组预测系数就反映了语音信号的特性,可以 作为语音信号特征参数用于语音识别、语音合成等。

线性预测分析要解决的问题是:给定语音序列 (显然,鉴于语音信号的时变特性,LPC分析必须按 帧进行),使预测误差在某个准则下最小,求预测 系数的最佳估值ai,这个准则通常采用最小均方误 差准则。

说明: (1)求解滤波器系数 ai和增益常数G的过程称为 语音信号的线性预测分析 (2)鉴于语音信号的时变特性,预测系数的估计必 须在一段语音信号中进行,即分帧进行 (3)对于鼻音和摩擦音,要求声道传递函数既要有 极点也要有零点,即采用零极模型

线性预测方程组的求解


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:在线接口文档(在线接口文档编写)
下一篇:接口管理平台(接口管理平台推荐)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~