语音编码的编码的分类

如题所述

语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为波形编码、参量编码(音源编码)和混合编码,波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量进行编码,混合编译码是结合波形编译码和参量编译码之间的优点。波形编译码器虽然可提供高话音的质量,但数据率低于16kb/s的情况下,在技术上还没有解决音质的问题。 基本原理是在时间轴上对模拟话音信号按照一定的速率来抽样,然后将幅度样本分层量化,并使用代码来表示。在接收端将收到的数字序列经过解码恢复到原模拟信号,保持原始语音的波形形状。话音质量高,编码速率高。如PCM编码类(a率或u率PCM、ADPCM、ADM),编码速率为64-16kb/s,语音质量好。
波形编码的目的在于尽可能精确地再现原来的语音波形,并以波形的保真度即自然度为其质量的主要度量指标,但波形编码所需的码速率较高。 根据语音信号产生的数学模型,通过对语音信号特征参数的提取后进行编码(将特征参数变换成数字代码进行传输)。在接收端将特征参数,结合数学模型,恢复语音,力图使重建语音保持尽可能高的可懂度,重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测(LPC)编码类。编码速率低,2.4-1.2kb/s,自然度低,对环境噪声敏感。
这种语音编码的主要质量指标是可懂度,参量编码可以将语音编码以后的速率压得很低。 将波形编码与参数编码相结合,在2.4-1.2kb/s速率上能够得到高质量的合成语音。混合编码把波形编码的高质量和参量编码的高效性融为一体,在参量编码的基础上附加一定的波形编码特征,实现在可懂度的基础上适当地改善自然度的目的。
用于移动通信中的语音编码一般都是混合编码。选择混合编码时,要使比特率、质量、复杂度和处理时延这4个参量及其关系达到综合最佳化。 语音中最基本的元素是音素,大约有128~256个,如果按通常的说话速度,每秒平均发出10个音素,则信息率为:I=[log2(256)10]bps=80bps
把发音看成是以语音速率来传送,则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps,到极限速率80bps,之间的距离,对于理论研究和实践有着极大的吸引力。

温馨提示:答案为网友推荐,仅供参考
相似回答