京东旗舰店

News

新闻中心

会议电视系统关键技术中视音频压缩编解码技术分析

2023-10-14 160

会议电视系统中,所传送的视音频信号在数字化后具有很高的码率,如CIF格式及QCIF的图像,一幅图像的有效像素点分别为352×288及176×144。这两种格式的最大帧频为每秒30帧(实际为29.97每秒帧)。当每像素量化为8bit时,CIF及QCIF格式的码率分别为36.5Mbit/s和9.1 Mbit/s,这样高的码率要在ISDN信道64 kbit/s至2.048 Mbit/s上传输,需进行高压缩比的视频压缩编码。


图像压缩编码通常利用两个基本原理。一是利用图像信号的统计性质,即图像在相邻像素间、相邻行间及相邻帧间均存在较强的相关性,因此可以依据信息论中信息编码的原理,去除冗余度。二是利用人眼的视觉特性来实现图像压缩。例如在斜方向的析像清晰度的视感度低于水平与垂直方向的视感度,故压缩斜方向的高通信号部分,对析像清晰度影响很小。人们对高频率的信号成分的视感度低,故在一定程度上压缩高频率成分并无多大影响。色度信号的视感度低于亮度信号,故可对色度信号频带在行及帧方向进行压缩等。


应用在会议电视系统中的图像压缩编码标准主要是H.261、H.262(MPEG)、H.263及MPEG-4等。


会议电视系统关键技术中语音压缩编码的分类:


1、基于语音波形进行编码的波形编码法。


2、基于语音特征参数进行编码的参数编码法。


3、前二类方法混合使用的混合编码法。


CCITT第15研究组(SGXV,现改称为ITU-TS的SG15)对语音信号压缩编码制定了各种标准。相应的建议为G系列,简述如下。


① G.711“音频的脉冲编码调制(PCM)”建议。该建议规定抽样频率为8kHz,每一抽样按A律或μ律压扩量化成8bit的64kbit/s的PCM编码。G.711建议用于200Hz至3.4kHz频带内的语音信号的编码,采用非线性量化后,其编码质量相当于12bit的线性量化的效果。


② G.721“32kbit/s自适应差分脉冲编码调制(ADPCM)”建议。该建议编码速率为32 kbit/s,这样可以在64kbit/s的PCM信道中同时传送两路语音信号,也可用在调幅广播的音频信号及交互式激光唱盘(CD-I)的音频压缩编码中。


③ G.722“SB-ADPCM编码” 建议。G.711及G.721主要用在300~3400Hz电话信号带宽的信道中。G.722是在64kbit/s的信道中传送50~7000Hz的音频信号。G.722有时可称为宽带音频编码建议,抽样频率为16kHz,针对有些应用需要还可在64kbit/s信道中传输数据。为了使音质降低最小,同时又满足数据传输要求,G.722定义了64kitbit/s、56kbit/s及48kbit/s三种语音传输模式,在保证信道总传输速率为64kbit/s时,相应有0、8kbit/s及16kbit/s三种传输速率用于数据传输。G.722建议可以用在N-ISDN的一个B信道上传输调幅广播质量的音频信号,并可用于电视会议及多媒体通信中。


④ G.728“利用低时延码激励线性预测(LD-CELP)以16kbit/s语音编码”建议。该建议的传输码率低至16kbit/s,但其质量与32kbit/s的G.721建议相当,适用于200~3400kHz音频带宽,三次音频转接时其时延小于5ms,抗干扰能力强,允许10~10误码。G.728可应用在数字移动通信、可视电话等通信系统中。


⑤ G.723“传输速率为5.3kbit/s及6.3kbit/s的多媒体通信语音编码器”建议。该建议是1995年ITU-T通过的低比特率音频编码标准,采用了多脉冲最大似然量化激励(MP-MLQ)编码方法,传输速率分为两挡,即5.3kbit/s及6.3kbit/s。现改名为G.723.1。


⑥ G.729 “使用共轭结构代数码激励线性预测的语音编码(CS-ACELP)”建议。该建议采用矢量量化方法编码线性预测系数,长时和短时激励码本矢量和增益。帧长为10ms(80个样点),总编解码延迟为25ms,码率为8kbit/s。能够同时获得高压缩比和高质量的语音。