现今主流的图像视频压缩标准及技术

1）MJPEG

　　MJPEG的优点是画质还比较清晰，缺点是压缩率低，占用带宽很大。一般单路占用带宽2M左右。

　　2）H.263

　　H.263 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩标准。H.263 采用运动视频编码中常见的编码方法，将编码过程分为帧内编码和帧间编码两个部分。埃帧内用改进的DCT 变换并量化，在帧间采用1/2 象素运动矢量预测补偿技术，使运动补偿更加精确，量化后适用改进的变长编码表（VLC）地量化数据进行熵编码，得到最终的编码系数。

　　H.263标准压缩率较高，CIF格式全实时模式下单路占用带宽一般在几百左右，具体占用带宽视画面运动量多少而不同。缺点是画质相对差一些，占用带宽随画面运动的复杂度而大幅变化。

　　3）MPEG-1

　　VCD标准。

　　制定于1992年，为工业级标准而设计，可适用于不同带宽的设备，如CD-ROM,Video-CD、CD-i。它用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码，经过MPEG-1标准压缩后，视频数据压缩率为1/100～1/200，影视图像的分辩率为360×240×30（NTSC制）或360×288×25（PAL制），它的质量要比家用录像系统（VHS-Video Home System）的质量略高。音频压缩率为1/6.5，声音接近于CD-DA的质量。MPEG-1允许超过70分钟的高质量的视频和音频存储在一张CD-ROM盘上。VCD采用的就是MPEG-1的标准，该标准是一个面向家庭电视质量级的视频、音频压缩标准。MPEG-1的编码速率最高可达4-5Mbits/sec，但随着速率的提高，其解码后的图象质量有所降低。MPEG-1也被用于数字电话络上的视频传输，如非对称数字用户线路(ADSL)，视频点播(VOD)，以及教育络等。同时，MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。MPEG1标准占用的络带宽在1.5M左右。

　　4）MPEG-2

　　DVD标准。

　　制定于1994年，设计目标是高级工业标准的图象质量以及更高的传输率，主要针对高清晰度电视（HDTV）的需要，传输速率在3-10Mbits/sec间，与MPEG-1兼容，适用于1.5～60Mbps甚至更高的编码范围。分辩率为720×480×30（NTSC制）或720×576×25（PAL制）。影视图像的质量是广播级的质量,声音也是接近于CD-DA的质量。MPEG-2是家用视频制式（VHS）录像带分辩率的两倍。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道，和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理，使得大多数MPEG-2解码器也可播放MPEG-1格式的数据，如VCD。除了做为DVD的指定标准外，MPEG-2还可用于为广播，有线电视，电缆络以及多级多点的直播 (Direct Broadcast Satellite) 提供广播级的数字视频。MPEG-2的另一特点是，其可提供一个较广的范围改变压缩比，以适应不同画面质量，存储容量，以及带宽的要求。对于最终用户来说，由于现存电视机分辨率限制，MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显，到是其音频特性(如加重低音，多伴音声道等)更引人注目。

　　MPEG-2的画质质量最好，但同时占用带宽也非常大，在4M~15M之间，不太适于远程传输。

　　5）MPEG-4

　　如果说，MPEG-1“文件小，但质量差”；而MPEG-2则“质量好，但更占空间”的话，那么MPEG－4则很好的结合了前两者的优点。它于1998年10月定案，在1999年1月成为一个国际性标准，随后为扩展用途又进行了第二版的开发，于1999年底结束。MPEG－4是超低码率运动图像和语言的压缩标准，它不仅是针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。MPEG-4标准主要应用于视像电话(Video Phone)，视像电子邮件(Video Email)和电子新闻(Electronic News)等，其传输速率要求较低，在4800-64Kbits/sec之间，分辨率为176X144。MPEG-4利用很窄的带宽，通过帧重建技术，压缩和传输数据，以求以最少的数据获得最佳的图象质量。与MPEG-1和MPEG-2相比，MPEG-4为多媒体数据压缩提供了一个更为广阔的平台。它更多定义的是一种格式、一种架构，而不是具体的算法。它可以将各种各样的多媒体技术充分用进来，包括压缩本身的一些工具、算法，也包括图像合成、语音合成等技术。 MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看，允许你加入其中，即有交互性)的动态图象标准；它的另一个特点是其综合性；从根源上说，MPEG-4试图将自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和可扩展性。

　　MPEG4标准的占用带宽可调，占用带宽与图像的清晰度成正比。以目前的技术，一般占用带宽大致在几百K左右。

6）WMV-HD

　　WMV-HD是由软件业的巨头微软公司所创立的一种视频压缩格式。其压缩率甚至高于MPEG-2标准，同样是2小时的HDTV节目，如果使用MPEG-2最多只能压缩至30GB，而使用WMV-HD这样的高压缩率编码器，在画质丝毫不降的前提下都可压缩到15GB以下。

　　WMV-HD，基于WMV9标准，是微软开发的视频压缩技术系列中的最新版本，尽管WMV-HD是微软的独有标准，但因其在操作系统中大力支持WMV系列版本，从而在桌面系统得以迅速普及。在性能上，WMV-HD的数据压缩率与H.264一样，两者的应用领域也极其相似，因此在新一代主流视频编码标准霸主地位的争夺之中，双方展开了针锋相对的斗争，而斗争的焦点集中在下一代光盘规格“HD DVD”和数字微波广播电视等领域。

　　WMA-HD格式对系统有很高的要求，要想实现对WMA-HD格式的HDTV文件的播放，至少需要 P4 2.4G，建议使用 P4 3.0G以上处理器。而且根据微软的说法建议搭配384 MB 内存，并建议配备 512 MB 内存进行播放。同时具备128 MB 显存的显示卡也是必须的。同时播放还只适用于 Windows XP以上操作系统，软件方面则要求用户安装DirectX 9 和 Windows Media Player 9 系列。不过以上只是搭配Windows Media Player 9或者WINDVD之类占用系统资源较多的播放软件的建议系统配置要求。如果我们采用Media Player Classic之类节省系统资源的软件时，对系统要求可降低到P4 2.0G/AMD 2000+ 、256M的建议系统配置。如果你的电脑满足不了这样的配置，就可能会在播放过程中产生画面与语音不同步、画面经常停顿、爆音等现象，严重的话甚至无法顺利观看。

　　一般采用.wmv为后缀的HDTV文件就是采用的WMV-HD压缩的。

　　目前DVD论坛已经初步批准将微软的MPEG-2、H.264和WMA-HD作为下一代DVD即HD－DVD技术的强制执行标准。

　7） H.264

　　H.264是由国际电信联盟（ITU-T）所制定的新一代的视频压缩格式。H.264最具价值的部分无疑是更高的数据压缩比。在同等的图像质量条件下，H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2-3倍，比MPEG-4高1.5-2倍。正因为如此，经过H.264压缩的视频数据，在络传输过程中所需要的带宽更少，也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时，H.264只需要1Mbps-2Mbps的传输速率，应用范围从3G手机、iChat AV视频会议、HD广播、HD DVD等等，目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳，成为新一代HD DVD的标准，不过H.264解码算法更复杂，计算要求比WMA-HD还要高，我们知道WMA-HD已经让我们叹为观止了，同时我们知道ATi下一代显卡R520会加入对H.264硬解码的支持，不过H.264是相当有前景的视频技术。

　　与MPEG-4一样，经过H.264压缩的视频文件一般也是采用.avi 作为其后缀名，同样不容易辨认，只能通过解码器来自己识别。

图像编码方法可分为两代：第一代是基于数据统计，去掉的是数据冗余，称为低层压缩编码方法；第二代是基于内容，去掉的是内容冗余，其中基于对象（Object－Based）方法称为中层压缩编码方法，其中基于语义（Syntax－Based）方法称为高层压缩编码方法。

　　基于内容压缩编码方法代表新一代的压缩方法，也是目前最活跃的领域，最早是由瑞典的Forchheimer提出的，随后日本的Harashima等人也展示了不少研究成果。

3.2运动估计和补偿

　　MPEG－4中提供了基于块的运动估计和补偿技术来有效地利用各个VOP中视频内容上的时间冗余。一般，运动估计和补偿可以看作针对任意形状图像序列的块匹配技术的延伸。块匹配过程对于标准宏块使用；预测误差和用于预测的宏块运动向量一起被编码；高级运动补偿模式支持重叠块运动补偿，可对8×8块运动向量进行编码。为了使运动估计得到高编码效率，预测图像和被预测图像越相似越好，所以在运动估计之前要先进行补偿。在目标边界上的MB先用水平填补而后用垂直填补，其余完全在VOP之外的MB用扩张填补。

3.3纹理编码

　　纹理指的是I－VOP图像和P/B－VOP经运动补偿后残留的图像信息。纹理一般在变换域进行压缩编码和熵编码。

　　静态图像压缩编码标准（JPEG）；数字声像储存压缩编码标准（MPEG－1）；通用视频图像压缩编码标准（MPEG－2）。

3.1形状编码

　　形状信息的获得首先要对图形进行分析和分割，把各个代表不同内容的目标分割后再用形状表示。形状信息通常用二值Alpha平面和灰度Alpha平面来表示。二值Alpha平面可用临近信息进行算术编码（CAE）；灰度Alpha平面可用运动补偿加DCT变换方式类似纹理编码一样进行编码。

　　其中用于图像压缩的变换有离散Forier变换（DFT）、离散小波变换（DWT）、奇异值分解（SVD）、K－L变换、Walsh变换、Hadamard变换、Harr变换、Slant变换、离散余弦变换（DCT）。其中K－L变换的去相关性最好，而DCT是接近K－L变换效果的最便于实现的变换。和MPEG－1/2一样，MPEG－4也选择了DCT。通常，用于数据压缩的熵编码方法有霍夫曼（Huffman）编码、矢量量化、算术编码、游程编码、LZW编码等。对于纹理编码，MPEG－4选择了把游程编码、矢量量化和Huffman编码进行混合编程编码（VLC）。纹理编码要经过DCT变换、量化、DC/AC预测、扫描、基于Hufman的VLC编码。

3.4伸屈性

　　视频的伸屈性，包括空间伸屈性和时间伸屈性。空间伸屈性可以得到不同的空间分辨率，时间伸屈性可得到不同的时间分辨率。每种伸屈都有多层，在只有高低2层的情况下，底层指的是基本层，而高层指的是增强层。

3.5差错回避

　　VLC码中的一个比特错误会引起同步丢失，而运动补偿则会引起错误传递。

　　MPEG－4的差错回避有三个方面：重同步、数据恢复和错误隐藏。

　　重同步，是指差错被检测后，解码器和码流之间重新同步的技术。一般来说，这种方法会将错误之前的同步点到重建的同步点之间的数据丢弃。不过这些丢弃的数据可以用其他的技术进行恢复和实施错误隐藏。

　　数据恢复工具在解码器和码流重新建立起同步后用来恢复丢弃的数据。这些工具不是简单的用容错码恢复，而是用一种差错回避手段，即用可逆VLC码字进行VLC编码。

　　错误隐藏，在重同步有效地将错误定位后可以很容易处理。为了进一步提高错误隐匿的能力，有必要增加错误定位能力，特别是数据分割可以用来提高错误定位能力。

文章知识点与官方知识档案匹配，可进一步学习相关知识Python入门技能树人工智能机器学习工具包Scikit-learn211279 人正在系统学习中相关资源：1stopt数据拟合软件_曲线拟合软件-深度学习文档类资源-CSDN文库

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

现今主流的图像视频压缩标准及技术

相关推荐