多媒体数据压缩算法及其实现研究

2020-08-21 17:21:37 《电脑知识与技术》 2020年21期

王宇 刘俊 高云

摘要:伴随社会经济不断进步,信息化发展日新月异。丰富的多媒体数据占用空间比较大,传输速度较慢。若不对多媒体数据进行有效的压缩,就难以使用户通过多种感官与计算机进行实时信息交互,从而不能构成完整的多媒体计算机系统。数据信息的海量性已经成为影响数据存储、数据传输的重大阻碍。计算机多媒体数据压缩技术的发展,是互联网与通信技术得以深入发展的关键所在。数据压缩的目的在于通过用压缩手段减少音频、视频、图像信号中冗余信息,将信息数据以压缩的形式进行传输和存储。该文对数据的压缩进行了研究,并通过比较分析不同压缩算法及其实现原理,对其应用方向和发展前景进行简单的探析。

关键词:计算机多媒体;数据压缩;技术分析

中图分类号:TP3 文献标识码:A

文章编号:1009-3044(2020)21-0190-03

开放科学(资源服务)标识码(OSID):

在今天数字化和信息化进程加速的背景下,数字信息产业的发展已成为备受关注的对象。计算机多媒体技术作为时代新兴产物,定义为向计算机输入媒体信息,计算机输出数字化后的信息[1]。但随着网络的飞速发展,多媒体数据也逐渐呈现出爆炸式增长的势头。例如:一幅分辨率为256x512的彩色静态图像CRGB),如果每种颜色用8bit表示,则数据量竞有384kb之多。若不进行处理,仅由此方法构成图像、音频、视频文件,现有的网络带宽或难以承受。多媒体数据具有的丰富性,多媒体计算机需要具有强大的装置综合能力和处理多种媒体的功能,具体表现为综合处理动画、视(音)频、图像等多种形式的媒体。但是由多媒体计算机处理的多种媒体具备非常大的数字量,给传输和存储带来了很大的难度[2]。如今,阻碍信息传输的主要障碍是如何对数据有效的传输和处理。

造成多媒体数据量巨大的部分原因是数据中携带着大量冗余信息,这无疑成为信息传播与应用的困扰。如何解决冗余问题,将直接关系到信号能否进行快速的传输。由此看来,数据压缩已成为解决巨大数据信息量问题和多媒体技术发展的必经之路。

1 数据压缩技术概述

1.1数据压缩的原理与过程

数据压缩本质上是数据编码技术。其基本原理很简单,就是找出那些重复出现的内容,然后用更简短的语言表示。数据是信息的载体,在数据的交流中我们想获得的其实是信息。

多媒体数据的压缩分为编码和解码过程,即原始数据经过一系列处理过程转化为压缩后的编码符号,过程可抽象为编码器(图1)。解码过程则是与编码过程相反的操作。通过编码与解码的操作,可以使信息在处理环节、传输环节中以“简略”的格式表达。不仅提高了通信传输效率,也使计算机同时处理两种以上媒体信息得以实现。

1.2 多媒体计算机数据压缩的必要性与可行性

多媒体信息结构复杂且种类繁多,对各类多媒体数据进行自由、高效率存储与传输的要求也日益严苛。只有通过数据压缩,才能在不增加带宽和存储容量的前提下对音频、视频、图片等媒体数据有效处理和传输。多媒体数据通常包含很大的冗余。一份传输完整的数据其中信息量是小于其数据量的,压缩正是利用信息中无关信息量的存在,期望能够通过不同的编码与解码方式使得冗余量所占信息量的比重达到一个可以接受的范围。音频、图像和视频等数据中的多余信息主要表现在空间、时间和知觉等方面。

以多媒体数据图像数据作为研究对象,人观察到的静态图像看似规律是并不相同的,但实际图像数据中的光强、色彩和饱和度有很大部分重合,这就是所谓空间的冗余。而对于动态画面来讲,当长时间停留在某一动作图像时,在相邻的帧之间很少有不相同的地方动画等序列图片,这种称之为时间冗余。因此,在实际操作中,我们完全可以依据“部分代替整体”的原则,用少量的数据展示整体。以此来有效地减少图像数据中的初始数据。

2 数据压缩算法研究

2.1 数据压缩算法种类

依据多媒体数据的冗余类型,可使用不同的压缩方法。按照被压缩数据解码后是否已改变原数据,可将压缩方法分为无损压缩与有损压缩。

有损的压缩在可接受范围内允许解码出的数据与原数据存在一定差異,以损失部分信息为代价获得可观的压缩比,也即不可逆编码。想要达到低数据率的效果,几乎都需要采用有损压缩。最终的压缩比越小丢失的数据则越多,相应解压后的还原度就越低。所以这种压缩大多建立在这种压缩方法大多应用在多媒体技术上。有损压缩编码立足于图像、声波存在频带宽、信息量大的特点,人类视、听觉无法对其做出敏感的观测。有损压缩编码在压缩过程中的要求并不严格,为了能够较大程度地减少多余信息,有损编码甚至允许丢失一部分数据信息。鉴于在压缩时丢失的信息并没有影响到人们对原始数据、图像的理解,而相较无损压缩具有很高的压缩比例,因此有损编码在语言、图像以及视频等数据压缩工作当中受到了普遍的运用[3]。

无损编码是一种基于信息熵原理的可逆的编码方法,不会损坏初始数据,这种编码又称为熵保持编码或熵编码。由于无损压缩多采用概率统计原理,故压缩情况多表现为对出现频率高的数据与频率低的数据压缩效果存在差异。因此冗余度理论极限一般为2:1到5:1。虽压缩比例不够出色,但能够保证完整还原、不产生任何损耗。这种方法使用在自然图像的压缩上效果并不好,多用于电子表格,文档数据,珍贵照片等的压缩。相对于有损压缩来说,无损压缩的占用空间大、压缩比不高等都是限制无损压缩适用范围的因素,但随着硬盘容量成本的降低和用户追求的提升,其不改变数据无损还原的性质得到开发,将来发展前景广阔。

2.2 压缩算法的分析

无损压缩编码多为统计编码(哈夫曼编码、LZW编码以及行程编码等);有损压缩编码有:预测编码(DPCM编码、ADPCM编码等)、变化编码与分析合成编码(量化编码、小波变化编码、分形图像编码、子带编码等)。

下面我们对几种常见压缩算法进行研究分析。

(1)基于哈夫曼编码(Huffman Coding)的文本数据压缩算法

哈夫曼编码(Huffman Coding)是一种无损压缩算法。虽然压缩率有限,但可完全无偏差地还原压缩前数据,用在文本压缩尤为合适。下图为哈夫曼编码方法的UML协同图。

哈夫曼编码的步骤是根据给定的权值构造只有根结点的二叉树,并确定始权值。选取两棵权值最小的树做子树,构造新二叉树。在森林中删除这两棵树,置新二叉树根结点权值为其子树结点权值之和。重复上步骤即可得到哈夫曼树。此类型编码方式会对原符号进行评估,为取得更小的代价,用较短编码表示出现概率高的符号,而出现概率低的使用较长编码。目的是使编码后的原符号长度的期望值降低,从而使数据压缩。

(2)LZW压缩算法

LZW编码(Encoding)的主要思想是扫描文本的思想。LZW编码对每个出现的符号都需要进行判断,查看其与前向符号能否组成在此之前曾出现过的符号串。对于能组成符号串的情况,继续向后扫描;反之,则必须将前向符号转换为一个索引,并且将索引写入输出文件中。针对文本中符号串重复越多的情况,可以收到良好的压缩效果。

对应以上描述,LZW编码的流程图可表示为图3。

其核心思想并不复杂,就是把出现过的符号串映射到记号上,借此通过较短的编码来表示较长的符号串。这样就将其用对应的索引来代替原较长的文本写入输出文件中,达到压缩原庞大信息的效果。LZW编码常应用于文本数据的压缩,对于重复出现的符号串的较多的文本压缩效果较好。

3 应用场景与展望

多媒体数据通常在传输或存储前都需要进行压缩,而根据不同的数据格式和服务质量要求,可对文本数据、音频数据、图像数据和视频进行有损压缩或无损压缩。

对于类型为文本的数据,需要保证压缩前后不能任何内容的偏差,必须使用无损压缩的方法。并且在保证数据安全性的前提下进行不丢失信息的压缩,推荐使用算法是哈夫曼编码和LZW词典编码的方式。

对音频类型的数据压缩已发展较为成熟,主要表现为波形编码、参数编码以及融编码的形式。波形编码方式是根据人耳听觉特性采样量化音频信号波形的原理,尽可能匹配原始信号波形,其特点是可在高码率的条件下获得较高品质的音频信号。参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息进行编码,最后在输出端合成原始信号[4]。但追求编码压缩率的同时,也意味着损失数据量会较大,不适合高保真语音和高品质音乐。

图像数据压缩有静态图像压缩JPEG标准和运动图像压缩MPEG标准两种国际标准,存在多种压缩数据方式。JPEG标准用于处理单张的静止画面,MPEG标准则处理由一连串画面组成的运动的图像。静态图像压缩目的是去除部分图像中对人眼不敏感的部分,是空间信息的压缩,不会对视觉观赏产生影响。对静态图像文件用JPEG进行压缩效果十分明显,当压缩率达到20:1时人眼基本不可见其失真。

采用数据压缩算法对数据进行压缩是一种信息高校传输和存储的技术,目的是让计算机拥有处理庞大的多媒体数据的能力,从而将网络的数据传输速率带来的阻碍减小到最低程度。随着大数据发展浪潮的到来,爆炸式增长的数据给多媒体数据压缩算法也带来了新的挑战。同时,深度学习、人工智能的蓬勃发展也给数据处理带来了新的思路,势必會使数据压缩的技术迸发出新的活力。未来,多媒体数据压缩的发展将无限可能。

4 结语

根据以上的研究分析,压缩算法以不同编码方式的利用为切人点,合理去除数据中存在的冗余问题。在不增大带宽和存储容量的前提下,有效降低数据传输率,为多媒体设备、音频应用、动画制作带来巨大变革。随着人们对视频音频的高质量需求和更多相关领域的开发,计算机多媒体压缩必将上升到一个崭新高度,成为处理数据中不可或缺的数字化技术。

参考文献:

[1]黄梦.计算机多媒体音像压缩技术的研究及应用前景探析[Jl,计算机光盘软件与应用,2014(4):207-207,209.

[2]张华.多媒体计算机图像数据压缩的实现[J].计算机光盘软件与应用,2014,17(1):192,194.

[3]梅刚.多媒体数据压缩技术有效分析[J].数字技术与应用,2015(5):219.

[4]孟铂,樊新华.浅析多媒体数据压缩技术[J].电脑知识与技术,2006(20):129,156.

【通联编辑:代影】

作者简介:王宇(1998-),男,安徽淮南人,重庆邮电大学,学生,本科,研究方向为图像处理;刘俊(1978-),男,讲师,研究方向为移动互联网软件;高云(1999-),男,本科,研究方向为模式识别。