基于视觉质量的离散余弦变换图像压缩方法设计文献综述

 2022-11-28 18:55:33

一、引言

在信息技术领域,数字图像被广泛的应用于多媒体存储和计算机、通信系统中。但是数字图像自身具有较大的数据量,不便于网络传输、存储和处理,需要进行压缩。图像压缩是指以较少的比特有损或无损地表示原来的像素矩阵的技术。图像数据之所以能被压缩,是因为图像数据中存在着空间冗余、时间冗余和频谱冗余等[1]。图像压缩通过去除图像的冗余和不必要的信息,改变图像的表达方式,以尽量少的比特数来表征图像,在不降低图像视觉质量的情况下,减少数据量和存储空间,提高传输速率,同时保持复原图像的质量[2,3]

二、内容

图像压缩方法有许多种,从不同的角度出发有不同的分类方法[15]。按原始图像是否完全可以恢复,可以分为冗余度压缩方法(也称无损压缩或熵编码)和信息量压缩方法(有损压缩或熵压缩编码)。无损压缩对解码图像与原始图像要求严格相同,无失真,无损压缩编码主要包括霍夫曼编码、算术编码和游程编码等;有损编码是一种以牺牲部分信息量为代价的编码压缩方法,主要有离散余弦变换编码(DCT)、差分脉冲预测编码、量化编码等[7]

离散余弦变换 DCT(Discrete Cosine Transform)是数码率压缩常用的一个变换编码方法。由于任何连续的实对称函数的傅里叶变换中只含余弦项,因此余弦变换与傅里叶变换一样有明确的物理意义[8]。DCT 是先将整体图像分成 N*N 像素块,然后对 N*N像素块逐一进行离散余弦正变换[12]。由于大多数图像的高频分量较小,相应于图像高频分量的变换系数经常为零,加上人眼对高频成分的失真不太敏感,所以可以通过量化步骤有选择性的消除或较粗糙地量化高频部分,只保留图像的低频信息部分,而低频部分包含了图像的主要信息。因此,传送变换系数的数码率要大大小于传送图像像素所用的数码率。重建图像时利用离散余弦反变换就可以得到原图像,虽然压缩后会有一定的失真,但人眼是可以接受的[3]

这类变换的基本运算是将信号从一种表达形式变成另一种表达形式,并且这种变换过程是可逆的,即在两个变换过程中除开舍入误差和截误差,本质都是无损失的。[9,11]离散余弦变换(DCT)的工作原理是把图像分离成不同频率的部分。经过量化后,把不太重要频率丢弃,因此,被称为有损压缩,总的来说,压缩比越大,压缩后的码率就低,分辨率相对也低。基本方法为:图像按像素被划分为8times;8的图像块;从左至右,从上到下顺序,DCT被应用到每个块;每个块通过量化来进行压缩;构成图像的压缩块的序列存储所占的空间急剧减少;当需要时,图像通过使用离散余弦逆变换(IDCT)的方法解压恢复。

量化就是通过减少精确度来减少存储数据所需要比特数的过程。图像经过 DCT 变换压缩后,离原点(0,0)越远的元素对图像的贡献越小,因而也就越不关心此处取值的精确性,量化公式为:C(u,v)=int{F(u,v)/Q(u,v)}其中 C(u,v)是量化后的系数,F(u,v)是量化前变换系数的幅度值,Q(u,v)是量化步长。由于人眼对亮度信号比对色差信号敏感,并且对低频分量的图像比对高频分量的图像敏感,所以采用 JPEG 标准推荐的色度值和亮度值作为量化步长。

在对图像进行采集、压缩(DCT)、处理、传输和复制等过程中,不可避免地会给图像带来不同程度和类型的失真。这些失真直接影响了观察者对图像的视觉感知,影响人们对图像信息的提取和理解,即图像质量出现了下降,难以满足人们的实际需求。因此,提供图像质量的评估方法,是十分必要的。

图象质量的含义主要包括两个方面: 图像的逼真度和图像的可懂度。图像质量评价一般来说可分为主观评价方法和客观评价方法,主观评价方法 (MOS, Mean Opinion Score)考虑了观察者对图像的理解效果, 但是这种方法由于受到观察者知识背景、观测目的和环境等影响,稳定性和可移植性差 ,且难以用数学模型表达加以应用。客观评价方法包括MSE,PSNR,SSIM。

常用的客观评价方法有均方误差 (MSE, Mean Square Error)和峰值信噪比 (PSNR, Peak Signal Noise Ratio),他们对两幅图像之间的误差进行了简单数学统计,能将误差量化表达。MSE表示当前图像X和参考图像Y的均方误差[10]。PSNR是最普遍和使用最为广泛的一种图像客观评价指标,单位是dB,数值越大表示失真越小。SSIM(Structural Similarity)结构相似性,通过计算当前图像X和参考图像Y的均值、方差、协方差来从亮度、对比度、结构三方面度量图像相似性[6] ,SSIM取值范围[0,1],值越大,表示图像失真越小[4]

对于不同的质量评估模型,利用标准测试图像并建立图像库。live图像数据库源自一组源图像,从互联网上收集了29个高分辨率和高质量的图像,充分反映了图像内容的多样性。这些图像包括面部,人物,动物,特写镜头,广角镜头,自然场景,人造物体,具有前景/背景配置的图像以及没有任何特定感兴趣对象的图像[14]。二十几个受试者对779个失真的图像采用成对比较的视觉心理物理学方法,对压缩图像进行主观评估[5],用大约25000个主观评估结果来评估几个突出的全参考图像质量评估算法(均方误差评估、峰值信噪比评估、结构相似性评估)的性能。TID 2013包含25个参考图像和3000的失真图像(25参考图像times;24种失真times;5失真水平)。所有图像都以Bitmap格式保存在数据库中,没有任何压缩[13]。最后主观评估结果与MSE、PSNR、SSIM方法对比发现,SSIM效果最佳。

三、参考文献

[1]张银慧,《基于MATLAB 的数字图像 JPEG 压缩编码实现》,天津三星通信技术研究有限公司,天津 300385

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。