您的位置: turnitin查重官网> 计算机 >> 计算机数据库 >关于感知基于压缩感知改善MPEG—2编码案例

关于感知基于压缩感知改善MPEG—2编码案例

收藏本文 2024-04-07 点赞:11812 浏览:46860 作者:网友投稿原创标记本站原创

摘 要:为寻找压缩感知在视频编码上的应用并提高MPEG-2的编码效率,提出了基于压缩感知和MPEG-2的改进方案。该视频编码改进方案从标准重构方法与像素域最小全变分重构算法中选出最终重构方法,使最终重构出的图像具有较小均方误差和。像素域最小全变分重构算法的提出,基于原始图像的梯度比残差图像的梯度更稀疏这个特征。实验结果表明,所提出的方案对于各类序列都有性能的提升。对于有比较锐利边缘物体的序列,平均峰值信噪比(PSNR)提高0.5dB以上;而对于具有较多平坦区域或复杂纹理的序列,平均PSNR也有0.26dB~0.41dB的提高。
关键词:MPEG-2;视频编码;部分离散余弦变换;压缩感知;图像重构;最小全变分
:A
Improved MPEG-2 video coding scheme based on compressed sensing
DUAN Ji-zhong1, ZHANG Li-yi1,2*, LIU Yu1, SUN Yun-shan1,2
1.School of Electronic Information Engineering, Tianjin University, Tianjin 300072,China;
2 School of Information Engineering, Tianjin University of Commerce, Tianjin 300134, China
Abstract:
In order to seek for applications in video coding of Compressed Sensing (CS) and improve the coding efficiency of MPEG-2, a CS and MPEG-2 based improved scheme was proposed. The improved video coding scheme chose the method producing an image with aller Sum of Squared Differences (SSD) as the final reconstruction method between the standard reconstruction method and the Total Variation (TV) minimization algorithm in the pixel domain, which is based on the fact that the original image has sparser gradient than the residual image. The experimental results show that the proposed scheme is efficient for all kinds of video sequences. The improvement of Peak Signal-to-Noise Ratio (PSNR) is greater than 0.5dB for the sequences with sharp edges, and 0.26dB~0.41dB for sequences with ooth areas or complex textures.
英文关键词 Key words:
MPEG-2; video coding; partial Discrete Cosine Tranorm (DCT); Compressed Sensing (CS); image reconstruction; Total Variation (TV) minimization
0 引言
压缩感知(Compressed Sensing, CS),也叫压缩采样、压缩传感或稀疏重构,是新兴的数字信号处理理论。该理论指出,在信号具有稀疏性或可压缩的条件下,能以极大概率从远低于奈奎斯特采样速率的采样值(也叫测量值)中无失真恢复原始信号[1-3]。压缩感知理论的最初应用之一是从部分离散傅里叶变换(Discrete Fourier Tranorm, DFT)系数中无失真重构核磁共振图像(Magnetic Resonance Imaging, MRI)[1,4]。在传统的图像/视频编码过程中,一般先将图像变换到一个变换域以去除空间相关性,再对变换系数进行量化和熵编码等其他处理[5]。其中,最常用的变换分为两类:一类是基于块的离散余弦变换(Discrete Cosine Tranorm,DCT)(在JPEG、MPEG-2、MEPG-4中使用)以及H.264中使用的整数DCT;另一类是基于图像的小波变换(在JPEG2000中使用)。这些变换与DFT变换有着很高的相似性,理论上也能从部分变换系数中重构出原始图像,文献[6]对基于部分DCT系数的重构作了详细阐述。因此,可以将压缩感知结合进图像/视频编码流程中,设计符合CS理论的图像/视频编码工具,从而实现进一步压缩。
Zhang等[7]提出了一种在H.264中基于CS的从量化/反量化DCT系数重构残差图像的方法。该方法采用一维DCT,然后截取头40个系数作为采样值,因此空间相关性并未得到充分去除,而且仅考虑了帧内预测中的直流(Direct Current, DC)预测,增益非常有限。潘榕等[6]2提出量化即是对二维DCT系数进行采样的观点,设计了相应的编解码流程,充分去除了空间相关性,提高了编码效率和重构质量。然而,由于原图像与预测图像的残差的梯度稀疏性有限,前面两种方法都不适合用在采用残差图像的编码框架中。图像拥有比相应的残差更稀疏的梯度。基于这个特性,Do等[8]提出在像素域恢复图像的方法,该方法将预测图像按照残差图像的采样方法进行采样,并与残差图像的采样相加,得到原始图像的采样,再使用最小全变分法恢复原始图像块。实验证明该方法对H.264的帧内编码和帧间编码都有一定的效果。文献[9]使用在像素域恢复图像的方法来恢复多视点视频编码(Multiview Video Coding, MVC)中的深度图,获得了较大增益。MPEG-2是当今应用最广泛的视频编码标准之一。是否能将CS与MEPG-2相结合呢?本文拟基于MPEG-2视频编码标准所采用的块结构,将CS恢复算法——像素域最小全变分算法作为一种编码工具加入到MEPG-2编码流程中,期望提高率失真性能。

1 压缩感知理论

1.1 压缩感知一般表示

设有一个长度为N的信号x,若可表示成x=Ψs,且满

源于:论文范文格式www.udooo.com

足‖x‖0≤K,KN,则称该信号x为K稀疏信号,Ψ为稀疏基[10]。 
压缩感知的采样过程可以表示为:

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号