压缩感知的视频编码技术研究

摘 要现如今人们对视频信息的需求量越来越大,传统的编码方法给系统带来很大的采样压力,因此如何用更少的数据获得高质量图像已成为视频压缩的一大研究热点。本文阐述了压缩感知的基本原理,分析了其研究热点,在此基础上将传统的分布式视频编码框架与之结合,重点对基于块的视频压缩感知关键技术进行了分析,主要研究内容为:首先阐述了传统的视频编码技术、压缩感知、分布式视频编解码框架的理论基础,对其关键技术和研究热点进行了分析研究,为后续分析分布式压缩感知理论打下基础;其次将传统的分布式视频编解码框架与压缩感知理论相结合,对基于块的分布式视频压缩感知中稀疏基、测量矩阵的选取和重构算法的设计等关键技术进行了分析与研究,分析了 BCS_SPL_DCT系统,采用了DCT做为稀疏基,随机产生的正交矩阵做为测量矩阵,BCS-SPL算法来恢复原始信号;接着通过MATLAB进行仿真实验,研究影响算法重构质量的关键因素:测量率,图像块大小和视频序列复杂度,分别对其进行实验仿真和分析,通过实验得出:在其它条件相同的情况下,若测量率越高,则重构的图像质量越好;图像块大小的选取则需要根据图像复杂度和与运算量综合考虑,一般情况下可以取16*16,或者8*8;序列的复杂度越高其重构质量越差。最后,将重构质量与计算时间共同考虑,对分布式视频压缩感知系统中的BCS-SPL重构算法进行优化,在编码端对CS块进行模式判别,不同的块采用不同的测量率进行测量采样,由此生成新的重构算法-基于DVCS的自适应重构算法,最后将其通过实验仿真与之前的BCS-SPL算法相比较。MATLAB仿真结果表明,在相同条件下,本文提出的自适应重构算法与单独的BCS-SPL重构算法相比,其率失真性能更好。
Key words : Compressed Sensing Distributed Video Coding DCT BCSSPL adaptive DVCS based reconstruction algorithm 目录
摘 要 I
Abstract II
第一章 绪论 1
1.1研究的背景及意义 1
1.2视频编码技术的发展 2
1.2.1传统视频编码的理论依据及技术分析 2
1.2.2视频编码标准 3<
 *好棒文|www.hbsrm.com +Q: ^351916072* 
br /> 1.2.3压缩感知 5
1.3论文的章节安排 6
第二章 分布式视频压缩感知理论分析 8
2.1分布式视频编码的理论基础和研究现状 8
2.2压缩感知关键技术分析 10
2.2.1稀疏基的表示方法 10
2.2.2测量矩阵的表示方法 12
2.2.3信号的重构算法 13
2.3分布式视频压缩感知分析 15
2.3.1分布式视频压缩感知(DVCS)的理论基础与研究现状 15
2.3.2分布式压缩感知中稀疏基的构造 16
2.3.3分布式压缩感知中测量矩阵的构造 17
2.4本章总结 17
第三章 基于块的DCVS重构算法分析 18
3.1 基于块的图像压缩感知原理 18
3.2 BCSSPL重构算法分析 20
3.2.1 BCSSPL重构算法的理论基础 20
3.2.2本文使用的BCSSPL重构算法 22
3.3 基于DVCS的重构算法 22
3.4 仿真实验结果分析 23
3.5 本章小结 26
第四章 影响图像重构性能的参数研究 28
4.1 测量率对重构性能的影响分析 28
4.2 块大小对重构性能的影响分析 29
4.3 序列复杂度对重构性能的影响分析 31
4.4 基于块的DVCS自适应重构算法 33
4.4.1自适应重构算法 33
4.4.2实验与分析 34
4.5本章小结 35
第五章 总结与展望 37
5.1总结 37
5.2展望 38
参考文献 39
第一章 绪论
1.1研究的背景及意义
本课题依托“河海大学——江苏国光信息产业股份有限公司工程实践教育中心”(国家级实践教育中心),河海大学与江苏国光合作承担的智能视觉物联网关键技术课题研究。随着人类生活水平的提高,科学技术的进步,人们对信息交流和处理的要求越来越高。因为图像信息拥有形象、易懂等特点,是人们生活中最常使用的信息种类,而其中尤以视频应用最为广泛和重要。视频是一组图像在时间上的有序排列,也是二维图像在时间域上组成的有序图像。由于视频图像的信息量巨大,直接传输需要大量的存储空间和计算时间,因此我们通常将视频信息进行压缩后再传输。
视频压缩与编码的本质是将要处理的图像按照某种规则进行变换与组合,从而使得能以较少的代码表示更多的信息。视频的压缩主要基于两点:其一,图像信息间拥有一定的相关性,即数据有很大的时空冗余度;其二:人眼拥有一定的分辨率,当失真小于某一值时,人眼分辨不出,即能使重构的图像拥有令人满意的质量。
1948年10月香农在《贝尔系统技术学报》上发表了论文《A Mathematical Theory of communication》(通信的数学理论),这一事件标志了现代信息论研究的开端,香农亦被称为“信息论之父”。香农信息论共研究信息传输和信息压缩两大领域,本文重点研究学习的是信息压缩。传统的信息采样、压缩中,必须遵循的是香农采样定理(亦被称为奈奎斯特采样定理),即要想获得高质量的重构信号,采样速率应该大于等于两倍的信号带宽。但在采样到压缩这一过程中大量的冗余信息被丢弃,造成了很大的资源浪费,如果有一种方法能使采样数远低于奈奎斯特采样数,并且能够很好的重构图像,这将大大的提高资源利用率。
D.Donoho、E.Candes和T.Tao等人在2004年提出了压缩感知理论(Compressive Sensing,CS)[1],这一理论的前提是信号可以稀疏表示,其为图像研究提供了一种新思路。CS理论与传统的奈奎斯特有很大的不同,改变了人们采集、重构信号的传统理念:利用信号在其他变换域的表示,建立一个崭新的理论框架,用远低于奈奎斯特定理所需的采样数来高质量的恢复原始信号。该理论证明了奈奎斯特采样率是信号能够精确重构的充分不必要条件。这一理论一经提出,其独特的信号采集方式就得到了广泛关注,也被应用在多个领域,如:视频图像信号处理、通信、无线监控和雷达探测。
1.2视频编码技术的发展
1.2.1传统视频编码的理论依据及技术分析
视频压缩编码的理论基础是香农所建立的信息论[2],其共有3大定理,共同支撑起了视频压缩的理论框架。视频压缩编码的目的是将冗余度尽可能的消除以减少传输过程中用来表示图像的比特数,因此视频压缩的基本方法分为两类:其一为无损压缩,将类似或相同的数据归为一类,使用尽可能少的数据表示不同的类,这样就能减少传输的数据量;其二为有损压缩,人的眼睛有一定的分辨率,利用这一特征可以简化某些不必要的数据,最终达成减少传输的数据的目的。
无损压缩的本质是对图像数据本身进行操作,而不会改变数据的存储方式,并且,无损压缩在解码端能够完全重构,即重构的图像与输入的图像完全相同,细节部分也不会产生偏差。常用的无损压缩技术有霍夫曼(huffman)编码、算数编码以及方块编码。
这里简单的介绍一下霍夫曼编码,其基本思想可以表示如下:如果该信息出现的概率大,那么就采用短字长的码,否则采用长字长的码,这样就可以缩短信息的平均码长,达到压缩的目的。其编码过程可以表示如下:一,标明每个信源符号出现的概率,将其按从小到大排列,将概率最小的两个信源符号概率相加,产生一个新的概率,对应的也产生一个新的信源符号;二,将信源符号重新排列,仍是由小到大,再次将最小概率的两个值相加,产生一个新的概率和符号;三,继续重复过程一和二,一直到最后只剩两个概率时结束;四,反过来向前编码,逐步进行,每一步有两个分支,若遇到的符号概率大,可以对其赋值0,若遇到的符号概率小,可以对其赋值1,当然,反过来亦可。最后我们可以计算出其平均码长与信息源的熵大致相等,该编码是很有效的。但是,由于无损压缩并没有优化数据的存储,因此压缩比很小,一般使用中最大也只有5:1,因此无损压缩的使用范围并不大,支持该功能的硬件也就不多,只能用在文本、程序等场合。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1156.html

好棒文