CN108495111B - 一种基于成像几何特征的立体元图像阵列编码方法 - Google Patents
一种基于成像几何特征的立体元图像阵列编码方法 Download PDFInfo
- Publication number
- CN108495111B CN108495111B CN201810319166.8A CN201810319166A CN108495111B CN 108495111 B CN108495111 B CN 108495111B CN 201810319166 A CN201810319166 A CN 201810319166A CN 108495111 B CN108495111 B CN 108495111B
- Authority
- CN
- China
- Prior art keywords
- coding
- maximum coding
- element image
- coding unit
- stereo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000003384 imaging method Methods 0.000 title claims abstract description 22
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims abstract description 8
- 108091026890 Coding region Proteins 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000003464 asthenopia Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
一种基于成像几何特征的立体元图像阵列编码方法属计算机图像处理技术领域,本发明包括下列步骤:对输入的一幅8M×8N的立体元图像阵列进行分块,块大小为R×R,称为最大编码单元;对最大编码单元按从左到右从上到下的顺序进行分组及确定编码顺序;根据同名像点的偏移量确定最大编码单元的预测块;计算最大编码单元与其预测块之间的残差块;对残差块进行HEVC编码。本发明利用立体元图像阵列成像的几何特征,提出了一种高效的编码方法,不仅对比了传统的HEVC帧内预测编码方法,还将立体元图像阵列中的所有立体元图像,按照Z字扫描顺序组成一个视频序列进行编码。本发明相比于以上两种传统的编码方法,有较好的率失真性能。
Description
技术领域
本发明属计算机图像处理技术领域,具体涉及一种基于成像几何特征的立体元图像阵列编码方法。
背景技术
真三维显示技术通过光线叠加实现了立体图像的空间重现,观看者只需裸眼即可观看到具有物理景深的三维图像。真三维显示具有不会产生视觉疲劳、图像色彩真实、视差完整、多视角、可多人同时观看等优点,成为学术和工业界公认的未来三维显示的发展方向。
真三维显示技术主要包括集成成像技术、全息显示技术和体显示技术等。其中集成成像技术具有观众无需佩戴任何特制的眼镜和头盔、实现过程相对简单、无需相干光源、对记录环境没有特殊要求和系统易实现等优点,使其在军事、医学、生物学和娱乐等领域中具有广泛应用,也是最有可能实现真三维电视的技术。因此,集成成像技术已成为目前国际上的研究热点。
典型的集成成像系统包括采集、编码以及显示部分,其采集部分生成的视频是由一帧帧时间上连续的立体元图像阵列组成。立体元图像是构成立体元图像阵列的基本单元,它由集成成像系统中的每个微透镜从不同方向对目标场景的一小部分区域成像形成,因此具有纹理结构简单的特点。集成成像系统中的每一帧(即为一幅立体元图像阵列)通常由几十甚至成百上千幅小尺寸的立体元图像组成,从而存储或传输一幅立体元图像阵列所需的存储空间或传输带宽将比存储或传输一幅传统图像多几倍甚至几十倍,对视频也是如此。所以探索集成成像(也称立体元图像阵列)的视频高效编解码方法是集成成像技术推广应用的一个重要课题。
国内外针对立体元图像阵列编码(一些文章也称为集成成像编码)的研究可分为两大类,一类是基于视频编码国际标准的方法,从二十几年前的MPEG-2,到十几年前的MPEG-4、H.264/AVC,再到最新的H.265/HEVC;另一类是基于小波变换、3D-DCT、K-L变换以及基于进化策略的编码等非视频编码标准的方法。目前,立体元图像阵列编码方法的编码效率还有待提高。
发明内容
根据立体元图像阵列采集过程中的成像几何特征,即相邻的立体元图像之间存在很大部分的重叠区域,提出一种基于成像几何特征的立体元图像阵列编码方法。此方法是在高效视频编码(HEVC)的框架下实现的,根据采集系统中的相关物理参数,充分利用立体元图像之间的相关性进行编码。
本发明是基于成像几何特征的立体元图像阵列编码方法,包括下列步骤:
1.1对输入的一幅8M×8N的立体元图像阵列进行分块,块大小为R×R,称为最大编码单元,其中M、N、R为任意正整数;
1.2对步骤1.1中得到的最大编码单元按从左到右、从上到下的顺序进行分组,其中分组根据立体元图像阵列获取过程中透镜阵列的物理参数及立体元图像大小确定,具体包括下列步骤:
1.2.1透镜阵列的物理参数包括物距h,像距g,以及透镜阵列中相邻透镜中心的间距p,立体元图像阵列采集所用的透镜阵列中相邻透镜的水平间距和垂直间距相等;立体元图像的大小为q×q;
1.2.2计算每个分组中最大编码单元的个数m,m向下取整,m定义为:
1.3对步骤1.2中得到的分组,首先编码每行每个分组中的第一个最大编码单元,然后对相邻两个分组中已编码的两个最大编码单元中间的最大编码单元进行编码,再依次编码每组中剩余的最大编码单元,并逐行进行编码;
1.4按步骤1.3的编码顺序,根据同名像点的偏移量确定最大编码单元的预测块,包括下列步骤:
1.4.1对于每个分组中的第一个最大编码单元,预测块的所有像素值设为0或128;
1.4.2对于其它最大编码单元的预测块,首先根据透镜阵列的物理参数,确定同名像点间距,同名像点间距与立体元图像大小相减即为同名像点的偏移量,再根据同名像点的偏移量,将预测块的所有像素值设为左右最近邻已编码最大编码单元的对应同名像点的像素值;
1.5计算最大编码单元与步骤1.4中得到的最大编码单元的预测块之间的残差块;
1.6对步骤1.5中得到的残差块进行HEVC编码。
现有的面向集成成像的视频编码方法很多,但没有充分利用立体元图像区别于传统图像的特征进行编码,而本发明就是利用这个特征提出的方法,根据立体元图像阵列获取过程中透镜阵列的物理参数及立体元图像大小,确定编码顺序,改进预测方式。不仅对比了传统的HEVC帧内预测编码算法,还将立体元图像阵列中的所有立体元图像按照Z字扫描顺序组成一个视频序列,然后采用HEVC运动补偿的方式对该视频序列进行编码。在相同重构图像质量的前提下,本发明的方法大幅度的减少了编码的比特率。
附图说明
图1为基于成像几何特征的立体元图像阵列编码方法的流程图
图2为两组最大编码单元及其编码顺序的示意图
图3为一幅1056×800的风景测试图
图4为一幅800×544的卡通测试图
图3和图4中:(a)为二维普通图像示意图,(b)为相应的立体元图像阵列示意图
图5为风景测试图的实验结果对比图
图6为卡通测试图的实验结果对比图
具体实施方式
本发明的核心内容在于:根据立体元图像阵列生成过程中的透镜阵列参数,可以得出相邻立体元图像的同名像点的偏移量,根据这一特征改进立体元图像阵列中最大编码单元的编码顺序以及最大编码单元间的预测方式,从而减少比特率。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及实例做进一步的详细叙述:
1.1对输入的一幅8M×8N的立体元图像阵列进行分块,块大小为R×R,称为最大编码单元,附图中用LCU进行表示,其中M、N、R为任意正整数;
1.2对步骤1.1中得到的最大编码单元按从左到右、从上到下的顺序进行分组,其中分组根据立体元图像阵列获取过程中透镜阵列的物理参数及立体元图像大小确定,具体步骤如下:
1.2.1透镜阵列的物理参数包括物距h,像距g以及透镜阵列中相邻透镜中心之间的距离p,通常立体元图像阵列采集所用的透镜阵列中相邻透镜的水平间距和垂直间距相等;立体元图像的大小为q×q;
1.2.2计算每个分组中最大编码单元的个数m,m向下取整,m定义为:
1.3对步骤1.2中得到的分组,首先编码每行每个分组中的第一个最大编码单元,然后对相邻两个分组中已编码的两个最大编码单元中间的最大编码单元进行编码,再依次编码每组中剩余的最大编码单元,并逐行进行编码。附图2以8个LCU为一组为例对两组最大编码单元说明了每组中最大编码单元具体的编码顺序;
1.4按步骤1.3的编码顺序,根据同名像点的偏移量确定最大编码单元的预测块,同名像点定义为空间一物点,经过不同的成像系统,分别在其像面上成像,所成的像点互为同名像点。包括下列步骤:
1.4.1对于每个分组中的第一个最大编码单元,预测块的所有像素值设为0或128;
1.4.2对于其它最大编码单元的预测块,首先根据透镜阵列的物理参数确定同名像点间距,同名像点间距表示为:
同名像点间距与立体元图像大小相减即为同名像点的偏移量,同名像点的偏移量可以表示为:
再根据同名像点的偏移量将预测块的所有像素值设为左右最近邻已编码最大编码单元的对应同名像点的像素值;
1.5计算最大编码单元与步骤1.4中得到的最大编码单元的预测块之间的残差块;
1.6对步骤1.5中得到的残差块进行HEVC(高效视频编码)编码。
下面以具体的测试来验证本发明的可行性。实验中不仅对比了传统的HEVC帧内预测编码算法,还将立体元图像阵列中的所有立体元图像,按照Z字扫描顺序组成一个视频序列,然后采用HEVC运动补偿的方式,对该视频序列进行编码。还将本发明与以上两种编码方式在比特率和解码重构图像质量方面进行了对比分析。
1.工作条件
本发明的实验采用Intel(R)Core(TM)i3-2100CPU@3.10GHz3.10GHz,内存为2GB,运行Windows7的PC机,编程语言为C++语言。
2.实验内容与结果分析
图3为一幅1056×800的风景测试图。图4为一幅800×544的卡通测试图。其中(a)为原始普通的二维图像,(b)为对应的立体元图像阵列,由图(b)可以观察到相邻的立体元图像之间有很大部分的重叠区域,重叠区域是同名像点所组成的,同名像点的偏移量计算如下:
对于实验结果的展示,采用率失真曲线来说明,率失真曲线是表示峰值信噪比(Y-PSNR)与比特率(Bitrate)关系的曲线,前者单位为dB,后者单位为比特每像素(bpp),具体说明如下:
PSNR的计算公式如下:
其中:f(x,y)和f'(x,y)为位于(x,y)处的原始图像像素值和重构图像像素值,M×N为图像的空间分辨率。
比特率的计算公式如下:
通过图5和图6可以看出,其不仅将本发明提出的算法与经典HEVC进行了比较,而且考虑到相邻立体元图像之间较强的相关性,还将立体元图像阵列中的所有立体元图像,按照Z字扫描顺序组成一个视频序列,然后采用HEVC运动补偿的方式对该视频序列进行编码,编码结果如图5和图6中的HEVC+视频序列。可见,在比特率基本相同的情况下,本发明获得的重构图像PSNR,远远高于基于HEVC的两种编码方法得到的重构图像PSNR,可见本发明更适合于立体元图像阵列编码,且能获得较好的编码效果。
Claims (1)
1.一种基于成像几何特征的立体元图像阵列编码方法,其特征在于包括下列步骤:
1.1对输入的一幅8M×8N的立体元图像阵列进行分块,块大小为R×R,称为最大编码单元,其中M、N、R为任意正整数;
1.2对步骤1.1中得到的最大编码单元按从左到右、从上到下的顺序进行分组,其中分组根据立体元图像阵列获取过程中透镜阵列的物理参数及立体元图像大小确定,具体包括下列步骤:
1.2.1透镜阵列的物理参数包括物距h,像距g,以及透镜阵列中相邻透镜中心的间距p,立体元图像阵列采集所用的透镜阵列中相邻透镜的水平间距和垂直间距相等;立体元图像的大小为q×q;
1.2.2计算每个分组中最大编码单元的个数m,m向下取整,m定义为:
1.3对步骤1.2中得到的分组,首先编码每行每个分组中的第一个最大编码单元,然后对相邻两个分组中已编码的两个最大编码单元中间的最大编码单元进行编码,再依次编码每组中剩余的最大编码单元,并逐行进行编码;
1.4按步骤1.3的编码顺序,根据同名像点的偏移量确定最大编码单元的预测块,包括下列步骤:
1.4.1对于每个分组中的第一个最大编码单元,预测块的所有像素值设为0或128;
1.4.2对于其它最大编码单元的预测块,首先根据透镜阵列的物理参数,确定同名像点间距,同名像点间距与立体元图像大小相减即为同名像点的偏移量,再根据同名像点的偏移量,将预测块的所有像素值设为左右最近邻已编码最大编码单元的对应同名像点的像素值;
1.5计算最大编码单元与步骤1.4中得到的最大编码单元的预测块之间的残差块;
1.6对步骤1.5中得到的残差块进行HEVC编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810319166.8A CN108495111B (zh) | 2018-04-11 | 2018-04-11 | 一种基于成像几何特征的立体元图像阵列编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810319166.8A CN108495111B (zh) | 2018-04-11 | 2018-04-11 | 一种基于成像几何特征的立体元图像阵列编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108495111A CN108495111A (zh) | 2018-09-04 |
CN108495111B true CN108495111B (zh) | 2019-12-13 |
Family
ID=63315655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810319166.8A Expired - Fee Related CN108495111B (zh) | 2018-04-11 | 2018-04-11 | 一种基于成像几何特征的立体元图像阵列编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108495111B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674371B (zh) * | 2021-08-06 | 2023-11-03 | 吉林大学 | 一种基于五维二次核建模的立体元图像阵列编码方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102006469B (zh) * | 2010-08-24 | 2012-07-04 | 吉林大学 | 基于立体元图像多等级混合预测编码结构的并行实现方法 |
CN102006468B (zh) * | 2010-08-24 | 2012-11-14 | 吉林大学 | 立体元图像多等级混合预测编码结构 |
JP5993694B2 (ja) * | 2012-10-02 | 2016-09-14 | 日本放送協会 | 画像符号化装置 |
CN103096113B (zh) * | 2013-02-15 | 2015-01-07 | 吉林大学 | 离散视点采集结合窗截取算法的立体元图像阵列生成方法 |
-
2018
- 2018-04-11 CN CN201810319166.8A patent/CN108495111B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN108495111A (zh) | 2018-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aggoun | Compression of 3D integral images using 3D wavelet transform | |
US20190222821A1 (en) | Methods for Full Parallax Compressed Light Field 3D Imaging Systems | |
Zaharia et al. | Adaptive 3D-DCT compression algorithm for continuous parallax 3D integral imaging | |
Aggoun | A 3D DCT compression algorithm for omnidirectional integral images | |
US20160050440A1 (en) | Low-complexity depth map encoder with quad-tree partitioned compressed sensing | |
US6535629B2 (en) | Stereoscopic image encoding | |
CN102685532A (zh) | 自由视点四维空间视频编码系统的编码方法 | |
Aggoun | 3D holoscopic imaging technology for real-time volume processing and display | |
CN1169641A (zh) | 立体观看装置和方法 | |
US11652973B2 (en) | 3D system | |
CN108495111B (zh) | 一种基于成像几何特征的立体元图像阵列编码方法 | |
Aggoun et al. | Live immerse video-audio interactive multimedia | |
Aggoun | Pre-processing of integral images for 3-D displays | |
Adedoyin et al. | Motion and disparity estimation with self adapted evolutionary strategy in 3D video coding | |
Aggoun et al. | Wavelet-based compression algorithm for still omnidirectional 3D integral images | |
US10121280B2 (en) | 3D system including rendering with three dimensional transformation | |
Aggoun et al. | Data compression of integral images for 3D TV | |
Adedoyin et al. | A joint motion & disparity motion estimation technique for 3D integral video compression using evolutionary strategy | |
US20170140571A1 (en) | 3d system including rendering with curved display | |
US20170142400A1 (en) | 3d system including rendering with shifted compensation | |
Sgouros et al. | Compression of IP images for autostereoscopic 3D imaging applications | |
Shah et al. | Issues in multiview autostereoscopic image compression | |
Mazri et al. | Compression of 3D integral images using wavelet decomposition | |
US10284837B2 (en) | 3D system including lens modeling | |
Isechi et al. | Light Field Compression for Compressive 3D Display |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191213 |