CN107770537A - 基于线性重建的光场图像压缩方法 - Google Patents

基于线性重建的光场图像压缩方法 Download PDF

Info

Publication number
CN107770537A
CN107770537A CN201711065302.7A CN201711065302A CN107770537A CN 107770537 A CN107770537 A CN 107770537A CN 201711065302 A CN201711065302 A CN 201711065302A CN 107770537 A CN107770537 A CN 107770537A
Authority
CN
China
Prior art keywords
visual angle
light field
decoding end
video decoder
field image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711065302.7A
Other languages
English (en)
Other versions
CN107770537B (zh
Inventor
陈志波
赵盛洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201711065302.7A priority Critical patent/CN107770537B/zh
Publication of CN107770537A publication Critical patent/CN107770537A/zh
Application granted granted Critical
Publication of CN107770537B publication Critical patent/CN107770537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于线性重建的光场图像压缩方法,包括:将光场图像分解为视角图阵列,再分为A、B两个集合;在编码端,采用第一视频编码器对A集合中的视角图进行压缩,码流传输给编码端中的视频解码器与解码端的视频解码器;将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,并利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器;在解码端,利用光场视角图的线性重建理论,并结合解码端的第一与第二视频解码器的解码结果,重建出B集合;利用重建的A集合与B集合重新组成光场图像。该方法可大幅度减少编码端编码数据,并在解码端以较好的质量重建。

Description

基于线性重建的光场图像压缩方法
技术领域
本发明涉及光场图像压缩技术领域,尤其涉及一种基于线性重建的光场图像压缩方法。
背景技术
光场相机可以记录下空间场景中的光线强度和方向信息(即光场信息)。在光场相机内部,一个微透镜阵列被放置在CCD传感器前方,并位于主透镜的焦距附近。每个微透镜对应于一个像素块(即宏像素),光场图像由N*M个宏像素组成,其中N和M分别为微透镜阵列的高和宽。若将每个微透镜视为小孔,则主透镜背面在每个宏像素上成倒立的像——即每个宏像素可视为对主透镜在特定方向上的一个采样。
相同空间分辨率下,数据量要数百倍于传统2D图像(Lytro二代光场相机拍摄单幅YUV图像大小50M左右),这是制约光场技术应用的一个重要因素。因此一套光场图像的高效压缩方案对于图像的存储传输是必须的。
主流的压缩方案可以分为基于raw文件、基于伪视频序列、基于稀疏编码三种。
基于raw文件的压缩方法将宏像素阵列视为2D图像,使用传统编码方法如JEPG压缩。很显然这种方法不能充分利用光场本身的结构特征,实际操作亦不能取得好的效果。
基于伪视频序列的方法将光场分解为多个视角图,采用一定的顺序构成一个视频序列,采用传统的视频压缩方法,如HEVC等进行压缩。该方法压缩效率高,但没有充分利用光场的2D结构。
基于稀疏编码的方法往往利用光场图像中一些关键视角,利用字典训练等手段进行光场重建。此类方法压缩率高,但往往需要在编解码端进行字典学习和重建系数求解。由于光场的维度高数据量大,此类方法有复杂度很高,解码时间长的缺陷。
发明内容
本发明的目的是提供一种基于线性重建的光场图像压缩方法,可以大幅度减少编码端编码数据,并在解码端以较好的质量重建。
本发明的目的是通过以下技术方案实现的:
一种基于线性重建的光场图像压缩方法,包括:
将光场图像分解为视角图阵列,再将视角图阵列分为A、B两个非空的集合;
在编码端,采用第一视频编码器对A集合中的视角图进行压缩后,码流传输给编码端中的视频解码器与解码端中的第一视频解码器;将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,再利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器;
在解码端,利用光场视角图的线性重建理论,并结合解码端的第一与第二视频解码器的解码结果,重建出B集合中视角图;
利用重建的A集合与B集合重新组成光场图像。
由上述本发明提供的技术方案可以看出,将光场图像分解为视频,使用视频编码器去除角度域和空间域的冗余,同时利用所提出的线性重建理论,大幅度减少编码端编码数据,并在解码端以较好的质量重建;与基于稀疏编码的方法相比,本方案无须进行复杂耗时的字典训练和重建过程,同时因为编码数据量的减少,降低了编码复杂度,节约了编解码时间;同时,本方案可以与任意的序列扫描顺序技术相结合,因此具有良好的可拓展性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的将光场图像分解为视角图阵列的示意图;
图2为本发明实施例提供的微相机阵列的示意图;
图3为本发明实施例提供的一种基于线性重建的光场图像压缩方法的示意图;
图4为本发明实施例提供的一种光场图像压缩方法的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于线性重建的光场图像压缩方法,其利用基于微透镜阵列的光场图像的本身特性,设计高效的压缩方案,支持光场图像的存储和传输。其原理如下:
光场图像由宏像素阵列组成,每个宏像素实际是一个像素块,通过算法可以将光场图像分解为视角图阵列。如图1所示,通过抽取宏像素相同位置的像素并组合,可以构成场景的视角图。分解后可得到二维的视角图阵列。基于这种分解,可以认为图像是由微型相机阵列所拍摄得到,也就是说,将基于微透镜阵列的光场相机视为如图2所示的微相机阵列。
如图2所示,相邻相机间的距离固定为t1,则对于深度为zp的空间点p,视角子图Vi与中心视角图之间的视差为:
其中,K为相机内参,为视角图Vi与中心视角图之间的相对位置矢量;
可以确定,任意两个视角图Vj与Vi之间存在如下关系:
其中,p为像素坐标,Du(p)为像素p的视差值,为视角图Vj与中心视角图之间的相对位置矢量,V0为光场图像的中心视角图,如果有一组系数[x1,x2,......,xm]满足:
其中M为重建所需视角图的个数。则可以得到:
即可以使用满足一定条件的稀疏对视角图进行线性重建。即在系数满足上式时,可以将视角图关系中的第二项消去,从而对视角图进行线性重建。值得注意的是,该约束为必要不充分条件,当M大于4的时候,系数没有唯一解,因此可以用优化模型求解一个最优系数。基于上述理论,提出一种基于线性重建的光场图像压缩方法,如图3所示,其主要包括:
1)将光场图像分解为视角图阵列,再将视角图阵列分为A、B两个非空的集合。
将光场图像分解为视角图阵列的过程可参见前文的图1。分解为视角图阵列,再将其分为A、B两个非空的集合。
2)在编码端,采用第一视频编码器(例如,可以是JEM标准编码器,即编码端上方的“JEM Encoder”)对A集合中的视角图进行压缩后,码流传输给编码端中的视频解码器(例如,可以是JEM标准解码器,即编码端的“JEM Decoder”)与解码端中的第一视频解码器(例如,可以是JEM标准解码器,即解码端上方的“JEM Decoder”);将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,再利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器(例如,可以是JEM标准解码器,即解码端下方的“JEM Decoder”)。
具体的,对A集合中的视角图按照一定顺序组成一个视频序列,再采用第一视频编码器对A集合中的视角图进行压缩,获得的码流给编码端中的视频解码器与解码端中的第一视频解码器。
本发明实施例中,所述将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,并利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器具体如下:
对B集合中的每一张视角图,取编码端中的视频解码器重建出的A集合中若干张视角图(例如,图3中使用了最临近的四张视角图),利用线性重建理论计算加权系数,直接计算线性加权和,结果与B集合中相应视角图作残差,再利用编码端中的第二视频编码器(例如,可以是JEM标准编码器,即编码端下方的“JEM Encoder”)将残差编码后传至解码端的第二视频解码器。
需要特别指出的是,线性平均方法重建的效果已经非常接近编码器编码效果,因此在低码率情况下,可以跳过残差编码,在解码端用A集合重建集合B。
3)在解码端过程与编码端相反:首先将A集合解码,然后利用A集合重建B集合,最后将B集合的残差解码,最终得到解码的B集合(即重建的集合B)。
4)利用重建的A集合与B集合重新组成光场图像。
本发明实施例上述方案,将光场图像分解为视频,使用视频编码器去除角度域和空间域的冗余,同时利用所提出的线性重建理论,大幅度减少编码端编码数据,并在解码端以较好的质量重建;与基于稀疏编码的方法相比,本方案无须进行复杂耗时的字典训练和重建过程,同时因为编码数据量的减少,降低了编码复杂度,节约了编解码时间;同时,本方案可以与任意的序列扫描顺序技术相结合,因此具有良好的可拓展性。
此外,为了验证本发明的效果,还进行了相关实验。实验过程如图4所示,图4与前文图3所示方案的原理类似,都属于线性重建理论的不同实施方案。线性重建的时候,需要对每一个视角图有加权系数,图4相当于用最优化模型去计算视角图的系数,而图3相当于使用了固定系数。与前述方案类似,按图1方法将光场图像分解为视角图阵列,再将视角图阵列分为A、B两个集合,对于A仍然使用标准编码器编码。但对于B集合中的每一个视角图,采用如下凸优化求解全局最优重建系数:
其中,将A集合中的所有视角图展开为列向量组成矩阵A,b为待重建的视角图,x为重建系数。对求得的最优重建系数进行量化和熵编码后传至解码端。
在解码端根据重建后的A集合中的视角图和解码得到的最优重建系数重建出B集合,进而还原整个光场图像。
这一实验中,采用了EPFL中的12幅光场图像,以ICME2016年光场压缩竞赛第一名的方案为参考;实验表明,相同质量下,本发明可以节约61.63%码率,极大的提高了编码效率,且在低码率时可以更加好的提高视觉体验和主观感受。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (3)

1.一种基于线性重建的光场图像压缩方法,其特征在于,包括:
将光场图像分解为视角图阵列,再将视角图阵列分为A、B两个非空的集合;
在编码端,采用第一视频编码器对A集合中的视角图进行压缩后,码流传输给编码端中的视频解码器与解码端中的第一视频解码器;将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,再利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器;
在解码端,利用光场视角图的线性重建理论,并结合解码端的第一与第二视频解码器的解码结果,重建出B集合中视角图;
利用重建的A集合与B集合重新组成光场图像。
2.根据权利要求1所述的一种基于线性重建的光场图像压缩方法,其特征在于,所述采用视频编码器对A集合中的视角图进行压缩包括:
对A集合中的视角图按照一定顺序组成一个视频序列,再采用视频编码器对A集合中的视角图进行压缩。
3.根据权利要求1所述的一种基于线性重建的光场图像压缩方法,其特征在于,所述将B集合中的视角图结合编码端中的视频解码器重建出的A集合中视角图,并利用光场视角图的线性重建理论,求得B集合中视角图与A集合中视角图的关系,并传输给解码端的第二视频解码器包括:
对B集合中的每一张视角图,取编码端中的视频解码器重建出的A集合中若干张视角图,利用线性重建理论计算加权系数,直接计算线性加权和,结果与B集合中相应视角图作残差,再利用编码端中的第二视频编码器将残差编码后传至解码端的第二视频解码器。
CN201711065302.7A 2017-11-02 2017-11-02 基于线性重建的光场图像压缩方法 Active CN107770537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711065302.7A CN107770537B (zh) 2017-11-02 2017-11-02 基于线性重建的光场图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711065302.7A CN107770537B (zh) 2017-11-02 2017-11-02 基于线性重建的光场图像压缩方法

Publications (2)

Publication Number Publication Date
CN107770537A true CN107770537A (zh) 2018-03-06
CN107770537B CN107770537B (zh) 2020-03-31

Family

ID=61272425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711065302.7A Active CN107770537B (zh) 2017-11-02 2017-11-02 基于线性重建的光场图像压缩方法

Country Status (1)

Country Link
CN (1) CN107770537B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110191359A (zh) * 2019-05-16 2019-08-30 华侨大学 一种基于关键子孔径图像选取的光场图像压缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254719A (zh) * 2016-07-25 2016-12-21 清华大学深圳研究生院 一种光场图像压缩方法
EP3142365A1 (en) * 2015-09-14 2017-03-15 Thomson Licensing Method and apparatus for encoding and decoding a light field based image, and corresponding computer program product
CN106534853A (zh) * 2016-12-21 2017-03-22 中国科学技术大学 基于混合扫描顺序的光场图像压缩方法
CN107027025A (zh) * 2017-03-28 2017-08-08 清华大学深圳研究生院 一种基于宏像素块自适应预测的光场图像压缩方法
CN107295264A (zh) * 2017-08-01 2017-10-24 清华大学深圳研究生院 一种基于单应性变换光场数据压缩方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3142365A1 (en) * 2015-09-14 2017-03-15 Thomson Licensing Method and apparatus for encoding and decoding a light field based image, and corresponding computer program product
CN106254719A (zh) * 2016-07-25 2016-12-21 清华大学深圳研究生院 一种光场图像压缩方法
CN106534853A (zh) * 2016-12-21 2017-03-22 中国科学技术大学 基于混合扫描顺序的光场图像压缩方法
CN107027025A (zh) * 2017-03-28 2017-08-08 清华大学深圳研究生院 一种基于宏像素块自适应预测的光场图像压缩方法
CN107295264A (zh) * 2017-08-01 2017-10-24 清华大学深圳研究生院 一种基于单应性变换光场数据压缩方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110191359A (zh) * 2019-05-16 2019-08-30 华侨大学 一种基于关键子孔径图像选取的光场图像压缩方法

Also Published As

Publication number Publication date
CN107770537B (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
Hu et al. Coarse-to-fine deep video coding with hyperprior-guided mode prediction
CN111819854B (zh) 用于协调多符号位隐藏和残差符号预测的方法和装置
Tabus et al. Lossy compression of lenslet images from plenoptic cameras combining sparse predictive coding and JPEG 2000
CN102640498B (zh) 通过纹理图案自适应分区块变换进行图像编解码的方法和设备
Deng et al. Content-based image compression for arbitrary-resolution display devices
CA2950964A1 (en) Method and apparatus of candidate generation for single sample mode in video coding
BRPI0924044B1 (pt) Métodos e aparelhos para seleções de transformada em codificação e decodificação de vídeo
CN103141092B (zh) 针对视频压缩使用运动补偿的基于示例的超分辨率来编码视频信号的方法和设备
CN103581647A (zh) 一种基于彩色视频运动矢量的深度图序列分形编码方法
CN106534853B (zh) 基于混合扫描顺序的光场图像压缩方法
CN101632313A (zh) 产生立体图像的头部信息的方法和装置
Gao et al. Structure-preserving motion estimation for learned video compression
US10687068B1 (en) Method for compressing light field data using variable block-size four-dimensional transforms and bit-plane decomposition
Liu et al. Multi-stream dense view reconstruction network for light field image compression
Olsson et al. A combined pre-processing and H. 264-compression scheme for 3D integral images
CN107770537A (zh) 基于线性重建的光场图像压缩方法
CN106961605B (zh) 一种基于宏像素边界匹配的光场图像压缩方法
Zhao et al. Light field image compression via CNN-based EPI super-resolution and decoder-side quality enhancement
CN112001854A (zh) 一种编码图像的修复方法及相关系统和装置
WO2020007554A1 (en) Compact description of region-wise packing information
KR100580876B1 (ko) 비트스트림 지도를 이용한 영상 부호화 및 복호화 장치 및 방법과, 그 기록매체
Wang et al. Intra coding and refresh based on video epitomic analysis
Yang et al. Graph-convolution network for image compression
CN108184064B (zh) 一种视角图阵列划分方法
Garrote et al. Lenslet light field imaging scalable coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant