CN107483936A - 一种基于宏像素的光场视频帧间预测方法 - Google Patents

一种基于宏像素的光场视频帧间预测方法 Download PDF

Info

Publication number
CN107483936A
CN107483936A CN201710647872.0A CN201710647872A CN107483936A CN 107483936 A CN107483936 A CN 107483936A CN 201710647872 A CN201710647872 A CN 201710647872A CN 107483936 A CN107483936 A CN 107483936A
Authority
CN
China
Prior art keywords
mrow
msub
pred
predicting unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710647872.0A
Other languages
English (en)
Other versions
CN107483936B (zh
Inventor
金欣
李羚俊
戴琼海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201710647872.0A priority Critical patent/CN107483936B/zh
Publication of CN107483936A publication Critical patent/CN107483936A/zh
Application granted granted Critical
Publication of CN107483936B publication Critical patent/CN107483936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

基于宏像素的光场视频帧间预测方法:输入当前预测单元的最佳预测向量并校正;以校正的预测运动向量指向的参考块左上角像素点为中心设定搜索范围,以宏像素宽度和高度作为横向间隔和纵向间隔计算得到(2p+1)×(2q+1)个待搜索点位置,p和q为正整数;从搜索范围内的以这些待搜索点为左上角像素位置的预测单元中找出最小代价预测单元,其运动向量为最佳运动向量;计算最佳预测向量与最佳运动向量之间的变化量并进行量化;对量化得到的运动向量变化量进行反量化并结合最佳预测向量重新计算最佳运动向量;根据更新的最佳运动向量来重新计算预测单元残差,以更新的最佳运动向量和预测单元残差,采用代价模型选择帧间预测模式完成帧间预测。

Description

一种基于宏像素的光场视频帧间预测方法
技术领域
本发明涉及计算机视觉与数字处理领域,具体涉及一种基于宏像素的光场视频帧间预测方法。
背景技术
近年来,光场相机所捕获的光场图像在立体显示、三维重建以及虚拟现实等计算机视觉领域引发了人们的广泛关注。光场视频,作为光场图像的进一步延伸,也有着广泛的应用前景。与光场图像相同,光场视频在记录了光线角度和位置信息的同时,也具有超高分辨率和特殊的像素分布,这使得相对于传统设备采集的视频,光场视频数据量急剧增大。数据量的激增给光场视频的存储和传输带来了巨大压力,对现有解码算法和编解码软硬件架构提出了巨大挑战,也制约了光场相机的发展和应用。因此,研究针对光场视频数据的编码技术,寻找针对光场视频数据高效的压缩方法成为由平面多媒体迈向立体影像时代急需且必须的核心技术。
在目前尚未有针对光场视频利用帧间预测技术的直接压缩方法,但是用传统图像的方法也能对光场视频进行压缩,只是能够获得的压缩率十分有限;如HEVC(HighEfficiency Video Coding)自身的帧间预测方法能够处理光场视频,达到一定的压缩效果。但是由于光场视频的数据量较普通视频急剧上升,将光场视频作为传统视频进行压缩,将带来巨大计算复杂度。使用HEVC里的全搜索虽然能提供较高质量的压缩图像和节省较多的码流,但是巨大的计算复杂度是难以接受的,而其中的快速搜索方法虽然能够大幅降低计算复杂度,但是压缩后的视频质量还有一定提升空间,在节省码流的效果上也不尽人意。目前利用帧间预测对光场图像进行直接压缩的方法中,统一存在的缺陷就是由于图像中宏像素结构和编码器架构不匹配导致宏像素间的相关性未能充分利用,进而影响了编码效率。
发明内容
为了提升光场视频的编码压缩效率,同时降低编解码两端的计算复杂度,本发明提出了一种基于宏像素的光场视频帧间预测方法,该方法基于光场数据中宏像素之间具有的较高相关性和相似性的分析,有针对性的选择搜索点,从而缩小搜索范围以在保证较高匹配质量的前提下,有效降低计算复杂度,在处理运动向量变化量时,根据宏像素的特征,做出有针对性的量化以节约码流,进而实现编码效率的有效提升。
本发明为达上述目的所提供的技术方案如下:
一种基于宏像素的光场视频帧间预测方法,包括以下步骤S1至S8:
S1、筛选出当前预测单元的最佳预测向量MVpred(x,y);
S2、基于宏像素特征对所述最佳预测向量MVpred(x,y)进行校正,得到校正的预测运动向量MV'pred(x,y);
S3、以所述校正的预测运动向量MV'pred(x,y)所指向的参考块左上角的像素点为中心设定搜索范围,以宏像素的宽度和高度分别作为横向间隔和纵向间隔计算得到(2p+1)×(2q+1)个待搜索点的位置,其中,p和q为正整数;
S4、从所述搜索范围内的(2p+1)×(2q+1)个以所述待搜索点为左上角像素位置的预测单元中,筛选出最小代价预测单元,并设定该最小代价预测单元的运动向量为最佳运动向量MV(x,y);
S5、计算所述最佳预测向量MVpred(x,y)与所述最佳运动向量MV(x,y)之间的变化量δmv,并对所述变化量δmv进行量化,得到对应于所述最小代价预测单元的量化的运动向量变化量δmvscaled
S6、对对应于最小代价预测单元的量化的运动向量变化量δmvscaled进行反量化,用反量化的结果和所述最佳预测向量MVpred(x,y)重新计算并更新所述最佳运动向量;
S7、采用步骤S6更新的最佳运动向量作为预测单元的运动向量来重新计算并更新预测单元残差;
S8、根据更新的最佳运动向量和预测单元残差,采用代价模型进行最优帧间预测模式选择,以完成帧间预测。
本发明提供的上述技术方案,与现有技术相比,至少具有以下有益效果:首先基于相邻宏像素之间具有相关性和相似性的特征,将输入的最佳预测向量进行校正,以使当前预测块与参考块之间的宏像素相互匹配,从而改善预测效果。其次,在选取搜索范围时,利用宏像素之间的相关性,选取参考帧内同位预测块的邻域内的宏像素块作为当前预测块的帧间搜索范围,降低时域的冗余信息。其中,搜索范围内的参考块左上角像素的坐标之间满足以宏像素宽度为横向间距,以宏像素高度为纵向间距的条件,确保了所有的待搜索的参考块均与当前预测块满足宏像素匹配的关系,有效地减小了搜索范围,同时也保证了参考块与当前预测块较高的匹配度,提高了搜索效率。在得到最佳运动向量后,对运动向量变化量进行基于宏像素特征的量化,以更多的节省码流,提高了视频的压缩率。最终根据最佳运动向量和预测单元残差,采用代价模型可以从多种帧间预测模式中选择一种最优的预测模式,完成帧间预测。在此基础上,最终可以根据HEVC自身的框架完成整个光场视频的压缩过程,采用本发明提供的上述帧间预测方法,可以为整个压缩过程节省更多的码流,提高了光场视频的压缩率。
附图说明
图1是本发明具体实施例提供的一种基于宏像素的光场视频帧间预测方法的流程图;
图2是其中一种示例性块尺寸下的待搜索点位置选取示意图;
图3是另一种示例性块尺寸下的待搜索点位置选取示意图。
具体实施方式
下面结合附图和优选的实施方式对本发明作进一步说明。
本发明的具体实施方式提供了一种基于宏像素的光场视频帧间预测方法,用于在对光场视频进行压缩编码的过程中进行帧间预测,本发明的方法可以适用于大多数视频编码的软件,在后述的说明中以应用于HM16.15软件中为例。编码软件的类型和版本不对本发明的保护范围构成限制。
参考图1,本发明的所述方法包括以下步骤S1至S8:
步骤S1、筛选出当前预测单元的最佳预测向量MVpred(x,y)。在一种优选的实施例中,所述最佳预测向量MVpred(x,y)是经过对相邻预测单元的运动向量,以率失真代价最小原则进行筛选后得出。
步骤S2、基于宏像素特征对所述最佳预测向量MVpred(x,y)进行校正,得到校正的预测运动向量MV'pred(x,y)。由于输入的最佳预测向量MVpred(x,y)所指向的参考块可能与当前预测块不满足宏像素匹配关系,或不满足图像的边界条件。因此需要对输入的最佳预测向量MVpred(x,y)进行校正,以方便后续待搜索点的选取。
在一种具体的实施例中,对最佳预测向量MVpred(x,y)进行校正分为两个部分:边界校正和位置校正。具体包括:首先通过当前预测块的位置信息对最佳预测向量MVpred(x,y)进行边界校正,以使其所指向的参考块满足图像的边界条件,得到边界校正的预测运动向量(xpred,ypred);再对所述边界校正的预测运动向量(xpred,ypred)进行位置校正,得到所述校正的预测运动向量:MV'pred(x,y)=(xpred-(xpredmod m),ypred-(ypredmod n));其中,m和n分别为宏像素的宽度和高度。校正得到的MV'pred(x,y)既满足图像的边界条件,又与当前预测块内的宏像素一一对应。
步骤S3、以所述校正的预测运动向量MV'pred(x,y)所指向的参考块左上角的像素点为中心设定搜索范围,以宏像素的宽度和高度分别作为横向间隔和纵向间隔计算得到(2p+1)×(2q+1)个待搜索点的位置,其中,p和q为正整数。p和q的值根据实际需求而设定,例如根据对压缩品质的需求,对同一个图像而言,p和q越大,则压缩质量越高,所需的压缩时间也越长。
如图2所示,绘示了参考帧10和当前预测帧100,图中的标号11所指向的一个小方块代表一个宏像素。根据实际需求设定p和q的值均为1,选取以MV'pred(x,y)指向的参考块左上角的像素点为中心、以宏像素宽度16为横向间隔、以宏像素高度16为纵向间隔,计算得到的3×3个待搜索点的位置,设定搜索范围S,在S内包含了3×3个搜索块(每相邻的两列包括了3个搜索块),如图2所示,由于在选取待搜索点时是以MV'pred(x,y)=(0,0)为例来选取的,因此在搜索范围S内,其中心的搜索块12即为对应于当前预测块101的同位编码块。则,待搜索点位置可通过如下的过程来求得:
先求取搜索块运动向量的横、纵坐标x、y:
x=xpred+i·m=xpred+i·16
y=ypred+j·n=ypred+j·16
其中,i和j为整数,且i∈[-p,p],j∈[-q,q],m和n分别为宏像素的宽度和高度,xpred和ypred分别为最佳预测向量MVpred(x,y)的横、纵坐标;
再根据当前预测块的位置信息去掉搜索块中不满足边界条件的搜索点,得到所述待搜索点的位置,其中,所述边界条件为:
0≤x+xcur≤W-w
0≤y+ycur≤H-h
其中,xcur和ycur分别为当前预测块左上角像素点的横、纵坐标,W、H分别为测试图像的宽度和高度;w、h分别为当前预测块的宽度和高度。W、H例如可以是8656、6944,但这只是举例而已。
图2所示的是当前预测块的尺寸大于宏像素的尺寸的一种例子。当然,当前预测块的尺寸有很多变化,例如图3所示的是当前预测块的尺寸小于宏像素的尺寸的例子,图3中,左边为参考帧20,右边为当前预测帧200,参考帧20中的9个小方块21即代表了9个待搜索点,其中心的小方块22代表了对应于当前预测帧200中当前预测块201的同位编码块。需要说明,图2和图3是以MV'pred(x,y)=(0,0)为例进行待搜索点的选取,因此得到的9个搜索块是以同位编码块为中心的。
步骤S4、从所述搜索范围内的(2p+1)×(2q+1)个以所述待搜索点为左上角像素位置的预测单元中,筛选出最小代价预测单元,并设定该最小代价预测单元的运动向量为最佳运动向量MV(x,y)。以前面p和q均为1的例子而言,具体做法是:遍历所述搜索范围内的3×3个以所述待搜索点为左上角像素位置的预测单元,并计算每一个预测单元的码率代价和率失真,通过联合优化模型筛选出其中的最小代价预测单元。其中,各个预测单元的码率代价根据各预测单元对应的量化的运动向量变化量δmvscaled-k计算得到,k=1,2,3…,不同的k分别代表9个预测单元中的不同预测单元;其中,各预测单元对应的量化的运动向量变化量δmvscaled-k的横、纵坐标为:
其中,xmv-k和ymv-k分别表示(2p+1)×(2q+1)个预测单元中第k个预测单元的运动向量MVk(x,y)的横、纵坐标,xpmv和ypmv分别表示所述最佳预测向量MVpred(x,y)的横、纵坐标,offset表示误差补偿,在当前实施例中,offset=8,当然,offset的值并不构成对本发明的限制。m和n分别为宏像素的宽度和高度。也就是说,在上述的例子中,在设定的搜索范围内有9个预测单元,则需要分别计算每个预测单元的δmvscaled-k
另外,每一预测单元的率失真是根据其对应的匹配误差计算得到;通过联合优化模型筛选出(2p+1)×(2q+1)个预测单元中最小代价预测单元具体包括:对每一预测单元,由该预测单元的码率代价和率失真计算其预测代价,选出预测代价最小的预测单元为所述最小代价预测单元。
步骤S5、计算所述最佳预测向量MVpred(x,y)与所述最佳运动向量MV(x,y)之间的变化量δmv,并对所述变化量δmv进行量化,得到对应于所述最小代价预测单元的量化的运动向量变化量δmvscaled。在一种具体的实施例中,对应于最小代价预测单元的量化的运动向量变化量δmvscaled的横、纵坐标分别为:
其中,xmv和ymv分别表示最佳运动向量MV(x,y)的横、纵坐标。
步骤S6、对对应于最小代价预测单元的量化的运动向量变化量δmvscaled进行反量化,用反量化的结果和所述最佳预测向量MVpred(x,y)重新计算并更新所述最佳运动向量。重新计算得到的,即更新后的最佳运动向量MV'(x,y)的横、纵坐标x'mv和y'mv分别为:
步骤S7、采用步骤S6更新的最佳运动向量作为预测单元的运动向量来重新计算并更新预测单元残差。
步骤S8、根据更新的最佳运动向量和预测单元残差,采用代价模型进行最优帧间预测模式选择,完成帧间预测。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于宏像素的光场视频帧间预测方法,其特征在于:包括以下步骤S1至S8:
S1、筛选出当前预测单元的最佳预测向量MVpred(x,y);
S2、基于宏像素特征对所述最佳预测向量MVpred(x,y)进行校正,得到校正的预测运动向量MV'pred(x,y);
S3、以所述校正的预测运动向量MV'pred(x,y)所指向的参考块左上角的像素点为中心设定搜索范围,以宏像素的宽度和高度分别作为横向间隔和纵向间隔计算得到(2p+1)×(2q+1)个待搜索点的位置,其中,p和q为正整数;
S4、从所述搜索范围内的(2p+1)×(2q+1)个以所述待搜索点为左上角像素位置的预测单元中,筛选出最小代价预测单元,并设定该最小代价预测单元的运动向量为最佳运动向量MV(x,y);
S5、计算所述最佳预测向量MVpred(x,y)与所述最佳运动向量MV(x,y)之间的变化量δmv,并对所述变化量δmv进行量化,得到对应于所述最小代价预测单元的量化的运动向量变化量δmvscaled
S6、对对应于最小代价预测单元的量化的运动向量变化量δmvscaled进行反量化,用反量化的结果和所述最佳预测向量MVpred(x,y)重新计算并更新所述最佳运动向量;
S7、采用步骤S6更新的最佳运动向量作为预测单元的运动向量来重新计算并更新预测单元残差;
S8、根据更新的最佳运动向量和预测单元残差,采用代价模型进行最优帧间预测模式选择,完成帧间预测。
2.如权利要求1所述的基于宏像素的光场视频帧间预测方法,其特征在于:步骤S1具体包括:以率失真代价最小原则对相邻预测单元的运动向量进行筛选,得到所述最佳预测向量MVpred(x,y)。
3.如权利要求1所述的基于宏像素的光场视频帧间预测方法,其特征在于:步骤S2具体包括:
S21、通过当前预测块的位置信息对所述最佳预测向量MVpred(x,y)进行边界校正,以使指向的参考块满足图像的边界条件,得到边界校正的预测运动向量(xpred,ypred);
S21、对所述边界校正的预测运动向量(xpred,ypred)进行位置校正,得到所述校正的预测运动向量:MV'pred(x,y)=(xpred-(xpred mod m),ypred-(ypred mod n));其中,m和n分别为宏像素的宽度和高度。
4.如权利要求1所述的基于宏像素的光场视频帧间预测方法,其特征在于:步骤S3中各所述待搜索点的位置通过如下方法得到:
先计算搜索块运动向量的横、纵坐标x、y,
x=xpred+i·m
y=ypred+j·n
其中,i和j为整数,且i∈[-p,p],j∈[-q,q],m和n分别为宏像素的宽度和高度,xpred和ypred分别为最佳预测向量MVpred(x,y)的横、纵坐标;
再根据当前预测块的位置信息去掉搜索块中不满足边界条件的搜索点,得到所述待搜索点的位置,其中,所述边界条件为:
0≤x+xcur≤W-w
0≤y+ycur≤H-h
其中,xcur和ycur分别为当前预测块左上角像素点的横、纵坐标,W、H分别为图像的宽度和高度;w、h分别为当前预测块的宽度和高度。
5.如权利要求1所述的基于宏像素的光场视频帧间预测方法,其特征在于:步骤S4中筛选所述最小代价预测单元具体包括:遍历所述搜索范围内的(2p+1)×(2q+1)个以所述待搜索点为左上角像素位置的预测单元,并计算每一个预测单元的码率代价和率失真,通过联合优化模型筛选出其中的最小代价预测单元。
6.如权利要求5所述的基于宏像素的光场视频帧间预测方法,其特征在于:在步骤S4中,每一预测单元的码率代价根据各预测单元对应的量化的运动向量变化量δmvscaled-k计算得到,k=1,2,3…,不同的k代表(2p+1)×(2q+1)个预测单元中的不同预测单元;其中,各预测单元对应的量化的运动向量变化量δmvscaled-k的横、纵坐标为:
<mrow> <msub> <mi>x</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> <mo>-</mo> <mi>k</mi> </mrow> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>v</mi> <mo>-</mo> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>+</mo> <mi>o</mi> <mi>f</mi> <mi>f</mi> <mi>s</mi> <mi>e</mi> <mi>t</mi> </mrow> <mi>m</mi> </mfrac> </mrow>
<mrow> <msub> <mi>y</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> <mo>-</mo> <mi>k</mi> </mrow> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>y</mi> <mrow> <mi>m</mi> <mi>v</mi> <mo>-</mo> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>+</mo> <mi>o</mi> <mi>f</mi> <mi>f</mi> <mi>s</mi> <mi>e</mi> <mi>t</mi> </mrow> <mi>n</mi> </mfrac> </mrow>
其中,xmv-k和ymv-k分别表示(2p+1)×(2q+1)个预测单元中第k个预测单元的运动向量MVk(x,y)的横、纵坐标,xpmv和ypmv分别表示所述最佳预测向量MVpred(x,y)的横、纵坐标,offset表示误差补偿,m和n分别为宏像素的宽度和高度;
每一预测单元的率失真是根据其对应的匹配误差计算得到;
通过联合优化模型筛选出(2p+1)×(2q+1)个预测单元中最小代价预测单元具体包括:对每一预测单元,由该预测单元的码率代价和率失真计算其预测代价,选出预测代价最小的预测单元为所述最小代价预测单元。
7.如权利要求6所述的基于宏像素的光场视频帧间预测方法,其特征在于:在步骤S5中,对应于最小代价预测单元的量化的运动向量变化量δmvscaled的横、纵坐标分别为:
<mrow> <msub> <mi>x</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>+</mo> <mi>o</mi> <mi>f</mi> <mi>f</mi> <mi>s</mi> <mi>e</mi> <mi>t</mi> </mrow> <mi>m</mi> </mfrac> </mrow>
<mrow> <msub> <mi>y</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>y</mi> <mrow> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>+</mo> <mi>o</mi> <mi>f</mi> <mi>f</mi> <mi>s</mi> <mi>e</mi> <mi>t</mi> </mrow> <mi>n</mi> </mfrac> </mrow>
其中,xmv和ymv分别表示最佳运动向量MV(x,y)的横、纵坐标。
8.如权利要求7所述的基于宏像素的光场视频帧间预测方法,其特征在于:步骤S6中更新的最佳运动向量MV'(x,y)的横、纵坐标x'mv和y'mv分别为:
<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <msup> <mi>x</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>=</mo> <mi>m</mi> <mo>&amp;CenterDot;</mo> <msub> <mi>x</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> </mrow> </msub> <mo>+</mo> <msub> <mi>x</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <msup> <mi>y</mi> <mo>&amp;prime;</mo> </msup> <mrow> <mi>m</mi> <mi>v</mi> </mrow> </msub> <mo>=</mo> <mi>n</mi> <mo>&amp;CenterDot;</mo> <msub> <mi>y</mi> <mrow> <msub> <mi>&amp;delta;mv</mi> <mrow> <mi>s</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>e</mi> <mi>d</mi> </mrow> </msub> </mrow> </msub> <mo>+</mo> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mi>m</mi> <mi>v</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> <mo>.</mo> </mrow> 2
CN201710647872.0A 2017-08-01 2017-08-01 一种基于宏像素的光场视频帧间预测方法 Active CN107483936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710647872.0A CN107483936B (zh) 2017-08-01 2017-08-01 一种基于宏像素的光场视频帧间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710647872.0A CN107483936B (zh) 2017-08-01 2017-08-01 一种基于宏像素的光场视频帧间预测方法

Publications (2)

Publication Number Publication Date
CN107483936A true CN107483936A (zh) 2017-12-15
CN107483936B CN107483936B (zh) 2019-09-06

Family

ID=60598421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710647872.0A Active CN107483936B (zh) 2017-08-01 2017-08-01 一种基于宏像素的光场视频帧间预测方法

Country Status (1)

Country Link
CN (1) CN107483936B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110062243A (zh) * 2019-04-23 2019-07-26 清华大学深圳研究生院 一种基于近邻优化的光场视频运动估计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1555831A2 (en) * 2004-01-13 2005-07-20 Sony Corporation Still picture and moving picture encoding method and apparatus
CN103188496A (zh) * 2013-03-26 2013-07-03 北京工业大学 基于运动矢量分布预测的快速运动估计视频编码方法
CN104604232A (zh) * 2012-04-30 2015-05-06 数码士控股有限公司 用于编码多视点图像的方法及装置,以及用于解码多视点图像的方法及装置
CN104618725A (zh) * 2015-01-15 2015-05-13 华侨大学 快速搜索与模式优化结合的多视点视频编码算法
CN105959699A (zh) * 2016-05-06 2016-09-21 西安电子科技大学 一种基于运动估计和时空域相关性的快速帧间预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1555831A2 (en) * 2004-01-13 2005-07-20 Sony Corporation Still picture and moving picture encoding method and apparatus
CN104604232A (zh) * 2012-04-30 2015-05-06 数码士控股有限公司 用于编码多视点图像的方法及装置,以及用于解码多视点图像的方法及装置
CN103188496A (zh) * 2013-03-26 2013-07-03 北京工业大学 基于运动矢量分布预测的快速运动估计视频编码方法
CN104618725A (zh) * 2015-01-15 2015-05-13 华侨大学 快速搜索与模式优化结合的多视点视频编码算法
CN105959699A (zh) * 2016-05-06 2016-09-21 西安电子科技大学 一种基于运动估计和时空域相关性的快速帧间预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110062243A (zh) * 2019-04-23 2019-07-26 清华大学深圳研究生院 一种基于近邻优化的光场视频运动估计方法

Also Published As

Publication number Publication date
CN107483936B (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN108495135B (zh) 一种屏幕内容视频编码的快速编码方法
CN111147867B (zh) 一种多功能视频编码cu划分快速决策方法及存储介质
CN110087087B (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
CN103797800B (zh) 推导参考模式值以及编码和解码表示预测模式的信息
CN102484710B (zh) 用于像素内插的系统及方法
CN107027025B (zh) 一种基于宏像素块自适应预测的光场图像压缩方法
US9883200B2 (en) Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video
CN102752588B (zh) 使用空间缩放预测的视频编解码方法
CN107295337A (zh) 使针对图像的一组重建样本的补偿偏移的编码/解码最优化的方法和装置
CN103647972A (zh) 运动图像解码方法和运动图像编码方法
CN106998473A (zh) 运动图像编码装置以及运动图像解码装置
CN107623850A (zh) 一种基于时空相关性的快速屏幕内容编码方法
CN108174208B (zh) 一种基于特征分类的高效视频编码方法
CN107071421B (zh) 一种结合视频稳定的视频编码方法
CN110365982A (zh) 一种多用途编码中帧内编码的多变换选择加速方法
CN101291436B (zh) 视频编/解码方法和视频编/解码装置
CN112465698A (zh) 一种图像处理方法和装置
CN109996083B (zh) 帧内预测方法及装置
TWI489876B (zh) A Multi - view Video Coding Method That Can Save Decoding Picture Memory Space
CN109151467B (zh) 基于图像块活动性的屏幕内容编码帧间模式快速选择方法
CN102647595B (zh) 一种基于avs的亚像素运动估计的装置
CN107483936A (zh) 一种基于宏像素的光场视频帧间预测方法
US11212518B2 (en) Method for accelerating coding and decoding of an HEVC video sequence
CN106134198A (zh) 利用深度信息的视频编码装置及其方法
CN102547258B (zh) 一种帧间编码中子象素搜索方法、运动搜索方法及其模块

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant