CN110996099B - 一种视频编码方法、系统及设备 - Google Patents
一种视频编码方法、系统及设备 Download PDFInfo
- Publication number
- CN110996099B CN110996099B CN201911122051.0A CN201911122051A CN110996099B CN 110996099 B CN110996099 B CN 110996099B CN 201911122051 A CN201911122051 A CN 201911122051A CN 110996099 B CN110996099 B CN 110996099B
- Authority
- CN
- China
- Prior art keywords
- region
- interest
- coding
- basic unit
- coding basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种视频编码方法、系统及设备,其中,所述方法包括:根据待编码视频中的当前帧和编码顺序,在所述待编码视频中获取当前图像集;按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个视频帧内的感兴趣区域进行反向更新;为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的各个编码基本单元进行编码。本申请提供的技术方案,能够提高视频编码的精确度。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种视频编码方法、系统及设备。
背景技术
随着视频往高清化方向的不断发展,传输高清视频所需的带宽也越来越大。考虑到带宽的成本,当前在对高清视频进行编码时,通常会为视频帧中不同的区域分配不同的码率,这样可以在保证总码率不变的情况下,尽可能将重点区域的清晰度提高。
为了实现上述的方案,在对视频进行编码时,需要识别出各个视频帧中人眼感兴趣的区域,然后针对人眼感兴趣的区域可以分配较多的码率,而对于其它部分的区域则可以分配较少的码率。这种编码方式,对于人眼感兴趣的区域通常采用相同的量化参数进行编码。但实际上,人眼感兴趣的区域中,也并非每个位置都是人眼关注的,因此当前的这种编码方式还是不够精确。
发明内容
本申请的目的在于提供一种视频编码方法、系统及设备,能够提高视频编码的精确度。
为实现上述目的,本申请一方面提供一种视频编码方法,待编码视频的视频帧中包括感兴趣区域和非感兴趣区域;所述方法包括:根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧;按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个视频帧内的感兴趣区域进行反向更新;为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的各个编码基本单元进行编码。
为实现上述目的,本申请另一方面还提供一种视频编码系统,待编码视频的视频帧中包括感兴趣区域和非感兴趣区域;所述系统包括:当前图像集获取单元,用于根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧;反向更新单元,用于按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个视频帧内的感兴趣区域进行反向更新;量化编码单元,用于为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的编码基本单元进行编码。
为实现上述目的,本申请另一方面还提供一种视频编码设备,所述设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的视频编码方法。
由上可见,本申请一个或者多个实施方式提供的技术方案,在对当前帧进行编码时,可以结合在编码顺序上位于当前帧之后的多个视频帧一起分析。具体地,可以按照与编码顺序相反的顺序,从最后一个视频帧开始,依次向前反向更新各个视频帧内的感兴趣区域。这样,对于时间上相邻的视频帧,如果相同位置处出现感兴趣区域突变的情况,能够通过反向更新的方式减缓或者消除这种感兴趣区域突变的情况,最终使得相邻帧的感兴趣区域在编码后从视觉上也不会出现太大的突变。在反向更新感兴趣区域之后,可以从编码基本单元的角度,为当前帧中各个编码基本单元计算量化参数。后续在对当前帧进行编码时,可以针对不同的编码基本单元分配不同的码率,从而更加精细化地在一个视频帧内进行码率分配,使得视频编码的精确度更高。
附图说明
为了更清楚地说明本发明实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施方式中视频编码方法的步骤图;
图2是本发明实施方式中视频编码系统的功能模块示意图;
图3是本发明实施方式中视频编码设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施方式及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施方式仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
本申请的一个实施方式提供了一种视频编码方法,该方法可以针对待编码视频中的各个视频帧进行编码。在实际应用中,待编码视频中的各个视频帧可以具备各自的显著性图像。该显著性图像可以是宽(Width,W)和高(Height,H)与视频帧保持一致的图像,该显著性图像可以是一个灰度图像,并且在该显著性图像中,每个像素点的像素值可以位于[0,1]的区间内,该像素值便可以作为视频帧中对应像素点的显著性值。该像素值越大,则表示视频帧中对应像素点的显著性越大。具体地,可以按照视觉显著性检测算法,对待编码视频中的各个视频帧进行处理,从而得到各个视频帧的显著性图像。在本实施方式中,显著性图像中各个像素点的显著性值可以通过S(i,j)来表示,由上可见,S(i,j)可以满足以下条件:
0≤S(i,j)≤1,0≤i<W,0≤j<H
其中,W表示显著性图像的宽,H表示显著性图像的高。
此外,待编码视频中各个视频帧可以被分为感兴趣区域和非感兴趣区域,其中,感兴趣区域可以是用户在观看视频时关注的区域,而非感兴趣区域则是用户不太关注的区域。感兴趣区域可以通过多种算法识别得到,本申请对感兴趣区域的识别过程并不做限定。
在一个实施方式中,上述的视频编码方法可以包括如图1所示的多个步骤。
S1:根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧。
在本实施方式中,可以将待编码视频中的各个视频帧以及各个视频帧对应的显著性图像作为输入数据进行处理。具体地,当前正在处理的视频帧可以作为当前帧,为了准确地对当前帧进行编码,可以结合在编码顺序上位于当前帧之后的多个视频帧一起进行分析。例如,可以按照预先配置的指定数量N,将当前帧以及在编码顺序上位于当前帧之后的N个视频帧,作为从待编码视频中获取的当前图像集。该当前图像集中的各个视频帧可以按照编码顺序进行编号,具体地,可以记为:
P0,P1…PN
其中,P0可以是当前帧,PN可以是当前图像集中在编码顺序上的最后一帧。
在本实施方式中,当前图像集中的第t个视频帧的显著性图像可以记为St(i,j),这样,St(i,j)与Pt便可以具备对应关系。
S3:按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个视频帧内的感兴趣区域进行反向更新。
在本实施方式中,考虑到编码时间上相邻的视频帧在相同位置处的画面可能存在显著性值突变的情况,这种情况会导致感兴趣区域也会发生突变。存在突变的感兴趣区域在编码后,可能会引起用户视觉上的冲突。为了消除这种情况的影响,可以采用反向更新感兴趣区域的方式,以使得相邻视频帧之间相同位置处的画面的显著性值比较连贯。
具体地,针对当前帧中的各个视频帧,可以按照编码基本单元进行划分,从而将每个视频帧划分为若干个编码基本单元。在实际应用中,编码基本单元可以是大小相同的矩形,并且根据不同的编码方式,编码基本单元的尺寸也可以不同。例如,对于H.264编码器而言,编码基本单元可以是16*16的宏块。而对于HEVC编码器而言,编码基本单元可以是该编码器所允许的最小HEVC编码单元,该最小HEVC编码单元的典型大小可以是8*8。其中,编码基本单元的宽和高可以分别记为Wbu和Hbu。
在本实施方式中,在将各个视频帧按照编码基本单元进行划分后,每个编码基本单元在编码过程中还可以进一步划分为多个分块。具体地,按照编码顺序,可以为当前图像集中的各个视频帧,以编码基本单元为单位,进行编码模式的选择。其中,编码模式可以包括帧间预测模式和帧内预测模式。帧内预测模式可以包括帧内分块的划分、帧内预测方向等信息,帧间预测模式可以包括帧间分块的划分,分块的参考帧的选择以及分块的运动矢量等信息。
当然,在实际应用中,为了减低编码的计算量,可以适当简化编码模式的选择过程。例如,在进行帧间运动搜索时,可以只使用整像素精度。又例如,在进行帧内预测时,可以只使用水平、竖直、45度等方向,而不进行熵编码,也不进行量化等操作。
在本实施方式中,可以记录视频帧中各个编码基本单元的最优预测模式。最优预测模式是帧间预测还是帧内预测,可以根据不同预测模式中,原始值和预测值之间的差距,以及需要记录的额外信息的多少来决定。如果某个预测模式下,编码基本单元中分块的原始值与预测值越接近,以及需要记录的信息量越少,那么该预测模式便可以作为最优的预测模式。最终,通过分别对帧间预测模式和帧内预测模式进行检测,从而可以确定出视频帧中各个编码基本单元的最优预测模式。
在本实施方式中,在确定了编码基本单元的最优预测模式后,还可以计算编码基本单元中各个分块的复杂度。该复杂度可以在后续的反向更新感兴趣区域的过程中发挥作用。具体地,分块的复杂度可以是该分块的绝对变换误差和(Sum of AbsoluteTransformed Difference,SATD),在计算SATD值时,可以先获取分块的原始像素值和经过最优预测模式预测得到的预测像素值。需要说明的是,原始像素值和预测像素值均可以是像素矩阵,并不局限于一个具体的像素值。然后,可以将原始像素值和预测像素值相减,并对相减后的结果进行hadamard变换,得到变换像素矩阵。最终,将该变换像素矩阵中的各个元素的绝对值求和,便可以得到分块的SATD值,该SATD值便可以作为分块的复杂度。
在本实施方式中,在计算出各个分块的复杂度后,便可以进行反向更新感兴趣区域的过程。具体地,首先可以确定反向更新感兴趣区域的顺序,该顺序可以是与编码顺序相反的逆顺序。例如,编码顺序是从P0到PN,那么反向更新感兴趣区域的顺序便可以是从PN到P0。下面以第一个进行反向更新的视频帧PN为例,来阐述反向更新的具体过程。
首先,可以识别出该视频帧中的感兴趣区域中的编码基本单元,针对感兴趣区域中编码基本单元内的各个分块都进行相同的操作。遍历视频帧的感兴趣区域中的各个编码基本单元,并针对当前的编码基本单元中的任一分块,可以先识别该分块采用的最优预测模式。该分块采用的最优预测模式,可以与该分块所属的编码基本单元的最优预测模式保持一致。如果该最优预测模式为帧内预测模式,可以不对该分块进行处理,直接跳转至下一个分块。而如果该最优预测模式为帧间预测模式,那么可以根据帧间预测模式记录的各项信息,在该视频帧的参考帧中,查找到与该分块对应的参考块。该参考帧可以是当前图像集中位于视频帧PN之前的视频帧。若该参考块在所述参考帧中不属于感兴趣区域,则可以将所述参考块设置为感兴趣区域。这样,对感兴趣区域内的每个分块都进行相同的处理后,便可以完成向参考帧反向更新感兴趣区域的过程。
在本实施方式中,在反向更新感兴趣区域后,还需要为更新后的感兴趣区域中的各个像素点重新设置对应的显著性值。具体地,可以通过反向传递显著性值的方式,为参考帧中更新后的感兴趣区域重新设置显著性值。在反向传递显著性值时,可以先根据视频帧PN中分块的复杂度确定传递系数,并将传递系数与分块中像素点的显著性值的乘积作为待传递的显著性值。该传递系数可以通过将分块的复杂度代入预先设置的传递函数中得到。考虑到在反向更新感兴趣区域时,传递给参考块的显著性值不应该超过分块本身的显著性值,因此该传递函数可以是一个计算结果在[0,1]区间内的函数。此外,考虑到如果分块的复杂度比较大,则意味着分块与参考块之间的相似程度比较低,这时候为了不过分影响参考块的真实性,向参考块传递的显著性值也应当比较小。鉴于此,该传递函数应当是关于复杂度的递减函数。综上,预先设置的传递函数φ(x)应当满足以下条件:
(1)0≤φ(x)≤1
(2)对于任意的0≤a<b,满足φ(a)≥φ(b)
在本实施方式中,将分块的复杂度代入上述的传递函数,便可以得到传递系数,将该传递系数与分块中像素点的显著性值相乘后,便可以得到待传递的显著性值。然后,可以将待传递的显著性值作为参考块中对应像素点的显著性值。按照这种反向更新感兴趣区域,以及为参考帧中更新后的感兴趣区域重新设置显著性值的方式,可以减少分块与参考块的画面突变。
由上可见,在进行重新设置显著性值时,针对目标视频帧中参与反向更新感兴趣区域的目标分块,可以根据所述目标分块的复杂度确定传递系数,并将所述传递系数与所述目标分块中像素点的显著性值的乘积,作为待传递的显著性值。然后,可以在所述参考帧中确定所述目标分块的参考块,并利用所述待传递的显著性值替换所述目标分块的参考块中对应像素点的显著性值。以上只是以视频帧PN为例阐述了反向更新感兴趣区域的过程,本领域人员应当知晓,针对当前图像集中的任一目标视频帧,均可以采用上述的方式进行反向更新感兴趣区域,最终可以将当前帧的显著性图像进行更新。
需要说明的是,若视频帧PN采用的帧间预测模式使用了两个或者更多个参考帧,那么可以针对每个参考帧均进行上述的处理,这里便不再赘述。
S5:为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的各个编码基本单元进行编码。
在本实施方式中,在进行感兴趣区域的反向更新后,当前图像集中视频帧内的感兴趣区域可能都以分块为单位进行了更新。由于在编码过程中是以编码基本单元为单位,因此可以按照编码基本单元,对当前视频帧中的感兴趣区域进行调整,并且为了后续数据处理的方便,可以为调整后的感兴趣区域中的各个编码基本单元设置代表显著性值。
具体地,按照编码基本单元进行感兴趣区域的调整时,可以根据实际应用场景进行灵活设置。例如,对于所述当前帧中的任一编码基本单元,若所述编码基本单元中包含属于感兴趣区域的分块,可以将所述编码基本单元设置为感兴趣区域。又例如,对于所述当前帧中的任一编码基本单元,若所述编码基本单元中的各个分块均属于感兴趣区域,才将所述编码基本单元设置为感兴趣区域,这种方式调整后的感兴趣区域,会比前一种方式调整得到的感兴趣区域小一些,具体可以按照处理精度或者设备的运算能力,灵活选用合适的感兴趣区域的调整方式。
在对当前帧中感兴趣区域进行调整后,可以确定调整后的感兴趣区域中各个编码基本单元的代表显著性值。根据应用场景和精度的不同,可以灵活地确定上述的代表显著性值。例如,在一个实施方式中,针对当前的编码基本单元,可以将所述当前的编码基本单元中最大的显著性值作为代表显著性值。又例如,在另一个实施方式中,针对当前的编码基本单元,可以读取所述当前的编码基本单元中各个像素点的显著性值,并对各个所述像素点的显著性值进行均值滤波或者中值滤波处理,并将处理后的结果作为代表显著性值。在实际应用中,可以按照以下公式来对各个像素点的显著性值进行均值滤波:
其中,S'(x,y)可以表示均值滤波后的显著性值,Wbu和Hbu可以分别表示编码基本单元的宽和高。
当然,在实际应用中还存在更多的方式来确定编码基本单元的代表显著性值,这里就不一一例举。
在本实施方式中,在确定出当前帧更新后的感兴趣区域内各个编码基本单元的代表显著性值后,可以根据该代表显著性值,分别计算更新后的感兴趣区域中各个编码基本单元的码率调整系数。该码率调整系数,可以表示编码过程中,对编码基本单元的码率提升程度。该码率调整系数越大,表示分配给对应的编码基本单元的码率越多。在实际应用中,码率调整系数的值可以大于或者等于1,并且可以将编码基本单元的代表显著性值作为自变量,代表显著性值越大,对应的码率调整系数也越大。具体地,在一个实施方式中,码率调整系数可以按照以下公式确定:
g(s)=k*sn+1
其中,g(s)表示码率调整系数,s表示某个编码基本单元的代表显著性值,k和n是自定义的常数。
此外,在另一个实施方式中,码率调整系数还可以按照以下公式确定:
g(s)=ks
当然,只要码率调整系数的计算方式符合以上的设定,在实际应用中还可以存在更多的方式来计算码率调整系数,这里就不一一例举了,对于当前帧中第i个编码基本单元的码率调整系数,可以用gi来表示。
在本实施方式中,还可以计算当前帧更新后的感兴趣区域内各个编码基本单元的缩放复杂度。该缩放复杂度可以根据各个编码基本单元的原始复杂度来确定。具体地,若原始的编码器对于当前帧中的各个编码基本单元都使用了相同的量化参数,那么每个编码基本单元的缩放复杂度可以等同于原始复杂度。而如果原始的编码器对于当前帧中的各个编码基本单元设置了不同的量化参数,那么可以先根据所述当前帧中各个编码基本单元的原始量化参数,计算所述当前帧的平均量化参数。然后,针对所述当前帧中的任一编码基本单元,可以根据所述当前帧的平均量化参数、所述编码基本单元中各个分块的复杂度和所述编码基本单元的原始量化参数,计算所述编码基本单元的缩放复杂度。在一个具体应用场景下,平均量化参数的计算公式可以如下所示:
其中,QPavg表示当前帧的平均量化参数,QPi表示当前帧中第i个编码基本单元的原始量化参数,NBU表示当前帧中编码基本单元的总数。
在具体实施过程中,对于量化参数和量化步长是以2为底的指数关系的编码标准(例如H.264和HEVC),可以采用以下公式计算缩放复杂度:
其中,FSi表示第i个编码基本单元的缩放复杂度,Fi(j)表示第i个编码基本单元中第j个分块的复杂度,NPUi表示第i个编码基本单元中分块的总数量。
对于量化参数等于量化步长的编码标准,则可以采用以下公式计算缩放复杂度:
在一个实施方式中,为了防止非感兴趣区域码率过低而导致编码出来的画面出现花屏、模糊等问题,在实际实施过程中,需要设定一个非感兴趣区域码率保护系数B,该保护系数可以代表一个视频帧内码率可以从非感兴趣区域转移到感兴趣区域的程度。非感兴趣区域的保护系数B可以是一个大于0小于1的数,该保护系数的值越大,代表从非感兴趣区域转移到感兴趣区域的码率越少,也就是说,保护系数越大,则非感兴趣区域减少的码率越少,相应地,感兴趣区域可用的额外码率也越少。
在具体实施过程中,由于非感兴趣区域的保护系数B的限制,使得在相同输出码率的前提下,从非感兴趣区域中转移到感兴趣区域的码率可能受到限制,该限制可以由一个值来表示,该值可以称为码率调整完成度。具体地,基于所述保护系数、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,可以计算所述当前帧的码率调整完成度P。
在一个实施方式中,在计算当前帧的码率调整完成度时,可以计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和与所述保护系数的第一乘积。然后,可以计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的第二乘积,并计算所述更新后的感兴趣区域中各个编码基本单元的第二乘积之和。最终,可以计算当前帧各个编码基本单元的缩放复杂度之和与所述第一乘积的差值,并计算所述差值与所述第二乘积之和的比值,并将所述比值作为所述当前帧的码率调整完成度。
上述的过程可以通过以下的公式来表示:
其中,NROI表示当前帧中的非感兴趣区域,ROI表示当前帧中的感兴趣区域。
如果上式计算的码率调整完成度小于1,则代表当前帧中从非感兴趣区域转移到感兴趣区域的码率可能受到了限制。比如P=0.8则代表,由于非感兴趣区域码率保护系数的限制,当前帧中从非感兴趣区域中转移到感兴趣区域的码率只有预期的80%。如果码率调整完成度大于或者等于1,则意味着根据各编码基本单元的码率调整系数,从非感兴趣区域转移到感兴趣区域的码率没有受到限制,符合预期的情况。按照上述的方式,在具体实施过程中,不同视频帧的感兴趣区域码率调整完成度可能是不同的,从而能够精确地对各个视频帧进行码率分配。
在本实施方式中,根据所述码率调整完成度、所述更新后的感兴趣区域中各个编码基本单元的码率调整系数以及所述更新后的感兴趣区域中各个编码基本单元的原始量化参数,便可以计算所述当前帧中更新后的感兴趣区域中各个编码基本单元的量化参数。对于不同的编码标准,计算感兴趣区域内各个编码基本单元的量化参数的过程也可以不同。
具体地,对于量化参数和量化步长是以2为底的指数关系的编码标准(如H.264和HEVC编码标准),可以按照以下公式来重新计算各个编码基本单元的量化参数:
其中,QPi'表示重新计算后的第i个编码基本单元的量化参数。
而对于量化参数等于量化步长的编码标准,可以采用以下公式重新计算量化参数:
由上可见,在重新计算感兴趣区域内各个编码基本单元的量化参数时,对于更新后的感兴趣区域中的任一目标编码基本单元,若所述当前帧的码率调整完成度小于指定阈值,可以根据所述码率调整完成度和所述目标编码基本单元的码率调整系数的乘积确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数。若所述当前帧的码率调整完成度大于或者等于所述指定阈值,可以根据所述目标编码基本单元的码率调整系数确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数。上述的指定阈值,可以是公式中的1。当然,根据应用场景的不同,指定阈值和码率调整完成度的数值也可以相应变化。
在本实施方式中,计算出感兴趣区域内各个编码基本单元的量化参数后,可以继续计算非感兴趣区域内各个编码基本单元的量化参数。具体地,可以先根据所述当前帧的码率调整完成度、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,计算所述更新后的非感兴趣区域的码率降低系数。然后,再根据所述非感兴趣区域的码率降低系数和所述非感兴趣区域中各个编码基本单元的原始量化参数,计算所述非感兴趣区域中各个编码基本单元的量化参数。
其中,非感兴趣区域的码率降低系数D可以按照以下公式计算:
可见,若所述当前帧的码率调整完成度小于指定阈值,可以将所述保护系数作为所述更新后的非感兴趣区域的码率降低系数。若所述当前帧的码率调整完成度大于或者等于所述指定阈值,可以计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的乘积,以及计算各个所述乘积之和。然后,还可以计算当前帧中各个编码基本单元的复杂度之和与所述乘积之和的差值,并将所述差值与所述缩放复杂度之和的比值作为所述更新后的非感兴趣区域的码率降低系数。上述的指定阈值,可以是公式中的1。当然,根据应用场景的不同,指定阈值和码率调整完成度的数值也可以相应变化。
在本实施方式中,计算出非感兴趣区域的码率降低系数后,对于所述更新后的非感兴趣区域中的任一目标编码基本单元,可以根据所述非感兴趣区域的码率降低系数确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数。具体地,上述过程可以按照以下公式来表示:
对于量化参数和量化步长是以2为底的指数关系的编码标准(如H.264和HEVC编码标准),可以按照以下公式来计算非感兴趣区域中各个编码基本单元的量化参数:
QPi'=QPi-6log2D
而对于量化参数等于量化步长的编码标准,可以采用以下公式计算非感兴趣区域中各个编码基本单元的量化参数:
在本实施方式中,在按照上述方式重新计算出当前帧中感兴趣区域和非感兴趣区域内各个编码基本单元的量化参数后,便可以按照重新计算出的量化参数,对各个编码基本单元进行编码。由于按照上述方式调整后感兴趣区域内编码基本单元的量化步长变小,而非感兴趣区域内的编码基本单元的量化步长变大,因此能够使得对感兴趣区域进行更为精细的编码,获得更多的码率分配,从而更为清晰。
请参阅图2,本申请还提供一种视频编码系统,待编码视频的视频帧中包括感兴趣区域和非感兴趣区域;所述系统包括:
当前图像集获取单元,用于根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧;
反向更新单元,用于按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个视频帧内的感兴趣区域进行反向更新;
量化编码单元,用于为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的编码基本单元进行编码。
在一个实施方式中,所述量化编码单元包括:
显著性值重置模块,用于为更新后的感兴趣区域重新设置显著性值;
量化参数计算模块,用于确定所述当前帧中各个编码基本单元的缩放复杂度,并基于所述缩放复杂度和所述当前帧中重新设置的显著性值,为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数。
在一个实施方式中,所述反向更新单元包括:
编码基本单元配置模块,用于将所述当前图像集中的各个视频帧按照编码基本单元进行划分,并为划分得到的各个编码基本单元确定最优预测模式;
感兴趣区域重置模块,用于针对所述当前图像集中的任一目标视频帧,遍历所述目标视频帧的感兴趣区域内的各个编码基本单元,并针对当前的编码基本单元中的任一分块进行分析,若所述分块采用的最优预测模式为帧间预测模式,在所述目标视频帧的参考帧中查找所述分块对应的参考块,若所述参考块在所述参考帧中不属于感兴趣区域,将所述参考块设置为感兴趣区域。
在一个实施方式中,所述系统还包括:
复杂度计算单元用于分别计算所述编码基本单元中各个分块的复杂度,其中,针对所述编码基本单元中的任一分块,按照所述最优预测模式确定所述分块的预测像素值,并根据所述分块的原始像素值和所述预测像素值计算绝对变换误差和,并将所述绝对变换误差和作为所述分块的复杂度。
在一个实施方式中,所述量化编码单元包括:
码率调整系数计算模块,用于根据所述当前帧中更新后的感兴趣区域中各个编码基本单元的代表显著性值,分别计算所述更新后的感兴趣区域中各个编码基本单元的码率调整系数;
码率调整完成度计算模块,用于确定非感兴趣区域的保护系数,并基于所述保护系数、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,计算所述当前帧的码率调整完成度;其中,所述保护系数用于表征码率从非感兴趣区域转移至感兴趣区域的程度;
感兴趣区域计算模块,用于根据所述码率调整完成度、所述更新后的感兴趣区域中各个编码基本单元的码率调整系数以及所述更新后的感兴趣区域中各个编码基本单元的原始量化参数,计算所述当前帧中更新后的感兴趣区域中各个编码基本单元的量化参数。
在一个实施方式中,所述码率调整完成度计算模块包括:
第一乘积计算模块,用于计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和与所述保护系数的第一乘积;
第二乘积之和计算模块,用于计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的第二乘积,并计算所述更新后的感兴趣区域中各个编码基本单元的第二乘积之和;
比值计算模块,用于计算所述当前帧中各个编码基本单元的缩放复杂度之和与所述第一乘积的差值,并计算所述差值与所述第二乘积之和的比值,并将所述比值作为所述当前帧的码率调整完成度。
请参阅图3,本申请一个实施方式还提供一种视频编码设备,所述设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,可以实现上述的视频编码方法。
在本实施方式中,所述存储器可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括:利用电能方式存储信息的装置,如RAM或ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器或U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的存储器,例如量子存储器或石墨烯存储器等等。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
由上可见,本申请一个或者多个实施方式提供的技术方案,在对当前帧进行编码时,可以结合在编码顺序上位于当前帧之后的多个视频帧一起分析。具体地,可以按照与编码顺序相反的顺序,从最后一个视频帧开始,依次向前反向更新各个视频帧内的感兴趣区域,并可以为更新后的感兴趣区域重新设置显著性值。这样,对于时间上相邻的视频帧,如果相同位置处出现感兴趣区域突变的情况,能够通过反向更新的方式减缓或者消除这种感兴趣区域突变的情况,最终使得相邻帧的感兴趣区域在编码后从视觉上也不会出现太大的突变。在反向更新感兴趣区域之后,可以从编码基本单元的角度,为当前帧中各个编码基本单元计算量化参数。其中,由于各个编码基本单元的缩放复杂度和显著性值不同,并且感兴趣区域和非感兴趣区域的量化参数的计算方式也不同,因此当前帧中各个编码基本单元的量化参数也可能各不相同。后续在对当前帧进行编码时,可以针对不同的编码基本单元分配不同的码率,从而更加精细化地在一个视频帧内进行码率分配,使得视频编码的精确度更高。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对系统和设备的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本领域内的技术人员应明白,本发明的实施方式可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施方式、完全软件实施方式、或结合软件和硬件方面的实施方式的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施方式而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (20)
1.一种视频编码方法,其特征在于,待编码视频的视频帧中包括感兴趣区域和非感兴趣区域;所述方法包括:
根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧;
按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个参考帧内的感兴趣区域进行反向更新;其中,所述当前帧作为所述当前图像集中其它视频帧的参考帧;
为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的各个编码基本单元进行编码;其中,所述感兴趣区域中所述编码基本单元的量化参数基于码率调整系数计算得到,所述码率调整系数用于表征对所述编码基本单元的码率提升程度。
2.根据权利要求1所述的方法,其特征在于,为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数包括:
为更新后的感兴趣区域重新设置显著性值;
确定所述当前帧中各个编码基本单元的缩放复杂度,并基于所述缩放复杂度和所述当前帧中重新设置的显著性值,为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数;其中,所述编码基本单元的缩放复杂度基于所述当前帧中编码基本单元的原始量化参数和编码基本单元中分块的复杂度计算得到;所述非感兴趣区域中编码基本单元的量化参数基于码率调整完成度计算得到,所述码率调整完成度用于表征从所述非感兴趣区域中转移到所述感兴趣区域的码率。
3.根据权利要求2所述的方法,其特征在于,依次对所述当前图像集中各个参考帧内的感兴趣区域进行反向更新包括:
将所述当前图像集中的各个视频帧按照编码基本单元进行划分,并为划分得到的各个编码基本单元确定最优预测模式;
针对所述当前图像集中的任一目标视频帧,遍历所述目标视频帧的感兴趣区域内的各个编码基本单元,并针对当前的编码基本单元中的任一分块进行分析,若所述分块采用的最优预测模式为帧间预测模式,在所述目标视频帧的参考帧中查找所述分块对应的参考块,若所述参考块在所述参考帧中不属于感兴趣区域,将所述参考块设置为感兴趣区域。
4.根据权利要求3所述的方法,其特征在于,在为划分得到的各个编码基本单元确定最优预测模式时,所述方法还包括:
分别计算所述编码基本单元中各个分块的复杂度,其中,针对所述编码基本单元中的任一分块,按照所述最优预测模式确定所述分块的预测像素值,并根据所述分块的原始像素值和所述预测像素值计算绝对变换误差和,并将所述绝对变换误差和作为所述分块的复杂度。
5.根据权利要求4所述的方法,其特征在于,为更新后的感兴趣区域重新设置显著性值包括:
针对所述目标视频帧中参与反向更新感兴趣区域的目标分块,根据所述目标分块的复杂度确定传递系数,并将所述传递系数与所述目标分块中像素点的显著性值的乘积,作为待传递的显著性值;
在所述参考帧中确定所述目标分块的参考块,并利用所述待传递的显著性值替换所述目标分块的参考块中对应像素点的显著性值。
6.根据权利要求2所述的方法,其特征在于,在为更新后的感兴趣区域重新设置显著性值之后,所述方法还包括:
在所述当前帧中以编码基本单元为单位,调整所述当前帧中的感兴趣区域,并为调整后的感兴趣区域中的各个编码基本单元设置代表显著性值;
其中,对于所述当前帧中的任一编码基本单元,若所述编码基本单元中包含属于感兴趣区域的分块,将所述编码基本单元设置为感兴趣区域;
或者
对于所述当前帧中的任一编码基本单元,若所述编码基本单元中的各个分块均属于感兴趣区域,将所述编码基本单元设置为感兴趣区域。
7.根据权利要求2或6所述的方法,其特征在于,为所述当前帧中更新后的感兴趣区域中的编码基本单元计算量化参数包括:
根据所述当前帧中更新后的感兴趣区域中各个编码基本单元的代表显著性值,分别计算所述更新后的感兴趣区域中各个编码基本单元的码率调整系数;其中,代表显著性值越大,对应的码率调整系数也越大;
确定非感兴趣区域的保护系数,并基于所述保护系数、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,计算所述当前帧的码率调整完成度;其中,所述保护系数用于表征码率从非感兴趣区域转移至感兴趣区域的程度;
根据所述码率调整完成度、所述更新后的感兴趣区域中各个编码基本单元的码率调整系数以及所述更新后的感兴趣区域中各个编码基本单元的原始量化参数,计算所述当前帧中更新后的感兴趣区域中各个编码基本单元的量化参数。
8.根据权利要求7所述的方法,其特征在于,计算所述当前帧的码率调整完成度包括:
计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和与所述保护系数的第一乘积;
计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的第二乘积,并计算所述更新后的感兴趣区域中各个编码基本单元的第二乘积之和;
计算所述当前帧中各个编码基本单元的缩放复杂度之和与所述第一乘积的差值,并计算所述差值与所述第二乘积之和的比值,并将所述比值作为所述当前帧的码率调整完成度。
9.根据权利要求7所述的方法,其特征在于,计算所述当前帧中更新后的感兴趣区域中各个编码基本单元的量化参数包括:
对于所述更新后的感兴趣区域中的任一目标编码基本单元,若所述当前帧的码率调整完成度小于指定阈值,根据所述码率调整完成度和所述目标编码基本单元的码率调整系数的乘积确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数;
若所述当前帧的码率调整完成度大于或者等于所述指定阈值,根据所述目标编码基本单元的码率调整系数确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数。
10.根据权利要求7所述的方法,其特征在于,为所述当前帧中更新后的非感兴趣区域中的编码基本单元分别计算量化参数包括:
根据所述当前帧的码率调整完成度、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,计算所述更新后的非感兴趣区域的码率降低系数;
根据所述非感兴趣区域的码率降低系数和所述非感兴趣区域中各个编码基本单元的原始量化参数,计算所述非感兴趣区域中各个编码基本单元的量化参数。
11.根据权利要求10所述的方法,其特征在于,计算所述更新后的非感兴趣区域的码率降低系数包括:
若所述当前帧的码率调整完成度小于指定阈值,将所述保护系数作为所述更新后的非感兴趣区域的码率降低系数;
若所述当前帧的码率调整完成度大于或者等于所述指定阈值,计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的乘积,以及计算各个所述乘积之和;计算所述当前帧中各个编码基本单元的缩放复杂度之和与所述乘积之和的差值,并将所述差值与所述缩放复杂度之和的比值作为所述更新后的非感兴趣区域的码率降低系数。
12.根据权利要求10所述的方法,其特征在于,计算所述非感兴趣区域中各个编码基本单元的量化参数包括:
对于所述更新后的非感兴趣区域中的任一目标编码基本单元,根据所述非感兴趣区域的码率降低系数确定所述目标编码基本单元的量化调整值,并将所述目标编码基本单元的原始量化参数和所述量化调整值的差值或者比值作为所述目标编码基本单元的的量化参数。
13.根据权利要求2所述的方法,其特征在于,确定所述当前帧中各个编码基本单元的缩放复杂度包括:
根据所述当前帧中各个编码基本单元的原始量化参数,计算所述当前帧的平均量化参数;
针对所述当前帧中的任一编码基本单元,根据所述当前帧的平均量化参数、所述编码基本单元中各个分块的复杂度和所述编码基本单元的原始量化参数,计算所述编码基本单元的缩放复杂度。
14.一种视频编码系统,其特征在于,待编码视频的视频帧中包括感兴趣区域和非感兴趣区域;所述系统包括:
当前图像集获取单元,用于根据所述待编码视频中的当前帧和所述待编码视频的编码顺序,在所述待编码视频中获取当前图像集,所述当前图像集中包括所述当前帧以及在编码顺序上位于所述当前帧之后的指定数量的视频帧;
反向更新单元,用于按照与所述编码顺序相反的逆顺序,依次对所述当前图像集中各个参考帧内的感兴趣区域进行反向更新;其中,所述当前帧作为所述当前图像集中其它视频帧的参考帧;
量化编码单元,用于为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数,以根据计算得到的量化参数为所述当前帧中的编码基本单元进行编码;其中,所述感兴趣区域中所述编码基本单元的量化参数基于码率调整系数计算得到,所述码率调整系数用于表征对所述编码基本单元的码率提升程度。
15.根据权利要求14所述的系统,其特征在于,所述量化编码单元包括:
显著性值重置模块,用于为更新后的感兴趣区域重新设置显著性值;
量化参数计算模块,用于确定所述当前帧中各个编码基本单元的缩放复杂度,并基于所述缩放复杂度和所述当前帧中重新设置的显著性值,为所述当前帧中更新后的感兴趣区域和非感兴趣区域中的编码基本单元分别计算量化参数;其中,所述编码基本单元的缩放复杂度基于所述当前帧中编码基本单元的原始量化参数和编码基本单元中分块的复杂度计算得到;所述非感兴趣区域中编码基本单元的量化参数基于码率调整完成度计算得到,所述码率调整完成度用于表征从所述非感兴趣区域中转移到所述感兴趣区域的码率。
16.根据权利要求15所述的系统,其特征在于,所述反向更新单元包括:
编码基本单元配置模块,用于将所述当前图像集中的各个视频帧按照编码基本单元进行划分,并为划分得到的各个编码基本单元确定最优预测模式;
感兴趣区域重置模块,用于针对所述当前图像集中的任一目标视频帧,遍历所述目标视频帧的感兴趣区域内的各个编码基本单元,并针对当前的编码基本单元中的任一分块进行分析,若所述分块采用的最优预测模式为帧间预测模式,在所述目标视频帧的参考帧中查找所述分块对应的参考块,若所述参考块在所述参考帧中不属于感兴趣区域,将所述参考块设置为感兴趣区域。
17.根据权利要求16所述的系统,其特征在于,所述系统还包括:
复杂度计算单元用于分别计算所述编码基本单元中各个分块的复杂度,其中,针对所述编码基本单元中的任一分块,按照所述最优预测模式确定所述分块的预测像素值,并根据所述分块的原始像素值和所述预测像素值计算绝对变换误差和,并将所述绝对变换误差和作为所述分块的复杂度。
18.根据权利要求15所述的系统,其特征在于,所述量化编码单元包括:
码率调整系数计算模块,用于根据所述当前帧中更新后的感兴趣区域中各个编码基本单元的代表显著性值,分别计算所述更新后的感兴趣区域中各个编码基本单元的码率调整系数;其中,代表显著性值越大,对应的码率调整系数也越大;
码率调整完成度计算模块,用于确定非感兴趣区域的保护系数,并基于所述保护系数、所述当前帧中各个编码基本单元的缩放复杂度以及所述更新后的感兴趣区域中各个编码基本单元的码率调整系数,计算所述当前帧的码率调整完成度;其中,所述保护系数用于表征码率从非感兴趣区域转移至感兴趣区域的程度;
感兴趣区域计算模块,用于根据所述码率调整完成度、所述更新后的感兴趣区域中各个编码基本单元的码率调整系数以及所述更新后的感兴趣区域中各个编码基本单元的原始量化参数,计算所述当前帧中更新后的感兴趣区域中各个编码基本单元的量化参数。
19.根据权利要求18所述的系统,其特征在于,所述码率调整完成度计算模块包括:
第一乘积计算模块,用于计算所述当前帧中更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和,并计算所述更新后的非感兴趣区域中各个编码基本单元的缩放复杂度之和与所述保护系数的第一乘积;
第二乘积之和计算模块,用于计算所述更新后的感兴趣区域中各个编码基本单元的缩放复杂度与各自的码率调整系数的第二乘积,并计算所述更新后的感兴趣区域中各个编码基本单元的第二乘积之和;
比值计算模块,用于计算所述当前帧中各个编码基本单元的缩放复杂度之和与所述第一乘积的差值,并计算所述差值与所述第二乘积之和的比值,并将所述比值作为所述当前帧的码率调整完成度。
20.一种视频编码设备,其特征在于,所述设备包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至13中任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911122051.0A CN110996099B (zh) | 2019-11-15 | 2019-11-15 | 一种视频编码方法、系统及设备 |
PCT/CN2019/123710 WO2021093060A1 (zh) | 2019-11-15 | 2019-12-06 | 一种视频编码方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911122051.0A CN110996099B (zh) | 2019-11-15 | 2019-11-15 | 一种视频编码方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110996099A CN110996099A (zh) | 2020-04-10 |
CN110996099B true CN110996099B (zh) | 2021-05-25 |
Family
ID=70084489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911122051.0A Active CN110996099B (zh) | 2019-11-15 | 2019-11-15 | 一种视频编码方法、系统及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110996099B (zh) |
WO (1) | WO2021093060A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111479113B (zh) * | 2020-04-15 | 2021-04-09 | 腾讯科技(深圳)有限公司 | 码率控制方法和装置、存储介质和电子设备 |
CN112788344B (zh) * | 2020-12-30 | 2023-03-21 | 北京大数据研究院 | 基于编码单元重组的视频解码方法、装置、系统、介质及终端 |
CN112788336B (zh) * | 2020-12-30 | 2023-04-14 | 北京大数据研究院 | 数据元素的排序还原方法、系统、终端及标记方法 |
CN112822488B (zh) * | 2020-12-30 | 2023-04-07 | 北京大学 | 基于块重组的视频编解码系统、方法、装置、终端及介质 |
CN112804562B (zh) * | 2020-12-30 | 2022-01-07 | 北京大学 | 基于片重组的视频编码方法、装置、终端及介质 |
CN114339218A (zh) * | 2022-01-04 | 2022-04-12 | 维沃移动通信有限公司 | 图像编码方法、图像编码装置、电子设备和可读存储介质 |
CN115314722B (zh) * | 2022-06-17 | 2023-12-08 | 百果园技术(新加坡)有限公司 | 一种视频码率分配方法、系统、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682454A (zh) * | 2012-04-28 | 2012-09-19 | 中国科学技术大学 | 一种视频中的感兴趣区域跟踪方法及装置 |
CN101375312B (zh) * | 2006-02-07 | 2013-03-20 | 高通股份有限公司 | 多模式关注区视频对象分割 |
CN104539962A (zh) * | 2015-01-20 | 2015-04-22 | 北京工业大学 | 一种融合视觉感知特征的可分层视频编码方法 |
CN105379268A (zh) * | 2013-01-28 | 2016-03-02 | 微软技术许可有限责任公司 | 在视频编码中适应鲁棒性 |
CN106934794A (zh) * | 2015-12-01 | 2017-07-07 | 株式会社理光 | 信息处理装置,信息处理方法和检查系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107770525B (zh) * | 2016-08-15 | 2020-07-24 | 华为技术有限公司 | 一种图像编码的方法及装置 |
US20180068451A1 (en) * | 2016-09-08 | 2018-03-08 | Qualcomm Incorporated | Systems and methods for creating a cinemagraph |
KR102498597B1 (ko) * | 2017-08-22 | 2023-02-14 | 삼성전자 주식회사 | 전자 장치 및 이를 이용하여 관심 영역을 설정하여 오브젝트를 식별하는 방법 |
KR102343648B1 (ko) * | 2017-08-29 | 2021-12-24 | 삼성전자주식회사 | 영상 부호화 장치 및 영상 부호화 시스템 |
KR102543444B1 (ko) * | 2017-08-29 | 2023-06-13 | 삼성전자주식회사 | 영상 부호화 장치 |
CN109429065A (zh) * | 2017-09-05 | 2019-03-05 | 联咏科技股份有限公司 | 视频编码装置及视频编码方法 |
-
2019
- 2019-11-15 CN CN201911122051.0A patent/CN110996099B/zh active Active
- 2019-12-06 WO PCT/CN2019/123710 patent/WO2021093060A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101375312B (zh) * | 2006-02-07 | 2013-03-20 | 高通股份有限公司 | 多模式关注区视频对象分割 |
CN102682454A (zh) * | 2012-04-28 | 2012-09-19 | 中国科学技术大学 | 一种视频中的感兴趣区域跟踪方法及装置 |
CN105379268A (zh) * | 2013-01-28 | 2016-03-02 | 微软技术许可有限责任公司 | 在视频编码中适应鲁棒性 |
CN104539962A (zh) * | 2015-01-20 | 2015-04-22 | 北京工业大学 | 一种融合视觉感知特征的可分层视频编码方法 |
CN106934794A (zh) * | 2015-12-01 | 2017-07-07 | 株式会社理光 | 信息处理装置,信息处理方法和检查系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021093060A1 (zh) | 2021-05-20 |
CN110996099A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110996099B (zh) | 一种视频编码方法、系统及设备 | |
US20110317766A1 (en) | Apparatus and method of depth coding using prediction mode | |
CN109660800B (zh) | 运动估计方法、装置、电子设备及计算机可读存储介质 | |
EP3282701B1 (en) | Prediction mode selection method, apparatus and device | |
JP2017536002A (ja) | 画像予測方法および関連装置 | |
CN110769254B (zh) | 一种视频帧的码率配置方法、系统及设备 | |
US11310524B2 (en) | Method and apparatus for determining motion vector of affine code block | |
US20040218675A1 (en) | Method and apparatus for determining reference picture and block mode for fast motion estimation | |
WO2007057986A1 (ja) | 動きベクトル算出装置および動きベクトル算出方法 | |
TW200803521A (en) | Randomly sub-sampled partition voting (RSPV) algorithm for scene change detection | |
CN104052998B (zh) | 一种基于运动强度的gop层率控调整方法和系统 | |
CN107852500A (zh) | 运动矢量场编码方法和解码方法、编码和解码装置 | |
US20200128252A1 (en) | Variable Frame Rate Encoding Method and Device, Computer Device and Computer Readable Storage Medium | |
RU2734616C1 (ru) | Способ декодирования видео с предсказанием и устройство декодирования видео с предсказанием | |
US10034016B2 (en) | Coding apparatus, computer system, coding method, and computer product | |
US10595038B2 (en) | Moving image coding apparatus, moving image coding method and recording medium | |
CN110166770B (zh) | 视频编码方法、装置、计算机设备和存储介质 | |
CN112087624A (zh) | 基于高效率视频编码的编码管理方法 | |
EP1690232A2 (en) | Detection of local visual space-time details in a video signal | |
US10666970B2 (en) | Encoding apparatus, encoding method, and storage medium | |
US10715822B2 (en) | Image encoding method and encoder | |
CN110933446B (zh) | 一种感兴趣区域的识别方法、系统及设备 | |
CN104918047A (zh) | 一种双向运动估计的排除方法和装置 | |
CN110876082B (zh) | 一种视频帧的复杂度的确定方法及装置 | |
JP2008252225A (ja) | 動画像符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |