CN109660812A - 复杂度和码率的确定方法、装置及计算机可读存储介质 - Google Patents
复杂度和码率的确定方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109660812A CN109660812A CN201811341867.8A CN201811341867A CN109660812A CN 109660812 A CN109660812 A CN 109660812A CN 201811341867 A CN201811341867 A CN 201811341867A CN 109660812 A CN109660812 A CN 109660812A
- Authority
- CN
- China
- Prior art keywords
- complexity
- value
- sub
- determined
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请是关于一种复杂度、码率的确定方法、装置和计算机存储介质。该复杂度的确定方法包括:获取待确定视频;对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。在复杂度的该确定方法中,根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
Description
技术领域
本申请属于视频处理技术领域,尤其是复杂度和码率的确定方法、装置及计算机可读存储介质。
背景技术
视频码率就是数据传输时单位时间传送的数据位数,视频码率配置的一个重要依据是视频的复杂度。
目前,视频复杂度只有一个定性的概念,例如,运动、有纹理的视频就是广义上的复杂视频,平滑、静止的视频就是广义上的简单视频,即,视频复杂度不容易量化,从而,对视频码率的配置往往也是依靠一定的经验进行。实践中,对复杂的视频配置较低的视频码率,会造成视频质量差,出现花屏的风险;对简单的视频配置较高的视频码率,会导致码率冗余,浪费资源。
针对视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题,现有技术中缺乏有效的解决方案。
发明内容
为缓解相关技术中存在的问题,本申请公开一种复杂度、码率的确定方法、装置及计算机可读存储介质。
第一方面,本发明实施例提供了一种复杂度的确定方法,包括:
获取待确定视频;
对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
计算多个所述空域复杂度数值的平均值得到第一平均值,并计算多个所述时域复杂度数值的平均值得到第二平均值,以根据所述第一平均值和所述第二平均值确定所述待确定视频的复杂度。
可选地,对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,包括:
将所述待确定视频每一图像帧划分为多个子块;
对每个所述子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个所述第一子复杂度之和确定为所述空域复杂度数值;
对每个所述子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个所述第二子复杂度之和确定为所述时域复杂度数值。
可选地,对每个所述子块的空域复杂度进行计算,包括:
基于帧内预测方向,对所述子块计算残差,得到残差块;
将所述残差块拆为多个分块;
对每个所述分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个所述绝对值总和之和的二分之一确定为所述第一子复杂度。
可选地,对每个所述子块的时域复杂度进行计算,包括:
搜索所述子块参考原始帧最佳匹配块的运动矢量;
对所述运动矢量进行预测,得到预测运动矢量;
计算所述运动矢量和所述预测运动矢量的差值;
获取所述差值的坐标值,并计算所述运动矢量和所述预测运动矢量之间的绝对差值和,以基于所述坐标值和所述绝对差值和确定所述第二子复杂度。
第二方面,本发明实施例提供了一种复杂度的确定装置,包括:
第一获取模块,用于获取待确定视频;
第一计算模块,用于对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
第二计算模块,用于计算多个所述空域复杂度数值的平均值得到第一平均值,并计算多个所述时域复杂度数值的平均值得到第二平均值,以根据所述第一平均值和所述第二平均值确定所述待确定视频的复杂度。
可选地,所述第一计算模块包括:
划分单元,用于将所述待确定视频每一图像帧划分为多个子块;
第一计算单元,用于对每个所述子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个所述第一子复杂度之和确定为所述空域复杂度数值;
第二计算单元,用于对每个所述子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个所述第二子复杂度之和确定为所述时域复杂度数值。
可选地,所述第一计算单元用于:
基于帧内预测方向,对所述子块计算残差,得到残差块;
将所述残差块拆为多个分块;
对每个所述分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个所述绝对值总和之和的二分之一确定为所述第一子复杂度。
可选地,所述第二计算单元用于:
搜索所述子块参考原始帧最佳匹配块的运动矢量;
对所述运动矢量进行预测,得到预测运动矢量;
计算所述运动矢量和所述预测运动矢量的差值;
获取所述差值的坐标值,并计算所述运动矢量和所述预测运动矢量之间的绝对差值和,以基于所述坐标值和所述绝对差值和确定所述第二子复杂度。
第三方面,本发明实施例提供了一种码率的确定方法,包括:
调用第一方面所述的复杂度的确定方法,得到所述待确定视频的第一平均值和第二平均值;
获取空域复杂度因子、时域复杂度因子和缩放因子,其中,所述空域复杂度因子和所述时域复杂度因子的取值皆为大于-1且小于1的数值,所述缩放因子为大于1且小于20的数值;
计算所述第一平均值和所述空域复杂度因子的积以得到第一积值,并计算所述第二平均值和所述时域复杂度因子的积以得到第二积值;
将所述第一积值和所述第二积值之和与所述缩放因子之间的商,确定为所述待确定视频的码率。
可选地,所述空域复杂度因子取值0.5,所述时域复杂度因子取值1.0,所述缩放因子取值2.0。
第四方面,本发明实施例提供了一种码率的确定装置,包括:
调用模块,用于调用第一方面所述的复杂度的确定方法,得到所述待确定视频的第一平均值和第二平均值;
第二获取模块,用于获取空域复杂度因子、时域复杂度因子和缩放因子,其中,所述空域复杂度因子和所述时域复杂度因子的取值皆为大于-1且小于1的数值,所述缩放因子为大于1且小于20的数值;
第三计算模块,用于计算所述第一平均值和所述空域复杂度因子的积以得到第一积值,并计算所述第二平均值和所述时域复杂度因子的积以得到第二积值;
确定模块,用于将所述第一积值和所述第二积值之和与所述缩放因子之间的商,确定为所述待确定视频的码率。
可选地,所述空域复杂度因子取值0.5,所述时域复杂度因子取值1.0,所述缩放因子取值2.0。
第五方面,本发明实施例提供了一种复杂度的确定装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行第一方面所述的复杂度的确定方法。
第六方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现第一方面所述的复杂度的确定方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
该复杂度的确定方法包括:获取待确定视频;对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。在复杂度的该确定方法中,根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
附图说明
图1所示为本发明实施例一提供的一种复杂度的确定方法流程图;
图2所示为本发明实施例二提供的一种复杂度的确定装置结构框图;
图3所示为本发明实施例三提供的一种码率的确定方法流程图;
图4所示为本发明实施例四提供的一种码率的确定装置结构框图;
图5所示为本发明实施例三提供的一种复杂度的确定装置结构框图;
图6所示为本发明实施例三提供的另一种复杂度的确定装置结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
为便于对本实施例进行理解,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
实施例一
本发明实施例提供了一种复杂度的确定方法,如图1所示,包括:
步骤S102,获取待确定视频;
步骤S104,对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
步骤S106,计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。
具体地,根据第一平均值和第二平均值确定待确定视频的复杂度,可以先将第一平均值和第二平均值归一化:将第一平均值除以图像帧长与宽的乘积而得到第一归一化数值,将第二平均值除以图像帧长与宽的乘积而得到第二归一化数值,然后由第一归一化数值和第二归一化数值确定待确定视频的复杂度。通过归一化的数值确定待确定视频的复杂度,有利于对不同大小图像帧的视频复杂度进行比较。
本发明实施例提供的复杂度的该确定方法中,根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
本发明的一个可选实施方式中,对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,包括:
将待确定视频每一图像帧划分为多个子块;
对每个子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个第一子复杂度之和确定为空域复杂度数值;
对每个子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个第二子复杂度之和的二分之一确定为时域复杂度数值。
本发明实施例中,将每一图像帧划分为多个子块,通过多个子块的空域复杂度之和确定每一图像帧的空域复杂度,通过多个子块的时域复杂度之和确定每一图像帧的时域复杂度,顺应了图像划分的处理方案,有利于利用现有方法计算多个子块的空域复杂度和时域复杂度,从而得到每一图像帧的空域复杂度和时域复杂度。
本发明的另一个可选实施方式中,对每个子块的空域复杂度进行计算,包括:
基于帧内预测方向,对子块计算残差,得到残差块;
将残差块拆为多个分块;
对每个分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个绝对值总和之和的二分之一确定为第一子复杂度。
例如:子块为一个8X8的子块,该子块的原始数据为:
接下来对该子块实施如下步骤,以得到该子块的第一子复杂度:
(1)对该子块进行帧内预测
首先,判断帧内预测模式是否为DC模式,其中,如果不是DC模式,则直接采用该子块的周边像素数据进行帧内预测;如果是DC模式,则对该子块的周边像素进行滤波,采用滤波后的周边像素数据进行帧内预测。
其次,进行帧内预测步骤。下面以DC模式为例进行说明:
a、获取该子块的周边像素在滤波前的数据:
45 39 36 32 31 33 31 32 33 30 35 43 40 49 52 64 67 44 45 42 42 42 4646 44 33 33 42 48 60 58 46 44
需要说明的是,上述数据依次存储在0-32这33个位置,其中:存储位置0存储周边左上角的像素数据;存储位置1-8存储周边上侧的像素数据;存储位置9-16存储周边右上角的像素数据;存储位置17-24存储周边左侧的像素数据;存储位置25-32存储周边左下角的像素数据。
b、通过以下公式计算dcValue:
dcValue=(left像素和+above像素和+当前块宽度)>>(log2(N)+1),其中,>>为右移运算符,N为子块的长/宽,具体将数值代入为:
dcValue=(left像素和+above像素和+当前块宽度)>>(log2(N)+1)
=((44+45+42+42+42+46+46+44)+(39+36+32+31+33+31+32+33)+8)>>4
=39
C、判断子块是否大于16X16,其中,如果子块大于16X16,则对该子块进行帧内预测而得到的预测块中全部数据为dcValue;如果子块不大于16X16,则:
预测左上角像素=(left[0]+above[0]+2*dcValue+2)>>2,具体将数值代入为:预测左上角像素=(left[0]+above[0]+2*dcValue+2)>>2=(44+39+2*39+2)>>2=40,
预测第一行像素[x]=(above[x]+3*dcValue+2)>>2,例如:预测第一行像素[4]=(33+3*39+2)>>2=38,
预测第一列像素[x]=(left[x]+3*dcValue+2)>>2,例如:预测第一列像素[5]=(46+3*39+2)>>2=41;
d、得到上述帧内预测后的预测块:
(2)对子块计算残差,得到残差块
具体地,残差块为该子块的原始数据块和帧内预测后的预测块对应位置的数值之差,得到如下残差块:
(3)将残差块拆为多个分块:
这里将残差块拆为4X4的分块A、B、C和D:
(4)对每个分块的预测残差绝对值总和进行计算,得到多个绝对值总和
具体地,将各个分块作变换后,将变换后各分块对应矩阵中所有元素的绝对值之和确定为预测残差绝对值总和。下面选取哈达玛变换进行举例说明:
例如,对分块A进行哈达玛变换:
哈达玛矩阵hadma如下:
对分块A进行哈达玛变换hadma*A*hadma',结果为:
求分块A对应矩阵中所有元素的绝对值之和:Σabs(x)=128。
(5)多个绝对值总和之和的二分之一确定为第一子复杂度
例如:基于A、B、C、D四个分块,得到:第一子复杂度Icost=64+112+108+96=380。
本发明实施例给出了一种第一子复杂度的详细计算方法,计算简单快捷,科学合理,以较快的速度量化了第一子复杂度,为视频复杂度的量化提供了具体可行的步骤。
本发明的另一个可选实施方式中,对每个子块的时域复杂度进行计算,包括:
搜索子块参考原始帧最佳匹配块的运动矢量;
对运动矢量进行预测,得到预测运动矢量;
计算运动矢量和预测运动矢量的差值;
获取差值的坐标值,并计算运动矢量和预测运动矢量之间的绝对差值和,以基于坐标值和绝对差值和确定第二子复杂度。
需要说明的是,搜索子块参考原始帧最佳匹配块的运动矢量,可以采用任意ME方法,例如,可以采用DIA方法。
具体地,记运动矢量为MV,预测运动矢量为PMV,运动矢量和预测运动矢量的差值为MVD,MVD的x、y坐标分别为mvdx和mvdy,运动矢量和预测运动矢量之间的绝对差值和为SAD,则第二子复杂度Tcost可以按照如下计算公式得到:
Tcost=2*(log2(mvdx+1))+e-1+2*(log2(mvdy+1))+e-1+SAD。
本发明实施例给出了一种第二子复杂度的详细计算方法,计算简单快捷,科学合理,以较快的速度量化了第二子复杂度,为视频复杂度的量化提供了具体可行的步骤。
实施例二
本发明实施例提供一种复杂度的确定装置,如图2所示,包括:
第一获取模块11,用于获取待确定视频;
第一计算模块12,用于对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
第二计算模块13,用于计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。
本发明实施例中,复杂度的确定装置根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
本发明实施例的一个可选实施方式中,第一计算模块包括:
划分单元,用于将待确定视频每一图像帧划分为多个子块;
第一计算单元,用于对每个子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个第一子复杂度之和确定为空域复杂度数值;
第二计算单元,用于对每个子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个第二子复杂度之和确定为时域复杂度数值。
本发明实施例的另一个可选实施方式中,第一计算单元用于:
基于帧内预测方向,对子块计算残差,得到残差块;
将残差块拆为多个分块;
对每个分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个绝对值总和之和的二分之一确定为第一子复杂度。
本发明实施例的另一个可选实施方式中,第二计算单元用于:
搜索子块参考原始帧最佳匹配块的运动矢量;
对运动矢量进行预测,得到预测运动矢量;
计算运动矢量和预测运动矢量的差值;
获取差值的坐标值,并计算运动矢量和预测运动矢量之间的绝对差值和,以基于坐标值和绝对差值和确定第二子复杂度。
实施例三
本发明实施例提供了一种码率的确定方法,如图3所示,包括:
步骤S302,调用实施例一中复杂度的确定方法,得到待确定视频的第一平均值和第二平均值;
步骤S304,获取空域复杂度因子、时域复杂度因子和缩放因子,其中,空域复杂度因子和时域复杂度因子的取值皆为大于-1且小于1的数值,缩放因子为大于1且小于20的数值;
步骤S306,计算第一平均值和空域复杂度因子的积以得到第一积值,并计算第二平均值和时域复杂度因子的积以得到第二积值;
步骤S308,将第一积值和第二积值之和与缩放因子之间的商,确定为待确定视频的码率。
具体地,若记第一平均值为VScost,第二平均值为VTcost,空域复杂度因子为时域复杂度因子为β,缩放因子为scale,则待确定视频的码率Bitrate的计算公式如下:
本发明实施例提供的码率的确定方法,调用实施例一中复杂度的确定方法,得到了数值化的第一平均值和第二平均值,然后基于第一平均值和第二平均值确定了待确定视频的码率,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
本发明实施例的一个可选实施方式中,空域复杂度因子取值0.5,时域复杂度因子取值1.0,缩放因子取值2.0。
需要说明的是,该码率的确定法方法通过计算机等设备运行,空域复杂度因子、时域复杂度因子和缩放因子的上述取值可以设置为设备的默认值。
例如,第一平均值为3.2*(720*1280),第二平均值为3.0*(720*1280),则待确定视频的码率Bitrate为:2119680bps即2.1Mbps。
本发明实施例中,空域复杂度因子、时域复杂度因子的取值使得空域复杂度和时域复杂度在视频复杂度中的占比更加合理,缩放因子的取值更加符合视频复杂度到码率的对应缩放关系,即,给出了一种较精确地由复杂度确定视频码率的方法。
实施例四
本发明实施例提供了一种码率的确定装置,如图4所示,包括:
调用模块41,用于调用实施例一的复杂度的确定方法,得到待确定视频的第一平均值和第二平均值;
第二获取模块42,用于获取空域复杂度因子、时域复杂度因子和缩放因子,其中,缩放因子是视频的复杂度到码率的缩放因子;
第三计算模块43,用于计算第一平均值和空域复杂度因子的积以得到第一积值,并计算第二平均值和时域复杂度因子的积以得到第二积值;
确定模块44,用于将第一积值和第二积值之和与缩放因子之间的商,确定为待确定视频的码率。
本发明实施例提供的码率的确定装置,调用实施例一中复杂度的确定方法,得到了数值化的第一平均值和第二平均值,然后基于第一平均值和第二平均值确定了待确定视频的码率,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
本发明实施例的一个可选实施方式中,空域复杂度因子取值0.5,时域复杂度因子取值1.0,缩放因子取值2.0。
实施例五
本发明实施例提供了一种复杂度的确定装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为执行实施例一的复杂度的确定方法。
本发明实施例中,处理器被配置为执行实施例一的复杂度的确定方法,即,获取待确定视频;对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。在复杂度的该确定方法中,根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
图5所示为一种复杂度的确定装置500的结构框图。参照图5,复杂度的确定装置500可以包括以下一个或多个组件:处理组件502,存储器504,电力组件505,多媒体组件508,音频组件510,输入/输出(I/O)接口512,传感器组件514,以及通信组件515。
处理组件502通常控制复杂度的确定装置500的整体操作,诸如与显示,数据通信,和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在复杂度的确定装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件505为装置500的各种组件提供电力。电源组件505可以包括电源管理系统,一个或多个电源,及其他与为复杂度的确定装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当复杂度的确定装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件515发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如组件为复杂度的确定装置500的显示器和小键盘,传感器组件514还可以检测复杂度的确定装置500或复杂度的确定装置500一个组件的位置改变,用户与复杂度的确定装置500接触的存在或不存在,复杂度的确定装置500方位或加速/减速和复杂度的确定装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件515被配置为便于复杂度的确定装置500和其他设备之间有线或无线方式的通信。复杂度的确定装置500可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件515经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件515还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,复杂度的确定装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
图6所示为另一种复杂度的确定装置600的结构框图。例如,复杂度的确定装置600可以被提供为一服务器。参照图6,复杂度的确定装置600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述信息列表显示方法。
复杂度的确定装置600还可以包括一个电源组件625被配置为执行复杂度的确定装置600的电源管理,一个有线或无线网络接口650被配置为将复杂度的确定装置600连接到网络,和一个输入输出(I/O)接口658。复杂度的确定装置600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
实施例六
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令被执行时实现实施例一的复杂度的确定方法。
具体地,计算机可读存储介质,例如包括指令的存储器504,上述指令可由复杂度的确定装置600的处理器520执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明实施例中,计算机指令被执行时实现实施例一的复杂度的确定方法,即,获取待确定视频;对待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;计算多个空域复杂度数值的平均值得到第一平均值,并计算多个时域复杂度数值的平均值得到第二平均值,以根据第一平均值和第二平均值确定待确定视频的复杂度。在复杂度的该确定方法中,根据第一平均值和第二平均值确定待确定视频的复杂度,给出了复杂度的一种量化方法,缓解了现有技术中视频复杂度的确定缺乏量化方法而导致视频码率预测不准的技术问题。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种复杂度的确定方法,其特征在于,包括:
获取待确定视频;
对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
计算多个所述空域复杂度数值的平均值得到第一平均值,并计算多个所述时域复杂度数值的平均值得到第二平均值,以根据所述第一平均值和所述第二平均值确定所述待确定视频的复杂度。
2.根据权利要求1所述的复杂度的确定方法,其特征在于,对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,包括:
将所述待确定视频每一图像帧划分为多个子块;
对每个所述子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个所述第一子复杂度之和确定为所述空域复杂度数值;
对每个所述子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个所述第二子复杂度之和确定为所述时域复杂度数值。
3.根据权利要求2所述的复杂度的确定方法,其特征在于,对每个所述子块的空域复杂度进行计算,包括:
基于帧内预测方向,对所述子块计算残差,得到残差块;
将所述残差块拆为多个分块;
对每个所述分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个所述绝对值总和之和的二分之一确定为所述第一子复杂度。
4.根据权利要求2所述的复杂度的确定方法,其特征在于,对每个所述子块的时域复杂度进行计算,包括:
搜索所述子块参考原始帧最佳匹配块的运动矢量;
对所述运动矢量进行预测,得到预测运动矢量;
计算所述运动矢量和所述预测运动矢量的差值;
获取所述差值的坐标值,并计算所述运动矢量和所述预测运动矢量之间的绝对差值和,以基于所述坐标值和所述绝对差值和确定所述第二子复杂度。
5.一种复杂度的确定装置,其特征在于,包括:
第一获取模块,用于获取待确定视频;
第一计算模块,用于对所述待确定视频每一图像帧的空域复杂度和时域复杂度进行计算,得到多个空域复杂度数值和多个时域复杂度数值;
第二计算模块,用于计算多个所述空域复杂度数值的平均值得到第一平均值,并计算多个所述时域复杂度数值的平均值得到第二平均值,以根据所述第一平均值和所述第二平均值确定所述待确定视频的复杂度。
6.根据权利要求5所述的复杂度的确定装置,其特征在于,所述第一计算模块包括:
划分单元,用于将所述待确定视频每一图像帧划分为多个子块;
第一计算单元,用于对每个所述子块的空域复杂度进行计算,得到多个第一子复杂度,以将多个所述第一子复杂度之和确定为所述空域复杂度数值;
第二计算单元,用于对每个所述子块的时域复杂度进行计算,得到多个第二子复杂度,以将多个所述第二子复杂度之和确定为所述时域复杂度数值;
优选地,所述第一计算单元用于:
基于帧内预测方向,对所述子块计算残差,得到残差块;
将所述残差块拆为多个分块;
对每个所述分块的预测残差绝对值总和进行计算,得到多个绝对值总和,以将多个所述绝对值总和之和的二分之一确定为所述第一子复杂度;
优选地,所述第二计算单元用于:
搜索所述子块参考原始帧最佳匹配块的运动矢量;
对所述运动矢量进行预测,得到预测运动矢量;
计算所述运动矢量和所述预测运动矢量的差值;
获取所述差值的坐标值,并计算所述运动矢量和所述预测运动矢量之间的绝对差值和,以基于所述坐标值和所述绝对差值和确定所述第二子复杂度。
7.一种码率的确定方法,其特征在于,包括:
调用权利要求1-4中任一项所述的复杂度的确定方法,得到所述待确定视频的第一平均值和第二平均值;
获取空域复杂度因子、时域复杂度因子和缩放因子,其中,所述空域复杂度因子和所述时域复杂度因子的取值皆为大于-1且小于1的数值,所述缩放因子为大于1且小于20的数值;
计算所述第一平均值和所述空域复杂度因子的积以得到第一积值,并计算所述第二平均值和所述时域复杂度因子的积以得到第二积值;
将所述第一积值和所述第二积值之和与所述缩放因子之间的商,确定为所述待确定视频的码率;
优选地,所述空域复杂度因子取值0.5,所述时域复杂度因子取值1.0,所述缩放因子取值2.0。
8.一种码率的确定装置,其特征在于,包括:
调用模块,用于调用权利要求1-4中任一项所述的复杂度的确定方法,得到所述待确定视频的第一平均值和第二平均值;
第二获取模块,用于获取空域复杂度因子、时域复杂度因子和缩放因子,其中,所述空域复杂度因子和所述时域复杂度因子的取值皆为大于-1且小于1的数值,所述缩放因子为大于1且小于20的数值;
第三计算模块,用于计算所述第一平均值和所述空域复杂度因子的积以得到第一积值,并计算所述第二平均值和所述时域复杂度因子的积以得到第二积值;
确定模块,用于将所述第一积值和所述第二积值之和与所述缩放因子之间的商,确定为所述待确定视频的码率;
优选地,所述空域复杂度因子取值0.5,所述时域复杂度因子取值1.0,所述缩放因子取值2.0。
9.一种复杂度的确定装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-4任意一项所述的复杂度的确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现如权利要求1至4任一项所述的复杂度的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811341867.8A CN109660812A (zh) | 2018-11-12 | 2018-11-12 | 复杂度和码率的确定方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811341867.8A CN109660812A (zh) | 2018-11-12 | 2018-11-12 | 复杂度和码率的确定方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109660812A true CN109660812A (zh) | 2019-04-19 |
Family
ID=66110111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811341867.8A Pending CN109660812A (zh) | 2018-11-12 | 2018-11-12 | 复杂度和码率的确定方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109660812A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110611809A (zh) * | 2019-10-16 | 2019-12-24 | 西安邮电大学 | 帧分辨率自适应的视频空时域复杂度评价方法 |
US11954910B2 (en) | 2020-12-26 | 2024-04-09 | International Business Machines Corporation | Dynamic multi-resolution processing for video classification |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101668197A (zh) * | 2009-09-18 | 2010-03-10 | 浙江大学 | 一种基于线性模型的可伸缩性视频编码中的码率控制方法 |
US20100104010A1 (en) * | 2008-10-24 | 2010-04-29 | Jiun-In Guo | Real-time rate-control method for video encoder chip |
CN102438146A (zh) * | 2011-12-05 | 2012-05-02 | 苏州希图视鼎微电子有限公司 | 一种视频质量的提高方法及其实现装置 |
CN102984541A (zh) * | 2012-12-07 | 2013-03-20 | 浙江大学 | 一种基于像素域失真度估计的视频质量评价方法 |
CN103747237A (zh) * | 2013-02-06 | 2014-04-23 | 华为技术有限公司 | 视频编码质量的评估方法及设备 |
CN103957424A (zh) * | 2014-04-15 | 2014-07-30 | 南京第五十五所技术开发有限公司 | 一种有效消除视频的乱码或方块的方法 |
CN104683804A (zh) * | 2015-02-14 | 2015-06-03 | 北京航空航天大学 | 基于视频内容特征的参数自适应多维码率控制方法 |
-
2018
- 2018-11-12 CN CN201811341867.8A patent/CN109660812A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100104010A1 (en) * | 2008-10-24 | 2010-04-29 | Jiun-In Guo | Real-time rate-control method for video encoder chip |
CN101668197A (zh) * | 2009-09-18 | 2010-03-10 | 浙江大学 | 一种基于线性模型的可伸缩性视频编码中的码率控制方法 |
CN102438146A (zh) * | 2011-12-05 | 2012-05-02 | 苏州希图视鼎微电子有限公司 | 一种视频质量的提高方法及其实现装置 |
CN102984541A (zh) * | 2012-12-07 | 2013-03-20 | 浙江大学 | 一种基于像素域失真度估计的视频质量评价方法 |
CN103747237A (zh) * | 2013-02-06 | 2014-04-23 | 华为技术有限公司 | 视频编码质量的评估方法及设备 |
CN103957424A (zh) * | 2014-04-15 | 2014-07-30 | 南京第五十五所技术开发有限公司 | 一种有效消除视频的乱码或方块的方法 |
CN104683804A (zh) * | 2015-02-14 | 2015-06-03 | 北京航空航天大学 | 基于视频内容特征的参数自适应多维码率控制方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110611809A (zh) * | 2019-10-16 | 2019-12-24 | 西安邮电大学 | 帧分辨率自适应的视频空时域复杂度评价方法 |
CN110611809B (zh) * | 2019-10-16 | 2020-10-27 | 西安邮电大学 | 帧分辨率自适应的视频空时域复杂度评价方法 |
US11954910B2 (en) | 2020-12-26 | 2024-04-09 | International Business Machines Corporation | Dynamic multi-resolution processing for video classification |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11704771B2 (en) | Training super-resolution convolutional neural network model using a high-definition training image, a low-definition training image, and a mask image | |
CN105611413B (zh) | 一种添加视频段类别标记的方法和装置 | |
CN106651955A (zh) | 图片中目标物的定位方法及装置 | |
CN105100609A (zh) | 移动终端和拍摄参数的调节方法 | |
CN104361558B (zh) | 图像处理方法、装置及设备 | |
CN109658927A (zh) | 智能设备的唤醒处理方法、装置及管理设备 | |
CN108521609B (zh) | 确定推送视频类型的方法、装置及终端 | |
CN105117111B (zh) | 虚拟现实交互画面的渲染方法和装置 | |
CN104238890B (zh) | 文字显示方法及装置 | |
CN105975961B (zh) | 人脸识别的方法、装置及终端 | |
CN106778773A (zh) | 图片中目标物的定位方法及装置 | |
CN106559631A (zh) | 视频处理方法及装置 | |
CN107948926A (zh) | 智能设备分享的方法和装置 | |
CN109599104A (zh) | 多波束选取方法及装置 | |
CN109376771A (zh) | 应用程序分类方法及装置 | |
CN110378312A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN104601204B (zh) | 触发条件检测方法及装置 | |
CN107820684A (zh) | 信道检测、信息发送方法、装置及通信设备 | |
CN104123720A (zh) | 图像重定位方法、装置及终端 | |
CN109660812A (zh) | 复杂度和码率的确定方法、装置及计算机可读存储介质 | |
CN104539497B (zh) | 网络连接方法及装置 | |
CN106060707A (zh) | 混响处理方法及装置 | |
CN105957011B (zh) | 图片处理方法及装置 | |
CN108804187A (zh) | 界面窗口的设置方法及装置 | |
CN107730443A (zh) | 图像处理方法、装置及用户设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190419 |
|
RJ01 | Rejection of invention patent application after publication |