CN112073723B - 视频信息处理方法、装置、电子设备及存储介质 - Google Patents

视频信息处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112073723B
CN112073723B CN202011274600.9A CN202011274600A CN112073723B CN 112073723 B CN112073723 B CN 112073723B CN 202011274600 A CN202011274600 A CN 202011274600A CN 112073723 B CN112073723 B CN 112073723B
Authority
CN
China
Prior art keywords
ith
quantization parameter
value
video frame
target video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011274600.9A
Other languages
English (en)
Other versions
CN112073723A (zh
Inventor
尹亮
王剑光
尹益平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202011274600.9A priority Critical patent/CN112073723B/zh
Publication of CN112073723A publication Critical patent/CN112073723A/zh
Application granted granted Critical
Publication of CN112073723B publication Critical patent/CN112073723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种视频信息处理方法、装置、电子设备和存储介质,该方法包括:基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数。

Description

视频信息处理方法、装置、电子设备及存储介质
技术领域
本发明的实施方式涉及视频编码领域,更具体地,本发明的实施方式涉及一种视频信息处理方法、装置、电子设备和存储介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
AVC(高级视频编码,Advanced Video Coding)视频编码技术在学术界和工业界都被广泛使用,AVC有着高效的视频图像压缩效率和不断迭代的码率控制技术足以满足用户的观看需求,为了在主观质量上获得更好的增益视频编码中引入了自适应量化工具,通过优化宏块级别的量化参数以平衡视频码率和质量的合理性及稳定性。但是,如何使得宏块级别的量化参数的分配更加合理,从而使得视频码率的分配合理化,就成为需要解决的问题。
发明内容
本发明期望提供一种视频信息处理方法、装置、电子设备和存储介质,以至少解决上述技术问题。
本申请实施例的第一方面,提供一种视频信息处理方法,包括:
基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数。
本申请实施例的第二方面,提供一种视频信息处理装置,包括:
初始处理单元,用于基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
量化参数调整单元,用于基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数。
本申请实施例的第三方面,提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的方法。
本申请实施例的第四方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意实施例所述的方法。
本申请提供的实施例,可以通过基于目标视频帧的第i个宏块的自身的信息、以及第i个宏块的空域相关信息、时域相关信息来对确定目标视频帧的宏块的量化参数,如此,就可以结合目标视频帧的宏块的信息、宏块的时域以及空域上的信息协同处理以使得宏块的量化参数更加合理,进而使得目标视频帧内宏块的码率分配更加合理化,从而保证视频质量。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施例中的视频信息处理方法流程示意图一;
图2示意性地示出了根据本发明实施例中的空域上宏块相邻的至少一个编码块的示意图;
图3示意性地示出了根据本发明实施例中的视频中宏块包含的YUV分量的像素信息的示意图;
图4示意性地示出了根据本发明实施例中的视频编码解码流程示意图;
图5示意性地示出了根据本发明实施例中的视频信息处理方法流程示意图二;
图6示意性的示出采用本发明实施例的方案进行视频图像处理后局部细节的主观质量上的区别;
图7示意性地示出了根据本发明另一实施例的视频信息处理装置组成结构示意图;
图8示意性地示出了根据本发明另一实施方式的电子设备结构示意图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
本发明的第一方面提供一种视频信息处理方法,下面参考图1来描述根据本发明示例性实施方式的视频信息处理方法,包括:
S101:基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
S102:基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数。
本实施例可以应用于电子设备中,该电子设备可以是需要上传视频的终端设备,比如可以是个人电脑、手机、平板电脑等。
在执行上述S101之前,可以先对目标视频帧进行初始量化参数的确定,可以包括:
基于目标视频帧的整体方差,确定所述目标视频帧的量化参数调整值;基于所述目标视频帧的量化参数调整值,确定所述目标视频帧的初始量化参数。
这里,所述目标视频帧可以具体是当前待编码视频帧。
具体来说,可以是针对目标视频帧预测或确定出一个待调整的量化参数,基于目标视频帧的整体方差计算得到目标视频帧的量化参数调整值;再根据量化参数调整值对所述待调整量化参数进行调整,得到目标视频帧的初始量化参数。
其中,确定目标视频帧的整体方差的方式,可以包括:基于所述目标视频帧的像素的关系计算得到整体方差。
进一步地,基于目标视频帧的整体方差,确定所述目标视频帧的量化参数调整值,可以是:基于目标视频帧的整体方差以及计算因子,确定所述目标视频帧的量化参数初始调整值;
基于所述目标视频帧的量化参数初始调整值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述目标视频帧的量化参数调整值。具体的,基于目标视频帧的整体方差以及计算因子,确定所述目标视频帧的量化参数初始调整值,可以采用以下公式1进行计算:
Figure 987454DEST_PATH_IMAGE001
公式1;
其中,
Figure 531699DEST_PATH_IMAGE002
表示目标视频帧的整体方差;
Figure 197167DEST_PATH_IMAGE003
表示计算因子,该计算因子可以是与比特深度有关的计算因子。
所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值的计算方式,可以采用以下公式2:
Figure 685917DEST_PATH_IMAGE004
公式2
其中,avg_mb_adj为整帧(即目标视频帧)中按16x16划分宏块个数的调整值的平均值;
Figure 95032DEST_PATH_IMAGE005
表示目标视频帧中的任意一个宏块的量化参数调整值,将该任意一个宏块表示为第i个宏块;i取值为(0,n-1);n表示一帧中按16x16划分宏块划分的宏块个数,也就是前述N;Sum()也就是对目标视频帧的全部宏块的量化参数调整值取和。
基于所述目标视频帧的量化参数初始调整值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述目标视频帧的量化参数调整值,可以采用以下公式3进行计算:
slice_adj = (slice_adj - avg_mb_adj ) * 2.5公式3
其中,等号右侧括号中的“slice_adj”可以理解为上述量化参数初始调整值,等号左边的“slice_adj”即为上述目标视频帧的量化参数调整值。
在基于以上处理确定目标视频帧的初始量化参数之后,可以执行本实施例中S101,具体包括:
基于所述目标视频帧的初始量化参数,确定所述第i个宏块的亮度分量的待调整量化参数;
基于所述目标视频帧的所述第i个宏块中的像素的亮度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,计算得到所述第i个宏块的亮度分量的量化参数调整值;其中,N为大于等于1的整数;
基于所述第i个宏块的亮度分量的量化参数调整值调整所述第i个宏块的亮度分量的待调整量化参数,得到所述第i个宏块的亮度分量的初始量化参数。
其中,所述第i个宏块可以是目标视频帧中的当前待编码宏块。所述宏块的基本单位可以是16*16(像素),也就是16*16的像素可以组成一个宏块。
需要理解的是,第i个宏块可以是目标视频帧中的任意一个待编码宏块,也就是针对目标视频帧中每一个待编码宏块都采用相同的方式进行处理,为了后面说明方便,将其任意一个待编码宏块表示为第i个宏块。
在开始准备对第i个宏块进行量化参数调整的时候,可以将之前预先确定的目标视频帧的初始量化参数作为目标视频帧的全部待编码宏块的待调整量化参数。再进一步来说,目标视频帧的初始量化参数可以包括亮度分量的量化参数以及色度分量的量化参数,在步骤S101中,首先关心的是第i个宏块的亮度分量的待调整量化参数,也就是可以将目标视频帧的亮度分量的量化参数作为所述第i个宏块的亮度分量的待调整量化参数。
基于所述目标视频帧的所述第i个宏块中的像素的亮度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,计算得到所述第i个宏块的亮度分量的量化参数调整值,具体来说可以包括:
基于所述第i个宏块中的像素的亮度分量的方差值、以及计算因子,确定所述第i个宏块的亮度分量的初始量化参数调整值;
计算目标视频帧划分得到的N个宏块的量化参数调整值的平均值;
将所述第i个宏块的亮度分量的初始量化参数调整值减去所述平均值,得到所述第i个宏块的亮度分量的量化参数调整值。
结合公式进行说明,可以根据x264编码器的参考公式4计算第i个宏块的调整值(即亮度分量的初始量化参数调整值):
Figure 228205DEST_PATH_IMAGE006
公式4
其中,varPixel_MB_Y表示16x16宏块像素的方差值,
Figure 330153DEST_PATH_IMAGE007
为与比特深度有关的计算因子。mbAdj_y表示亮度分量Y的量化参数调整值(或称为初始量化参数调整值);
Figure 306199DEST_PATH_IMAGE008
可以表示第i个宏块的调整值,也就是第i个宏块的亮度分量的初始量化参数调整值。
再根据公式5和公式6进行调整值
Figure 925530DEST_PATH_IMAGE009
的进一步优化,其中,
Figure 241105DEST_PATH_IMAGE010
公式5;
公式5中 avg_mb_adj为整帧中按16x16划分宏块个数的调整值的平均值,i取值为(0,n-1),n表示一帧中按16x16划分宏块划分的宏块个数。
Figure 310692DEST_PATH_IMAGE011
公式6
其中,等号右侧的“
Figure 711718DEST_PATH_IMAGE012
”可以理解为上述公式4计算得到的结果,即第i个宏块的亮度分量的初始量化参数调整值;等号左边的“
Figure 394460DEST_PATH_IMAGE013
”即为用于进行量化参数调整的所述第i个宏块的亮度分量的量化参数调整值。
这里计算得到的第i个宏块的亮度分量的量化参数调整值可以是正值也可以是负值或者可以是0,将第i个宏块的亮度分量的量化参数调整值、与所述第i个宏块的亮度分量的待调整量化参数进行计算,就可以得到S101中的第i个宏块的亮度分量的初始量化参数。
S102的处理中,结合第i个宏块的初始量化参数、空域相关信息以及时域相关信息,可以进一步确定针对第i个宏块的亮度分量的调整方式并进行调整,最终可以调整得到第i个宏块的亮度分量的量化参数。
具体为:基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,基于第一调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第一量化参数;基于所述目标视频帧的时域相关信息确定第二调整方式,基于第二调整方式对第i个宏块的亮度分量的第一量化参数进行调整,得到第i个宏块的亮度分量的目标量化参数。
分别对上述第一调整方式以及第二调整方式的确定进行详细说明:
所述基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,包括:
将所述目标视频帧内与所述第i个宏块相邻的至少一个编码块对应的相关信息作为所述第i个宏块在所述目标视频帧内的空域相关信息;基于所述至少一个编码块对应的相关信息确定所述第一调整方式。
也就是可以基于空域上的已编码宏块的相关信息对第i个宏块的量化参数调优。
所述空域相关信息可以包括:所述第i个宏块在目标视频帧中相邻的至少一个编码块,以及所述相邻的至少一个编码块中每一个编码块对应的相关信息。
其中,每一个编码块对应的相关信息可以包括:编码块的模式、编码块运动估计过程中的SAD(Sum of Absolute Differences,绝对差值和)cost(代价)值等等。
上述与第i个宏块相邻的至少一个编码块可以包括有:所述第i个宏块的左宏块、所述第i个宏块的的上边宏块、所述第i个宏块的左上宏块、所述第i个宏块的右上宏块。
结合图2举例来说,图2中的第i个宏块可以是当前宏块,实际处理中可以将其表示为“CUR”;图中的左宏块也就是第i个宏块相邻的左边的宏块,实际处理中可以将其表示为“LEFT”;第i个宏块上边相邻的宏块为上边宏块,实际处理中可以将其表示为“TOP”;第i个宏块的左上方相邻的宏块即左上宏块,实际处理中可以将其表示为“TOPLEFT”;第i个宏块右上方相邻的宏块即右上宏块,实际处理中可以将其表示为“TOPRIGHT”。
需要理解的是,这里所述第i个宏块的左边宏块的数量可以不仅一个,还可以是多个,比如,可以包括第i个宏块左边相邻的第一个宏块、以及该第i个宏块左边相邻的第一个宏块左边的宏块作为第二个宏块,当然还可以有更多,这里不做穷举。同样的,所述第i个宏块的的上边宏块、所述第i个宏块的左上宏块、所述第i个宏块的右上宏块,也都可以是一个或多个,这里不做赘述。
进一步地,基于上述至少一个编码块的相关信息,可以确定模式标志位。具体来说,所述至少一个编码块的相关信息中包含有每一个编码块的模式;在所述至少一个编码块的模式均不为预设模式的情况下,将所述模式标志位设置为第一预设值,否则,将所述模式标志位设置为第二预设值。其中,所述第一预设值可以为1、第二预设值可以为0,或者反之亦可,这里不对其进行限定。
其中,所述预设模式可以是skip模式(或background(背景)模式)。
也就是说,无论实际处理中选取多少个编码宏块作为第i个宏块的相邻宏块,在全部已编码宏块均不为预设模式的情况下,才会将该模式标志位(可以表示为SKIP_ALL_NEI_MB)设置为第一值,否则设置为第二值。
在上述模式标志位为第一值的情况下,才会执行基于所述至少一个编码块对应的相关信息确定所述第一调整方式,并基于所述第一调整方式进行亮度分量的量化参数的调整。换句话说,当所述第i个宏块在目标视频帧内的相邻的至少一个编码块中全部编码块的模式均不为skip模式的情况下,执行基于所述至少一个编码块对应的相关信息确定所述第一调整方式的处理。
其中,所述基于所述至少一个编码块对应的相关信息确定所述第一调整方式,包括:
基于所述至少一个编码块的相关信息确定累计参考值,基于所述相邻宏块的累计参考值确定所述第i个宏块的预测值;基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式。
前述已经说明,在每一个编码块对应的相关信息中可以包括编码块运动估计过程中的SAD(Sum of Absolute Differences,绝对差值和)cost(代价)值。相应的,基于所述至少一个编码块的相关信息确定累计参考值,具体为:基于所述至少一个编码块中每一个编码块的SAD cost相加,得到所述相邻宏块的累计参考值。
一种示例中,可以设置一个数组SAD_REF_ME[4],用于表示临近的至少一个已编码宏块运动估计过程中的SadCost值。数组SAD_REF_ME[4]中可以包括:SAD_REF_ME[0],SAD_REF_ME[1],SAD_REF_ME[2],SAD_REF_ME[3];其中,SAD_REF_ME[0]表示第i个宏块的左宏块的SadCost值、SAD_REF_ME[1]- 表示第i个宏块的上边宏块的SadCost值、SAD_REF_ME[2]-表示第i个宏块的左上宏块的SadCost值、SAD_REF_ME[3]- 表示第i个宏块的右上宏块的SadCost值。将上述数组中的各个根据SAD_REF_ME数组信息进行累和得到累计参考值,可以将其记为SUM_REF_SADCOST_ME,计算过程可以表示如下:
SUM_REF_SADCOST_ME=SAD_REF_ME[0]+…SAD_REF_ME[3]。
进一步地,基于累计参考值,确定第i个宏块的预测值,包括:基于各个编码块对应的SAD值以及所述相邻宏块的累计参考值,分别确定各个编码块的比例值;根据各个编码块对应的比例值与其SadCost值相乘得到的结果进行累和得到所述第i个宏块的预测值。其中,第i个宏块的预测值可以表示第i个宏块在进行决策过程中的预测值,可以将其表示为PRED_SAD_ME。
比如,根据SAD_REF_ME数组的累和SUM_REF_SADCOST_ME逐项求比例,再根据各项比例与各自SadCost值相乘,将相乘的结果再累计做和,将累计做和得到的结果作为第i个宏块在进行ME过程中的预测值,将其记为PRED_SAD_ME。
基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式,包括以下方式之一:
方式一、在所述相邻宏块的累计参考值为零的情况下,若所述第i个宏块的预判值为零,则确定所述第一调整方式为增加第一值;
方式二、在所述相邻宏块的累计参考值为零的情况下,若第i个宏块的预判值大于第一预设门限值,则确定所述第一调整方式为减少第二值;
方式三、在所述相邻宏块的累计参考值处于第一预设范围内的情况下,若第i个宏块的预判值与所述第i个宏块的预测值满足预设条件,则确定所述第一调整方式为减少第三值。
上述方式一中,
在所述相邻宏块的累计参考值为零的情况下,也就是前述SUM_REF_SADCOST_ME == 0 ,可以分两种情况进行所述第i个宏块的亮度分量的量化参数的调整,本方式为第一种情况,具体的:
在所述相邻宏块的累计参考值为零的情况下,若所述第i个宏块的预判值为零,则所述第一调整方式为将所述第i个宏块的亮度分量的初始量化参数增加第一值。
其中,第i个宏块的预判值具体可以是所述第i个宏块的预信息SAD值。
所述第一值可以根据实际情况设置,比如,可以设置为1,当然,还可以设置为2,本实施例不做穷举。
一种示例中,方式一确定第一调整方式后,可以将所述第i个宏块的亮度分量的初始量化参数加1得到所述第i个宏块的亮度分量的第一量化参数;又一种示例中,方式一确定第一调整方式后,可以根据第一调整方式对第i个宏块的亮度分量的第二量化参数加1,得到第i个宏块的亮度分量的目标量化参数。
也就是第i个宏块(MB)根据预信息SAD值== 0时,iLumaQp = iLumaQp + 1;其中,等号左侧的iLumaQp表示对所述第i个宏块的亮度分量的初始量化参数调整所得到第i个宏块的亮度分量的第一量化参数;等号右侧的iLumaQp表示所述第i个宏块的亮度分量的初始量化参数;“1”即为前述第一值。
方式二中,
在所述相邻宏块的累计参考值为零的情况下,也就是前述SUM_REF_SADCOST_ME == 0 ,可以分两种情况进行所述第i个宏块的亮度分量的量化参数的调整,本方式为第二种情况,具体的:
在所述相邻宏块的累计参考值为零的情况下,若第i个宏块的预判值大于第一预设门限值,则所述第一调整方式为将所述第i个宏块的亮度分量的初始量化参数减少第二值。
其中,第一预设门限值可以根据实际情况进行设置,可以与当前场景、视频分辨率相关,比如可以为3000,当然,根据实际情况还可以将其设置为其他值,这里不做穷举。
所述第二值可以与第一值相同或不同,所述第二值可是根据实际情况设置,比如可以设置成1,当然还可以是2等其他数值,不做穷举。
本情况中,基于第一调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第一量化参数,具体可以为,将所述第i个宏块的亮度分量的初始量化参数减1得到所述第i个宏块的亮度分量的第一量化参数。
也就是第i个宏块(MB)预信息SAD值>3000时,iLumaQp = iLumaQp– 1。
方式三中,
所述第一预设范围可以根据实际情况设置,比如可以根据当前场景或当前视频分辨率,或者还可以包括当前传输带宽等来确定。一种优选的示例中,该第一预设范围可以是大于0且小于18000,可以表示为SUM_REF_SADCOST_ME <18000 且SUM_REF_SADCOST_ME >0。
进一步地,在累计参考值在第一预设范围内的时候,进一步需要判断第i个宏块的预信息SAD值与第i个宏块的预测值之间的关系是否满足预设条件,若满足,则将第i个宏块的亮度分量的量化参数减少第三值。
该预设条件可以是:第i个宏块的预信息SAD值大于1.05 * PRED_SAD_ME(即第i个宏块的预测值)。
其中,关于第i个宏块的预测值的确定方式前述实施例已经说明,这里不做赘述。
第三值可以与第一值相同或不同,可以根据实际情况设置,比如,可以是1或2。一种示例中,采用方式三的第一调整方式对亮度分量的初始量化参数进行调整可以表示为:iLumaQp= iLumaQp – 1。
在上述三种方式之外,还可以包括其他的方式来确定第一调整方式,比如可以设置统计量INTRA_REF_MODE_COUNT表示临近块是帧内模式的统计个数;进而可以根据INTRA_REF_MODE_COUNT、和/或所述相邻宏块的累计参考值SUM_REF_SADCOST_ME的预设范围,确定第一调整方式为加一、或者减一、或者采用默认值、或者不变等等。
所述基于所述目标视频帧的时域上的参考模式概率确定第二调整方式之前,还可以包括:
基于所述目标视频帧的参考帧和/或所述目标视频帧的前k帧的模式概率信息,确定时域上的参考模式概率;其中,k为大于等于1的整数。
其中,前k帧中,k的取值可以根据实际情况设置,比如,可以设置为1,那么就是目标视频帧的前1帧。若k的取值为2或更多,那么可以是目标视频帧的前2帧或更多帧。还需要指出的是,前k帧与目标视频帧之间的间隔可以为1或更多,比如,前k帧与目标视频帧之间的间隔为2,那么前k帧指的是目标视频帧的前第2帧。
具体来说,在目标视频帧的参考帧以及前k帧相同的情况下,可以基于该参考帧(或前k帧)的模式概率信息作为时域上的参考模式概率。
在目标视频帧的参考帧以及前k帧不相同的情况,可以将参考帧中的模式概率信息、以及前k帧的模式概率信息进行平均值计算,将计算到的平均值作为所述时域上的参考模式概率。
也就是可以基于时域上的前一个已经编码帧的不同模式(或宏块模式)的概率分布、和参考帧中宏块的不同宏块模式的概率分布情况,进一步的量化参数的调整。
上述宏块的模式,可以主要统计帧内三种type0:INTRRA_16x16、type1:INTRA_8x8、type2:INTRA_4x4;帧间九种type3:INTER_16x16、type4:(INTER_16x8/INTER_8x16)、type5:INTER_8x8、type6(INTER_8x4/INTER_4x8)、type7:INTER_4x4、type8:SKIP。
举例来说,假设测试统计视频主要包括320x180、832x480、1024x768、1280x720和1920x1080的多组视频帧序列,根据不同特性情况主要选取几种分布类似的序列数据如表1所示,由于实现编码器未对INTRA_8x8和INTER_8x4以及INTER_4x8做实现,统计数据暂时不包括上述三种情况,表中的数据为测试序列的所有帧的模式占比平均值。
type I_4x4 I_16x16 P16x16 P8x16 P16x8 Px8x8 P_SKIP
180p 1.21% 0.479% 1.584% 0.028% 0.058% 0.147% 96.494%
480p 2.6% 31.812% 16.426% 0.677% 0.671% 0.789% 47.025%
720p 3.165% 20.751% 7.976% 0.46% 0.385 0.489% 66.775%
1080p 0.43% 6.214% 4.1% 0.112% 0.101% 0.139% 88.904%
表1
上述视频帧按不同的场景划分,表1中180p和1080p属于视频帧较缓(类别1),480p和720p属于视频帧运动较为剧烈的(类别2),从表1可以看出类别1中P_SKIP的比重较大,类别2的P_SKIP占比较低,P_16x16的占比也呈现较为明显的差异,对于P16x8和P8x16所占的比重相对都较低,因此根据数据分析对宏块的亮度分量的量化参数进行进一步的预测修正。
具体来说,所述基于所述目标视频帧的时域上的参考模式概率确定第二调整方式,包括以下之一:
在所述时域上的参考模式概率中的第一模式的概率超过第二预设门限值的情况下,确定所述第二调整方式为增加第四值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率大于第五预设门限值,则确定所述第二调整方式为减少第五值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率小于第六预设门限值,则确定所述第二调整方式为将减少第六值。
上述第一模式可以为type8:SKIP模式。第二模式可以是type4:(INTER_16x8/INTER_8x16);第三模式可以是type3:INTER_16x16;第四模式可以是type0:INTRRA_16x16。
所述第二预设门限值可以根据实际情况设置,比如,可以设置为85%,当然还可以是其他数值,比如可以是86%或80%等等,不对其进行穷举。
第三预设门限值同样可以根据实际情况进行设置,比如,可以设置为65%,又或者可以设置为60%或63%等等,不进行穷举。
第四预设门限值也可以根据实际情况设置,比如可以是4%,当然还可以是其他数值,这里不进行穷举。
第五预设门限值可以是根据实际情况设置,比如可以是20%,其他数值不做穷举。
第六预设门限值可以根据实际情况设置,比如,可以是1%,其他数值不做穷举。
第四值、第五值、第六值可以相同也可以不同,并且第四值、第五值、第六值分别与前述第一值可以相同或不同。
举例来说:
在TYPE8的概率超过85%的情况下,可以认为目标视频帧和其参考帧/前一参考帧类似情况,因此调整第i个宏块的亮度分量的量化参数iLumaQp = iLumaQp + 1;
在TYPE8 < 65%且TYPE4 + TYPE3的概率值>4%的情况下,
如果TYPE0的概率大于20%,第i个宏块的亮度分量的量化参数iLumaQp = ILumaQp-1;
如果TYPE0的概率小于1%,第i个宏块的亮度分量的量化参数iLumaQp = iLumaQp+ 1。
当然,还存在上述组合中未包含的情况,其对应的第二调整方式可以是采用默认值或保持不变等等,本实施例中不做赘述。
基于以上实施例的说明可以得到目标视频帧的第i个宏块的亮度分量的目标量化参数,进一步地,还可以基于该亮度分量的目标量化参数,调整第i个宏块的色度分量的量化参数,具体可以包括:
基于所述第i个宏块的亮度分量的目标量化参数,确定所述第i个宏块的色度分量的初始量化参数;
基于所述第i个宏块中的像素的色度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述第i个宏块的色度分量的调整值;
基于所述第i个宏块的色度分量的调整值对所述第i个宏块的色度分量的初始量化参数进行调整,得到所述第i个宏块的色度分量的目标量化参数。
其中,基于所述第i个宏块的亮度分量的目标量化参数,确定所述第i个宏块的色度分量的初始量化参数,可以是根据预设的对应表来确定,比如,基于所述第i个宏块的亮度分量的目标量化参数,从所述预设的对应表中查到其对应的色度分量的量化参数,将查找到的色度分量的量化参数作为所述第i个宏块的色度分量的初始量化参数。
进而,可以采用前述实施例中公式4-公式6类似的处理,对所述第i个宏块的色度分量的量化参数进行调整,得到第i个宏块的色度分量的目标量化参数。由于这部分针对色度分量的调整与前述公式4-公式6类似所对应的处理类似,只是需要将其中的参数替换为:
Figure 564541DEST_PATH_IMAGE014
Figure 70609DEST_PATH_IMAGE015
、mb_adj_u和mb_adj_v,因此不再重复说明。需要指出的是,上述色度分量可以表示为U、V(宏块的YUV三分量的像素信息的情况可以如图3所示),基于上述处理可以分别确定U分量所对应的量化参数调整值、以及V分量对应的量化参数调整值,可以将U,V的量化参数的调整值的最小值,作为所述第i个宏块的色度分量的量化参数的调整值。
另外,与前述亮度分量的量化参数的处理中不同之处在于,针对色度分量不再根据时域相关信息以及空域相关信息进行处理,而是直接基于前述公式4-公式6类似的处理即可确定最终的目标量化参数。
需要补充说明的是,S102的另一种处理可以为:基于所述目标视频帧的时域相关信息确定第二调整方式,基于第二调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第二量化参数;基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,基于第一调整方式对第i个宏块的亮度分量的第二量化参数进行调整,得到第i个宏块的亮度分量的目标量化参数。与前述实施例中S102的处理方式不同之处仅在于,先后顺序做了调整,这种处理可以先结合时域相关信息进行初始量化参数的调整,将其调整后得到的量化参数称为第二量化参数;然后再结合空域相关信息进行再次调整,最终也是得到第i个宏块的亮度分量的目标量化参数。
这种处理方式,确定第一调整方式以及确定第二调整方式的具体处理与前述实施例均相同。并且,这种处理方式中,得到第i个宏块的亮度分量的目标量化参数之后,采用与前述实施例相同的方式确定第i个宏块的色度分量的量化参数等处理,因此不进行重复说明。
至此完成针对目标视频帧的第i个宏块的亮度分量以及色度分量的量化参数的调整,得到第i个宏块的亮度分量以及色度分量的目标量化参数。
由于第i个宏块可以为目标视频帧中多个宏块中任意一个,相应的,得到目标视频帧中的第i个宏块的量化参数之后,还可以:根据宏块的量化参数对所述第i个宏块进行编码,最终生成编码后的目标视频帧。
视频编解码技术的应用已经深入到我们生活的方方面面中,视频会议、在线教育、视频聊天、影视作品的观看等。关于视频编码解码的处理,可以结合图4进行说明,可以包括有通过摄像头进行采集,得到摄像头采集的视频帧;然后通过编码器对每一个视频帧进行实时编码;在接收端,可以实时接收编码后的视频帧,对编码后的视频帧进行解码得到并显示每一个视频帧的视频图像。
本实施例提供的方案,可以通过基于目标视频帧的第i个宏块的自身的信息、以及第i个宏块的空域相关信息、时域相关信息来对确定目标视频帧的宏块的量化参数,如此,就可以结合目标视频帧的宏块的信息、宏块的时域以及空域上的信息协同处理以使得宏块的量化参数更加合理,进而使得目标视频帧在GOP(画面组,Group of Pictures)内的码率分配更加合理,也可以使得宏块级别的码率分配在帧内均匀合理化,从而保证视频质量,实现在不上升或降低视频码率的基础上使得视频主观和客观指标上都有所增益的效果。
最后结合以下示例,对前述实施例提供的方案进行宏块级量化参数调整的方案进行说明,如图5所示,包括:
S51:基于目标视频帧的第i个宏块内的像素上的关系计算宏块的方差值;根据x264编码器的参考公式计算宏块的调整值,对调整值进行优化得到优化后的调整值;基于优化后的调整值确定所述第i个宏块的亮度分量的初始量化参数。
计算宏块的方差值指的是计算以16x16为基本单位的宏块的方差值。
这里的具体处理可以采用前述实施例中公式4-公式6进行处理,不再赘述。
另外,第一步执行之前,还可以计算目标视频帧(也就是当前编码帧)的整体方差,并根据上述公式1-公式3计算目标视频帧的最优调整值,根据最优调整值确定目标视频帧的帧级别的初始量化参数。具体处理与前述实施例相同,不再赘述。
S52:基于空域上与所述第i个宏块相邻的至少一个编码块的相关信息,对第i个宏块的亮度分量的初始量化参数进行调整。
需要理解的是,这里是先基于空域相关信息对第i个宏块的亮度分量的量化参数进行的调整,也就是执行完步骤52可以得到第i个宏块的亮度分量的第一量化参数。
获取空域上与所述第i个宏块相邻的至少一个编码块可以是至少一个已编码宏块,并存下至少一个编码块的相关信息(模式信息、sadCost信息、量化参数等)。
设置至少一个编码块是否均为SKIP模式的标志位SKIP_ALL_NEI_MB,设置数组SAD_REF_ME[4]表示了相邻的至少一个编码块运动估计过程中的SadCost值,数组中包括:SAD_REF_ME[0]-左边、SAD_REF_ME[1]-上边、SAD_REF_ME[2]-左上、SAD_REF_ME[3]-右上。
然后根据SAD_REF_ME数组信息进行累和(记为SUM_REF_SADCOST_ME)然后逐项求比例,再根据比例与各自SAD_REF_ME值乘,再累和,作为所述第i个宏块在进行ME过程中的预测值记为PRED_SAD_ME。具体如何进行所述第i个宏块的亮度分量的量化参数调优描述如下,在至少一个编码块均不为skip模式的情况下,执行S521、S522:
S521:如果SUM_REF_SADCOST_ME == 0 时分两种情况进行所述第i个宏块的亮度分量的量化参数的调整,情况1:所述第i个宏块的预信息sad值== 0时,iLumaQp = iLumaQp+ 1;情况2:所述第i个宏块的预信息sad值>3000时,iLumaQp = iLumaQp– 1。
S522:SUM_REF_SADCOST_ME <18000 且SUM_REF_SADCOST_ME >0时:如果所述第i个宏块的预sad值大于1.05 * PRED_SAD_ME,iLumaQp = iLumaQp– 1。
SUM_REF_SADCOST_ME其余情况可以根据实际情况确定对应的调整方式,比如可以不做调整,或采用默认值等等,本实施例不做穷举。
S53:基于时域上的前一个编码帧的不同的概率分布、和参考帧中宏块的不同宏块模式的概率分布情况,对第i个宏块的亮度分量的第一量化参数调整,得到所述第i个宏块的亮度分量的目标量化参数。
与前述实施例相同,这里主要统计帧内三种type0:INTRRA_16x16、type1:INTRA_8x8、type2:INTRA_4x4帧间九种type3:INTER_16x16、type4:(INTER_16x8/INTER_8x16)、type5:INTER_8x8、type6(INTER_8x4/INTER_4x8)、type7:INTER_4x4、type8:SKIP.
本步骤对S51-S52中基于时域上的前一个编码帧的不同的概率分布、和参考帧中宏块的不同宏块模式的概率分布情况确定参考模式概率,进而基于参考模式概率对宏块的亮度分量的第一量化参数进行进一步的预测修正,具体可以包括:
在TYPE8的概率超过85%的情况下,则目标视频帧和其参考帧/前一参考帧类似情况,因此调整第i个宏块的量化参数iLumaQp = iLumaQp + 1;
在TYPE8 < 65%且TYPE4 + TYPE3的概率值>4%的情况下,如果TYPE0的概率大于20%,iLumaQp = ILumaQp -1;如果TYPE0的概率小于1%,调整第i个宏块的量化参数iLumaQp= iLumaQp + 1。
进一步地,完成上述S53的处理之后,还可以基于第i个宏块的亮度分量的目标量化参数,确定第i个宏块的色度分量的初始量化参数;再根据第i个宏块的自身像素计算对应的色度分量对应的方差,基于该方差可以确定第i个宏块的色度分量的量化参数调整值;基于该色度分量的量化参数调整值对所述初始量化参数进行调整,得到所述第i个宏块的色度分量的目标量化参数。关于色度分量的目标量化参数的具体确定方式与前述实施例的处理相同,因此不做赘述。
结合表2对本示例的客观效果进行说明,可以看出基于本实施例对视频数据流进行实时处理之后,可以使得BD-rate为负值,在BD-rate为负值时表示相同PSNR(PeakSignal-to-Noise Ratio,峰值信噪比)条件下,码率减少,性能提高。
视频数据流 BD-rate
视频数据流1 -5.15%
视频数据流2 -6.75%
视频数据流3 -4.73%
表2
结合图6对本示例进行视频处理后的主观效果进行说明,基于图6可以看出,通过本示例提供的方案进行量化参数的调整后进行视频帧的编码处理,可以使得处理后视频帧中的图像相对于原始图像的线条更加平滑,比如图6中示意出的采用相关技术处理后的视频帧的图像中的局部细节61、以及采用本实施例提供的方案处理后的视频帧的图像中的局部细节62来看,明显处理后的视频帧的图像中的局部细节62的边缘线条更加平滑。
本实施例的第二方面提供了一种视频信息处理装置,如图7所示,包括:
初始处理单元71,用于基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
量化参数调整单元72,用于基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数。
所述初始处理单元71,用于基于目标视频帧的整体方差,确定所述目标视频帧的量化参数调整值;基于所述目标视频帧的量化参数调整值,确定所述目标视频帧的初始量化参数。
所述初始处理单元71,用于基于所述目标视频帧的初始量化参数,确定所述第i个宏块的亮度分量的待调整量化参数;基于所述目标视频帧的所述第i个宏块中的像素的亮度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,计算得到所述第i个宏块的亮度分量的量化参数调整值;其中,N为大于等于1的整数;基于所述第i个宏块的亮度分量的量化参数调整值调整所述第i个宏块的亮度分量的待调整量化参数,得到所述第i个宏块的亮度分量的初始量化参数。
所述量化参数调整单元72,包括:
空域调整子单元721,用于基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,基于第一调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第一量化参数;
时域调整子单元722,用于基于所述目标视频帧的时域相关信息确定第二调整方式,基于第二调整方式对第i个宏块的亮度分量的第一量化参数进行调整,得到第i个宏块的亮度分量的目标量化参数。
所述空域调整子单元721,用于将所述目标视频帧内与所述第i个宏块相邻的至少一个编码块对应的相关信息作为所述第i个宏块在所述目标视频帧内的空域相关信息;基于所述至少一个编码块对应的相关信息确定所述第一调整方式;
所述时域调整子单元722,用于将所述目标视频帧的时域上的参考模式概率作为所述目标视频帧的时域相关信息;基于所述目标视频帧的时域上的参考模式概率确定第二调整方式。
所述空域调整子单元721,用于基于所述至少一个编码块对应的相关信息确定相邻宏块的累计参考值,基于所述相邻宏块的累计参考值确定所述第i个宏块的预测值;基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式。
所述空域调整子单元721,用于执行以下之一:
在所述相邻宏块的累计参考值为零的情况下,若所述第i个宏块的预判值为零,则确定所述第一调整方式为增加第一值;
在所述相邻宏块的累计参考值为零的情况下,若第i个宏块的预判值大于第一预设门限值,则确定所述第一调整方式为减少第二值;
在所述相邻宏块的累计参考值处于第一预设范围内的情况下,若第i个宏块的预判值与所述第i个宏块的预测值满足预设条件,则确定所述第一调整方式为减少第三值。
所述时域调整子单元722,用于基于所述目标视频帧的参考帧和/或所述目标视频帧的前k帧的模式概率信息,确定时域上的参考模式概率;其中,k为大于等于1的整数;
相应的,所述时域调整子单元722,还用于执行以下之一:
在所述时域上的参考模式概率中的第一模式的概率超过第二预设门限值的情况下,确定所述第二调整方式为增加第四值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率大于第五预设门限值,则确定所述第二调整方式为减少第五值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率小于第六预设门限值,则确定所述第二调整方式为将减少第六值。
所述量化参数调整单元,还包括:
色度调整子单元723,用于基于所述第i个宏块的亮度分量的目标量化参数,确定所述第i个宏块的色度分量的初始量化参数;基于所述第i个宏块中的像素的色度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述第i个宏块的色度分量的调整值;基于所述第i个宏块的色度分量的调整值对所述第i个宏块的色度分量的初始量化参数进行调整,得到所述第i个宏块的色度分量的目标量化参数。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图8所示,是根据本申请实施例的视频信息处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图8所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的视频信息处理方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的视频信息处理方法对应的程序指令/模块。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的视频信息处理方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据视频信息处理方法的电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至视频信息处理方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
视频信息处理方法的电子设备还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图8中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS)服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (18)

1.一种视频信息处理方法,包括:
基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数;
其中,所述基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数,包括:
基于所述目标视频帧的初始量化参数,确定所述第i个宏块的亮度分量的待调整量化参数;
基于所述目标视频帧的所述第i个宏块中的像素的亮度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,计算得到所述第i个宏块的亮度分量的量化参数调整值;其中,N为大于等于1的整数;
基于所述第i个宏块的亮度分量的量化参数调整值调整所述第i个宏块的亮度分量的待调整量化参数,得到所述第i个宏块的亮度分量的初始量化参数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于目标视频帧的整体方差,确定所述目标视频帧的量化参数调整值;基于所述目标视频帧的量化参数调整值,确定所述目标视频帧的初始量化参数。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数,包括:
基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,基于第一调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第一量化参数;
基于所述目标视频帧的时域相关信息确定第二调整方式,基于第二调整方式对第i个宏块的亮度分量的第一量化参数进行调整,得到第i个宏块的亮度分量的目标量化参数。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,包括:将所述目标视频帧内与所述第i个宏块相邻的至少一个编码块对应的相关信息作为所述第i个宏块在所述目标视频帧内的空域相关信息;基于所述至少一个编码块对应的相关信息确定所述第一调整方式;
所述基于所述目标视频帧的时域相关信息确定第二调整方式,包括:将所述目标视频帧的时域上的参考模式概率作为所述目标视频帧的时域相关信息;基于所述目标视频帧的时域上的参考模式概率确定第二调整方式。
5.根据权利要求4所述的方法,其特征在于,所述基于所述至少一个编码块对应的相关信息确定所述第一调整方式,包括:
基于所述至少一个编码块对应的相关信息确定相邻宏块的累计参考值,基于所述相邻宏块的累计参考值确定所述第i个宏块的预测值;
基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式。
6.根据权利要求5所述的方法,其特征在于,所述基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式,包括以下之一:
在所述相邻宏块的累计参考值为零的情况下,若所述第i个宏块的预判值为零,则确定所述第一调整方式为增加第一值;
在所述相邻宏块的累计参考值为零的情况下,若第i个宏块的预判值大于第一预设门限值,则确定所述第一调整方式为减少第二值;
在所述相邻宏块的累计参考值处于第一预设范围内的情况下,若第i个宏块的预判值与所述第i个宏块的预测值满足预设条件,则确定所述第一调整方式为减少第三值。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于所述目标视频帧的参考帧和/或所述目标视频帧的前k帧的模式概率信息,确定时域上的参考模式概率;其中,k为大于等于1的整数;
相应的,所述基于所述目标视频帧的时域上的参考模式概率确定第二调整方式,包括以下之一:
在所述时域上的参考模式概率中的第一模式的概率超过第二预设门限值的情况下,确定所述第二调整方式为增加第四值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率大于第五预设门限值,则确定所述第二调整方式为减少第五值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率小于第六预设门限值,则确定所述第二调整方式为将减少第六值。
8.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于所述第i个宏块的亮度分量的目标量化参数,确定所述第i个宏块的色度分量的初始量化参数;
基于所述第i个宏块中的像素的色度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述第i个宏块的色度分量的调整值;
基于所述第i个宏块的色度分量的调整值对所述第i个宏块的色度分量的初始量化参数进行调整,得到所述第i个宏块的色度分量的目标量化参数。
9.一种视频信息处理装置,包括:
初始处理单元,用于基于目标视频帧的初始量化参数、以及所述目标视频帧的第i个宏块的信息,确定所述第i个宏块的初始量化参数;其中,i为大于等于1的整数;
量化参数调整单元,用于基于所述第i个宏块的初始量化参数、所述第i个宏块在所述目标视频帧内的空域相关信息、以及所述目标视频帧的时域相关信息,确定所述第i个宏块的量化参数;
所述初始处理单元,用于基于所述目标视频帧的初始量化参数,确定所述第i个宏块的亮度分量的待调整量化参数;基于所述目标视频帧的所述第i个宏块中的像素的亮度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,计算得到所述第i个宏块的亮度分量的量化参数调整值;其中,N为大于等于1的整数;基于所述第i个宏块的亮度分量的量化参数调整值调整所述第i个宏块的亮度分量的待调整量化参数,得到所述第i个宏块的亮度分量的初始量化参数。
10.根据权利要求9所述的装置,其特征在于,所述初始处理单元,用于基于目标视频帧的整体方差,确定所述目标视频帧的量化参数调整值;基于所述目标视频帧的量化参数调整值,确定所述目标视频帧的初始量化参数。
11.根据权利要求9所述的装置,其特征在于,所述量化参数调整单元,包括:
空域调整子单元,用于基于所述第i个宏块在所述目标视频帧内的空域相关信息确定第一调整方式,基于第一调整方式对所述第i个宏块的亮度分量的初始量化参数进行调整,得到第i个宏块的亮度分量的第一量化参数;
时域调整子单元,用于基于所述目标视频帧的时域相关信息确定第二调整方式,基于第二调整方式对第i个宏块的亮度分量的第一量化参数进行调整,得到第i个宏块的亮度分量的目标量化参数。
12.根据权利要求11所述的装置,其特征在于,所述空域调整子单元,用于将所述目标视频帧内与所述第i个宏块相邻的至少一个编码块对应的相关信息作为所述第i个宏块在所述目标视频帧内的空域相关信息;基于所述至少一个编码块对应的相关信息确定所述第一调整方式;
所述时域调整子单元,用于将所述目标视频帧的时域上的参考模式概率作为所述目标视频帧的时域相关信息;基于所述目标视频帧的时域上的参考模式概率确定第二调整方式。
13.根据权利要求12所述的装置,其特征在于,所述空域调整子单元,用于基于所述至少一个编码块对应的相关信息确定相邻宏块的累计参考值,基于所述相邻宏块的累计参考值确定所述第i个宏块的预测值;基于所述相邻宏块的累计参考值、所述第i个宏块的预测值,确定所述第一调整方式。
14.根据权利要求13所述的装置,其特征在于,所述空域调整子单元,用于执行以下之一:
在所述相邻宏块的累计参考值为零的情况下,若所述第i个宏块的预判值为零,则确定所述第一调整方式为增加第一值;
在所述相邻宏块的累计参考值为零的情况下,若第i个宏块的预判值大于第一预设门限值,则确定所述第一调整方式为减少第二值;
在所述相邻宏块的累计参考值处于第一预设范围内的情况下,若第i个宏块的预判值与所述第i个宏块的预测值满足预设条件,则确定所述第一调整方式为减少第三值。
15.根据权利要求11所述的装置,其特征在于,所述时域调整子单元,用于基于所述目标视频帧的参考帧和/或所述目标视频帧的前k帧的模式概率信息,确定时域上的参考模式概率;其中,k为大于等于1的整数;
相应的,所述时域调整子单元,还用于执行以下之一:
在所述时域上的参考模式概率中的第一模式的概率超过第二预设门限值的情况下,确定所述第二调整方式为增加第四值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率大于第五预设门限值,则确定所述第二调整方式为减少第五值;
在所述时域上的参考模式概率中的第一模式的概率小于第三预设门限值、并且所述时域上的参考模式概率中的第二模式以及第三模式的概率之和大于第四预设门限值的情况下,若所述时域上的参考模式概率中的第四模式的概率小于第六预设门限值,则确定所述第二调整方式为将减少第六值。
16.根据权利要求11所述的装置,其特征在于,所述量化参数调整单元,还包括:
色度调整子单元,用于基于所述第i个宏块的亮度分量的目标量化参数,确定所述第i个宏块的色度分量的初始量化参数;基于所述第i个宏块中的像素的色度分量的方差值、以及所述目标视频帧划分得到的N个宏块的量化参数调整值的平均值,确定所述第i个宏块的色度分量的调整值;基于所述第i个宏块的色度分量的调整值对所述第i个宏块的色度分量的初始量化参数进行调整,得到所述第i个宏块的色度分量的目标量化参数。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
CN202011274600.9A 2020-11-16 2020-11-16 视频信息处理方法、装置、电子设备及存储介质 Active CN112073723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011274600.9A CN112073723B (zh) 2020-11-16 2020-11-16 视频信息处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011274600.9A CN112073723B (zh) 2020-11-16 2020-11-16 视频信息处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112073723A CN112073723A (zh) 2020-12-11
CN112073723B true CN112073723B (zh) 2021-02-02

Family

ID=73655013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011274600.9A Active CN112073723B (zh) 2020-11-16 2020-11-16 视频信息处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112073723B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114727108A (zh) * 2021-01-04 2022-07-08 北京金山云网络技术有限公司 量化因子调整方法、装置、电子设备及存储介质
CN113612999B (zh) * 2021-08-20 2024-03-22 北京市商汤科技开发有限公司 视频处理方法及装置、电子设备和存储介质
CN114898175B (zh) * 2022-04-29 2023-03-28 北京九章云极科技有限公司 目标检测方法、装置及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102263943A (zh) * 2010-05-25 2011-11-30 财团法人工业技术研究院 视频位率控制装置与方法
CN106170979A (zh) * 2014-04-30 2016-11-30 英特尔公司 恒定质量视频编码
WO2019079117A1 (en) * 2017-10-19 2019-04-25 Qualcomm Incorporated CHROMINANCE QUANTIFICATION PARAMETER (QP) SHIFT
CN110324622A (zh) * 2018-03-28 2019-10-11 腾讯科技(深圳)有限公司 一种视频编码码率控制方法、装置、设备及存储介质
US20200267396A1 (en) * 2020-05-07 2020-08-20 Intel Corporation Human visual system adaptive video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102263943A (zh) * 2010-05-25 2011-11-30 财团法人工业技术研究院 视频位率控制装置与方法
CN106170979A (zh) * 2014-04-30 2016-11-30 英特尔公司 恒定质量视频编码
WO2019079117A1 (en) * 2017-10-19 2019-04-25 Qualcomm Incorporated CHROMINANCE QUANTIFICATION PARAMETER (QP) SHIFT
CN110324622A (zh) * 2018-03-28 2019-10-11 腾讯科技(深圳)有限公司 一种视频编码码率控制方法、装置、设备及存储介质
US20200267396A1 (en) * 2020-05-07 2020-08-20 Intel Corporation Human visual system adaptive video coding

Also Published As

Publication number Publication date
CN112073723A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN112073723B (zh) 视频信息处理方法、装置、电子设备及存储介质
WO2022022297A1 (zh) 视频解码方法、视频编码方法、装置、设备及存储介质
CN111757107B (zh) 一种视频编码方法、装置、设备及介质
US10321138B2 (en) Adaptive video processing of an interactive environment
WO2021244341A1 (zh) 图像编码方法及装置、电子设备及计算机可读存储介质
CN110267037B (zh) 视频编码方法、装置、电子设备及计算机可读存储介质
CN112073735B (zh) 视频信息处理方法、装置、电子设备及存储介质
EP1849304B1 (en) Method and apparatus for real-time frame encoding
CN102986211A (zh) 视频编码中的速率控制
CN111757111B (zh) 视频编码方法、装置、设备和存储介质
EA035121B1 (ru) Декодирование видеоданных для пикселей вне палитры в блоках, кодируемых в режиме на основе палитры
CN106961603A (zh) 帧内编码帧码率分配方法和装置
WO2018161867A1 (zh) 码率分配方法、设备及存储介质
CN112913236B (zh) 编码器,解码器和使用压缩mv存储的对应方法
CN113784126A (zh) 图像编码方法、装置、设备及存储介质
CN111757105A (zh) 图像编码处理方法、装置、设备和介质
CN112913238A (zh) 用于低等待时间视频写码的有效量化参数预测方法
De Praeter et al. Simultaneous encoder for high-dynamic-range and low-dynamic-range video
KR20140081681A (ko) 영상의 부호화 방법 및 이를 이용하는 장치
WO2023061129A1 (zh) 视频编码方法、装置、设备及存储介质
Zhou et al. Temporal corelation based hierarchical quantization parameter determination for HEVC video coding
Duanmu et al. An HEVC-compliant fast screen content transcoding framework based on mode mapping
CN109587502B (zh) 一种帧内压缩的方法、装置、设备及计算机可读存储介质
CN112073724B (zh) 视频信息处理方法、装置、电子设备及存储介质
Juri et al. Review on the latest H. 264 motion estimation techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant