CN111953988A - 视频转码方法、计算机设备和存储介质 - Google Patents

视频转码方法、计算机设备和存储介质 Download PDF

Info

Publication number
CN111953988A
CN111953988A CN202010682997.9A CN202010682997A CN111953988A CN 111953988 A CN111953988 A CN 111953988A CN 202010682997 A CN202010682997 A CN 202010682997A CN 111953988 A CN111953988 A CN 111953988A
Authority
CN
China
Prior art keywords
frame
avs2
target
slice
macroblock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010682997.9A
Other languages
English (en)
Other versions
CN111953988B (zh
Inventor
李健恒
曾志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kuvision Digital Technology Co ltd
Original Assignee
Guangzhou Kuvision Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kuvision Digital Technology Co ltd filed Critical Guangzhou Kuvision Digital Technology Co ltd
Priority to CN202010682997.9A priority Critical patent/CN111953988B/zh
Publication of CN111953988A publication Critical patent/CN111953988A/zh
Application granted granted Critical
Publication of CN111953988B publication Critical patent/CN111953988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请公开了一种视频转码方法、计算机设备和存储介质,其中该方法包括解码H265视频,得到H265条带和H265条带的描述信息;根据描述信息确定AVS2目标帧的帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量,然后根据得到的信息编码得到AVS2视频。可以用更少的计算量实现将H265视频转码为AVS2视频,能够在保证输出质量不劣化的情况下高效的将H265视频转换为AVS2视频。

Description

视频转码方法、计算机设备和存储介质
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频转码方法、计算机设备和存储介质。
背景技术
在5G以及高带宽基础通讯建设全面展开的当今中国,在人民群众生活水平不断提高的当下,我们国家率先制定了中国的4K信源标准格式AVS2以满足各行各业日益提高的物质文化需求。目前还有很多视频源是国际标准H265,可以用面向国际标准H265的标准解码器还原出基带YUV信号,再用满足中国国家新一代视频编码4K标准AVS2的编码器进行二次重编码的方式产生AVS2信号,这被称为全解全编方式。这种方式的最大问题在于全系统的设备成本过高,因为运算量太大。
在H265信源保有量相当大的情况下,如何在保证输出质量不劣化的情况下,低成本地设计出高效的H265信源向新中国国家AVS2标准转码的课题就此应运而生。
发明内容
本申请实施例提供一种视频转码方法、计算机设备和存储介质,能够在保证输出质量不劣化的情况下高效的将H265信源转换为AVS2信源。
本申请实施例第一方面提供了一种视频转码方法,用于将H265视频转码为AVS2视频,所述视频转码方法包括:
解码所述H265视频,得到H265条带和所述H265条带的描述信息;所述描述信息包括所述H265条带的参考帧集、所述H265条带中各宏块的预测类型、显示时序标签;
根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定AVS2目标帧的帧类型;
根据所述H265条带的显示时序标签确定所述AVS2目标帧的显示时序标签、编码时序标签和播放延时标签;
根据所述H265条带的参考帧集,确定所述AVS2目标帧的参考信息以及帧删除信息,所述帧删除信息用于删除对应的参考帧;
根据所述H265条带中的宏块生成所述AVS2目标帧中的目标宏块;
根据所述H265条带中各宏块的宏块预测模式和各宏块的运动矢量确定所述AVS2目标帧中各目标宏块的目标宏块预测模式和目标运动矢量;
根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频。
本申请实施例第二方面提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储程序指令;若所述处理器执行所述程序指令,实现上述视频转码方法的步骤。
本申请实施例第三方面提供了一种存储介质,所述存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现上述视频转码方法的步骤。
相比现有技术,本申请实施例的有益效果在于:通过解码H265视频得到H265条带的描述信息,通过对H265条带的描述信息进行异构匹配得到AVS2目标帧的描述信息,如帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量等,从而可以根据AVS2目标帧的描述信息编码得到所述AVS2视频。从而可以用更少的计算量实现将H265视频转码为AVS2视频,能够在保证输出质量不劣化的情况下高效的将H265视频转换为AVS2视频。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1为本申请实施例的视频转码方法的流程示意图;
图2为图1中确定AVS2目标帧的帧类型的流程示意图;
图3为H265视频IPB码率分布的示意图;
图4为AVS2视频IPB码率分布的示意图;
图5为H265视频宏块划分的示意图;
图6为AVS2视频宏块划分的示意图;
图7为H265视频宏块类型的示意图;
图8为AVS2视频宏块类型的示意图;
图9为本申请实施例的计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,如果不冲突,本申请实施例中的各个特征可以相互组合,均在本申请的保护范围之内。另外,虽然在装置示意图中进行了功能模块的划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置示意图中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
本申请的实施例提供了一种视频转码方法、计算机设备和存储介质。其中,该视频转码方法可以应用于终端或服务器中,以实现将H265视频转码为AVS2视频等过程。
示例性的,所述视频转码方法可以用于服务器,当然可以用于终端。其中,终端可以是机顶盒、手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;服务器可以为独立的服务器,也可以为服务器集群。但为了便于理解,以下实施例将以应用于终端的视频转码方法进行详细介绍。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的一种视频转码方法的流程示意图。
如图1所示,视频转码方法包括以下步骤S110至步骤S170。
步骤S110、解码所述H265视频,得到H265条带和所述H265条带的描述信息。
在一些实施方式中,H265条带数据NALU包括网络抽象层头数据和原始数据字节流组成。因此,可以将H265视频解析为网络抽象层头数据和原始数据字节流,其中原始数据字节流主要包括视频的信息,可以称为H265条带,网络抽象层头数据可以包括H265条带的描述信息。
示例性的,所述H265条带的描述信息包括所述H265条带的参考帧集(RPS)、所述H265条带中各宏块的预测类型、显示时序标签。
步骤S120、根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定AVS2目标帧的帧类型。
H265采用了参考帧集(RPS)的技术来管理已解码的帧,用作后续图像的参考。
H265视频以条带(slice)作为最大图像编码单位,没有严格意义上的帧概念,H265条带按照编码类型可以分为帧内条带(I条带),帧间前向条带(P条带),帧间双向条带(B条带)。AVS2以帧作为最大图像编码单位,有IPB(帧类型)图像的概念。可以从H265条带出发异构匹配出AVS2的帧类型信息,确定AVS2目标帧的帧类型,实现H265条带和AVS2目标帧帧类型之间的异构匹配。
B条带是H265中最灵活,压缩效率最高的一种条带。但在一些实施方式中会出现假B条带,或者还会出现假P条带。
在一些实施方式中,如图2所示,所述根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定AVS2目标帧的帧类型,包括步骤S121至步骤S122。
步骤S121、根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定所述H265条带实际的条带类型。
在一些实施方式中会出现假B条带,也就是条带的所有参考帧都是前向,同时条带内的所有宏块的帧间预测类型都是前向预测。这在H265中是合法的存在,但在AVS2中是不允许出现无后向参考帧的B帧的,这种假B条带实际上是P条带。
示例性的,若所述H265条带的参考帧集表示所述H265条带的参考帧都是前向参考帧,且所述H265条带中所有宏块的预测类型均为前向预测,则确定所述H265条带实际的条带类型为P条带。
在一些实施方式中还会出现假P条带,无任何前向参考帧,宏块类型全为I类型,这在H265中是合法的,但在AVS2中是不允许的,这样的假P条带实际上是I条带。
示例性的,若所述H265条带的参考帧集表示所述H265条带的参考帧不包括前向参考帧,且所述H265条带中所有宏块的预测类型均为帧内预测,则确定所述H265条带实际的条带类型为I条带。
通过识别正确的条带类型,可以提高AVS2目标帧的帧类型判定的准确性。
可以理解的,若H265条带不是假B条带也不是假P条带,则该H265条带的条带类型是正确的,可以确定为是实际的条带类型。
步骤S122、根据H265图像中若干H265条带实际的条带类型确定所述H265图像对应的AVS2目标帧的帧类型。
可以理解的,一个H265图像可以划分为一个或多个H265条带。
示例性的,若H265图像中若干H265条带实际的条带类型均为I条带,则确定所述H265图像对应的AVS2目标帧的帧类型为I帧。
如果H265一张图像的所有H265条带都是I类型,则可以确定对应的AVS2帧类型为I帧类型。
示例性的,若H265图像中若干H265条带实际的条带类型均不为B条带且有H265条带实际的条带类型为P条带,则确定所述H265图像对应的AVS2目标帧的帧类型为P帧。
如果H265一张图像的所有H265条带没有B条带类型且至少有一个P条带,则可以确定对应的AVS2帧类型为P帧类型。
示例性的,若H265图像中有H265条带实际的条带类型为B条带,则确定所述H265图像对应的AVS2目标帧的帧类型为B帧。
如果H265一张图像的所有H265条带中至少有一个H265条带为B条带,则可以确定对应的AVS2帧类型为B帧类型。
步骤S130、根据所述H265条带的显示时序标签确定所述AVS2目标帧的显示时序标签、编码时序标签和播放延时标签。
从而可以从H265出发异构匹配出AVS2的帧时序信息。
在一些实施方式中,H265视频显式传输序列最大显示缓冲延时(MaxReorderDelay),序列最大显示缓冲延时用于如果显示缓冲缓存图像数如果大于该序列最大显示缓冲延时,则必可以输出一帧,可以直接将H265视频显式传输的序列最大显示缓冲延时确定为AVS2视频的序列最大显示缓冲延时。
H265视频的时序标签体系只显式传输显示时序标签(POI),而不传输编码时序标签(COI)。AVS2视频的时序标签体系需要显式传输编码时序标签。本申请实施例可以通过帧时序标签异构匹配得到传输编码时序标签。
示例性的,H265视频显式传输的显示时序标签可以表示为H265_POI,可以根据H265视频的码流信息顺序隐式地得到编码时序标签,表示为H265_COI。
示例性的,AVS2视频显式传输的编码时序标签可以表示为AVS2_COI,可以根据AVS2视频显式传输的编码时序标签确定AVS2视频的显示时序标签,表示为AVS2_POI。
在一些实施方式中,在根据H265_POI确定H265_COI时,如果出现传输失败的情况,会使隐式传输的顺序信息乱序,确定得到的H265_COI不够准确,不适合直接作为AVS2_COI。
示例性的,AVS2视频还显式传输播放延时标签(AVS2_Display_delay),播放延时标签用于控制当前帧进入解码器后,过多少帧后输出。
有AVS2_POI=AVS2_COI+AVS2_Display_delay-MaxReorderDeley,其中MaxReorderDeley表示AVS2视频的序列最大显示缓冲延时。可以理解的,有AVS2_Display_delay(未知)=H265_POI(已知)-H265_COI(未知)+MaxReorderDeley。
示例性的,一图组序列如表1所示,POI单调递增,步进为1。
表1H265码流的显示时序标签
H265_POI T0 T1 T2 T3 T4 T5 T6
帧类型顺序 I0 B0 B1 I1 B2 I2 P0
其中,B0、B1开环参考I0、I1,P0参考I2,B2参考I2;以及T1=T0+1,T2=T1+1,……T6=T5+1。
相应的,H265码流进入解码器的时序H265_COI如表2所示:
表2H265码流的编码时序标签
H265_COI 0 1 2 3 4 5 6
帧类型顺序 I0 I1 B0 B1 I2 B2 P0
在表中的I0进入解码器的时候把COI_Register寄存器清为0,同时记录下I0的POI时序标签T0。给每一张图片分配标签对(POI_N:COI_N),其中的POI_N为当前图像的显示时序标签减去T0,COI_N在后续除I0外每张图片进来的时候COI_register加1后记录保存。则I0的时钟标签对为(T0-T0,0)=(0,0),I1的标签对为(T3–T0,1)=(3,1),……P0的标签对为(T6–T0,6)=(6,6)。
把每张图像的AVS2_Display_delay记为AVS2_Display_delay_N,则有AVS2_Display_delay_N=POI_N–COI_N+MaxReorderDeley,可以确定未知的AVS2_Display_delay。则有AVS2_COI=H265_POI-AVS2_Display_delay+MaxReorderDeley。如果将AVS2_COI置为AVS2_COI_N,将H265_POI置为POI_N,以及将AVS2_Display_delay置为AVS2_Display_delay_N,则可以确定AVS2_COI_N=POI_N-AVS2_Display_delay_N+MaxReorderDeley。从而可以得到AVS2中的显式传输的信息对AVS2_COI_N、AVS2_Display_delay_N。所述根据所述H265条带的显示时序标签确定所述AVS2目标帧的显示时序标签、编码时序标签和播放延时标签对开环闭环序列通用,可以正确确定AVS2的解码以及显示时序标签,有效解决H265信源产生输入丢帧错误时的AVS2正确时序恢复问题。
步骤S140、根据所述H265条带的参考帧集,确定所述AVS2目标帧的参考信息以及帧删除信息,所述帧删除信息用于删除对应的参考帧。
H265的参考帧管理信息是告诉解码器后面的帧解码需要保留哪些参考帧,除此之外要删除。AVS2的参考帧管理信息是告诉解码器后面的帧不需要哪些参考帧,这些帧要删除,除此之外要保留。
本申请实施例可以匹配H265的帧管理信息到AVS2的帧管理信息。
H265的参考帧集(RPS)是基于每个条带的,分别对应long_term RPS,short_termRPS,表达描述了当前条带要用哪些参考帧,后续条带要用哪些参考帧,其中哪些参考帧是短时参考哪些参考帧是长时参考,无描述的参考帧可删除。AVS2的参考帧集(RPS)是基于帧的,分别描述当前帧要参考哪些帧。其中I帧无参考;P帧最多四个参考帧;B帧最多两个参考帧,一前向一后向,描述哪些参考帧是可以删除的,没有描述要删除的参考帧需要保留。
在一些实施方式中,H265序列参考帧数量都会远远大于AVS2的参考帧数量,H265条带的参考帧集取并集就会远远超出AVS2目标帧的参考帧集的允许值范围。
示例性的,若所述H265条带条带类型为I条带,根据所述H265条带的参考帧集,确定所述AVS2目标帧的帧删除信息。
在H265条带帧内参考I帧的情况下,可以把H265条带的参考帧集隐式删除的帧信息显式写入当前AVS2帧内参考I帧的删除帧信息中。
示例性的,若所述H265条带条带类型为P条带,根据若干所述H265条带的参考帧集的并集中确定一至四个前向参考帧,并确定所述AVS2目标帧的参考信息以及帧删除信息。
在H265条带帧间参考P帧的情况下,可以把H265所有条带RPS并集信息中最靠近当前帧的最多四帧信息显式写入当前AVS2帧间参考P帧的参考信息中。以及可以把H265条带的参考帧集隐式删除的帧信息显式写入当前AVS2帧内参考I帧的删除帧信息中。
示例性的,若所述H265条带条带类型为B条带,根据若干所述H265条带的参考帧集的并集中确定一个前向参考帧和一个后向参考帧,并确定所述AVS2目标帧的参考信息以及帧删除信息。
在H265条带帧间参考B帧的情况下,可以把H265所有条带RPS并集信息中最靠近当前帧的一前一后两帧参考帧信息显式写入当前AVS2帧间参考B帧的参考信息中。以及可以把H265条带的参考帧集隐式删除的帧信息显式写入当前AVS2帧内参考I帧的删除帧信息中。
示例性的,还可以将当前AVS2目标帧的因标准最大写入限制而无法及时显式写入的帧删除信息合并至下一个AVS2目标帧的帧删除信息中。
步骤S150、根据所述H265条带中的宏块生成所述AVS2目标帧中的目标宏块。
H265视频的宏块划分显式地声明了N×N方式,但AVS2视频的N×N宏块只存在于帧内预测Intra8×8宏块中。
本申请实施例可以将H265宏块划分匹配到AVS2中的相应宏块划分,包括N×N宏块的划分。
H265的编码宏块(CU宏块)的宽高最小值可以由编码器设置,可以称这种宏块为最小CU宏块,可以大于8×8;AVS2的最小CU宏块一定是8×8。
H265中的N×N模式只能出现在帧内预测并且CU宏块大小为最小CU宏块的时候,AVS2的N×N模式只能出现在帧内预测并且CU宏块大小为最小CU宏块(一定是8×8)的时候。
在一些实施方式中,若所述H265条带中有宏块为最小CU宏块且大小大于8×8,则对所述宏块进行分割,得到所述AVS2目标帧中对应的多个目标宏块,并确定所述多个目标宏块的宏块分裂标志。
例如,如果H265条带的最小CU宏块的大小为16×16且宏块划分模式为N×N,则可以把这个宏块变为四个2N×2N的8×8CU宏块,并且设16×16时的宏块分裂标志为1。
示例性的,非最小CU宏块的CU宏块划分的主对应匹配如表3所示:
表3非最小CU宏块的CU宏块划分的主对应匹配
H265 2N×2N 2N×N N×2N 2N×nU 2N×nD nL×2N nR×2N
AVS2 2N×2N 2N×N N×2N 2N×nU 2N×nD nL×2N nR×2N
步骤S160、根据所述H265条带中各宏块的宏块预测模式和各宏块的运动矢量确定所述AVS2目标帧中各目标宏块的目标宏块预测模式和目标运动矢量。
宏块预测模式主要包括帧内预测模式帧间预测模式。在帧内预测模式中,H265帧内预测角度和AVS2帧内预测角度的角度步进值不同,在帧间预测中,参考帧的数量H265远远大于AVS2。在一些实施方式中,宏块预测模式还可以包括跳过模式(Skip模式),H265视频的跳过模式和AVS2视频的跳过模式也不同。
本申请实施例可以在H265和AVS2两个体系中匹配宏块预测模式。
示例性的,若所述H265条带中宏块的宏块预测模式为角度预测的帧内预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为角度预测的帧内预测模式,以及对最接近所述宏块的预测角度的若干AVS2角度进行率失真判决,以确定所述目标宏块的预测角度。
示例性的,若所述H265条带中宏块的宏块预测模式为非角度预测的帧内预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为非角度预测的帧内预测模式,以及对预设的若干AVS2帧内非角度预测模式进行率失真判决,以确定所述目标宏块的帧内非角度预测模式。
帧内预测模式分为两类:角度预测,非角度预测。
H265的角度预测模式匹配到AVS2角度预测模式可以通过以下步骤实现:把最接近H265预测角度的有限个AVS2角度作一次率失真(RDO)判决,选出其中的最优值。
非角度预测时,可以把所有AVS2非角度预测作一次率失真判决,选出其中的最优值。
示例性的,若所述H265条带中宏块的宏块预测模式为帧间预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为帧间预测模式,以及根据所述H265条带的参考帧集和所述AVS2目标帧的参考信息对所述H265条带的运动矢量进行修正和近锚点搜索,以得到所述目标宏块的目标运动矢量,其中,所述帧间预测模式包括前向预测、后向预测或者双向预测。
帧间预测时,H265的前向预测、后向预测、双向预测分别匹配为AVS2的前向预测、后向预测、双向预测,但参考帧要作出变化,因为H265的一帧内可参考帧总数比AVS2的一帧内可参考帧总数要多得多,意味着会有宏块的最优参考帧要发生替换,替换原则是用显示时序最靠近被替换帧的可用参考帧去替换参考帧。
由于所述AVS2目标帧的参考帧发生了替换,可以对这种帧间预测模式的宏块的运动矢量(MV)进行缩放作为修正。例如,可以根据当前帧和原参考帧之间的顺序间隔与当前帧和替换后参考帧的顺序间隔的比值对所述H265条带的运动矢量进行修正,而且可以以修正后的MV作为锚点,作一次近锚点MV搜索,找出最优解,作为真正的预测MV,即所述目标宏块的目标运动矢量。
示例性的,若所述H265条带中宏块的宏块预测模式为跳过模式,则根据率失真判决确定所述AVS2目标帧中相应目标宏块的宏块预测模式为正常跳过模式或特别跳过模式。
H265跳过模式的宏块,对应着AVS2的正常跳过模式和特别跳过模式,可以应用率失真判决选出其中的最优值作为目标宏块的宏块预测模式。
示例性的,对参考帧没变化的帧间宏块可直接将H265条带的运动矢量作为AVS2中所述目标宏块的目标运动矢量。
步骤S170、根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频。
示例性的,编码包括变换,量化与熵编码。
本申请实施例提供的视频转码方法,通过解码H265视频得到H265条带的描述信息,通过对H265条带的描述信息进行异构匹配得到AVS2目标帧的描述信息,如帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量等,从而可以根据AVS2目标帧的描述信息编码得到所述AVS2视频。从而可以用更少的计算量实现将H265视频转码为AVS2视频,能够在保证输出质量不劣化的情况下高效的将H265视频转换为AVS2视频。
H265的图像信息头部分包括VPS、SPS、PPS以及其它扩展信息,AVS2的图像头信息包括序列头,图像头以及其它扩展头信息,在条带部分两者的条带信息不一样,宏块级的所有信息都有或大或小的差异,这些信息异构匹配之后重编码,会引起码率变化。
在一些实施方式中,所述视频转码方法还包括:根据所述H265视频的量化步长、所述H265条带的纹理复杂度、所述H265条带的图像复杂度确定所述AVS2视频的帧内量化步长。
示例性的,有AVS2_QP=8÷6×(H265_QP–H265_QP_Zero)+AVS2_QP_Zero;其中AVS2_QP表示所述AVS2视频的帧内量化步长,H265_QP表示所述H265视频的量化步长,H265_QP_Zero、AVS2_QP_Zero为与位宽有关的常数。因此如果H265视频的量化步长是动态的,则可以直接基于该算式,根据所述H265视频的量化步长确定所述AVS2视频的帧内量化步长。
示例性的,如果H265视频的量化步长不是动态的,则可以根据H265条带的纹理复杂度对不同纹理复杂度的区域的AVS2视频的帧内量化步长进行调整。
示例性的,还可以根据H265的图像复杂度划分区域对AVS2视频的帧内量化步长进行调整。
在一些实施方式中,所述视频转码方法还包括:根据所述H265视频的码率和量化步长,以及所述AVS2视频的目标码率确定所述AVS2视频的帧间量化步长。
帧内图像压缩完成后,码率会略有误差,可以这个误差合并到后面的帧中进行平衡。
示例性的,有QP2=QP1-QpStep×(log2)[size2÷size1],其中QP2表示所述AVS2视频的帧间量化步长,size2表示所述AVS2视频的目标码率,size1表示所述H265视频的码率,QP1表示所述H265视频的量化步长,QpStep为一经验值。
示例性的,所述根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频,包括:基于所述AVS2视频的帧内量化步长和所述AVS2视频的帧间量化步长,根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频。
通过根据H265视频的码率和量化步长确定AVS2视频的帧内量化步长和AVS2视频的帧间量化步长,可以在异构转码中保持码率按要求保持稳定。通过调节AVS2视频的目标码率可以使得AVS2视频的码率按需求向下或向上产生可控的设计码率变化。
本申请实施例的视频转码方法,是一种基于新一代国际视频编码4K标准H265到中国国家新一代视频编码4K标准AVS2的快速转码方法。充分利用输入H265码流中的编码信息来指导AVS2进行快速异构编码。有效降低AVS2编码端中参考帧选择、帧类型判决、宏块划分、宏块预测模式选择、宏块运动搜索、全视频序列码率控制的运算量,可以大幅减少转码需要的计算资源和计算时间,无视开环闭环图组的差异,同时保证转码后视频的码率稳定以及极小的主客观视频质量指标的下降,可以在一般的服务器平台上实现一CPU一路的快速实时转码。
如图3所示为H265视频IPB码率分布的示意图,图4所示为AVS2视频IPB码率分布的示意图。如图5所示为H265视频宏块划分的示意图,图6所示为AVS2视频宏块划分的示意图。如图7所示为H265视频宏块类型的示意图,图8所示为AVS2视频宏块类型的示意图。
应用本申请实施例的视频转码方法后AVS2输出视频序列和原H265输入视频序列比较会有以下特征:有相同或相似的帧类型对应关系和包络一致的码率控制曲线,以及相似或相同的宏块划分、宏块预测模式、和方向一致的经缩放后的运动向量。用分析工具打开输入信源H265码流和输出转码后的AVS2码流可以直接观察出上面的特征。
本申请实施例的视频转码方法可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
示例性的,上述的视频转码方法可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。请参阅图9,图9是本申请实施例提供的一种计算机设备的结构示意图。该计算机设备可以是服务器或终端。
参阅图9,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种视频转码方法的步骤。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种视频转码方法。
该网络接口用于进行网络通信,如接收H265视频,或发送AVS2视频等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本实施例中的计算机设备与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施中的计算机设备的结构及实施过程,为了说明书的简洁,在此就不再赘述。
本申请实施例提供的计算机设备,可以通过解码H265视频得到H265条带的描述信息,通过对H265条带的描述信息进行异构匹配得到AVS2目标帧的描述信息,如帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量等,从而可以根据AVS2目标帧的描述信息编码得到所述AVS2视频。从而可以用更少的计算量实现将H265视频转码为AVS2视频,能够在保证输出质量不劣化的情况下高效的将H265视频转换为AVS2视频。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法,如:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项视频转码方法的步骤。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种视频转码方法,其特征在于,用于将H265视频转码为AVS2视频,所述视频转码方法包括:
解码所述H265视频,得到H265条带和所述H265条带的描述信息;所述描述信息包括所述H265条带的参考帧集、所述H265条带中各宏块的预测类型、显示时序标签;
根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定AVS2目标帧的帧类型;
根据所述H265条带的显示时序标签确定所述AVS2目标帧的显示时序标签、编码时序标签和播放延时标签;
根据所述H265条带的参考帧集,确定所述AVS2目标帧的参考信息以及帧删除信息,所述帧删除信息用于删除对应的参考帧;
根据所述H265条带中的宏块生成所述AVS2目标帧中的目标宏块;
根据所述H265条带中各宏块的宏块预测模式和各宏块的运动矢量确定所述AVS2目标帧中各目标宏块的目标宏块预测模式和目标运动矢量;
根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频。
2.如权利要求1所述的视频转码方法,其特征在于:所述根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定AVS2目标帧的帧类型,包括:
根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定所述H265条带实际的条带类型;
根据H265图像中若干H265条带实际的条带类型确定所述H265图像对应的AVS2目标帧的帧类型。
3.如权利要求2所述的视频转码方法,其特征在于:所述根据所述H265条带的参考帧集,以及所述H265条带中各宏块的预测类型确定所述H265条带实际的条带类型,包括:
若所述H265条带的参考帧集表示所述H265条带的参考帧都是前向参考帧,且所述H265条带中所有宏块的预测类型均为前向预测,则确定所述H265条带实际的条带类型为P条带;
若所述H265条带的参考帧集表示所述H265条带的参考帧不包括前向参考帧,且所述H265条带中所有宏块的预测类型均为帧内预测,则确定所述H265条带实际的条带类型为I条带。
4.如权利要求3所述的视频转码方法,其特征在于:所述根据H265图像中若干H265条带实际的条带类型确定所述H265图像对应的AVS2目标帧的帧类型,包括:
若H265图像中若干H265条带实际的条带类型均为I条带,则确定所述H265图像对应的AVS2目标帧的帧类型为I帧;
若H265图像中若干H265条带实际的条带类型均不为B条带且有H265条带实际的条带类型为P条带,则确定所述H265图像对应的AVS2目标帧的帧类型为P帧;
若H265图像中有H265条带实际的条带类型为B条带,则确定所述H265图像对应的AVS2目标帧的帧类型为B帧。
5.如权利要求1-4中任一项所述的视频转码方法,其特征在于:所述根据所述H265条带的参考帧集,确定所述AVS2目标帧的参考信息以及帧删除信息,包括:
若所述H265条带条带类型为I条带,根据所述H265条带的参考帧集,确定所述AVS2目标帧的帧删除信息;
若所述H265条带条带类型为P条带,根据若干所述H265条带的参考帧集的并集中确定一至四个前向参考帧,并确定所述AVS2目标帧的参考信息以及帧删除信息;
若所述H265条带条带类型为B条带,根据若干所述H265条带的参考帧集的并集中确定一个前向参考帧和一个后向参考帧,并确定所述AVS2目标帧的参考信息以及帧删除信息。
6.如权利要求1-4中任一项所述的视频转码方法,其特征在于:所述根据所述H265条带中的宏块生成所述AVS2目标帧中的目标宏块,包括:
若所述H265条带中有宏块为最小CU宏块且大小大于8×8,则对所述宏块进行分割,得到所述AVS2目标帧中对应的多个目标宏块,并确定所述多个目标宏块的宏块分裂标志。
7.如权利要求1-4中任一项所述的视频转码方法,其特征在于:所述根据所述H265条带中各宏块的宏块预测模式和各宏块的运动矢量确定所述AVS2目标帧中各目标宏块的目标宏块预测模式和目标运动矢量,包括:
若所述H265条带中宏块的宏块预测模式为角度预测的帧内预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为角度预测的帧内预测模式,以及对最接近所述宏块的预测角度的若干AVS2角度进行率失真判决,以确定所述目标宏块的预测角度;
若所述H265条带中宏块的宏块预测模式为非角度预测的帧内预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为非角度预测的帧内预测模式,以及对预设的若干AVS2帧内非角度预测模式进行率失真判决,以确定所述目标宏块的帧内非角度预测模式;
若所述H265条带中宏块的宏块预测模式为帧间预测模式,则确定所述AVS2目标帧中相应目标宏块的宏块预测模式为帧间预测模式,以及根据所述H265条带的参考帧集和所述AVS2目标帧的参考信息对所述H265条带的运动矢量进行修正和近锚点搜索,以得到所述目标宏块的目标运动矢量,其中,所述帧间预测模式包括前向预测、后向预测或者双向预测;
若所述H265条带中宏块的宏块预测模式为跳过模式,则根据率失真判决确定所述AVS2目标帧中相应目标宏块的宏块预测模式为正常跳过模式或特别跳过模式。
8.如权利要求1-4中任一项所述的视频转码方法,其特征在于:所述方法还包括:
根据所述H265视频的量化步长、所述H265条带的纹理复杂度、所述H265条带的图像复杂度确定所述AVS2视频的帧内量化步长;
根据所述H265视频的码率和量化步长,以及所述AVS2视频的目标码率确定所述AVS2视频的帧间量化步长;
所述根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频,包括:
基于所述AVS2视频的帧内量化步长和所述AVS2视频的帧间量化步长,根据所述AVS2目标帧中的目标宏块、帧类型、显示时序标签、编码时序标签、播放延时标签、参考信息、帧删除信息、目标宏块预测模式和目标运动矢量编码得到所述AVS2视频。
9.一种计算机设备,其特征在于:包括存储器和处理器,所述存储器用于存储程序指令;若所述处理器执行所述程序指令,实现如权利要求1-8中任一项所述的视频转码方法的步骤。
10.一种存储介质,所述存储介质存储有计算机程序,其特征在于:若所述计算机程序被处理器执行,实现如权利要求1-8中任一项所述的视频转码方法的步骤。
CN202010682997.9A 2020-07-15 2020-07-15 视频转码方法、计算机设备和存储介质 Active CN111953988B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010682997.9A CN111953988B (zh) 2020-07-15 2020-07-15 视频转码方法、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010682997.9A CN111953988B (zh) 2020-07-15 2020-07-15 视频转码方法、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111953988A true CN111953988A (zh) 2020-11-17
CN111953988B CN111953988B (zh) 2022-08-09

Family

ID=73341317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010682997.9A Active CN111953988B (zh) 2020-07-15 2020-07-15 视频转码方法、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111953988B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070030904A1 (en) * 2005-08-05 2007-02-08 Lsi Logic Corporation Method and apparatus for MPEG-2 to H.264 video transcoding
CN101621687A (zh) * 2008-08-18 2010-01-06 深圳市铁越电气有限公司 H.264到avs视频码流转换方法及其装置
CN101668207A (zh) * 2009-09-25 2010-03-10 天津大学 Mpeg到avs视频编码转换系统
CN104038764A (zh) * 2014-06-27 2014-09-10 华中师范大学 一种h.264到h.265的视频转码方法及转码器
CN104796694A (zh) * 2015-04-30 2015-07-22 上海交通大学 基于视频纹理信息的优化帧内视频编码方法
CN104837019A (zh) * 2015-04-30 2015-08-12 上海交通大学 基于支持向量机的avs到hevc优化视频转码方法
US20160301942A1 (en) * 2015-04-10 2016-10-13 Montage Technology (Shanghai) Co., Ltd. Circuit, method and video decoder for video decoding
WO2020108033A1 (zh) * 2018-11-27 2020-06-04 北京达佳互联信息技术有限公司 转码方法、转码装置和计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070030904A1 (en) * 2005-08-05 2007-02-08 Lsi Logic Corporation Method and apparatus for MPEG-2 to H.264 video transcoding
CN101621687A (zh) * 2008-08-18 2010-01-06 深圳市铁越电气有限公司 H.264到avs视频码流转换方法及其装置
CN101668207A (zh) * 2009-09-25 2010-03-10 天津大学 Mpeg到avs视频编码转换系统
CN104038764A (zh) * 2014-06-27 2014-09-10 华中师范大学 一种h.264到h.265的视频转码方法及转码器
US20160301942A1 (en) * 2015-04-10 2016-10-13 Montage Technology (Shanghai) Co., Ltd. Circuit, method and video decoder for video decoding
CN104796694A (zh) * 2015-04-30 2015-07-22 上海交通大学 基于视频纹理信息的优化帧内视频编码方法
CN104837019A (zh) * 2015-04-30 2015-08-12 上海交通大学 基于支持向量机的avs到hevc优化视频转码方法
WO2020108033A1 (zh) * 2018-11-27 2020-06-04 北京达佳互联信息技术有限公司 转码方法、转码装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN111953988B (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
US11412248B2 (en) Image encoding method and apparatus, and image decoding method and apparatus
CN110944185B (zh) 视频解码的方法和装置、计算机设备及存储介质
GB2492778A (en) Motion compensated image coding by combining motion information predictors
CN114827595A (zh) 视频解码方法、装置、计算机设备及存储介质
US20180184089A1 (en) Target bit allocation for video coding
US11095878B2 (en) Method and device for encoding a sequence of images and method and device for decoding a sequence of image
US20200322613A1 (en) Rate Control for Video Splicing Applications
US20210084294A1 (en) Encoding video using two-stage intra search
CN114501010A (zh) 图像编码方法、图像解码方法及相关装置
US20220232208A1 (en) Displacement vector prediction method and apparatus in video encoding and decoding and device
CN111953987B (zh) 视频转码方法、计算机设备和存储介质
CN114827623A (zh) 用于视频编解码的边界扩展
US11303916B2 (en) Motion compensation techniques for video
CN115428445A (zh) 用于视频编码的方法和装置
CN111953988B (zh) 视频转码方法、计算机设备和存储介质
US20060061497A1 (en) Bit rate conversion apparatus and method
CN117378202A (zh) 用于自适应mvd分辨率的双边匹配的系统和方法
KR20240051197A (ko) 비디오 인코딩 및 디코딩 방법, 장치, 저장 매체, 전자 기기 및 컴퓨터 프로그램 제품
US20130287100A1 (en) Mechanism for facilitating cost-efficient and low-latency encoding of video streams
Song et al. Extra sign bit hiding algorithm based on recovery of transform coefficients
CN113141507B (zh) 视频编解码中的运动信息列表构建方法、装置及设备
US11683509B1 (en) Prediction unit skip detection in encoder
US12022088B2 (en) Method and apparatus for constructing motion information list in video encoding and decoding and device
CN102577130B (zh) 从第一mpeg流到第二mpeg流的代码转换器
US11405617B1 (en) Method and system to enhance compression efficiency in encoded video by using dual pass entropy coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant