CN107948649B - 一种基于主观质量模型的视频编码方法及装置 - Google Patents
一种基于主观质量模型的视频编码方法及装置 Download PDFInfo
- Publication number
- CN107948649B CN107948649B CN201610891984.6A CN201610891984A CN107948649B CN 107948649 B CN107948649 B CN 107948649B CN 201610891984 A CN201610891984 A CN 201610891984A CN 107948649 B CN107948649 B CN 107948649B
- Authority
- CN
- China
- Prior art keywords
- model
- target object
- type
- subjective quality
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
Abstract
本发明实施例公开了一种基于主观质量模型的视频编码方法及装置。方法包括:获得目标层级中目标对象的原始数据;根据原始数据,对目标对象进行编码,获得目标对象的重建数据;计算原始数据和重建数据的像素差矩阵;获得原始数据基于目标层级的第一类主观质量模型的第一类模型值;根据像素差矩阵和第一类模型值,判断目标对象是否编码成功;若为否,调整针对目标对象的编码参数,返回执行对所述目标对象进行编码,获得目标对象的重建数据的步骤;若为是,判定所述目标对象编码成功。通过本方案可以保证视频的编码结果能够满足人眼视觉特性。
Description
技术领域
本发明涉及视频编码技术领域,特别涉及一种基于主观质量模型的视频编码方法及装置。
背景技术
随着多媒体应用中视频业务的不断发展以及视频云计算需求的不断提高,视频原始信息的数据量之大是现有的传输网络带宽和存储资源无法承受的,因此,以消除视频信号的各种数据冗余为目的的视频编码成为目前国内外研究和应用的热点之一。
以编码单元为例,传统视频编码方法中,去除目标编码单元的时域、空域、结构以及信息熵冗余后,一般依据客观评价标准评价目标编码单元的失真情况、依据客观评价模型确定率失真代价等等,从而实现目标编码单元的各种编码参数的选择,以对目标编码单元进行编码,其中,上述客观评价模型可以理解为:基于客观评价标准的率失真模型。
由于视频最终是提供给人观看的,而人眼具有其特殊的视觉特性,为使得编码后的视频能够给人们带来较佳的视觉体验,视频感知编码得到了越来越广泛的应用,其中,视频感知编码可以简单的理解为引入人眼视觉模型即主观质量模型的视频编码。
现有的视频感知编码方法通常聚焦于使用主观质量模型来替代传统编码过程中的失真评价方法,具体地,对目标编码单元进行各种编码参数选择时,基于主观质量模型进行失真评价,然后将上述失真评价结果带入前述客观评价模型,以进行各种编码参数的选择,最终基于选定的各种编码参数,实现对目标编码单元的编码。
应用上述方式可以实现视频感知编码,但由于只在失真计算方面考虑了人眼视觉特性,而忽略了人眼视觉特性对其他因素的影响,进而无法保证能够得到满足人眼视觉特性的编码结果。
发明内容
本发明实施例的目的在于提供一种基于主观质量模型的视频编码方法及装置,以保证视频的编码结果能够满足人眼视觉特性。具体技术方案如下:
第一方面,本发明实施例提供了一种基于主观质量模型的视频编码方法,包括:
获得目标层级中目标对象的原始数据;
根据所述原始数据,对所述目标对象进行编码,获得所述目标对象的重建数据;
计算所述原始数据和所述重建数据的像素差矩阵;
获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值;
根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功;
若为否,调整针对所述目标对象的编码参数,返回执行所述对所述目标对象进行编码,获得所述目标对象的重建数据的步骤;
若为是,判定所述目标对象编码成功。
可选地,所述获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值,包括:
将所述原始数据输入所述目标层级的第一类主观质量模型后获得的模型值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值;
或,
将所述目标层级的第一类主观质量模型的第一预设值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值。
可选地,在所述判定所述目标对象编码成功之后,本发明实施例所提供的基于主观质量模型的视频编码方法,还包括:
判断所述目标层级是否存在未编码的对象;
若为是,将所述目标对象更新为所述目标对象的下一对象,并返回执行所述获得目标层级中目标对象的原始数据的步骤;
若为否,获得所述目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值;根据所述目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断所述父对象是否编码成功;若否,调整针对所述父对象的编码参数,将所述目标对象更新为所述父对象包含的第一个子对象,并返回执行所述获得目标层级中目标对象的原始数据的步骤,若是,判定所述父对象编码成功,其中,所述第二类主观质量模型为:所述目标层级的上一层的主观质量模型。
可选地,所述获得所述目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,包括:
将所述目标对象父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值;
或,
将第二类主观质量模型的第二预设值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值。
可选地,所述第一类主观质量模型和所述第二类主观质量模型为以下模型中的至少一种:
恰可失真模型、峰值信噪比模型、协方差经验值模型、最大K×K块平均像素差经验值模型、最大K×K块像素均方差模型,其中,K为正整数。
可选地,在所述第一类主观质量模型包括至少两种模型的情况下,
所述获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值,包括:
获得所述原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
所述根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功,包括:
根据所述像素差矩阵和所述第一类模型值包含的每一模型值,分别判断所述目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
可选地,所述目标层级为根据针对编码结果的主观质量评价参数确定的。
可选地,在所述调整针对所述目标对象的编码参数之前,本发明实施例所提供的基于主观质量模型的视频编码方法,还包括:
判断所述目标对象的编码参数是否已遍历完成;
如果否,执行所述调整针对所述目标对象的编码参数的步骤;
如果是,按照预设规则,从所述目标对象的编码结果中选取一个编码结果作为所述目标对象的最终编码结果,并确定所述目标对象编码成功。
第二方面,本发明实施例提供了一种基于主观质量模型的视频编码装置,包括:
第一获得模块,用于获得目标层级中目标对象的原始数据;
第二获得模块,用于根据所述原始数据,对所述目标对象进行编码,获得所述目标对象的重建数据;
计算模块,用于计算所述原始数据和所述重建数据的像素差矩阵;
第三获得模块,用于获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值;
第一判断模块,用于根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功;
第一调整模块,用于在所述第一判断模块的结果为否的情况下,调整针对所述目标对象的编码参数,触发所述第二获得模块;
第一判定模块,用于在所述第一判断模块的结果为是的情况下,判定所述目标对象编码成功。
可选地,所述第三获得模块,具体用于:
将所述原始数据输入所述目标层级的第一类主观质量模型后获得的模型值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值;
或,
将所述目标层级的第一类主观质量模型的第一预设值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值。
可选地,本发明实施例所提供的基于主观质量模型的视频编码装置,还包括:
第二判断模块,用于在所述第一判定模块判定所述目标对象编码成功之后,判断所述目标层级是否存在未编码的对象;
更新模块,用于在所述第二判断模块的结果为是的情况下,将所述目标对象更新为所述目标对象的下一对象,并触发所述第一获得模块;
第四获得模块,用于在所述第二判断模块的结果为否的情况下,获得所述目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,其中,所述第二类主观质量模型为:所述目标层级的上一层的主观质量模型;
第三判断模块,用于根据所述目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断所述父对象是否编码成功;
第二调整模块,用于在所述第三判断模块的结果为否的情况下,调整针对所述父对象的编码参数,将所述目标对象更新为所述父对象包含的第一个子对象,并触发所述第一获得模块;
第二判定模块,用于在所述第三判断模块的结果为是的情况下,判定所述父对象编码成功。
可选地,所述第四获得模块,具体用于:
在所述第二判断模块的结果为否的情况下,将所述目标对象父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值;
或,
在所述第二判断模块的结果为否的情况下,将第二类主观质量模型的第二预设值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值。
可选地,所述第一类主观质量模型和所述第二类主观质量模型为以下模型中的至少一种:
恰可失真模型、峰值信噪比模型、协方差经验值模型、最大K×K块平均像素差经验值模型、最大K×K块像素均方差模型,其中,K为正整数。
可选地,在所述第一类主观质量模型包括至少两种模型的情况下,
所述第三获得模块,具体用于:
获得所述原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
所述第一判断模块,具体用于:
根据所述像素差矩阵和所述第一类模型值包含的每一模型值,分别判断所述目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
可选地,所述目标层级为根据针对编码结果的主观质量评价参数确定的。
可选地,本发明实施例所提供的基于主观质量模型的视频编码装置,还包括:
第四判断模块,用于在所述第一调整模块调整针对所述目标对象的编码参数之前,判断所述目标对象的编码参数是否已遍历完成;
触发模块,用于在所述第四判断模块的结果为否的情况下,触发所述第一调整模块;
确定模块,用于在所述第四判断模块的结果为是的情况下,按照预设规则,从所述目标对象的编码结果中选取一个编码结果作为所述目标对象的最终编码结果,并确定所述目标对象编码成功。
在本发明实施例所提供的基于主观质量模型的视频编码方法中,首先获得目标层级中目标对象的原始数据,而后,根据原始数据,对目标对象进行编码,获得目标对象的重建数据,并计算原始数据和重建数据的像素差矩阵,再获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,最后,根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,若为否,调整针对目标对象的编码参数,返回执行对所述目标对象进行编码,获得目标对象的重建数据的步骤;若为是,判定目标对象编码成功。现有技术中,只在失真计算方面考虑了人眼视觉特性,而忽略了人眼视觉特性对其他因素的影响,无法保证能够得到满足人眼视觉特性的编码结果,与其相比,本发明实施例提供的技术方案中,直接将主观质量模型应用在目标对象的编码结果的评价上,以此来判断目标对象是否编码成功,如果编码失败,则调整针对目标对象的各种编码参数,对目标对象重新进行编码,以保证得到能够满足人眼视觉特性的编码结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的基于主观质量模型的视频编码方法的第一种流程示意图;
图2为视频编码层级结构的示例;
图3为本发明实施例所提供的基于主观质量模型的视频编码方法的第二种流程示意图;
图4为图3所示实施例的一种具体的流程图;
图5为本发明实施例所提供的基于主观质量模型的视频编码方法的第三种流程示意图;
图6为本发明实施例所提供的基于主观质量模型的视频编码装置的第一种结构示意图;
图7为本发明实施例所提供的基于主观质量模型的视频编码装置的第二种结构示意图;
图8为本发明实施例所提供的基于主观质量模型的视频编码装置的第三种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了保证得到能够满足人眼视觉特性的编码结果,本发明实施例提供了一种基于主观质量模型的视频编码方法及装置。
下面首先对本发明实施例提供的一种基于主观质量模型的视频编码方法进行介绍。
需要说明的是,本发明实施例所提供的一种基于主观质量模型的视频编码方法的执行主体可以为一种基于主观质量模型的视频编码装置,如:视频编码器。其中,该基于主观质量模型的视频编码装置可以为现有视频编码软件中的插件,或者,独立的功能软件,这都是合理的。并且,该基于主观质量模型的视频编码装置可以应用于终端中,也可以应用于服务器中。
如图1所示,本发明实施例所提供的一种基于主观质量模型的视频编码方法,包括如下步骤:
S101,获得目标层级中目标对象的原始数据。
其中,目标对象的原始数据可以是从多个对象预先获得并存储的数据中提取的,也可以是实时获得的,在此不作限定。
可以理解的是,层级是根据视频编码的层级结构确定的,具体地,包括从低到高的预测单元层/编码单元层、条带层、图像层、图像组层、视频段层、视频层,其中,每个高层级对象都可以划分为至少一个低层级对象,被划分的高层级对象为划分所得的低层级对象的父对象,多个低层级对象为被划分的高层级对象的子对象。需要强调的是,实际应用中,层级划分可以是不连续的,例如,可以划分成只包括图像层和编码单元层的层级结构,这都是允许的,那么,图像层对象便为其划分的多个编码单元层对象的父对象。
举例而言,参见图2所示,视频1至视频5均为视频层的对象,可以将视频层对象视频3划分为N个视频段层对象;而针对视频段层对象视频段4,又可以将其划分为M个图像层对象,分别为图像1至图像M;进一步地,还可以将图像层对象图像2划分为7个条带层对象,分别为条带1至条带7;更进一步地,条带层对象条带7还可以划分成多个编码单元及其划分的预测单元,其中,就图像2而言,图像2为条带1至条带7的父对象,条带1至条带7为图像2的子对象。其中,N为大于5的自然数,M为大于6的自然数。
需要说明的是,实际应用中,目标层级可以根据针对编码结果的主观质量评价参数确定,可以为预测单元层、编码单元层、条带层、图像层、图像组层、视频段层或视频层。
具体地,可以通过定义主观质量评价参数与视频编码的层级间的对应关系来实现。举例而言,主观质量评价参数可以为高质、低质,其中,高质表示对编码结果的主观质量要求比较高,目标层级可以为较低层级,例如编码单元层,将主观质量模型应用在该层级,以使得该层级对象的编码结果可控;低质表示对编码结果的主观质量要求较低,则目标层级可以为较高层级,例如图像层。
实际应用中,还可以根据视频信息来确定目标层级,具体的,可以根据视频的分辨率来确定,例如,针对手机拍摄的中小移动视频,人眼观看距离较近,人眼对图像质量的敏感度较高,主观质量模型就要求更细粒化,那么在进行编码时,目标层级便可以选择较低层级,例如编码单元层;而针对远距离观看的大分辨率电影视频,人眼对图像质量的敏感度稍低,主观质量模型可以粗一些,在进行编码时,目标层级便可以选择较高的层级,例如图像层。
S102,根据原始数据,对目标对象进行编码,获得目标对象的重建数据。
其中,执行S101后,可以根据获得的原始数据,应用传统编码方法对目标对象进行编码,再经过解码后重建,获得该目标对象的重建数据。具体如何编码和获得重建数据属于现有技术,此处不再赘述。
需要说明的是,现有的视频感知编码方法聚焦于使用主观质量模型来替代传统编码过程中的失真评价方法,对目标编码单元进行各种编码参数选择时,基于主观质量模型进行失真评价,然后将上述失真评价结果带入客观评价模型,其中,上述客观评价模型可以理解为:基于客观评价标准的率失真模型;由于现有视频编码的大部分工具都是用基于原有的客观评价模型训练出来的,应用现有的视频感知编码方法,会导致单次编码效率明显下降,而本发明实施例所提供的技术方案中,当目标层级为编码单元层时,对目标编码单元进行编码时,仍可以应用传统编码方法,避免了现有技术中单次编码效率明显下降的问题,此外,由于编码时仍然采用的传统编码方法进行编码,应用本发明实施例提供的方案仅仅影响编码参数的选择,所以应用本发明实施例提供的技术方案进行编码,最终生成的视频码流符合现有的视频编码标准,可以直接被常用播放器解码播放。
S103,计算原始数据和重建数据的像素差矩阵。
需要说明的是,为了后续处理,可以计算由S101获得原始数据和由S102获得的重建数据的像素差矩阵,其中具体的计算过程属于现有技术,此处不再赘述。
S104,获得原始数据基于目标层级的第一类主观质量模型的第一类模型值。
其中,主观质量模型指人眼观看视频对视频质量的主观评价体系,包括主观质量模型值的计算和评价方法两部分,评价方法即指如何根据主观质量模型模型具体判断编码对象是否编码成功。
可以理解的是,主观质量模型按照模型值的获得方式可以分为两种:
第一种主观质量模型,模型值由对象的原始数据经过复杂计算得到。如,JND(JustNoticeable difference,恰可失真)模型,根据JND模型的定义,以原始待编码像素为输入,计算出像素域或频域的每个位置的JND模型值;
第二种主观质量模型,模型值是经验值或使用简单运算得到的。如PSNR(PeakSignal to Noise Ratio,峰值信噪比)经验值模型、协方差经验值模型、最大K×K块平均像素差经验值模型和最大K×K块像素均方差模型都是此类典型的模型,其中,K为正整数。
实际应用中,第一类主观质量模型可以为第一种主观质量模型和第二种主观质量模型中的至少一种,当然,也可以为除第一种主观质量模型和第二种主观质量模型之外的其他模型,在此不作限定。具体的,当目标层级为图像层时,第一类主观质量模型可以为PSNR经验值模型和/或最大K×K块像素均方差模型,其中,为提高压缩效率,还可以更具体地,针对不同帧类型的图像,即I帧、B帧、P帧的图像分别使用不同的PSNR经验值模型,此外,为更好地控制编码结果的主观质量,具体可以使用最大4×4块像素均方差模型;当目标层级为编码单元层时,第一类主观质量模型可以为最大4×4块像素均方差模型。
因此,具体的,获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,可以包括:
将原始数据输入目标层级的第一类主观质量模型后获得的模型值,确定为原始数据基于第一类主观质量模型的第一类模型值;
或,
将目标层级的第一类主观质量模型的第一预设值,确定为原始数据基于第一类主观质量模型的第一类模型值。
需要说明的是,可以在对目标层级中第一个对象编码之前就获得目标层级中所有对象的原始数据基于第一类主观质量模型的模型值,然后从预先获得的模型值中提取出目标对象的原始数据基于目标层级的第一类主观质量模型的第一类模型值;还可以在对目标对象编码之前或者编码后实时获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,在此不作限定。
S105,根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,若为否,执行S106,若为是,执行S107。
需要说明的是,在目标对象编码完成后,可以根据S103中计算得到的像素差矩阵和S104中获得的第一类模型值,判断目标对象是否编码成功,若目标对象编码失败,则执行S106,若目标对象编码成功,则执行S107。
其中,需要先将像素差矩阵转换成与第一类主观质量模型对应的类型数据,例如,当第一类主观质量模型为PSNR经验值模型时,需将像素差矩阵转换为PSNR,即目标对象的实际PSNR;可以理解的是,像素差矩阵的转换结果可以为以下类型数据的至少一种:PSNR、协方差、最大K×K块平均像素差、最大K×K块像素均方差、行列式绝对值、秩、平均均方差和像素差和。
而后,根据像素差矩阵的转换结果和第一类模型值,判断目标对象是否编码成功,需要说明的是,其具体判断方式由第一类主观质量模型决定。举例而言,当第一类主观质量模型为PSNR经验值模型时,可以理解的是,若像素差矩阵转换获得的目标对象的实际PSNR大于PSNR经验值,则可以判定目标对象编码成功;当第一类主观质量模型为JND模型、协方差经验值模型、最大K×K块平均像素差经验值模型或最大K×K块像素均方差模型时,可以理解的是,若像素差矩阵对应的转换结果小于第一类模型值,则可以判定目标对象编码成功。其中,当第一类主观质量模型包括至少两种模型时的判断方式可以就上述示例中的两种方式进行结合,具体将在后续实施例中进行详细介绍。
S106,调整针对目标对象的编码参数。
需要说明的是,当S105执行结果为否,即目标对象编码失败时,可以调整针对目标对象的编码参数,并返回执行S102及其后续步骤,对目标对象重新进行编码,并基于第一类主观质量模型对新的编码结果进行判断,若仍然编码失败,则继续调整目标对象的编码参数,并返回执行S102及其后续步骤,不断循环,以使得目标对象编码成功。
S107,判定目标对象编码成功。
需要说明的是,当S105执行结果为是,则说明目标对象编码成功,实际应用中,可以基于此进行后续处理流程,例如,可以在目标层级未编码完成时,对目标对象的下一个对象进行编码。
应用图1所示实施例提供的基于主观质量模型的视频编码方法,首先获得目标层级中目标对象的原始数据,而后,根据原始数据,对目标对象进行编码,获得目标对象的重建数据,并计算原始数据和重建数据的像素差矩阵,再获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,最后,根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,若为否,调整针对目标对象的编码参数,返回执行对所述目标对象进行编码,获得目标对象的重建数据的步骤;若为是,判定目标对象编码成功。现有技术中,只在失真计算方面考虑了人眼视觉特性,而忽略了人眼视觉特性对其他因素的影响,无法保证能够得到满足人眼视觉特性的编码结果,与其相比,本发明实施例提供的技术方案中,直接将主观质量模型应用在目标对象的编码结果的评价上,以此来判断目标对象是否编码成功,即编码结果是否满足人眼视觉特性,如果不满足,即编码失败,则调整针对目标对象的各种编码参数,对目标对象重新进行编码,以保证得到能够满足人眼视觉特性的编码结果。
更进一步的,在图1所示实施例的基础上,S107之后,如图3所示,本发明实施例所提供的一种基于主观质量模型的视频编码方法,还包括:
S108,判断目标层级是否存在未编码的对象,若为是,执行S109,若为否,执行S110。
需要说明的是,若目标层级中的目标对象编码成功,可以判断目标层级是否存在未编码的对象,并根据判断结果进行后续处理,具体的,如果目标层级存在未编码的对象,说明目标对象不是目标层级的最后一个对象,则执行S109,如果目标层级不存在未编码的对象,即目标层级中所有的对象已编码完成,则执行S110。其中,具体的判断方法属于现有技术,此处不再赘述。
S109,将目标对象更新为目标对象的下一对象。
需要说明的是,当S108执行结果为是,即目标层级存在未编码对象时,可以将目标对象更新为目标对象的下一对象,循环执行S101及其后续步骤。
举例而言,目标对象为图像层中的图像3,图像3编码成功后,图像层中还有未编码的图像4、图像5、图像6和图像7,那么,可以将目标对象更新为根据设定的规则所确定的图像3的下一对象,具体的,图像3的下一对象可以为图像4,也可以为图像6,在此不作限定。
S110,获得目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值。
其中,第二类主观质量模型为目标层级的上一层的主观质量模型;可以理解的是,父对象为目标层级的上一层中的对象,且目标对象为由父对象划分所获得的子对象。举例而言,目标层级为编码单元层,其上一层为图像层,针对图像层中的对象图像9,它被划分成包括目标对象在内的多个编码单元层的对象,那么,目标对象的父对象便是图像9。
需要说明的是,第二类主观质量模型可以为以下模型中的至少一种:恰可失真模型、峰值信噪比模型、协方差经验值模型、最大K×K块平均像素差经验值模型、最大K×K块像素均方差模型,其中,K为正整数;当然,第二类主观质量模型也可以为除上述几种模型之外的其他主观质量模型,在此不作限定。
具体的,当目标层级的上一层为图像层时,第二类主观质量模型可以为PSNR经验值模型和/或最大K×K块像素均方差模型,其中,为提高压缩效率,还可以更具体地,针对不同帧类型的图像,即I帧、B帧、P帧的图像分别使用不同的PSNR经验值模型,此外,为更好地控制编码结果的主观质量,具体可以使用最大4×4块像素均方差模型。
具体的,获得目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,可以包括:
将目标对象父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值;
或,
将第二类主观质量模型的第二预设值,确定为目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值。
需要说明的是,可以在对目标层级的上一层中第一个对象编码之前就获得上一层中所有对象的原始数据基于第二类主观质量模型的模型值,然后从预先获得的模型值中提取出父对象的原始数据基于第二类主观质量模型的第二类模型值;还可以在对父对象编码之前或者编码后实时获得其原始数据基于第二类主观质量模型的第二类模型值,在此不作限定。
S111,根据目标层级包含的所有对象的像素差矩阵和第二类模型值,判断父对象是否编码成功,若是,执行S112,若否,执行S113。
需要说明的是,在父对象编码完成后,可以根据目标层级包含的所有对象的像素差矩阵和S110中获得的第二类模型值,判断父对象是否编码成功,若父对象编码成功,执行S112,若父对象编码失败,则执行S113。
其中,需要先根据目标层级包含的所有对象的像素差矩阵获得父对象的像素差矩阵,然后将父对象的像素差矩阵转换成与第二类主观质量模型对应的类型数据,这点在图1所示实施例中的S105已进行了详细阐述,此处不再赘述。
而后,根据父对象的像素差矩阵的转换结果和第二类模型值,判断父对象是否编码成功,需要说明的是,其判断方式由第二类主观质量模型决定,具体思路与S105中判断目标对象是否编码成功的方式相似,此处不再赘述。
在第二类主观质量模型包括至少两种模型的情况下,所述获得目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,可以包括:
获得目标对象父对象的原始数据分别基于第二类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
相应地,所述根据目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断父对象是否编码成功,可以包括:
根据目标层级包含的所有对象的像素差矩阵和第二类模型值包含的每一模型值,分别判断父对象是否编码成功;
统计编码成功的次数;
判断次数是否大于预设阈值;
若为是,判定父对象编码成功;
若为否,判定父对象编码失败。
举例而言,预设阈值为2,第二类主观质量模型包括PSNR经验值模型、最大4×4块像素均方差模型、协方差经验值模型,首先获得由PSNR经验值a、最大4×4块像素均方差经验值b、协方差经验值c组成的第二类模型值,然后根据父对象的像素差矩阵转换得到的实际PSNR值a′、最大4×4块像素均方差b′以及协方差c′,分别判断父对象是否编码成功;具体地,若a′大于a,针对PSNR经验值模型,可以判定父对象编码成功,若b′小于b,针对最大4×4块像素均方差模型,可以判定父对象编码成功,若c′小于c,针对协方差经验值模型,可以判定父对象编码成功,即编码成功次数为3,大于预设阈值2,因此,可以判定父对象编码成功。其中,a,b,c,a′,b′,c′均为正数。
同样地,在第一类主观质量模型包括至少两种模型的情况下,所述获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,可以包括:
获得原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
相应地,所述根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,可以包括:
根据像素差矩阵和第一类模型值包含的每一模型值,分别判断目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
S112,判定父对象编码成功。
需要说明的是,若S111执行结果为是,则可以判定父对象编码成功,继续进行后续的处理,如对父对象的下一个对象进行编码。
S113,调整针对父对象的编码参数,将目标对象更新为父对象包含的第一个子对象,返回执行S101。
可以理解的是,若S111执行结果为否,即目标对象父对象编码失败,那么可以调整针对父对象的各种编码参数,并将目标对象更新父对象包含的第一个子对象,返回执行S101,实现对父对象的重新编码。
举例而言,父对象为图像9,划分为6个条带层子对象,分别为条带1至条带6,如果图像9编码失败,那么可以调整针对图像9的编码参数,如量化参数,再将目标对象更新为条带1至条带6中确定的第一个子对象,对其进行重新编码,从而实现对父对象的重新编码。
应用图3所示实施例,更进一步地,在目标层级中的目标对象编码成功的情况下,判断目标层级是否存在未编码的对象,若为是,将目标对象更新为目标对象的下一对象;若为否,获得目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,并根据目标层级包含的所有对象的像素差矩阵和第二类模型值,判断父对象是否编码成功,若是,判定父对象编码成功,若否,即父对象编码失败,则调整父对象的编码参数,将目标对象更新为父对象包含的第一个子对象,返回执行获得目标层级中目标对象的原始数据的步骤,实现对父对象的重新编码。可以看出,应用本发明实施例所提供的技术方案,可以针对多个层级中的对象应用基于主观质量模型的视频编码方法,在多个层级上获得能够满足人眼视觉特性的编码结果,从而使得视频的最终编码结果更加满足人眼视觉特性。
可以理解的是,如果对编码结果的主观质量模型要求比较严格,那么可以在多个层级应用基于主观质量模型的视频编码方法,以防止得到的编码结果仅在底层满足人眼视觉特性,而在高层级却不满足。
针对图3所示实施例,下面将以一具体实施例进行说明,设定在编码单元层和图像层应用基于主观质量模型的视频编码方法,其中,目标层级为编码单元层,其上一层为图像层,参见图4,包括:
S401,获得编码单元层中目标对象的原始数据。
S402,根据原始数据,对目标对象进行编码,获得目标对象的重建数据。
S403,计算原始数据和重建数据的像素差矩阵。
S404,获得原始数据基于编码单元层的最大4×4块像素均方差模型的第一类模型值7.5。
需要说明的是,本具体实施例中,最大4×4块像素均方差模型的模型值直接为经验值7.5,可以直接获得。
S405,根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,如果是,执行S407,如果否,执行S406。
需要说明的是,本具体实施例中,对于目标对象,将像素差矩阵转换为最大4×4块像素均方差,若转换的结果大于7.5,则执行S407,判定目标对象编码成功,否则,判定目标对象编码失败,执行S406。
S406,调整针对目标对象的编码参数,返回执行S402。
其中,若像素差矩阵转换的最大4×4块像素均方差小于7.5,即目标对象编码失败,则调整针对目标对象的编码参数,返回执行对目标对象进行编码,获得目标对象的重建数据的步骤。
S407,判定目标对象编码成功。
S408,判断编码单元层是否存在未编码的对象,如果是,执行S410,如果否,执行S409。
S409,将目标对象更新为目标对象的下一对象,返回执行S401。
S410,获得目标对象父对象的原始数据分别基于PSNR经验值模型、最大4×4块像素均方差模型的模型值组成的第二类模型值,其中,设定I、B、P帧图像的PSNR经验值模型的模型值分别为42、40、40,最大4×4块像素均方差模型的模型值为7.5。
S411,根据编码单元层包含的所有对象的像素差矩阵和第二类模型值,判断父对象是否编码成功。
需要说明的是,首先根据编码单元层包含的所有对象的像素差矩阵获得父对象的最大4×4块像素均方差及实际PSNR,并判断最大4×4块像素均方差是否小于7.5,实际PSNR是否大于父对象的帧类型对应的PSNR经验值模型的模型值,若均为是,执行S412,判定父对象编码成功,否则,判定父对象编码失败,执行S413。
S412,判定父对象编码成功。
S413,调整针对父对象的编码参数,将目标对象更新为父对象包含的第一个子对象。
其中,若父对象编码失败,则调整针对父对象的编码参数,并将目标对象更新为父对象包含的第一个子对象,实现对父对象的重新编码。
其中,针对编码单元层级的每一对象,须根据像素差矩阵,获得其所有4×4块的均方差的最大值,并判断是否大于7.5,如果否,就调整针对该编码单元层对象的编码参数,重新对该对象进行编码;如果是,则判定对象编码成功,在编码单元层还存在未编码对象的情况下,继续对下一编码单元层对象进行编码,如果编码单元层所有对象都已编码成功,那么就可以返回图像层,对图像层对象进行编码;针对图像层的每一个对象,须根据像素差矩阵,获得其所有4×4块的均方差的最大值,以及编码后重建数据对应的实际PSRN,并判断所获得的最大值是否大于7.5,实际PSNR是否小于对应的PSNR经验值,若均为是,判定编码成功,然后在图像层还存在未编码对象的情况下,继续对下一图像层对象进行编码,否则就调整针对该图像层对象的编码参数,然后重新进行编码。可以看出,采用图4所示具体实施例中的技术方案,对编码单元层和图像层的对象应用基于主观质量模型的视频编码方法,可以保证编码单元层和图像层的对象的编码结果满足人眼视觉特性。
更进一步的,在图1所示实施例的基础上,S106之前,如图5所示,本发明实施例所提供的一种基于主观质量模型的视频编码方法,还包括:
S114,判断目标对象的编码参数是否已遍历完成,如果是,执行S115,如果否,执行S106。
实际应用中,为避免针对某一编码参数的取值重复编码,浪费时间,可以在调整针对目标对象的编码参数之前,判断目标对象的编码参数是否已遍历完成,如果否,那么可以执行S106,调整针对目标对象的编码参数,对目标对象重新进行编码,如果是,即目标对象的编码参数已遍历完成,则可以执行S115。
S115,按照预设规则,从目标对象的编码结果中选取一个编码结果作为目标对象的最终编码结果,并确定目标对象编码成功。
可以理解的是,如果S114的执行结果为是,即目标对象的编码参数已遍历完成,那么,便可以按照预设规则,从目标对象的编码结果中选取一个编码结果作为目标对象的最终编码结果,并确定目标对象编码成功,以进行后续步骤,如对目标对象的下一对象进行编码。其中,所述按照预设规则,从目标对象的编码结果中选取一个编码结果作为目标对象的最终编码结果,可以是按照目标对象的实际PSNR大小,从目标对象的编码结果中选取一个最大PSNR对应的编码结果作为目标对象的最终编码结果,具体不作限定。
应用图5所示实施例,在图1所示实施例基础上,更进一步地,在调整针对目标对象的编码参数之前,判断目标对象的编码参数是否已遍历完成,如果是,按照预设规则,从目标对象的编码结果中选取一个编码结果作为目标对象的最终编码结果,并确定目标对象编码成功;如果否,执行调整针对目标对象的编码参数的步骤。可以看出,应用图5所示实施例的技术方案,可以避免重复编码,浪费编码时间,并且可以从目标对象的编码结果中可以按照预设规则,选择一个合适的编码结果作为目标对象的最终编码结果,在一定程度上也较佳地满足了人眼视觉特性。
需要说明的是,实际应用中,如果对编码结果的主观质量要求不是很严格,还可以在多个层级上应用基于主观质量模型的视频编码方法,但对于某些层级,比如低层级对象的编码结果,可以不要求都满足人眼视觉特性,例如针对编码单元层对象A,设定参数调整次数阈值为4,即如果针对A的编码参数调整4次后,还是没有得到满足人眼视觉特性的编码结果,那么考虑到节省编码时间,可以直接从其所有的编码结果中选取一个作为最终的编码结果,并认定对象A编码成功。具体地,可以在图像层和编码单元层应用基于主观质量模型的视频编码方法,且如果图像层对象的编码结果都满足人眼视觉特性,那么,即使编码单元层的对象在对编码单元调整有限次数后仍然无法都获得满足人眼视觉特性的编码结果,也可以最终判定编码成功;当然在对编码结果的主观质量要求比较严格时,可以只有在图像层和编码单元层的对象的编码结果都满足人眼视觉特性时,才最终判定编码成功。
相应于上述方法实施例,本发明实施例提供了一种基于主观质量模型的视频编码装置,如图6所示,所述装置可以包括:
第一获得模块601,用于获得目标层级中目标对象的原始数据;
第二获得模块602,用于根据所述原始数据,对所述目标对象进行编码,获得所述目标对象的重建数据;
计算模块603,用于计算所述原始数据和所述重建数据的像素差矩阵;
第三获得模块604,用于获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值;
第一判断模块605,用于根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功;
第一调整模块606,用于在所述第一判断模块605的结果为否的情况下,调整针对所述目标对象的编码参数,触发所述第二获得模块602;
第一判定模块607,用于在所述第一判断模块605的结果为是的情况下,判定所述目标对象编码成功。
应用图6所示实施例提供的技术方案,首先获得目标层级中目标对象的原始数据,而后,根据原始数据,对目标对象进行编码,获得目标对象的重建数据,并计算原始数据和重建数据的像素差矩阵,再获得原始数据基于目标层级的第一类主观质量模型的第一类模型值,最后,根据像素差矩阵和第一类模型值,判断目标对象是否编码成功,若为否,调整针对目标对象的编码参数,返回执行对所述目标对象进行编码,获得目标对象的重建数据的步骤;若为是,判定目标对象编码成功。现有技术中,只在失真计算方面考虑了人眼视觉特性,而忽略了人眼视觉特性对其他因素的影响,无法保证能够得到满足人眼视觉特性的编码结果,与其相比,本发明实施例提供的技术方案中,直接将主观质量模型应用在目标对象的编码结果的评价上,以此来判断目标对象是否编码成功,即编码结果是否满足人眼视觉特性,如果不满足,即编码失败,则调整针对目标对象的各种编码参数,对目标对象重新进行编码,以保证得到能够满足人眼视觉特性的编码结果。
具体的,所述第三获得模块604,具体用于:
将所述原始数据输入所述目标层级的第一类主观质量模型后获得的模型值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值;
或,将所述目标层级的第一类主观质量模型的第一预设值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值。
具体的,所述目标层级为根据针对编码结果的主观质量评价参数确定的。
更进一步的,在包含第一获得模块601,第二获得模块602,计算模块603,第三获得模块604,第一判断模块605,第一调整模块606,第一判定模块607的基础上,如图7所示,本发明实施例所提供的一种长期参考图像选择装置还可以包括:
第二判断模块608,用于在所述第一判定模块607判定所述目标对象编码成功之后,判断所述目标层级是否存在未编码的对象;
更新模块609,用于在所述第二判断模块608的结果为是的情况下,将所述目标对象更新为所述目标对象的下一对象,并触发所述第一获得模块601;
第四获得模块610,用于在所述第二判断模块608的结果为否的情况下,获得所述目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,其中,所述第二类主观质量模型为:所述目标层级的上一层的主观质量模型;
第三判断模块611,用于根据所述目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断所述父对象是否编码成功;
第二调整模块612,用于在所述第三判断模块611的结果为否的情况下,调整针对所述父对象的编码参数,将所述目标对象更新为所述父对象包含的第一个子对象,并触发所述第一获得模块601;
第二判定模块613,用于在所述第三判断模块611的结果为是的情况下,判定所述父对象编码成功。
应用图7所示实施例,更进一步地,在目标层级中的目标对象编码成功的情况下,判断目标层级是否存在未编码的对象,若为是,将目标对象更新为目标对象的下一对象;若为否,获得目标对象父对象的原始数据基于第二类主观质量模型的第二类模型值,并根据目标层级包含的所有对象的像素差矩阵和第二类模型值,判断父对象是否编码成功,若是,判定父对象编码成功,若否,即父对象编码失败,则调整父对象的编码参数,将目标对象更新为父对象包含的第一个子对象,返回执行获得目标层级中目标对象的原始数据的步骤,实现对父对象的重新编码。可以看出,应用本发明实施例所提供的技术方案,可以针对多个层级中的对象应用基于主观质量模型的视频编码方法,在多个层级上获得能够满足人眼视觉特性的编码结果,从而使得视频的最终编码结果更加满足人眼视觉特性。
具体的,所述第四获得模块610,具体用于:
在所述第二判断模块608的结果为否的情况下,将所述目标对象父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值;
或,在所述第二判断模块608的结果为否的情况下,将第二类主观质量模型的第二预设值,确定为所述目标对象父对象的原始数据基于所述第二类主观质量模型的第二类模型值。
具体的,所述第一类主观质量模型和所述第二类主观质量模型为以下模型中的至少一种:
恰可失真模型、峰值信噪比模型、协方差经验值模型、平均像素差经验值模型、最大K×K块像素均方差模型,其中,N为正整数。
具体的,在所述第一类主观质量模型包括至少两种模型的情况下,
所述第三获得模块604,具体用于:
获得所述原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
所述第一判断模块605,具体用于:
根据所述像素差矩阵和所述第一类模型值包含的每一模型值,分别判断所述目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
更进一步的,在包含第一获得模块601,第二获得模块602,计算模块603,第三获得模块604,第一判断模块605,第一调整模块606,第一判定模块607的基础上,如图8所示,本发明实施例所提供的一种长期参考图像选择装置还可以包括:
第四判断模块614,用于在所述第一调整模块调整针对所述目标对象的编码参数之前,判断所述目标对象的编码参数是否已遍历完成;
触发模块615,用于在所述第四判断模块614的结果为否的情况下,触发所述第一调整模块;
确定模块616,用于在所述第四判断模块614的结果为是的情况下,按照预设规则,从所述目标对象的编码结果中选取一个编码结果作为所述目标对象的最终编码结果,并确定所述目标对象编码成功。
应用图8所示实施例,在图6所示实施例基础上,更进一步地,在调整针对目标对象的编码参数之前,判断目标对象的编码参数是否已遍历完成,如果是,按照预设规则,从目标对象的编码结果中选取一个编码结果作为目标对象的最终编码结果,并确定目标对象编码成功;如果否,执行调整针对目标对象的编码参数的步骤。可以看出,应用图8所示实施例的技术方案,可以避免重复编码,浪费编码时间,并且可以从目标对象的编码结果中可以按照预设规则,选择一个合适的编码结果作为目标对象的最终编码结果,在一定程度上也较佳地满足了人眼视觉特性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (15)
1.一种基于主观质量模型的视频编码方法,其特征在于,包括:
获得目标层级中目标对象的原始数据;层级是根据视频编码的层级结构确定的;
根据所述原始数据,对所述目标对象进行编码,再经过解码后重建,获得所述目标对象的重建数据;
计算所述原始数据和所述重建数据的像素差矩阵;
获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值;
根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功;
若为否,调整针对所述目标对象的编码参数,返回执行所述对所述目标对象进行编码,获得所述目标对象的重建数据的步骤;
若为是,判定所述目标对象编码成功;
在所述判定所述目标对象编码成功之后,还包括:
判断所述目标层级是否存在未编码的对象;
若为是,将所述目标对象更新为所述目标对象的下一对象,并返回执行所述获得目标层级中目标对象的原始数据的步骤;
若为否,获得所述目标对象的父对象的原始数据基于第二类主观质量模型的第二类模型值;根据所述目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断所述父对象是否编码成功;若否,调整针对所述父对象的编码参数,将所述目标对象更新为所述父对象包含的第一个子对象,并返回执行所述获得目标层级中目标对象的原始数据的步骤,若是,判定所述父对象编码成功,其中,所述第二类主观质量模型为:所述目标层级的上一层的主观质量模型;所述父对象为所述目标层级的上一层中的对象,且所述目标对象为由所述父对象划分所获得的子对象。
2.根据权利要求1所述的方法,其特征在于,所述获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值,包括:
将所述原始数据输入所述目标层级的第一类主观质量模型后获得的模型值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值;
或,将所述目标层级的第一类主观质量模型的第一预设值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值。
3.根据权利要求1所述的方法,其特征在于,所述获得所述目标对象的父对象的原始数据基于第二类主观质量模型的第二类模型值,包括:
将所述目标对象的父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为所述目标对象的父对象的原始数据基于所述第二类主观质量模型的第二类模型值;
或,将第二类主观质量模型的第二预设值,确定为所述目标对象的父对象的原始数据基于所述第二类主观质量模型的第二类模型值。
4.根据权利要求1所述的方法,其特征在于,所述第一类主观质量模型和所述第二类主观质量模型为以下模型中的至少一种:
恰可失真模型、峰值信噪比模型、协方差经验值模型、最大K×K块平均像素差经验值模型、最大K×K块像素均方差模型,其中,K为正整数。
5.根据权利要求4所述的方法,其特征在于,在所述第一类主观质量模型包括至少两种模型的情况下,
所述获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值,包括:
获得所述原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
所述根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功,包括:
根据所述像素差矩阵和所述第一类模型值包含的每一模型值,分别判断所述目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
6.根据权利要求1所述的方法,其特征在于,所述目标层级为根据针对编码结果的主观质量评价参数确定的。
7.根据权利要求1所述的方法,其特征在于,在所述调整针对所述目标对象的编码参数之前,还包括:
判断所述目标对象的编码参数是否已遍历完成;
如果否,执行所述调整针对所述目标对象的编码参数的步骤;
如果是,按照预设规则,从所述目标对象的编码结果中选取一个编码结果作为所述目标对象的最终编码结果,并确定所述目标对象编码成功。
8.一种基于主观质量模型的视频编码装置,其特征在于,包括:
第一获得模块,用于获得目标层级中目标对象的原始数据;层级是根据视频编码的层级结构确定的;
第二获得模块,用于根据所述原始数据,对所述目标对象进行编码,再经过解码后重建,获得所述目标对象的重建数据;
计算模块,用于计算所述原始数据和所述重建数据的像素差矩阵;
第三获得模块,用于获得所述原始数据基于所述目标层级的第一类主观质量模型的第一类模型值;
第一判断模块,用于根据所述像素差矩阵和所述第一类模型值,判断所述目标对象是否编码成功;
第一调整模块,用于在所述第一判断模块的结果为否的情况下,调整针对所述目标对象的编码参数,触发所述第二获得模块;
第一判定模块,用于在所述第一判断模块的结果为是的情况下,判定所述目标对象编码成功;
还包括:
第二判断模块,用于在所述第一判定模块判定所述目标对象编码成功之后,判断所述目标层级是否存在未编码的对象;
更新模块,用于在所述第二判断模块的结果为是的情况下,将所述目标对象更新为所述目标对象的下一对象,并触发所述第一获得模块;
第四获得模块,用于在所述第二判断模块的结果为否的情况下,获得所述目标对象的父对象的原始数据基于第二类主观质量模型的第二类模型值,其中,所述第二类主观质量模型为:所述目标层级的上一层的主观质量模型;所述父对象为所述目标层级的上一层中的对象,且所述目标对象为由所述父对象划分所获得的子对象;
第三判断模块,用于根据所述目标层级包含的所有对象的像素差矩阵和所述第二类模型值,判断所述父对象是否编码成功;
第二调整模块,用于在所述第三判断模块的结果为否的情况下,调整针对所述父对象的编码参数,将所述目标对象更新为所述父对象包含的第一个子对象,并触发所述第一获得模块;
第二判定模块,用于在所述第三判断模块的结果为是的情况下,判定所述父对象编码成功。
9.根据权利要求8所述的装置,其特征在于,所述第三获得模块,具体用于:
将所述原始数据输入所述目标层级的第一类主观质量模型后获得的模型值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值;
或,将所述目标层级的第一类主观质量模型的第一预设值,确定为所述原始数据基于所述第一类主观质量模型的第一类模型值。
10.根据权利要求8所述的装置,其特征在于,所述第四获得模块,具体用于:
在所述第二判断模块的结果为否的情况下,将所述目标对象的父对象的原始数据输入第二类主观质量模型后获得的模型值,确定为所述目标对象的父对象的原始数据基于所述第二类主观质量模型的第二类模型值;
或,在所述第二判断模块的结果为否的情况下,将第二类主观质量模型的第二预设值,确定为所述目标对象的父对象的原始数据基于所述第二类主观质量模型的第二类模型值。
11.根据权利要求8所述的装置,其特征在于,所述第一类主观质量模型和所述第二类主观质量模型为以下模型中的至少一种:
恰可失真模型、峰值信噪比模型、协方差经验值模型、最大K×K块平均像素差经验值模型、最大K×K块像素均方差模型,其中,K为正整数。
12.根据权利要求11所述的装置,其特征在于,在所述第一类主观质量模型包括至少两种模型的情况下,
所述第三获得模块,具体用于:
获得所述原始数据分别基于所述目标层级的第一类主观质量模型包括的每一模型的模型值,所获得的模型值组成第一类模型值;
所述第一判断模块,具体用于:
根据所述像素差矩阵和所述第一类模型值包含的每一模型值,分别判断所述目标对象是否编码成功;
统计编码成功的次数;
判断所述次数是否大于预设阈值;
若为是,判定所述目标对象编码成功;
若为否,判定所述目标对象编码失败。
13.根据权利要求8所述的装置,其特征在于,所述目标层级为根据针对编码结果的主观质量评价参数确定的。
14.根据权利要求8所述的装置,其特征在于,还包括:
第四判断模块,用于在所述第一调整模块调整针对所述目标对象的编码参数之前,判断所述目标对象的编码参数是否已遍历完成;
触发模块,用于在所述第四判断模块的结果为否的情况下,触发所述第一调整模块;
确定模块,用于在所述第四判断模块的结果为是的情况下,按照预设规则,从所述目标对象的编码结果中选取一个编码结果作为所述目标对象的最终编码结果,并确定所述目标对象编码成功。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有程序,所述程序用于指令硬件实现权利要求1-7任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610891984.6A CN107948649B (zh) | 2016-10-12 | 2016-10-12 | 一种基于主观质量模型的视频编码方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610891984.6A CN107948649B (zh) | 2016-10-12 | 2016-10-12 | 一种基于主观质量模型的视频编码方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107948649A CN107948649A (zh) | 2018-04-20 |
CN107948649B true CN107948649B (zh) | 2020-07-03 |
Family
ID=61928857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610891984.6A Active CN107948649B (zh) | 2016-10-12 | 2016-10-12 | 一种基于主观质量模型的视频编码方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107948649B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111311584B (zh) * | 2020-02-24 | 2023-06-23 | 北京百度网讯科技有限公司 | 视频质量评估方法及装置、电子设备、可读介质 |
CN111935545B (zh) * | 2020-08-03 | 2023-03-24 | 腾讯音乐娱乐科技(深圳)有限公司 | 转码视频数据的方法、装置、设备及存储介质 |
CN112351252B (zh) * | 2020-10-27 | 2023-10-20 | 重庆中星微人工智能芯片技术有限公司 | 监控视频编解码装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104333754A (zh) * | 2014-11-03 | 2015-02-04 | 西安电子科技大学 | 基于预测模式快速选择的shvc增强层视频编码方法 |
CN105163106A (zh) * | 2015-07-22 | 2015-12-16 | 天津科技大学 | 一种多重数据处理的视频质量评价系统 |
CN105306954A (zh) * | 2014-05-30 | 2016-02-03 | 西安电子科技大学 | 一种基于视差最小可察觉误差模型的感知立体视频编码 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100466736C (zh) * | 2005-12-30 | 2009-03-04 | 杭州华三通信技术有限公司 | 运动图像编码控制方法及编码装置 |
EP2101503A1 (en) * | 2008-03-11 | 2009-09-16 | British Telecommunications Public Limited Company | Video coding |
CN102685472B (zh) * | 2011-03-08 | 2014-11-05 | 华为技术有限公司 | 数据传输的方法、装置和系统 |
CN102523477B (zh) * | 2011-12-01 | 2014-02-12 | 上海大学 | 一种基于双目最小可辨失真模型的立体视频质量评价方法 |
US20130188060A1 (en) * | 2012-01-23 | 2013-07-25 | Victor Steinberg | Method, System and Apparatus for Testing Video Quality |
US9036497B2 (en) * | 2013-01-07 | 2015-05-19 | Snu R&Db Foundation | Mobile video streaming enhancement in a network coding-capable wireless network |
CN105049838B (zh) * | 2015-07-10 | 2017-05-10 | 天津大学 | 一种用于压缩立体视频质量的客观评价方法 |
CN105100789B (zh) * | 2015-07-22 | 2018-05-15 | 天津科技大学 | 一种视频质量评价方法 |
-
2016
- 2016-10-12 CN CN201610891984.6A patent/CN107948649B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105306954A (zh) * | 2014-05-30 | 2016-02-03 | 西安电子科技大学 | 一种基于视差最小可察觉误差模型的感知立体视频编码 |
CN104333754A (zh) * | 2014-11-03 | 2015-02-04 | 西安电子科技大学 | 基于预测模式快速选择的shvc增强层视频编码方法 |
CN105163106A (zh) * | 2015-07-22 | 2015-12-16 | 天津科技大学 | 一种多重数据处理的视频质量评价系统 |
Non-Patent Citations (2)
Title |
---|
H.264视频编码率失真优化和码率控制技术研究进展;崔子冠;《电子学报》;20131215;第41卷(第12期);2443-2450 * |
融合视觉感知特性的视频编码率失真优化;王茜;《计算机辅助设计与图形学学报》;20151015;第27卷(第10期);1852-1859 * |
Also Published As
Publication number | Publication date |
---|---|
CN107948649A (zh) | 2018-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Recent advances in rate control for video coding | |
CN101627635B (zh) | 三维视频编码 | |
CN103609115B (zh) | 具有基于知觉的帧内切换的模式决策的编码方法及装置 | |
JP7075983B2 (ja) | ビデオ処理装置およびビデオストリームの処理方法 | |
CN108574841B (zh) | 一种基于自适应量化参数的编码方法及装置 | |
CN103609122B (zh) | 用于视频编码的率失真优化 | |
CN102067610A (zh) | 基于视频编码的切片依赖性的码率控制模型适配 | |
CN107948649B (zh) | 一种基于主观质量模型的视频编码方法及装置 | |
EP3328083A1 (en) | Method and apparatus for encoding a video applying adaptive quantisation | |
CN112584119B (zh) | 一种基于强化学习的自适应全景视频传输方法及系统 | |
KR102472971B1 (ko) | 인공지능 모델을 이용한 동영상 인코딩 최적화 방법, 시스템, 및 컴퓨터 프로그램 | |
CN110708570B (zh) | 视频的编码码率确定方法、装置、设备及存储介质 | |
Rehman et al. | Perceptual experience of time-varying video quality | |
Shahid et al. | A no-reference machine learning based video quality predictor | |
Xu et al. | Consistent visual quality control in video coding | |
CN101426135A (zh) | 编码装置及其控制方法 | |
Micó-Enguídanos et al. | Per-title and per-segment CRF estimation using DNNs for quality-based video coding | |
Haseeb et al. | Rate and distortion modeling for real-time MGS coding and adaptation | |
CN116527909A (zh) | 编码参数的传输方法、装置、设备、存储介质及程序产品 | |
Topiwala et al. | Deep learning techniques in video coding and quality analysis | |
CN108012154B (zh) | 一种视频编码方法及装置 | |
CN116827921A (zh) | 一种流媒体的音视频处理方法、装置及设备 | |
CN108206954B (zh) | 一种视频编码方法及装置 | |
Jung | Comparison of video quality assessment methods | |
US9838713B1 (en) | Method for fast transform coding based on perceptual quality and apparatus for the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |