CN113099216B - 编码复杂度评估方法、装置、设备以及存储介质 - Google Patents

编码复杂度评估方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113099216B
CN113099216B CN202110327261.4A CN202110327261A CN113099216B CN 113099216 B CN113099216 B CN 113099216B CN 202110327261 A CN202110327261 A CN 202110327261A CN 113099216 B CN113099216 B CN 113099216B
Authority
CN
China
Prior art keywords
code rate
coding
coding time
time curve
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110327261.4A
Other languages
English (en)
Other versions
CN113099216A (zh
Inventor
张娇娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110327261.4A priority Critical patent/CN113099216B/zh
Publication of CN113099216A publication Critical patent/CN113099216A/zh
Application granted granted Critical
Publication of CN113099216B publication Critical patent/CN113099216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供了一种编码复杂度评估方法、装置、设备、存储介质以及程序产品,涉及编码技术领域。该方法的一具体实施方式包括:确定第一编码器、第二编码器和测试序列集;对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;拟合第一码率‑编码时间曲线和第二码率‑编码时间曲线;在第一码率‑编码时间曲线和第二码率‑编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。该实施方式提高了编码复杂度评估的精准度。

Description

编码复杂度评估方法、装置、设备以及存储介质
技术领域
本公开实施例涉及计算机领域,具体涉及编码技术领域,尤其涉及编码复杂度评估方法、装置、设备、存储介质以及程序产品。
背景技术
在视频编码领域,编码时间越短,表示编码复杂度越低。为了评估两个编码器的编码复杂度,通常需要测试每个编码器的多个码率点,并一一比较两个编码器在多个码率点的编码时间。
然而,同一编码器在不同码率点的编码时间可能相差较大,码率提升的同时往往伴随着编码时间的增大,并且二者之间具有单调性。若比对时两个编码器的码率相差较大,则可能导致编码复杂度的评估误差较大。比如两个编码器A、B,编码器A的码率和编码时间分别为100kbps、10s,编码器B的码率和编码时间分别为200kbps、15s。目前的方法无法在该情况下评估哪个编码器的复杂度更低。
发明内容
本公开实施例提出了一种编码复杂度评估方法、装置、设备、存储介质以及程序产品。
第一方面,本公开实施例提出了一种编码复杂度评估方法,包括:确定第一编码器、第二编码器和测试序列集;对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;根据第一码率集合和第一编码时间集合,拟合第一码率-编码时间曲线,以及根据第二码率集合和第二编码时间集合,拟合第二码率-编码时间曲线;在第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。
第二方面,本公开实施例提出了一种编码复杂度评估装置,包括:确定模块,被配置成确定第一编码器、第二编码器和测试序列集;统计模块,被配置成对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;拟合模块,被配置成根据第一码率集合和第一编码时间集合,拟合第一码率-编码时间曲线,以及根据第二码率集合和第二编码时间集合,拟合第二码率-编码时间曲线;查找模块,被配置成在第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;评估模块,被配置成比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。
第三方面,本公开实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。
第四方面,本公开实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。
第五方面,本公开实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面中任一实现方式描述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开可以应用于其中的示例性系统架构图;
图2是根据本公开的编码复杂度评估方法的一个实施例的流程图;
图3是根据本公开的编码复杂度评估方法的又一个实施例的流程图;
图4是码率-编码时间曲线的示意图;
图5是根据本公开的编码复杂度评估装置的一个实施例的结构示意图;
图6是用来实现本公开实施例的编码复杂度评估方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的编码复杂度评估方法或编码复杂度评估装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送测试序列集等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以提供各种服务。例如,服务器105可以对从终端设备101、102、103获取到的测试序列集进行分析等处理,并生成处理结果(例如编码复杂度)。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开实施例所提供的编码复杂度评估方法一般由服务器105执行,相应地,编码复杂度评估装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本公开的编码复杂度评估方法的一个实施例的流程200。该编码复杂度评估方法包括以下步骤:
步骤201,确定第一编码器、第二编码器和测试序列集。
在本实施例中,编码复杂度评估方法的执行主体(例如图1所示的服务器105)可以确定第一编码器A、第二编码器B和测试序列集V。其中,第一编码器A和第二编码器B可以是需要进行编码复杂度比较的两个不同的编码器。编码器可以通过特定的压缩技术,将某个格式的文件转换为另一种格式的文件。测试序列集V中的一个测试序列可以是一个文件。当应用在视频编码领域时,测试序列集V中的一个测试序列可以是一段视频。
步骤202,对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合。
在本实施例中,对于第一编码器A和第二编码器B,上述执行主体可以分别在各自对应的量化参数集下对测试序列集V进行编码,统计得到第一码率集合RAq、第一编码时间集合TAq、第二码率集合RBq和第二编码时间集合TBq。其中,第一码率集合RAq中的第一码率RAq_i与第一编码时间集合TAq中的第一编码时间TAq_i一一对应。第二码率集合RBq中的第二码率RBq_i与第二编码时间集合TBq中的第二编码时间TBq_i一一对应。RAq_i∈RAq,RBq_i∈RBq。码率(Bit Rate)是单位时间内的编码比特(bit)数,通常用kbps表示。值越大,精度越高,压缩后的文件越接近原始文件。编码时间是编码流所需要的时间。编码时间越短,表示编码复杂度越低。
由于不同编码器的量化参数范围可能不同,因此第一编码器A和第二编码器B需要在各自对应的量化参数范围中选择测试的量化参数集。其中,第一编码器A选择测试的量化参数集qpset_A={qpa1,qpa2,……,qpan},第二编码器B选择测试的量化参数集qpset_B={qpb1,qpb2,……,qpbn},n为不小于4的正整数。
通常,编码器可以在其量化参数范围中等间隔采样量化参数,来得到量化参数集,也可以先在其量化参数范围中选取一个子范围,再在子范围中等间隔采样量化参数,来得到量化参数集。其中,量化参数(Quantizer Parameter,QP)可以用于调节编码空间细节压缩。值越小,量化越精细,图像质量越高,产生的码流也越大。值越大,码率降低,图像失真加强,质量下降。
步骤203,根据第一码率集合和第一编码时间集合,拟合第一码率-编码时间曲线,以及根据第二码率集合和第二编码时间集合,拟合第二码率-编码时间曲线。
在本实施例中,上述执行主体可以根据第一码率集合RAq和第一编码时间集合TAq,拟合第一码率-编码时间曲线LA。同理,根据第二码率集合RBq和第二编码时间集合TBq,拟合第二码率-编码时间曲线LB
第一码率集合RAq中的第一码率RAq_i与第一编码时间集合TAq中的第一编码时间TAq_i一一对应,因此可以将每对第一码率RAq_i和第一编码时间TAq_i作为预设坐标系下的坐标点(RAq_i,TAq_i),拟合第一码率-编码时间曲线LA。其中,横坐标可以为第一码率RAq,纵坐标可以为第一编码时间TAq_i
需要说明的是,拟合第二码率-编码时间曲线LB与拟合第一码率-编码时间曲线LA类似,这里不再赘述。
步骤204,在第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间。
在本实施例中,上述执行主体可以在第一码率-编码时间曲线LA和第二码率-编码时间曲线LB的重合区间内,查找目标码率对应的第一编码时间TA_target和第二编码时间TB_target。其中,重合区间可以是第一码率-编码时间曲线LA和第二码率-编码时间曲线LB的码率(横坐标)重合区间。在码率重合区间上选取一个码率,作为目标码率。在第一码率-编码时间曲线LA上查找目标码率对应的第一编码时间TA_target。同理,在第二码率-编码时间曲线LB上查找目标码率对应的第二编码时间TB_target
步骤205,比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。
在本实施例中,上述执行主体可以比较第一编码时间TA_target和第二编码时间TB_target,评估第一编码器A和第二编码器B的编码复杂度。由于编码时间越短,编码复杂度越低,因此编码复杂度通常以编码时间为评价指标。具体地,若第一编码时间TA_target大于第二编码时间TB_target,则第一编码器的编码复杂度大于第二编码器的编码复杂度。若第一编码时间TA_target等于第二编码时间TB_target,则第一编码器的编码复杂度等于第二编码器的编码复杂度。若第一编码时间TA_target小于第二编码时间TB_target,则第一编码器的编码复杂度小于第二编码器的编码复杂度。
由于不同编码器的量化参数范围可能不同,因此第一编码器和第二编码器需要在各自对应的量化参数集下对测试序列集进行编码。此时,得到的第一编码器和第二编码器的码率通常相差较大,码率非对齐。若直接在不同的码率点比较编码时间,来评估编码器的复杂度,会导致编码复杂度的评估误差较大。而本公开实施例提供的编码复杂度评估方法,根据码率和编码时间拟合第一编码器和第二编码器的码率-编码时间曲线,并找出重合区间。在重合区间找到第一编码器和第二编码器的同一码率点对应的编码时间,从而将码率对齐。基于同一码率点对应的编码时间评估两个编码器的复杂度,提高了编码复杂度评估的精准度。能够应用于码率非对齐的情况下,不同编码器的编码复杂度的评估,扩大了编码复杂度评估方法的应用场景。
进一步参考图3,其示出了根据本公开的编码复杂度评估方法的又一个实施例的流程300。该编码复杂度评估方法包括以下步骤:
步骤301,确定第一编码器、第二编码器和测试序列集。
步骤302,对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合。
在本实施例中,步骤301-302具体操作已在图2所示的实施例中步骤201-202进行了详细的介绍,在此不再赘述。
步骤303,根据第一码率集合和第一编码时间集合,拟合第一码率-编码时间曲线,以及根据第二码率集合和第二编码时间集合,拟合第二码率-编码时间曲线。
在本实施例中,编码复杂度评估方法的执行主体(例如图1所示的服务器105)可以根据第一码率集合RAq和第一编码时间集合TAq,拟合第一码率-编码时间曲线LA。同理,根据第二码率集合RBq和第二编码时间集合TBq,拟合第二码率-编码时间曲线LB
第一码率集合RAq中的第一码率RAq_i与第一编码时间集合TAq中的第一编码时间TAq_i一一对应,因此可以将每对第一码率RAq_i和第一编码时间TAq_i作为预设坐标系下的坐标点(RAq_i,TAq_i),拟合第一码率-编码时间曲线LA。其中,横坐标可以为第一码率RAq,纵坐标可以为第一编码时间TAq_i。通常,拟合曲线可以选择线性函数、指数函数、对数函数、幂函数和多项式等中的至少一项,然后选择确定系数R-square最大的曲线,作为第一码率-编码时间曲线LA。其中,确定系数R-square可以用来表示数据拟合的拟合程度,取值在0~1之间。越接近1,表明数据对模型的拟合程度越好。使用多种函数拟合曲线,选取其中确定系数R-square最大的曲线,能够使坐标点(RAq_i,TAq_i)对最终得到的第一码率-编码时间曲线LA的拟合程度更好。
需要说明的是,拟合第二码率-编码时间曲线LB与拟合第一码率-编码时间曲线LA类似,这里不再赘述。
步骤304,确定第一码率-编码时间曲线和第二码率-编码时间曲线是否存在重合区间。
在本实施例中,上述执行主体可以确定第一码率-编码时间曲线LA和第二码率-编码时间曲线LB是否存在重合区间。若存在重合区间,执行步骤305;若不存在重合区间,执行步骤306。其中,重合区间可以是第一码率-编码时间曲线LA和第二码率-编码时间曲线LB的码率(横坐标)重合区间。
由于重合区间是码率重合区间,其下限可以定义为Rmin,上限可以定义为Rmax。下面提供两种快速确定重合区间的下限Rmin和上限Rmax的方式:
其一,重合区间的下限Rmin是第一码率-编码时间曲线LA的最小码率Min(RAq_i)和第二码率-编码时间曲线LB的最小码率Min(RBq_i)中的最大值,即,Rmin=Max(Min(RAq_i,RBq_i))。重合区间的上限Rmax是第一码率-编码时间曲线LA的最大码率Max(RAq_i)和第二码率-编码时间曲线LB的最大码率Max(RBq_i)中的最小值,即,Rmax=Min(Max(RAq_i,RBq_i))。其中,RAq_i∈RAq,RBq_i∈RBq
其二,重合区间的下限Rmin是第一码率-编码时间曲线LA的最小码率Min(RAq_i)和第二码率-编码时间曲线LB的最小码率Min(RBq_i)中的最小值,即,Rmin=Min(Min(RAq_i,RBq_i))。重合区间的上限Rmax是第一码率-编码时间曲线LA的最大码率Max(RAq_i)和第二码率-编码时间曲线LB的最大码率Max(RBq_i)中的最大值,即,Rmax=Max(Max(RAq_i,RBq_i))。其中,RAq_i∈RAq,RBq_i∈RBq
步骤305,计算重合区间的平均码率,作为目标码率。
在本实施例中,若第一码率-编码时间曲线LA和第二码率-编码时间曲线LB存在重合区间,上述执行主体可以计算重合区间的平均码率Ravg,作为目标码率。
其中,重合区间的平均码率Ravg是重合区间的中值,其计算公式如下:
Ravg=1/2*(Rmin+Rmax)。
为了便于理解,图4示出了码率-编码时间曲线的示意图。如图4所示,上方曲线为第一码率-编码时间曲线LB,下方曲线为第二码率-编码时间曲线LA。重合区间的下限Rmin为第一码率-编码时间曲线LA的最小码率Min(RAq_i),重合区间的上限Rmax为第二码率-编码时间曲线LB的最大码率Max(RBq_i)。重合区间的平均码率Ravg为目标码率,其在第一码率-编码时间曲线LA上对应的点是(Ravg,TA_target),其在第二码率-编码时间曲线LB上对应的点是(Ravg,TB_target)。TA_target为目标码率对应的第一编码时间,TB_target为目标码率对应的第二编码时间。
步骤306,对第一码率-编码时间曲线和/或第二码率-编码时间曲线按照曲线趋势延伸至重叠。
在本实施例中,若第一码率-编码时间曲线LA和第二码率-编码时间曲线LB不存在重合区间,上述执行主体可以对第一码率-编码时间曲线LA和/或第二码率-编码时间曲线LB按照曲线趋势延伸至重叠。
具体地,上述执行主体可以第一码率-编码时间曲线LA和/或第二码率-编码时间曲线LB向对方延伸,直至第一码率-编码时间曲线LA和第二码率-编码时间曲线LB的码率区间存在交集。例如,第一码率-编码时间曲线LA的码率区间是[100,1000],第二码率-编码时间曲线LB的码率区间是[1100,2000]。将第一码率-编码时间曲线LA向第二码率-编码时间曲线LB延伸,直至第一码率-编码时间曲线LA的码率区间为[100,2000]为止。
步骤307,计算延伸后的第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间的平均码率,作为目标码率。
在本实施例中,上述执行主体可以计算延伸后的第一码率-编码时间曲线LA和第二码率-编码时间曲线LB的重合区间的平均码率Ravg,作为目标码率。
需要说明的是,目标码率的计算方式可以参考步骤305,这里不再赘述。
步骤308,查找目标码率对应的第一编码时间和第二编码时间。
步骤309,比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。
在本实施例中,步骤308-309具体操作已在图2所示的实施例中步骤204-205进行了详细的介绍,在此不再赘述。
步骤310,分别获取第一编码器和第二编码器的编码失真和码率大小。
在本实施例中,上述执行主体可以分别获取第一编码器和第二编码器的编码失真和码率大小。
通常,上述执行主体利用第一编码器和第二编码器分别在各自对应的量化参数集下对测试序列集进行编码时,可以计算BD-Rate、PSNR和SSIM。其中,BD-Rate(Bjontegaard-Delta)是评价视频编码算法性能的主要参数之一,表示新算法编码的视频相对于原来的算法在码率和失真上的变化情况。值为负时,表示相同失真下,码率减少,编码器的性能提高。因此,BD-rate可以用来综合评估编码失真和码率大小,即相同失真下的相对码率差异。PSNR(peak signal to noise ratio,峰值信噪比)是一种视频质量的评价指标,压缩后PSNR越大,表明压缩带来的失真越小。SSIM(structural similarity inde,结构相似性)和PSNR类似,也是一种视频质量的评价指标,和PSNR相比,SSIM算法在设计上考虑了人眼的视觉特性,更符合人眼视觉感知。因此,PSNR和SSIM通常是编码失真的评价指标。码率大小通常以单位时间内码流的大小为评价指标。
步骤311,基于第一编码器和第二编码器的编码失真、码率大小和编码复杂度,评价第一编码器和第二编码器的性能。
在本实施例中,上述执行主体可以从编码失真、码率大小和编码复杂度三个方面对第一编码器和第二编码器进行评价,得到第一编码器和第二编码器的性能。
从图3中可以看出,与图2对应的实施例相比,本实施例中的编码复杂度评估方法突出了目标码率选取步骤和编码器性能评价步骤。由此,本实施例描述的方案对于存在重合区间的情况,直接计算重合区间的目标码率;对于不存在重合区间的情况,先延伸至存在重合区间,再计算重合区间的目标码率,适用于任意两个编码器的目标码率选取,应用场景更加广泛。并且,选取重合区间的均值作为目标码率,均值相对于重合区间上的其他点更具有代表性,使得选取查找到的对应的编码时间能够更准确地表达编码器的编码复杂度。从编码失真、码率大小和编码复杂度三个方面对第一编码器和第二编码器进行评价,实现了更精准的编码器的整体评估。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种编码复杂度评估装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的编码复杂度评估装置500可以包括:确定模块501、统计模块502、拟合模块503、查找模块504和评估模块505。其中,确定模块501,被配置成确定第一编码器、第二编码器和测试序列集;统计模块502,被配置成对于第一编码器和第二编码器,分别在各自对应的量化参数集下对测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;拟合模块503,被配置成根据第一码率集合和第一编码时间集合,拟合第一码率-编码时间曲线,以及根据第二码率集合和第二编码时间集合,拟合第二码率-编码时间曲线;查找模块504,被配置成在第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;评估模块505,被配置成比较第一编码时间和第二编码时间,评估第一编码器和第二编码器的编码复杂度。
在本实施例中,编码复杂度评估装置500中:确定模块501、统计模块502、拟合模块503、查找模块504和评估模块505的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-205的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,拟合模块503进一步被配置成:利用线性函数、指数函数、对数函数、幂函数和多项式中的至少一项拟合曲线;选择确定系数最大的曲线,作为第一码率-编码时间曲线。
在本实施例的一些可选的实现方式中,查找模块504进一步被配置成:若第一码率-编码时间曲线和第二码率-编码时间曲线存在重合区间,计算重合区间的平均码率,作为目标码率。
在本实施例的一些可选的实现方式中,查找模块504进一步被配置成:若第一码率-编码时间曲线和第二码率-编码时间曲线不存在重合区间,对第一码率-编码时间曲线和/或第二码率-编码时间曲线按照曲线趋势延伸至重叠;计算延伸后的第一码率-编码时间曲线和第二码率-编码时间曲线的重合区间的平均码率,作为目标码率。
在本实施例的一些可选的实现方式中,重合区间的下限是第一码率-编码时间曲线的最小码率和第二码率-编码时间曲线的最小码率中的最大值,重合区间的上限是第一码率-编码时间曲线的最大码率和第二码率-编码时间曲线的最大码率中的最小值;或者重合区间的下限是第一码率-编码时间曲线的最小码率和第二码率-编码时间曲线的最小码率中的最小值,重合区间的上限是第一码率-编码时间曲线的最大码率和第二码率-编码时间曲线的最大码率中的最大值。
在本实施例的一些可选的实现方式中,编码复杂度评估装置500还包括:获取模块,被配置成分别获取第一编码器和第二编码器的编码失真和码率大小;评价模块,被配置成基于第一编码器和第二编码器的编码失真、码率大小和编码复杂度,评价第一编码器和第二编码器的性能。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如编码复杂度评估方法。例如,在一些实施例中,编码复杂度评估方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的编码复杂度评估方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行编码复杂度评估方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (12)

1.一种编码复杂度评估方法,包括:
确定第一编码器、第二编码器和测试序列集;
对于所述第一编码器和所述第二编码器,分别在各自对应的量化参数集下对所述测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;
根据所述第一码率集合和所述第一编码时间集合,拟合第一码率-编码时间曲线,以及根据所述第二码率集合和所述第二编码时间集合,拟合第二码率-编码时间曲线;
在所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;
比较所述第一编码时间和所述第二编码时间,评估所述第一编码器和所述第二编码器的编码复杂度;
其中,所述在所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间,包括:
若所述第一码率-编码时间曲线和所述第二码率-编码时间曲线不存在重合区间,对所述第一码率-编码时间曲线和/或所述第二码率-编码时间曲线按照曲线趋势延伸至重叠;
计算延伸后的所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间的平均码率,作为所述目标码率。
2.根据权利要求1所述的方法,其中,所述根据所述第一码率集合和所述第一编码时间集合,拟合第一码率-编码时间曲线,包括:
利用线性函数、指数函数、对数函数、幂函数和多项式中的至少一项拟合曲线;
选择确定系数最大的曲线,作为所述第一码率-编码时间曲线。
3.根据权利要求1所述的方法,其中,所述在所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间,包括:
若所述第一码率-编码时间曲线和所述第二码率-编码时间曲线存在重合区间,计算重合区间的平均码率,作为所述目标码率。
4.根据权利要求1所述的方法,其中,
所述重合区间的下限是所述第一码率-编码时间曲线的最小码率和所述第二码率-编码时间曲线的最小码率中的最大值,所述重合区间的上限是所述第一码率-编码时间曲线的最大码率和所述第二码率-编码时间曲线的最大码率中的最小值;或者
所述重合区间的下限是所述第一码率-编码时间曲线的最小码率和所述第二码率-编码时间曲线的最小码率中的最小值,所述重合区间的上限是所述第一码率-编码时间曲线的最大码率和所述第二码率-编码时间曲线的最大码率中的最大值。
5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:
分别获取所述第一编码器和第二编码器的编码失真和码率大小;
基于所述第一编码器和第二编码器的编码失真、码率大小和编码复杂度,评价所述第一编码器和所述第二编码器的性能。
6.一种编码复杂度评估装置,包括:
确定模块,被配置成确定第一编码器、第二编码器和测试序列集;
统计模块,被配置成对于所述第一编码器和所述第二编码器,分别在各自对应的量化参数集下对所述测试序列集进行编码,统计得到第一码率集合、第一编码时间集合、第二码率集合和第二编码时间集合;
拟合模块,被配置成根据所述第一码率集合和所述第一编码时间集合,拟合第一码率-编码时间曲线,以及根据所述第二码率集合和所述第二编码时间集合,拟合第二码率-编码时间曲线;
查找模块,被配置成在所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间内,查找目标码率对应的第一编码时间和第二编码时间;
评估模块,被配置成比较所述第一编码时间和所述第二编码时间,评估所述第一编码器和所述第二编码器的编码复杂度;
其中,所述查找模块进一步被配置成:
若所述第一码率-编码时间曲线和所述第二码率-编码时间曲线不存在重合区间,对所述第一码率-编码时间曲线和/或所述第二码率-编码时间曲线按照曲线趋势延伸至重叠;
计算延伸后的所述第一码率-编码时间曲线和所述第二码率-编码时间曲线的重合区间的平均码率,作为所述目标码率。
7.根据权利要求6所述的装置,其中,所述拟合模块进一步被配置成:
利用线性函数、指数函数、对数函数、幂函数和多项式中的至少一项拟合曲线;
选择确定系数最大的曲线,作为所述第一码率-编码时间曲线。
8.根据权利要求6所述的装置,其中,所述查找模块进一步被配置成:
若所述第一码率-编码时间曲线和所述第二码率-编码时间曲线存在重合区间,计算重合区间的平均码率,作为所述目标码率。
9.根据权利要求6所述的装置,其中,
所述重合区间的下限是所述第一码率-编码时间曲线的最小码率和所述第二码率-编码时间曲线的最小码率中的最大值,所述重合区间的上限是所述第一码率-编码时间曲线的最大码率和所述第二码率-编码时间曲线的最大码率中的最小值;或者
所述重合区间的下限是所述第一码率-编码时间曲线的最小码率和所述第二码率-编码时间曲线的最小码率中的最小值,所述重合区间的上限是所述第一码率-编码时间曲线的最大码率和所述第二码率-编码时间曲线的最大码率中的最大值。
10.根据权利要求6-9之一所述的装置,其中,所述装置还包括:
获取模块,被配置成分别获取所述第一编码器和第二编码器的编码失真和码率大小;
评价模块,被配置成基于所述第一编码器和第二编码器的编码失真、码率大小和编码复杂度,评价所述第一编码器和所述第二编码器的性能。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
CN202110327261.4A 2021-03-26 2021-03-26 编码复杂度评估方法、装置、设备以及存储介质 Active CN113099216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110327261.4A CN113099216B (zh) 2021-03-26 2021-03-26 编码复杂度评估方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110327261.4A CN113099216B (zh) 2021-03-26 2021-03-26 编码复杂度评估方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113099216A CN113099216A (zh) 2021-07-09
CN113099216B true CN113099216B (zh) 2023-03-24

Family

ID=76670124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110327261.4A Active CN113099216B (zh) 2021-03-26 2021-03-26 编码复杂度评估方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113099216B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108419081A (zh) * 2018-03-28 2018-08-17 佛山市顺德区中山大学研究院 一种基于特征的帧间编码方法
CN111246219A (zh) * 2020-01-17 2020-06-05 南华大学 一种vvc帧内cu深度快速划分方法
CN111953966A (zh) * 2020-08-11 2020-11-17 广州市百果园信息技术有限公司 一种编码测试的方法、装置、服务器和存储介质
CN112243123A (zh) * 2019-07-16 2021-01-19 四川大学 一种基于无损编码的hevc码率优化方法
CN112312135A (zh) * 2020-10-23 2021-02-02 广州市百果园网络科技有限公司 一种视频发布方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108419081A (zh) * 2018-03-28 2018-08-17 佛山市顺德区中山大学研究院 一种基于特征的帧间编码方法
CN112243123A (zh) * 2019-07-16 2021-01-19 四川大学 一种基于无损编码的hevc码率优化方法
CN111246219A (zh) * 2020-01-17 2020-06-05 南华大学 一种vvc帧内cu深度快速划分方法
CN111953966A (zh) * 2020-08-11 2020-11-17 广州市百果园信息技术有限公司 一种编码测试的方法、装置、服务器和存储介质
CN112312135A (zh) * 2020-10-23 2021-02-02 广州市百果园网络科技有限公司 一种视频发布方法、装置、计算机设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JVET-D0068,AHG8: A study on the influence of different projection schemes;SUN yule等;《Joint Video Exploration Team (JVET) Joint Video Exploration Team (JVET)》;20161021;全文 *
基于分级B预测结构的快速多视点深度编码算法;马祥等;《华南理工大学学报(自然科学版)》;20130915(第09期);全文 *
基于方向梯度的H.264帧内预测模式选择算法;宋云等;《计算机学报》;20130815;第36卷(第08期);全文 *
基于自适应量化矩阵的硬判决量化算法;李瑞阳等;《电视技术》;20170919;全文 *

Also Published As

Publication number Publication date
CN113099216A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
US11490084B2 (en) Method and apparatus for adjusting quantization parameter for adaptive quantization
CN112488060B (zh) 目标检测方法、装置、设备和介质
US11861498B2 (en) Method and apparatus for compressing neural network model
CN113014922B (zh) 模型训练、视频编码方法,装置,设备以及存储介质
CN113642710A (zh) 一种网络模型的量化方法、装置、设备和存储介质
CN113052063A (zh) 置信度阈值选择方法、装置、设备以及存储介质
CN113099216B (zh) 编码复杂度评估方法、装置、设备以及存储介质
CN116567246A (zh) Avc编码方法和装置
US20240073420A1 (en) Data processing method and apparatus
CN114842066A (zh) 图像深度识别模型训练方法、图像深度识别方法及装置
CN113033373A (zh) 用于训练人脸识别模型及识别人脸的方法及相关装置
CN112651453A (zh) 损失函数的自适应方法、装置、设备和存储介质
CN113271462B (zh) 视频编码算法的评价方法及装置、计算机设备及介质
CN113099231B (zh) 确定亚像素插值位置的方法、装置、电子设备和存储介质
CN117615137B (zh) 一种视频处理方法、装置、设备以及存储介质
CN113407844B (zh) 小程序框架的版本推荐方法、装置、设备以及存储介质
CN117392416A (zh) 多目标优化方法、装置、设备以及存储介质
CN115546701A (zh) 匹配特征确定方法、装置及电子设备
CN117994833A (zh) 人脸视频生成方法、装置及电子设备
CN114501026A (zh) 视频编码方法、装置、设备及存储介质
CN115086649A (zh) 一种编解码算法性能测试方法、装置、电子设备及介质
CN114816083A (zh) 应用于预测输入字符的模型训练方法和预测方法
CN115729957A (zh) 一种基于最大信息系数的未知流特征选择方法及装置
CN115700745A (zh) 视频质量的评价方法、装置、设备及存储介质
CN116668692A (zh) 视频编码方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant