CN114241350B - 视频编码测试序列确定方法、相关装置及计算机程序产品 - Google Patents
视频编码测试序列确定方法、相关装置及计算机程序产品 Download PDFInfo
- Publication number
- CN114241350B CN114241350B CN202111319210.3A CN202111319210A CN114241350B CN 114241350 B CN114241350 B CN 114241350B CN 202111319210 A CN202111319210 A CN 202111319210A CN 114241350 B CN114241350 B CN 114241350B
- Authority
- CN
- China
- Prior art keywords
- video
- target
- class
- distribution
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 157
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004590 computer program Methods 0.000 title abstract description 15
- 238000011056 performance test Methods 0.000 claims abstract description 17
- 238000010276 construction Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012812 general test Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开提供了一种视频编码测试序列确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及视频编码、编码器性能测试等媒体云技术领域。该方法包括:确定与目标业务需求对应的包含多个备选视频的备选视频集;将各备选视频按所属内容类别进行分类,得到目标内容类别分布;将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;基于各目标类代表视频,构建目标视频编码测试序列。该方法通过该目标视频编码测试序列得以提升待测编码器对业务特化视频的编码性能的评测针对性、准确性。
Description
技术领域
本公开涉及图像处理技术领域,具体涉及视频编码、编码器性能测试等媒体云技术领域,尤其涉及一种视频编码测试序列确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
在优化视频编码器或评估视频编码器的性能时,需在一组通用测试序列上进行测试(类似于评估各种人工智能算法时使用到的测试集)。
目前的视频编码测试序列主要使用的是编码标准提案中的通用测试序列(即JCTVC视频)。如H.265标准所使用的测试序列见文档《JCTVC-L1100》。这些测试序列涵盖了视频的基本特征,如不同的分辨率,不同的帧率,镜头采集视频以及计算机制作视频等。
也正是由于这些通用测试序列要保证全面性,因而在某些业务特化的场景下,无法准确的确定编码器的实际性能。
发明内容
本公开实施例提出了一种视频编码测试序列确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
第一方面,本公开实施例提出了一种视频编码测试序列确定方法,包括:确定与目标业务需求对应的包含多个备选视频的备选视频集;将各备选视频按所属内容类别进行分类,得到目标内容类别分布;将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;基于各目标类代表视频,构建目标视频编码测试序列。
第二方面,本公开实施例提出了一种视频编码测试序列确定装置,包括:备选视频确定单元,被配置成确定与目标业务需求对应的包含多个备选视频的备选视频集;按内容类别分类单元,被配置成将各备选视频按所属内容类别进行分类,得到目标内容类别分布;按编码复杂度聚类单元,被配置成将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;目标类代表视频选取单元,被配置成分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;目标视频编码测试序列构建单元,被配置成基于各目标类代表视频,构建目标视频编码测试序列。
第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的视频编码测试序列确定方法。
第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的视频编码测试序列确定方法。
第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的视频编码测试序列确定方法。
本公开实施例提供的视频编码测试序列确定方法包括:确定与目标业务需求对应的包含多个备选视频的备选视频集;将各备选视频按所属内容类别进行分类,得到目标内容类别分布;将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;基于各目标类代表视频,构建目标视频编码测试序列。
本公开所提供方案在通用编码测试序列的基础上,结合了与业务需求对应的多个备选视频在内容类别上的分布和按预设编码复杂度的聚类情况,通过控制在每个聚类得到的视频类中选取出的类代表视频的实际内容类别分布与各备选视频的真实内容类别分布一致,得到在内容类别、编码复杂度上反映业务需求的目标类待代表视频,最终得到额外加入目标类代表视频的目标视频编码测试序列。通过该目标视频编码测试序列得以提升待测编码器对业务特化视频的编码性能的评测针对性、准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性系统架构;
图2为本公开实施例提供的一种视频编码测试序列确定方法的流程图;
图3为本公开实施例提供的视频编码测试序列确定方法中一种按预设编码复杂度进行聚类的方法的流程图;
图4为本公开实施例提供的视频编码测试序列确定方法中一种确定目标类代表视频的方法的流程图;
图5为本公开实施例提供的视频编码测试序列确定方法中另一种确定目标类代表视频的方法的流程图;
图6为本公开实施例提供的一种视频编码测试序列确定装置的结构框图;
图7为本公开实施例提供的一种适用于执行视频编码测试序列确定方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图1示出了可以应用本公开的视频编码测试序列确定方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如视频编码测试序列构建类应用、视频编码性能计算类应用、即时通讯类应用等。
终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
服务器105通过内置的各种应用可以提供各种服务,以用于为业务特化视频提供针对性编码性能测试的视频编码测试序列生成服务的视频编码测试序列构建类应用为例,服务器105在运行视频编码测试序列构建类应用时可实现如下效果:首先,通过网络104分别从终端设备101、102、103中收集与目标业务需求对应的包含多个备选视频,汇总得到备选视频集;然后,将各备选视频按所属内容类别进行分类,得到目标内容类别分布;接下来,将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;下一步,分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;最后,基于各目标类代表视频,构建目标视频编码测试序列。
进一步的,服务器105还可以将构建得到的目标视频编码测试序列建立与目标业务需求之间的对应关系,并提供给待测编码器进行针对此类业务视频的编码性能测试,进而得到针对性的编码性能测试结果。
需要指出的是,与目标业务需求对应的多个备选视频除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时,可选择直接从本地获取这些数据,在此种情况下,示例性系统架构100也可以不包括终端设备101、102、103和网络104。
由于综合编码复杂度和内容类别分类需要占用较多的运算资源和较强的运算能力,因此本公开后续各实施例所提供的视频编码测试序列确定方法一般由拥有较强运算能力、较多运算资源的服务器105来执行,相应地,视频编码测试序列确定装置一般也设置于服务器105中。但同时也需要指出的是,在终端设备101、102、103也具有满足要求的运算能力和运算资源时,终端设备101、102、103也可以通过其上安装的视频编码测试序列构建类应用完成上述本交由服务器105做的各项运算,进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下,但视频编码测试序列构建类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时,可以让终端设备来执行上述运算,从而适当减轻服务器105的运算压力,相应的,视频编码测试序列确定装置也可以设置于终端设备101、102、103中。在此种情况下,示例性系统架构100也可以不包括服务器105和网络104。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,图2为本公开实施例提供的一种视频编码测试序列确定方法的流程图,其中流程200包括以下步骤:
步骤201:确定与目标业务需求对应的包含多个备选视频的备选视频集;
本步骤旨在由视频编码测试序列确定方法的执行主体(例如图1所示的服务器105)确定与目标业务需求对应的包含多个备选视频的备选视频集。
根据是否符合目标业务需求,可将所有类型的视频分为两类,即分为符合目标业务需求的一类视频、不符合目标业务需求的另一类视频,本步骤旨在将符合目标业务需求的视频命名为备选视频,并将数量级足够的备选视频构建为备选视频集。
具体的,目标业务需求可以从视频属性的多个方面进行定义,例如将分辨率超过2K(即2560×1440)的视频确定为符合目标业务需求的视频,此时的目标业务需求就是对最低分辨率进行限制,又例如将视频长度超过5分钟、小于10分钟的中等长度视频确定为符合目标业务需求的视频,此时的目标业务需求就是对视频时长进行了限制,除上述示出的分辨率和时长外,也可以根据实际业务关注的属性来自定义目标业务需求,并根据定义的目标业务需求来确定与之对应的备选视频。
具体的,备选视频的获取途径可以从自有视频库选取得到,也可以面向自身受众发起征稿活动获得,以期尽可能的与自身业务需求相对应。
步骤202:将各备选视频按所属内容类别进行分类,得到目标内容类别分布;
在步骤201的基础上,本步骤旨在由上述执行主体将各备选视频按视频内容所属的类别进行分类,得到目标内容类别分布。即该目标内容类别分布体现了各备选视频在不同内容类别上的真实数量比。
具体的,根据视频内容所进行的类别划分,可以通过多种方式进行,例如从每个备选视频中抽取出至少一帧关键帧,然后通过图像识别技术确定关键帧所呈现图像内容所属的内容种类,可以根据实际应用场景预先划分出多个不同的内容类别,例如按照视频生成形式划分为电影类、动漫(动画)类、个人记实类等,也可以按照画面复杂度划分为:静态物体类、打斗类、风景类等等。
假定预先将所有备选视频按内容类别划分为4类,总数为10000的备选视频在这4个类上的目标内容类别分布可以表现为:6000:2000:1000:1000,化简后为:6:2:1:1。
步骤203:将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;
在步骤201的基础上,本步骤旨在由上述执行主体将各备选视频按预设编码复杂度的大小进行聚类,以得到经聚类操作后得到的多个视频类。即每个视频类均围绕该类的聚类中心的多个在预设编码复杂度上存在关联的多个备选视频。由于进行聚类的目的是为了选取出每个视频类的类代表视频,因此聚类中心数也可以事先根据构成目标视频编码测试序列中的与目标业务需求对应的业务特化测试视频数,该业务特化测试视频数也可以以通用测试视频数为基准确定得到,例如控制两者的数量比例为1:1或业务特化测试视频数对序列的总数占比大于通用测试视频数对序列总数的占比,大于幅度可以根据实际情况灵活设置,例如控制业务特化测试视频数与通过用测试视频数的比例为:3:2等。
具体的,在给定聚类中心数的情况下,本步骤可通过多种方式实现聚类,例如通过K-means聚类算法,或其它效果相同或类似的聚类算法,此处不做具体限定。
步骤204:分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;
在步骤202和步骤203的基础上,本步骤旨在由上述执行主体从每个视频类中选取出一个能够尽可能准确代表所在视频类的类代表视频,并控制所选取出的各类代表视频的实际内容类别分布与目标内容类别分布一致,经符合这些要求的类代表视频作为目标类代表视频。
需要说明的是,之所以要控制实际内容类别分布与目标内容类别分布一致,是为了使所选取出的类代表视频能够有效的代表数量庞大的所有备选视频,因此通过控制所有备选视频的内容类别分布与各类代表视频的内容类别相同,进而使得各类代表视频能够在内容类别分布上与所有备选视频保持一致,而不是存在较大的偏差。
具体的,如何使得从每个视频类选取出的类代表视频能够使其实际内容类别分布与目标内容类别分布一致,可通过多种方式,但需要控制选取出的类代表视频应当能够足够代表所属的视频类。
步骤205:基于各目标类代表视频,构建目标视频编码测试序列。
在步骤204的基础上,本步骤旨在由上述执行主体基于各目标类代表视频,构建目标视频编码测试序列。即在通用测试视频的基础上,额外加入各目标类代表视频,进而得到包括目标类代表视频和通用测试视频的目标视频编码测试序列。具体的,各视频如何排列得到该目标视频编码测试序列可根据实际应用场景下所有可能存在的制约因素来确定,此处不做具体限定。
本公开实施例提供的视频编码测试序列确定方法,在通用编码测试序列的基础上,结合了与业务需求对应的多个备选视频在内容类别上的分布和按预设编码复杂度的聚类情况,通过控制在每个聚类得到的视频类中选取出的类代表视频的实际内容类别分布与各备选视频的真实内容类别分布一致,得到在内容类别、编码复杂度上反映业务需求的目标类待代表视频,最终得到额外加入目标类代表视频的目标视频编码测试序列。通过该目标视频编码测试序列得以提升待测编码器对业务特化视频的编码性能的评测针对性、准确性。
请参考图3,图3为本公开实施例提供的视频编码测试序列确定方法中一种按预设编码复杂度进行聚类的方法的流程图,即针对图2所示的流程200中的步骤203提供了一种具体的实现方式,流程200中的其它步骤并不做调整,也将本实施例所提供的具体实现方式以替换步骤203的方式得到一个新的完整实施例,其中流程300包括以下步骤:
步骤301:基于预设的锚点视频,分别计算每个备选视频的BD-rate参数,得到每个备选视频在视频编码过程中的率失真性能参数;
BD-rate:Bjontegaard-Delta-rate,是评价视频编码算法性能的主要参数之一,表示新算法编码的视频相对于原来的算法在码率和PSNR(Peak Signal to Noise Ratio,峰值信噪比,一种视频质量的评价指标,压缩后PSNR越大,表明压缩带来的失真越小)上的变化情况,因其主要用于评价视频编码的率失真性能,因此本步骤将其称为率失真性能参数。
在视频编码中,码率低表示压缩量大,PSNR值高表示客观质量好。因此,对于一种编码算法,如果压缩视频码率降低、PSNR值提高,那么该算法具有良好的性能。但是通常视频编码算法在提高压缩量的同时会损失压缩质量,即码率减小的同时PSNR值也减小,此时就需要使用BD-rate进行衡量。
步骤302:获取与目标业务需求对应的业务特化测试视频数,并将业务特化测试视频数作为聚类中心数;
本步骤旨在由上述执行主体将获取到的业务特化测试视频的数量(即业务特化测试视频数)作为后续聚类操作的指定聚类中心数。
由于进行聚类的目的是为了选取出每个视频类的类代表视频,因此聚类中心数也可以事先根据构成目标视频编码测试序列中的与目标业务需求对应的业务特化测试视频数,该业务特化测试视频数也可以以通用测试视频数为基准确定得到,例如控制两者的数量比例为1:1或业务特化测试视频数对序列的总数占比大于通用测试视频数对序列总数的占比,大于幅度可以根据实际情况灵活设置,例如控制业务特化测试视频数与通过用测试视频数的比例为:3:2等。
步骤303:将各备选视频按对应的率失真性能参数的大小进行聚类,得到数量为聚类中心数的多个视频类。
在步骤302的基础上,本步骤旨在由上述执行主体将各备选视频按对应的率失真性能参数的大小进行聚类,得到数量为聚类中心数的多个视频类。
在上述实施例的基础上,本实施例通过步骤301-步骤303为流程200中的步骤203提供了一种具体实现方式,具体的选用了BD-rate作为每个备选视频的预设编码复杂度的计算方式,然后基于获取到的业务特化测试视频数来确定聚类操作的聚类中心数,最终通过执行聚类操作确定出多个视频类。
应当理解的是,除本实施例所给出的BD-rate可作为预设编码复杂度外,也可以采用其它能够表征视频在时域和空余上的复杂度的其它参数,此处不做具体限定。
请参考图4,图4为本公开实施例提供的视频编码测试序列确定方法中一种确定目标类代表视频的方法的流程图,即针对图2所示的流程200中的步骤204提供了一种具体的实现方式,流程200中的其它步骤并不做调整,也将本实施例所提供的具体实现方式以替换步骤204的方式得到一个新的完整实施例,其中流程400包括以下步骤:
步骤401:将每个视频类中具有最接近聚类中心的实际预设编码复杂度的备选视频,确定为相应视频类的初始类代表视频;
出于为使选取出的视频最能够代表每个视频类,本步骤将具有最接近聚类中心的实际综合编码的备选视频确定为相应视频类的初始类代表视频。
可知,聚类中心实际上也是一个有具体值的预设编码复杂度,该聚类中心值的计算方式有多种,例如求取均值或其它能够作为类中心的计算方式,因此通过求取每个视频类中的备选视频的实际预设编码复杂度与聚类中心的数值差或距离,就可以确定出最接近聚类中心的备选视频。进而根据离聚类中心越近、越能代表该视频类的原则,将其确定为相应食品类的初始类代表视频。
步骤402:将各初始类代表视频按所属内容类别进行分类,得到初始内容类别分布;
在步骤401的基础上,本步骤旨在由上述执行主体参考步骤202的分类操作,将各初始类代表视频按所属内容类别进行分类,得到初始内容类别分布。
步骤403:响应于初始内容类别分布与目标内容类别分布不一致,确定导致初始内容类别分布与目标内容类别分布不一致的目标视频类;
本步骤针对初始内容类别分布与目标内容类别分布不一致的情况,旨在由上述执行主体确定导致初始内容类别分布与目标内容类别分布不一致的目标视频类。
需要明确的是,在不一致的情况下,目标视频类必然不会单一出现,至少会同时出现两个视频类,即其中一个视频类的数量多、另一个视频类的数量少。此时还可以将目标视频类再细分为:数量偏多的第一目标视频类、数量偏少的第二目标视频类。
步骤404:将目标视频类中使对应的内容类别分布与目标内容类别分布一致的备选视频确定为目标类代表视频。
在步骤403的基础上,本步骤旨在由上述执行主体将目标视频类中使对应的内容类别分布与目标内容类别分布一致的备选视频确定为目标类代表视频。即通过重新选取新的类代表视频的方式来使实际内容类别分布与目标内容类别分布一致。
具体的,重新选取或选取出目标类代表视频的方式有多种,包括随时选取、按距聚类中心距离从小到大逐渐尝试、在第一目标视频类中选取距第二目标视频类的聚类中心较近的方式等。
在上述实施例的基础上,本实施例通过步骤401-步骤404为流程200中的步骤203提供了一种具体实现方式,以从每个视频类中先选取距聚类中心最接近的备选视频作为代表该视频类的类代表视频作为初始操作,并在初始类代表视频对应的内容类别分布与目标内容类别分布不一致时,来通过重新选取的方式来使两者一致,最终得到目标类代表视频。
请参考图5,图5为本公开实施例提供的视频编码测试序列确定方法中另一种确定目标类代表视频的方法的流程图,即针对图4所示的流程400中的步骤404提供了一种具体的实现方式,流程400中的其它步骤并不做调整,也将本实施例所提供的具体实现方式以替换步骤404的方式得到一个新的完整实施例,其中流程500包括以下步骤:
步骤501:根据与目标视频类的聚类中心的接近程度,确定目标视频类中各备选视频应被选取为新的类代表视频的选取次序;
即该选取次序应表现为越接近聚类中心、选取次序越靠前,越接近聚类中心、选取次序越靠后。若最接近聚类中心的初始类代表视频无法使实际内容类别分布与目标内容类别分布一致,按本步骤所提供的指导思想,再下一次重新选取时应将次接近聚类中心的备选视频作为下一次的类代表视频来再次验证。
步骤502:响应于根据选取次序选取出的新的类代表视频仍使当前的内容类别分布仍与目标内容类别分布不一致,根据选取次序更换新的类代表视频直至使对应的内容类别分布与目标内容类别分布一致;
本步骤针对根据选取次序选取出的新的类代表视频仍使当前的内容类别分布仍与目标内容类别分布不一致的情况,旨在由上述执行主体根据选取次序更换新的类代表视频直至使对应的内容类别分布与目标内容类别分布一致。即不断的按照选取次序尝试,直至尝试到可使当前的内容类别分布与目标内容类别分布一致结束。
步骤503:将目标视频类中使对应的内容类别分布与目标内容类别分布一致的新的类代表视频确定为目标类代表视频。
即本实施例针对流程400中步骤404提及的按距聚类中心距离从小到大逐渐尝试的原理,给出了一种具体的实现方式,通过本实施例的重新选取方式可以尽可能的保证每个目标类代表视频能够尽可能的代表所属的视频类。
同理,为了减少尝试次数,还可以在第一目标视频类中选取距第二目标视频类的聚类中心较近的方式,来有倾向性的、耗费少量次数的尝试来减少确定出目标类代表视频所需耗时的目的。
为加深理解,本公开还结合一个具体应用场景,给出了一种具体的实现方案:
本实施例想要构建的目标视频编码测试序列包含了两个部分:JCTVC序列(即通用测试视频)和包含了基于业务场景筛选出的业务特化测试视频构成业务特化序列,以使其既能涵盖视频标准所囊括的视频基础特征,又能较好地反映出业务场景中的视频特征,进而使得最终测试出的视频编码器的性能能较好的匹配实际业务视频。
本实例的核心技术点为从庞大的业务视频候选集(即包含数万个备选视频)中选取最具有代表性的部分视频(数十个类代表视频),以期通过精简测试序列数量的方式来提高测试效率,以及提高测试序列与实际业务的相关性。
主要实现流程包括:
1)确定JCTVC序列与业务特化序列中视频数量比例为N:M(例如可以设定为1:1),由此确定业务特化测试视频的数量为X,以及待构建的目标视频编码测试序列所包含的视频总数为Y;
2)分析与实际业务场景对应的数万个备选视频的视频特征,包括底层特征即视频综合复杂度,以及上层特征即视频内容的所属类别,确定两特征的分布;
2-1)计算每个备选视频的综合编码复杂度
综合编码复杂度体现了备选视频在空域和时域上的综合复杂度,可具体采用如下计算方式:
①用特定编码器(如x264)对所有备选视频采用相同编码模式进行多码率点编码(如cqp模式,qp=22/27/32/37这4个码率点),记录每个码率点的码率与失真,将码率按视频的分辨率和帧率进行归一化;
②选取某特定视频,以此作为anchor视频(即锚点视频,也可以理解为基础视频),将所有备选业务视频作为test视频(测试视频,以基础视频为计算基础)计算BD-rate,则视频的综合编码复杂度Complexity=BD-rate+100。Complexity的取值范围数值为(0,+∞),数值越大则表明该视频复杂度越高,反之则表明该视频复杂度越低。
需注意,在计算BD-rate时,需采用“完全覆盖”模式,即将anchor与test视频的两条RD曲线做插值延长直至两曲线在失真维度上完全重合;
③计算出各备选视频的综合复杂度后,按数值进行排序,并等分为X类,该X即为1)中所得最终测试序列中业务视频的个数。
2-2)备选视频内容的所属类别
①根据实际业务,确定类型标签,如可将所有备选视频分为动画,电影,体育,游戏,音乐,教育,其他等N类;
②利用人工智能技术对各备选视频的视频内容进行分析,确定每个视频所属的类别,并统计出各内容类别对应的视频数,并根据各类别视频数计算出不同类别之间的目标内容类别分布。
3)依据备选视频的特征分布,进行业务特化测试视频的筛选。
①依据综合编码复杂度,找出每一类复杂度的聚类中心(即每一类排序中间位置处)视频,共组成X个视频,作为初始的业务特化序列;
②根据各类别视频数计算出不同类别之间的目标内容类别分布,对业务特化序列中的类代表视频进行调整,即剔除数量或占比超出目标内容类别分布情况的类代表视频,并从通过一类的聚类中心附近重新选取新的类代表视频填补至数量或占比小于目标内容类别分布情况的内容类别,直至调整后的业务特化序列中包含的各类代表视频的实际内容类别分布与目标内容类别分布一致。
③人工查看选出的业务特化序列,剔除存在主观异常的视频(如存在对焦模糊、颜色异常、亮度过曝等),并用同一复杂度且同一类场景的主观无异常视频进行替换。
为便于理解,此处举例说明:
1)在JCTVC视频数量为24、设定N:M=1:1的情况下,可知业务特化序列中的视频数量也为24;
2)分别确定数万个与业务需求对应的每个备选视频所属的内容类别分布,假定预设划分为7类,统计得到这7类的视频数比例为4:2:2:1:1:1:1,因此在总数为24的情况下,每类视频最终选取的数量为8,4,4,2,2,2,2个;
3)计算所有业务特化测试视频的综合编码复杂度,并按照大小和为24的指定聚类中心数,得到24个视频类;
4)根据每个视频类的聚类中心,将最接近聚类中心的备选视频确定为该视频类的类代表视频,假定此时与24个类代表视频对应的内容类别分布为:9:4:4:2:2:2:1,与步骤2)统计得到8:4:4:2:2:2:2对比后可知,内容类别1多了1个视频、内容类别7少了1个视频;
5)从在内容类别上被划分为内容类别1的目标视频类中重新选取出一个类代表视频(仍从靠近聚类中心处选取),以尝试看是否能够使得重新选取后的各类代表视频的内容类别分布为:8:4:4:2:2:2:2。
6)最终再从主观上对所选出的测试序列进行修正。
在完成上述步骤后,就可以利用目标视频编码测试序列对与目标业务需求对应的待测编码器进行编码性能测试,得到性能测试结果,最后根据该性能测试结果确定该待测编码器的实际性能。
进一步参考图6,作为对上述各图所示方法的实现,本公开提供了一种视频编码测试序列确定装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的视频编码测试序列确定装置600可以包括:备选视频确定单元601、按内容类别分类单元602、按编码复杂度聚类单元603、目标类代表视频选取单元604、目标视频编码测试序列构建单元605。其中,备选视频确定单元601,被配置成确定与目标业务需求对应的包含多个备选视频的备选视频集;按内容类别分类单元602,被配置成将各备选视频按所属内容类别进行分类,得到目标内容类别分布;按编码复杂度聚类单元603,被配置成将各备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;目标类代表视频选取单元604,被配置成分别从每个视频类中选取出使实际的内容类别分布与目标内容类别分布一致的目标类代表视频;目标视频编码测试序列构建单元605,被配置成基于各目标类代表视频,构建目标视频编码测试序列。
在本实施例中,视频编码测试序列确定装置600中:备选视频确定单元601、按内容类别分类单元602、按编码复杂度聚类单元603、目标类代表视频选取单元604、目标视频编码测试序列构建单元605的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-205的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,按编码复杂度聚类单元603可以包括:
率失真性能参数计算子单元,被配置成基于预设的锚点视频,分别计算每个备选视频的BD-rate参数,得到每个备选视频在视频编码过程中的率失真性能参数;
业务特化测试视频数确定及聚类中心数确定子单元,被配置成获取与目标业务需求对应的业务特化测试视频数,并将业务特化测试视频数作为聚类中心数;
聚类子单元,被配置成将各备选视频按对应的率失真性能参数的大小进行聚类,得到数量为聚类中心数的多个视频类。
在本实施例的一些可选的实现方式中,业务特化测试视频数确定及聚类中心数确定子单元可以包括被配置成获取与目标业务需求对应的业务特化测试视频数的业务特化测试视频数确定模块,业务特化测试视频数确定模块可以被进一步配置成:
确定目标视频编码测试序列中包含的通用测试视频数;
基于通用测试视频数和预设比例,确定与目标业务需求对应的业务特化测试视频数。
在本实施例的一些可选的实现方式中,目标类代表视频选取单元604可以包括:
初始类代表视频确定子单元,被配置成将每个视频类中具有最接近聚类中心的实际预设编码复杂度的备选视频,确定为相应视频类的初始类代表视频;
初始内容类别分布确定子单元,被配置成将各初始类代表视频按所属内容类别进行分类,得到初始内容类别分布;
目标视频类确定子单元,别配置成响应于初始内容类别分布与目标内容类别分布不一致,确定导致初始内容类别分布与目标内容类别分布不一致的目标视频类;
目标类代表视频确定子单元,被配置成将目标视频类中使对应的内容类别分布与目标内容类别分布一致的备选视频确定为目标类代表视频。
在本实施例的一些可选的实现方式中,将目标类代表视频确定子单元可以被进一步配置成:
根据与目标视频类的聚类中心的接近程度,确定目标视频类中各备选视频应被选取为新的类代表视频的选取次序;
响应于根据选取次序选取出的新的类代表视频仍使当前的内容类别分布仍与目标内容类别分布不一致,根据选取次序更换新的类代表视频直至使对应的内容类别分布仍与目标内容类别分布一致;
将目标视频类中使对应的内容类别分布与目标内容类别分布一致的新的类代表视频确定为目标类代表视频。
在本实施例的一些可选的实现方式中,视频编码测试序列确定装置600还可以包括:
性能测试确定单元,被配置成利用目标视频编码测试序列对与目标业务需求对应的待测编码器进行编码性能测试,得到性能测试结果;
性能确定单元,被配置成根据性能测试结果确定待测编码器的实际性能。
本实施例作为对应于上述方法实施例的装置实施例存在,本实施例提供的视频编码测试序列确定装置在通用编码测试序列的基础上,结合了与业务需求对应的多个备选视频在内容类别上的分布和按预设编码复杂度的聚类情况,通过控制在每个聚类得到的视频类中选取出的类代表视频的实际内容类别分布与各备选视频的真实内容类别分布一致,得到在内容类别、编码复杂度上反映业务需求的目标类待代表视频,最终得到额外加入目标类代表视频的目标视频编码测试序列。通过该目标视频编码测试序列得以提升待测编码器对业务特化视频的编码性能的评测针对性、准确性。
根据本公开的实施例,本公开还提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现上述任意实施例所描述的视频编码测试序列确定方法。
根据本公开的实施例,本公开还提供了一种可读存储介质,该可读存储介质存储有计算机指令,该计算机指令用于使计算机执行时能够实现上述任意实施例所描述的视频编码测试序列确定方法。
本公开实施例提供了一种计算机程序产品,该计算机程序在被处理器执行时能够实现上述任意实施例所描述的视频编码测试序列确定方法。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如视频编码测试序列确定方法。例如,在一些实施例中,视频编码测试序列确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的视频编码测试序列确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行视频编码测试序列确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。
根据本公开实施例的技术方案,在通用编码测试序列的基础上,结合了与业务需求对应的多个备选视频在内容类别上的分布和按预设编码复杂度的聚类情况,通过控制在每个聚类得到的视频类中选取出的类代表视频的实际内容类别分布与各备选视频的真实内容类别分布一致,得到在内容类别、编码复杂度上反映业务需求的目标类待代表视频,最终得到额外加入目标类代表视频的目标视频编码测试序列。通过该目标视频编码测试序列得以提升待测编码器对业务特化视频的编码性能的评测针对性、准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (10)
1.一种视频编码测试序列确定方法,包括:
确定与目标业务需求对应的包含多个备选视频的备选视频集;
将各所述备选视频按所属内容类别进行分类,得到目标内容类别分布;
将各所述备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;
将每个所述视频类中具有最接近聚类中心的实际预设编码复杂度的备选视频,确定为相应视频类的初始类代表视频;将各所述初始类代表视频按所属内容类别进行分类,得到初始内容类别分布;响应于所述初始内容类别分布与所述目标内容类别分布不一致,确定导致所述初始内容类别分布与所述目标内容类别分布不一致的目标视频类;根据与所述目标视频类的聚类中心的接近程度,确定所述目标视频类中各备选视频应被选取为新的类代表视频的选取次序;响应于根据所述选取次序选取出的新的类代表视频仍使当前的内容类别分布仍与所述目标内容类别分布不一致,根据所述选取次序更换新的类代表视频直至使对应的内容类别分布仍与所述目标内容类别分布一致;将所述目标视频类中使对应的内容类别分布与所述目标内容类别分布一致的新的类代表视频确定为目标类代表视频;
基于各所述目标类代表视频和通用测试视频,构建目标视频编码测试序列。
2.根据权利要求1所述的方法,其中,所述将各所述备选视频按预设编码复杂度的大小进行聚类,得到多个视频类,包括:
基于预设的锚点视频,分别计算每个所述备选视频的BD-rate参数,得到每个所述备选视频在视频编码过程中的率失真性能参数;
获取与所述目标业务需求对应的业务特化测试视频数,并将所述业务特化测试视频数作为聚类中心数;
将各所述备选视频按对应的率失真性能参数的大小进行聚类,得到数量为所述聚类中心数的多个所述视频类。
3.根据权利要求2所述的方法,其中,所述获取与所述目标业务需求对应的业务特化测试视频数,包括:
确定所述目标视频编码测试序列中包含的通用测试视频数;
基于所述通用测试视频数和预设比例,确定与所述目标业务需求对应的业务特化测试视频数。
4.根据权利要求1-3任一项所述的方法,还包括:
利用所述目标视频编码测试序列对与所述目标业务需求对应的待测编码器进行编码性能测试,得到性能测试结果;
根据所述性能测试结果确定所述待测编码器的实际性能。
5.一种视频编码测试序列确定装置,包括:
备选视频确定单元,被配置成确定与目标业务需求对应的包含多个备选视频的备选视频集;
按内容类别分类单元,被配置成将各所述备选视频按所属内容类别进行分类,得到目标内容类别分布;
按编码复杂度聚类单元,被配置成将各所述备选视频按预设编码复杂度的大小进行聚类,得到多个视频类;
目标类代表视频选取单元,被配置成将每个所述视频类中具有最接近聚类中心的实际预设编码复杂度的备选视频,确定为相应视频类的初始类代表视频;将各所述初始类代表视频按所属内容类别进行分类,得到初始内容类别分布;响应于所述初始内容类别分布与所述目标内容类别分布不一致,确定导致所述初始内容类别分布与所述目标内容类别分布不一致的目标视频类;根据与所述目标视频类的聚类中心的接近程度,确定所述目标视频类中各备选视频应被选取为新的类代表视频的选取次序;响应于根据所述选取次序选取出的新的类代表视频仍使当前的内容类别分布仍与所述目标内容类别分布不一致,根据所述选取次序更换新的类代表视频直至使对应的内容类别分布仍与所述目标内容类别分布一致;将所述目标视频类中使对应的内容类别分布与所述目标内容类别分布一致的新的类代表视频确定为所述目标类代表视频;
目标视频编码测试序列构建单元,被配置成基于各所述目标类代表视频和通用测试视频,构建目标视频编码测试序列。
6.根据权利要求5所述的装置,其中,所述按编码复杂度聚类单元包括:
率失真性能参数计算子单元,被配置成基于预设的锚点视频,分别计算每个所述备选视频的BD-rate参数,得到每个所述备选视频在视频编码过程中的率失真性能参数;
业务特化测试视频数确定及聚类中心数确定子单元,被配置成获取与所述目标业务需求对应的业务特化测试视频数,并将所述业务特化测试视频数作为聚类中心数;
聚类子单元,被配置成将各所述备选视频按对应的率失真性能参数的大小进行聚类,得到数量为所述聚类中心数的多个所述视频类。
7.根据权利要求6所述的装置,其中,所述业务特化测试视频数确定及聚类中心数确定子单元包括被配置成获取与所述目标业务需求对应的业务特化测试视频数的业务特化测试视频数确定模块,所述业务特化测试视频数确定模块被进一步配置成:
确定所述目标视频编码测试序列中包含的通用测试视频数;
基于所述通用测试视频数和预设比例,确定与所述目标业务需求对应的业务特化测试视频数。
8.根据权利要求5-7任一项所述的装置,还包括:
性能测试确定单元,被配置成利用所述目标视频编码测试序列对与所述目标业务需求对应的待测编码器进行编码性能测试,得到性能测试结果;
性能确定单元,被配置成根据所述性能测试结果确定所述待测编码器的实际性能。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的视频编码测试序列确定方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的视频编码测试序列确定方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111319210.3A CN114241350B (zh) | 2021-11-09 | 2021-11-09 | 视频编码测试序列确定方法、相关装置及计算机程序产品 |
US17/902,521 US20220415046A1 (en) | 2021-11-09 | 2022-09-02 | Method for determining video coding test sequence, electronic device and computer storage medium |
EP22197633.5A EP4149111A1 (en) | 2021-11-09 | 2022-09-26 | Method for determining video coding test sequence, related apparatus and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111319210.3A CN114241350B (zh) | 2021-11-09 | 2021-11-09 | 视频编码测试序列确定方法、相关装置及计算机程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114241350A CN114241350A (zh) | 2022-03-25 |
CN114241350B true CN114241350B (zh) | 2023-09-19 |
Family
ID=80748747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111319210.3A Active CN114241350B (zh) | 2021-11-09 | 2021-11-09 | 视频编码测试序列确定方法、相关装置及计算机程序产品 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220415046A1 (zh) |
EP (1) | EP4149111A1 (zh) |
CN (1) | CN114241350B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240251138A1 (en) * | 2023-01-23 | 2024-07-25 | T-Mobile Usa, Inc. | Reference video quality measurement feedback |
CN117725274A (zh) * | 2023-03-24 | 2024-03-19 | 书行科技(北京)有限公司 | 一种数据筛选方法、装置、计算机设备及存储介质 |
CN117354524B (zh) * | 2023-12-04 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 编码器编码性能测试方法、装置、设备及计算机介质 |
CN118138421B (zh) * | 2024-04-12 | 2024-08-09 | 中国通信建设集团设计院有限公司 | 一种基于自适应调制的信号高效传输方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201201423D0 (en) * | 2012-01-27 | 2012-03-14 | Half Minute Media Ltd | Automatic detection of repeating video sequences |
CN112188310A (zh) * | 2020-09-28 | 2021-01-05 | 北京金山云网络技术有限公司 | 测试序列构建方法、装置、电子设备及存储介质 |
CN112399177A (zh) * | 2020-11-17 | 2021-02-23 | 深圳大学 | 一种视频编码方法、装置、计算机设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7023471B2 (en) * | 2001-10-31 | 2006-04-04 | Intel Corporation | Video quality assessment with test video sequences |
US20130188060A1 (en) * | 2012-01-23 | 2013-07-25 | Victor Steinberg | Method, System and Apparatus for Testing Video Quality |
-
2021
- 2021-11-09 CN CN202111319210.3A patent/CN114241350B/zh active Active
-
2022
- 2022-09-02 US US17/902,521 patent/US20220415046A1/en active Pending
- 2022-09-26 EP EP22197633.5A patent/EP4149111A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201201423D0 (en) * | 2012-01-27 | 2012-03-14 | Half Minute Media Ltd | Automatic detection of repeating video sequences |
CN112188310A (zh) * | 2020-09-28 | 2021-01-05 | 北京金山云网络技术有限公司 | 测试序列构建方法、装置、电子设备及存储介质 |
CN112399177A (zh) * | 2020-11-17 | 2021-02-23 | 深圳大学 | 一种视频编码方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于隐马尔可夫模型的体育视频分类方法;潘丹 等;湘潭大学自然科学学报;第39卷(第01期);第73-77页 * |
Also Published As
Publication number | Publication date |
---|---|
EP4149111A1 (en) | 2023-03-15 |
US20220415046A1 (en) | 2022-12-29 |
CN114241350A (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114241350B (zh) | 视频编码测试序列确定方法、相关装置及计算机程序产品 | |
CN109740499A (zh) | 视频分割方法、视频动作识别方法、装置、设备及介质 | |
RU2693906C2 (ru) | Основанный на правилах анализ важности видео | |
Zheng et al. | A review of QoE research progress in metaverse | |
CN113691733B (zh) | 视频抖动检测方法、装置、电子设备和存储介质 | |
CN112001274A (zh) | 人群密度确定方法、装置、存储介质和处理器 | |
CN111401722A (zh) | 智能决策方法和智能决策系统 | |
CN113422988B (zh) | 直播封面生成方法、装置、电子设备及存储介质 | |
CN113873291A (zh) | 视频编码参数组合确定方法、装置及服务器 | |
CN112308704A (zh) | 数据评估方法、装置、电子设备及存储介质 | |
CN113205495A (zh) | 图像质量评价及模型训练方法、装置、设备和存储介质 | |
US11645579B2 (en) | Automated machine learning tagging and optimization of review procedures | |
CN109409305A (zh) | 一种人脸图像清晰度评价方法及装置 | |
CN114071190B (zh) | 云应用视频流处理方法、相关装置及计算机程序产品 | |
CN113033373B (zh) | 用于训练人脸识别模型及识别人脸的方法及相关装置 | |
US20180270492A1 (en) | Content-based transcoder | |
CN113452996A (zh) | 一种视频编码、解码方法及装置 | |
US10764578B2 (en) | Bit rate optimization system and method | |
CN116668843A (zh) | 一种拍摄状态的切换方法、装置、电子设备以及存储介质 | |
CN115471672A (zh) | 图像处理方法、电子设备、存储介质及程序产品 | |
CN115270923A (zh) | 一种基于场景的可视化智能决策方法及系统 | |
CN114550300A (zh) | 视频数据分析方法、装置、电子设备及计算机存储介质 | |
CN114511022A (zh) | 特征筛选、行为识别模型训练、异常行为识别方法及装置 | |
Ling et al. | Rate-distortion video coding and uncertainties: to be blindly chasing marginal improvement or to be greener | |
CN113099216B (zh) | 编码复杂度评估方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |