CN114697638A - 视频信息生成方法、装置、电子设备和计算机可读介质 - Google Patents
视频信息生成方法、装置、电子设备和计算机可读介质 Download PDFInfo
- Publication number
- CN114697638A CN114697638A CN202011604293.6A CN202011604293A CN114697638A CN 114697638 A CN114697638 A CN 114697638A CN 202011604293 A CN202011604293 A CN 202011604293A CN 114697638 A CN114697638 A CN 114697638A
- Authority
- CN
- China
- Prior art keywords
- region
- interest
- area
- detection
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
Abstract
本公开的实施例公开了视频信息生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标视频,其中,上述目标视频包括至少一个感兴趣区域;对上述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;基于上述目标视频和上述感兴趣区域信息集,生成至少一条率失真曲线;基于上述至少一条率失真曲线,生成视频质量评价信息。该实施方式解决了评价视频质量的准确度偏低的问题。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及视频信息生成方法、装置、电子设备和计算机可读介质。
背景技术
在传统视频编解码质量评价体系中,通常以解码重构图像的还原度以及对应压缩码流的码率的对应率失真曲线作为评判标准。目前,通常采用整体检测的方式对视频中的全帧图像进行检测。
然而,采用上述检测方式时,通常会存在以下技术问题:
第一,无法同时在率失真曲线中对检测编码器和压缩编码器的性能进行评估;
第二,未通过视频所包含的感兴趣区域对视频质量进行评估,造成了评价视频质量的准确度偏低。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了视频信息生成方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了视频信息生成方法,该方法包括:获取目标视频,其中,上述目标视频包括至少一个感兴趣区域;对上述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;基于上述目标视频和上述感兴趣区域信息集,生成至少一条率失真曲线;基于上述至少一条率失真曲线,生成视频质量评价信息。
第二方面,本公开的一些实施例提供了一种视频信息生成装置,装置包括:获取单元,被配置成获取目标视频,其中,上述目标视频包括至少一个感兴趣区域;标注单元,对上述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;生成单元,被配置成基于上述目标视频和上述感兴趣区域信息集,生成至少一条率失真曲线;评价单元,被配置成基于上述至少一条率失真曲线,生成视频质量评价信息。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的视频信息生成方法,有效地提高了视频质量评价的准确度。具体来说,造成相关的视频质量评价结果不够准确的原因在于:传统方法对整个视频的全帧图像的质量进行评测,而没有突显视频中感兴趣区域的重要性。首先,对获取的目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集。由此,可以为生成率失真曲线提供一个参考的感兴趣区域集。然后,基于目标视频和感兴趣区域信息集,生成至少一条率失真曲线。由此,可以压缩视频的质量评估提供数据支持。最后,基于至少一条率失真曲线,生成视频质量评价信息。由此,解决了评价视频质量的准确度偏低的问题。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的一些实施例的视频信息生成方法的一个应用场景的示意图;
图2是根据本公开的视频信息生成方法的一些实施例的流程图;
图3是根据本公开的视频信息生成装置的一些实施例的流程图;
图4是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是本公开的一些实施例的视频信息生成方法的一个应用场景的示意图。
在图1的应用场景中,首先,计算设备101可以获取目标视频102。其中,目标视频102包括至少一个感兴趣区域。接着,计算设备101可以对目标视频102包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集103。然后,计算设备101可以基于目标视频102和感兴趣区域信息集103,生成至少一条率失真曲线104。最后,计算设备101可以基于至少一条率失真曲线104,生成视频质量评价信息105。
需要说明的是,上述计算设备101可以是硬件,也可以是软件。当计算设备为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的计算设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的计算设备。
继续参考图2,示出了根据本公开的视频信息生成方法的一些实施例的流程200。该方法包括以下步骤:
步骤201,获取目标视频。
在一些实施例中,视频信息生成方法的执行主体(例如图1所示的计算设备101)可以通过有线连接方式或者无线连接方式获取目标视频。其中,上述目标视频包括了至少一个感兴趣区域。实践中,感兴趣区域可以是从被处理的图像中以矩形方式勾勒出需要处理的区域。其中,上述目标视频可以是包含至少一个感兴趣区域的视频。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
步骤202,对目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集。
在一些实施例中,上述执行主体可以对目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集。这里,标注的方式可以采用视频标定编码器进行标注,也可以采用手动标注的方式。实践中,可以对上述目标视频进行抽帧,得到目标视频对应帧图序列;之后,对帧图序列包括的每一个帧图进行手工标注,以得到感兴趣区域信息集。
步骤203,基于目标视频和感兴趣区域信息集,生成至少一条率失真曲线。
在一些实施例中,上述执行主体可以通过各种方法对目标视频和感兴趣区域信息集进行分析处理,生成至少一条率失真曲线。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤生成至少一条率失真曲线:
第一步,利用预设检测编码器对上述目标视频包括的至少一个感兴趣区域进行检测,以生成检测区域集。其中,预设检测编码器可以是具有目标检测功能的编码器。实践中,上述执行主体可以通过预设检测编码器对目标视频包括的至少一个感兴趣区域进行检测,得到检测到的感兴趣区域的集合作为检测区域集。
第二步,对上述检测区域集中的每个检测区域进行标注,以生成检测区域信息集。实践中,对上述检测区域集进行标注,得到每一个检测区域所在目标视频对应的帧图序列中的帧图号,以及位置信息和大小信息。
第三步,将上述目标视频输入至预设压缩编码器组,生成编码视频组集。其中,上述预设压缩编码器可以是具有对感兴趣区域进行变值的编码器。其中,预设压缩编码器是一种使用可打印的ASCII字符表示各种编码格式下的字符的编码方式。实践中,上述预设编码器,将目标视频输入至预设压缩编码器,生成至少4个不同码率下的编码视频,即编码视频组。为了便于比较压缩效果,可以将目标视频在另一个预设压缩编码器下,生成同样的编码视频组,得到编码视频组集。
第四步,基于上述目标视频和上述编码视频组集中的每个编码视频组,生成率失真信息组,得到率失真信息组集。通过以下公式,生成上述编码视频组中每个编码视频对应的率失真信息包括的峰值信噪比:
其中,对于目标视频中的每一帧图像,以图像左上角为原点,以像素为单位,图像数组中像素的列数为横坐标,像素的行数为纵坐标建立图像坐标系。(i,j)表示图像坐标系中的坐标。i表示上述坐标的横坐标。j表示上述坐标的纵坐标。MSE表示均方误差。PSNR表示峰值信噪比。n表示像素值的比特数。A表示上述至少一个感兴趣区域。card(A)表示上述至少一个感兴趣区域所包括感兴趣区域的数量。k表示上述至少一个感兴趣区域中感兴趣区域的序号。pk表示序号为k的感兴趣区域的左上角的像素的横坐标。qk表示上述左上角的像素的纵坐标。rk表示序号为k的感兴趣区域的右下角的像素的横坐标。Sk表示上述右下角的像素的纵坐标。Ik(i,j)表示上述集合A中序号为k的感兴趣区域对应的目标视频的帧图上坐标(i,j)处的子像素的值。Jk(i,j)表示上述集合A中序号为k的感兴趣区域对应的编码视频的帧图上坐标(i,j)处的子像素的值。
上述图像可以由不同的色彩模式表示,比如用红绿蓝(RGB)三原色来表示图像。图像中的每个像素上的每种颜色叫一个子像素,每个子像素处理一个颜色通道。实践中,上述子像素可以是处理表示图像亮度信息的颜色通道的子像素。由此,可以以编码视频的码率为横坐标,对应的峰值信噪比为纵坐标,可以得到一个率失真信息。在同一个预设压缩编码器下,对于不同的码率,可以得到一组率失真信息,即率失真信息组。
可选地,如果应用需求更关注于目标视频中的确定时间段(t,t+Δt)内的压缩编码质量,此时对应的感兴趣集合为上述集合A的子集At,t+Δt,将集合A替换为其子集At,t+Δt,重新进行上述生成过程即可得到该条件下的率失真信息组集。
可选地,如果应用需求更关注于目标视频的某些时刻是否有感兴趣区域或关注感兴趣区域所在的环境(即帧图信息),而对这些感兴趣区域的位置不关注,可以将编码前后确定时间段内有感兴趣区域的帧图集作为输入,生成相应的率失真信息组集。
第五步,基于上述率失真信息组集,生成至少一条率失真曲线。实践中,可以将上述率失真信息组集中的一组率失真信息作为一组坐标点,将上述一组坐标点连接并进行插值得到一条率失真曲线。
上述公式以及相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“未通过视频所包含的感兴趣区域对视频质量进行评估,造成了评价视频质量的准确度偏低”。导致造成准确度偏低的因素往往如下:未通过视频所包含的感兴趣区域对视频进行质量评估。如果解决了上述因素,就能达到提高视频质量评价的准确度的效果。为了达到这一效果,本公开引入了感兴趣区域和感兴趣时间段以提高视频质量评价的准确度。当应用更关注目标视频中某一时间段内的感兴趣区域的信息时,可以利用该时间段内的感兴趣区域集的编码前后的像素值,来得到峰值信噪比,进而生成率失真曲线和质量评价信息。当应用更关注目标视频中某一时刻是否有感兴趣区域或关注感兴趣区域所在的环境(即帧图信息),可以利用确定时间段内有感兴趣区域的帧图集的编码前后的像素值,来得到峰值信噪比,进而生成率失真曲线和质量评价信息。上述两种方法分别对不关注的区域或帧图进行了过滤,从而提高了视频质量评价的准确度。
步骤204,基于至少一条率失真曲线,生成视频质量评价信息。
在一些实施例中,上述执行主体可以通过率失真曲线可得到视频质量评价信息,如不同视频码率下,峰值信噪比的变化。如果得到两条以上的率失真曲线,对比可得到评价信息,如在同一视频码率下,两条曲线的峰值信噪比的大小等。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤生成视频质量评价信息:
第一步,基于至少一个感兴趣区域和检测区域集,生成交并比信息。
在一些实施例中,上述第一步可以包括以下子步骤:
第一子步骤,确定至少一个感兴趣区域中的每个感兴趣区域对应的感兴趣区域信息包括的感兴趣区域帧号,得到至少一个感兴趣区域帧号。
第二子步骤,确定检测区域集中的每个检测区域对应的检测区域信息包括的检测区域帧号,得到检测区域帧号组。
第三子步骤,对于至少一个感兴趣区域中的每个感兴趣区域,确定检测区域帧号组中是否存在与感兴趣区域对应的感兴趣区域帧号相匹配的检测区域帧号。相匹配可以是相同。
第四子步骤,响应于存在相匹配的检测区域帧号,执行如下处理步骤:
检测感兴趣区域是否存在与检测区域帧号对应的检测区域相匹配的区域。相匹配可以是两个区域有重叠部分。
响应于存在相匹配的区域,确定相匹配的区域的面积以及感兴趣区域的面积和检测区域的面积。相匹配的区域可以看作两个区域的交集。
第五子步骤,将所确定的相匹配的区域的面积中的每个相匹配的区域的面积确定为匹配区域面积,得到匹配区域面积组。
第六子步骤,将所确定的感兴趣区域的面积中的每个感兴趣区域的面积确定为感兴趣区域面积,得到感兴趣区域面积组。
第七子步骤,将所确定的检测区域的面积中的每个检测区域的面积确定为检测区域面积,得到检测区域面积组。
第八子步骤,基于匹配区域面积组、感兴趣区域面积组和检测区域面积组,生成交并比组。一个感兴趣区域与相应的检测区域相交的部分为相匹配的区域,用匹配区域面积来度量。感兴趣区域与相应的检测区域合并的部分用感兴趣区域面积加上相应的检测区域面积减去相应的匹配区域面积来度量。用上述相交的部分的面积除以合并的部分的面积作为上述感兴趣区域的交并比,得到交并比组。
第九子步骤,基于交并比组和至少一个感兴趣区域所包括的感兴趣区域的数量,生成交并比信息。对上述交并比组求和,所得结果除以至少一个感兴趣区域包括的感兴趣区域的数量,得到交并比信息。
第二步,对交并比信息进行评分生成处理,得到检测编码器的目标检测评分值。可直接将交并比的值作为检测编码器的目标检测评分值。
第三步,基于至少一条率失真曲线和目标检测评分值,生成视频质量评价信息。检测编码器的目标检测性能由上述评分值表征,而压缩编码器是基于检测区域进行的编码,因而检测编码器的检测性能会影响压缩视频的质量,上述评分值和率失真曲线可作为视频质量评价信息。
可选地,上述执行主体可以通过以下步骤生成视频质量评价信息:
第一步,至少一个感兴趣区域和检测区域集,生成交并比信息。
在目标视频的感兴趣时间段(t,t+Δt)内,可以找到对应的有感兴趣区域的帧号集S,还可以找到对应的有检测区域的帧号集T。从S中选出所有帧号连续的最大子集S1,S2,...,Sn。其中n表示S中帧号连续的最大子集的的个数。此处的最大子集指相同约束下,元素数目最多的子集。对于S1中的每一个帧号,如果同时存在于T中,则将其放入空集合I1中,对S2,...,Sn亦做同样的对比处理,最终得到集合I1,I2,...,In。
将集合U1,U2,...,Un分别初始化为集合I1,I2,...,In。找出I1中最小的帧号I1min和最大的帧号I1max,以I1min为初始值,如果帧号I1min-1在T中,则将该帧号加入U1中,对I1min-2,I1min-3,...依次判断,直至某一个帧号不在T中,停止此次添加。然后以I1max为初始值,如果帧号I1max+1在T中,则将该帧号加入U1中,对I1max+2,I1max+3,...依次判断,直至某一个帧号不在T中,停止添加。对I2,...,In亦做同样的处理,最终得到更新后的集合序列U1,U2,...,Un。之后求出Card(I1)/Card(U1)+Card(I2)/Card(U2)+...+Card(In)/Card(Un),再将上述结果除以Card(S),结果作为交并比信息。其中,Card(S)表示集合S中元素的数目。
第二步,对上述交并比信息进行评分生成处理,得到预设检测编码器的目标检测评分值。上述交并比信息,可以作为上述检测编码器的目标检测评分值。
第三步,基于上述至少一条率失真曲线和上述目标检测评分值,生成视频质量评价信息。检测编码器的目标检测性能由上述评分值表征,而压缩编码器是基于检测区域进行的编码,因而检测编码器的检测性能会影响压缩视频的质量,上述评分值和率失真曲线可作为视频质量评价信息。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的视频信息生成方法,有效地提高了视频质量评价的准确度。具体来说,造成相关的视频质量评价结果不够准确的原因在于:传统方法对整个视频的全帧图像的质量进行评测,而没有突显视频中感兴趣区域的重要性。首先,对获取的目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集。由此,可以为生成率失真曲线提供一个参考的感兴趣区域集。然后,基于目标视频和感兴趣区域信息集,生成至少一条率失真曲线。由此,可以压缩视频的质量评估提供数据支持。最后,基于至少一条率失真曲线,生成视频质量评价信息。由此,解决了评价视频质量的准确度偏低的问题。
进一步参考图3,作为对上述所示方法的实现,本公开提供了一种视频信息生成装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,一些实施例的视频质量评价装置300包括:获取单元301、标注单元302、生成单元303和评价单元304。其中,获取单元301被配置成获取目标视频,其中,上述目标视频包括至少一个感兴趣区域;标注单元302被配置成对上述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;生成单元303被配置成基于上述目标视频和上述感兴趣区域信息集,生成至少一条率失真曲线;而评价单元304被配置成基于上述至少一条率失真曲线,生成视频质量评价信息。
可以理解的是,该装置300中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置300及其中包含的单元,在此不再赘述。
下面参考图4,其示出了适于用来实现本公开的一些实施例的电子设备(例如图1中的计算设备101)400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图4中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标视频,其中,目标视频包括至少一个感兴趣区域;对目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;基于目标视频和感兴趣区域信息集,生成至少一条率失真曲线;基于至少一条率失真曲线,生成视频质量评价信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、标注单元、生成单元和评价单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标视频,其中,上述目标视频包括至少一个感兴趣区域”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种视频信息生成方法,包括:
获取目标视频,其中,所述目标视频包括至少一个感兴趣区域;
对所述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;
基于所述目标视频和所述感兴趣区域信息集,生成至少一条率失真曲线;
基于所述至少一条率失真曲线,生成视频质量评价信息。
2.根据权利要求1所述的方法,其中,在所述基于所述目标视频和所述感兴趣区域信息集,生成至少一条率失真曲线之前,所述方法还包括:
利用预设检测编码器对所述目标视频包括的至少一个感兴趣区域进行检测,以生成检测区域集;
对所述检测区域集中的每个检测区域进行标注,以生成检测区域信息集。
3.根据权利要求2所述的方法,其中,所述基于所述至少一条率失真曲线,生成视频质量评价信息,包括:
基于所述至少一个感兴趣区域和所述检测区域集,生成交并比信息;
对所述交并比信息进行评分生成处理,得到所述检测编码器的目标检测评分值;
基于所述至少一条率失真曲线和所述目标检测评分值,生成视频质量评价信息。
4.根据权利要求3所述的方法,其中,所述基于所述目标视频和所述感兴趣区域信息集,生成至少一条率失真曲线,包括:
将所述目标视频输入至预设压缩编码器组,生成编码视频组集;
基于所述目标视频和所述编码视频组集中的每个编码视频组,生成率失真信息组,得到率失真信息组集;
基于所述率失真信息组集,生成至少一条率失真曲线。
5.根据权利要求4所述的方法,其中,所述率失真信息包括:峰值信噪比;以及
所述基于所述目标视频和所述编码视频组集中的每个编码视频组,生成率失真信息组,包括:
通过以下公式,生成所述编码视频组中每个编码视频对应的率失真信息包括的峰值信噪比:
其中,对于所述目标视频中的每一帧图像,以所述图像左上角为原点,以像素为单位,图像数组中像素的列数为横坐标,像素的行数为纵坐标建立图像坐标系,(i,j)表示所述图像坐标系中的坐标,i表示所述坐标的横坐标,j表示所述坐标的纵坐标,MSE表示均方误差,PSNR表示峰值信噪比,n表示像素值的比特数,A表示所述至少一个感兴趣区域,card(A)表示所述至少一个感兴趣区域所包括感兴趣区域的数量,k表示所述至少一个感兴趣区域中感兴趣区域的序号,pk表示所述序号为k的感兴趣区域的左上角的像素的横坐标,qk表示所述左上角的像素的纵坐标,rk表示所述序号为k的感兴趣区域的右下角的像素的横坐标,Sk表示所述右下角的像素的纵坐标,Ik(i,j)表示所述集合A中序号为k的感兴趣区域对应的所述目标视频的帧图上坐标(i,j)处的子像素的值,Jk(i,j)表示所述集合A中序号为k的感兴趣区域对应的所述编码视频的帧图上坐标(i,j)处的所述子像素的值。
6.根据权利要求5所述的方法,其中,所述感兴趣区域信息包括:感兴趣区域帧号,所述检测区域信息包括:检测区域帧号;以及
所述基于所述至少一个感兴趣区域和所述检测区域集,生成交并比信息,包括:
确定所述至少一个感兴趣区域中的每个感兴趣区域对应的感兴趣区域信息包括的感兴趣区域帧号,得到至少一个感兴趣区域帧号;
确定所述检测区域集中的每个检测区域对应的检测区域信息包括的检测区域帧号,得到检测区域帧号组;
对于所述至少一个感兴趣区域中的每个感兴趣区域,确定所述检测区域帧号组中是否存在与所述感兴趣区域对应的感兴趣区域帧号相匹配的检测区域帧号;
响应于存在相匹配的检测区域帧号,执行如下处理步骤:
检测所述感兴趣区域是否存在与所述检测区域帧号对应的检测区域相匹配的区域;
响应于存在相匹配的区域,确定所述相匹配的区域的面积以及所述感兴趣区域的面积和所述检测区域的面积。
7.根据权利要求6所述的方法,其中,所述基于所述至少一个感兴趣区域和所述检测区域集,生成交并比信息,还包括:
将所确定的相匹配的区域的面积中的每个相匹配的区域的面积确定为匹配区域面积,得到匹配区域面积组;
将所确定的感兴趣区域的面积中的每个感兴趣区域的面积确定为感兴趣区域面积,得到感兴趣区域面积组;
将所确定的检测区域的面积中的每个检测区域的面积确定为检测区域面积,得到检测区域面积组;
基于所述匹配区域面积组、所述感兴趣区域面积组和所述检测区域面积组,生成交并比组;
基于所述交并比组和所述至少一个感兴趣区域所包括的感兴趣区域的数量,生成交并比信息。
8.一种视频信息生成装置,包括:
获取单元,被配置成获取目标视频,其中,所述目标视频包括至少一个感兴趣区域;
标注单元,对所述目标视频包括的至少一个感兴趣区域进行标注,以生成感兴趣区域信息集;
生成单元,被配置成基于所述目标视频和所述感兴趣区域信息集,生成至少一条率失真曲线;
评价单元,被配置成基于所述至少一条率失真曲线,生成视频质量评价信息。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604293.6A CN114697638A (zh) | 2020-12-29 | 2020-12-29 | 视频信息生成方法、装置、电子设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604293.6A CN114697638A (zh) | 2020-12-29 | 2020-12-29 | 视频信息生成方法、装置、电子设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114697638A true CN114697638A (zh) | 2022-07-01 |
Family
ID=82132389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011604293.6A Pending CN114697638A (zh) | 2020-12-29 | 2020-12-29 | 视频信息生成方法、装置、电子设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114697638A (zh) |
-
2020
- 2020-12-29 CN CN202011604293.6A patent/CN114697638A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325096B (zh) | 直播流采样方法、装置及电子设备 | |
EP3952312A1 (en) | Method and apparatus for video frame interpolation, and device and storage medium | |
EP3335155B1 (en) | Electronic device and operating method of the same | |
CN112381717A (zh) | 图像处理方法、模型训练方法、装置、介质及设备 | |
CN113038176B (zh) | 视频抽帧方法、装置和电子设备 | |
Yang et al. | No‐reference image quality assessment via structural information fluctuation | |
WO2024037556A1 (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114697638A (zh) | 视频信息生成方法、装置、电子设备和计算机可读介质 | |
CN114414067B (zh) | 热成像数据处理方法、装置、热成像摄影设备及存储介质 | |
CN113255812B (zh) | 视频边框检测方法、装置和电子设备 | |
CN110290381B (zh) | 视频质量评估方法、装置、电子设备及计算机存储介质 | |
CN115439660A (zh) | 一种检测方法、装置、电子设备及介质 | |
CN114399696A (zh) | 一种目标检测方法、装置、存储介质及电子设备 | |
CN115272667A (zh) | 农田图像分割模型训练方法、装置、电子设备和介质 | |
CN114037716A (zh) | 图像分割方法、装置、设备及存储介质 | |
CN114155545A (zh) | 表格识别方法、装置、可读介质及电子设备 | |
JP2022546774A (ja) | イントラ予測のための補間フィルタリング方法と装置、コンピュータプログラム及び電子装置 | |
CN112308809A (zh) | 一种图像合成方法、装置、计算机设备及存储介质 | |
CN112241744A (zh) | 图像颜色迁移方法、装置、设备和计算机可读介质 | |
CN115796637B (zh) | 基于角钢塔材料的信息处理方法、装置、设备与介质 | |
CN110825480A (zh) | 图片的展示方法、装置、电子设备及计算机可读存储介质 | |
WO2023036111A1 (zh) | 视频处理方法、装置、设备及介质 | |
CN110189279B (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN115643348B (zh) | 基于可逆图像处理网络的可证安全自然隐写方法及装置 | |
CN115690246B (zh) | 图像纹理信息生成方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |