CN110490845A - 一种图像特征提取方法、装置、存储介质及电子设备 - Google Patents

一种图像特征提取方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN110490845A
CN110490845A CN201910682971.1A CN201910682971A CN110490845A CN 110490845 A CN110490845 A CN 110490845A CN 201910682971 A CN201910682971 A CN 201910682971A CN 110490845 A CN110490845 A CN 110490845A
Authority
CN
China
Prior art keywords
image
subsequence
calculates
described image
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910682971.1A
Other languages
English (en)
Inventor
颜洪奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dami Technology Co Ltd
Original Assignee
Beijing Dami Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dami Technology Co Ltd filed Critical Beijing Dami Technology Co Ltd
Priority to CN201910682971.1A priority Critical patent/CN110490845A/zh
Publication of CN110490845A publication Critical patent/CN110490845A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请实施例公开了一种图像特征提取方法、装置、存储介质及电子设备,其中,方法包括:获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。因此,采用本申请实施例,可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。

Description

一种图像特征提取方法、装置、存储介质及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像特征提取方法、装置、存储介质及电子设备。
背景技术
在无参考媒体质量评价方法中,如何对媒体文件进行分段提取特征是重要的一步,既关系到计算的复杂度,也直接关系到最终的质量评价结果。
现有技术中,对媒体文件分段提取特征通常是基于图像组(Group of picture,GOP)分段。所谓GOP分段,是指按照图像序列中每相邻两个I帧进行分段,这种分段方式会发生GOP固定、GOP过小或GOP过大的情况。当GOP固定时,会因为GOP的强行划分(如每两秒种的视频序列组成一个GOP)而强行将同一场景下的序列切分成多个片段,并且有的片段是跨场景的,从而影响了质量评价结果;当GOP过小(如一帧一个GOP)时,会因为特征提取的数据过于碎片化,导致媒体质量评价无法获得正常结果;当GOP过大(如一个一小时时长的文件只有一个GOP)时,会因为特征提取片段太长,而失去片段的意义,其媒体质量评价结果同样不可用。因此,采用GOP分片段提取图像质量特征以进行媒体质量评价,将会导致媒体质量评价结果不准确。
发明内容
本申请实施例提供了一种图像特征提取方法、装置、存储介质及电子设备,可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。所述技术方案如下:
第一方面,本申请实施例提供了一种图像特征提取方法,所述方法包括:
获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
第二方面,本申请实施例提供了一种图像特征提取装置,所述装置包括:
图像获取模块,用于获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
场景获取模块,用于对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
图像切分模块,用于基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
特征获取模块,用于以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请一些实施例提供的技术方案带来的有益效果至少包括:
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后提取所述至少一个图像计算子序列中各图像计算子序列的图像特征信息。通过将同一场景下的序列归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像特征提取方法的流程示意图;
图2是本申请实施例提供的一种H.264码流结构示意图;
图3是本申请实施例提供的一种H.264解码数据转换流程图;
图4是本申请实施例提供的一种图像特征提取方法的流程示意图;
图5是本申请实施例提供的一种图像计算子序列的分割效果示意图;
图6是本申请实施例提供的一种图像特征提取方法的流程示意图;
图7是本申请实施例提供的一种目标图像计算子序列的分割效果示意图;
图8是本申请实施例提供的一种图像特征提取装置的结构示意图;
图9是本申请实施例提供的一种图像特征提取装置的结构示意图;
图10是本申请实施例提供的一种图像切分模块的结构示意图;
图11是本申请实施例提供的一种图像切分模块的结构示意图;
图12是本申请实施例提供的一种图像获取模块的结构示意图;
图13是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
下面将结合附图1-附图6,对本申请实施例提供的图像特征提取方法进行详细介绍。
其中,本申请实施例中的图像特征提取装置可以是用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digitalassistant,PDA)、5G网络或未来演进网络中的终端设备等。
请参见图1,为本申请实施例提供的一种图像特征提取方法的流程示意图。如图1所示,本申请实施例的所述图像特征提取方法可以包括以下步骤:
S101,获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
视频文件包括音频码流以及视频码流(图像码流)等多种类型的码流。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频文件可包括wmv、asf、asx、rm、rmvb、mp4、3gp、mov、m4v、avi、dat、mkv、flv、vob等多种类型的格式。
码流是指视频文件在单位时间内使用的数据流量,也叫码率,是视频编码中画面质量控制中最重要的部分。同样分辨率下,视频文件的码流越大,压缩比就越小,画面质量就越好。
对于视频码流与音频码流的分割,可基于码流的预设编码格式,对于视频码流,常见的编码格式包括H.264/AVC或H.265/HEVC等。
H.264/AVC:H.264,或称MPEG-4第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,JointVideoTeam)提出的高度压缩数字视频编解码器标准。H.264是一种高性能的视频编解码技术。H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。H.264在具有高压缩比的同时还拥有高质量流畅的图像。
H.265是ITU-T VCEG继H.264之后所制定的新的视频编码标准。H.265标准围绕着现有的视频编码标准H.264,保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。具体的研究内容包括:提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。H.264由于算法优化,可以低于1Mbps的速度实现标清(分辨率在1280P*720以下)数字图像传送;H.265则可以实现利用1~2Mbps的传输速度传送720P(分辨率1280*720)普通高清音视频传送。
分离某些封装格式(例如MP4/FLV/MKV等)中的H.264的时候,需要首先写入SPS和PPS,否则会导致分离出来的数据没有SPS、PPS而无法播放。H.264码流的SPS和PPS信息存储在AVCodecContext结构体的extradata中。需要使用ffmpeg中名称为“h264_mp4toannexb”的bitstream filter(比特流过滤器)处理。
例如,采用H.264编解码前后的视频数据封装在CMSampleBuffer中,编码后的图像存储方式为CMBlockBuffer,解码后的图像存储方式为CVPixelBuffer,CMSampleBuffer中还存储和时间已经描述相关的信息。
解码前的CMSampleBuffer对象,包括CMTime、CMVideoFormatDesc、CMBlockBuffer等,解码的任务就是从H.264码流里面提取上面三处的信息,合成解码后的CMSampleBuffer对象,提供给硬解码接口进行解码工作。
H.264码流由NALU单元组成,NALU单元包含视频图像数据CMBlockBuffer和H.264的参数信息则可以组合成FormatDesc,具体参数信息包含SPS(Sequence Parameter Set)和PPS(Picture Parameter Set),如图2所示为H.264码流结构。
具体的解码过程为:提取sps和pps生成format description,利用函数CMVideoFormatDescriptionCreateFromH264ParameterSets来构建CMVideoFormatDescriptionRef,以获取描述信息,提取视频数据生成待解码对象CMBlockBuffer,根据需要,生成CMTime信息。所对应的H.264解码数据转换图如图3所示。
在解码完成后,即可得到视频码流对应的图像序列,并进行显示。
S102,对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
场景检测即对图像序列每一帧计算一个度量值,并根据该值来估计与前一帧的不同程度。如果该值低于设定的阈值,则认为侦测到一个场景变换。也就是对图像序列中每相邻两帧的度量值作差值,当该差值绝对值低于预设阈值时,确认该两帧对应的场景不一样。所述度量值可以为该帧图像所有像素色彩值的平均值。
所述场景信息包括白天、黑夜、晴天、雨天等。
S103,基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
具体实现中,按照场景检测结果对该图像序列进行分割,从而得到与场景相应的至少一个图像计算子序列。也就是说,分割后的每个图像计算子序列分别对应一个场景,相邻的图像计算子序列对应的场景不同,而间隔的图像计算子序列所对应的场景可以相同。同时,每个第一图像子序列包括至少一帧图像,每个图像计算子序列包含的各帧图像属于同一场景。
S104,以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
以每个图像计算子序列为单位,分别提取每个单位中各图像的图像特征信息。
其中,特征提取指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。同一场景的不同图像所提取的特征应该是相同的。
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
常用的特征提取算法包括局部二值模式(Local Binary Patterns,LBP)特征提取算法、方向梯度直方图(Histogram of Oriented Gradient,HOG)特征提取算法、Haar特征提取算子、二阶拉普拉斯-高斯(Laplacian of Gaussian,LOG)边缘提取算法,Harris角点特征提取算法、SIFT特征提取算子、SURF特征提取算法,等。
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后提取所述至少一个图像计算子序列中各图像计算子序列的图像特征信息。通过将同一场景下的序列归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
请参见图4,为本申请实施例提供的一种图像特征提取方法的流程示意图。本实施例以图像特征提取方法应用于电子设备中来举例说明。该图像特征提取方法可以包括以下步骤:
S201,获取视频文件;
视频文件包括音频码流以及视频码流(图像码流)等多种类型的码流。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频文件可包括wmv、asf、asx、rm、rmvb、mp4、3gp、mov、m4v、avi、dat、mkv、flv、vob等多种类型的格式。
码流是指视频文件在单位时间内使用的数据流量,也叫码率,是视频编码中画面质量控制中最重要的部分。同样分辨率下,视频文件的码流越大,压缩比就越小,画面质量就越好。
该视频文件可以为本地存储中所选择的视频文件,也可以为网络下载的视频文件,还可以为其他用户发送的视频文件。
当然,该视频文件可以包括一个或多个,当为多个时,可依次对这多个视频文件进行处理。
在本申请实施例中,以视频文件为一个为例,进行说明。
S202,对所述视频文件进行解析,提取所述视频文件中预设编码类型的视频码流;
从视频文件中提取视频码流,可基于码流的预设编码格式。对于视频码流,常见的编码格式包括H.264/AVC或H.265/HEVC等。
分离视频文件(例如MP4/FLV/MKV等)中的H.264码流的时候,需要首先写入SPS和PPS,否则会导致分离出来的数据没有SPS、PPS而无法播放。H.264码流的SPS和PPS信息存储在AVCodecContext结构体的extradata中。需要使用ffmpeg中名称为“h264_mp4toannexb”的bitstream filter(比特流过滤器)处理。
S203,对所述视频码流进行解码,得到所述视频码流对应的图像序列;
例如,采用H.264编解码前后的视频数据封装在CMSampleBuffer中,编码后的图像存储方式为CMBlockBuffer,解码后的图像存储方式为CVPixelBuffer,CMSampleBuffer中还存储和时间已经描述相关的信息。
解码前的CMSampleBuffer对象,包括CMTime、CMVideoFormatDesc、CMBlockBuffer等,解码的任务就是从H.264码流里面提取上面三处的信息,合成解码后的CMSampleBuffer对象,提供给硬解码接口进行解码工作。
H.264码流由NALU单元组成,NALU单元包含视频图像数据CMBlockBuffer和H.264的参数信息则可以组合成FormatDesc,具体参数信息包含SPS(Sequence Parameter Set)和PPS(Picture Parameter Set)。
具体的解码过程为:提取sps和pps生成format description,利用函数CMVideoFormatDescriptionCreateFromH264ParameterSets来构建CMVideoFormatDescriptionRef,以获取描述信息,提取视频数据生成待解码对象CMBlockBuffer,根据需要,生成CMTime信息。
在解码完成后,即可得到视频码流对应的图像序列,并进行显示。
S204,对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
场景检测即对图像序列每一帧计算一个度量值,并根据该值来估计与前一帧的不同程度。如果该值低于设定的阈值,则认为侦测到一个场景变换。也就是对图像序列中每相邻两帧的度量值作差值,当该差值绝对值低于预设阈值时,确认该两帧对应的场景不一样。所述度量值可以为该帧图像所有像素色彩值的平均值。
当然,也可以对相邻两帧的度量值作商,当商值低于预设阈值时,确认该两帧对应的场景不一样。
所述场景信息包括白天、黑夜、晴天、雨天等。
S205,基于所述场景信息,确定所述图像序列对应的至少一个场景;
例如,若该图像序列有100帧,通过对这100帧图像进行场景检测处理,得到相应的场景信息,从而可确定第1-10帧为A1场景,11-30帧为A2场景,31-35为A3场景,….,91-100为An场景。
S206,以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景;
具体实现中,按照场景检测结果对该图像序列进行分割,从而得到与场景相应的图像计算子序列。也就是说,分割后的每个图像计算子序列分别对应一个场景,相邻的第一图像子序列对应的场景不同,而间隔的第一图像子序列所对应的场景可以相同。如,第1个第一图像子序列与第2个第一图像子序列对应的场景不同,第1个第一图像子序列与第3个第一图像子序列对应的场景相同。
例如,如图5所示,假设将视频文件按照场景信息分割后得到序列分别为1~10的10个图像计算子序列,每个图像计算子序列的长度不一。
然后再分别统计每个第一图像子序列所包含的图像帧数,例如,一共分割为10个图像计算子序列,其对应的统计结果可以如表1所示。
表1
第一序列号 帧数
1 10
2 20
3 5
10 8
S207,以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
其中,特征提取指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。同一场景的不同图像所提取的特征应该是相同的。
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
常用的特征提取算法包括LBP特征提取算法、HOG特征提取算法、Haar特征提取算子、LOG边缘提取算法,Harris角点特征提取算法、SIFT特征提取算子、SURF特征提取算法,等。
在本申请实施例中,以所述图像计算子序列为特征提取单位,分别提取各个图像计算子序列所包含的各帧图像的图像特征信息。
S208,基于所述图像特征信息,获取所述视频文件的质量评价结果。
质量评价包括全参考媒体质量评价、半参考媒体质量评价以及无参考媒体质量评价。
全参考媒体质量评价:通过参考视频和测试视频之间的比较来得出测试视频的视频清晰度,并计算得到一个评价分数。这类方法需要整个参考视频,因此它的计算量很大,但通常有最好的评估结果。
半参考媒体质量评价:从原始参考视频和测试视频中提取许多特征,然后仅基于这些特征的比较来得出测试视频的质量。半参考网络视频质量评价方法虽然不要求完整的原始参考视频,但由于需要在网络上传输参考视频的特征,因此需要一路额外的信道来支持,这也限制了半参考质量评价方法的实用性。
无参考媒体质量评价:只分析测试视频,而不需要任何的原始视频信息。这使得无参考评价方法比上述两种方法都更灵活实用,因为在网络视频业务中几乎不可能得到原始视频信息。但这也意味着由于没有参考信息,而对网络视频图像清晰度评价比较困难,是网络视频评价领域的热点与难点。
在本申请实施例中,获取了各个图像计算子序列的图像特征信息后,可采用上述任一媒体质量评价方法对该视频文件进行质量评价,从而可以得到良好的媒体质量评价结果。
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后提取所述至少一个图像计算子序列中各图像计算子序列的图像特征信息。通过将同一场景下的序列归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
请参见图6,为本申请实施例提供的一种图像特征提取方法的流程示意图。本实施例以图像特征提取方法应用于电子设备中来举例说明。该图像特征提取方法可以包括以下步骤:
S301,获取视频文件;
S302,对所述视频文件进行解析,提取所述视频文件中预设编码类型的视频码流;
S303,对所述视频码流进行解码,得到所述视频码流对应的图像序列;
S304,对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
S305,基于所述场景信息,确定所述图像序列对应的至少一个场景;
S306,以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景;
S301~S306具体可参见S201~S206,此处不再赘述。
S307,获取所述至少一个图像计算子序列中各图像计算子序列的图像帧数;
分别统计每个图像计算子序列所包含的图像帧数,例如,一共分割为10个图像计算子序列,其对应的统计结果可以如表1所示。
S308,将图像帧数大于预设帧数阈值的图像计算子序列以所述预设帧数阈值为切分单位进行切分,得到对应的目标图像子序列;
例如,如图7所示,将每个图像计算子序列的帧数(序列长度)分别与预设帧数阈值进行比较,从而找出其中长度大于预设帧数阈值的2、4、5号图像计算子序列,然后再将这3个图像计算子序列以预设帧数阈值为切分单位进行分割,得到相应的目标图像子序列。
又例如,将表1统计结果中的帧数依次与预设帧数阈值(如10)进行比较,找出其中帧数大于10的目标图像计算子序列(如第2个图像计算子序列、第4个图像计算子序列、第5个图像计算子序列),所对应的帧数分别为20、28、35。则将第2个图像计算子序列分割为2个10帧的目标图像子序列,将第4个图像计算子序列分割为2个10帧的目标图像子序列和1个8帧的目标图像子序列,将第5个图像计算子序列分割为3个10帧的目标图像子序列和1个5帧的目标图像子序列,如表2所示。
表2
S309,以所述目标图像子序列为特征提取单位,提取所述目标图像子序列的图像特征信息,同时,提取图像帧数小于或等于预设阈值的图像计算子序列的图像特征信息;
按照上述举例,则分别获取第1个图像计算子序列、第3个图像计算子序列、第6-10个图像计算子序列,以及第2个图像计算子序列、第4个图像计算子序列和第5个图像计算子序列分别对应的目标图像子序列所对应的图像特征信息。
S310,基于所述图像特征信息,获取所述视频文件的质量评价结果结果。
具体可参见S208,此处不再赘述。
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后将其中图像帧数较长的图像计算子序列再进一步切分为短的序列,最后分别提取一次切分后的短序列以及二次切分后的短序列的图像特征信息。通过将同一场景下较短的序列以及同一场景下较长的序列进一步切分后归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参见图8,其示出了本申请一个示例性实施例提供的图像特征提取装置的结构示意图。该图像特征提取装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括图像获取模块10、场景获取模块20、图像切分模块30和特征获取模块40。
图像获取模块10,用于获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
场景获取模块20,用于对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
图像切分模块30,用于基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
特征获取模块40,用于以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
可选的,如图9所示,还包括:
评价获取模块50,用于基于所述至少一个图像计算子序列的图像特征信息,确定所述视频文件的质量评价结果。
可选的,如图10所示,所述图像切分模块30,包括:
场景确定单元301,用于基于所述场景信息,确定所述图像序列对应的至少一个场景;
图像切分单元302,用于以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景。
可选的,如图11所示,所述图像切分模块30,包括:
场景确定单元301,用于基于所述场景信息,确定所述图像序列对应的至少一个场景;
图像切分单元302,用于以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景;
帧数获取模块303,用于获取所述至少一个图像计算子序列中各图像计算子序列的图像帧数;
子序列分割模块304,用于将图像帧数大于预设帧数阈值的图像计算子序列以所述预设帧数阈值为切分单位进行切分,得到对应的目标图像子序列;
所述特征获取模块40,具体用于:
以所述目标图像子序列为特征提取单位,提取所述目标图像子序列的图像特征信息,同时,提取图像帧数小于或等于预设阈值的图像计算子序列的图像特征信息。
可选的,如图12所示,所述图像获取模块10,包括:
文件获取单元101,用于获取视频文件;
文件解析单元102,用于对所述视频文件进行解析,提取所述视频文件中预设编码类型的视频码流。
可选的,所述图像获取模块10,具体用于:
对所述视频码流进行解码,得到所述视频码流对应的图像序列。
需要说明的是,上述实施例提供的图像特征提取装置在执行图像特征提取方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像特征提取装置与图像特征提取方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后将其中图像帧数较长的图像计算子序列再进一步切分为短的序列,最后分别提取一次切分后的短序列以及二次切分后的短序列的图像特征信息。通过将同一场景下较短的序列以及同一场景下较长的序列进一步切分后归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1-图7所示实施例的方法步骤,具体执行过程可以参见图1-图7所示实施例的具体说明,在此不进行赘述。
请参见图13,为本申请实施例提供了一种电子设备的结构示意图。如图13所示,所述电子设备1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
其中,通信总线1002用于实现这些组件之间的连接通信。
其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像特征提取应用程序。
在图13所示的电子设备1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的图像特征提取应用程序,并具体执行以下操作:
获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
在一个实施例中,所述处理器1001在执行提取所述至少一个图像计算子序列的图像特征信息之后,还执行以下操作:
基于所述至少一个图像计算子序列的图像特征信息,确定所述视频文件的质量评价结果。
在一个实施例中,所述处理器1001在执行基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列,具体执行以下操作:
基于所述场景信息,确定所述图像序列对应的至少一个场景;
以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景。
在一个实施例中,所述处理器1001在执行基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列,具体执行以下操作:
基于所述场景信息,确定所述图像序列对应的至少一个场景;
以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景;
获取所述至少一个图像计算子序列中各图像计算子序列的图像帧数;
将图像帧数大于预设帧数阈值的图像计算子序列以所述预设帧数阈值为切分单位进行切分,得到对应的目标图像子序列;
所述处理器1001在执行以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息时,具体执行以下操作:
以所述目标图像子序列为特征提取单位,提取所述目标图像子序列的图像特征信息,同时,提取图像帧数小于或等于预设阈值的图像计算子序列的图像特征信息。
在一个实施例中,所述处理器1001在执行获取视频文件中预设编码类型的视频码流时,具体执行以下操作:
视频文件;
对所述视频文件进行解析,提取所述视频文件中预设编码类型的视频码流。
在一个实施例中,所述处理器1001在执行获取所述视频码流对应的图像序列时,具体执行以下操作:
对所述视频码流进行解码,得到所述视频码流对应的图像序列。
在本申请一个或多个实施例中,通过获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列,对所述图像序列进行场景检测处理,得到所述图像序列对应的至少一个场景信息,再将所述图像序列按照所述至少一个场景信息分割为至少一个图像计算子序列,然后将其中图像帧数较长的图像计算子序列再进一步切分为短的序列,最后分别提取一次切分后的短序列以及二次切分后的短序列的图像特征信息。通过将同一场景下较短的序列以及同一场景下较长的序列进一步切分后归纳到同一特征提取单元,从而可以获得较好的特征提取数据,为获得良好的媒体质量评价结果提供了基础的核心的支撑,进而可以提高媒体质量评价结果的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种图像特征提取方法,其特征在于,所述方法包括:
获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
2.根据权利要求1所述的方法,其特征在于,所述提取所述至少一个图像计算子序列的图像特征信息之后,还包括:
基于所述至少一个图像计算子序列的图像特征信息,确定所述视频文件的质量评价结果。
3.根据权利要求1所述的方法,其特征在于,所述基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列,包括:
基于所述场景信息,确定所述图像序列对应的至少一个场景;
以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景。
4.根据权利要求1所述的方法,其特征在于,所述基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列,包括:
基于所述场景信息,确定所述图像序列对应的至少一个场景;
以所述场景作为切分单位,切分所述图像序列,得到所述至少一个图像计算子序列,其中,所述图像计算子序列中的图像处于同一场景;
获取所述至少一个图像计算子序列中各图像计算子序列的图像帧数;
将图像帧数大于预设帧数阈值的图像计算子序列以所述预设帧数阈值为切分单位进行切分,得到对应的目标图像子序列;
所述以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息,包括:
以所述目标图像子序列为特征提取单位,提取所述目标图像子序列的图像特征信息,同时,提取图像帧数小于或等于预设阈值的图像计算子序列的图像特征信息。
5.根据权利要求1所述的方法,其特征在于,所述获取视频文件中预设编码类型的视频码流,包括:
获取视频文件;
对所述视频文件进行解析,提取所述视频文件中预设编码类型的视频码流。
6.根据权利要求5所述的方法,其特征在于,所述获取所述视频码流对应的图像序列,包括:
对所述视频码流进行解码,得到所述视频码流对应的图像序列。
7.一种图像特征提取装置,其特征在于,所述装置包括:
图像获取模块,用于获取视频文件中预设编码类型的视频码流,获取所述视频码流对应的图像序列;
场景获取模块,用于对所述图像序列进行场景检测处理,确定所述图像序列对应的场景信息;
图像切分模块,用于基于所述场景信息,将所述图像序列切分为至少一个图像计算子序列;
特征获取模块,用于以所述图像计算子序列为特征提取单位,提取所述至少一个图像计算子序列的图像特征信息。
8.根据权利要求7所述的装置,其特征在于,还包括:
评价获取模块,用于基于所述至少一个图像计算子序列的图像特征信息,确定所述视频文件的质量评价结果。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~6任意一项的方法步骤。
10.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~6任意一项的方法步骤。
CN201910682971.1A 2019-07-26 2019-07-26 一种图像特征提取方法、装置、存储介质及电子设备 Pending CN110490845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910682971.1A CN110490845A (zh) 2019-07-26 2019-07-26 一种图像特征提取方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910682971.1A CN110490845A (zh) 2019-07-26 2019-07-26 一种图像特征提取方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN110490845A true CN110490845A (zh) 2019-11-22

Family

ID=68547578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910682971.1A Pending CN110490845A (zh) 2019-07-26 2019-07-26 一种图像特征提取方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN110490845A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233075A (zh) * 2020-09-30 2021-01-15 腾讯科技(深圳)有限公司 视频清晰度评估方法、装置、存储介质及电子设备
CN112749660A (zh) * 2021-01-13 2021-05-04 中国科学院上海微系统与信息技术研究所 一种视频内容描述信息的生成方法和设备
CN112839257A (zh) * 2020-12-31 2021-05-25 四川金熊猫新媒体有限公司 视频内容检测方法、装置、服务器及存储介质
CN112929729A (zh) * 2021-01-21 2021-06-08 北京奇艺世纪科技有限公司 弹幕数据调整方法、装置、设备及存储介质
CN113553469A (zh) * 2020-04-23 2021-10-26 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN113781384A (zh) * 2021-01-21 2021-12-10 北京沃东天骏信息技术有限公司 视频质量评估方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109151468A (zh) * 2017-06-28 2019-01-04 华为技术有限公司 一种图像数据的编码、解码方法及装置
CN109286825A (zh) * 2018-12-14 2019-01-29 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109831680A (zh) * 2019-03-18 2019-05-31 北京奇艺世纪科技有限公司 一种视频清晰度的评价方法及装置
CN110049336A (zh) * 2019-05-22 2019-07-23 腾讯科技(深圳)有限公司 视频编码方法和视频解码方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109151468A (zh) * 2017-06-28 2019-01-04 华为技术有限公司 一种图像数据的编码、解码方法及装置
CN109286825A (zh) * 2018-12-14 2019-01-29 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109831680A (zh) * 2019-03-18 2019-05-31 北京奇艺世纪科技有限公司 一种视频清晰度的评价方法及装置
CN110049336A (zh) * 2019-05-22 2019-07-23 腾讯科技(深圳)有限公司 视频编码方法和视频解码方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BRUCE ALBERT,: "IOS8系统H264视频硬件编解码说明", 《博客园》 *
ETHAN_STRUGGLE,: "ios8系统H264视频硬件编解码说明", 《简书》 *
佚名,: "ios8系统H264视频硬件编解码说明", 《微信公众号》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113553469A (zh) * 2020-04-23 2021-10-26 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN113553469B (zh) * 2020-04-23 2023-12-22 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN112233075A (zh) * 2020-09-30 2021-01-15 腾讯科技(深圳)有限公司 视频清晰度评估方法、装置、存储介质及电子设备
CN112233075B (zh) * 2020-09-30 2024-02-20 腾讯科技(深圳)有限公司 视频清晰度评估方法、装置、存储介质及电子设备
CN112839257A (zh) * 2020-12-31 2021-05-25 四川金熊猫新媒体有限公司 视频内容检测方法、装置、服务器及存储介质
CN112839257B (zh) * 2020-12-31 2023-05-09 四川金熊猫新媒体有限公司 视频内容检测方法、装置、服务器及存储介质
CN112749660A (zh) * 2021-01-13 2021-05-04 中国科学院上海微系统与信息技术研究所 一种视频内容描述信息的生成方法和设备
CN112929729A (zh) * 2021-01-21 2021-06-08 北京奇艺世纪科技有限公司 弹幕数据调整方法、装置、设备及存储介质
CN113781384A (zh) * 2021-01-21 2021-12-10 北京沃东天骏信息技术有限公司 视频质量评估方法和装置
CN112929729B (zh) * 2021-01-21 2023-06-30 北京奇艺世纪科技有限公司 弹幕数据调整方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110490845A (zh) 一种图像特征提取方法、装置、存储介质及电子设备
US9363542B2 (en) Techniques to provide an enhanced video replay
EP0818930B1 (en) Video coding method
KR101776809B1 (ko) 적응적 비디오 디코딩 회로망 및 기술들
CN102724492B (zh) 视频图像传输、播放方法和系统
TW201238356A (en) Adaptive bit rate control based on scenes
KR20190093746A (ko) 신경망을 이용한 컨텐츠 인지 기반 컨텐츠 전송 서버 장치 및 방법
KR20140005261A (ko) 콘텐츠 프로파일링을 사용한 강화된 원격 트랜스코딩을 위한 시스템 및 방법
CN101998051A (zh) 图像显示控制装置、图像处理装置及搭载其的摄像装置
CN103517135A (zh) 一种连续播放mp4格式视频文件的方法、系统及电视
KR20110063004A (ko) 키 프레임 추출 장치 및 방법과 이를 이용한 방송 녹화 장치 및 방법
TWI487366B (zh) 用於無線hd1.1規範中的圖形模式壓縮的位元流語法
CN109819234A (zh) 一种基于h.265的虚拟现实视频传输与播放方法、系统
CN110691246A (zh) 视频编码方法、装置及电子设备
CN105635715A (zh) 视频格式识别方法及装置
WO2024078066A1 (zh) 视频解码方法、视频编码方法、装置、存储介质及设备
CN111464812B (zh) 编码解码的方法、系统、装置、存储介质及处理器
US10750185B2 (en) High speed scalable video coding device and method using multi-track video
WO2021056575A1 (zh) 一种低延迟信源信道联合编码方法及相关设备
JP2024517915A (ja) データ処理方法、装置、コンピュータ機器及びコンピュータプログラム
KR20180093441A (ko) 영상 구조 변경을 통한 워터마크 삽입 장치 및 방법
KR101829262B1 (ko) 문자나 그래픽을 포함한 비디오에 대한 ip패킷 전송방법 및 그 장치
CN111212288A (zh) 视频数据的编解码方法、装置、计算机设备和存储介质
CN115243101B (zh) 视频动静率识别方法、装置、电子设备及存储介质
CN103179469A (zh) 一种带有虚拟现实信息的视频及其加载和解码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191122