CN104219423A - 一种信息处理方法和装置 - Google Patents
一种信息处理方法和装置 Download PDFInfo
- Publication number
- CN104219423A CN104219423A CN201410498530.3A CN201410498530A CN104219423A CN 104219423 A CN104219423 A CN 104219423A CN 201410498530 A CN201410498530 A CN 201410498530A CN 104219423 A CN104219423 A CN 104219423A
- Authority
- CN
- China
- Prior art keywords
- frame
- key frame
- video
- image block
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
本申请实施例提供了一种信息处理方法和装置,所述方法包括:获取视频数据,所述视频数据由连续的多个视频帧组成;从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧;针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块;处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧;利用各个图像块的特征描述子进行视频处理,本申请实施例提高了视频处理的精确度。
Description
技术领域
本申请涉及信息处理技术领域,更具体的说是涉及一种信息处理方法和装置。
背景技术
在进行视频搜索、视频匹配或视频滤波等视频处理时,是基于视频数据的视频帧进行的,例如视频匹配时,是通过比较两个视频数据中的视频帧的相似度进行匹配的。
现有技术中,在进行视频的分析处理时,一种方式是分析视频帧中的像素点,从中选择出多个关键的像素点来代表视频帧,在进行视频处理分析视频帧时,是针对视频帧中若干个关键的像素点进行的。但是现有的这种方式,精确度并不高,会影响视频处理的效果。
发明内容
有鉴于此,本申请提供了一种信息处理方法和装置,用于提高视频处理的精确度,提高视频处理的效果。
为实现上述目的,本申请提供如下技术方案:
一种信息处理方法,所述方法包括:
获取视频数据,所述视频数据由连续的多个视频帧组成;
从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧;
针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块;
处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧;
利用各个图像块的特征描述子进行视频处理。
优选地,所述将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块包括:
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
优选地,所述将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块;
确定所述关键帧中满足第二预设条件的内容;
确定所述满足第二预设条件的内容对应的区域尺寸;
根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
优选地,所述将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块包括:
根据每一个关键帧,获得每一个关键帧对应的N个相同的图像帧;
将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块,其中,每一个图像帧划分得到的图像块数量不同。
优选地,所述将每一个关键帧对应的N个相同图像帧分别进行划分包括:
将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
优选地,所述从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧包括:
按照第一策略,将视频数据划分为多个视频数据段;
在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
一种信息处理装置,所述装置包括:
数据获取模块,用于获取视频数据,所述视频数据由连续的多个视频帧组成;
关键帧选择模块,用于从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧;
块划分模块,用于针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块;
特征描述模块,用于处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧;
处理模块,用于利用各个图像块的特征描述子进行视频处理。
优选地,所述块划分模块具体用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
优选地,所述块划分模块包括:
内容确定模块,用于确定所述关键帧中满足第二预设条件的内容;
区域确定模块,用于确定所述满足第二预设条件的内容对应的区域尺寸;
尺寸确定模块,用于根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
第一划分子模块,用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
优选地,所述块划分模块包括:
图像帧获得模块,用于根据每一个关键帧,获得每一个关键帧对应的N个相同的图像帧;
第二划分子模块,用于将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块,其中,每一个图像帧划分得到的图像块数量不同。
优选地,所述第二划分模块具体将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块;所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
优选地,所述关键帧选择模块包括:
段划分模块,用于按照第一策略,将视频数据划分为多个视频数据段;
关键帧选择子模块,用于在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
经由上述的技术方案可知,与现有技术相比,本申请提供了一种信息处理方法和装置,针对获取的视频数据中的连续的多个视频帧,从中选择满足第一预设条件的视频帧作为关键帧,针对每一个关键帧,将关键进行划分,得到多个图像块,从而可以对图像块进行处理,获得用于描述图像块特征的特征描述子,在进行视频处理时,即处理各个图像块的特征描述子即可。由于将视频帧划分为了多个图像块,按照图像块的特征进行视频处理,多个图像块覆盖了视频帧包含的不同信息,因此可以提高视频处理时的精确度,提高处理效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种信息处理方法一个实施例的流程图;
图2为本申请实施例提供的一种信息处理方法又一个实施例的流程图;
图3a~图3c为本申请实施例中关键帧划分的一种示意图;
图3d为本申请实施例中特征描述子一种表示示意图;
图4为本申请实施例提供的一种信息处理装置一个实施例的结构示意图;
图5为本申请实施例提供的一种信息处理装置又一个实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中,针对获取的视频数据中的连续的多个视频帧,从中选择满足第一预设条件的视频帧作为关键帧,针对每一个关键帧,将关键进行划分,得到多个图像块,从而可以对图像块进行处理,获得用于描述图像块特征的特征描述子,在进行视频处理时,即处理各个图像块的特征描述子即可。由于将视频帧划分为了多个图像块,按照图像块的特征进行视频处理,多个图像块覆盖了视频帧包含的各种不同信息,因此可以提高视频处理时的精确度,提高了处理效果。
下面结合附图,对本申请实施方案进行详细描述。
图1为本申请实施例提供的一种信息处理方法一个实施例的流程图,该方法可以包括以下几个步骤:
101:获取视频数据,所述视频数据由连续的多个视频帧组成。
102:从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧。
103:针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块。
104:处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子。
所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧。
105:利用各个图像块的特征描述子进行视频处理。
在本申请实施例中,针对视频数据中的每一个关键帧,将关键进行划分,得到多个图像块,从而可以对图像块进行处理,获得用于描述图像块特征的特征描述子,这些顺序排列的特征描述子即可以表示关键帧,从而在进行视频处理时,处理各个图像块的特征描述子即可。由于将视频帧划分为多个图像块,按照图像块的特征进行视频处理,使得可以提高处理的精确度,提高了处理效果。
在视频处理过程对视频的处理包括视频搜索、与其他视频进行匹配、对视频进行滤波降噪处理等。
视频搜索可以应用于播放器播放的视频中镜头快进等场景。
视频匹配可以应用于分析两个视频是否有相同的部分等。
现有技术中,视频搜索、视频匹配以及视频滤波等视频处理均是基于视频帧进行的,通过几个关键像素点表示视频帧,这种方式精确度较低。而通过本申请实施例,可以利用视频帧对应的特征描述子进行处理,视频搜索时,可以利用特征描述子进行搜索。视频匹配时,可以分别计算得到两个视频的关键帧对应的特征描述子,通过匹配特征描述子即可。
特别描述子表示图像块的特征,而一帧视频帧对应的各个图像块基本覆盖了视频帧中的不同信息内容,覆盖范围大,在进行视频处理时,精确度会更高。
其中,为了使得关键帧存在突出的内容,在又一个实施例中,所述将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块可以具体是:
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
例如,该预设划分尺寸可以是指将关键帧的长和宽的长度分别按照1:2:1划分得到9个图像块。其中,尺寸最大的图像块位于关键帧的中间,而通常关键帧的中间部分为包含信息量最多以及最重要的部分,因此可以将其对应的图像块的尺寸设置的最大。
当然,该预设划分尺寸还可以是指将关键帧的长和宽的长度分别按照1:1:2划分得到9个图像块,以为了突出关键帧边缘的内容。
该预设划分尺寸还可以是指将关键帧的长和宽的长度分别按照2:4:2划分得到9个图像,或者1:2:2:1划分得到16个图像块等。
其中,作为一种可能的实现方式,将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块可以具体是:
确定所述关键帧中满足第二预设条件的内容;
确定所述满足第二预设条件的内容对应的区域尺寸;
根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
该第二预设条件即可以是指包含的信息量最多的内容,或者包含重要信息的内容。或者根据实际应用情况具体限定,例如实际应用中想要突出边缘内容,该第二预设条件即可以设定为位于关键帧边界的内容,从而使得划分得到的图像块,位于边界的图像块其尺寸最大。
通过不等分划分可以突出关键帧中重点关注的内容,从而可以进一步提高视频处理的精确度。
图2为本申请实施例提供的一种信息处理方法又一个实施例的流程图,该方法可以包括以下几个步骤:
201:获取视频数据,所述视频数据由连续的多个视频帧组成。
202:从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧。
203:针对每一个关键帧,获得每一个关键帧对应的N个相同的图像帧;
204:将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块。
其中,每一个图像帧划分得到的图像块数量不同。
205:处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子。
所述特征描述子用于表示各个图像块的特征。
206:利用各个图像块的特征描述子进行视频处理。
本实施例中,对于每一个关键帧不仅进行一次划分,而是进行N次划分。每一次划分得到的图像块的数量不同。也即将关键帧复制得到N个图像帧,将N个图像帧分别进行划分。
每一个图像帧划分得到的图像块即是关键帧对应的图像块。
其中,将每一个关键帧对应的N个相同的图像帧分别进行划分,具体可以是将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
由于在视频处理过程中,根据不同的实际应用情况,并不要求100%的处理精确度。例如在视频匹配时,一种情况可能两帧视频帧70%相似,即可认为两帧视频帧匹配,另一种情况可能两帧视频帧90%相似,才认为两帧视频帧匹配。而每一个关键帧分别进行了不同的划分,假设不同图像帧分别划分得到图像块为1块、4块、9块,在进行匹配时,根据匹配精确度,在精确度要求不高时,可以利用划分出的4块中的每一块匹配即可,若其中两块相似,则可以认为匹配,而如果采用9块中每一块进行匹配,可能需要至少比较5块才能确定出是否匹配,因此可以降低处理复杂度;在精确度要求高时,可以利用划分出的9块中的每一块匹配即可。因此,通过将关键帧分别进行N次不同的划分,可以使得得到的关键帧对应的特征描述子能够适用于不同的情况,适用范围广,且可以降低处理的复杂度。
且在需要对关键帧对应的9块图像块进行处理时,可以首先对4块图像块进行处理,以初步确定出哪一块或哪几块为本次处理需要重点处理的,进而可以确定出需要处理的位置和方向,再对9块图像块进行处理时,可以只针对需要处理的位置和方向处对应的9块图像块中图像块,进行细化处理即可,无需对9块图像块全部进行处理,从而也可以降低处理复杂度,提高处理效率。
因此,通过本实施例的技术方案,不仅扩大适用范围,且可以降低处理的复杂度,提高处理效率。
在上述各个实施例的描述中,作为一种可能的实现方式,该第一预设条件可以是视频数据中的每一个视频帧均作为关键帧。
通过分析视频数据的每一个视频帧,建立每一视频帧对应的特征描述子。因此,在进行视频处理时,特征描述子基本覆盖了视频数据的全部内容,精确度会更高。
作为另一种可能的实现方式,该第一预设条件可以是指视频数据划分出的每一个视频数据段中,最接近视频数据段内容的视频帧作为关键帧。
因此,该从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧可以包括:
按照第一策略,将视频数据划分为多个视频数据段;
在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
视频数据段的划分可以有多种实现方式。
该第一策略可以是指按照视频镜头进行划分。
也即将视频数据划分为多个视频数据段具体为将视频数据按照镜头划分为多个镜头段,每一个镜头段即为一个视频数据段。
同一摄像机进行连续不间断拍摄,表示时间和空间上的一个连续动作的帧序列称为一个镜头。
视频数据的镜头分割可以采用镜头边界检测方式检测出镜头边界,进而将视频数据再按照镜头分割。
镜头边界的形成是两个镜头进行切换的结果,即边界是由于视频内容的不连续造成的,因此可以据此确定出镜头边界。且镜头边界处的视频帧内容变化比较剧烈。
当然该第一策略还可以是其他的可能情况,对应其他的视频数据段划分的其他实现方式。例如该第一策略还可以是指将视频数据的多个连续视频帧进行等分,每一份即对应一个视频数据段。
最接近所述视频数据段内容的视频帧的确定也可以有多种实现方式:
一种可能的实现方式为:
每间隔M帧,选择所述视频数据段中的视频帧作为候选视频帧;
计算每一候选视频帧与其他候选视频帧的帧差之和;
将帧差之和最小的候选视频帧作为所述视频数据段的关键视频帧。
其中,帧差可以通过计算任意两帧视频帧的每一个像素点的像素值的差值,再将差值求平均得到帧差。
或者分别求得两帧视频帧的特征直方图,利用特征直方图计算得到的帧差,具体的可以按照下述计算得到:
d(H1,H2)=∑min(H1(i),H2(i));
H1,H2表示两个特征直方图,H(i)表示该征直方图第i个bin的值,d(H1,H2)表示两个特征直方图的相交值。
如果两个特征直方图都被归一化到1,则完全匹配时两个特征直方图相交的值是1,完全不匹配时是0。通常使用时,会用1减去该相交值,所以1表示两帧帧差最大,0表示两帧帧差最小。
另一种可能的实现方式为:
可以采用帧平均算法确定,例如可以将一个视频数据段中求其所有视频帧的像素值的平均值,将该视频数据段中最接近该平均值的视频帧作为关键帧。
其中,图像块的特征描述子可以有多种实现方式。
在一种可能的实现方式中,该特征描述子即可以是指建立的图像块的特征直方图。
该特征直方图可以具体是指颜色直方图等、
其中,不同颜色空间可以求不同颜色空间的直方图,如灰度、RGB(Red-Green-Blue,红绿蓝)、HSV((Hue-Saturation-Value,色调-饱和度-亮度)等。因为HSV更符合人眼感知特性,同时相比其他颜色空间来说,其直方图的匹配效果也较优,因此,优选地,该特征直方图可以具体用HSV直方图。
在另一种可能的实现方式,该特征描述子可以是指图像块的SIFT(Scale-invariant feature transform,尺度不变特征转换)特征或者SURF(SpeededUp Robust Features,加速稳健特征)特征。
在又一种可能的实现方式,可以首先建立各个图像块的特征直方图,然后将各个图像块对应的特征直方图量化为多维数据,将每一维数据作为特征描述子,利用各个图像块的特征描述子进行视频处理时,可以具体是:利用每一维数据进行视频处理。
以关键帧为视频数据中最接近每一个镜头段内容的视频帧,将关键帧对应的N个相同的图像帧,分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块为例,其中,所述划分包括将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。具体划分如图3a~图3c所示。
对每一个图像求取特征直方图,每一个特征直方图可以量化为18维数据,14块图像块即共有14*18=252维数据。加上每一个镜头段中视频关键帧的序号,以及起始帧序号和结束帧序号,因此一个关键帧,也即一个镜头段可以采用255维数据进行描述,每一维即是一个特征描述子,如图3d所示。
在利用各个图像块的特征描述子进行视频处理时,即是利用多维数据进行视频处理。例如视频帧匹配,可以通过比较特征描述子确定视频帧是否匹配。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
图4为本申请实施例提供的一种信息处理装置一个实施例的结构示意图,所述装置可以包括:
数据获取模块401,用于获取视频数据,所述视频数据由连续的多个视频帧组成。
关键帧选择模块402,用于从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧。
块划分模块403,用于针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块。
特征描述模块404,用于处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧。
处理模块405,用于利用各个图像块的特征描述子进行视频处理。
在本申请实施例中,针对视频数据中的每一个关键帧,将关键进行划分,得到多个图像块,从而可以对图像块进行处理,获得用于描述图像块特征的特征描述子,这些顺序排列的特征描述子即可以表示关键帧,从而在进行视频处理的视频帧处理时,处理各个图像块的特征描述子即可。由于将视频帧划分为多个图像块,按照图像块的特征进行视频处理,使得可以提高处理的精确度,提高了处理效果。
在视频处理过程对视频的处理包括视频搜索、与其他视频进行匹配、对视频进行滤波降噪处理等。
视频搜索可以应用于播放器播放的视频中镜头快进等场景。
视频匹配可以应用于分析两个视频是否有相同的部分等。
现有技术中,视频搜索、视频匹配以及视频滤波等视频处理均是基于视频帧进行的,通过几个关键像素点表示视频帧,这种方式精确度较低。而通过本申请实施例,可以利用视频帧对应的特征描述子进行处理,视频搜索时,可以利用特征描述子进行搜索。视频匹配时,可以分别计算得到两个视频的关键帧对应的特征描述子,通过匹配特征描述子即可。
特别描述子表示图像块的特征,而一帧视频帧对应的各个图像块基本覆盖了视频帧中的不同信息内容,覆盖范围大,在进行视频处理时,精确度会更高。
其中,为了使得关键帧存在突出的内容,在又一个实施例中,所述块划分模块具体用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
例如,该预设划分尺寸可以是指将关键帧的长和宽的长度分别按照1:2:1划分得到9个图像块。其中,尺寸最大的图像块位于关键帧的中间,而通常关键帧的中间部分为包含信息量最多以及最重要的部分,因此可以将其对应的图像块的尺寸设置的最大。
当然,该预设划分尺寸还可以是指将关键帧的长和宽的长度分别按照1:1:2划分得到9个图像块,以为了突出关键帧一侧边缘的内容。
该预设划分尺寸还可以是指将关键帧的长和宽的长度分别按照2:4:2划分得到9个图像,或者1:2:2:1划分得到16个图像块等。
其中,作为一种可能的实现方式,所述块划分模块可以具体包括:
内容确定模块,用于确定所述关键帧中满足第二预设条件的内容;
区域确定模块,用于确定所述满足第二预设条件的内容对应的区域尺寸;
尺寸确定模块,用于根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
第一划分子模块,用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
该第二预设条件即可以是指包含的信息量最多的内容,或者包含重要信息的内容。或者根据实际应用情况具体限定,例如实际应用中想要突出边缘内容,该第二预设条件即可以设定为位于关键帧边界的内容,从而使得划分得到的图像块,位于边界的图像块其尺寸最大。
通过不等分划分可以突出关键帧中重点关注的内容,从而可以进一步提高视频处理的精确度。
图5为本申请实施例提供的一种信息处理装置又一个实施例的结构示意图,所述装置可以包括数据获取模块401、关键帧选择模块402、块划分模块403、特征描述模块404以及处理模块405,各个模块功能可以参见图4对应实施例,与图4对应的实施例不同之处在于,所述特征描述模块404可以包括:
图像帧获得模块501,用于根据每一个关键帧,获得每一个关键帧对应的N个相同的图像帧。
第二划分子模块502,用于将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块,其中,每一个图像帧划分得到的图像块数量不同。
本实施例中,对于每一个关键帧不仅进行一次划分,而是进行N次划分。每一次划分得到的图像块的数量不同。也即将关键帧复制得到N个图像帧,将N个图像帧分别进行划分。
每一个图像帧划分得到的图像块即是关键帧对应的图像块。
其中,所述第二划分模块可以具体用于将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块;所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
由于在视频处理过程中,根据不同的实际应用情况,并不要求100%的处理精确度。例如在视频匹配时,一种情况可能两帧视频帧70%相似,即可认为两帧视频帧匹配,另一种情况可能两帧视频帧90%相似,才认为两帧视频帧匹配。而每一个关键帧分别进行了不同的划分,假设不同图像帧分别划分得到图像块为1块、4块、9块,在进行匹配时,根据匹配精确度,在精确度要求不高时,可以利用划分出的4块中的每一块匹配即可,若其中两块相似,则可以认为匹配,而如果采用9块中每一块进行匹配,可能需要至少比较5块才能确定出是否匹配,因此可以降低处理复杂度;在精确度要求高时,可以利用划分出的9块中的每一块匹配即可。因此,通过将关键帧分别进行N次不同的划分,可以使得得到的关键帧对应的特征描述子能够适用于不同的情况,适用范围广,且可以降低处理的复杂度。
且在需要对关键帧对应的9块图像块进行处理时,可以首先对4块图像块进行处理,以初步确定出哪一块或哪几块为本次处理需要重点处理的,进而可以确定出需要处理的位置和方向,再对9块图像块进行处理时,可以只针对需要处理的位置和方向处对应的9块图像块中图像块,进行细化处理即可,无需对9块图像块全部进行处理,从而也可以降低处理复杂度,提高处理效率。
因此,通过本实施例的技术方案,不仅扩大适用范围,且可以降低处理的复杂度,提高处理效率。
在上述各个实施例的描述中,作为一种可能的实现方式,该第一预设条件可以是视频数据中的每一个视频帧均作为关键帧。
通过分析视频数据的每一个视频帧,建立每一视频帧对应的特征描述子。因此,在进行视频处理时,特征描述子基本覆盖了视频数据的全部内容,精确度会更高。
作为另一种可能的实现方式,该第一预设条件可以是指视频数据划分出的每一个视频数据段中,最接近视频数据段内容的视频帧作为关键帧。
因此,所述关键帧选择模块可以包括:
段划分模块,用于按照第一策略,将视频数据划分为多个视频数据段;
关键帧选择子模块,用于在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
视频数据段的划分可以有多种实现方式。
该第一策略可以是指按照视频镜头进行划分。
也即将视频数据划分为多个视频数据段具体为将视频数据按照镜头划分为多个镜头段,每一个镜头段即为一个视频数据段。
同一摄像机进行连续不间断拍摄,表示时间和空间上的一个连续动作的帧序列称为一个镜头。
视频数据的镜头分割可以采用镜头边界检测方式检测出镜头边界,进而将视频数据再按照镜头分割。
镜头边界的形成是两个镜头进行切换的结果,即边界是由于视频内容的不连续造成的,因此可以据此确定出镜头边界。且镜头边界处的视频帧内容变化比较剧烈。
当然该第一策略还可以是其他的可能情况,对应其他的视频数据段划分的其他实现方式。例如该第一策略还可以是指将视频数据的多个连续视频帧进行等分,每一份即对应一个视频数据段。
最接近所述视频数据段内容的视频帧的确定也可以有多种实现方式:
一种可能的实现方式为:
每间隔M帧,选择所述视频数据段中的视频帧作为候选视频帧;
计算每一候选视频帧与其他候选视频帧的帧差之和;
将帧差之和最小的候选视频帧作为所述视频数据段的关键视频帧。
其中,帧差可以通过计算任意两帧视频帧的每一个像素点的像素值的差值,再将差值求平均得到帧差。
或者分别求得两帧视频帧的特征直方图,利用特征直方图计算得到的帧差,具体的可以按照下述计算得到:
d(H1,H2)=∑min(H1(i),H2(i));
H1,H2表示两个特征直方图,H(i)表示该征直方图第i个bin的值,d(H1,H2)表示两个特征直方图的相交值。
如果两个特征直方图都被归一化到1,则完全匹配时两个特征直方图相交的值是1,完全不匹配时是0。通常使用时,会用1减去该相交值,所以1表示两帧帧差最大,0表示两帧帧差最小。
另一种可能的实现方式为:
可以采用帧平均算法确定,例如可以将一个视频数据段中求其所有视频帧的像素值的平均值,将该视频数据段中最接近该平均值的视频帧作为关键帧。
其中,图像块的特征描述子可以有多种实现方式。
在一种可能的实现方式中,该特征描述子即可以是指建立的图像块的特征直方图。
该特征直方图可以具体是指颜色直方图等、
其中,不同颜色空间可以求不同颜色空间的直方图,如灰度、RGB(Red-Green-Blue,红绿蓝)、HSV((Hue-Saturation-Value,色调-饱和度-亮度)等。因为HSV更符合人眼感知特性,同时相比其他颜色空间来说,其直方图的匹配效果也较优,因此,优选地,该特征直方图可以具体用HSV直方图。
在另一种可能的实现方式,该特征描述子可以是指图像块的SIFT(Scale-invariant feature transform,尺度不变特征转换)特征或者SURF(SpeededUp Robust Features,加速稳健特征)特征。
在又一种可能的实现方式,可以首先建立各个图像块的特征直方图,然后将各个图像块对应的特征直方图量化为多维数据,将每一维数据作为特征描述子,利用各个图像块的特征描述子进行视频处理时具体是:利用每一维数据进行视频处理。
以关键帧为视频数据中最接近每一个镜头段内容的视频帧,将关键帧对应的N个相同的图像帧,分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块为例,其中,所述划分包括将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
对每一个图像求取特征直方图,每一个特征直方图可以量化为18维数据,14块图像块即共有14*18=252维数据。加上每一个镜头段中视频关键帧的序号,以及起始帧序号和结束帧序号,因此一个关键帧,也即一个镜头段可以采用255维数据进行描述,每一维即是一个特征描述子。
在利用各个图像块的特征描述子进行视频处理时,即是利用多维数据进行视频处理。例如视频帧匹配,可以通过比较特征描述子确定视频帧是否匹配。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种信息处理方法,其特征在于,所述方法包括:
获取视频数据,所述视频数据由连续的多个视频帧组成;
从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧;
针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块;
处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧;
利用各个图像块的特征描述子进行视频处理。
2.根据权利要求1所述的方法,其特征在于,所述将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块包括:
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
3.根据权利要求2所述的方法,其特征在于,所述将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块;
确定所述关键帧中满足第二预设条件的内容;
确定所述满足第二预设条件的内容对应的区域尺寸;
根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
4.根据权利要求1所述的方法,其特征在于,所述将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块包括:
根据每一个关键帧,获得每一个关键帧对应的N个相同的图像帧;
将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块,其中,每一个图像帧划分得到的图像块数量不同。
5.根据权利要求4所述的方法,其特征在于,所述将每一个关键帧对应的N个相同图像帧分别进行划分包括:
将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
6.根据权利要求1所述的方法,其特征在于,所述从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧包括:
按照第一策略,将视频数据划分为多个视频数据段;
在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
7.一种信息处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取视频数据,所述视频数据由连续的多个视频帧组成;
关键帧选择模块,用于从所述连续的多个视频帧中选择满足第一预设条件的视频帧,作为关键帧;
块划分模块,用于针对每一个关键帧,将每一个关键帧进行划分,获得每一个关键帧对应的多个图像块;
特征描述模块,用于处理每一个关键帧对应的各个图像块,获得各个图像块对应的特征描述子,所述特征描述子用于表示各个图像块的特征;按照顺序排列的所述特征描述子用于表示所述关键帧;
处理模块,用于利用各个图像块的特征描述子进行视频处理。
8.根据权利要求7所述的装置,其特征在于,所述块划分模块具体用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
9.根据权利要求8所述的装置,其特征在于,所述块划分模块包括:
内容确定模块,用于确定所述关键帧中满足第二预设条件的内容;
区域确定模块,用于确定所述满足第二预设条件的内容对应的区域尺寸;
尺寸确定模块,用于根据所述区域尺寸,获得图像块的预设划分尺寸,所述预设划分尺寸中最大尺寸对应的图像块包含所述关键帧中满足第二预设条件的内容;
第一划分子模块,用于将每一个关键帧按照预设划分尺寸进行不等分划分,获得每一个关键帧对应的多个图像块。
10.根据权利要求7所述的装置,其特征在于,所述块划分模块包括:
图像帧获得模块,用于根据每一个关键帧,获得每一个关键帧对应的N个相同的图像帧;
第二划分子模块,用于将每一个关键帧对应的N个相同的图像帧分别进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块,其中,每一个图像帧划分得到的图像块数量不同。
11.根据权利应要求10所述的装置,其特征在于,所述第二划分模块具体将每一个关键帧对应的N个相同的图像帧按照不同的预设划分尺寸进行划分,获得每一个关键帧对应的由图像帧划分得到的图像块;所述预设划分尺寸至少包括:将一个图像帧不进行划分得到一个图像块;将另一个图像帧的长和宽的长度分别按照1:1划分得到4个图像块;以及将又一个图像帧长和宽的长度分别按照1:2:1划分得到9个图像块。
12.根据权利要求7所述的装置,其特征在于,所述关键帧选择模块包括:
段划分模块,用于按照第一策略,将视频数据划分为多个视频数据段;
关键帧选择子模块,用于在每一个视频数据段中,按照第二策略,选择最接近所述视频数据段内容的视频帧作为关键帧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410498530.3A CN104219423B (zh) | 2014-09-25 | 2014-09-25 | 一种信息处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410498530.3A CN104219423B (zh) | 2014-09-25 | 2014-09-25 | 一种信息处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104219423A true CN104219423A (zh) | 2014-12-17 |
CN104219423B CN104219423B (zh) | 2017-09-29 |
Family
ID=52100525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410498530.3A Active CN104219423B (zh) | 2014-09-25 | 2014-09-25 | 一种信息处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104219423B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504121A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇艺世纪科技有限公司 | 一种视频检索方法及装置 |
CN105979267A (zh) * | 2015-12-03 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种视频压缩、播放方法以及装置 |
CN117058742A (zh) * | 2023-09-26 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 一种人脸伪造的检测方法、装置、电子设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110071209A (ko) * | 2009-12-21 | 2011-06-29 | 한국전자통신연구원 | 계층적 영상블록의 대칭정보를 이용한 비디오 식별 방법 및 장치 |
CN103093458A (zh) * | 2012-12-31 | 2013-05-08 | 清华大学 | 关键帧的检测方法及装置 |
CN103390040A (zh) * | 2013-07-17 | 2013-11-13 | 南京邮电大学 | 一种视频拷贝检测方法 |
CN103593464A (zh) * | 2013-11-25 | 2014-02-19 | 华中科技大学 | 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 |
US20140071230A1 (en) * | 2012-09-10 | 2014-03-13 | Hisense Co. Ltd. | 3d video conversion system and method, key frame selection method and apparatus thereof |
-
2014
- 2014-09-25 CN CN201410498530.3A patent/CN104219423B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110071209A (ko) * | 2009-12-21 | 2011-06-29 | 한국전자통신연구원 | 계층적 영상블록의 대칭정보를 이용한 비디오 식별 방법 및 장치 |
US20140071230A1 (en) * | 2012-09-10 | 2014-03-13 | Hisense Co. Ltd. | 3d video conversion system and method, key frame selection method and apparatus thereof |
CN103093458A (zh) * | 2012-12-31 | 2013-05-08 | 清华大学 | 关键帧的检测方法及装置 |
CN103390040A (zh) * | 2013-07-17 | 2013-11-13 | 南京邮电大学 | 一种视频拷贝检测方法 |
CN103593464A (zh) * | 2013-11-25 | 2014-02-19 | 华中科技大学 | 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504121A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇艺世纪科技有限公司 | 一种视频检索方法及装置 |
CN105979267A (zh) * | 2015-12-03 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种视频压缩、播放方法以及装置 |
WO2017092340A1 (zh) * | 2015-12-03 | 2017-06-08 | 乐视控股(北京)有限公司 | 一种视频压缩、播放方法以及装置 |
CN117058742A (zh) * | 2023-09-26 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 一种人脸伪造的检测方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104219423B (zh) | 2017-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11194854B2 (en) | Media fingerprinting and identification system | |
Liang et al. | Objective quality prediction of image retargeting algorithms | |
Zhang et al. | Multiple-level feature-based measure for retargeted image quality | |
Hua et al. | Similarity measure for image resizing using SIFT feature | |
Krig et al. | Image pre-processing | |
US10249029B2 (en) | Reconstruction of missing regions of images | |
US20120269429A1 (en) | Apparatus and method for searching image | |
Kim et al. | Adaptive weighted fusion with new spatial and temporal fingerprints for improved video copy detection | |
Yeh et al. | Relative features for photo quality assessment | |
Déniz et al. | Fast and accurate global motion compensation | |
Fang et al. | Saliency-based image retargeting in the compressed domain | |
CN104219423A (zh) | 一种信息处理方法和装置 | |
JP6387026B2 (ja) | 書籍探索装置、方法及びプログラム | |
Ma et al. | How does the shape descriptor measure the perceptual quality of the retargeting image? | |
KR102121534B1 (ko) | 시퀀스 간의 유사성을 결정하는 방법 및 디바이스 | |
Pal et al. | How do warm colors affect visual attention? | |
CN105120335A (zh) | 一种处理电视节目图片的方法和装置 | |
Tsingalis et al. | Shot type characterization in 2D and 3D video content | |
Xiang et al. | Scale-space saliency detection in combined color space | |
Rouhi et al. | A compressed-domain robust descriptor for near duplicate video copy detection | |
Zhang et al. | Object-level saliency detection based on spatial compactness assumption | |
JP6387028B2 (ja) | 探索書籍表示装置、方法及びプログラム | |
Afshar et al. | Image retargeting quality assessment using structural similarity and information preservation rate | |
Kim et al. | Image indexing technique using entropy measures with multilevel multiresolution approach | |
JP6387027B2 (ja) | 書籍探索装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |