CN107633023B - 一种图像去重方法和装置 - Google Patents

一种图像去重方法和装置 Download PDF

Info

Publication number
CN107633023B
CN107633023B CN201710743275.8A CN201710743275A CN107633023B CN 107633023 B CN107633023 B CN 107633023B CN 201710743275 A CN201710743275 A CN 201710743275A CN 107633023 B CN107633023 B CN 107633023B
Authority
CN
China
Prior art keywords
frame
image frame
image
redundant
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710743275.8A
Other languages
English (en)
Other versions
CN107633023A (zh
Inventor
史培培
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710743275.8A priority Critical patent/CN107633023B/zh
Publication of CN107633023A publication Critical patent/CN107633023A/zh
Application granted granted Critical
Publication of CN107633023B publication Critical patent/CN107633023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种图像去重方法和装置,涉及图像处理技术领域。所述方法,包括:获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,以及在以图搜剧时返回的检索结果中包含大量的重复点位信息,影响用户的视频检索体验的技术问题。取得了有效避免存储空间浪费,以及提高用户的视频检索体验的有益效果。

Description

一种图像去重方法和装置
技术领域
本发明涉及图像处理技术领域,具体涉及一种图像去重方法和装置。
背景技术
随着互联网的发展,视频网站不断崛起,通过图片从视频数据库中检索所需的影视剧资源具有很大的研究价值和商业应用。
在以图搜剧项目中,用户希望能够通过图片的方式在视频数据库中找到相应的影视资源。以图搜剧过程中,可以在后台图片库中检索与用户输入图片相匹配的图片,进而基于检索到的图片在视频数据库中找到相应的影视资源。其中的图片库是由视频数据库抽帧得到的,一般情况下可以通过等间隔抽帧或者镜头检测的方法来构建图片库。但是这两种方法都存在一定的缺陷:第一,采用等间隔抽帧的方法,即每隔固定的间隔取一帧图像,这种方法没有考虑图像之间的相关性,当镜头变化较慢时会产生大量的相似图像,因此会导致基于同一输入图像在视频数据库中进行检索时会返回多个重复的视频数据信息;第二,采用镜头检测的方法,即将视频切分为多个镜头,然后每个镜头取固定数目帧数的图像,然而镜头检测对图像本身变化的刻画能力是有限的,并不能很好的描述各帧图像之前的相似性。
有上述分析可知,由于视频的数目巨大,因此后台图片库的规模也很大,而且其中包含了大量的相似图片,一方面会造成存储空间的浪费;另一方面,容易导致在检索过程中返回的检索结果中包含大量的重复点位信息,影响用户的视频检索体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像去重方法和相应的一种图像去重装置。
依据本发明的一个方面,提供了一种图像去重方法,包括:
获取对应同一视频数据的所有图像帧;
获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;
基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;
如果所述图像帧是冗余帧,则将所述图像帧删除。
可选地,所述获取所述图像帧的深度特征的步骤,包括:
从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。
可选地,所述预设深度特征计算模型包括卷积神经网络模型。
可选地,所述基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧的步骤,包括:
判断所述图像帧是否为相应视频数据对应的第一个图像帧;
如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;
如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;
判断所述余弦距离是否大于预设数值;如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
可选地,所述预设数值为0.1。
根据本发明的另一方面,提供了一种图像去重装置,包括:
图像帧获取模块,用于获取对应同一视频数据的所有图像帧;
深度特征获取模块,用于获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;
冗余帧判断模块,用于基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;
冗余帧删除模块,用于如果所述图像帧是冗余帧,则将所述图像帧删除。
可选地,所述深度特征获取模块,还用于从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。
可选地,所述预设深度特征计算模型包括卷积神经网络模型。
可选地,所述冗余帧判断模块,包括:
第一帧图像判断子模块,用于判断所述图像帧是否为相应视频数据对应的第一个图像帧;
非冗余帧确定子模块,用于如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;
余弦距离计算子模块,用于如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;
余弦距离判断子模块,用于判断所述余弦距离是否大于预设数值;
冗余帧确定子模块,用于如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
可选地,所述预设数值为0.1。
针对在先技术,本发明具备如下优点:
本发明提供了一种图像去重方法和装置,可以获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。由此解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,以及在以图搜剧时返回的检索结果中包含大量的重复点位信息,影响用户的视频检索体验的技术问题。取得了有效避免存储空间浪费,以及提高用户的视频检索体验的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种图像去重方法的步骤流程图;
图2示出了根据本发明一个实施例的一种图像去重方法的步骤流程图;
图3示出了根据本发明一个实施例的一种图像去重装置的结构示意图;以及
图4示出了根据本发明一个实施例的一种图像去重装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
详细介绍本发明实施例提供的一种图像去重方法。
参照图1,示出了本发明实施例中一种图像去重方法的步骤流程图。
步骤110,获取对应同一视频数据的所有图像帧。
如前述,在实际应用中,为了方便进行以图搜剧,可以基于不同的视频数据通过等间隔抽帧或者镜头检测等方法从各个视频数据中抽取图像帧。那么在以图搜剧时,则可以根据用户的输入图像,从各个图像帧中检索与输入图像匹配的图像帧,进而可以基于检索得到的图像帧获取与该图像帧匹配的视频数据作视频检测结果返回至用户。但是在从视频数据中提取图像帧的时候,容易提取多个相似度极高的图像帧,那么如果用户输入图像与多个相似度极高的图像帧都匹配,那么返回的检索结果中则会包含多个相同的视频数据,从而给用户带了视觉困扰。因此,在本申请实施例中,为了尽可能避免返回多个重复的视频数据,可以对同一视频数据的图像帧进行去重处理。那么首先则需要获取对应同一视频数据的所有图像帧。其中的视频数据可以包括但不限于电影视频数据、录像视频数据、电视剧视频数据等等,对此本申请实施例不加以限定。
在实际应用中,可以预先设置一预设图片库,在预设图片库中存储各视频数据提取的图像帧,而且在提取图像帧时,即可以确定各图像帧与视频数据之间的对应关系,那么此时则可以从预设图片库中分别获取对应同一视频数据的所有图像帧。其中的预设图片库可以位于移动终端本地,也可以位于云端服务器等等任何可用存储空间,对此本申请实施例不加以限定。但是一般而言,由于预设图片库中需要存储的数据量较大,所以优选地会将预设图片库设置于云端服务器中。当然,在本申请实施例中,也可以采用其他任何可用方式存储各视频数据的图像帧,对此本申请实施例不加以限定。
步骤120,获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量。
在本申请实施例中,可以基于各图像帧的深度特征对图像帧进行去重处理,因此还需要获取各图像帧的深度特征。其中的,深度特征包括但不限于基于图像帧获取的用以表征各图像帧之间相似性的特征向量。具体的深度特征可以包括但不限于图像帧中某些特定参数、属性等等。深度特征可以为向量,当然也可以为其数据类型,对此本申请实施例不加以限定。在本申请实施例中,可以预先定义深度特征的内容,对此本申请实施例不加以限定。在本申请实施例中,可以利用预设的深度特征计算模型获取各个图像帧的深度特征,其中的深度特征计算模型可以为现有的已训练完成的模型,例如ResNet(残差网络)模型、Inception模型、Xception(extreme inception)模型,等等。当然,在本申请实施例中,也可以自定义并训练深度特征计算模型,那么此时可以利用自己构建的数据集训练自定义的深度特征计算模型,对此本申请实施例不加以限定。其中的数据集则可以根据训练需求进行预先设置,对此本申请实施例也不加以限定。
而且,在实际应用中,深度特征计算模型可以包含多个层,例如神经网络模型可以包含输入层、输出层以及至少一层中间层,其中各层的输出并不完全相同,那么在本申请实施例中,还可以深度特征计算模型中任一层的输出向量作为图像帧的深度特征,对此本申请实施例不加以限定。
另外,在本申请实施例中,也可以预先设置一预设特征库,用以存储已计算得到的各图像帧的深度特征,那么则可以从预设特征库中获取图像帧的深度特征。其中预设特征库也可以位于移动终端本地,或者是云端服务器等等任何可用存储空间,对此本申请实施例不加以限定。
步骤130,基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧。
在获取各图像帧的深度特征之后,则可以基于图像帧的深度特征,判断各图像帧是否为冗余帧。如前述,如果针对同一视频数据的多个图像帧之间的相似度比较高,那么则可以确定该多个图像帧中存在冗余帧。例如,假设针对同一视频数据的N个图像帧之间的相似度比较高,那么其中的N-1各图像帧则为冗余帧。在本申请实施例中,可以利用各个图像帧的深度特征表征相应的图像帧,然后基于图像帧的深度特征,判断相应图像帧是否为冗余帧。
具体的可以比较各个图像帧的深度特征,如果两个图像帧之间的深度特征近似度超过预设程度,则可以确定该两个图像帧之间的任意一个为冗余帧。其中的预设程度可以根据需求在本步骤之前,或者是本步骤之前的的任一步骤之前进行设定,对此本申请实施例不加以限定。
而且,在本申请实施例中,可以基于图像帧的深度特征,以任意两个图像帧为一组,分别比较各个组合中的图像帧是否为冗余帧。例如,假设获取的对应同一视频数据的所有图像帧为图像帧A、图像帧B、图像帧C,那么此时则可以分别基于各个图像帧的深度特征判断图像帧A和图像帧B中是否存在冗余帧、图像帧A和图像帧C中是否存在冗余帧、图像帧B和图像帧C中是否存在冗余帧。当然,如果在前一次的判断过程中已确定某一图像帧为冗余帧,那么此时则可以直接将该冗余帧删除,那么此时则不会判断包含删除的冗余帧在内的组合中是否存在冗余帧。例如,对于前述的图像帧A、图像帧B、图像帧C,如果确定图像帧A和图像帧B中存在冗余帧,那么此时可以删除其中的图像帧A或者是图像帧B,假设此时将图像帧B作为冗余帧进行了删除,那么后续在判断过程中,则无需判断图像帧B和图像帧C中是否存在冗余帧,而只判断图像帧A和图像帧C中是否存在冗余帧即可。
但是在实际应用中,对于同一视频数据而言,在抽取图像帧时,一般而言在视频数据中位置比较接近的图像帧之间的相似度较高的可能性更大,也即在视频数据中位置比较接近的多个图像帧之间存在冗余帧的可能性更大,而在视频数据中位置比较分散的多个图像帧之间存在冗余帧的可能性很小,因此在本申请实施例中,为了提高确定冗余帧的效率,可以按照各个图像帧在视频数据中的位置顺序,以后一个图像帧与前一图像帧进行比较,逐帧判断各个图像帧是否为冗余帧。
例如,对于前述的图像帧A、图像帧B、图像帧C,假设各个图像帧在视频数据中的位置前后顺序为图像帧A、图像帧B、图像帧C,那么可以先判断图像帧A是否为冗余帧,基于图像帧的深度特征,将图像帧B与图像帧A进行比较,确定图像帧B是否为冗余帧,将图像帧C与图像帧B进行比较,确定图像帧C是否为冗余帧。当然,同样的,如果确定其中一个为冗余帧并删除之后,那么此时对于其后的图像帧,则可以与被删除的冗余帧的前一未被删除的图像帧进行比较,其确定其后的图像帧是否为冗余帧。例如,假设确定图像帧A为非冗余帧,而确定图像帧B为冗余帧并删除,那么则可以将图像帧C与图像帧A进行比较,确定图像帧C是否为冗余帧。而如果对于确定的冗余帧不立即进行删除,那么也可以按照原来的方式进行比较,对此本申请实施例不加以限定。
步骤140,如果所述图像帧是冗余帧,则将所述图像帧删除。
对于确定是冗余帧的图像帧而言,其存在并无有效价值,反而会占用较多的存储空间,因此可以将确定为冗余帧的图像帧删除。而如果图像帧为非冗余帧,则需要保留该图像帧。
在本发明实施例中,可以获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。由此解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,从而能够有效避免存储空间浪费,以及提高用户进行以图搜剧的视频检索体验。
实施例二
详细介绍本发明实施例提供的一种图像去重方法。
参照图2,示出了本发明实施例中一种图像去重方法的步骤流程图。
步骤210,获取对应同一视频数据的所有图像帧。
步骤220,从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。
如前述,在本申请实施例中,可以预先构建一预设特征库用以存储各图像帧的深度特征,那么则可以从预设特征库中获取各图像帧的深度特征。而且,在本申请实施例中,在从各个视频数据中抽取得到相应视频数据对应的图像帧之后,则可以获取各个图像帧的深度特征并存储于预设特征库中。
具体的可以图像帧作为预设深度特征计算模型的输入,以预设深度特征计算模型中预设层的输出作为该图像帧的深度特征。其中的预设深度特征计算模型可以为现有的已训练完成的模型,例如ResNet(残差网络)模型、Inception模型、Xception(extremeinception)模型,等等。当然,在本申请实施例中,也可以自定义并训练深度特征计算模型,那么此时可以利用自己构建的数据集(至少一个已定义深度特征的图像帧)训练自定义的深度特征计算模型,对此本申请实施例不加以限定。
而且,在实际应用中,深度特征计算模型可以包含多个层,例如神经网络模型可以包含输入层、输出层以及至少一层中间层,其中各层的输出并不完全相同,那么在本申请实施例中,还可以深度特征计算模型中预设层的输出向量作为图像帧的深度特征,对此本申请实施例不加以限定。其中的预设层也可以根据需求进行预先设置,对此本申请实施例不加以限定。
可选地,在本申请实施例中,所述预设深度特征计算模型包括卷积神经网络模型。
在本申请实施例中,预设深度特征计算模型可以包括但不限于模糊数学模型、卷积神经网络模型等等任何可用模型。但是相对而言,以卷积神经网络模型得到的深度特征准确度更高,因此优选地可以设置预设深度特征计算模型为卷积神经网络模型,但是卷积神经网络模型的具体结构可以根据需求进行预先设置,对此本申请实施例不加以限定。而且,在本申请实施例中,可以利用前述的ResNet(残差网络)模型、Inception模型等等现有的已训练完成的卷积神经网络模型作为预设深度特征计算模型,也可以自定义设置并训练得到的卷积神经网络模型作为预设深度特征计算模型,对此本申请实施例也不加以限定。
步骤230,判断所述图像帧是否为相应视频数据对应的第一个图像帧。
在本申请实施例中,如果以各图像帧在视频数据中的位置先后顺序,逐帧判断各图像帧是否为冗余帧,那么对于视频数据对应的第一个图像帧,也即该视频数据对应的全部图像帧中在视频数据中的位置最靠前的图像帧,其之前没有参照对象,那么在本申请实施例中,则可以确认其为非冗余帧。
因此,在本申请实施例中,需要判断获取的对应同一视频数据的各图像帧是否为相应视频数据对应的第一个图像帧。在实际应用中,在从视频数据中抽取图像帧时,一般是按照从前向后的顺序抽取图像帧,那么则可以按照各图像帧的抽取时间顺序进行对相应图像帧进行标号,即为帧号,可以看出帧号可以代表图像帧在视频数据中的位置信息。具体的可以设置帧号越大,其对应的图像帧在视频数据中位置越靠前,那么此时则可以判断相应图像帧的帧号是否为最大值,如果是则说明该图像帧为相应视频数据对应的第一个图像帧。也可以设置帧号越小,其对应的图像帧在视频数据中的位置越靠前,那么此时则可以判断相应图像帧的帧号是否为最小值,如果是则说明该图像帧为相应视频数据对应的第一个图像帧,对此本申请实施例不加以限定。
另外,在本申请实施例中,还可以在获取得到对应同一视频数据的全部图像帧之后,将图像帧按照帧号的大小进行排序,此时则可以直接根据各图像帧的帧号确定其中的第一个图像帧为非冗余帧。
步骤240,如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧。
步骤250,如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离。
而对于不是相应视频数据对应的第一个图像帧的其他图像帧而言,则可以基于当前图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离,确定当前图像帧是否为冗余帧。
在本申请实施例中,所述余弦距离可以通过如下公式计算得到:
Figure BDA0001389583320000101
其中,d为所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离,Fm为所述图像帧的深度特征,Fm-1为所述图像帧的前一帧图像帧的深度特征,||Fm||为Fm的范数,||Fm-1||为Fm-1的范数。当然也可以采用其他任何可用方法计算余弦距离,对此本申请实施例不加以限定。
步骤260,判断所述余弦距离是否大于预设数值。
其中的预设数值可以根据需求在本步骤之前,或者是本步骤之前的任一步骤之前进行设定,对此本申请实施例不加以限定。
可选地,在本申请实施例中,所述预设数值为0.1。此时,基于给预设数值判断冗余帧的精确度以及合理性相对较高。
步骤270,如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
在本申请实施例中,可以利用当前图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离,表征当前图像帧与其前一帧图像帧之间的差别,余弦距离与差别成正比,因此如果余弦距离不大于预设数值,则说明当前图像帧与其前一帧图像帧之间的差别较小,进一步可以确认当前图像帧为冗余帧。而如果余弦距离大于预设数值,则确认当前图像帧为非冗余帧。
需要说明的是,在本申请实施例中,也可以相应视频数据对应的最后一个图像帧为非冗余帧,然后以倒序方式依次判断当前图像帧的深度特征与其后一图像帧的深度特征之间的余弦距离是否大于预设数值,如果不大于则可以确认当前图像帧为冗余帧;或者也可以相应视频数据对应的中间位置任一图像帧为非冗余帧,对于该图像帧之后的各个图像帧,则可以正序方式,依次判断当前图像帧的深度特征与其前一图像帧的深度特征之间的余弦距离是否大于预设数值,如果不大于则可以确认当前图像帧为冗余帧,对于该图像帧之前的各个图像帧,则可以倒序方式依次判断当前图像帧的深度特征与其后一图像帧的深度特征之间的余弦距离是否大于预设数值,如果不大于则可以确认当前图像帧为冗余帧;等等,对此本申请实施例不加以限定。
步骤280,如果所述图像帧是冗余帧,则将所述图像帧删除。
如前述,在本申请实施例中,可以预先设置一用以存储图像帧的预设图片库,以及用以存储图像帧的深度特征的预设特征库。而对于冗余帧而言,其深度特征也没有继续存储的必要,因此如果确认图像帧为冗余帧,则可以将该图像帧从用以存储图像帧的预设图片库中删除,同时将该图像帧的深度特征从预设特征库中删除。从而可以有效避免对存储空间的浪费。
在本发明实施例中,可以获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。由此解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,从而能够有效避免存储空间浪费,以及提高用户进行以图搜剧的视频检索体验。
而且,在本发明实施例中,还可以从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。而且所述预设深度特征计算模型包括卷积神经网络模型。从而可以进一步提高图像数据的深度特征的准确性以及有效性。
另外,在本发明实施例中,还可以判断所述图像帧是否为相应视频数据对应的第一个图像帧;如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;判断所述余弦距离是否大于预设数值;如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。而且可以优选地设置预设数值为0.1。可以进一步提高对冗余帧判断的准确度。
进一步地,在本发明实施例中,还可以将所述图像帧从用以存储所述图像帧的预设图片库中删除,同时将所述图像帧的深度特征从所述预设特征库中删除。从而可以进一步避免对存储空间的浪费。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例三
详细介绍本发明实施例提供的一种图像去重装置。
参照图3,示出了本发明实施例中一种图像去重装置的结构示意图。
所述图像去重装置300包括:
图像帧获取模块310,用于获取对应同一视频数据的所有图像帧。
深度特征获取模块320,用于获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;
冗余帧判断模块330,用于基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧。
冗余帧删除模块340,用于如果所述图像帧是冗余帧,则将所述图像帧删除。
在本发明实施例中,可以获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。由此解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,从而能够有效避免存储空间浪费,以及提高用户进行以图搜剧的视频检索体验。
实施例四
详细介绍本发明实施例提供的一种图像去重装置。
参照图4,示出了本发明实施例中一种图像去重装置的结构示意图。
所述图像去重装置400可以包括:
图像帧获取模块410,用于获取对应同一视频数据的所有图像帧。
深度特征获取模块420,用于获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量。
可选地,在本申请实施例中,所述深度特征获取模块420,还用于从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。
可选地,在本申请实施例中,所述预设深度特征计算模型包括卷积神经网络模型。
冗余帧判断模块430,用于基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧。
可选地,在本申请实施例中,所述冗余帧判断模块430,进一步可以包括:
第一帧图像判断子模块431,用于判断所述图像帧是否为相应视频数据对应的第一个图像帧。
非冗余帧确定子模块432,用于如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧。
余弦距离计算子模块433,用于如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离。
可选地,在本申请实施例中,所述余弦距离可以通过如下公式计算得到:
Figure BDA0001389583320000141
其中,d为所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离,Fm为所述图像帧的深度特征,Fm-1为所述图像帧的前一帧图像帧的深度特征。
余弦距离判断子模块434,用于判断所述余弦距离是否大于预设数值。
可选地,在本申请实施例中,所述预设数值为0.1。
冗余帧确定子模块435,用于如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
冗余帧删除模块440,用于如果所述图像帧是冗余帧,则将所述图像帧删除。
可选地,在本申请实施例中,所述冗余帧删除模块440,还用于将所述图像帧从用以存储所述图像帧的预设图片库中删除,同时将所述图像帧的深度特征从所述预设特征库中删除。
在本发明实施例中,可以获取对应同一视频数据的所有图像帧;获取所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征所述图像帧之间相似性的特征向量;基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧;如果所述图像帧是冗余帧,则将所述图像帧删除。由此解决了现有的图片库中存在大量冗余图片,造成存储空间浪费,从而能够有效避免存储空间浪费,以及提高用户进行以图搜剧的视频检索体验。
而且,在本发明实施例中,还可以从预设特征库中获取所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为所述图像帧的深度特征。而且所述预设深度特征计算模型包括卷积神经网络模型。从而可以进一步提高图像数据的深度特征的准确性以及有效性。
另外,在本发明实施例中,还可以判断所述图像帧是否为相应视频数据对应的第一个图像帧;如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;判断所述余弦距离是否大于预设数值;如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。而且可以优选地设置预设数值为0.1。可以进一步提高对冗余帧判断的准确度。
进一步地,在本发明实施例中,还可以将所述图像帧从用以存储所述图像帧的预设图片库中删除,同时将所述图像帧的深度特征从所述预设特征库中删除。从而可以进一步避免对存储空间的浪费。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像去重设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种图像去重方法,其特征在于,包括:
获取对应同一视频数据的所有图像帧;
获取各所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征各所述图像帧之间相似性的特征向量;
基于各所述图像帧的深度特征,判断各所述图像帧是否为冗余帧,包括:以任意两个所述图像帧为一组,分别比较各个组合中的两个所述图像帧中是否存在冗余帧;
如果确定一所述图像帧是冗余帧,则将所述冗余帧删除,并放弃判断包含删除的所述冗余帧在内的其余组合中是否存在冗余帧。
2.根据权利要求1所述的方法,其特征在于,所述获取各所述图像帧的深度特征的步骤,包括:
从预设特征库中获取各所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以各所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为各所述图像帧的深度特征。
3.根据权利要求2所述的方法,其特征在于,所述预设深度特征计算模型包括卷积神经网络模型。
4.根据权利要求1所述的方法,其特征在于,所述基于所述图像帧的深度特征,判断所述图像帧是否为冗余帧的步骤,包括:
判断所述图像帧是否为相应视频数据对应的第一个图像帧;
如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;
如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;
判断所述余弦距离是否大于预设数值;如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
5.根据权利要求4所述的方法,其特征在于,所述预设数值为0.1。
6.一种图像去重装置,其特征在于,包括:
图像帧获取模块,用于获取对应同一视频数据的所有图像帧;
深度特征获取模块,用于获取各所述图像帧的深度特征;所述深度特征包括基于所述图像帧获取的用以表征各所述图像帧之间相似性的特征向量;
冗余帧判断模块,用于基于各所述图像帧的深度特征,判断各所述图像帧是否为冗余帧,包括:以任意两个所述图像帧为一组,分别比较各个组合中的两个所述图像帧中是否存在冗余帧;
冗余帧删除模块,用于如果确定一所述图像帧是冗余帧,则将所述冗余帧删除,并放弃判断包含删除的所述冗余帧在内的其余组合中是否存在冗余帧。
7.根据权利要求6所述的装置,其特征在于,所述深度特征获取模块,还用于从预设特征库中获取各所述图像帧的深度特征;其中,所述预设特征库中的深度特征通过以下方式预先获取得到:以各所述图像帧作为预设深度特征计算模型的输入,以所述预设深度特征计算模型中预设层的输出作为各所述图像帧的深度特征。
8.根据权利要求7所述的装置,其特征在于,所述预设深度特征计算模型包括卷积神经网络模型。
9.根据权利要求6所述的装置,其特征在于,所述冗余帧判断模块,包括:
第一帧图像判断子模块,用于判断所述图像帧是否为相应视频数据对应的第一个图像帧;
非冗余帧确定子模块,用于如果所述图像帧是相应视频数据对应的第一个图像帧,则确认所述图像帧为非冗余帧;
余弦距离计算子模块,用于如果所述图像帧不是相应视频数据对应的第一个图像帧,则计算所述图像帧的深度特征与其前一帧图像帧的深度特征的余弦距离;
余弦距离判断子模块,用于判断所述余弦距离是否大于预设数值;
冗余帧确定子模块,用于如果所述余弦距离不大于预设数值,则确认所述图像帧为冗余帧。
10.根据权利要求9所述的装置,其特征在于,所述预设数值为0.1。
CN201710743275.8A 2017-08-25 2017-08-25 一种图像去重方法和装置 Active CN107633023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710743275.8A CN107633023B (zh) 2017-08-25 2017-08-25 一种图像去重方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710743275.8A CN107633023B (zh) 2017-08-25 2017-08-25 一种图像去重方法和装置

Publications (2)

Publication Number Publication Date
CN107633023A CN107633023A (zh) 2018-01-26
CN107633023B true CN107633023B (zh) 2020-04-21

Family

ID=61101610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710743275.8A Active CN107633023B (zh) 2017-08-25 2017-08-25 一种图像去重方法和装置

Country Status (1)

Country Link
CN (1) CN107633023B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614984A (zh) * 2018-10-29 2019-04-12 深圳北斗应用技术研究院有限公司 一种同源图像检测方法和系统
CN109726798B (zh) * 2018-12-27 2021-04-13 北京灵汐科技有限公司 一种数据处理方法及装置
CN111510724A (zh) * 2019-01-31 2020-08-07 北京小犀智能科技中心(有限合伙) 基于图像特征提取的等效视频压缩存储方法及系统
CN110111565A (zh) * 2019-04-18 2019-08-09 中国电子科技网络信息安全有限公司 一种基于实时视频流下的人车流量统计系统与方法
CN110362697A (zh) * 2019-07-05 2019-10-22 武汉莱博信息技术有限公司 基于卷积神经网络模型的图像查重方法、设备及存储介质
CN110728699B (zh) * 2019-10-11 2022-11-08 杭州云栖智慧视通科技有限公司 一种基于特征距离的轨迹后处理方法
CN110944201A (zh) * 2019-12-02 2020-03-31 深圳云朵数据技术有限公司 一种视频去重压缩的方法、装置、服务器及存储介质
CN111818300B (zh) * 2020-06-16 2022-05-27 浙江大华技术股份有限公司 一种数据存储、查询方法、装置、计算机设备及存储介质
CN112995676A (zh) * 2021-04-25 2021-06-18 北京金和网络股份有限公司 一种音视频压缩方法、装置、设备、系统及存储介质
CN113110804B (zh) * 2021-04-30 2023-03-21 平安普惠企业管理有限公司 重复图片删除方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655859A (zh) * 2009-07-10 2010-02-24 北京大学 快速去除冗余关键帧的方法及装置
CN105183857A (zh) * 2015-09-10 2015-12-23 成都品果科技有限公司 一种自动的图片训练样本提取方法及系统
CN106991373A (zh) * 2017-03-02 2017-07-28 中国人民解放军国防科学技术大学 一种基于深度学习和图论的拷贝视频检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100596706B1 (ko) * 2003-12-01 2006-07-04 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655859A (zh) * 2009-07-10 2010-02-24 北京大学 快速去除冗余关键帧的方法及装置
CN105183857A (zh) * 2015-09-10 2015-12-23 成都品果科技有限公司 一种自动的图片训练样本提取方法及系统
CN106991373A (zh) * 2017-03-02 2017-07-28 中国人民解放军国防科学技术大学 一种基于深度学习和图论的拷贝视频检测方法

Also Published As

Publication number Publication date
CN107633023A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN107633023B (zh) 一种图像去重方法和装置
CN109885770B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN108416028B (zh) 一种搜索内容资源的方法、装置及服务器
CN101281540B (zh) 用于处理信息的设备、方法和计算机程序
US9323785B2 (en) Method and system for mobile visual search using metadata and segmentation
US20150161174A1 (en) Content-based image ranking
CN107766360B (zh) 一种视频热度预测方法和装置
CN106557545B (zh) 视频检索方法和装置
CN109508406B (zh) 一种信息处理方法、装置及计算机可读存储介质
CN109871464B (zh) 一种基于ucl语义标引的视频推荐方法与装置
WO2015032353A1 (zh) 视频推荐方法及装置
CN111062871A (zh) 一种图像处理方法、装置、计算机设备及可读存储介质
CN111581423B (zh) 一种目标检索方法及装置
EP2588976A1 (en) Method and apparatus for managing video content
WO2012141655A1 (en) In-video product annotation with web information mining
CN110688524A (zh) 视频检索方法、装置、电子设备及存储介质
CN111708909B (zh) 视频标签的添加方法及装置、电子设备、计算机可读存储介质
JP2015204105A (ja) 推薦情報を提供するための方法および装置
CN108702551B (zh) 用于提供视频的概要信息的方法和装置
CN108345700B (zh) 文章代表图片的选取方法、装置和计算机设备
CN113407773A (zh) 一种短视频智能推荐方法、系统、电子设备及存储介质
WO2017202086A1 (zh) 图片的筛选方法及装置
CN108647227B (zh) 一种推荐方法及装置
CN111078944B (zh) 视频内容热度预测方法和装置
CN116595241A (zh) 新媒体信息展示方法、装置、电子设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant