CN111091118A - 图像的识别方法、装置及电子设备和存储介质 - Google Patents
图像的识别方法、装置及电子设备和存储介质 Download PDFInfo
- Publication number
- CN111091118A CN111091118A CN201911425307.5A CN201911425307A CN111091118A CN 111091118 A CN111091118 A CN 111091118A CN 201911425307 A CN201911425307 A CN 201911425307A CN 111091118 A CN111091118 A CN 111091118A
- Authority
- CN
- China
- Prior art keywords
- image
- fingerprint data
- target
- target area
- video image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004891 communication Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种图像的识别方法和装置,其中,所述方法包括:分别获取目标图像的第一指纹数据和目标视频流;对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;将所述第一指纹数据分别与各所述第二指纹数据进行匹配;当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。本发明实施例可以避免人工对视频图像中的目标图像进行识别过程中的遗漏情况,进而提高目标图像识别的准确度。在将本发明实施例提供的图像的识别方案应用于广告识别时,可以提高广告识别的准确度。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像的识别方法、装置及电子设备和存储介质。
背景技术
目前,一些电视节目或者电影、电视剧等影视作品中会携带有广告。例如,尺寸比较小的广告图像以浮窗的形式展示在视频图像的某个区域,既不影响用户观看视频,又起到了推广品牌、产品或者服务的作用。
但是,若要识别出视频图像上的广告,现有的技术方案为人工肉眼识别每一帧视频图像上的广告。由于广告可以在任意时间和任意位置出现在视频图像上,人工识别的方式容易遗漏一帧或多帧视频图像上的广告,造成广告识别的准确度不高的问题。
发明内容
本发明实施例的目的在于提供一种图像的识别方法、装置及电子设备和存储介质,以实现提高图像识别的准确度的目的。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种图像的识别方法,包括:分别获取目标图像的第一指纹数据和目标视频流;对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;将所述第一指纹数据分别与各所述第二指纹数据进行匹配;当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
可选地,所述对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据的步骤,包括:按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
可选地,所述将所述第一指纹数据分别与各所述第二指纹数据进行匹配的步骤,包括:比较所述第一指纹数据中各位置的字符与各所述第二指纹数据中对应位置的字符是否相同,所述第一指纹数据和所述第二指纹数据均为预设长度的字符串。
可选地,所述当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息的步骤,包括:当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的相关信息。
可选地,所述输出所述目标图像在对应的所述视频图像中的相关信息的步骤,包括:输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
可选地,所述输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息的步骤,包括:将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像的坐标信息作为所述位置信息,输出所述位置信息;以及,将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像所属的所述视频图像在所述目标视频流中的帧序号作为所述时序信息,输出所述时序信息。
在本发明实施的第二方面,还提供了一种图像的识别装置,包括:获取模块,用于分别获取目标图像的第一指纹数据和目标视频流;检测模块,用于对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;匹配模块,用于将所述第一指纹数据分别与各所述第二指纹数据进行匹配;输出模块,用于当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
可选地,所述检测模块,包括:划分子模块,用于按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;检测子模块,用于对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;确定子模块,用于将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
可选地,所述匹配模块,用于比较所述第一指纹数据中各位置的字符与各所述第二指纹数据中对应位置的字符是否相同。
可选地,所述输出模块,用于当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的相关信息。
可选地,所述输出模块,用于输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
可选地,所述输出模块,用于将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像的坐标信息作为所述位置信息,输出所述位置信息;以及,将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像所属的所述视频图像在所述目标视频流中的帧序号作为所述时序信息,输出所述时序信息。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的图像的识别方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的图像的识别方法。
本发明实施例提供的图像的识别方案,通过分别获取目标图像的第一指纹数据和目标视频流,对目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各目标区域图像的第二指纹数据,进而,将第一指纹数据分别与各第二指纹数据进行匹配,当第一指纹数据与一个或多个第二指纹数据满足匹配条件时,输出目标图像在对应的视频图像中的相关信息。可以避免人工对视频图像中的目标图像进行识别过程中的遗漏情况,进而提高目标图像识别的准确度。在将本发明实施例提供的图像的识别方案应用于广告识别时,可以提高广告识别的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中一种图像的识别方法的原理图;
图2为本发明实施例中一种图像的识别方法的步骤流程图;
图3为本发明实施例中另一种图像的识别方法的步骤流程图;
图4为本发明实施例中一种广告的识别装置的结构框图;
图5为本发明实施例中一种图像的识别装置的结构框图;
图6为本发明实施例中一种电子设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
参照图1,示出了本发明实施例中一种图像的识别方法的原理图。
在本发明实施例中,从目标视频流中提取出每一帧视频图像,检测得到每一帧视频图像的指纹数据。从指纹数据库中提取出目标图像的第一指纹数据。将目标图像的第一指纹数据与每一帧视频图像的指纹数据进行匹配,若匹配成功,则输出目标图像在视频图像中的相关信息。
参照图2,示出了本发明实施例中一种图像的识别方法的步骤流程图。
步骤201,分别获取目标图像的第一指纹数据和目标视频流。
在本发明实施例中,可以从任意数据源获取任意格式、码率、时间长度的目标视频流。获取到的目标视频流中可以包含目标图像,具体地,目标视频流中的某一帧视频图像或者某几帧视频图像可以包含目标图像。获取到的目标视频流中也可以不包含目标图像。
在本发明实施例中,目标图像可以理解为在目标视频流中待识别出的图像。也就是说,识别目标视频流中是否包含目标图像。通常情况下,目标图像的尺寸可以小于目标视频流中每一帧视频图像的尺寸。目标图像可以展示在任一帧视频图像的任意位置。
在本发明实施例中,目标图像的第一指纹数据可以存储在指纹数据库中。该指纹数据库中可以存储目标图像的第一指纹数据,也可以存储其他图像的指纹数据。在指纹数据库中,第一指纹数据可以与目标图像的标识信息具有对应关系。目标图像的标识信息可以为目标图像的名称、编号、尺寸、分辨率等等,本发明实施例对目标图像的标识信息的内容等不作具体限制。
步骤202,对目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各目标区域图像的第二指纹数据。
在本发明实施例中,目标视频流中的每一帧视频图像可以划分为多个目标区域图像。每个目标区域图像具有各自的第二指纹数据。通过对各目标区域图像进行检测,得到各目标区域图像的第二指纹数据。最终,每一帧视频图像可以对应多个第二指纹数据。
步骤203,将第一指纹数据分别与各第二指纹数据进行匹配。
在本发明实施例中,将目标图像的第一指纹数据分别与目标视频流中每一帧视频图像的多个目标区域图像的第二指纹数据进行比较。具体地,可以按照每一帧视频图像在目标视频流中的时间顺序,以及,各目标区域图像在视频图像中的位置关系将第一指纹数据分别与各第二指纹数据进行匹配。例如,视频图像p01为目标视频流S的第一帧图像,视频图像p02为目标视频流的第二帧图像。目标区域图像pd11为视频图像p01的左上角的图像,目标区域图像pd12为与目标区域图像pd01相邻,且位于目标区域图像pd01右侧的图像。目标区域图像pd21为视频图像p02的左上角的图像,目标区域图像pd22为与目标区域图像pd21相邻,且位于目标区域图像pd21右侧的图像。在进行第一指纹数据和第二指纹数据匹配时,可以将目标图像M的第一指纹数据依次与目标区域图像pd11、目标区域图像pd12、目标区域图像pd21和目标区域图像pd22的第二指纹数据分别进行匹配。
步骤204,当第一指纹数据与一个或多个第二指纹数据满足预设的匹配条件时,输出目标图像在对应的视频图像中的相关信息。
在本发明实施例中,若第一指纹数据与某个或者某些个第二指纹数据满足匹配条件,则可以认为在满足匹配条件的某个或某些个第二指纹数据对应的视频图像中存在目标图像,进而,将目标图像在对应的视频图像中的相关信息输出。
本发明实施例提供的图像的识别方法,通过分别获取目标图像的第一指纹数据和目标视频流,对目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各目标区域图像的第二指纹数据,进而,将第一指纹数据分别与各第二指纹数据进行匹配,当第一指纹数据与一个或多个第二指纹数据满足匹配条件时,输出目标图像在对应的视频图像中的相关信息。可以避免人工对视频图像中的目标图像进行识别过程中的遗漏情况,进而提高目标图像识别的准确度。
参照图3,示出了本发明实施例中另一种图像的识别方法的步骤流程图。
步骤301,获取目标视频流,并从目标视频流中提取出每一帧视频图像。
在本发明实施例中,获取一定时间长度的目标视频流,并从目标视频流中提取出每一帧视频图像。在提取视频图像的过程中,可以将目标视频流中的每一帧视频画面进行尺寸调整、颜色简化等处理得到每一帧视频图像。
步骤302,从每一帧视频图像中分割出多个目标区域图像。
在本发明实施例中,可以将目标图像的尺寸作为目标区域图像的尺寸,将视频图像分割为多个目标区域图像的过程中,可以按照从左向右、从上向下的顺序将视频图像分割为多个目标区域图像,相邻的目标区域图像之间有重叠区域。例如,视频图像为8x8的尺寸,即视频图像共包含64个像素点。目标图像为2x2的尺寸,即目标图像共包含4个像素点。按照从左向右、从上向下的顺序分割视频图像时,以视频图像的左上角为坐标原点,第一个目标区域图像在视频图像中的左上角像素点坐标为(0,0),右下角像素点坐标为(2,-2)。第二个目标区域图像在视频图像中的左上角像素点坐标为(1,0),右下角像素点坐标为(3,-2)。第三个目标区域图像在视频图像中的左上角像素点坐标为(2,0),右下角像素点坐标为(4,-2),以此类推,直至分割出最后一个目标区域图像在视频图像中的左上角像素点坐标为(5,-5),右下角像素点坐标为(7,-7)。可见,第一个目标区域图像与第二个目标区域图像之间有重叠区域,第二个目标区域图像与第三个目标区域图像之间也有重叠区域,每一个目标区域图像与其相邻的目标区域图像之间都有重叠区域。相邻的目标区域图像之间有重叠区域的好处在于,目标图像的第一指纹数据可以对应地与视频图像中每一个像素点所在的目标区域图像的第二指纹数据进行匹配,提高指纹数据匹配的精确度。
步骤303,对多个目标区域图像进行检测,得到各目标区域图像的第二指纹数据。
在本发明实施例中,针对每个目标区域图像可以检测相邻像素点之间的像素值的差异,进而得到目标区域图像的特征值,并将特征值作为第二指纹数据。
在实际应用中,可以采用图像哈希算法检测相邻像素点之间的像素值的差异得到目标区域图像的哈希值,将哈希值作为第二指纹数据。图像哈希算法用于检测一张图像的内容,然后根据检测到的内容为图像建立一个唯一值。例如,目标区域图像为9x8的尺寸的RGB三通道彩色图。将目标区域图像转换为单通道灰度图,得到一个9x8的矩阵G。对矩阵G的每一行进行如下操作:相邻的两个元素进行相减(左边元素减右边元素),每一行得出8个不同的差异值,一共得到64个差异值。若某差异值大于或等于0,则将该差异值对应的哈希值的字符记为1;若某差异值小于0,则将该差异值对应的哈希值的字符记为0。最终,将64个差异值对应的哈希值的字符按照各差异值的顺序组成目标区域图像的哈希值。内容相似的图像具有相似的哈希值。简单来说,图像哈希算法着眼于两个相邻像素点之间的像素差值。基于两两相邻像素点之间的像素差值,建立起一个哈希值。
步骤304,获取目标图像的第一指纹数据,将第一指纹数据与各第二指纹数据进行匹配。
在本发明实施例中,可以从指纹数据库中提取出目标图像的第一指纹数据。第一指纹数据也可以为哈希值。计算第一指纹数据的过程可以参照上述计算第二指纹数据的过程,在此不再赘述。
将第一指纹数据与各第二指纹数据进行匹配的目的在于,确定第一指纹数据与各第二指纹数据的相似度。在实际应用中,可以比较第一指纹数据中各位置的字符与各第二指纹数据中对应位置的字符是否相同。例如,第一指纹数据为64位的哈希值,第二指纹数据也为64位的哈希值。将第一指纹数据与第二指纹数据进行匹配时,可以将第一指纹数据中第1位的字符与第二指纹数据中第1位的字符进行比较,然后将第一指纹数据中第2位的字符与第二指纹数据中第2位的字符进行比较,再将第一指纹数据中第3位的字符与第二指纹数据中第3位的字符进行比较,以此类推,直至将第一指纹数据中第64位的字符与第二指纹数据中第64位的字符进行比较。最终,统计出第一指纹数据与第二指纹数据中相同位置的字符相同的数量,若第一指纹数据与第二指纹数据存在60个位置的字符是相同的,预设数量阈值为58,则60大于58,可以认为第一指纹数据与第二指纹数据满足匹配条件。若第一指纹数据与第二指纹数据存在60个位置的字符是相同的,预设比值阈值为80%,则60÷64=93.75%大于80%,可以认为第一指纹数据与第二指纹数据满足匹配条件。
综上,将第一指纹数据与视频图像中每一个目标区域图像的第二指纹数据进行匹配。若第一指纹数据与第二指纹数据满足匹配条件,则可以认为满足匹配条件的第二指纹数据对应的目标区域图像与目标图像相似;若第一指纹数据与第二指纹数据不满足匹配条件,可以认为不满足匹配条件的第二指纹数据对应的目标区域图像与目标图像不相似。
步骤305,输出目标图像在视频图像中的相关信息。
在本发明实施例中,目标图像在视频图像中的相关信息可以包括目标图像在视频图像中的位置信息,以及,视频图像在目标视频流中的时序信息。
在确定目标图像在视频图像中的位置信息时,可以将视频图像中与目标图像相似的目标区域图像的坐标信息作为目标图像在视频图像中的位置信息。如左上角像素点坐标(2,2),右下角像素点坐标(4,4)。
在确定视频图像在目标视频流中的时序信息时,可以将包含与目标图像相似的目标区域图像的视频图像在目标视频流中的帧序号作为时序信息。如包含与目标图像相似的目标区域图像的视频图像为目标视频流的第5帧。
综上,输出目标图像在视频图像中的相关信息为左上角像素点坐标(2,2),右下角像素点坐标(4,4),以及,第5帧。
基于上述关于一种图像的识别方法的相关说明,下面介绍一种广告的识别装置。该广告的识别装置可以用于对电视节目中的浮窗广告进行识别。
参照图4,示出了本发明实施例中一种广告的识别装置的结构框图。该广告的识别装置可以包括频道节目管理模块、后台数据服务模块、算法模块和前端模块。其中,频道节目管理模块可以对待识别广告的电视节目设置时间范围和目标广告,电视节目可以为目标视频流。例如,对电视节目A设置时间范围为20:00至22:00,目标广告为图标pdd的图像。频道节目管理模块设置时间范围和目标广告的目的在于,对20:00至22:00之间的电视节目A,识别出以图标pdd形式展示的广告。频道节目管理模块设置完毕时间范围和目标广告之后,可以生成广告识别任务,并将广告识别任务发送至后台数据服务模块。具体地,频道节目管理模块可以根据电视节目A的标识信息、时间范围20:00至22:00和图标pdd的图像生成广告识别任务。后台数据服务模块可以根据广告识别任务先获取时间范围内的电视节目A,并将时间范围内的电视节目A和目标广告发送至算法服务模块。算法服务模块可以采用图像哈希算法对电视节目A的每一帧图像中与目标广告的尺寸相同的目标区域图像检测,得到每个目标区域图像的指纹数据。算法服务模块也可以对目标广告进行检测,得到目标广告的指纹数据。算法服务模块将目标广告的指纹数据与每个目标区域图像的指纹数据进行匹配,输出目标广告在电视节目A中的时间信息和目标广告在一帧图像或多帧图像中的位置信息至后台数据服务模块。后台数据服务模块将上述时间信息和位置信息传输至前端模块,前端模块可以根据时间信息和位置信息在电视节目A中的一帧图像或多帧图像中展示出目标广告的位置。
需要说明的是,上述目标广告的指纹数据可以由算法服务模块检测得到,也可以由后台数据服务模块从指纹数据库中提取得到,本发明实施例对目标广告的指纹数据的来源与检测手段等不做具体限制。
在本发明实施例提供的技术方案中,目标图像的尺寸通常小于视频图像的尺寸,若视频图像中包含目标图像,则目标图像可以展示在视频图像的任意位置。因此,在识别视频图像中是否存在目标图像时,可以将视频图像划分为多个与目标图像尺寸相同的目标区域图像,进而将每个目标区域图像的指纹数据与目标图像的指纹数据进行匹配,以确定目标区域图像与目标图像之间的相似度。若目标区域图像与目标图像相似,则表示目标区域图像所在的视频图像中存在目标图像。
本发明实施例在检测指纹数据时,可以利用常用的图像哈希算法、图像感知算法或者散列函数计算目标区域图像和目标图像的指纹数据。由于指纹数据可以唯一标识一张图像。相似的图像之间的指纹数据也相似。在实际应用中,满足什么样的条件才可以认为两张图像相似,可以根据实际情况而定。例如,若两张图像的指纹数据的80%部分的字符是相同的,则可以认为该两张图像相似。此处的80%部分的字符相同不仅指字符本身相同,也指字符所在的位置是相同的。因此,在比较两张图像的指纹数据时,需要将位置相同的字符进行比较,最终得出多少个相同位置的字符是相同的,得出字符相同的位置占指纹数据的总位置数量的百分比。通过百分比与设定的比值阈值进行比较,确定两张图像是否相似。
本发明实施例中,若目标图像与某一目标区域图像相似,则可以理解为该一目标区域图像所在的视频图像中包含了目标图像,进而将该一目标区域图像的像素点坐标作为目标图像在视频图像中的位置信息,并将视频图像在目标视频流中的帧序号作为目标图像在目标视频流中的时序信息。在得到位置信息和时序信息之后,可以先利用时序信息确定目标视频流中的某一帧视频图像或某几帧视频图像,再根据位置信息确定目标图像在某一帧视频图像或某几帧视频图像中的位置,实现目标图像识别的目的。
本发明实施例应用于识别目标视频流中的广告场景时,通过将目标视频流中每一帧视频图像中目标区域图像的指纹数据,与目标广告的指纹数据进行匹配,识别出与目标广告相似的目标区域图像。将包含与目标广告相似的目标区域图像的视频图像作为含有目标广告的一帧视频图像或者多帧视频图像。再利用一帧视频图像或者多帧视频图像的帧序号定位目标广告在目标视频流中具体视频图像,利用与目标广告相似的目标区域图像的像素点坐标定位目标广告在具体视频图像中的位置,最终,可以识别出目标视频流中的目标广告。避免了人工识别目标视频流中的目标广告时容易遗漏视频图像的问题,提高了广告识别的准确度和效率。
参照图5,示出了本发明实施例中一种图像的识别装置的结构框图。该图像的识别装置可以包括如下模块:
获取模块501,用于分别获取目标图像的第一指纹数据和目标视频流;
检测模块502,用于对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;
匹配模块503,用于将所述第一指纹数据分别与各所述第二指纹数据进行匹配;
输出模块504,用于当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
在本发明的一种示例性实施例中,所述检测模块502,包括:
划分子模块5021,用于按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;
检测子模块5022,用于对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;
确定子模块5023,用于将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
在本发明的一种示例性实施例中,所述匹配模块503,用于比较所述第一指纹数据中各位置的字符与各所述第二指纹数据中对应位置的字符是否相同。
在本发明的一种示例性实施例中,所述输出模块504,用于当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的相关信息。
在本发明的一种示例性实施例中,所述输出模块504,用于输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
在本发明的一种示例性实施例中,所述输出模块504,用于将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像的坐标信息作为所述位置信息,输出所述位置信息;以及,将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像所属的所述视频图像在所述目标视频流中的帧序号作为所述时序信息,输出所述时序信息。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信,
存储器63,用于存放计算机程序;
处理器61,用于执行存储器63上所存放的程序时,实现如下步骤:
步骤S1,分别获取目标图像的第一指纹数据和目标视频流;
步骤S2,对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;
步骤S3,将所述第一指纹数据分别与各所述第二指纹数据进行匹配;
步骤S4,当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
在步骤S2的执行过程中,可以按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
在步骤S3的执行过程中,可以比较所述第一指纹数据中各位置的字符与各所述第二指纹数据中对应位置的字符是否相同,所述第一指纹数据和所述第二指纹数据均为预设长度的字符串。
在步骤S4的执行过程中,可以当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的相关信息。
在步骤S4的执行过程中,可以输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
在步骤S4的执行过程中,可以将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像的坐标信息作为所述位置信息,输出所述位置信息;以及,将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像所属的所述视频图像在所述目标视频流中的帧序号作为所述时序信息,输出所述时序信息。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像的识别方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像的识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (11)
1.一种图像的识别方法,其特征在于,包括:
分别获取目标图像的第一指纹数据和目标视频流;
对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;
将所述第一指纹数据分别与各所述第二指纹数据进行匹配;
当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据的步骤,包括:
按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;
对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;
将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一指纹数据分别与各所述第二指纹数据进行匹配的步骤,包括:
比较所述第一指纹数据中各位置的字符与各所述第二指纹数据中对应位置的字符是否相同,所述第一指纹数据和所述第二指纹数据均为预设长度的字符串。
4.根据权利要求3所述的方法,其特征在于,所述当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息的步骤,包括:
当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的相关信息。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述输出所述目标图像在对应的所述视频图像中的相关信息的步骤,包括:
输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
6.根据权利要求5所述的方法,其特征在于,所述输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息的步骤,包括:
将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像的坐标信息作为所述位置信息,输出所述位置信息;以及,
将满足所述匹配条件的所述第二指纹数据对应的所述目标区域图像所属的所述视频图像在所述目标视频流中的帧序号作为所述时序信息,输出所述时序信息。
7.一种图像的识别装置,其特征在于,包括:
获取模块,用于分别获取目标图像的第一指纹数据和目标视频流;
检测模块,用于对所述目标视频流中每一帧视频图像的各目标区域图像进行检测,得到各所述目标区域图像的第二指纹数据;
匹配模块,用于将所述第一指纹数据分别与各所述第二指纹数据进行匹配;
输出模块,用于当所述第一指纹数据与一个或多个所述第二指纹数据满足预设的匹配条件时,输出所述目标图像在对应的所述视频图像中的相关信息。
8.根据权利要求7所述的装置,其特征在于,所述检测模块,包括:
划分子模块,用于按照所述目标图像的尺寸将每一帧所述视频图像划分为各所述目标区域图像,相邻的所述目标区域图像之间有重叠区域;
检测子模块,用于对各所述目标区域图像的相邻像素点之间的像素值进行差异检测,得到各所述目标区域图像的特征值;
确定子模块,用于将各所述目标区域图像的所述特征值作为各所述目标区域图像的所述第二指纹数据。
9.根据权利要求7所述的装置,其特征在于,所述输出模块,用于当所述第一指纹数据中与一个或多个所述第二指纹数据中字符相同的位置的数量大于或等于预设数量阈值时,或者,当所述字符相同的位置的数量与所述第一指纹数据或所述第二指纹数据的数据位数的比值大于或等于预设比值阈值时,输出所述目标图像在对应的所述视频图像中的位置信息,以及对应的所述视频图像在所述目标视频流中的时序信息。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911425307.5A CN111091118A (zh) | 2019-12-31 | 2019-12-31 | 图像的识别方法、装置及电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911425307.5A CN111091118A (zh) | 2019-12-31 | 2019-12-31 | 图像的识别方法、装置及电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111091118A true CN111091118A (zh) | 2020-05-01 |
Family
ID=70398760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911425307.5A Pending CN111091118A (zh) | 2019-12-31 | 2019-12-31 | 图像的识别方法、装置及电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111091118A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329851A (zh) * | 2020-11-05 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 一种图标检测方法、装置及计算机可读存储介质 |
CN113495901A (zh) * | 2021-04-20 | 2021-10-12 | 河海大学 | 一种面向可变长数据块的快速检索方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102393900A (zh) * | 2011-07-02 | 2012-03-28 | 山东大学 | 基于鲁棒哈希的视频拷贝检测方法 |
CN102799605A (zh) * | 2012-05-02 | 2012-11-28 | 天脉聚源(北京)传媒科技有限公司 | 一种广告监播方法和系统 |
CN103235956A (zh) * | 2013-03-28 | 2013-08-07 | 天脉聚源(北京)传媒科技有限公司 | 一种广告检测方法和装置 |
WO2018076614A1 (zh) * | 2016-10-31 | 2018-05-03 | 武汉斗鱼网络科技有限公司 | 一种直播视频的处理方法、装置及设备、计算机可读介质 |
CN108595710A (zh) * | 2018-05-11 | 2018-09-28 | 杨晓春 | 一种快速的海量图片去重方法 |
CN110083740A (zh) * | 2019-05-07 | 2019-08-02 | 深圳市网心科技有限公司 | 视频指纹提取及视频检索方法、装置、终端及存储介质 |
CN110349191A (zh) * | 2019-06-25 | 2019-10-18 | 昆明理工大学 | 一种基于感知哈希算法的视觉跟踪方法 |
-
2019
- 2019-12-31 CN CN201911425307.5A patent/CN111091118A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102393900A (zh) * | 2011-07-02 | 2012-03-28 | 山东大学 | 基于鲁棒哈希的视频拷贝检测方法 |
CN102799605A (zh) * | 2012-05-02 | 2012-11-28 | 天脉聚源(北京)传媒科技有限公司 | 一种广告监播方法和系统 |
CN103235956A (zh) * | 2013-03-28 | 2013-08-07 | 天脉聚源(北京)传媒科技有限公司 | 一种广告检测方法和装置 |
WO2018076614A1 (zh) * | 2016-10-31 | 2018-05-03 | 武汉斗鱼网络科技有限公司 | 一种直播视频的处理方法、装置及设备、计算机可读介质 |
CN108595710A (zh) * | 2018-05-11 | 2018-09-28 | 杨晓春 | 一种快速的海量图片去重方法 |
CN110083740A (zh) * | 2019-05-07 | 2019-08-02 | 深圳市网心科技有限公司 | 视频指纹提取及视频检索方法、装置、终端及存储介质 |
CN110349191A (zh) * | 2019-06-25 | 2019-10-18 | 昆明理工大学 | 一种基于感知哈希算法的视觉跟踪方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329851A (zh) * | 2020-11-05 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 一种图标检测方法、装置及计算机可读存储介质 |
CN113495901A (zh) * | 2021-04-20 | 2021-10-12 | 河海大学 | 一种面向可变长数据块的快速检索方法 |
CN113495901B (zh) * | 2021-04-20 | 2023-10-13 | 河海大学 | 一种面向可变长数据块的快速检索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109871815B (zh) | 一种查询监控信息的方法及装置 | |
CN109308463B (zh) | 一种视频目标识别方法、装置及设备 | |
US9600744B2 (en) | Adaptive interest rate control for visual search | |
CN110083740B (zh) | 视频指纹提取及视频检索方法、装置、终端及存储介质 | |
CN109426785B (zh) | 一种人体目标身份识别方法及装置 | |
CN110705405A (zh) | 目标标注的方法及装置 | |
CN103079092B (zh) | 在视频中获取人物信息的方法和装置 | |
CN109446061B (zh) | 一种页面检测方法、计算机可读存储介质及终端设备 | |
CN109727275B (zh) | 目标检测方法、装置、系统和计算机可读存储介质 | |
CN106560840B (zh) | 一种图像信息识别处理方法及装置 | |
CN109116129B (zh) | 终端检测方法、检测设备、系统及存储介质 | |
CN111666907A (zh) | 一种视频中对象信息的识别方法、装置及服务器 | |
CN108961183B (zh) | 图像处理方法、终端设备及计算机可读存储介质 | |
CN111209431A (zh) | 一种视频搜索方法、装置、设备及介质 | |
CN110691259A (zh) | 视频播放方法、系统、装置、电子设备及存储介质 | |
US20200364479A1 (en) | Face recognition system, method for establishing data of face recognition, and face recognizing method thereof | |
CN109447022B (zh) | 一种镜头类型识别方法及装置 | |
CN111091118A (zh) | 图像的识别方法、装置及电子设备和存储介质 | |
CN111080665A (zh) | 图像边框识别方法、装置、设备和计算机存储介质 | |
CN107992872B (zh) | 一种对图片进行文本识别的方法及移动终端 | |
JP2013528869A (ja) | オブジェクトを認識する手続き | |
CN112672102B (zh) | 一种视频生成方法及装置 | |
CN113223184A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN113052019A (zh) | 目标跟踪方法及装置、智能设备和计算机存储介质 | |
CN109451318B (zh) | 便于vr视频编码的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200501 |
|
RJ01 | Rejection of invention patent application after publication |