WO2013185518A1 - 一种电视直播流中的广告段检测方法 - Google Patents

一种电视直播流中的广告段检测方法 Download PDF

Info

Publication number
WO2013185518A1
WO2013185518A1 PCT/CN2013/075485 CN2013075485W WO2013185518A1 WO 2013185518 A1 WO2013185518 A1 WO 2013185518A1 CN 2013075485 W CN2013075485 W CN 2013075485W WO 2013185518 A1 WO2013185518 A1 WO 2013185518A1
Authority
WO
WIPO (PCT)
Prior art keywords
video
visual
retrieved
feature vector
visual feature
Prior art date
Application number
PCT/CN2013/075485
Other languages
English (en)
French (fr)
Inventor
王建超
Original Assignee
天脉聚源(北京)传媒科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 天脉聚源(北京)传媒科技有限公司 filed Critical 天脉聚源(北京)传媒科技有限公司
Publication of WO2013185518A1 publication Critical patent/WO2013185518A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Definitions

  • the invention discloses a method for detecting an advertisement segment in a live television stream.
  • This application claims to be submitted to the Chinese Patent Office on June 13, 2012, the application number is 201210194968.3, and the invention title is "a method for detecting an advertisement segment in a live television stream”.
  • Priority of the application the entire contents of which are incorporated herein by reference.
  • the present invention relates to the field of video retrieval and video detection technologies, and in particular, to an advertisement segment detection method in a live television stream. Background technique
  • TV stations at all levels will insert some advertisements in their own programs to increase the income of TV stations.
  • some enterprises are willing to pay for the advertisements of their products.
  • they can promote the company, and on the other hand, they can promote the company.
  • it can increase the sales of enterprise products.
  • advertising companies and enterprises must send people to supervise the broadcasting of TV stations.
  • the cultural management department will require TV stations to broadcast some public service advertisements, government notices, notices, etc. according to the government's administrative orders. In order to ensure that these mandatory advertisements are broadcast within the stipulated time, the cultural supervision department must also send someone to conduct the test.
  • This method is the earliest method of video advertisement detection.
  • This method mainly uses the station logo of the TV station for detection.
  • TV stations will display their own logos when playing ordinary TV programs, and will generally hide the logo when playing advertisements. This allows us to distinguish between video advertisements and ordinary TV program videos by detecting the presence or absence of logos.
  • static logos For different types of logos, there are corresponding detection methods to achieve the detection of video ads.
  • the research on static logos is more in-depth and widely used.
  • semi-transparent logos and dynamic logos it is difficult to detect, so there is no mature detection method.
  • many radio stations now display the logo when playing video advertisements. At this time, the detection method based on the logo will be invalid.
  • the object of the present invention is to provide an advertisement segment detection method in a live television stream, which performs lens segmentation and key frame extraction for video advertisements, based on the difference between visual features of video advertisements and visual features of ordinary television programs.
  • the video advertisement in the video stream is detected, and the update strategy of the video advertisement database is proposed, which can greatly reduce the workload of the staff in the field of video detection and editing, and improve the speed of video detection and the accuracy of detection.
  • the invention provides a method for detecting an advertisement segment in a live television stream, which comprises the following steps:
  • extracting at least one visual feature vector of each video advertisement further includes the following steps:
  • each video ad into no less than one lens, extract the lens keyframes for each shot; extract no less than one visual feature of each shot keyframe of the video ad, and visualize the keyframe of all video ads
  • the features constitute a visual feature of the video advertisement, converting each visual feature of the video advertisement into a visual feature vector of the corresponding video advertisement.
  • step B extracting at least one visual feature vector of the video to be retrieved further includes the following steps:
  • the visual features constitute a visual feature of the video to be retrieved, and the visual feature vector of the video to be retrieved corresponding to each visual feature of the video to be retrieved is obtained by using the distance relationship.
  • dividing the video into not less than one lens further includes the following steps: Extracting a color histogram of all video frames of the video, and calculating a similarity value of a color histogram of two adjacent video image frames as an inter-frame similarity value;
  • a sequence of shot boundaries is determined according to an interframe similarity value of the video, a preset first threshold, a preset second threshold, and a preset third threshold of the gradient lens length.
  • extracting a color histogram of all video frames and calculating inter-frame similarity values also includes the following steps:
  • P " is the weight of the block in the first row of column P
  • P is the value of the 'bin' of the color histogram of the first ⁇ X ⁇ ? block of the frame
  • a and b are the sequence numbers of the video image frame
  • the m in function is to find the smaller of the two values.
  • the extracting the lens key frame of each lens is to extract the first video frame and the last video frame of the lens as lens key frames.
  • the extracting the visual feature of each shot key frame is to extract the visual feature of the lens key frame by using a SIFT scale invariant feature transform matching algorithm.
  • converting each visual feature of the video advertisement into a visual feature vector of the corresponding video advertisement further includes the following steps:
  • Clustering algorithm is used to cluster the visual features of the video advertisement, and each cluster center is used as a visual word, and all visual words constitute a visual vocabulary;
  • the correspondence between the visual word to which each visual feature belongs to the visual vocabulary and the visual vocabulary constitutes a visual word histogram of the video advertisement, the visual word histogram being used as the visual feature vector of the video advertisement.
  • the clustering algorithm is a K-means algorithm.
  • the method further includes the following steps:
  • the correspondence between the visual word and the visual vocabulary constitutes a visual word histogram of the video to be retrieved, and the visual word histogram is used as a visual feature vector of the video to be retrieved.
  • step A is a KD-tree data structure.
  • step C the visual feature vector of the video to be retrieved is matched with the visual feature vector of each video advertisement in the data structure, and the data structure is updated according to the matching result, and the following steps are further included. :
  • the maximum value of the similarity is greater than the preset value, it is determined that the matching is successful, and the matching success times of the successfully matched visual feature vectors in the data structure and the current matching success time are updated, and if the similarity maximum value is less than the preset value, it is determined to be a match. Unsuccessful, the visual feature vector of the video to be retrieved is inserted into the data structure, and the visual feature vector with no matching success in the preset time threshold in the deleted data structure is deleted.
  • step C the feature vector of the video to be retrieved is matched with each feature vector in the data structure, and the matching algorithm used is a BBF feature matching search algorithm.
  • step D the video retrieval result is calculated and output according to all the matching results, and the following steps are further included:
  • the shot of the matching visual feature vector is marked as 1 , the unsuccessful match is marked as 0, and the video to be retrieved is represented as a 01 sequence;
  • Providing a method for detecting advertisement segments in a live television stream for the staff in the field of video detection and editing work which can greatly reduce the workload of the staff in the field of video detection and editing, and improve the speed of video detection and the accuracy of detection.
  • FIG. 1A is a main flow chart of an advertisement segment detecting method in a live television stream in a specific embodiment of the present invention.
  • FIG. 1B is a detailed flowchart of an advertisement segment detecting method in a live television stream in a specific embodiment of the present invention. detailed description
  • FIG. 1A is a main flow chart of an advertisement segment detecting method in a live television stream in a specific embodiment of the present invention. As shown in FIG. 1A, the process of the video advertisement detection method specifically includes the following steps:
  • FIG. 1B is a detailed flowchart of a method for detecting an advertisement segment in a live television stream in a specific embodiment of the present invention.
  • the process of the video advertisement detection method specifically includes the following steps: Step 101: Extract no less than one video advertisement, and establish a video advertisement database.
  • H color
  • S purity
  • V brightness
  • the similarity value of the color histogram of the two opposite video frames is calculated as the inter-frame similarity value. Use the following formula to calculate similar values for the color histograms of two adjacent video image frames:
  • the weight of the row block is the value of the 'bin' of the color histogram of the Mth block of the frame
  • a and b are the sequence numbers of the video image frame
  • the m in function is the smaller of the two values. value.
  • Each video advertisement is divided into not less than one shot according to a sequence of shot boundaries, and the first video frame and the last video frame of each shot are extracted as lens key frames.
  • Step 103 Using SIFT (Scale-invariant feature transform) algorithm to extract no less than one visual feature of each lens key frame of the video advertisement, and visual features of the lens key frames of all video advertisements constitute a video advertisement Visual characteristics.
  • SIFT Scale-invariant feature transform
  • Step 104 The K-means clustering algorithm is used to cluster the visual features of the video advertisement, and each cluster center is used as a visual word, and all visual words constitute a visual vocabulary;
  • the correspondence between the visual word to which each visual feature belongs to the visual vocabulary and the visual vocabulary constitutes a visual word histogram of the video advertisement, the visual word histogram being used as the visual feature vector of the video advertisement.
  • Step 105 Input the video to be retrieved, divide the video to be retrieved into at least one lens by using the method of step 102, and extract the lens key frame of each lens.
  • Step 106 Extracting, by using the SIFT method, no less than one visual feature of each key frame of the video to be retrieved, and the lens key frame visual features of all the videos to be retrieved constitute a visual feature of the video to be retrieved.
  • Step 107 Calculate the similarity between the visual features of the video to be retrieved and each visual word in the visual vocabulary, and sort the similarities to select the visual word with the largest similarity;
  • the correspondence between the visual word and the visual vocabulary constitutes a visual word histogram of the video to be retrieved, and the visual word histogram is used as a visual feature vector of the video to be retrieved.
  • Step 108 Match a visual feature vector of the video to be retrieved with a visual feature vector of each video advertisement in the data structure by using a BBF feature matching search algorithm. That is, check on the KD-tree Find the nearest neighbor, starting from the root, when looking for the path on the KD-tree, the missed point is first inserted into the priority queue, swept to the leaf node, and then the current key value is the smallest, that is, the distance on the dimension The smallest, repeat the above process, sweeping to the leaf node. Until the queue is empty, or has been repeated 500 times to stop.
  • the similarity between the most similar visual feature vector found and the visual feature vector to be matched is greater than the threshold value of 0.85, it is found that similar visual feature vectors are found, the matching is successful, and the matching success times of the successfully matched visual feature vectors in the updated data structure are The matching success time, otherwise no similar visual feature vector is found, the matching is unsuccessful, and the visual feature vector of the video to be retrieved is inserted into the data structure, and the visual feature vector with no matching success in the data structure is deleted within 180 days.
  • Step 109 Mark the lens of the visual feature vector with successful matching as 1 , the unsuccessful matching flag is 0, and the video to be retrieved is represented as a 01 sequence; if a 0 is present in 5 consecutive 1s in the 01 sequence, then 0 is If the ratio of 1 in the 01 sequence is greater than 0.8, it is determined that the video to be retrieved is a video advertisement, and if it is less than 0.8, the video to be retrieved is determined to be a non-video advertisement, and the detection result is output.
  • embodiments of the present invention can be provided as a method, system, or computer program product. Accordingly, the present invention may take the form of an entirely hardware embodiment, an entirely software embodiment, or a combination of software and hardware. Moreover, the invention can take the form of a computer program product embodied on one or more computer-usable storage media (including but not limited to disk storage, CD-ROM, optical storage, etc.) including computer usable program code.
  • computer-usable storage media including but not limited to disk storage, CD-ROM, optical storage, etc.
  • the computer program instructions can also be stored in a computer readable memory operable in a particular manner by a computer or other programmable data processing device, such that instructions stored in the computer readable memory produce an article of manufacture comprising the instruction device.
  • the instruction means implements the functions specified in one or more blocks of the flow or in a flow or block diagram of the flowchart.
  • These computer program instructions can also be loaded onto a computer or other programmable data processing device such that a series of operational steps are performed on a computer or other programmable device to produce computer-implemented processing for execution on a computer or other programmable device
  • the instructions provide steps for implementing the functions specified in a block or blocks of a flow or a flow and/or a block diagram of a flowchart.

Abstract

本申请公开了一种电视直播流中的广告段检测方法,首先,提取不少于一个的视频广告,建立视频广告数据库,提取每个视频广告的不少于一个的视觉特征向量,构建数据结构来组织所述视频广告的所有视觉特征向量;输入待检索视频,提取待检索视频的不少于一个的视觉特征向量;将所述待检索视频的视觉特征向量与所述数据结构中的每个视频广告的视觉特征向量进行匹配,得到匹配结果,根据所述匹配结果更新所述数据结构;根据所有所述匹配结果判断视频检测结果并输出。本申请能够有效克服现有技术的不足,为电视直播流中视频广告的分析和检测提供信息和依据。

Description

一种电视直播流中的广告段检测方法 本申请要求在 2012年 6月 13日提交中国专利局、申请号为 201210194968.3、 发明名称为"一种电视直播流中的广告段检测方法"的中国专利申请的优先权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及视频检索与视频检测技术领域, 尤其涉及一种电视直播流中 的广告段检测方法。 背景技术
目前, 随着经济的高速发展, 各级电视台都会在自己的节目中插播一些 广告来增加电视台的收入, 同时一些企业也愿意出资播放本企业产品的广告, 一方面可以为企业做宣传, 另一方面又可以提升企业产品销量。 而广告公司 和企业为了确保其视频广告取得应有的效益, 必须派人来监督电视台广告的 播放情况, 同时文化管理部门会依据政府的行政命令要求电视台播放一些公 益广告、政府通告、通知等, 为了确保这些强制性广告在规定的时间内播出, 文化监管部门也必须派专人进行检测。
在电视节目制作过程中, 出于商业目的, 通常会加入一些广告片段, 但 在网上视频点播、 媒体资产管理等领域中, 为了有效的检索及浏览视频, 插 播的广告片段需要被剔除或者替换成其他视频。 因此, 自动、 精确的检测出 电视节目视频中的广告片段, 成为视频点播、 媒体资产管理等领域中急需解 决的问题。 目前,视频广告的检测都是通过人工进行的,浪费了大量的资源。 为了有效地检索相关视频信息, 需要研发一些先进技术对海量的视频数据进 行分析、 浏览、 检索和语义内容分类。 视频广告作为一种独立的视频类型, 其检测与分析作为视频分类的一个重要方面也日益受到重视, 视频广告检测 方法的研究工作也逐渐成为国内外视频应用领域的研究热点之一。
对于视频广告的检测, 研发人员基于视频广告和普通节目视频的特征上 的区别, 提出了多种方法。 现在的较为常用的视频广告检测方法大体上分为 以下两类:
(1)基于标识的方法 (Logo-based methods)
此方法是最早的视频广告检测方法。 该方法主要利用电视台的台标进行 检测。 电视台在播放普通电视节目时会将自己的台标显示出来, 而播放广告 时一般就会隐去台标, 这使得我们可以通过检测台标的存在与否来区分视频 广告和普通电视节目视频。 台标一般分为三种: 静态台标、 半透明台标和动 态台标。 针对不同形态的台标, 都有相应的检测方法, 从而实现对视频广告 的检测。 其中对于静态台标的研究是比较深入的, 而且应用得很广泛。 但是 对于半透明台标和动态台标, 检测起来比较困难, 所以还没有比较成熟的检 测方法。 另外, 现在很多电台在播放视频广告的时候也会将台标显示出来, 这时基于标识的检测方法就会失效。
(2)基于规则的方法 (Rule-based methods)
基于规则的方法大多是利用广告镜头的信息来进行检测的, 它是通过一 组特征和规则来区分广告和普通电视节目视频。 由于视频广告和普通电视节 目视频在某些特征方面存在着比较明显的差异, 因此利用这些区分性比较强 的特征, 就可以实现对视频广告的检测。 在视频方面可以通过提取一段视频 帧的平均边缘变化率 A-ECR (Average of Edge Change Ratio )和边缘变化方差 V-ECR (Variance of Change Ratio )以及平均顿差 A-FD (Average of Frame Difference)和帧方差 V-FD( Variance of Frame Difference)来实现检测。在音频方 面, 视频广告的音频内容和普通电视节目的音频内容也存在一些明显的特征 上的区别 , 比如可以利用音频多维频率普系数 (Mel-frequency Cepstral Coefficient)和音频信息熵来实现对视频广告的分割检测。不过音频方面的特征 一般都用于辅助视频特征检测方面, 通过两者的结合才能实现对广告段更加 精确的分割检测。 发明内容 本发明的目的是在于提出一种电视直播流中的广告段检测方法, 对视频 广告进行了镜头分割和提取关键帧, 基于视频广告的视觉特征与普通电视节 目的视觉特征之间的差异对直播视频流中的视频广告进行检测, 并提出了视 频广告数据库的更新策略, 能够大量减少视频检测和编辑领域的工作人员的 工作量, 提高视频检测速度和检测的精确度。
本发明提供了一种电视直播流中的广告段检测方法, 包括以下步骤:
A、 提取不少于一个的视频广告, 建立视频广告数据库, 提取每个视频广 告的不少于一个的视觉特征向量, 构建数据结构来组织所述视频广告的所有 视觉特征向量;
B、 输入待检索视频, 提取待检索视频的不少于一个的视觉特征向量;
C、将所述待检索视频的视觉特征向量与所述数据结构中的每个视频广告 的视觉特征向量进行匹配, 得到匹配结果, 根据所述匹配结果更新所述数据 结构;
D、 根据所述匹配结果判断视频检测结果, 将所述检测结果输出。
进一步地,步骤 A中,提取每个视频广告的不少于一个的视觉特征向量, 还包括以下步骤:
将每个视频广告分割为不少于一个的镜头, 提取每个镜头的镜头关键帧; 提取视频广告的每个镜头关键帧的不少于一个的视觉特征, 所有视频广 告的镜头关键帧的视觉特征构成视频广告的视觉特征, 将视频广告的每个视 觉特征转换为对应的视频广告的视觉特征向量。
进一步地, 步驟 B中, 提取待检索视频的不少于一个的视觉特征向量, 还包括以下步骤:
将待检索视频分割为不少于一个的镜头, 提取每个镜头的镜头关键帧; 提取待检索视频的每个镜头关键帧的不少于一个的视觉特征, 所有待检 索视频的镜头关键帧的视觉特征组成待检索视频的视觉特征, 利用距离关系 得到所述待检索视频的每个视觉特征对应的待检索视频的视觉特征向量。
进一步地, 将视频分割成不少于一个的镜头, 还包括以下步骤: 提取所述视频的所有视频帧的颜色直方图, 计算两个相邻视频图像帧的 颜色直方图的相似值, 作为帧间相似值;
根据所述视频的帧间相似值、 预设的第一阈值、 预设的第二阈值和预设 的渐变镜头长度第三阈值, 确定镜头边界序列。
进一步地, 提取所有视频帧的颜色直方图, 计算帧间相似值, 还包括以 下步骤:
对视频图像进行分块, 共分为 块, 其中 Μ是列数, W是行数; 对图像的每一个图像块在 HS V颜色空间上提取颜色直方图, 其中把亮度 量化为 1个区间, 把色调量化为 16个区间, 把色饱和度量化为 8个区间, 每 一帧图像得到 个有 16x8x1 =128个 bm 的颜色直方图,并对得到的颜色直 方图进行归一化;
采用下面的公式计算两个相邻视频图像帧的颜色直方图的相似值: 1 £7:1 1
M N
其中 P" , 为处于第 P列第?行的块的权重, 是第 "帧 的第 ρ X <?个块的颜色直方图的第 '个 bin的值, a和 b为视频图像帧的序号, m in 函数是求取两个值中较小的值。
进一步地, 根据整个视频的帧间相似值、 预设的第一阔值、 预设的第二 阔值和预设的渐变镜头长度第三阈值,确定镜头边界序列,还包括以下步骤: 输入整个视频序列的帧间相似值序列 S = ' '···Α} ,预设高阔值 ΤΗ , 预设 低阈值 TL , 预设渐变镜头长度最低阈值 T 1, 其中 = 1°;
根据每个帧间相似度 进行判断: 如果 <7 ^且没有设置渐变标志, 判断镜头发生了突变, 输出突变镜头的 边界信息;
如果 ^ < 但设置了渐变标志, 则渐变镜头长度 加 1; 如果 >=< 7 没有设置渐变标志, 则设置渐变标志, 记录下当前 图像帧位置作为候选镜头开始边界, 并开始计数渐变镜头长度^"
如果 >= TH并设置了渐变标志, 则检查渐变镜头长度, 如果 Length > 则判断发生了渐变, 输出渐变镜头的边界信息, 否则判断不是渐变, 取消渐 变标志, 并把渐变镜头长度 重新置零;
如果 且没有设置渐变标志, 则判断没有发生镜头变化; 输出镜头边界序列。
进一步地, 所述提取每个镜头的镜头关键帧是提取镜头的第一视频帧和 最后一视频帧作为镜头关键帧。
进一步地, 所述提取每个镜头关键帧的视觉特征是釆用 SIFT尺度不变特 征变换匹配算法提取镜头关键帧的视觉特征。
进一步地, 将视频广告的每个视觉特征转换为对应的视频广告的视觉特 征向量, 还包括以下步骤:
采用聚类算法对所述视频广告的视觉特征进行聚类, 用每个聚类中心作 为视觉单词, 所有视觉单词构成视觉词汇表;
视频广告的每个视觉特征所属视觉单词与所述视觉词汇表的对应关系构 成视频广告的视觉单词直方图, 用所述视觉单词直方图作为视频广告的视觉 特征向量。
进一步地, 所述聚类算法是 K-均值算法。
进一步地, 利用距离关系得到所述待检索视频的视觉特征对应的待检索 视频的视觉特征向量, 还包括以下步骤:
计算待检索视频的视觉特征与视觉词汇表中每个视觉单词的相似度, 并 对相似度进行排序, 选取相似度最大的视觉单词;
所述视觉单词与所述视觉词汇表的对应关系构成待检索视频的视觉单词 直方图, 将所述视觉单词直方图作为所述待检索视频的视觉特征向量。
进一步地, 步骤 A中所述数据结构, 为 KD-树数据结构。 进一步地, 步骤 C中, 将所迷待检索视频的视觉特征向量与所述数据结 构中的每个视频广告的视觉特征向量进行匹配, 根据所述匹配结果更新所述 数据结构, 还包括以下步骤:
计算所述待检索视频的视觉特征向量与所迷数据结构中的每个视频广告 的视觉特征向量之间的相似度;
如果相似度的最大值大于预设值, 判断为匹配成功, 更新数据结构中匹 配成功的视觉特征向量的匹配成功次数和本次匹配成功时间, 如果相似度最 大值小于预设值, 判断为匹配不成功, 将所述待检索视频的视觉特征向量插 入数据结构中, 删除数据结构中预设时间阈值内没有匹配成功的视觉特征向 量。
进一步地, 步骤 C中, 将所述待检索视频的特征向量与所述数据结构中 的每个特征向量进行匹配, 采用的匹配算法为 BBF特征匹配搜索算法。
进一步地,步骤 D中,根据所有所述匹配结果计算视频检索结果并输出, 还包括以下步骤:
将匹配成功的视觉特征向量所属镜头标记为 1 , 匹配不成功标记为 0 , 待 检索视频表示为一个 01序列;
如果所述 01序列中连续预设数量的 1中出现一个 0 , 则把 0改判为 1 ; 如果所述 01序列中 1所占比例大于预设值, 则判断待检索视频为视频广 告, 小于预设值, 则判断待检索视频为非视频广告。 本发明的技术效果在于:
为视频检测和编辑工作领域的工作人员提供一种电视直播流中的广告段 检测方法, 能够大量减少视频检测和编辑领域的工作人员的工作量, 提高视 频检测速度和检测的精确度。
本发明的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说 明书中变得显而易见, 或者通过实施本发明而了解。 本发明的目的和其他优 点可通过在所写的说明书、 权利要求书、 以及附图中所特别指出的结构来实 现和获得。
下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 附图说明
附图用来提供对本发明的进一步理解, 并且构成说明书的一部分, 与本 发明的实施例一起用于解释本发明, 并不构成对本发明的限制。 在附图中: 图 1 A是本发明具体实施方式中电视直播流中的广告段检测方法的主要 流程图。
图 1B 是本发明具体实施方式中电视直播流中的广告段检测方法的详细 流程图。 具体实施方式
以下结合附图对本发明的优选实施例进行说明, 应当理解, 此处所描述 的优选实施例仅用于说明和解释本发明, 并不用于限定本发明。
图 1 A是本发明具体实施方式中电视直播流中的广告段检测方法的主要 流程图。 如图 1A所示, 视频广告检测方法的流程, 具体包括以下步骤:
A、 提取不少于一个的视频广告, 建立视频广告数据库, 提取每个视频广 告的不少于一个的视觉特征向量, 构建数据结构来组织所述视频广告的所有 视觉特征向量;
B、 输入待检索视频, 提取待检索视频的不少于一个的视觉特征向量;
C、将所述待检索视频的视觉特征向量与所述数据结构中的每个视频广告 的视觉特征向量进行匹配, 得到匹配结果, 根据所述匹配结果更新所述数据 结构;
D、 根据所述匹配结果判断视频检测结果, 将所述检测结果输出。
图 1B 是本发明具体实施方式中电视直播流中的广告段检测方法的详细 流程图。 如图 1B所示, 视频广告检测方法的流程, 具体包括以下步骤: 步骤 101、 提取不少于一个的视频广告, 建立视频广告数据库。 步骤 102、提取所述视频广告的所有视频帧的颜色直方图, 即对视频图像 进行分块, 共分为 块, 其中 ^是列数, W是行数; 对图像的每一个图像 块在 HS V (色彩 (H) , 纯度 (S), 明度 (V) )颜色空间上提取颜色直方图, 其中 把亮度量化为 1个区间, 把色调量化为 16个区间, 把色饱和度量化为 8个区 间, 每一帧图像得到 个有 16x8x1=128个 bm的颜色直方图, 对得到的颜 色直方图进行归一化。
计算两个相郐视频帧的颜色直方图的相似值, 作为帧间相似值。 采用下 面的公式计算两个相邻视频图像帧的颜色直方图的相似值:
M N 128
= ^n min( 。 (p, q, i), Hb (p, q, i))
p-l q-\ i-\
M N
Y Y w = 1
其中 Pq , 为处于第 P列第?行的块的权重, 是第 "帧 的第 M个块的颜色直方图的第 '个 bin的值, a和 b为视频图像帧的序号, m in 函数是求取两个值中较小的值。
计算所有相邻视频帧的帧间相似值, 构成整个视频序列的帧间相似值序 列: s = , 输入整个视频序列的帧间相似值序列 S = ' 2'··" }, 预设第一阈值
=0.85 , 预设第二阈值 =0.65, 预设渐变镜头长度最低阈值 ual , 其中 τ = 1 0
gradual · 根据每个帧间相似值 s '进行判断: 如果 < 7 ^且没有设置渐变标志, 判断镜头发生了突变, 输出突变镜头 的边界信息; 如果 s' < 但设置了渐变标志, 则渐变镜头长度 Ze"^加 1; 如果 >=< 7^但没有设置渐变标志, 设置渐变标志, 记录下当前图 像帧位置作为候选镜头开始边界, 并开始计数渐变镜头长度 如果 并设置了渐变标志, 则检查渐变镜头长度, 如果 "^¾ > 7^^则判断发生了渐变, 输出渐变镜头的边界信息, 否则判断不是 渐变, 取消渐变标志, 并把渐变镜头长度1 重新置零; 如果 >= 且没有设置渐变标志, 则判断没有发生镜头变化; 输出镜头边界序列 ^"^…'"
按照镜头边界序列将每个视频广告分割为不少于一个的镜头, 提取每个 镜头的第一视频帧和最后一视频帧作为镜头关键帧。
步骤 103、 采用 SIFT ( Scale-invariant feature transform, 尺度不变特征变 换匹配)算法提取视频广告每个镜头关键帧的不少于一个的视觉特征, 所有视 频广告的镜头关键帧的视觉特征构成视频广告的视觉特征。
步骤 104、 釆用 K-均值聚类算法对所述视频广告的视觉特征进行聚类, 用每个聚类中心作为视觉单词, 所有视觉单词构成视觉词汇表;
视频广告的每个视觉特征所属视觉单词与所述视觉词汇表的对应关系构 成视频广告的视觉单词直方图, 用所述视觉单词直方图作为视频广告的视觉 特征向量。
步骤 105、输入待检索视频, 采用步骤 102的方法将待检索视频分割为不 少于一个的镜头, 并提取每个镜头的镜头关键帧。
步骤 106、 采用 SIFT方法提取待检索视频每个关键帧的不少于一个的视 觉特征, 所有待检索视频的镜头关键帧视觉特征构成待检索视频的视觉特征。
步骤 107、计算待检索视频的视觉特征与视觉词汇表中每个视觉单词的相 似度, 并对相似度进行排序, 选取相似度最大的视觉单词;
所述视觉单词与所述视觉词汇表的对应关系构成待检索视频的视觉单词 直方图, 将所述视觉单词直方图作为所述待检索视频的视觉特征向量。
步骤 108、 釆用 BBF特征匹配搜索算法将所述待检索视频的视觉特征向 量与数据结构中的每个视频广告的视觉特征向量进行匹配。 即在 KD-树上查 找最近邻,从根开始,在 KD-树上寻找路径时,错过的点先塞入优先队列里, 一直扫到叶子节点, 然后再从队列中取出目前 key值最小的, 即 维上的距离 最小者, 重复上述过程, 一直扫到叶子节点。 直到队列已空, 或者已重复了 500遍停止。如果找到的最相似的视觉特征向量和待匹配的视觉特征向量的相 似度大于阈值 0.85 , 则说明找到相似的视觉特征向量, 匹配成功, 更新数据 结构中匹配成功的视觉特征向量的匹配成功次数和本次匹配成功时间, 否则 没有找到相似的视觉特征向量, 匹配不成功, 将所述待检索视频的视觉特征 向量插入数据结构中, 删除数据结构中 180天内没有匹配成功的视觉特征向 量。
步骤 109、 将匹配成功的视觉特征向量所属镜头标记为 1 , 匹配不成功标 记为 0,待检索视频表示为一个 01序列; 如果所述 01序列中连续 5个 1中出 现一个 0, 则把 0改判为 1 ; 如果所述 01序列中 1所占比例大于 0.8, 则判断 待检索视频为视频广告, 小于 0.8, 则判断待检索视频为非视频广告, 输出检 测结果。
本实施例中的所有数值均为举例, 可根据实际需要进行调整。
本领域内的技术人员应明白, 本发明的实施例可提供为方法、 系统、 或 计算机程序产品。 因此, 本发明可采用完全硬件实施例、 完全软件实施例、 或结合软件和硬件方面的实施例的形式。 而且, 本发明可采用在一个或多个 其中包含有计算机可用程序代码的计算机可用存储介质 (包括但不限于磁盘 存储器、 CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、 设备(系统)、 和计算机程序产 品的流程图和 /或方框图来描述的。 应理解可由计算机程序指令实现流程图 和 /或方框图中的每一流程和 /或方框、 以及流程图和 /或方框图中的流程 和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、 嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器, 使得通 过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流 程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的 装置。
这些计算机程序指令也可存储在能弓 I导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中, 使得存储在该计算机可读存储器 中的指令产生包括指令装置的制造品, 该指令装置实现在流程图一个流程或 多个流程和 /或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装栽到计算机或其他可编程数据处理设备上, 使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的 处理, 从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图 一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例, 但本领域内的技术人员一旦得知了 基本创造性概念, 则可对这些实施例作出另外的变更和修改。 所以, 所附权 利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然, 本领域的技术人员可以对本发明实施例进行各种改动和变型而不 脱离本发明实施例的精神和范围。 这样, 倘若本发明实施例的这些修改和变 型属于本发明权利要求及其等同技术的范围之内, 则本发明也意图包含这些 改动和变型在内。

Claims

权 利 要 求
1、 一种电视直播流中的广告段检测方法, 其特征在于, 包括以下步骤:
A、 提取不少于一个的视频广告, 建立视频广告数据库, 提取每个视频广 告的不少于一个的视觉特征向量, 构建数据结构来组织所述视频广告的所有 视觉特征向量;
B . 输入待检索视频, 提取待检索视频的不少于一个的视觉特征向量;
C.将所述待检索视频的视觉特征向量与所述数据结构中的每个视频广告 的视觉特征向量进行匹配, 得到匹配结果, 根据所述匹配结果更新所述数据 结构;
D、 根据所述匹配结果判断视频检测结果, 将所述检测结果输出。
2、 根据权利要求 1所述一种电视直播流中的广告段检测方法, 其特征在 于, 步骤 A中, 提取每个视频广告的不少于一个的视觉特征向量, 进一步包 括以下步骤:
将每个视频广告分割为不少于一个的镜头, 提取每个镜头的镜头关键帧; 提取视频广告的每个镜头关键帧的不少于一个的视觉特征, 所有视频广 告的镜头关键帧的视觉特征构成视频广告的视觉特征, 将视频广告的每个视 觉特征转换为对应的视频广告的视觉特征向量。
3、 根据权利要求 1所述一种电视直播流中的广告段检测方法, 其特征在 于, 步骤 B 中, 提取待检索视频的不少于一个的视觉特征向量, 进一步包括 以下步骤:
将待检索视频分割为不少于一个的镜头, 提取每个镜头的镜头关键帧; 提取待检索视频的每个镜头关键帧的不少于一个的视觉特征, 所有待检 索视频的镜头关键帧的视觉特征組成待检索视频的视觉特征, 利用距离关系 得到所述待检索视频的每个视觉特征对应的待检索视频的视觉特征向量。
4、 根据权利要求 2或 3所述一种电视直播流中的广告段检测方法, 其特 征在于, 将视频分割成不少于一个的镜头, 进一步包括以下步骤: 提取所述视频的所有视频帧的颜色直方图, 计算两个相邻视频图像帧的 颜色直方图的相似值, 作为帧间相似值;
根据所述视频的帧间相似值、 预设的第一阈值、 预设的第二阈值和预设 的渐变镜头长度第三阈值, 确定镜头边界序列。
5、 根据权利要求 4所述一种电视直播流中的广告段检测方法, 其特征在 于,提取所有视频帧的颜色直方图,计算帧间相似值,进一步包括以下步骤: 对视频图像进行分块, 共分为 块, 其中 Μ是列数, W是行数; 对图像的每一个图像块在 HS V颜色空间上提取颜色直方图, 其中把亮度 量化为 1个区间, 把色调量化为 16个区间, 把色饱和度量化为 8个区间, 每 一帧图像得到 个有 16x8x1 =128个 bm 的颜色直方图,并对得到的颜色直 方图进行归一化;
采用下面的公式计算两个相邻视频图像帧的颜色直方图的相似值: 1 £7:1 1
M N
其中 P" , 为处于第 P列第?行的块的权重, 是第 "帧 的第 ρ X <?个块的颜色直方图的第 '个 bin的值, a和 b为视频图像帧的序号, m in 函数是求取两个值中较小的值。
6、 根据权利要求 4所述一种电视直播流中的广告段检测方法, 其特征在 于, 根据整个视频的帧间相似值、 预设的第一阈值、 预设的第二阔值和预设 的渐变镜头长度第三阈值, 确定镜头边界序列, 进一步包括以下步骤: 输入整个视频序列的帧间相似值序列 S = ' '···Α} ,预设高阈值 ΤΗ , 预设 低阈值 TL , 预设渐变镜头长度最低阈值 , 其中 = 1°; 根据每个帧间相似度 s'进行判断:
如果 < 且没有设置渐变标志, 判断镜头发生了突变, 输出突变镜头的 边界信息; 如果 < 但设置了渐变标志, 则渐变镜头长度 Ze"^加 1; 如果 >= 且 ' < 7 旦没有设置渐变标志, 则设置渐变标志, 记录下当前 图像帧位置作为候选镜头开始边界, 并开始计数渐变镜头长度 ;
如果 >=^并设置了渐变标志, 则检查渐变镜头长度, 如 1Τ ! 则判断发生了渐变, 输出渐变镜头的边界信息, 否则判断不是渐变, 取消渐 变标志, 并把渐变镜头长度1 重新置零;
如果 且没有设置渐变标志, 则判断没有发生镜头变化;
输出镜头边界序列。
7、 根据权利要求 2或 3所述一种电视直播流中的广告段检测方法, 其特 征在于, 所述提取每个镜头的镜头关键帧是提取镜头的第一视频帧和最后一 视频帧作为镜头关键帧。
8、 根据权利要求 2或 3所述一种电视直播流中的广告段检测方法, 其特 征在于, 所述提取每个镜头关键帧的视觉特征是采用 SIFT尺度不变特征变换 匹配算法提取镜头关键帧的视觉特征。
9、 根据权利要求 2所述一种电视直播流中的广告段检测方法, 其特征在 于, 将视频广告的每个视觉特征转换为对应的视频广告的视觉特征向量, 进 一步包括以下步骤:
采用聚类算法对所述视频广告的视觉特征进行聚类, 用每个聚类中心作 为视觉单词, 所有视觉单词构成视觉词汇表;
视频广告的每个视觉特征所属视觉单词与所迷视觉词汇表的对应关系构 成视频广告的视觉单词直方图, 用所述视觉单词直方图作为视频广告的视觉 特征向量。
10、 根据权利要求 9所述一种电视直播流中的广告段检测方法, 其特征 在于, 所述聚类算法是 K-均值算法。
11、 根据权利要求 3或 9所述一种电视直播流中的广告段检测方法, 其 特征在于, 利用距离关系得到所述待检索视频的视觉特征对应的待检索视频 的视觉特征向量, 进一步包括以下步骤:
计算待检索视频的视觉特征与视觉词汇表中每个视觉单词的相似度, 并 对相似度进行排序, 选取相似度最大的视觉单词;
所述视觉单词与所述视觉词汇表的对应关系构成待检索视频的视觉单词 直方图, 将所述视觉单词直方图作为所述待检索视频的视觉特征向量。
12、 根据权利要求 1 所述一种电视直播流中的广告段检测方法, 其特征 在于, 步骤 A中所述数据结构, 为 KD-树数据结构。
13、 根据权利要求 1 所述一种电视直播流中的广告段检测方法, 其特征 在于, 步樣 C中, 将所述待检索视频的视觉特征向量与所述数据结构中的每 个视频广告的视觉特征向量进行匹配, 根据所述匹配结果更新所述数据结构, 进一步包括以下步骤:
计算所述待检索视频的视觉特征向量与所述数据结构中的每个视频广告 的视觉特征向量之间的相似度;
如果相似度的最大值大于预设值, 判断为匹配成功, 更新数据结构中匹 配成功的视觉特征向量的匹配成功次数和本次匹配成功时间, 如果相似度最 大值小于预设值, 判断为匹配不成功, 将所述待检索视频的视觉特征向量插 入数据结构中, 删除数据结构中预设时间 1 值内没有匹配成功的视觉特征向 量。
14、 根据权利要求 1 所述一种电视直播流中的广告段检测方法, 其特征 在于, 步« 中, 将所述待检索视频的特征向量与所述数据结构中的每个特 征向量进行匹配, 采用的匹配算法为 BBF特征匹配搜索算法。
15、 根据权利要求 1 所述一种电视直播流中的广告段检测方法, 其特征 在于, 步骤 D中, 根据所有所述匹配结果计算视频检索结果并输出, 进一步 包括以下步骤:
将匹配成功的视觉特征向量所属镜头标记为 1 , 匹配不成功标记为 0 , 待 检索视频表示为一个 01序列;
如果所述 01序列中连续预设数量的 1中出现一个 0 , 则把 0改判为 1 ; 如果所述 01序列中 1所占比例大于预设值, 则判断待检索视频为视频广 小于预设值, 则判断待检索视频为非视频广告。
PCT/CN2013/075485 2012-06-13 2013-05-10 一种电视直播流中的广告段检测方法 WO2013185518A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210194968.3 2012-06-13
CN2012101949683A CN102760169A (zh) 2012-06-13 2012-06-13 一种电视直播流中的广告段检测方法

Publications (1)

Publication Number Publication Date
WO2013185518A1 true WO2013185518A1 (zh) 2013-12-19

Family

ID=47054626

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/075485 WO2013185518A1 (zh) 2012-06-13 2013-05-10 一种电视直播流中的广告段检测方法

Country Status (2)

Country Link
CN (1) CN102760169A (zh)
WO (1) WO2013185518A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020224291A1 (zh) * 2019-05-07 2020-11-12 创新先进技术有限公司 广告监播方法、系统、装置及电子设备

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法
CN105103566B (zh) * 2013-03-15 2019-05-21 构造数据有限责任公司 用于识别视频片段以便显示上下文相关内容的系统和方法
CN105052161B (zh) * 2013-03-15 2018-12-28 构造数据有限责任公司 实时电视广告检测的系统和方法
CN103475935A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种视频片段的检索方法及装置
CN103473551A (zh) * 2013-09-16 2013-12-25 中国传媒大学 基于sift算子的台标识别方法及系统
CN103714350B (zh) * 2013-12-13 2016-11-02 科大讯飞股份有限公司 基于台标位置的电视广告检测方法及系统
CN104899757B (zh) * 2014-03-07 2018-12-21 无锡天脉聚源传媒科技有限公司 一种广告快速精编系统及其精编方法
CN103984778B (zh) * 2014-06-06 2017-12-01 北京猎豹网络科技有限公司 一种视频检索方法及系统
CN106354736A (zh) * 2015-07-23 2017-01-25 无锡天脉聚源传媒科技有限公司 一种重复视频的判断方法及装置
CN106375848A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种视频播放提示方法及装置
CN106372092A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种生成模板的方法、装置、视频的更新方法及装置
CN105072455A (zh) * 2015-08-11 2015-11-18 精硕世纪科技(北京)有限公司 视频匹配方法和装置
CN106021321B (zh) * 2016-05-06 2019-05-21 成都索贝数码科技股份有限公司 基于图片的在线实时视频的检索方法
CN106021320B (zh) * 2016-05-06 2018-06-29 成都索贝数码科技股份有限公司 基于视频的在线实时视频的检索方法
CN106507141A (zh) * 2016-10-19 2017-03-15 天脉聚源(北京)科技有限公司 一种频道播出内容监控方法及装置
CN107124626A (zh) * 2017-04-05 2017-09-01 广东有线广播电视网络有限公司 一种机顶盒广告实时监控方法及系统
CN107396139A (zh) * 2017-08-22 2017-11-24 无锡天脉聚源传媒科技有限公司 一种视频处理方法及装置
CN110175591B (zh) * 2019-05-31 2021-06-22 中科软科技股份有限公司 一种获取视频相似度的方法及系统
CN111027419B (zh) * 2019-11-22 2023-10-20 腾讯科技(深圳)有限公司 一种视频无关内容检测的方法、装置、设备和介质
CN111836063B (zh) * 2020-07-02 2022-02-22 北京字节跳动网络技术有限公司 一种直播内容识别方法及装置
CN113627363B (zh) * 2021-08-13 2023-08-15 百度在线网络技术(北京)有限公司 视频文件的处理方法、装置、设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162470A (zh) * 2007-11-16 2008-04-16 北京交通大学 一种基于分层匹配的视频广告识别方法
WO2011139448A2 (en) * 2010-04-26 2011-11-10 Microsoft Corporation Enriching online videos by content detection, searching, and information aggregation
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4476786B2 (ja) * 2004-11-10 2010-06-09 株式会社東芝 検索装置
CN100586201C (zh) * 2006-05-25 2010-01-27 北大方正集团有限公司 一种广告视频检测的方法
JP2009245382A (ja) * 2008-03-31 2009-10-22 Osaka Prefecture Univ コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体
CN101404032B (zh) * 2008-11-11 2011-09-28 清华大学 一种基于内容的视频检索方法及系统
CN102117313A (zh) * 2010-12-29 2011-07-06 天脉聚源(北京)传媒科技有限公司 一种视频检索方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162470A (zh) * 2007-11-16 2008-04-16 北京交通大学 一种基于分层匹配的视频广告识别方法
WO2011139448A2 (en) * 2010-04-26 2011-11-10 Microsoft Corporation Enriching online videos by content detection, searching, and information aggregation
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DIAO, MENGMENG ET AL.: "An Approach of Image Retrieval Based on Visual Words", MEASUREMENT & CONTROL TECHNOLOGY, vol. 31, no. 5, May 2012 (2012-05-01), pages 17 - 20 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020224291A1 (zh) * 2019-05-07 2020-11-12 创新先进技术有限公司 广告监播方法、系统、装置及电子设备

Also Published As

Publication number Publication date
CN102760169A (zh) 2012-10-31

Similar Documents

Publication Publication Date Title
WO2013185518A1 (zh) 一种电视直播流中的广告段检测方法
Chou et al. Pattern-based near-duplicate video retrieval and localization on web-scale videos
CN102254006B (zh) 基于内容的互联网视频检索方法
CN101162470B (zh) 一种基于分层匹配的视频广告识别方法
CN101821734B (zh) 时基媒体之间的匹配的检测和分类
Papadopoulos et al. Cluster-based landmark and event detection for tagged photo collections
US20180181577A1 (en) System and process for building a catalog using visual objects
CN107169106B (zh) 视频检索方法、装置、存储介质及处理器
WO2012071696A1 (zh) 基于用户兴趣学习的个性化广告推送方法与系统
CN101894125B (zh) 一种基于内容的视频分类方法
US20160239711A1 (en) Visual Data Mining
US20080162561A1 (en) Method and apparatus for semantic super-resolution of audio-visual data
CN105678309B (zh) 一种基于多示例包特征学习的图像多标签标注算法
CN112269805B (zh) 数据处理方法、装置、设备及介质
CN104520875A (zh) 优选用于搜索和检索目的的从视频内容提取描述符的方法和装置
Küçüktunç et al. Video copy detection using multiple visual cues and MPEG-7 descriptors
CN103347167A (zh) 一种基于分段的监控视频内容描述方法
US20210406549A1 (en) Method and apparatus for detecting information insertion region, electronic device, and storage medium
CN109871464A (zh) 一种基于ucl语义标引的视频推荐方法与装置
Hossari et al. ADNet: A deep network for detecting adverts
CN103605666A (zh) 一种进行广告检测的视频拷贝检测方法
CN110569390B (zh) 基于区分存储介质的海量案件数据高效检索方法
CN110830836B (zh) 一种视频广告播出监测方法
Schwab et al. A multi-cue spatio-temporal framework for automatic frontal face clustering in video sequences
Huang et al. An integrated scheme for video key frame extraction

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13805045

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13805045

Country of ref document: EP

Kind code of ref document: A1