CN107948734B - 一种广告视频的筛选方法及系统 - Google Patents

一种广告视频的筛选方法及系统 Download PDF

Info

Publication number
CN107948734B
CN107948734B CN201711266120.6A CN201711266120A CN107948734B CN 107948734 B CN107948734 B CN 107948734B CN 201711266120 A CN201711266120 A CN 201711266120A CN 107948734 B CN107948734 B CN 107948734B
Authority
CN
China
Prior art keywords
video
audio
advertisement
matching
played
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711266120.6A
Other languages
English (en)
Other versions
CN107948734A (zh
Inventor
徐佳宏
莫愁
韩涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ipanel TV Inc
Original Assignee
Shenzhen Ipanel TV Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ipanel TV Inc filed Critical Shenzhen Ipanel TV Inc
Priority to CN201711266120.6A priority Critical patent/CN107948734B/zh
Publication of CN107948734A publication Critical patent/CN107948734A/zh
Application granted granted Critical
Publication of CN107948734B publication Critical patent/CN107948734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种广告视频的筛选方法,包括:按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;依据所述每一个视频段对应的音频特征值,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。上述的方法,提高了广告视频的筛选效率。

Description

一种广告视频的筛选方法及系统
技术领域
本发明涉及视频处理领域,尤其涉及一种广告视频的筛选方法和系统。
背景技术
随着网络通信的日趋发展,电视及网络视频已经成为人们生活不可或缺的一部分。人们在闲暇时间会观看电视节目,或应用电脑、手持终端等设备观看网络视频,各种不同的电视节目或网络视频,极大的丰富了人们的生活。
发明人对现有的电视节目或者网络视频的播放过程进行研究发现,在电视节目或者网络视频播放的过程中,都会插播广告,同一广告会在不同时段循环播放。重复播放的广告视频,再次观看浪费了用户的时间。为了节省用户的时间,目前采用人工提取重复播放广告视频的方式,去除电视或网络视频中的重复出现的广告视频,但是人工提取重复播放广告视频的方式效率低,耗时多。
发明内容
有鉴于此,本发明提供了一种广告视频的筛选方法,用以解决现有技术中人工提取重复播放广告视频的方式效率低,耗时多的问题。具体方案如下:
一种广告视频的筛选方法,包括:
按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。
上述的方法,优选的,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告样本进行匹配包括:
在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
上述的方法,优选的,还包括:
当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
上述的方法,优选的,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配包括:
将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
上述的方法,优选的,还包括:
当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
一种广告视频的筛选系统,包括:
划分模块,用于按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
第一匹配模块,用于依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
第二匹配模块,用于当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
筛选模块,用于当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。
上述的系统,优选的,所述第一匹配模块包括:
第一确定单元,用于在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
第二确定单元,用于将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
第三确定单元,用于以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
上述的系统,优选的,还包括:
筛选单元,用于当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
上述的系统,优选的,所述第二匹配模块包括:
第一匹配单元,用于将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
第二匹配单元,用于当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
判断单元,用于判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
上述的系统,优选的,还包括:
存储单元,用于当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
与现有技术相比,本发明包括以下优点:
本发明提供了一种广告视频的筛选方法,包括:按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档中的每一个音频特征进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。上述的方法,依据第一倒排索引库和第二倒排索引库中预存的样本进行自动的筛选,提高了广告视频筛选的速度,解决了现有技术中人工筛选广告效率低,耗时长的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种广告视频的筛选方法流程图;
图2为本申请实施例公开的一种广告视频的筛选方法又一方法流程图;
图3为本申请实施例公开的一种广告视频的筛选方法又一方法流程图;
图4为本申请实施例公开的一种广告视频的筛选方法又一方法流程图;
图5为本申请实施例公开的一种广告视频的筛选方法又一方法流程图;
图6为本申请实施例公开的一种广告视频的筛选系统结构框图;
图7为本申请实施例公开的一种广告视频的筛选系统又一结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
本发明提供了一种广告视频的筛选方法,所述方法应用于视频的播放过程中,所述视频中包含有多个视频流,每一个视频流可以为节目视频也可以为广告视频或者其它重复播放的视频流信息。所述方法的执行主体可以视频筛选软件对应的处理平台或者处理器等。所述方法的流程图,如图1所示,包括步骤:
S101、按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
本发明实施例中,将当前待播放的视频流,依据1S的时间间隔进行分段,得到多个长度相同的视频段,计算每一个视频段的音频特征,所述音频特征主要是针对梅尔频率MFCC特征进行处理。所述当前待播放的视频流为已知长度的视频流,每一个待播放的视频流的长度可以不同,但划分的预设长度与计算音频特征值的方式相同。
S102、依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
本发明实施例中,为了实现匹配,所述第一倒排索引库中存储的各个广告视频样本与当前待播放的视频流中分段长度与计算音频特征值的方法相同。判断由任意一个视频段对应的音频特征按预设的规则合并的视频与预设的第一倒排索引库中已存的某个广告视频样本是否匹配,进而确定所述预设的第一倒排索引库中是否存在于所述当前当播放的视频流相匹配的广告样本。
S103、当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
本发明实施例中,将所述每一个视频段对应的音频特征值在预设的第二倒排索引库中多组音频文档中查找与所述音频特征值相同的音频特征,获取所述音频特征对应的编号ID。所述第二倒排索引库中存在多组音频文档,所述每一个音频文档中都存在有多个具有编号ID的音频特征,在同一个音频文档中不同音频特征对应的编号ID可以相同。
S104、当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。
本发明实施例中,当存在一个音频特征与当前视频段对应的音频特征值相匹配时,依据预设的匹配规则,当与该音频特征对应的一组连续音频文档中是存在具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,定所述当前待播放视频流为广告视频,对其进行筛选。
本发明实施例中,所述连续递增编号ID可以为以下两种情况:
当多个编号ID满足严格递增关系时,即每一个编号ID和与其相邻的下一个ID都存在递增关系,认为当前多个编号ID满足递增关系。
当多个编号ID满足跳跃式的递增关系时,即相邻的编号ID之间不一定存在递增关系,统计递增的编号ID与非递增的编号ID的比例,当所述比例满足预设值时,认为当前多个编号ID满足递增关系。
本发明提供了一种广告视频的筛选方法,包括:按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档中的每一个音频特征进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。上述的方法,依据第一倒排索引库和第二倒排索引库中预存的样本进行自动的筛选,提高了广告视频筛选的速度,解决了现有技术中人工筛选广告效率低,耗时长的问题。
本发明实施例中,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告样本进行匹配的方法流程图如图2所示,包括步骤:
S201、在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
S202、将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
S203、以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
本发明实施例中,将目标视频与所述第一样本集中的各个广告样本逐一进行索引偏移的匹配,通过倒排索引的方式,可以检测出多个包含所述目标视频音频特征值的广告样本,然后还需要进一步的与上述多个样本进行样本精确匹配计算相似性。本发明中每一个待检测的视频段对应的音频是一段长度为1秒的音频。以广告样本为例,该音频可能处于广告样本的任一位置,统计具有相同音频特征值的索引偏移,电视播放广告的音频基本为固定的,播放速度固定,因此对应的特征值的相对位置也固定,则将待匹配音频偏移相应位置与样本进行匹配,计算匹配率。记录匹配率最高的广告样本为目标音频的匹配结果。将所述目标音频加入到一级待合并音频列表,以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配样本进行匹配,计算加权相似性,结合所述加权相似性,将各个匹配结果加入到一级待合并音频列表并进行合并,当匹配的总的视频时长超过预设的时长阈值时,确定所述待播放视频流与所述匹配广告样本相匹配。
本发明实施例中,在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,当不存在匹配成功的广告样本时,将所述当前待播放视频流中的每一个视频段发送到二级倒排索引库中与二级倒排索引库中的每一个音频特征进行匹配。
进一步的,本发明实施例中,还包括,当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
本发明实施例中,当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征的方法流程图如图3所示,包括步骤:
S301、将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
S302、当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
S303、判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
本发明实施例中,二级倒排索引库是由一系列连续音频段的特征文档训练得到的多组连续的音频文档,每一个音频文档中存在多个具有编号ID音频特征,所述每一个音频文档可以为一个完整的节目或广告,也可以为节目或广告的部分,或者为节目或者广告的组合。将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配,优选的,当存在一个音频特征与当前视频段的音频特征值相匹配时,将所述音频特征对应的编号ID发给所述当前视频段,将所述当前视频段和所述当前音频段对应的编码ID加入到二级待合并音频列表,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述音频特征对应的视频文档中各个音频特征相匹配,为了保证匹配的准确率,可以将所述当前待播放视频流中的每一个视频段的音频特征值与所述音频特征对应的视频文档中的每一个音频特征进行匹配,确定所述每一个音频段的音频特征值的匹配结果。将所述每一个音频段和所述每一个音频段对应的编码ID加入到二级待合并音频列表,将所述二级待合并音频列表中的编码ID进行合并,判断所述视频文档中的是否存在具有连续递增编码ID的多个音频特征与所述当前待播放视频流中的音频特征对应的二级待合并音频列表中的编码ID相匹配。以一个视频文档为例,匹配的结果如图4所示,由于考虑到倒排索引查找与匹配的误检、漏检情况,并不是每一个视频段都可以找到匹配的音频特征,判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。所述连续递增编号的数量与所述当前待播放视频流的长度,匹配的准确率,音频特征提取的精度以及其他影响匹配准确性的因素共同决定。
本发明实施例中,在将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配完成之后,可能存在多个匹配的特征文档,顺次的执行上述的匹配操作即可;也可能不存在与当前音频特征值匹配的音频特征文档,直接将与所述当前视频特征值匹配的待播放视频流舍弃。
本发明实施例中,当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
本发明实施例中,通过两级倒排索引的方式是实现了对当前待播放视频流中广告视频的筛选,具体的执行流程如图5所示。
与上述广告视频筛选方法相对应的,本发明还提供了一套广告视频筛选系统,其结果框图如图6所示,包括:
划分模块401,第一匹配模块402,第二匹配模块403和筛选模块404。
其中,
所述划分模块401,用于按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
所述第一匹配模块402,用于依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
所述第二匹配模块403,用于当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
所述筛选模块404,用于当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。
本发明提供了一种广告视频的筛选系统,包括:按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档中的每一个音频特征进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选。上述的方法,依据第一倒排索引库和第二倒排索引库中预存的样本进行自动的筛选,提高了广告视频筛选的速度,解决了现有技术中人工筛选广告效率低,耗时长的问题。
本发明实施例中,所述第一匹配模块402的结构框图如图7所示,包括:
第一确定单元405,第二确定单元406和第三确定单元407。
其中,
所述第一确定单元405,用于在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
所述第二确定单元406,用于将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
所述第三确定单元407,用于以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
本发明实施例中,还包括筛选单元,用于当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
本发明实施例中,所述第二匹配模块403的结构框图如图7所示,包括:
第一匹配单元408,第二匹配单元409和判断单元410。
其中,
所述第一匹配单元408,用于将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
所述第二匹配单元409,用于当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
所述判断单元410,用于判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
本发明实施例中,还包括存储单元,用于当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种广告视频的筛选方法,其特征在于,包括:
按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选;
其中,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告样本进行匹配包括:
在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
2.根据权利要求1所述的方法,其特征在于,还包括:
当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
3.根据权利要求1所述的方法,其特征在于,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配包括:
将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
4.根据权利要求1或3所述的方法,其特征在于,还包括:
当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
5.一种广告视频的筛选系统,其特征在于,包括:
划分模块,用于按预设的划分规则,将当前待播放的视频流划分为多个预设长度的视频段,并计算每一个视频段对应的音频特征值;
第一匹配模块,用于依据所述每一个视频段对应的音频特征值,按预设的匹配规则,将所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本进行匹配;
第二匹配模块,用于当未匹配成功时,将所述每一个视频段对应的音频特征值与预设的第二倒排索引库中的多组音频文档进行匹配,所述每一组音频文档中包含有多个具有编号ID的连续音频特征;
筛选模块,用于当存在一组音频文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,确定所述当前待播放视频流为广告视频,对其进行筛选;
其中,所述第一匹配模块包括:
第一确定单元,用于在所述当前待播放的视频流中任取一个视频段作为目标视频,将所述目标视频对应的音频特征值,按倒排索引的方式,与所述预设的第一倒排索引库中的各个已存广告样本进行逐一匹配,确定与所述目标视频对应的第一样本集;
第二确定单元,用于将所述目标视频与所述第一样本集中的各个广告样本进行索引偏移匹配,确定与所述目标视频对应的匹配广告样本;
第三确定单元,用于以所述目标视频为起始点,分别将所述目标视频左右两边的各个视频段逐一与所述匹配广告样本进行匹配,并进行匹配结果的合并,当合并的视频时长超过预设时长时,确定所述待播放视频流与所述匹配广告样本相匹配。
6.根据权利要求5所述的系统,其特征在于,还包括:
筛选单元,用于当所述当前待播放的视频流与预设的第一倒排索引库中已存的各个广告视频样本匹配成功时,确定所述当前待播放的视频流为广告视频,对其进行筛选。
7.根据权利要求5所述的系统,其特征在于,所述第二匹配模块包括:
第一匹配单元,用于将所述每一个视频段对应的音频特征值与所述多组音频文档中包含的每一个音频特征进行匹配;
第二匹配单元,用于当存在任意一个与当前视频段的音频特征值相匹配的音频特征对应的视频文档时,以所述当前视频段为起点,将与所述当前音频段相邻的每一个音频段的音频特征值与所述视频文档中各个音频特征相匹配;
判断单元,用于判断所述视频文档中的是否存在具有连续递增编号ID的多个音频特征与所述当前待播放视频流中的音频特征相匹配。
8.根据权利要求5或7所述的系统,其特征在于,还包括:
存储单元,用于当存在一组连续音频特征文档中的具有连续递增编号ID的多个音频特征与所述待播放视频流中的音频特征值相匹配时,将确定为广告视频的所述当前待播放的视频流作为广告视频样本存入第一倒排索引库中。
CN201711266120.6A 2017-12-05 2017-12-05 一种广告视频的筛选方法及系统 Active CN107948734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711266120.6A CN107948734B (zh) 2017-12-05 2017-12-05 一种广告视频的筛选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711266120.6A CN107948734B (zh) 2017-12-05 2017-12-05 一种广告视频的筛选方法及系统

Publications (2)

Publication Number Publication Date
CN107948734A CN107948734A (zh) 2018-04-20
CN107948734B true CN107948734B (zh) 2020-09-11

Family

ID=61945709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711266120.6A Active CN107948734B (zh) 2017-12-05 2017-12-05 一种广告视频的筛选方法及系统

Country Status (1)

Country Link
CN (1) CN107948734B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876467A (zh) * 2018-06-28 2018-11-23 北京陌上花科技有限公司 广告投放方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856997B2 (en) * 2000-10-27 2005-02-15 Lg Electronics Inc. Apparatus and method for providing file structure for multimedia streaming service
CN101017493A (zh) * 2005-07-06 2007-08-15 索尼株式会社 具有链接信息的索引信息的产生装置和方法
CN102201001A (zh) * 2011-04-29 2011-09-28 西安交通大学 基于倒排技术的快速检索方法
CN102289518A (zh) * 2011-09-13 2011-12-21 盛乐信息技术(上海)有限公司 音频指纹检索库的更新方法及系统
CN103440313A (zh) * 2013-08-27 2013-12-11 复旦大学 基于音频指纹特征的音乐检索系统
CN106375867A (zh) * 2016-08-22 2017-02-01 无锡天脉聚源传媒科技有限公司 一种在电视视频中切割广告的方法及装置
US9564172B2 (en) * 2014-07-14 2017-02-07 NFL Enterprises LLC Video replay systems and methods
CN107229629A (zh) * 2016-03-24 2017-10-03 腾讯科技(深圳)有限公司 音频识别方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856997B2 (en) * 2000-10-27 2005-02-15 Lg Electronics Inc. Apparatus and method for providing file structure for multimedia streaming service
CN101017493A (zh) * 2005-07-06 2007-08-15 索尼株式会社 具有链接信息的索引信息的产生装置和方法
CN102201001A (zh) * 2011-04-29 2011-09-28 西安交通大学 基于倒排技术的快速检索方法
CN102289518A (zh) * 2011-09-13 2011-12-21 盛乐信息技术(上海)有限公司 音频指纹检索库的更新方法及系统
CN103440313A (zh) * 2013-08-27 2013-12-11 复旦大学 基于音频指纹特征的音乐检索系统
US9564172B2 (en) * 2014-07-14 2017-02-07 NFL Enterprises LLC Video replay systems and methods
CN107229629A (zh) * 2016-03-24 2017-10-03 腾讯科技(深圳)有限公司 音频识别方法及装置
CN106375867A (zh) * 2016-08-22 2017-02-01 无锡天脉聚源传媒科技有限公司 一种在电视视频中切割广告的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于内容的视频检索系统设计;黄鹤;孟广仕;《科技创新与应用》;20150205;全文 *

Also Published As

Publication number Publication date
CN107948734A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN105245958B (zh) 一种直播电视节目推荐方法和装置
CN107644085B (zh) 体育赛事新闻的生成方法和装置
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
CN104469508A (zh) 基于弹幕信息内容进行视频定位的方法、服务器和系统
KR101404585B1 (ko) 구간 작성 장치, 구간 작성 방법 및, 구간 작성 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
KR20120088650A (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
EP3776263B1 (en) System and method for detecting repeating content, including commercials, in a video data stream using audio-based and video-based automated content recognition
CN101361301A (zh) 检测广播媒体中的重复内容
US8994311B1 (en) System, method, and computer program for segmenting a content stream
US20130138673A1 (en) Information processing device, information processing method, and program
US11785105B2 (en) Methods and apparatus to facilitate meter to meter matching for media identification
CN111385606A (zh) 一种视频预览方法、装置及智能终端
CN103442270B (zh) 一种采集用户的收视数据的方法及装置
CN112969079A (zh) 主播的资源分配方法、装置、计算机设备及存储介质
US20170024441A1 (en) Systems and methods for continuously detecting and identifying songs in a continuous audio stream
CN107948734B (zh) 一种广告视频的筛选方法及系统
CN112199582A (zh) 一种内容推荐方法、装置、设备及介质
CN108830636B (zh) 一种活跃用户的询量方法和装置
CN108024142B (zh) 一种视频流检测方法及系统
WO2012070182A1 (ja) 推定装置、推定方法、並びにプログラム
CN115834959A (zh) 一种视频推荐信息确定方法、装置、电子设备和介质
CN110263175B (zh) 一种信息归类的方法、装置及电子设备
CN105025369A (zh) 一种确定组合频道中推荐资源的方法及装置
CN112307312A (zh) 一种文章推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant