CN108171151A - 一种对视频广告进行识别统计的控制方法及装置 - Google Patents
一种对视频广告进行识别统计的控制方法及装置 Download PDFInfo
- Publication number
- CN108171151A CN108171151A CN201711437876.2A CN201711437876A CN108171151A CN 108171151 A CN108171151 A CN 108171151A CN 201711437876 A CN201711437876 A CN 201711437876A CN 108171151 A CN108171151 A CN 108171151A
- Authority
- CN
- China
- Prior art keywords
- compared
- waveforms
- final
- video ads
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明提供了一种对视频广告进行识别统计的控制方法,其用于基于声音波形捕捉识别视频广告类型,包括如下步骤:a.基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图;b.对所述波形图进行分割处理并确定一个或多个原始待比对波形;c.对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形;d.将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。本发明基于声音波形捕捉识别视频广告类型,能够快速、自动地识别统计出视频广告类型,节约了大量的人力物力,降低了识别统计成本。
Description
技术领域
本发明涉及声音识别领域,具体地,涉及一种对视频广告进行识别统计的控制方法及装置。
背景技术
随着网络和多媒体技术的发展,视频成为多媒体重要的组成部分。广告作为视频的一种,在传递商业信息上起着举足轻重的作用。目前,随着广告数量不断增加和广告类型的多样化,迫切需要开发出能够识别和统计视频广告类型以满足不同群体的需求。一般企业希望通过广告的识别来检查自己的广告是否在电视台或者网络中按照签订合同进行播放以及了解竞争对手的动态,以便制定合理策略,从而获得主动地位;广告公司希望通过识别和检测系统收集优秀的广告,进行研究和分析,从而制作出更有宣传效果的广告;普通人希望借助广告识别检测系统,迅速定位到广告部分,进行相关操作,比如删除或者获得有用的广告;政府机构可通过识别和统计系统快速确定视频广告播放的合法性和合理性。因此在视频广告越来越普遍的同时,如何快速、自动地识别统计出视频广告类型在研究、监管广告的过程中显得极为重要。
传统的视频广告识别检测主要通过人工检测,这一方法存在诸多缺陷:一是耗费时间过长,识别统计的速度慢;二是工作量较大,因而所需人力物力较多;三是大量的时间和人员投入导致的成本上升,不利于节约成本,提高经济效益。
而目前并没有能够解决上述技术问题的技术方案,并没有一种对视频广告进行识别统计的控制方法及装置。
发明内容
针对现有技术存在的技术缺陷,本发明的目的是提供一种对视频广告进行识别统计的控制方法,其用于基于声音波形捕捉识别视频广告类型,包括如下步骤:
a.基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图;
b.对所述波形图进行分割处理并确定一个或多个原始待比对波形;
c.对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形;
d.将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
优选地,在所述步骤a之前,包括如下步骤:
i.将多个视频广告转化为相匹配的多个波形数据;
ii.将所述多个波形数据存储在数据库中。
优选地,所述步骤b包括如下步骤:
b1.获取所述波形图的n个坐标点;
b2.基于初始坐标点以及n个坐标点确定n个原始待比对波形。
优选地,所述波形图的n个坐标点按照如下方式获取:
-相隔时间t标记为一个坐标点;
-确定声音强度高于第一阈值的坐标点标记为一个坐标点;以及
-确定声音强度低于第二阈值的坐标点标记为一个坐标点。
优选地,所述步骤c包括如下步骤:
c1.将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱;
c2.基于多个频谱中的每个频谱的音效确定一个或多个最终频谱;
c3.将一个或多个所述最终频谱作为一个或多个最终待比对波形。
优选地,所述步骤c2中声音效果包括如下几种方式实现:
声音强度随着时间逐渐变大;
声音持续时长大于第三阈值。
优选地,在所述步骤c2之后,还包括步骤c2′:通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。
优选地,在所述步骤d之后,还包括步骤:
e:将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告;
f:将一个或多个视频广告进行统计并标记在用户终端中进行存储。
优选地,用户终端每隔50ms对周围声音进行实时捕捉。
作为本发明的另一方面,还提供一种对视频广告进行识别统计的控制装置,用于基于声音波形捕捉识别视频广告类型,包括:
第一确定模块11:其用于基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图;
第二确定模块12:其用于对所述波形图进行分割处理并确定一个或多个原始待比对波形;
第三确定模块13:其用于对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形;
第一处理模块14:其用于将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
优选地,所述的控制装置,包括:
第二处理模块21:其用于将多个视频广告转化为相匹配的多个波形数据;
第一存储模块22:其用于将所述多个波形数据存储在数据库中。
优选地,所述的控制装置,其特征在于,所述第二确定模块12包括:
第一获取模块121:其用于获取所述波形图的n个坐标点;
第四确定模块122:其用于基于初始坐标点以及n个坐标点确定n个原始待比对波形。
优选地,所述第三确定模块13包括:
第二获取模块131:其用于将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱;
第五确定模块132:其用于基于多个频谱中的每个频谱的音效确定一个或多个最终频谱;
第六确定模块133:其用于将一个或多个所述最终频谱作为一个或多个最终待比对波形;
第三处理模块134:其用于通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。
优选地,所述的控制装置,还包括:
第三获取模块15:其用于将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告;
第二存储模块16:将一个或多个视频广告进行统计并标记在用户终端中进行存储。
本发明提供了一种对视频广告进行识别统计的控制方法,其用于基于声音波形捕捉识别视频广告类型,本发明基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图,进而对所述波形图进行分割处理并确定一个或多个原始待比对波形,并对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形,最后将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。本发明基于声音波形捕捉识别视频广告类型,能够快速、自动地识别统计出视频广告类型,节约了大量的人力物力,降低了识别统计成本,本发明结构简单,使用方便,具有极高的商业价值。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了本发明的一个具体实施方式的,一种基于声音波形捕捉识别视频广告类型的控制方法的具体流程示意图;
图2示出了本发明的第一实施例,用于将多个波形数据储存在数据库中的具体流程示意图;
图3示出了本发明的第二实施例,用于确定一个或多个原始待比对波形的具体流程示意图;
图4示出了本发明的第三实施例,用于对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形的具体流程示意图;
图5示出了本发明的第四实施例的,一种基于声音波形对视频广告类型进行捕捉识别以及对视频广告进行统计并标记在用户终端进行存储的控制方法的具体流程示意图;以及
图6示出了本发明的另一具体实施方式的,一种对视频广告进行识别统计的控制装置的模块连接示意图。
具体实施方式
为了更好的使本发明的技术方案清晰的表示出来,下面结合附图对本发明作进一步说明。
图1示出了本发明的一个具体实施方式的,一种基于声音波形捕捉识别视频广告类型的控制方法的流程图,包括如下步骤;
首先,执行步骤S101,基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图。具体地,声波是发声体产生的振动在介质中传播,其所到之处的质点沿着传播方向在平衡位置附近振动,通常被简化为正弦平面波的描述,其特征包括频率、波长、振幅、传播速度等。声波接收器通过记录并分析接收到的声波频率、相位等特征,可以判断出声音的类型以及介质的物理性质。不同的视频广告类型的声音波形并不相同,用户通过数字电视终端观看相应的电视节目,因而可通过在用户的终端设置声波接收器,实时捕捉各种类型的视频广告的声音波形,如每隔50ms对视频广告的声音进行实时捕捉,再通过即时设定初始坐标点,确定捕捉到的视频广告的波形图。
在一个具体应用中,例如通过wav文件直接记录声音波形,wav文件包含文件头和数据块。wav文件头记录的主要信息包括采样频率、采样精度和声道数。采样频率越高音质越接近原声,采样频率通常有11025hz、22050hz、44100hz、48000hz四种。采样精度数值越大分辨率越高。wav文件记录了波形上的各点数值,各点之间的横坐标间距由采样频率决定,各点的取值范围和精度由采样精度决定。波形绘制原理是用直线依次连接波形上相邻各个点。由于采样频率非常高,所以本来是由一些直线依次相连所构成的折线就在屏幕上形成了光滑细腻的曲线。结合步骤S101的内容,所述即时设定初始坐标点可以理解为步骤S101开始执行时在第一个时间点获得的采样信息,该采样信息对应曲线的起始点。更为具体地,可以利用.Net C#的读写器等文件操作类,实现对wave文件的解析从而得到声音的波形数据,再利用Graphics类的各种图形绘制方法将波形数据绘制成曲线,即以图形化的方式显示其波形。本领域技术人员理解,此处举例仅是为了说明,并不表示对本发明的限定。
然后,执行步骤S102,对所述波形图进行分割处理并确定一个或多个原始待比对波形。具体地,通过声波分析仪器将步骤S101捕捉确定的波形图进行分割处理,确定一个或者多个的原始待比对波形。本领域技术人员理解,可对波形图进行等间隔抽取,确定一个合理的时间间隔T,分别选取波形图上时间相隔为T的坐标点如(T1,0),(T2,0),将选取的坐标点之间的波形进行分割处理,获取时间间隔相同的波形作为原始待比对波形,所述根据相同时间间隔确定原始待比对波形的目的在于获取若干与数据库中的波形数据长度相等的波形,便于后续的比对;也可设定一个基准A,分别标记声音强度等于该基准A的坐标,截取已被标记的相邻两个坐标之间的波形,作为原始待比对波形,在后续比对中只需与数据库中高于或低于这一基准的波形进行相似度比对;也可选取波形图上的每个波峰和波谷的坐标点,截取相邻波峰波谷之间的波形,即所得原始待比对波形均呈上升或下降趋势,在最终比对过程中,根据原始待比对波形的波形趋势选择与具有相同趋势的数据库的波形数据进行比对。所述设定基准以及选取波峰波谷标记坐标点,可减少后续比对的程序和步骤,加快比对速度。
再然后,执行步骤S103,对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形。具体地,声音信息通过波形信号的传递进行传播,声音波形信号在它的产生、转换、传输的每一个环节都可能由于环境和干扰的存在而畸变,以致于信号及其所携带的信息被埋在噪声当中,因此声波接收器在捕捉视频广告时不可避免地会掺杂一些不属于视频广告的声音,例如,用户在观看视频广告时的讲话声和脚步声,视频广告的回音等,这些噪音会干扰声波接收器捕捉视频广告的声音波形,导致声波接收器确定的波形图不能准确反映真实的视频广告的声音波形。因此需要通过滤波器,对经过分割处理的一个或多个的原始待比对波形进行降噪处理,消除视频广告声音以外的杂音,确定一个或多个能准确反映视频广告的声音的最终待比对波形。
本领域技术人员理解,所述降噪处理可基于小波变换对原始待比对波形进行降噪处理。原始的声音信号一般是低频且稳定的,高频部分就是需要去除的噪声。首先,将信号做小波分解,利用噪音一般在高频的特性,使用阈值处理小波系数,之后再对其信号进行重构即可完成去噪。一般的,把小波信号分解成三层,其分解后的信号Ai(i=1,2,3)就含有有用的信号,同时对信号三层分解后的信号A3仍可能含有噪声信号,因此可对其继续进行小波分解,之后可分为四层、五层等。除了有用信号Ai之外,每层分解都有Di信号,大部分噪声信号就在其中。因此,可通过门限阈值处理小波系数,最后重构信号,即确定最终待比对波形;也可通过含噪的原始待比对波形信号和无声判别得到的纯噪声信号进行FFT变化,从含噪语音幅度谱的平方中减去纯噪声的幅度谱的平方,然后开方得到原始声音幅度谱的估值,再借用含噪语音的相位,进行IFFT变化,得到增强的声音信号。
最后,执行步骤S104,将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
具体地,在对声音波形进行对比之前,先将多个确定的视频广告的声音波形制成数据文件储存于特定的数据库中,将获取的最终待比对波形也通过计算机转化为数据文件,再通过事先编写的程序对两个数据文件的相关性进行比较得出相似度。例如,将最终待比对波形数据和数据库的波形数据分别假定为x(t),y(t),选择倍数a使a*y(t)去逼近x(t),再借助误差能量度量这对波形的相似程度。误差能量用x(t)-a*y(t)的平方在时域上的积分来表示,倍数a的选择须保证能使能量误差为最小,通过对函数求导求极值可以得知a。定义x(t)与y(t)的相关数为Pxy,其平方与1的差值为相对误差能量,即误差能量与x(t)*y(t)在时域积分的比值。其中,xy可用来表征两波形的相似程度。由于对于能量有限的信号而言,能量是确定的,相关系数Pxy的大小只由x(t)*y(t)的积分所决定。如果两完全不相似的波形其幅度取值和出现时刻是相互独立、彼此无关的,x(t)*y(t)=0,其积分结果亦为0,此时两波形信号相似度最差。当相关关系数为1时,说明两波形信号相似度高。通过将最终待比对波形数据与数据库中的标准波形数据一一进行相关性比较,得出相似度最高的标准波形数据作为匹配数据。本领域技术人员理解,还可基于Hausdroff距离比较将最终待比对波形与数据库的波形数据的相似度,分别定义数据库中的波形数据和最终待比对波形数据为数据集A、B,根据公式H(Am,Bn)=max(h(Am,Bn),h(Bn,Am))计算两者的Hausdorff距离,Hausdorff距离越小,则表明两者相似度越高,此方法可忽略由噪声引起的波形变化。
图2示出了本发明的第一实施例,用于将多个波形数据储存在数据库中的流程图,具体地,用于将多个波形数据储存在数据库中的流程在图一中示出的步骤S101执行之前进行,包括如下步骤:
首先,执行步骤S201,将多个视频广告转化为相匹配的多个波形数据。具体地,在捕捉需要识别的视频广告类型之前,先通过声波接收器将多个已知的不同类型的视频广告转化为相应的波形数据,再将该相应的波形数据储存在特定的数据库中。例如,操作人员先确定视频广告类型,如根据广告内容可将广告类型分为产品广告、公益广告、品牌广告、观念广告,或者根据广告目的将广告类型确定为告知广告、促销广告、形象广告、建议广告、公益广告、推广广告等。接着,操作人员在确定的各个广告类型下分别选取多个相应的视频广告,如属于公益广告的呼吁爱护花草、节约水资源的广告,属于产品广告的推销药膏、保健品的广告,通过声波接收器将选取的视频广告转化为相匹配的波形数据。本领域技术人员理解,所述将多个视频广告转化为相匹配的多个波形数据,先设定一个合理的采样频率,通过用户终端每隔相等时间对视频广告声音进行实时捕捉,将捕捉的毎个数据进行记录,例如a1,定义数据集Ax为每个视频广告类型,则Ar=(ar 1,ar 2···,ar n)。定义数据集A为数据库的波形数据,Ax为A的一个波形数据,则A=(A1,A2,···,Ax)。本领域技术人员理解,此处举例仅是为了说明,并不表示对本发明的限定。
然后,执行步骤S202,将所述多个波形数据存储在数据库中。具体地,操作人员将通过上述步骤S201转化得到的波形数据储存在特定的数据库中的对应的广告类型下。本领域技术人员理解,确定数据库中视频广告类型分别为商业广告、公益广告。选取多个商业广告和公益广告的波形数据分别归集于商业广告和公益广告的类型下,例如脑白金的视频广告,记录该广告的波形数据(C1,C2,···Cn),或者记录无偿献血的视频广告的波形数据(D1,D2,···Dn),所述捕捉记录视频广告的波形数据,可参考步骤S201,将该波形数据分别归集在商业广告和公益广告的类别下,若最终待比对波形数据(W1,W2···,Wn)与脑白金的视频广告的波形数据相似度最高,所述相似度比对可参考步骤S104,则表明所需识别的视频广告类型属于商业广告,若与无偿献血的视频广告的波形数据相似度最高,则表明所需识别的视频广告类型属于公益广告。
图3示出了本发明的第二实施例,是步骤S102的一个具体实现方式,用于确定一个或多个原始待比对波形的流程图,包括如下步骤:
首先,执行步骤S1021,获取所述波形图的n个坐标点。具体地,从声波接收器捕捉确定的波形图中选取相隔时间相同的坐标点,如每隔时间t标记为一个坐标点,选取的坐标点分别为(t1,0),(t2,0),(t3,0)等。确定第一阈值a,将波形图中声音强度高于第一阈值a的坐标点标记为一个坐标点,如(a1,0),(a2,0)。确定第二阈值b,将波形图中声音强度低于第二阈值b的坐标点标记为一个坐标点,如(b1,0),(b2,0)。
然后,执行步骤S1022,基于初始坐标点以及n个坐标点确定n个原始待比对波形。具体地,例如先确定初始坐标点(0,0),接着,根据步骤S1021获取波形图的n个坐标点,如(t1,0),(t2,0),(a1,0),(b1,0),最后,分别获取初始坐标点与n个坐标点之间的波形,将选取的波形作为原始待比对波形。
图4示出了本发明的第三实施例,是步骤S103的一个具体实现方式,用于对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形的流程图,包括如下步骤:
首先,执行步骤S1031,将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱。进一步地,执行步骤S1032,基于多个频谱中的每个频谱的音效确定一个或多个最终频谱。
进一步地,执行步骤S1033,通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。具体地,将上述步骤S1022确定的n个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱,基于多个频谱中的每个频谱的音效确定一个或多个最终频谱,通过调整一个或者多个所述最终频谱的滤波器系数用以消除回音。例如设定第三阈值c,选取多个频谱中声音效果为声音强度随着时间逐渐变大,声音持续时长大于第三阈值c的频谱确定为一个或多个最终频谱,再通过滤波器调整一个或者多个所述最终频谱的滤波器系数用以消除回音。
进一步地,执行步骤S1034,将上述一个或多个消除回音的频谱确定为一个或多个最终待比对波形。
图5示出了本发明的第四实施例的,一种基于声音波形对视频广告进行捕捉识别并对视频广告进行识别统计的控制方法的流程图,包括如下步骤:
首先,执行步骤S301,基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图。所述即时设定的初始坐标点,目的是将多个捕捉到的声音波形选择从同一坐标点开始,经相同时间长度,在同一坐标点结束,从而确定波形图,后续根据相同时间间隔选取坐标点对捕捉到的波形图进行分割处理,得到与数据库中的波形数据长度相同且初始坐标相同的原始待比对片段,便于所述原始待比对片段经过降噪处理后与数据库中的波形数据进行相似度比对。
进一步地,执行步骤S302,对所述波形图进行分割处理并确定一个或多个原始待比对波形。
进一步地,执行步骤S303,对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形。
进一步地,执行步骤S304,将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
进一步地,执行步骤S305,将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告。具体地,例如通过声波接收器捕捉的视频广告的波形数据与数据库中的相似度最高的匹配数据属于公益广告类型,则可识别出捕捉到的视频广告类型属于公益广告。
进一步地,执行步骤S306,将一个或多个视频广告进行统计并标记在用户终端中进行存储。具体地,将识别出的视频广告类型如产品广告、公益广告等进行统计并标记,然后在用户终端中进行储存。
图6示出了本发明的另一具体实施方式的,一种对视频广告进行识别统计的控制装置的功能框图,用于基于声音波形捕捉识别视频广告类型,包括:
本领域技术人员理解,图6中各装置功能的实现可以是硬件、由处理器执行的软件或者二者的组合。具体地,如果通过软件模块实现,则图6各个功能模块分别对应于执行图5示出的各个步骤。如果通过硬件模块实现,则可利用现场可编程门阵列(FPGA)将对应的功能模块固定化实现。
进一步地,所述软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、硬盘、或本领域已知的任何其他形式的存储介质。通过将所述存储介质耦接至微控制单元1的处理器,从而使所述处理器能够从所述存储介质中读取信息,并且可以向所述存储介质写入信息。作为一种变化,所述存储介质可以是处理器的组成部分,或者所述处理器和所述存储介质均位于专用集成电路(ASIC)上。
进一步地,所述硬件模块可以是能够实现图6中各功能模块具体功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件或以上这些硬件的组合。作为一种变化,图6中各功能模块具体功能还可以通过计算设备的组合实现,例如,DSP和微处理器的组合、多个微处理器的组合、与DSP通信结合的一个或者多个微处理器的组合等。
第一确定模块11:其用于基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图。
第二确定模块12:其用于对所述波形图进行分割处理并确定一个或多个原始待比对波形。
第三确定模块13:其用于对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形。
第一处理模块14:其用于将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
第三获取模块15:其用于将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告。
第二存储模块16:将一个或多个视频广告进行统计并标记在用户终端中进行存储。
优选地,所述第一确定模块11包括如下模块:
第二处理模块21:其用于将多个视频广告转化为相匹配的多个波形数据。
第一存储模块22:其用于将所述多个波形数据存储在数据库中。
优选地,所述第二确定模块12包括如下模块:
第一获取模块121:其用于获取所述波形图的n个坐标点。
第四确定模块122:其用于基于初始坐标点以及n个坐标点确定n个原始待比对波形。
优选地,所述第三确定模块13包括如下模块:
第二获取模块131:其用于将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱。
第五确定模块132:其用于基于多个频谱中的每个频谱的音效确定一个或多个最终频谱。
第六确定模块133:其用于将一个或多个所述最终频谱作为一个或多个最终待比对波形。
第三处理模块134:其用于通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。
本领域技术人员理解,图6中各模块的组合能够实现对视频广告的识别统计。具体地,所需识别的视频广告在用户终端通过第一确定模块根据其确定其波形图,所述的波形图通过第二确定模块进行分割处理确定为一个或多个原始待比对波形,所述一个或多个原始待比对波形通过第三确定模块进行降噪处理确定为一个或多个最终待比对波形,所述一个或多个最终待比对波形通过第一处理模块与数据库中的波形数据进行逐一匹配,获取与其相似度最高的波形数据作为一个或多个匹配数据,所述一个或多个匹配数据通过第三获取模块进行识别,并获取相对应的一个或者多个视频广告,将一个或者多个视频广告通过第二储存模块进行统计并标记在用户终端进行储存。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (14)
1.一种对视频广告进行识别统计的控制方法,其用于基于声音波形捕捉识别视频广告类型,其特征在于,包括如下步骤:
a.基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图;
b.对所述波形图进行分割处理并确定一个或多个原始待比对波形;
c.对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形;
d.将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
2.根据权利要求1所述的控制方法,其特征在于,在所述步骤a之前,包括如下步骤:
i.将多个视频广告转化为相匹配的多个波形数据;
ii.将所述多个波形数据存储在数据库中。
3.根据权利要求1所述的控制方法,其特征在于,所述步骤b包括如下步骤:
b1.获取所述波形图的n个坐标点;
b2.基于初始坐标点以及n个坐标点确定n个原始待比对波形。
4.根据权利要求3所述的控制方法,其特征在于,所述波形图的n个坐标点按照如下方式获取:
-相隔时间t标记为一个坐标点;
-确定声音强度高于第一阈值的坐标点标记为一个坐标点;以及
-确定声音强度低于第二阈值的坐标点标记为一个坐标点。
5.根据权利要求1所述的控制方法,其特征在于,所述步骤c包括如下步骤:
c1.将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱;
c2.基于多个频谱中的每个频谱的音效确定一个或多个最终频谱;
c3.将一个或多个所述最终频谱作为一个或多个最终待比对波形。
6.根据权利要求5所述的控制方法,其特征在于,所述步骤c2中声音效果包括如下几种方式实现:
声音强度随着时间逐渐变大;
声音持续时长大于第三阈值。
7.根据权利要求5所述的控制方法,其特征在于,在所述步骤c2之后,还包括步骤c2′:通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。
8.根据权利要求1所述的控制方法,其特征在于,在所述步骤d之后,还包括步骤:
e:将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告;
f:将一个或多个视频广告进行统计并标记在用户终端中进行存储。
9.根据权利要求1所述的控制方法,其特征在于,用户终端每隔50ms对周围声音进行实时捕捉。
10.一种对视频广告进行识别统计的控制装置,其用于基于声音波形捕捉识别视频广告类型,其特征在于,包括:
第一确定模块(11):其用于基于用户终端实时捕捉的多个声音波形以及即时设定的初始坐标点确定波形图;
第二确定模块(12):其用于对所述波形图进行分割处理并确定一个或多个原始待比对波形;
第三确定模块(13):其用于对所述一个或多个原始待比对波形进行降噪处理并确定一个或多个最终待比对波形;
第一处理模块(14):其用于将一个或多个最终待比对波形与数据库中的波形数据进行逐一匹配,获取与所述一个或多个最终待比对波形相似度最高的波形数据作为一个或多个匹配数据。
11.根据权利要求10所述的控制装置,其特征在于,包括:
第二处理模块(21):其用于将多个视频广告转化为相匹配的多个波形数据;
第一存储模块(22):其用于将所述多个波形数据存储在数据库中。
12.根据权利要求10或11所述的控制装置,其特征在于,所述第二确定模块(12)包括:
第一获取模块(121):其用于获取所述波形图的n个坐标点;
第四确定模块(122):其用于基于初始坐标点以及n个坐标点确定n个原始待比对波形。
13.根据权利要求12所述的控制装置,其特征在于,所述第三确定模块(13)包括:
第二获取模块(131):其用于将所述一个或多个原始待比对波形进行频谱分析,获取一个或多个待比对波形中的多个频谱;
第五确定模块(132):其用于基于多个频谱中的每个频谱的音效确定一个或多个最终频谱;
第六确定模块(133):其用于将一个或多个所述最终频谱作为一个或多个最终待比对波形;
第三处理模块(134):其用于通过调整一个或多个所述最终频谱的滤波器系数用以消除回音。
14.根据权利要求12所述的控制装置,其特征在于,还包括:
第三获取模块(15):其用于将所述一个或多个匹配数据进行识别,并获取相对应的一个或多个视频广告;
第二存储模块(16):将一个或多个视频广告进行统计并标记在用户终端中进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711437876.2A CN108171151A (zh) | 2017-12-26 | 2017-12-26 | 一种对视频广告进行识别统计的控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711437876.2A CN108171151A (zh) | 2017-12-26 | 2017-12-26 | 一种对视频广告进行识别统计的控制方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108171151A true CN108171151A (zh) | 2018-06-15 |
Family
ID=62521608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711437876.2A Pending CN108171151A (zh) | 2017-12-26 | 2017-12-26 | 一种对视频广告进行识别统计的控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108171151A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113613155A (zh) * | 2021-07-24 | 2021-11-05 | 武汉左点科技有限公司 | 一种自适应环境的助听方法及装置 |
CN113613079A (zh) * | 2021-10-11 | 2021-11-05 | 浙江德塔森特数据技术有限公司 | 一种智能设备视频广告处理方法以及智能设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158967A (zh) * | 2007-11-16 | 2008-04-09 | 北京交通大学 | 一种基于分层匹配的快速音频广告识别方法 |
CN101425161A (zh) * | 2007-10-30 | 2009-05-06 | 沈阳 | 基于目标受众的语音特征投放精准广告的方法 |
CN102405495A (zh) * | 2009-03-11 | 2012-04-04 | 谷歌公司 | 使用稀疏特征对信息检索进行音频分类 |
CN103403710A (zh) * | 2011-02-10 | 2013-11-20 | 雅虎公司 | 对来自音频信号的特征指纹的提取和匹配 |
CN103794209A (zh) * | 2014-01-17 | 2014-05-14 | 王博龙 | 一种基于音频指纹识别技术的电影映前广告监播系统 |
CN105190618A (zh) * | 2013-04-05 | 2015-12-23 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
CN105453577A (zh) * | 2013-08-07 | 2016-03-30 | 恩斯沃尔斯有限责任公司 | 直接反应广告检测及分类系统及方法 |
CN105554526A (zh) * | 2015-12-10 | 2016-05-04 | 上海都德信息科技有限公司 | 基于声纹识别的广告监测系统 |
CN106162321A (zh) * | 2016-08-31 | 2016-11-23 | 成都广电视讯文化传播有限公司 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
CN106372653A (zh) * | 2016-08-29 | 2017-02-01 | 中国传媒大学 | 一种基于堆栈式自动编码器的广告识别方法 |
CN107452401A (zh) * | 2017-05-27 | 2017-12-08 | 北京字节跳动网络技术有限公司 | 一种广告语音识别方法及装置 |
-
2017
- 2017-12-26 CN CN201711437876.2A patent/CN108171151A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425161A (zh) * | 2007-10-30 | 2009-05-06 | 沈阳 | 基于目标受众的语音特征投放精准广告的方法 |
CN101158967A (zh) * | 2007-11-16 | 2008-04-09 | 北京交通大学 | 一种基于分层匹配的快速音频广告识别方法 |
CN102405495A (zh) * | 2009-03-11 | 2012-04-04 | 谷歌公司 | 使用稀疏特征对信息检索进行音频分类 |
CN103403710A (zh) * | 2011-02-10 | 2013-11-20 | 雅虎公司 | 对来自音频信号的特征指纹的提取和匹配 |
CN105190618A (zh) * | 2013-04-05 | 2015-12-23 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
CN105453577A (zh) * | 2013-08-07 | 2016-03-30 | 恩斯沃尔斯有限责任公司 | 直接反应广告检测及分类系统及方法 |
CN103794209A (zh) * | 2014-01-17 | 2014-05-14 | 王博龙 | 一种基于音频指纹识别技术的电影映前广告监播系统 |
CN105554526A (zh) * | 2015-12-10 | 2016-05-04 | 上海都德信息科技有限公司 | 基于声纹识别的广告监测系统 |
CN106372653A (zh) * | 2016-08-29 | 2017-02-01 | 中国传媒大学 | 一种基于堆栈式自动编码器的广告识别方法 |
CN106162321A (zh) * | 2016-08-31 | 2016-11-23 | 成都广电视讯文化传播有限公司 | 一种声纹特征和音频水印相结合的音频信号识别方法 |
CN107452401A (zh) * | 2017-05-27 | 2017-12-08 | 北京字节跳动网络技术有限公司 | 一种广告语音识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
张澍: "音频声纹比对识别技术在广电监督中应用的技术探讨", 《内蒙古广播与电视技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113613155A (zh) * | 2021-07-24 | 2021-11-05 | 武汉左点科技有限公司 | 一种自适应环境的助听方法及装置 |
CN113613155B (zh) * | 2021-07-24 | 2024-04-26 | 武汉左点科技有限公司 | 一种自适应环境的助听方法及装置 |
CN113613079A (zh) * | 2021-10-11 | 2021-11-05 | 浙江德塔森特数据技术有限公司 | 一种智能设备视频广告处理方法以及智能设备 |
CN113613079B (zh) * | 2021-10-11 | 2022-01-04 | 浙江德塔森特数据技术有限公司 | 一种智能设备视频广告处理方法以及智能设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657798B2 (en) | Methods and apparatus to segment audio and determine audio segment similarities | |
US8386258B2 (en) | Systems and methods for recognizing sound and music signals in high noise and distortion | |
Sukittanon et al. | Modulation-scale analysis for content identification | |
CN107211061A (zh) | 用于空间会议回放的优化虚拟场景布局 | |
CN107211058A (zh) | 基于会话动态的会议分段 | |
CN110460872A (zh) | 视频直播的信息显示方法、装置、设备和存储介质 | |
CN107211027A (zh) | 感知质量比会议中原始听到的更高的后会议回放系统 | |
CN107210034A (zh) | 选择性会议摘要 | |
CN107210036A (zh) | 会议词语云 | |
CN109584904B (zh) | 应用于基础音乐视唱教育的视唱音频唱名识别建模方法 | |
CN113611324B (zh) | 一种直播中环境噪声抑制的方法、装置、电子设备及存储介质 | |
CN103594083A (zh) | 通过电视伴音自动识别电视节目的技术 | |
US20230317095A1 (en) | Systems and methods for pre-filtering audio content based on prominence of frequency content | |
CN110223677A (zh) | 空间音频信号滤波 | |
US9058384B2 (en) | System and method for identification of highly-variable vocalizations | |
CN108171151A (zh) | 一种对视频广告进行识别统计的控制方法及装置 | |
Seabra de Lima et al. | Characteristics of whistles from rough-toothed dolphins (Steno bredanensis) in Rio de Janeiro coast, southeastern Brazil | |
CN107452398A (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
Pilia et al. | Time scaling detection and estimation in audio recordings | |
US20220300553A1 (en) | Methods and apparatus to identify media | |
Dong et al. | Advances in automatic bird species recognition from environmental audio | |
Ou et al. | A non-spectrogram-correlation method of automatically detecting minke whale boings | |
Yu | Research on music emotion classification based on CNN-LSTM network | |
CN114743571A (zh) | 一种音频处理方法、装置、存储介质及电子设备 | |
Connor et al. | Automating identification of avian vocalizations using time–frequency information extracted from the Gabor transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180615 |
|
RJ01 | Rejection of invention patent application after publication |