CN106792140A - 一种基于声音识别的广播电视广告监测系统 - Google Patents
一种基于声音识别的广播电视广告监测系统 Download PDFInfo
- Publication number
- CN106792140A CN106792140A CN201611137655.9A CN201611137655A CN106792140A CN 106792140 A CN106792140 A CN 106792140A CN 201611137655 A CN201611137655 A CN 201611137655A CN 106792140 A CN106792140 A CN 106792140A
- Authority
- CN
- China
- Prior art keywords
- sound
- module
- voice recognition
- alarm
- broadcasted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44204—Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开一种基于声音识别的广播电视广告监测系统,包括声音采集模块、前端处理模块、声音识别建模模块、声音数据库、声音匹配模块;所述声音采集模块与前端处理模块连接;所述前端处理模块与声音识别模建模块连接;所述声音识别建模模块与声音匹配模块连接;所述声音匹配模块分别与声音数据库、报警模块和显示模块连接。本发明通过声音识别建模模块对样本声音和待识别的声音的特征值进行模型构建,保证待识别特征与模板特征之间识别的准确性;通过声音匹配模块对匹配的声音进行量化,提高匹配的准确性;通过报警模块和显示模块,能够直接的显示匹配的结果,增强匹配效果,在未来广告监测技术领域具有很好的发展前景。
Description
技术领域
本发明属于声音识别技术领域,涉及到一种基于声音识别的广播电视广告监测系统。
背景技术
广播和电视作为重要的传媒手段,在众多传媒方式中,有着广泛的影响力和良好的信息传播效果。以广播和电视为载体的广播广告和电视广告则在整个广告市场上一直占据着巨大的行业份额。广播电视广告具有信息密度高、信息含量大、受众认同度高和受众范围广泛等传统广告不具备的独特优势,已成为当今社会最主要和影响最广的广告形式之一。但是,伴随着我国经济结构的调整和行业市场的变化.广播电视广告行业在飞速发展的同时,出现了很多亟待解决的问题和现象:广播电视广告缺乏行业自律,广告违规问题频繁出现,因此对广播电视广告的监管已经迫在眉睫。
目前国内监测机构基本上采用人工抽样统计的方式对广播电视的广告进行监测和分析,具有效率低、正确性差的特点。
其中对广播电视广告的声音识别研究工作进展缓慢,主要表现在理论上一直没有突破,具体困难主要表现在:
(1)、声音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的声音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便;
(2)、髙噪声环境下声音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,因此需寻找新的信号分析处理方法;
(3)、语言学、生理学、心理学方面的研究成果己有不少,但如何把这些知识转化、建模并用于声音识别,将成为一个需解决的重大问题;
(4)、对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚,若将应用于声音识别还需要继续研究。
因此,设计一种基于声音识别的广播电视广告监测系统,用于解决目前广播电视广告检测的过程中声音识别不准确的问题。
发明内容
本发明的目的在于提供一种基于声音识别的广播电视广告监测系统,通过声音识别建模模块对样本声音和待识别的声音的特征值进行模型构建,且通过声音匹配模块对匹配的声音进行量化,解决了对广告声音识别不准确性且匹配效果差的问题。
本发明的目的可以通过以下技术方案实现:
一种基于声音识别的广播电视广告监测系统,包括声音采集模块、前端处理模块、声音识别建模模块、声音数据库、声音匹配模块;
所述声音采集模块与前端处理模块连接,所述声音采集模块用于采集广播电视广告在播放的过程中的声音信息,并将采集的声音信息发送至前端处理模块;
所述前端处理模块与声音识别模建模块连接,所述前端处理模块用于对采集的声音样本信号转化成特征矢量信息;
所述声音识别建模模块与声音匹配模块连接,所述声音识别建模模块用于将采集样本信号的特征矢量进行识别,并建立相应的声音模型;
所述声音数据库用于对声音样本建立的声音模型进行存储;
所述声音匹配模块分别与声音数据库、报警模块和显示模块连接,所述声音匹配模块用于将待识别的声音模型与声音数据库中存储的样本声音模型进行匹配计算。
进一步地,还包括报警模块和显示模块,所述报警模块用于对声音匹配的结果进行报警,所述报警模块用于发出报警提醒;所述显示模块用于显示声音匹配的结果。
进一步地,所述报警模块包括声报警和光报警,所述声报警采用蜂鸣器进行声音报警,所述光报警采用LED灯进行闪烁报警。
进一步地,所述显示模块采用智能手机或电脑。
进一步地,所述前端处理模块对声音的特征进行提取,提取的方法为短时谱方法,所述短时谱方法为将采集的声音进行10ms的划分,保证声音在短时间内具有平稳性。
进一步地,所述声音识别建模模块采用的识别方法包括模板匹配法和随机模型法。
进一步地,所述声音匹配模块采用矢量量化法,采用所述矢量量化法分别对声音样本进行量化和被识别的声音进行量化,对量化的两声音文件进行匹配,并将匹配的结果分别发送至所述报警模块和所述显示模块。
进一步地,若声音匹配不成功,则蜂鸣器发出刺耳报警提醒,且LED灯进行闪烁报警;若声音匹配成功,则所述声音匹配模块将匹配的结果发送至显示模块,所述显示模块显示匹配成功的声音模型。
本发明的有益效果:本发明通过声音识别建模模块对样本声音和待识别的声音的特征值进行模型构建,保证待识别特征与模板特征之间识别的准确性;通过声音匹配模块对匹配的声音进行量化,提高匹配的准确性;通过报警模块和显示模块,能够直接的显示匹配的结果,增强匹配效果,在未来广告监测技术领域具有很好的发展前景。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于声音识别的广播电视广告监测系统图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于声音识别的广播电视广告监测系统,包括声音采集模块、前端处理模块、声音识别建模模块、声音数据库、声音匹配模块、报警模块和显示模块;
声音采集模块与前端处理模块连接,声音采集模块用于采集广播电视广告在播放的过程中的声音信息,并将采集的声音信息发送至前端处理模块;
前端处理模块与声音识别模建模块连接,前端处理模块用于对采集的声音样本信号进行处理,转化成特征矢量信息;
声音识别建模模块与声音匹配模块连接,声音识别建模模块用于将采集样本信号的特征矢量进行识别,并建立相应的声音模型;
声音数据库用于对声音样本建立的声音模型进行存储;
声音匹配模块分别与声音数据库、报警模块和显示模块连接,声音匹配模块用于将广告中未知声音的声音模型与声音数据库中存储的样本声音模型进行匹配计算,并发送匹配的结果至报警模块和显示模块;
报警模块用于对声音匹配的结果进行报警,报警模块包括声报警和光报警,其中声报警采用蜂鸣器进行声音报警,光报警采用LED灯进行闪烁报警;
显示模块采用智能手机或电脑,用于显示声音匹配的结果。
在前端处理模块中对广告的声音进行分解,根据分解的声音得出声道共振特征和基音周期,用于声音编码、合成和识别等,提取的声音特征直接影响声音特征的比对,声音特征的提取采用短时谱方法进行表示,其中短时谱方法为将采集的声音进行10ms的划分,保证声音在短时间内具有平稳性。
声音识别建模模块采用的识别方法包括模板匹配法和随机模型法,其中模板匹配法通过将待识别语音信号的时间轴进行扭曲和弯曲,使待识别的声音特征与模板中的特征进行对比,并在两个特征中进行两个矢量距离最小的匹配路径计算,从而保证待识别特征与模板特征之间识别的准确性;随机模型法用于对声音信号进行统计,通过相互关联的两个随机过程共同描述信号的统计特征,其中一个是隐藏的具有有限状态的Markor链,另一个是与Markor链的每个装填进行相关联的观察矢量的随机过程,隐藏Markor链需通过可观察的信号特征进行显示,因此声音等时变性信号某一端的特征由对应状态下的可观测的随机过程进行描述。
声音匹配模块采用矢量量化法,采用矢量量化法分别对声音样本进行量化和被识别的声音进行量化,再对经过量化的两个声音文件进行匹配,并将匹配的结果分别发送至报警模块和显示模块,若匹配不成功,则蜂鸣器发出刺耳报警提醒,且LED灯进行闪烁报警,若匹配成功,则声音匹配模块将匹配的结果发送至显示模块,显示模块显示匹配成功的声音模型。
本发明通过声音识别建模模块对样本声音和待识别的声音的特征值进行模型构建,保证待识别特征与模板特征之间识别的准确性;通过声音匹配模块对匹配的声音进行量化,提高匹配的准确性;通过报警模块和显示模块,能够直接的显示匹配的结果,增强匹配效果,在未来广告监测技术领域具有很好的发展前景。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (8)
1.一种基于声音识别的广播电视广告监测系统,其特征在于:包括声音采集模块、前端处理模块、声音识别建模模块、声音数据库、声音匹配模块;
所述声音采集模块与前端处理模块连接,所述声音采集模块用于采集广播电视广告在播放的过程中的声音信息,并将采集的声音信息发送至前端处理模块;
所述前端处理模块与声音识别模建模块连接,所述前端处理模块用于对采集的声音样本信号转化成特征矢量信息;
所述声音识别建模模块与声音匹配模块连接,所述声音识别建模模块用于将采集样本信号的特征矢量进行识别,并建立相应的声音模型;
所述声音数据库用于对声音样本建立的声音模型进行存储;
所述声音匹配模块分别与声音数据库、报警模块和显示模块连接,所述声音匹配模块用于将待识别的声音模型与声音数据库中存储的样本声音模型进行匹配计算。
2.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:还包括报警模块和显示模块,所述报警模块用于对声音匹配的结果进行报警,所述报警模块用于发出报警提醒;所述显示模块用于显示声音匹配的结果。
3.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:所述报警模块包括声报警和光报警,所述声报警采用蜂鸣器进行声音报警,所述光报警采用LED灯进行闪烁报警。
4.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:所述显示模块采用智能手机或电脑。
5.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:所述前端处理模块对声音的特征进行提取,提取的方法为短时谱方法,所述短时谱方法为将采集的声音进行10ms的划分,保证声音在短时间内具有平稳性。
6.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:所述声音识别建模模块采用的识别方法包括模板匹配法和随机模型法。
7.根据权利要求1所述的一种基于声音识别的广播电视广告监测系统,其特征在于:所述声音匹配模块采用矢量量化法,采用所述矢量量化法分别对声音样本进行量化和被识别的声音进行量化,对量化的两声音文件进行匹配,并将匹配的结果分别发送至所述报警模块和所述显示模块。
8.根据权利要求7所述的一种基于声音识别的广播电视广告监测系统,其特征在于:若声音匹配不成功,则蜂鸣器发出刺耳报警提醒,且LED灯进行闪烁报警;若声音匹配成功,则所述声音匹配模块将匹配的结果发送至显示模块,所述显示模块显示匹配成功的声音模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611137655.9A CN106792140A (zh) | 2016-12-12 | 2016-12-12 | 一种基于声音识别的广播电视广告监测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611137655.9A CN106792140A (zh) | 2016-12-12 | 2016-12-12 | 一种基于声音识别的广播电视广告监测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106792140A true CN106792140A (zh) | 2017-05-31 |
Family
ID=58879862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611137655.9A Pending CN106792140A (zh) | 2016-12-12 | 2016-12-12 | 一种基于声音识别的广播电视广告监测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106792140A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111210812A (zh) * | 2019-12-26 | 2020-05-29 | 安徽仁昊智能科技有限公司 | 一种人工智能语音中转系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1189205A2 (en) * | 2000-09-18 | 2002-03-20 | Pioneer Corporation | HMM-based noisy speech recognition |
CN1447278A (zh) * | 2002-11-15 | 2003-10-08 | 郑方 | 一种声纹识别方法 |
US20040049388A1 (en) * | 2001-09-05 | 2004-03-11 | Roth Daniel L. | Methods, systems, and programming for performing speech recognition |
CN102799605A (zh) * | 2012-05-02 | 2012-11-28 | 天脉聚源(北京)传媒科技有限公司 | 一种广告监播方法和系统 |
CN105554526A (zh) * | 2015-12-10 | 2016-05-04 | 上海都德信息科技有限公司 | 基于声纹识别的广告监测系统 |
CN105701686A (zh) * | 2016-01-23 | 2016-06-22 | 北京掌阔移动传媒科技有限公司 | 一种声纹广告实现方法和装置 |
-
2016
- 2016-12-12 CN CN201611137655.9A patent/CN106792140A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1189205A2 (en) * | 2000-09-18 | 2002-03-20 | Pioneer Corporation | HMM-based noisy speech recognition |
US20040049388A1 (en) * | 2001-09-05 | 2004-03-11 | Roth Daniel L. | Methods, systems, and programming for performing speech recognition |
CN1447278A (zh) * | 2002-11-15 | 2003-10-08 | 郑方 | 一种声纹识别方法 |
CN102799605A (zh) * | 2012-05-02 | 2012-11-28 | 天脉聚源(北京)传媒科技有限公司 | 一种广告监播方法和系统 |
CN105554526A (zh) * | 2015-12-10 | 2016-05-04 | 上海都德信息科技有限公司 | 基于声纹识别的广告监测系统 |
CN105701686A (zh) * | 2016-01-23 | 2016-06-22 | 北京掌阔移动传媒科技有限公司 | 一种声纹广告实现方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111210812A (zh) * | 2019-12-26 | 2020-05-29 | 安徽仁昊智能科技有限公司 | 一种人工智能语音中转系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799605B (zh) | 一种广告监播方法和系统 | |
CN105138515B (zh) | 命名实体识别方法和装置 | |
CN106782615B (zh) | 语音数据情感检测方法和装置及系统 | |
CN110619568A (zh) | 风险评估报告的生成方法、装置、设备及存储介质 | |
CN107423278B (zh) | 评价要素的识别方法、装置及系统 | |
WO2015090215A1 (zh) | 区分地域性口音的语音数据识别方法、装置和服务器 | |
CN103186663B (zh) | 一种基于视频的网络舆情监测方法及系统 | |
CN105335496A (zh) | 基于余弦相似度文本挖掘算法的客服重复来电处理方法 | |
CN101159834A (zh) | 一种重复性视频音频节目片段的检测方法和系统 | |
CN104156447B (zh) | 一种智能社交平台广告预警及处理方法 | |
CN114760172B (zh) | 射频基带综合特征信号识别方法与装置 | |
CN106205606A (zh) | 一种基于语音识别的动态定位监控方法及系统 | |
CN113177558B (zh) | 一种基于小样本的特征融合的辐射源个体识别方法 | |
CN109493882A (zh) | 一种诈骗电话语音自动标注系统及方法 | |
CN112001184A (zh) | 面向视频弹幕的用户情感差异区域检测方法和系统 | |
CN106792140A (zh) | 一种基于声音识别的广播电视广告监测系统 | |
WO2022142048A1 (zh) | 唤醒指标监测方法、装置及电子设备 | |
CN103295573B (zh) | 基于费舍比率最优小波包分解的语音情感特征提取方法 | |
CN105608137A (zh) | 一种提取身份标识的方法和装置 | |
CN112541075B (zh) | 一种警情文本的标准案发时间提取方法及系统 | |
CN109542845B (zh) | 一种基于关键词表达式的文本元数据提取方法 | |
CN204990398U (zh) | 一种基于生物技术特征的企业管理系统 | |
CN111651565A (zh) | 一种社交媒体平台虚假信息识别系统 | |
CN114004996A (zh) | 异音检测方法、装置、电子设备及介质 | |
CN113257226A (zh) | 一种基于gfcc的改进特征参数的语种识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170531 |