CN113194332B - 基于多策略的新广告发现方法、电子设备和可读存储介质 - Google Patents

基于多策略的新广告发现方法、电子设备和可读存储介质 Download PDF

Info

Publication number
CN113194332B
CN113194332B CN202110463040.XA CN202110463040A CN113194332B CN 113194332 B CN113194332 B CN 113194332B CN 202110463040 A CN202110463040 A CN 202110463040A CN 113194332 B CN113194332 B CN 113194332B
Authority
CN
China
Prior art keywords
advertisement
unknown
segment
fragment
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110463040.XA
Other languages
English (en)
Other versions
CN113194332A (zh
Inventor
郑严
殷松迁
李国华
郭忠武
姜卫平
王荣芳
韩煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Bohui Technology Inc
Original Assignee
Beijing Bohui Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bohui Technology Inc filed Critical Beijing Bohui Technology Inc
Priority to CN202110463040.XA priority Critical patent/CN113194332B/zh
Publication of CN113194332A publication Critical patent/CN113194332A/zh
Application granted granted Critical
Publication of CN113194332B publication Critical patent/CN113194332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请提供了一种基于多策略的新广告发现方法,所述方法包括:从样本数据库中提取出广告片段;根据每段广告片段的播出时间,提取出每段广告片段的声纹特征;通过广告语音模板对每段广告片段的声纹特征逐一进行匹配,以从广告片段中选择出未知广告片段,广告语音模板是根据已知声纹特征生成;运用语音识别模型计算每段未知广告片段的声音边界时间点;依据声音边界时间点对未知广告片段进行分段,得到未知片段;分别计算每段未知片段的策略特征属性信息。本发明的有益效果主要在于:本申请运用机器运算模型,智能化计算广告片段的策略特征属性信息,精准的计算出广播电视节目广告片段中的新广告,从而缩短了广告样本制作周期,避免人工干预。

Description

基于多策略的新广告发现方法、电子设备和可读存储介质
技术领域
本发明涉及广告监管技术领域,具体而言,涉及一种基于多策略的新广告发现方法、电子设备和可读存储介质。
背景技术
随着我国广播电视产业的发展和开放,电视台的电视节目日益繁多,作为目前电视台的创收主要来源的电视广告,对电视台的节目管理提出了更高的要求,广告监管是最重要的一个环节,而且随着广播电视内容管理领域的不断深入,各级广播电视制作广告样本中各类数字音视频内容的迅速膨胀,广告管理在电视行业占据很大比重和工作量,对视频精确、复杂和个性化检索提出了要求。
由于广播电视节目中的广告监管主要依靠制作广告样本与广播电视节目进行特征对比,从而达到监测监管的目的,目前主要依靠人工标记录像,通过监听监看广告视频与语音的特征属性,对广告开始时间点与结束时间点进行截取保存,该方法需要浏览大量录像,广播电视广告具有节目多、周期性强、重复性强的特点,所以人工筛查存在工作量大,工作重复,十分不便利的问题。
发明内容
本发明的目的在于提供一种基于多策略的新广告发现方法、电子设备和可读存储介质,能够运用机器运算模型,智能化计算广告片段的策略特征属性信息,精准的计算出广播电视节目广告片段中的新广告,从而缩短了广告样本制作周期,避免了人工识别效率低、工作量大的问题。
本发明是这样实现的:一种基于多策略的新广告发现方法,电子设备和可读存储介质。
从样本数据库中提取出广告片段;
根据每段广告片段的播出时间,提取出每段所述广告片段的声纹特征;
通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,所述广告语音模板是根据已知声纹特征生成;
运用语音识别模型计算每段所述未知广告片段的声音边界时间点;
依据声音边界时间点对所述未知广告片段进行分段,得到未知片段;
分别计算每段所述未知片段的策略特征属性信息,所述策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;
根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告。
在本发明较佳的技术方案中,通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,包括:
针对每段所述广告片段,将该段广告片段的声纹特征与已知声纹进行特征匹配,所述已知声纹是根据存储在样本数据库中的已知广告生成;
若声纹特征匹配结果不同,则确定所述广告片段为未知广告片段。
在本发明较佳的技术方案中,运用语音识别模型计算每段所述未知广告片段的声音边界时间点,包括:
针对每段所述未知广告片段,根据语音识别模型计算每段所述未知广告片段在每个时间点的分贝值;
针对每段所述未知广告片段,根据该段未知广告片段在每个时间点的声音分贝值,判断该段未知广告片段中分贝值小于预设数值的目标时间点;
针对每段所述未知广告片段,根据该段未知广告片段的目标时间点,确定该段未知广告片段的边界时间点;
根据每段所述未知广告片段的边界时间点,对所述未知广告片段进行分段,得到未知片段。
在本发明较佳的技术方案中,所述策略特征属性信息包括播放时间长度,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
若所述未知片段的播放时间长度小于广告播放时长的固定秒数,则所述未知片段为新广告。
在本发明较佳的技术方案中,所述策略特征属性信息包括片段重复性,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
针对每段所述未知片段,通过所述广告片段的广告语音模板逐一进行声纹特征遍历;
若每段所述未知片段的遍历结果与所述广告片段的广告语音模板的声纹特征相同,则通过视频分割器将该段视频分割为两段新的子片段;
针对每段所述未知片段,统计其分割所述子片段播出的重复性,重复播出次数大于1,则确定为新广告。
在本发明较佳的技术方案中,所述策略特征属性信息包括广告关键词,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
获取每段所述未知片段中广告关键词文字信息;
统计所述文字信息出现时长;
计算所述文字信息出现时长与所述未知片段总时长的占比;
根据时长占比,确定所述未知片段为新广告。
在本发明较佳的技术方案中,获取每段所述未知片段中广告关键词文字信息,包括:
所述未知片段中广告关键词的文字信息包括以下的任意一种或多种:
广告、公益广告字样;
产品名称、金额;
联系方式:电话、QQ、微信、邮箱、网址。
在本发明较佳的技术方案中,所述策略特征属性信息包括文本分类,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
针对每段所述未知片段,运用循环神经网络算法从该未知片段的语音信息中识别出广告词;
根据所述未知片段文本分类出的广告词,判断该广告词篇幅字数与所述未知片段语音文字的概率占比;
根据篇幅字数概率占比,确定所述未知片段为新广告。
在本发明较佳的技术方案中,一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如所述基于多策略的新广告发现方法的步骤。
在本发明较佳的技术方案中,一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如所述基于多策略的新广告发现方法的步骤。
本发明的有益效果主要在于:本申请采用音频设备对广告片段的声纹特征进行识别,识别后与已知声纹生成的广告语音模板进行逐一的匹配,以从广告片段中选择出未知广告片段,运用语音识别模型计算未知广告片段的声音边界时间点,得到未知片段,再通过分别计算每段未知片段的策略特征属性信息,其中策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;以从未知片段中确定新广告,本方法能够智能化、系统化、多维度、监测监管广播电视节目广告片段,极大的缩短了广告样本制作周期,避免了人工干预,减低了人工成本。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种基于多策略的新广告发现方法的流程示意图。
图2为本发明实施例所提供的一种基于多策略的新广告发现方法的声纹特征匹配流程示意图。
图3为本发明实施例所提供的一种基于多策略的新广告发现方法的计算声音边界时间点流程示意图。
图4为本发明实施例所提供的一种基于多策略的新广告发现方法的策略特征属性信息结构示意图。
图4-1为本发明实施例所提供的一种基于多策略的新广告发现方法计算播放时间长度流程示意图。
图4-2为本发明实施例所提供的一种基于多策略的新广告发现方法计算片段重复性流程示意图。
图4-3为本发明实施例所提供的一种基于多策略的新广告发现方法计算广告关键词流程示意图。
图4-4为本发明实施例所提供的一种基于多策略的新广告发现方法计算文本分类流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计,因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着我国广播电视产业的发展和开放,电视台的电视节目日益繁多,作为目前电视台的创收主要来源的电视广告,对电视台的节目管理提出了更高的要求,广告监管是最重要的一个环节,而且随着广播电视内容管理领域的不断深入,各级广播电视制作广告样本中各类数视频内容的迅速膨胀,广告管理在电视行业占据很大比重和工作量,对视频精确、复杂和个性化检索提出了要求。
由于广播电视节目中的广告监管主要依靠制作广告样本与广播电视节目进行特征对比,从而达到监测监管的目的,目前主要依靠人工标记录像,通过监听监看广告视频与语音的特征属性,对广告开始时间点与结束时间点进行截取保存,该方法需要浏览大量录像,广播电视广告具有节目多、周期性强、重复性强的特点,所以人工筛查存在工作量大,工作重复,十分不便利的问题。
鉴于上述现有技术的不足,本申请采用音频设备对广告片段的声纹特征进行识别,识别后与已知声纹生成的广告语音模板进行逐一的匹配,以从广告片段中选择出未知广告片段,运用语音识别模型计算未知广告片段的声音边界时间点,得到未知片段,再通过分别计算每段未知片段的播放时间长度特征属性、片段重复性特征属性、广告关键词特征属性、文本分类特征属性,在未知片段中精准的获取新广告,获取新广告用于制作广告样本数据,实现智能化、系统化、多维度、监测监管广播电视节目广告片段的目的。
本申请中涉及英文引用的名词解释如下:
PCM(Pulse Code Modulation,脉冲编码调制)音频设备:音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准数字音频数据的设备。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
在一个可行的实现方案中,图1为本发明实施例所提供的基于多策略的新广告发现方法的流程示意图;如图1所示,所述方法中确定新广告具体包括以下步骤:
步骤S10,从样本数据库中提取出广告片段。
步骤S20,根据每段广告片段的播出时间,提取出每段广告片段的声纹特征。
步骤S30,通过广告语音模板对每段广告片段的声纹特征逐一进行匹配,以从广告片段中选择出未知广告片段,广告语音模板是根据已知声纹特征生成。
步骤S40,运用语音识别模型计算每段未知广告片段的声音边界时间点。
步骤S50,依据声音边界时间点对未知广告片段进行分段,得到未知片段。
步骤S60,分别计算每段未知片段的策略特征属性信息,策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类。
步骤S70,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告。
步骤S10在具体实施时,将待处理的录像素材存储到广告样本数据库中,采用音频设备获取录像素材的基本信息进行输出预处理,基本信息包括:频道名称、播出时间、播出时长、节目内容,音频设备对获取的录像素材的基本信息自动解码,解码后进行音视频采样,提取录像素材的声纹特征,对提取的声纹特征音频设备自动解码和抽帧处理,即完成录像素材的音视频输出预处理,然后,根据录像素材每段视频片段的播出时间,从录像素材中提取出多段视频片段,并将多段视频片段从录像素材中删除,以从广告样本数据库中得到广告片段。
步骤S20在具体实施时,采用PCM音频设备,根据每段广告片段的播出时间,提取存储在广告样本数据库中的每段广告片段的声纹特征,每段广告片段具有唯一的声纹,声纹是携带语言信息的声波频谱,声纹不仅具有特定性,还相对具有稳定性,声纹还可以从同一个人的语声中选择多个相同字、词或句的语义信息,在分析中得到其稳定而特殊的声纹特征。
步骤S30在具体实施时,根据广告语音模板中的声纹特征与提取的每段广告片段中的声纹特征逐一进行声纹特征匹配,若声纹特征匹配结果相同,则得到已知广告片段,若声纹特征匹配结果不同,则得到未知广告片段,广告语音模板是根据已知声纹特征生成的。
步骤S40在具体实施时,通过PCM音频设备获取未知广告片段的声纹特征数据,运用语音识别模型计算每段未知广告片段的声音边界时间点,根据计算得到的声音边界时间点,判断未知广告片段与未知广告片段之间的音频短停。
步骤S50在具体实施时,根据计算得到每段未知广告片段之间的声音边界时间点,该声音边界时间点结合广告片段的播出时长,且播出时长小于30秒,对未知广告片段进行自动分段,分段后得到未知片段。
步骤S60在具体实施时,未知片段的策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;
其中,策略特征属性信息包括播放时间长度,根据广告播放的连续性特征,判断任意两段广告片段之间是否连续播放,若两段广告片段未连续播放,则两段广告片段之间存在未知片段,计算未知广告的播放时间长度,且播放时间在30秒内。
策略特征属性信息包括片段重复性,根据广告播放的重复性特征,在每段未知片段中,提取该段声纹特征,通过广告语音模板与每段未知片段的声纹特征进行比对,若声纹特征匹配结果相同,则存在重复播出的未知片段。
策略特征属性信息包括广告关键词,识别广告关键词的文字信息、二维码信息、品牌标志信息,获取每段未知片段中广告关键词文字信息,计算文字信息出现时长与未知片段总时长的占比;识别未知片段中的二维码信息;识别未知片段中的品牌标志信息。
策略特征属性信息包括文本分类,针对每段未知片段,运用循环神经网络算法,从每段未知片段中识别语音信息,再对语音信息的文字进行文本分类,计算文本分类出的广告词篇幅字数概率占比。
步骤S70在具体实施时,根据步骤S60中分别计算每段未知片段的策略特征属性信息,从未知片段中确定新广告,其中,策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类。
其中,策略特征属性信息包括播放时间长度,针对每段未知广告片段,计算未知广告的播放时间长度,且播放时间在30秒内,确定未知片段为新广告。
策略特征属性信息包括片段重复性,针对每段未知广告片段,若每段未知广告的声纹特征匹配结果相同,则每段未知片段存在重复播出,统计每段未知广告的重复播出的概率,确定未知片段为新广告。
策略特征属性信息包括广告关键词,针对每段未知广告片段,计算广告关键词的文字信息出现时长与未知片段总时长的占比,根据播出时长占比,确定未知片段为新广告。
策略特征属性信息包括文本分类,针对每段未知广告片段,计算文本分类出的广告词篇幅字数概率占比,确定未知片段为新广告。
在一个可行的实现方案中,图2为本发明实施例所提供的基于多策略的新广告发现方法的声纹特征匹配流程示意图;如图2所示,具体选择出未知广告片段包括以下步骤:
在一个可行的实现方案中,上述步骤S30中,通过广告语音模板对每段广告片段的声纹特征逐一进行匹配,以从广告片段中选择出未知广告片段,包括:
步骤S301,针对每段广告片段,将该段广告片段的声纹特征与已知声纹进行特征匹配,已知声纹是根据存储在广告样本数据库中的已知广告生成。
步骤S302,若声纹特征匹配结果不同,则确定广告片段为未知广告片段。
步骤S301在具体实施时,根据每段广告片段的唯一声纹,从声纹中选择出多个相同字、词或句的语义信息,得到唯一的声纹特征,将每段广告片段的声纹特征与存储在广告样本数据库中的已知声纹进行声纹特征匹配,若声纹特征匹配结果相同,则得到已知广告片段。
步骤S302在具体实施时,将每段广告片段的声纹特征与存储在广告样本数据库中的已知声纹进行声纹特征匹配,若声纹特征匹配结果不相同,则得到未知广告片段,已知声纹是根据广告样本数据库中已知广告生成的。
在一个可行的实现方案中,图3为本发明实施例所提供的基于多策略的新广告发现方法的计算声音边界时间点流程示意图;如图3所示,具体计算每段未知广告片段的声音边界时间点包括以下步骤:
在一个可行的实现方案中,上述步骤S40中,运用语音识别模型计算每段未知广告片段的声音边界时间点,包括:
步骤S401,针对每段未知广告片段,根据语音识别模型计算每段未知广告片段在每个时间点的分贝值。
步骤S402,针对每段未知广告片段,根据该段未知广告片段在每个时间点的声音分贝值,判断该段未知广告片段中分贝值小于预设数值的目标时间点。
步骤S403,针对每段未知广告片段,根据该段未知广告片段的目标时间点,确定该段未知广告片段的边界时间点。
步骤S404,根据每段未知广告片段的边界时间点,对未知广告片段进行分段,得到未知片段。
步骤S401在具体实施时,PCM语音设备获取每段未知广告片段的待计算数据,通过语音识别模型分别读取每段未知广告在每个时间输出的声音分贝值。
步骤S402在具体实施时,针对每段未知广告在每个时间输出的声音分贝值,判断每个时间输出的声音分贝值是否小于目标时间点的预设数值。
步骤S403在具体实施时,若每段未知广告片段在每个时间输出的声音分贝值小于或者等于目标时间点的预设数值,则确定该段未知广告片段的开始和停止的两边界时间点。
步骤S404在具体实施时,针对每段未知广告片段的边界时间点,判断未知广告片段与未知广告片段之间是否存在时间短停,利用广告片段短停特征,结果广告播出时长,且播出时长小于30秒,满足以上条件,对未知广告片段进行分段处理。
在一个可行的实现方案中,图4为本发明实施例所提供的基于多策略的新广告发现方法的确定新广告的计算策略特征属性信息流程示意图;如图4所示,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告,策略特征属性信息包括以下的任意一种或多种:播放时间长度1、片段重复性2、广告关键词3、文本分类4;计算任意一种或多种策略特征属性信息包括以下步骤:
在一个可行的实现方案中,上述步骤S70中,策略特征属性信息包括播放时间长度,如图4-1所示,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告,包括:
步骤S701,若未知片段的播放时间长度小于广告播放时长的固定秒数,则未知片段为新广告。
步骤S701在具体实施时,根据广告播放的连续性特征,判断任意两段广告片段之间是否连续播放,若两段广告片段未连续播放,则两段广告片段之间存在未知片段,计算未知广告的播放时间长度,且播放时间在30秒内,确定未知片段为新广告。
在一个可行的实现方案中,上述步骤S70中,策略特征属性信息包括片段重复性,如图4-2所示,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告,包括:
步骤S702A,针对每段未知片段,通过广告片段的广告语音模板逐一进行声纹特征遍历;
步骤S702B若每段未知片段的遍历结果与广告片段的广告语音模板的声纹特征相同,则通过视频分割器将该段视频分割为两段新的子片段;
步骤S702C针对每段未知片段,统计其分割子片段结果的重复性,重复播出次数大于1,则确定为新广告。
步骤S702A、S702B、S702C在具体实施时,根据广告播放的重复性特征,在每段未知片段中,提取该段声纹特征,通过广告语音模板与每段未知片段的声纹特征进行比对,若声纹特征匹配结果相同,则存在重复播出的未知片段,其中,提取声纹特征具体步骤包括:
初始化:针对每段未知片段,按照其播放时长从短至长或从长至短进行排序,并将每段未知片段标记为未检索。
检索与分割:针对未检索的每段未知片段,按照排序与广告片段的广告语音模板逐一进行遍历,将遍历的未知片段与其他待遍历的未知片段进行声纹特征匹配,若任意一段未遍历的未知片段与已遍历的未知片段的声纹特征匹配结果相同,则将未遍历的未知片段进行视频分割,针对未遍历的未知片段,通过视频分割器将该段视频分割为两段新的子片段,将两段新的子片段,标记为未检索,加入遍历列表中,(遍历列表是用于记录未遍历的未知片段统计表),将分割出的相同声纹特征已知广告片段,标记为已检索,记录播出次数为1,再次对视频分割后新的子片段与广告片段的广告语音模板进行遍历。
例如:提取广告片段的广告语音模板A与未遍历的未知片段B与C中进行声纹特征匹配,若未遍历的未知片段B中未检索出相同的声纹特征,则未遍历的未知片段B不变,若未遍历的未知片段C中检索出相同的声纹特征,则将未遍历的未知片段C,通过视频分割器将其分割为C1、A、C2片段,将新分割出的C1和C2标记为未检索,且C1和C2为不相同声纹特征,加入到待遍历列表,将新分割出的A片段,标记为已检索,记录播出次数为1。
重复操作:针对未遍历的未知片段,直到无法分割出新的子片段时,检索结束,针对每段未知片段分割结果,统计其分割子片段结果的重复性,若未知片段重复播出次数大于1,则确定为新广告。
在一个可行的实现方案中,上述步骤S70中,策略特征属性信息包括广告关键词,如图4-3所示,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告,包括:
步骤S703A,获取每段未知片段中广告关键词文字信息。
步骤S703B,统计文字信息出现时长。
步骤S703C,计算文字信息出现时长与未知片段总时长的占比。
步骤S703D,根据时长占比,确定未知片段为新广告。
步骤S703A、S703B、S703C、S703D在具体实施时,运用循环神经网络算法,获取每段未知片段中广告关键词文字信息,统计文字信息出现时长的具体秒数,根据具体秒数,计算文字信息出现时长与未知片段总时长的占比,若文字信息出现时长占未知片段总时长,则确定未知片段为新广告;其中,广告关键词文字信息包括以下的任意一种或多种:广告、公益广告字样;
产品名称、金额;
联系方式:电话、QQ、微信、邮箱、网址。
运用循环神经网络算法还能够直接识别未知片段中的二维码信息,以及识别未知片段中的品牌标志信息,通过二维码和品牌标志的广告关键词识别,确定未知片段为新广告。
在一个可行的实现方案中,上述步骤S70中,策略特征属性信息包括文本分类,如图4-4所示,根据每段未知片段的策略特征属性信息,从未知片段中确定新广告,包括:
步骤S704A,针对每段未知片段,运用循环神经网络算法从该未知片段的语音信息中识别出广告词。
步骤S704B,根据未知片段文本分类出的广告词,判断该广告词篇幅字数与未知片段语音文字的概率占比。
步骤S704C,根据篇幅字数概率占比,确定未知片段为新广告。
步骤S704A、S704B、S704C在具体实施时,运用循环神经网络算法实现文本分类模型运算,能够将引导、推销、购物相关的文本进行分类,从每段未知片段中收集语音信息,在未知片段语音信息中分类出广告词,计算该段广告词篇幅字数占未知片段语音文字的概率占比,根据该段广告词篇幅字数占比,确定未知片段为新广告。
例如:针对每段未知片段,运用循环神经网络算法获取每段未知片段的原始视频数据,通过文本分类模型提取未知片段的语音信息变量,在未知片段的语音信息中分类出广告词,文本分类模型将分类出的广告词划分训练及和测试集,计算未知片段广告词占未知片段语音文字的占比,建立文本分类模型的逻辑回归模型,根据逻辑回归模型,得到该段广告词篇幅字数概率占比,确定未知片段为新广告的依据。
本申请实施例提供的一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行上述的信息处理的方法时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行以下步骤:
从样本数据库中提取出广告片段;
根据每段广告片段的播出时间,提取出每段所述广告片段的声纹特征;
通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,所述广告语音模板是根据已知声纹特征生成;
运用语音识别模型计算每段所述未知广告片段的声音边界时间点;
依据声音边界时间点对所述未知广告片段进行分段,得到未知片段;
分别计算每段所述未知片段的策略特征属性信息,所述策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;
根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告。
在本申请实施例中,所述存储介质还可以执行其它机器可读指令,以执行本申请中其它所述的方法,关于具体执行的方法步骤和原理参见上述的说明,在此不再详细赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行以下步骤:
从样本数据库中提取出广告片段;
根据每段广告片段的播出时间,提取出每段所述广告片段的声纹特征;
通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,所述广告语音模板是根据已知声纹特征生成;
运用语音识别模型计算每段所述未知广告片段的声音边界时间点;
依据声音边界时间点对所述未知广告片段进行分段,得到未知片段;
分别计算每段所述未知片段的策略特征属性信息,所述策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;
根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告。
在本申请实施例中,该计算机程序被处理器运行时还可以执行其它机器可读指令,以执行本申请中其它所述的方法,关于具体执行的方法步骤和原理参见上述的说明,在此不再详细赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于多策略的新广告发现方法,其特征在于,包括:
从样本数据库中提取出广告片段;
根据每段广告片段的播出时间,提取出每段所述广告片段的声纹特征;
通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,所述广告语音模板是根据已知声纹特征生成;
运用语音识别模型计算每段所述未知广告片段的声音边界时间点;
依据声音边界时间点对所述未知广告片段进行分段,得到未知片段;
分别计算每段所述未知片段的策略特征属性信息,所述策略特征属性信息包括以下的任意一种或多种:播放时间长度、片段重复性、广告关键词、文本分类;
根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告。
2.根据权利要求1所述的基于多策略的新广告发现方法,其特征在于,通过广告语音模板对每段所述广告片段的声纹特征逐一进行匹配,以从所述广告片段中选择出未知广告片段,包括:
针对每段所述广告片段,将该段广告片段的声纹特征与已知声纹进行特征匹配,所述已知声纹是根据存储在样本数据库中的已知广告生成;
若声纹特征匹配结果不同,则确定所述广告片段为未知广告片段。
3.根据权利要求2所述的基于多策略的新广告发现方法,其特征在于,运用语音识别模型计算每段所述未知广告片段的声音边界时间点,包括:
针对每段所述未知广告片段,根据语音识别模型计算每段所述未知广告片段在每个时间点的分贝值;
针对每段所述未知广告片段,根据该段未知广告片段在每个时间点的声音分贝值,判断该段未知广告片段中分贝值小于预设数值的目标时间点;
针对每段所述未知广告片段,根据该段未知广告片段的目标时间点,确定该段未知广告片段的边界时间点;
根据每段所述未知广告片段的边界时间点,对所述未知广告片段进行分段,得到未知片段。
4.根据权利要求1所述的基于多策略的新广告发现方法,其特征在于,所述策略特征属性信息包括播放时间长度,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
若所述未知片段的播放时间长度小于广告播放时长的固定秒数,则所述未知片段为新广告。
5.根据权利要求1所述的基于多策略的新广告发现方法,其特征在于,所述策略特征属性信息包括片段重复性,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
针对每段所述未知片段,通过所述广告片段的广告语音模板逐一进行声纹特征遍历;
若每段所述未知片段的遍历结果与所述广告片段的广告语音模板的声纹特征相同,则通过视频分割器将该未知片段 视频分割为两段新的子片段;
针对每段所述未知片段,统计其分割所述子片段播出的重复性,重复播出次数大于1,则确定为新广告。
6.根据权利要求1所述的基于多策略的新广告发现方法,其特征在于,所述策略特征属性信息包括广告关键词,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
获取每段所述未知片段中广告关键词文字信息;
统计所述文字信息出现时长;
计算所述文字信息出现时长与所述未知片段总时长的占比;
根据时长占比,确定所述未知片段为新广告。
7.根据权利要求6所述的基于多策略的新广告发现方法,其特征在于,获取每段所述未知片段中广告关键词文字信息,包括:
所述未知片段中广告关键词的文字信息包括以下的任意一种或多种:
广告、公益广告字样;
产品名称、金额;
联系方式:电话、QQ、微信、邮箱、网址。
8.根据权利要求1所述的基于多策略的新广告发现方法,其特征在于,所述策略特征属性信息包括文本分类,根据每段所述未知片段的策略特征属性信息,从所述未知片段中确定新广告,包括:
针对每段所述未知片段,运用循环神经网络算法从该未知片段的语音信息中识别出广告词;
根据所述未知片段文本分类出的广告词,判断该广告词篇幅字数与所述未知片段语音文字的概率占比;
根据篇幅字数概率占比,确定所述未知片段为新广告。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至8任一所述广告发现方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至8任一所述广告发现方法的步骤。
CN202110463040.XA 2021-04-27 2021-04-27 基于多策略的新广告发现方法、电子设备和可读存储介质 Active CN113194332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110463040.XA CN113194332B (zh) 2021-04-27 2021-04-27 基于多策略的新广告发现方法、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110463040.XA CN113194332B (zh) 2021-04-27 2021-04-27 基于多策略的新广告发现方法、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN113194332A CN113194332A (zh) 2021-07-30
CN113194332B true CN113194332B (zh) 2022-04-29

Family

ID=76979890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110463040.XA Active CN113194332B (zh) 2021-04-27 2021-04-27 基于多策略的新广告发现方法、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN113194332B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113935307A (zh) * 2021-09-16 2022-01-14 有米科技股份有限公司 广告文案的特征提取方法及装置
CN114419614A (zh) * 2022-01-26 2022-04-29 湖南快乐阳光互动娱乐传媒有限公司 广告主客户的挖掘方法及装置、电子设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1582545A (zh) * 2001-09-04 2005-02-16 皇家飞利浦电子股份有限公司 利用脚本信息识别和查明节目的广告部分的方法
CN102799605A (zh) * 2012-05-02 2012-11-28 天脉聚源(北京)传媒科技有限公司 一种广告监播方法和系统
CN102984585A (zh) * 2011-09-20 2013-03-20 北京鹏润鸿途科技有限公司 一种确定广告视频的方法及装置
CN107613318A (zh) * 2016-07-12 2018-01-19 上海视畅信息科技有限公司 一种基于声纹识别的电视广告和频道识别方法
CN111370022A (zh) * 2019-12-25 2020-07-03 厦门快商通科技股份有限公司 音频广告检测方法、装置、电子设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9918141B2 (en) * 2015-08-05 2018-03-13 Surewaves Mediatech Private Limited System and method for monitoring and detecting television ads in real-time using content databases (ADEX reporter)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1582545A (zh) * 2001-09-04 2005-02-16 皇家飞利浦电子股份有限公司 利用脚本信息识别和查明节目的广告部分的方法
CN102984585A (zh) * 2011-09-20 2013-03-20 北京鹏润鸿途科技有限公司 一种确定广告视频的方法及装置
CN102799605A (zh) * 2012-05-02 2012-11-28 天脉聚源(北京)传媒科技有限公司 一种广告监播方法和系统
CN107613318A (zh) * 2016-07-12 2018-01-19 上海视畅信息科技有限公司 一种基于声纹识别的电视广告和频道识别方法
CN111370022A (zh) * 2019-12-25 2020-07-03 厦门快商通科技股份有限公司 音频广告检测方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN113194332A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN102799605B (zh) 一种广告监播方法和系统
US10497378B2 (en) Systems and methods for recognizing sound and music signals in high noise and distortion
CN107301170B (zh) 基于人工智能的切分语句的方法和装置
CN110349564B (zh) 一种跨语言语音识别方法和装置
CN108932945B (zh) 一种语音指令的处理方法及装置
CN111145737B (zh) 语音测试方法、装置和电子设备
CN113194332B (zh) 基于多策略的新广告发现方法、电子设备和可读存储介质
WO2020155750A1 (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN109005451B (zh) 基于深度学习的视频拆条方法
CN112445997A (zh) 一种提取cms多版本识别特征规则的方法及装置
CN112002328A (zh) 一种字幕生成方法、装置及计算机存储介质、电子设备
CN110413998B (zh) 一种面向电力行业的自适应中文分词方法及其系统、介质
CN107301245B (zh) 一种电力信息视频搜索系统
KR20200098381A (ko) 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체
CN113051462A (zh) 一种多分类模型训练方法、系统及装置
CN116561230B (zh) 一种基于云计算的分布式存储与检索系统
CN113590771A (zh) 一种数据挖掘方法、装置、设备及存储介质
CN112231440A (zh) 一种基于人工智能的语音搜索方法
CN116303951A (zh) 对话处理方法、装置、电子设备和存储介质
CN113076932B (zh) 训练音频语种识别模型的方法、视频检测方法及其装置
CN114302227A (zh) 基于容器采集的网络视频采集与解析的方法和系统
CN114418623A (zh) 基于用户兴趣进行广告推送的方法、装置及设备
CN111492364A (zh) 数据标注方法、装置及存储介质
CN112466324A (zh) 一种情绪分析方法、系统、设备及可读存储介质
JP2004206571A (ja) 文書情報提示方法及び装置並びにプログラム及び記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant