CN111540376A - 广播节目智能碎片化的方法、装置及存储介质 - Google Patents

广播节目智能碎片化的方法、装置及存储介质 Download PDF

Info

Publication number
CN111540376A
CN111540376A CN202010236270.8A CN202010236270A CN111540376A CN 111540376 A CN111540376 A CN 111540376A CN 202010236270 A CN202010236270 A CN 202010236270A CN 111540376 A CN111540376 A CN 111540376A
Authority
CN
China
Prior art keywords
program
audio
information
pieces
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010236270.8A
Other languages
English (en)
Inventor
潘峰
杨硕
杨会林
雷鹏
孟瑜
闫卓
郭欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xunshan Network Technology Co ltd
Original Assignee
Beijing Xunshan Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xunshan Network Technology Co ltd filed Critical Beijing Xunshan Network Technology Co ltd
Priority to CN202010236270.8A priority Critical patent/CN111540376A/zh
Publication of CN111540376A publication Critical patent/CN111540376A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/38Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space
    • H04H60/40Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space for identifying broadcast time

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请公开了一种广播节目智能碎片化的方法、装置及存储介质。其中,该方法包括:生成与所述广播节目的节目片头对应的片头音频信息以及包括所述广播节目的节目音频在内的多个音频碎片信息;根据所述片头音频信息和所述多个音频碎片信息,确定所述广播节目的节目开始时间和节目结束时间;从所述多个音频碎片信息中获取所述节目开始时间和所述节目结束时间之间的多个第一音频碎片信息;以及将所述多个第一音频碎片信息进行合并,得到与所述广播节目对应的节目音频。达到了可以在非人工环境下准确定位出目标广播节目的开始时间和结束时间,然后准确的剪切出需要的节目音频,从而大大降低了用户与从业人员的不便的技术效果。

Description

广播节目智能碎片化的方法、装置及存储介质
技术领域
本申请涉及信息处理技术领域,特别是涉及一种广播节目智能碎片化的方法、装置及存储介质。
背景技术
在互联网时代,广播逐渐处于“窄播化”状态,现阶段听众的收听习惯与以往相比有了巨大的变化,导致传统广播面临巨大的挑战。同时,广播的市场格局和产业生态还受到移动电台等移动音频新品类的冲击和重构。
由于移动电台,移动音频,媒体新融合等需要,广播所具有的“无法重播”、“无法定位”的特质成为缺点。当用户或从业人员需要重新播放需要的内容时,除非有其他专业的设备同步录制,否则无法进行回听。尽管目前大部分广播电台均配备录制设备,但是由于录制的音频流信息中无法定位的特性,即使有专业设备录制,也无法在非人工环境下在录制的音频流信息中准确定位广播节目的开始时间和结束时间,只能通过人工判断节目何时开始结束,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便。
针对上述的现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种广播节目智能碎片化的方法、装置及存储介质,以至少解决现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题。
根据本公开实施例的一个方面,提供了一种广播节目智能碎片化的方法,包括:生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种广播节目智能碎片化的装置,包括:生成模块,用于生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;确定模块,用于根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;获取模块,用于从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及合并模块,用于将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
根据本公开实施例的另一个方面,还提供了一种广播节目智能碎片化的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
在本公开实施例中,首先生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息,便于后续确定广播节目的开始结束时间。然后根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间,无需人为的确定广播节目的节目开始时间和节目结束时间。然后从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息,最后将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。通过这种方式,达到了可以在非人工环境下准确定位出目标广播节目的开始时间和结束时间,然后准确的剪切出需要的节目音频,从而大大降低了用户与从业人员的不便的技术效果。进而解决了现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1的第一个方面所述的广播节目智能碎片化的方法的流程示意图;
图3是根据本公开实施例所述的广播节目智能碎片化的方法的整体流程示意图;
图4是根据本公开实施例所述的生成片头音频信息的流程示意图;
图5是根据本公开实施例所述的生成多个音频碎片信息的流程示意图;
图6是根据本公开实施例所述的获取多个第二音频碎片信息的流程示意图;
图7是根据本公开实施例2所述的广播节目智能碎片化的装置的示意图;以及
图8是根据本公开实施例3所述的广播节目智能碎片化的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种广播节目智能碎片化的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现广播节目智能碎片化的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的广播节目智能碎片化的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的广播节目智能碎片化的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
在上述运行环境下,根据本实施例的第一个方面,提供了一种广播节目智能碎片化的方法。图2示出了该方法的流程示意图,参考图2所示,该方法包括:
S202:生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;
S204:根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;
S206:从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及
S208:将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
正如前面背景技术中所述的,由于移动电台,移动音频,媒体新融合等需要,广播所具有的“无法重播”、“无法定位”的特质成为缺点。当用户或从业人员需要重新播放需要的内容时,除非有其他专业的设备同步录制,否则无法进行回听。尽管目前大部分广播电台均配备录制设备,但是由于录制的音频流信息中无法定位的特性,即使有专业设备录制,也无法在非人工环境下在录制的音频流信息中准确定位广播节目的开始时间和结束时间,只能通过人工判断节目何时开始结束,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便。
针对上述背景技术中存在的问题,结合图2所示,本实施例首先生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息。由于通过专业的录制设备录制得到的音频流数据是无法直接用于分析,无法确定广播节目的开始结束时间,因而生成多个音频碎片信息,便于后续确定广播节目的开始结束时间。
进一步地,根据生成的片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间。其中,广播节目以早间新闻节目为例,可以根据早间新闻节目的片头音频信息,从包括早间新闻节目在内的多个音频碎片信息中找到相匹配的音频碎片,从而确定早间新闻节目的节目开始时间。根据以上方法可以找到早间新闻节目的下一个节目的开始时间,然后把下一个节目的开始时间的前一时刻作为该早间新闻节目的节目结束时间。通过以上方式无需人为的确定广播节目的节目开始时间和节目结束时间。
进一步地,在确定早间新闻节目的节目开始时间和节目结束时间后(例如,节目开始时间为8:00,节目结束时间为8:30),从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息,即从多个音频碎片信息中获取8:00-8:30之间的多个第一音频碎片信息。最后,将多个第一音频碎片信息进行合并,得到与早间新闻节目对应的节目音频。
从而,在本实施例中,首先生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息,便于后续确定广播节目的开始结束时间。然后根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间,无需人为的确定广播节目的节目开始时间和节目结束时间。然后从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息,最后将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。通过这种方式,达到了可以在非人工环境下准确定位出目标广播节目的开始时间和结束时间,然后准确的剪切出需要的节目音频,从而大大降低了用户与从业人员的不便的技术效果。进而解决了现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题。
此外,图3示例性的示出了本实施例所述的广播节目智能碎片化的方法的整体流程示意图,图4示例性的示出了本实施例所述的生成片头音频信息的流程示意图。参照图3和图4,首先从听听FM管理平台中获取片头数据,具体为扫描目标oss目录,获取广播节目的片头数据,对片头数据进行解析,生成与广播节目的节目片头对应的片头音频信息。其中,一开始从CMS系统内容管理获取的片头数据是JSON格式的片头数据,因此需要对JSON格式的片头数据进行解析,生成片头音频信息。并且,还可以将生成的片头音频信息存储至预设的片头数据库中。其中,一开始从CMS系统内容管理获取的JSON格式的片头数据例如但不限于包含广播节目的大致开始时间、节目id、广播节目的大致结束时间、台别id以及节目名称等。
可选地,根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间的操作,包括:确定在节目片头的开始时间之前的第一时刻以及在节目片头的结束时间之后的第二时刻;从多个音频碎片信息中获取第一时刻和第二时刻之间的多个第二音频碎片信息;以及根据片头音频信息和多个第二音频碎片信息,确定广播节目的节目开始时间和节目结束时间。
具体地,为了进一步降低计算的工作量,可以先从多个音频碎片信息中获取一定时间段内的音频碎片信息,然后在进行相应的计算处理来准确的确定广播节目的节目开始时间和节目结束时间。但是广播节目一般会存在一定的延时性,例如由于播音员说话语速或者临时插播广告等问题,会导致广播节目的节目开始时间和节目结束时间和预告中的不一致。为了保障获取到的多个第二音频碎片信息(即,一定时间段内的音频碎片信息)包含片头音频信息在内,需要确定在节目片头的开始时间之前的第一时刻以及在节目片头的结束时间之后的第二时刻。例如该节目的开始时间大约为上午8点整,那么可以确定第一时刻为7点55分,第二时刻为到8点05分。其中,关于第一时刻以及第二时刻的选取可以由用户自定义,在本实施例中,第一时刻为节目开始时间之前的五分钟,第二时刻为节目开始时间之后的五分钟,当然也可以为其他的时刻,可以根据实际的场景需求进行不同的定义。
进一步地,从多个音频碎片信息中获取第一时刻和第二时刻之间的多个第二音频碎片信息,即从多个音频碎片信息中获取7点55分至8点05分这十分钟之间的多个第二音频碎片信息。最后根据片头音频信息和多个第二音频碎片信息,确定广播节目的节目开始时间和节目结束时间。通过这种方式,不仅保障了获取到的多个第二音频碎片信息包含片头音频信息在内,还有效的减轻了计算的工作量。
此外,图6示出了获取多个第二音频碎片信息的流程示意图。参照图6所示,首先判断预告中提供的广播节目的开始时间是否超过了系统时间(例如开始时间是上午8点),那么在系统时间为上午8点01分钟时就到了预告中所说的广播节目的开始时间,因此就可以持续获取第二音频碎片信息。在持续获取第二音频碎片信息的过程中,首先获取广播节目的开始时间前五分钟的音频碎片信息(其中每个音频碎片的时长为一分钟),以及获取广播节目的开始时间之后的五分钟的音频碎片。之后,还需要判断所获取的音频碎片的时长是否超过10分钟。例如:当前系统时间是8点03分钟时,只获取到了8分钟的音频碎片。此时获取到的音频碎片的时长还不足十分钟,因此需要继续获取音频碎片,直至获取到10分钟的音频碎片。
可选地,生成多个音频碎片信息的操作,包括:获取录制的音频直播数据;以及将音频直播数据进行碎片化处理,生成多个音频碎片信息。
具体地,可以通过专业的录制设备统一录制全天播放的广播节目的音频数据进行录制,得到一段音频直播数据,然后对该音频直播数据进行碎片化处理,进而生成多个音频碎片信息。此外,还会对生成的多个音频碎片信息进行存储。
可选地,将音频直播数据进行碎片化处理的操作之前,还包括:对音频直播数据进行转码操作;以及存储转码后的音频直播数据。
具体地,参照图3所示,在获取到音频直播数据之后,可以进行相应的转码操作,然后存储转码后的音频直播数据。通过这种方式,能够适应不同的网络带宽、不同的终端处理能力和不同的用户需求。
可选地,将音频直播数据进行碎片化处理,生成多个音频碎片信息的操作之后,还包括:将多个音频碎片信息与预设的多个节目台进行匹配;以及将多个音频碎片信息分别存储至音频碎片数据库中与各自匹配的节目台对应的文件中。
具体地,参照图3所示,在生成多个音频碎片信息之后,还需要对多个音频碎片信息进行分析,例如可以根据音频目录和名称,将各个音频碎片信息的音频开始时间、结束时间(比如20190101 19:00:01 01000到20190101 19:00:02 01000(精确到毫秒)以及台别(这里的台别为数字,类似0 1 2的形式)与具体的节目台(例如交通台、新闻台等)进行匹配,然后将需要用的音频碎片信息转换为pcm音频源文件,分别存储至音频碎片数据库中与各自匹配的节目台对应的文件中。
进一步地,图5示例性的示出了本实施例所述的生成多个音频碎片信息的流程示意图,参照图3以及图5所示,首先可以通过声卡设备读取广播音频流信息(对应于图5中的声卡音频信息),然后将广播音频流信息进行缓存。在判定缓存中存在音频碎片信息的情况下,对音频碎片信息进行转码操作,并将转码后的音频碎片信息写入缓存文件中。一般来说,所生成的音频碎片的时长为1分钟,因此还需要判断该音频碎片信息的时长是否为1分钟,并在判断的结果为是的情况下,将该音频碎片信息写入音频文件头以及文件尾,从而保证该音频文件能够正常被播放器播放。
可选地,确定广播节目的节目结束时间的操作,包括:确定广播节目播放结束之后的下一个广播节目的开始时间;以及将下一个广播节目的开始时间的前一时刻确定为广播节目的节目结束时间。
具体地,参照上述的广播节目的节目开始时间的确定方法,能够确定广播节目播放结束之后的下一个广播节目的开始时间,然后把下一个节目的开始时间的前一时刻确定为该广播节目的节目结束时间。通过这种方式,能够无需人为的确定广播节目的节目结束时间。
可选地,根据片头音频信息和多个第二音频碎片,确定广播节目的节目开始时间和节目结束时间的操作,包括:将多个第二音频碎片信息进行合并,得到第一音频信息;对片头音频信息和第一音频信息进行特征提取,确定片头音频信息的第一特征和第一音频信息的第二特征;以及将第一特征与第二特征进行匹配,确定节目开始时间。
具体地,由于保存的音频碎片信息皆为时间较短的音频(例如,皆为1分钟的音频),这会对后期计算造成比较大的困扰,因此将多个第二音频碎片信息合并成一段包括片头音频信息在内的较长音频信息(即,第一音频信息)。然后对片头音频信息和第一音频信息进行特征提取,确定片头音频信息的第一特征和第一音频信息的第二特征。其中,可以利用预先设置的特征提取算法(例如可以但不限于是MFCC特征提取算法)提取片头音频信息的第一特征和第一音频信息的第二特征。
进一步地,对第一特征和第二特征进行匹配,确定节目开始时间。即,通过匹配操作,确定节目片头的开始时间在第一音频信息中的第一时间位置。例如通过匹配操作,确定第一特征在第二特征中的位置,从而确定片头音频信息在第一音频信息的第一时间位置。通过这种方式,可以在非人工环境下准确的确定节目开始时间。
可选地,对片头音频信息进行特征提取,确定片头音频信息的第一特征的操作,包括:根据预先设置的加窗算法,将片头音频信息转换对应的具有周期性连续信号信息的第二音频信息;根据预先设置的傅里叶变换模型,将第二音频信息转换成对应的第一频域信息;计算第一频域信息的能量分布;以及根据第一频域信息的能量分布,确定第一特征,其中第一特征由多个比特位构成。
具体地,在对片头音频信息进行特征提取确定第一特征的操作过程中,可以根据预先设置的加窗算法,将片头音频信息转换对应的具有周期性连续信号信息的第二音频信息。其中,由于人在发声的过程中是唇端在发声,因此会造成高频信号比中频信号和低频信号弱。因此,在对片头音频信息进行加窗之前,为了突出片头音频信息中的高频部分的能量信息,需要对片头音频信息进行预加重处理。并且,在进行预加重处理之后,还可以利用语音信号的短时平稳性,对片头音频信息进行分帧处理。
进一步地,对片头音频信息进行分帧处理之后,对片头音频信息进行加窗处理,得到具有周期性连续信号信息的第二音频信息。由于对片头音频信息进行分帧处理之后得到的信号首尾不连续,因此为了得到具有周期性连续信号信息的第二音频信息,利用汉明窗处理可以使窗边界处信号平滑衰减的特性,可以选用加窗处理中的汉明窗处理来使片头音频信息的信号首尾连续。其中加窗算法的公式如下:W[n]=0.54-0.46cos(2πn/M),其中M表示为帧长度,n表示为原音频数据,W[n]表示为计算后的数据。
进一步地,根据预先设置的傅里叶变换模型,将第二音频信息转换成对应的第一频域信息,从而可以在频域信息上对第一音频信息进行特征提取。其中傅里叶变换的公式如下:
Figure BDA0002431076270000101
进一步地,计算第一频域信息的能量分布,例如可以通过Mel滤波得到能量信息,进一步通过能量信息得到能量的分布(例如:3425793845......,其中每个数值对应一个能量值)。其中Mel滤波公式如下:
M(f)=1125ln(1+f/700)
M-1(m)=700(exp(m/1125)-1)
其中,首先通过频率f求Mel频率(M(f)),再使用Mel频率(M(f))求解频率m。
进一步地,根据第一频域信息的能量分布,确定第一特征,其中第一特征由多个比特位构成。其中当能量上升的情况下我们记作0(例如上边所示的34,从3升到4即为上升),当能量下降的情况下记作1(例如上边所示的42,从4下降到2即为下降)。从而得到由多个比特位构成的第一特征,进而更加便于后期的特征匹配过程。
可选地,对第一音频信息进行特征提取,确定第一音频信息的第二特征的操作,包括:根据预先设置的加窗算法,将第一音频信息转换对应的具有周期性连续信号信息的第三音频信息;根据预先设置的傅里叶变换模型,将第三音频信息转换成对应的第二频域信息;计算第二频域信息的能量分布;以及根据第二频域信息的能量分布,确定第二特征,其中第二特征由多个比特位构成。
关于如何确定第一音频信息的第二特征的具体操作步骤,可以参照上述的确定片头音频信息的第一特征的操作步骤,此处不再赘述。
可选地,将第一特征与第二特征进行匹配,确定节目开始时间的操作,包括:从第二特征中提取多个特征片段,其中多个特征片段的长度与第一特征对应;分别计算第一特征与多个特征片段的相似度,并且将相似度最高的特征片段的起始位置确定为广播节目的开始时间在第一音频信息中的第一时间位置;以及根据第一时间位置,确定节目开始时间。
具体地,对第一特征和第二特征进行匹配,确定节目片头的开始时间在第二音频信息中的第一时间位置的操作,例如从第二特征中提取多个特征片段,其中多个特征片段的长度与第一特征对应(例如长度均为3个单元)。然后分别计算第一特征与多个特征片段的相似度,并且将相似度最高的特征片段的起始位置确定为节目片头的开始时间在第一音频信息中的第一时间位置。其中每个单元可以由32个比特位构成(例如:11100001110101010000001111000111)。例如在第一次匹配的过程中第一个单元匹配上的比特位的个数为20个、第二个单元匹配上的比特位个数为5个以及第三个单元匹配上的比特位的个数为10个,那么第一次匹配的相似度为(20+5+10)/32*3。以此类推,可以分别计算出所有的匹配过程的相似度(例如第一音频信息包含n=3个单元,第一音频信息包含m=14个单元,那么可以匹配m-n+1次,即12次)。因此可以计算出12个相似度,然后从12个相似度中寻找出最大的相似度,就可以确定片头音频信息在第一音频信息中的时间位置,即节目片头的开始时间在第一音频信息中的第一时间位置。从而通过以上所述的匹配方法,可以在第一音频信息中找到片头节目的开始位置。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图7示出了根据本实施例所述的广播节目智能碎片化的装置700,该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示,该装置700包括:生成模块710,用于生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;确定模块720,用于根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;获取模块730,用于从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及合并模块740,用于将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
可选地,确定模块720,包括:第一确定子模块,用于确定在节目片头的开始时间之前的第一时刻以及在节目片头的结束时间之后的第二时刻;第一获取子模块,用于从多个音频碎片信息中获取第一时刻和第二时刻之间的多个第二音频碎片信息;以及第二确定子模块,用于根据片头音频信息和多个第二音频碎片信息,确定广播节目的节目开始时间和节目结束时间。
可选地,生成模块730,包括:第二获取子模块,用于获取录制的音频直播数据;以及生成子模块,用于将音频直播数据进行碎片化处理,生成多个音频碎片信息。
可选地,还包括:转码模块,用于在生成子模块将音频直播数据进行碎片化处理的操作之前,对音频直播数据进行转码操作;以及第一存储模块,用于存储转码后的音频直播数据。
可选地,还包括:匹配模块,用于在生成子模块将音频直播数据进行碎片化处理生成多个音频碎片信息的操作之后,将多个音频碎片信息与预设的多个节目台进行匹配;以及第二存储模块,用于将多个音频碎片信息分别存储至音频碎片数据库中与各自匹配的节目台对应的文件中。
可选地,确定模块720,包括:第三确定子模块,用于确定广播节目播放结束之后的下一个广播节目的开始时间;以及第四确定子模块,用于将下一个广播节目的开始时间的前一时刻确定为广播节目的节目结束时间。
可选地,第二确定子模块,包括:合并单元,用于将多个第二音频碎片信息进行合并,得到第一音频信息;确定单元,用于对片头音频信息和第一音频信息进行特征提取,确定片头音频信息的第一特征和第一音频信息的第二特征;以及确定单元,用于将第一特征与第二特征进行匹配,确定节目开始时间。
从而根据本实施例,所提供的装置700首先生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息,便于后续确定广播节目的开始结束时间。然后根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间,无需人为的确定广播节目的节目开始时间和节目结束时间。然后从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息,最后将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。通过这种方式,达到了可以在非人工环境下准确定位出目标广播节目的开始时间和结束时间,然后准确的剪切出需要的节目音频,从而大大降低了用户与从业人员的不便的技术效果。进而解决了现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题。
实施例3
图8示出了根据本实施例所述的广播节目智能碎片化的装置800,该装置800与根据实施例1的第一个方面所述的方法相对应。参考图8所示,该装置800包括:处理器810;以及存储器820,与处理器810连接,用于为处理器810提供处理以下处理步骤的指令:生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息;根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间;从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息;以及将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。
可选地,根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间的操作,包括:确定在节目片头的开始时间之前的第一时刻以及在节目片头的结束时间之后的第二时刻;从多个音频碎片信息中获取第一时刻和第二时刻之间的多个第二音频碎片信息;以及根据片头音频信息和多个第二音频碎片信息,确定广播节目的节目开始时间和节目结束时间。
可选地,生成多个音频碎片信息的操作,包括:获取录制的音频直播数据;以及将音频直播数据进行碎片化处理,生成多个音频碎片信息。
可选地,存储器820还用于为处理器810提供处理以下处理步骤的指令:将音频直播数据进行碎片化处理的操作之前,对音频直播数据进行转码操作;以及存储转码后的音频直播数据。
可选地,存储器820还用于为处理器810提供处理以下处理步骤的指令:将音频直播数据进行碎片化处理,生成多个音频碎片信息的操作之后,将多个音频碎片信息与预设的多个节目台进行匹配;以及将多个音频碎片信息分别存储至音频碎片数据库中与各自匹配的节目台对应的文件中。
可选地,确定广播节目的节目结束时间的操作,包括:确定广播节目播放结束之后的下一个广播节目的开始时间;以及将下一个广播节目的开始时间的前一时刻确定为广播节目的节目结束时间。
可选地,根据片头音频信息和多个第二音频碎片,确定广播节目的节目开始时间和节目结束时间的操作,包括:将多个第二音频碎片信息进行合并,得到第一音频信息;对片头音频信息和第一音频信息进行特征提取,确定片头音频信息的第一特征和第一音频信息的第二特征;以及将第一特征与第二特征进行匹配,确定节目开始时间。
从而根据本实施例,所提供的装置800首先生成与广播节目的节目片头对应的片头音频信息以及包括广播节目的节目音频在内的多个音频碎片信息,便于后续确定广播节目的开始结束时间。然后根据片头音频信息和多个音频碎片信息,确定广播节目的节目开始时间和节目结束时间,无需人为的确定广播节目的节目开始时间和节目结束时间。然后从多个音频碎片信息中获取节目开始时间和节目结束时间之间的多个第一音频碎片信息,最后将多个第一音频碎片信息进行合并,得到与广播节目对应的节目音频。通过这种方式,达到了可以在非人工环境下准确定位出目标广播节目的开始时间和结束时间,然后准确的剪切出需要的节目音频,从而大大降低了用户与从业人员的不便的技术效果。进而解决了现有技术中存在的由于无法在非人工环境下准确定位录制的音频流信息中的目标广播节目的开始时间和结束时间,因此无法准确的剪切出需要的节目音频,导致用户与从业人员极为不便的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种广播节目智能碎片化的方法,所述方法用于确定与广播节目对应的节目音频,其特征在于,包括:
生成与所述广播节目的节目片头对应的片头音频信息以及包括所述广播节目的节目音频在内的多个音频碎片信息;
根据所述片头音频信息和所述多个音频碎片信息,确定所述广播节目的节目开始时间和节目结束时间;
从所述多个音频碎片信息中获取所述节目开始时间和所述节目结束时间之间的多个第一音频碎片信息;以及
将所述多个第一音频碎片信息进行合并,得到与所述广播节目对应的节目音频。
2.根据权利要求1所述的方法,其特征在于,根据所述片头音频信息和所述多个音频碎片信息,确定所述广播节目的节目开始时间和节目结束时间的操作,包括:
确定在所述节目片头的开始时间之前的第一时刻以及在所述节目片头的结束时间之后的第二时刻;
从所述多个音频碎片信息中获取所述第一时刻和所述第二时刻之间的多个第二音频碎片信息;以及
根据所述片头音频信息和所述多个第二音频碎片信息,确定所述广播节目的所述节目开始时间和所述节目结束时间。
3.根据权利要求1所述的方法,其特征在于,生成所述多个音频碎片信息的操作,包括:
获取录制的音频直播数据;以及
将所述音频直播数据进行碎片化处理,生成所述多个音频碎片信息。
4.根据权利要求3所述的方法,其特征在于,将所述音频直播数据进行碎片化处理的操作之前,还包括:
对所述音频直播数据进行转码操作;以及
存储转码后的所述音频直播数据。
5.根据权利要求3所述的方法,其特征在于,将所述音频直播数据进行碎片化处理,生成所述多个音频碎片信息的操作之后,还包括:
将所述多个音频碎片信息与预设的多个节目台进行匹配;以及
将所述多个音频碎片信息分别存储至音频碎片数据库中与各自匹配的节目台对应的文件中。
6.根据权利要求1所述的方法,其特征在于,确定所述广播节目的所述节目结束时间的操作,包括:
确定所述广播节目播放结束之后的下一个广播节目的开始时间;以及
将所述下一个广播节目的开始时间的前一时刻确定为所述广播节目的所述节目结束时间。
7.根据权利要求2所述的方法,其特征在于,根据所述片头音频信息和所述多个第二音频碎片,确定所述广播节目的所述节目开始时间和所述节目结束时间的操作,包括:
将所述多个第二音频碎片信息进行合并,得到第一音频信息;
对所述片头音频信息和所述第一音频信息进行特征提取,确定所述片头音频信息的第一特征和所述第一音频信息的第二特征;以及
将所述第一特征与所述第二特征进行匹配,确定所述节目开始时间。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至7中任意一项所述的方法。
9.一种广播节目智能碎片化的装置,其特征在于,包括:
生成模块,用于生成与所述广播节目的节目片头对应的片头音频信息以及包括所述广播节目的节目音频在内的多个音频碎片信息;
确定模块,用于根据所述片头音频信息和所述多个音频碎片信息,确定所述广播节目的节目开始时间和节目结束时间;
获取模块,用于从所述多个音频碎片信息中获取所述节目开始时间和所述节目结束时间之间的多个第一音频碎片信息;以及
合并模块,用于将所述多个第一音频碎片信息进行合并,得到与所述广播节目对应的节目音频。
10.一种广播节目智能碎片化的装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
生成与所述广播节目的节目片头对应的片头音频信息以及包括所述广播节目的节目音频在内的多个音频碎片信息;
根据所述片头音频信息和所述多个音频碎片信息,确定所述广播节目的节目开始时间和节目结束时间;
从所述多个音频碎片信息中获取所述节目开始时间和所述节目结束时间之间的多个第一音频碎片信息;以及
将所述多个第一音频碎片信息进行合并,得到与所述广播节目对应的节目音频。
CN202010236270.8A 2020-03-30 2020-03-30 广播节目智能碎片化的方法、装置及存储介质 Pending CN111540376A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010236270.8A CN111540376A (zh) 2020-03-30 2020-03-30 广播节目智能碎片化的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010236270.8A CN111540376A (zh) 2020-03-30 2020-03-30 广播节目智能碎片化的方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN111540376A true CN111540376A (zh) 2020-08-14

Family

ID=71976840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010236270.8A Pending CN111540376A (zh) 2020-03-30 2020-03-30 广播节目智能碎片化的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111540376A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423010A (zh) * 2020-11-16 2021-02-26 广东省广播电视局 一种广播电视直转播监测系统及监测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6771885B1 (en) * 2000-02-07 2004-08-03 Koninklijke Philips Electronics N.V. Methods and apparatus for recording programs prior to or beyond a preset recording time period
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
JP2010257546A (ja) * 2009-04-28 2010-11-11 Onkyo Corp コンテンツ抽出装置およびそのプログラム
CN102547139A (zh) * 2010-12-30 2012-07-04 北京新岸线网络技术有限公司 一种新闻视频节目切分方法、新闻视频编目方法及系统
CN104185066A (zh) * 2014-03-04 2014-12-03 无锡天脉聚源传媒科技有限公司 一种自动校验电子节目菜单的方法及装置
CN104202683A (zh) * 2014-03-11 2014-12-10 无锡天脉聚源传媒科技有限公司 一种在点播流中获取节目的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6771885B1 (en) * 2000-02-07 2004-08-03 Koninklijke Philips Electronics N.V. Methods and apparatus for recording programs prior to or beyond a preset recording time period
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
JP2010257546A (ja) * 2009-04-28 2010-11-11 Onkyo Corp コンテンツ抽出装置およびそのプログラム
CN102547139A (zh) * 2010-12-30 2012-07-04 北京新岸线网络技术有限公司 一种新闻视频节目切分方法、新闻视频编目方法及系统
CN104185066A (zh) * 2014-03-04 2014-12-03 无锡天脉聚源传媒科技有限公司 一种自动校验电子节目菜单的方法及装置
CN104202683A (zh) * 2014-03-11 2014-12-10 无锡天脉聚源传媒科技有限公司 一种在点播流中获取节目的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423010A (zh) * 2020-11-16 2021-02-26 广东省广播电视局 一种广播电视直转播监测系统及监测方法
CN112423010B (zh) * 2020-11-16 2022-11-15 广东省广播电视局 一种广播电视直转播监测系统及监测方法

Similar Documents

Publication Publication Date Title
US10776422B2 (en) Dual sound source audio data processing method and apparatus
US10097884B2 (en) Media playback method, client and system
US8805865B2 (en) Efficient matching of data
CN110312146B (zh) 音频处理方法、装置、电子设备和存储介质
CN103024601B (zh) 信息采集系统
CN111741233B (zh) 视频配乐方法、装置、存储介质以及电子设备
CN109348274B (zh) 一种直播互动方法、装置及存储介质
US11848030B2 (en) Audio encoding for functional interactivity
CN112312167B (zh) 广播内容的监测方法、装置、存储介质和电子设备
CN110428835B (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN104575550A (zh) 多媒体文件的片头略过方法与电子装置
JP6901798B2 (ja) オーディオエネルギー特性に基づくオーディオフィンガープリンティング
US20170068731A1 (en) Electronic media signature based applications
CN110830832B (zh) 移动终端的音频播放参数配置方法及相关设备
US20140105447A1 (en) Efficient data fingerprinting
US20140106708A1 (en) Continuous monitoring of data exposure and providing service related thereto
CN111540376A (zh) 广播节目智能碎片化的方法、装置及存储介质
CN113542626B (zh) 视频配乐方法、装置、计算机设备和存储介质
CN110853606A (zh) 一种音效配置方法、装置及计算机可读存储介质
US9859871B2 (en) Radio to tune multiple stations simultaneously and select programming segments
CN111489764B (zh) 音频特征的匹配和音频节目开始时间的定位的方法及装置
CN111540377B (zh) 广播节目智能碎片化的系统
CN112911332A (zh) 用于从直播视频流剪辑视频的方法、装置、设备和存储介质
CN115665504A (zh) 事件识别方法、装置、电子设备及存储介质
CN113781988A (zh) 字幕显示方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination