CN105142018A - 基于音频指纹的节目识别方法及装置 - Google Patents
基于音频指纹的节目识别方法及装置 Download PDFInfo
- Publication number
- CN105142018A CN105142018A CN201510493026.9A CN201510493026A CN105142018A CN 105142018 A CN105142018 A CN 105142018A CN 201510493026 A CN201510493026 A CN 201510493026A CN 105142018 A CN105142018 A CN 105142018A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency fingerprint
- fingerprint information
- information
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/232—Content retrieval operation locally within server, e.g. reading video streams from disk arrays
Abstract
本发明公开了基于音频指纹的节目识别方法,包括:在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;提取所述音频数据的音频指纹信息;将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;接收所述服务器反馈的所述节目信息。本发明还公开了一种基于音频指纹的节目识别装置。本发明实现了根据节目的音频指纹信息识别当前的节目信息,使得用户能够根据音频指纹信息准确的获取当前的节目信息,提高了节目的识别效率及准确性,进而提高了用户体验。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于音频指纹的节目识别方法及装置。
背景技术
目前,网络技术的快速发展和多媒体产业的迅速发展已经越来越在我们的日常生活中产生重要的影响。例如,用户在使用智能终端一些交友互动应用时,经常需要分享节目或音乐等音频数据给好友,此时,用户需要识别当前在听的音乐或者在看的节目,然后将音乐和节目等音频数据的相关信息分享给好友。
但是,这种音乐或节目等音频数据的识别方式对用户(分享者)的主观依赖性较大,容易由于用户的识别错误等原因造成音频数据的相关信息的错误,譬如,在用户根据听到或看到的音频数据的关键字等搜索该关键字对应的音频数据的相关信息时,由于关键字的不准确或错误而导致搜索到的音频数据的相关信息不正确或不准确,降低了音乐或节目等音频数据的识别效率及准确性。
发明内容
本发明提供一种基于音频指纹的节目识别方法及装置,旨在解决现有节目等音频数据识别的效率低及准确性低技术问题。
为实现上述目的,本发明提供的一种基于音频指纹的节目识别方法,所述基于音频指纹的节目识别方法包括以下步骤:
在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
提取所述音频数据的音频指纹信息;
将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
接收所述服务器反馈的所述节目信息。
优选地,所述提取所述音频数据的音频指纹信息的步骤包括:
实时获取对所述节目的音频信号进行录音的录音时长;
确定所述录音时长是否超过第一预设时长;
在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
优选地,在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息的步骤之后,所述基于音频指纹的节目识别方法包括:
定时提取所述音频数据的音频指纹信息。。
优选地,在所述在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据的步骤之后,所述基于音频指纹的节目识别方法还包括:
在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
优选地,所述将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息的步骤还包括:
获取所述音频指纹信息的数据大小;
确定所述音频指纹信息的数据大小是否大于预设阈值;
在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
此外,为实现上述目的,本发明还提供一种基于音频指纹的节目识别装置,所述基于音频指纹的节目识别装置包括:
录音模块,用于在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
提取模块,用于提取所述音频数据的音频指纹信息;
发送模块,用于将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
接收模块,用于接收所述服务器反馈的所述节目信息。
优选地,所述提取模块包括:
第一获取单元,用于实时获取对所述节目的音频信号进行录音的录音时长;
第一确定单元,用于确定所述录音时长是否超过第一预设时长;
提取单元,用于在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
优选地,所述基于音频指纹的节目识别装置还包括:
定时提取模块,用于定时提取所述音频数据的音频指纹信息。
优选地,所述基于音频指纹的节目识别装置还包括:
结束模块,用于在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
优选地,所述发送模块包括:
第二获取单元,用于获取所述音频指纹信息的数据大小;
第二确定单元,用于确定所述音频指纹信息的数据大小是否大于预设阈值;
发送单元,用于在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
本发明通过在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据,接着提取音频数据的音频指纹信息,然后将音频指纹信息发送至服务器,并接收服务器基于音频指纹信息反馈的节目信息,实现了根据节目的音频指纹信息识别当前的节目信息,使得用户能够根据音频指纹信息准确的获取当前的节目信息,提高了节目的识别效率及准确性,进而提高了用户体验。
附图说明
图1为本发明基于音频指纹的节目识别方法第一实施例的流程示意图;
图2为本发明提取音频指纹信息的步骤的流程示意图;
图3为本发明基于音频指纹的节目识别方法第二实施例的流程示意图;
图4为本发明基于音频指纹的节目识别方法第三实施例的流程示意图;
图5为本发明将音频指纹信息发送至服务器的步骤的流程示意图
图6为本发明基于音频指纹的节目识别装置第一实施例的功能模块示意图;
图7为图6中提取模块的细化功能模块示意图;
图8为本发明基于音频指纹的节目识别装置第二实施例的功能模块示意图;
图9为本发明基于音频指纹的节目识别装置第三实施例的功能模块示意图;
图10为图6中发送模块的细化功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于音频指纹的节目识别方法。
参照图1,图1为本发明基于音频指纹的节目识别方法第一实施例的流程示意图。
在本实施例中,该基于音频指纹的节目识别方法包括:
步骤S10,在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
在获取到识别指令时,对当前显示播放设备播放的节目的音频信号进行录音,并通过该录音操作获得音频数据;优选地,在本实施例中,音频信号的录音频率设置为8KHz、16比特量化的PCM(PulseCodeModulation,脉冲编码调制)格式、双声道,该设置下每秒钟录音/录音的裸音频数据大小约为3.2万个字节。在终端设有触发识别指令的按钮/按键时,可以通过在侦测到该按钮/按键的按压/点击操作等触发识别指令;还可以通过在侦测该按钮/按键的按压/点击操作的按压时长、按压操作的压力大小、按压操作的压力大小的持续时长/点击次数等达到预设条件时,触发识别指令;或者,在侦测到基于预设控件触发的触摸操作时、在侦测到基于屏幕中预设区域的触摸操作时、或者在所述终端的运动轨迹为预设运动轨迹时,触发该识别指令。
步骤S20,提取所述音频数据的音频指纹信息;
在录音获得的音频数据中提取音频指纹信息,本实施例中,可以通过对音频数据进行采样、滤波等一系列处理操作获得音频指纹信息。
步骤S30,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
与服务器建立连接,将提取的音频指纹信息发送至服务器并发送识别请求,服务器在接收到音频指纹信息时,在服务器自身或者与服务器信号连接的存储设备中查找与该音频指纹信息匹配的节目信息,并反馈将查找到的节目信息,其中节目信息包括节目的名称、演员等信息。
本实施例的服务器存储了一个庞大的音频指纹信息库,音频指纹信息库的所有音频指纹信息均为相关节目的音频数据的关键点的数据信息。在进行音频指纹信息的匹配时,服务器采用哈希表存储音频指纹信息作为key(哈希表的关键码值),该哈希表中与key对应的value(哈希表的关键码值)存储音频指纹信息对应的节目的名称和/或音频指纹信息的时长,同时服务器可以采用另外一个哈希表存储音频指纹信息对应节目名称和相关歌唱家、演员等信息。服务器在接收到音频指纹信息时,哈希查找与该音频指纹信息匹配的节目信息,并按照查找到的节目信息与该音频指纹信息匹配度大小进行排序,当然,如果反馈的匹配度比较高的两个节目名不同,则服务器等待终端上传更多音频指纹信息,并进行下一次的匹配操作,最终反馈匹配度最高的节目信息。本实施例中,可以为服务器存储的每一个节目信息设置相应的预设匹配度或者为所有的节目设置相同的匹配度,在服务器匹配到的节目信息与音频指纹信息的匹配度达到预设匹配度时,服务器反馈包括节目信息的识别结果或节目信息至终端。
步骤S40,接收所述服务器反馈的所述节目信息。
终端接收服务器反馈的节目信息,终端同时可以输出该节目信息以告知用户识别结果,当然,终端在接收到服务器反馈的节目信息时,结束该节目识别,即停止执行对当前节目的音频信号进行录音以及后续的流程。
本实施例中,为提高识别的效率以及速度,在获取到识别指令时,开启音频数据写入的子线程对节目的音频信号进行录音以获得音频数据并将音频数据写入第一缓冲区,然后在录音的时长达到预设时长时开启服务器请求子线程,在该线程将第一缓冲区的音频数据拷贝到第二缓冲区,并对该音频数据进行音频指纹信息的提取,然后将音频指纹信息发送至服务器;节目的音频信号的录音以及音频指纹信息的提取分别在不同的线程完成,使得节目识别的速度大大的提高。并且,音频数据写入子线程即录音线程要连续,即写入不能有耗时的操作,在实现中要求能够达到即录即写的效果,以保证音频数据的连续,避免写入间断的音频数据而影响节目的识别;将音频数据写入的子线程对应的第一缓冲区中已有的数据拷贝到服务器请求子线程对应的第二缓冲区时,数据拷贝一定要深拷贝,以避免读写冲突。
本实施例中,步骤S10包括:在获取到识别指令时,确定终端当前是否存储有其他的音频数据;在终端当前存储有其他的音频数据时,获取所述音频数据的长度标识/时间标识;对当前节目的音频信号进行录音以获得音频数据;步骤S20包括:基于所述长度标识/时间标识在所述音频数据中提取音频指纹信息。一般情况下,为了提高节目识别的效率,终端在存储音频数据后不会主动删除该音频数据(用户主动删除的情况除外),因此,需要确定终端当前是否存储有其他的音频数据,然后在除去该长度标识/时间标识之外的音频数据中提取音频指纹信息,以确定用于提取音频指纹信息的音频数据为进行本次节目识别的录音操作获得的数据。
本实施例通过在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据,接着提取音频数据的音频指纹信息,然后将音频指纹信息发送至服务器,并接收服务器基于音频指纹信息反馈的节目信息,实现了根据节目的音频指纹信息识别当前的节目信息,使得用户能够根据音频指纹信息准确的获取当前的节目信息,提高了节目的识别效率及准确性,进而提高了用户体验。
参照图2,图2为本发明提取音频指纹信息的步骤的流程示意图。
基于第一实施例提出本发明步骤S20的细化流程的实施例,在本实施例中,步骤S20包括:
步骤S21,实时获取对所述节目的音频信号进行录音的录音时长;
实时获取对当前节目的音频信号进行录音的录音时长,可以在录音开始时实时记录当前节目的音频信号进行录音的录音时长。
步骤S22,确定所述录音时长是否超过第一预设时长;
第一预设时长是指录音获得的语音数据可能提取到包括节目的关键点(能够识别当前节目的数据)的音频指纹数据的预设录音时长,例如,预设时长可以设置为3秒等。
步骤S23,在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
在录音时长超过第一预设时长时,在该录音时长的音频数据中提取音频指纹信息。保证用于提取音频指纹信息的语音数据具有适当的时长,尽可能地保证该音频数据可以提取出能够识别该节目的音频指纹信息。
本实施例通过实时获取对节目的音频信号进行录音的录音时长,然后在确定该录音时长超过第一预设时长时,提取音频数据的音频指纹信息,使得用于提取音频指纹信息的语音数据具有适当的时长以及数据大小,尽可能地保证该音频数据可以提取出能够识别该节目的音频指纹信息以及节目识别的效率,进一步提高了节目的识别效率及准确性,进而提高了用户体验。
参照图3,图3为本发明基于音频指纹的节目识别方法第二实施例的流程示意图。
基于上一实施例提出本发明基于音频指纹的节目识别方法的第二实施例,在本实施例中,在步骤S23之后,该基于音频指纹的节目识别方法还包括:
步骤S50,定时提取所述音频数据的音频指纹信息。
本实施例中,在第一次成功提取音频指纹信息之后,基于预设时间间隔定时提取音频数据的音频指纹信息,使得后续能够定时持续将音频指纹信息发生至服务器。优选地,本实施例中预设时间间隔设置为一秒,即在录音时长超过第一预设时长时,每隔一秒提取一次音频指纹信息。本实施例中,可以在第一次成功提取音频指纹信息之后进行计时,在计时的时长为预设时间间隔定的倍数时,提取音频数据的音频指纹信息。
本实施例通过第一次成功提取音频指纹信息之后,定时提取所述音频数据的音频指纹信息,实现了音频指纹信息的定时持续提取,使得后续能够定时持续将音频指纹信息发生至服务器,进而提高了服务器根据持续上传的音频指纹信息识别出该节目,进一步提高了节目的识别效率及准确性,进而提高了用户体验。
参照图4,图4为本发明基于音频指纹的节目识别方法第三实施例的流程示意图。
基于上一实施例提出本发明基于音频指纹的节目识别方法的第三实施例,在本实施例中,在步骤S10之后,该基于音频指纹的节目识别方法还包括:
步骤S60,在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
本实施例中,第二预设时长是指本次节目识别的总时长或本次节目识别的录音总时长,例如,可以将第二录音时长设置为30秒等。在录音时长超过第二预设时长时,无论终端是否收到服务器反馈的识别结果即节目信息,都结束对所述节目的音频信号的录音,进而结束本次节目识别。
本实施例通过在录音时长超过第二预设时长时,结束对节目的音频信号的录音,进而结束本次节目的识别,使得在无法识别该节目譬如当前节目无声音等时,能够及时的结束节目的识别,避免持续识别该节目而影响节目识别的效率。
参照图5,图5为本发明将音频指纹信息发送至服务器的步骤的流程示意图。
基于上述实施例提出本发明步骤S30的细化流程的实施例,在本实施例中,步骤S30包括:
步骤S31,获取所述音频指纹信息的数据大小;
获取提取到的音频指纹信息的数据大小。
步骤S32,确定所述音频指纹信息的数据大小是否大于预设阈值;
本实施例中,预设数据大小可以设置为20个字节等。
步骤S33,在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
在音频指纹信息的数据大小大于预设阈值时,将该音频指纹信息发送至服务器,以供所述服务器查找与音频指纹信息匹配的节目信息;当然,在音频指纹信息的数据大小小于或等于预设阈值时,则在间隔一定时间后重新提取音频指纹数据。
本实施例通过获取音频指纹信息的数据大小,然后在音频指纹信息的数据大小大于预设阈值时,将音频指纹信息发送至服务器,以供服务器查找与音频指纹信息匹配的节目信息,使得服务器接收到的音频指纹信息具有适当的数据大小,提高了服务器根据该音频指纹信息识别对应节目的概率,避免在音频指纹信息的数据大小不足时发生至服务器而使服务器识别不出该音频指纹信息对应的节目,进一步提高了节目的识别效率及准确性。
本发明进一步提供一种基于音频指纹的节目识别装置。
参照图6,图6为本发明基于音频指纹的节目识别装置第一实施例的功能模块示意图。
在本实施例中,该基于音频指纹的节目识别装置包括:
录音模块10,用于在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
在获取到识别指令时,录音模块10对当前显示播放设备播放的节目的音频信号进行录音,并通过该录音操作获得音频数据。
提取模块20,用于提取所述音频数据的音频指纹信息;
发送模块30,用于将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
发送模块30将提取的音频指纹信息发送至服务器并发送识别请求,,服务器在接收到音频指纹信息时,在服务器自身或者与服务器信号连接的存储设备中查找与该音频指纹信息匹配的节目信息,并反馈将查找到的节目信息,其中节目信息包括节目的名称、演员等信息。
接收模块40,用于接收所述服务器反馈的所述节目信息。
本实施例通过在获取到识别指令时,录音模块10对当前节目的音频信号进行录音以获得音频数据,接着提取模块20提取音频数据的音频指纹信息,然后发送模块30将音频指纹信息发送至服务器,接收模块40接收服务器基于音频指纹信息反馈的节目信息,实现了根据节目的音频指纹信息识别当前的节目信息,使得用户能够根据音频指纹信息准确的获取当前的节目信息,提高了节目的识别效率及准确性,进而提高了用户体验。
参照图7,图7为图6中提取模块的细化功能模块示意图。
基于第一实施例提出本发明提取模块20细化功能模块的实施例,在本实施例中,提取模块20包括:
第一获取单元21,用于实时获取对所述节目的音频信号进行录音的录音时长;
第一获取单元21实时获取对当前节目的音频信号进行录音的录音时长。
第一确定单元22,用于确定所述录音时长是否超过第一预设时长;
第一预设时长是指录音获得的语音数据可能提取到包括节目的关键点(能够识别当前节目的数据)的音频指纹数据的预设录音时长,例如,预设时长可以设置为3秒等。
提取单元23,用于在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
在录音时长超过第一预设时长时,提取单元23在该录音时长的音频数据中提取音频指纹信息。保证用于提取音频指纹信息的语音数据具有适当的时长,尽可能地保证该音频数据可以提取出能够识别该节目的音频指纹信息。
优选地,本实施例中,所述提取单元23还用于在所述录音时长超过第一预设时长时,基于预设时间间隔定时提取所述音频数据的音频指纹信息。
在录音时长超过第一预设时长时,基于预设时间间隔定时提取音频数据的音频指纹信息,使得后续能够预设时间间隔定时持续将音频指纹信息发生至服务器。优选地,本实施例中预设时间间隔设置为一秒,即在录音时长超过第一预设时长时,每隔一秒提取一次音频指纹信息。
本实施例通过第一获取单元21实时获取对节目的音频信号进行录音的录音时长,然后在第一确定单元22确定该录音时长超过第一预设时长时,提取单元23提取音频数据的音频指纹信息,使得用于提取音频指纹信息的语音数据具有适当的时长以及数据大小,尽可能地保证该音频数据可以提取出能够识别该节目的音频指纹信息以及节目识别的效率,进一步提高了节目的识别效率及准确性,进而提高了用户体验。
参照图8,图8为本发明基于音频指纹的节目识别装置第二实施例的功能模块示意图。
基于上一实施例提出本发明基于音频指纹的节目识别装置的第二实施例,在本实施例中,该基于音频指纹的节目识别装置还包括:
定时提取模块50,用于定时提取所述音频数据的音频指纹信息。
本实施例中,在第一次成功提取音频指纹信息之后,定时提取模块50定时提取音频数据的音频指纹信息,使得后续能够定时持续将音频指纹信息发生至服务器。优选地,本实施例中预设时间间隔设置为一秒,即在录音时长超过第一预设时长时,每隔一秒提取一次音频指纹信息。本实施例中,可以在第一次成功提取音频指纹信息之后进行计时,在计时的时长为预设时间间隔定的倍数时,提取音频数据的音频指纹信息。
本实施例通过第一次成功提取音频指纹信息之后,定时提取模块50定时提取所述音频数据的音频指纹信息,实现了音频指纹信息的定时持续提取,使得后续能够定时持续将音频指纹信息发生至服务器,进而提高了服务器根据持续上传的音频指纹信息识别出该节目,进一步提高了节目的识别效率及准确性,进而提高了用户体验。
参照图9,图9为本发明基于音频指纹的节目识别装置第三实施例的功能模块示意图。
基于上一实施例提出本发明基于音频指纹的节目识别装置的第三实施例,在本实施例中,该基于音频指纹的节目识别装置还包括:
结束模块60,用于在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
本实施例中,第二预设时长是指本次节目识别的总时长或本次节目识别的录音总时长,例如,可以将第二录音时长设置为30秒等。在录音时长超过第二预设时长时,无论终端是否收到服务器反馈的识别结果即节目信息,结束模块60都结束对所述节目的音频信号的录音,进而结束本次节目识别。
本实施例通过在录音时长超过第二预设时长时,结束模块60结束对节目的音频信号的录音,进而结束本次节目的识别,使得在无法识别该节目譬如当前节目无声音等时,能够及时的结束节目的识别,避免持续识别该节目而影响节目识别的效率。
参照图10,图10为图6中发送模块的细化功能模块示意图。
基于第一实施例提出本发明发送模块30的细化功能模块实施例,在本实施例中,发送模块30包括:
第二获取单元31,用于获取所述音频指纹信息的数据大小;
第二获取单元31获取提取到的音频指纹信息的数据大小。
第二确定单元32,用于确定所述音频指纹信息的数据大小是否大于预设阈值;
发送单元33,用于在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
在音频指纹信息的数据大小大于预设阈值时,发送单元33将该音频指纹信息发送至服务器,以供所述服务器查找与音频指纹信息匹配的节目信息;当然,在音频指纹信息的数据大小小于或等于预设阈值时,则在间隔一定时间后重新提取音频指纹数据。
本实施例通过第二获取单元31获取音频指纹信息的数据大小,然后在第二确定单元32确定音频指纹信息的数据大小大于预设阈值时,发送单元33将音频指纹信息发送至服务器,以供服务器查找与音频指纹信息匹配的节目信息,使得服务器接收到的音频指纹信息具有适当的数据大小,提高了服务器根据该音频指纹信息识别对应节目的概率,避免在音频指纹信息的数据大小不足时发生至服务器而使服务器识别不出该音频指纹信息对应的节目,进一步提高了节目的识别效率及准确性。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于音频指纹的节目识别方法,其特征在于,所述基于音频指纹的节目识别方法包括以下步骤:
在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
提取所述音频数据的音频指纹信息;
将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
接收所述服务器反馈的所述节目信息。
2.如权利要求1所述的基于音频指纹的节目识别方法,其特征在于,所述提取所述音频数据的音频指纹信息的步骤包括:
实时获取对所述节目的音频信号进行录音的录音时长;
确定所述录音时长是否超过第一预设时长;
在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
3.如权利要求2所述的基于音频指纹的节目识别方法,其特征在于,在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息的步骤之后,所述基于音频指纹的节目识别方法还包括:
定时提取所述音频数据的音频指纹信息。
4.如权利要求3所述的基于音频指纹的节目识别方法,其特征在于,在所述在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据的步骤之后,所述基于音频指纹的节目识别方法还包括:
在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
5.如权利要求1至4任一项所述的基于音频指纹的节目识别方法,其特征在于,所述将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息的步骤还包括:
获取所述音频指纹信息的数据大小;
确定所述音频指纹信息的数据大小是否大于预设阈值;
在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
6.一种基于音频指纹的节目识别装置,其特征在于,所述基于音频指纹的节目识别装置包括:
录音模块,用于在获取到识别指令时,对当前节目的音频信号进行录音以获得音频数据;
提取模块,用于提取所述音频数据的音频指纹信息;
发送模块,用于将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息;
接收模块,用于接收所述服务器反馈的所述节目信息。
7.如权利要求6所述的基于音频指纹的节目识别装置,其特征在于,所述提取模块包括:
第一获取单元,用于实时获取对所述节目的音频信号进行录音的录音时长;
第一确定单元,用于确定所述录音时长是否超过第一预设时长;
提取单元,用于在所述录音时长超过第一预设时长时,提取所述音频数据的音频指纹信息。
8.如权利要求7所述的基于音频指纹的节目识别装置,其特征在于,所述基于音频指纹的节目识别装置还包括:
定时提取模块,用于定时提取所述音频数据的音频指纹信息。
9.如权利要求8所述的基于音频指纹的节目识别装置,其特征在于,所述基于音频指纹的节目识别装置还包括:
结束模块,用于在所述录音时长超过第二预设时长时,结束对所述节目的音频信号的录音。
10.如权利要求6至9任一项所述的基于音频指纹的节目识别装置,其特征在于,所述发送模块包括:
第二获取单元,用于获取所述音频指纹信息的数据大小;
第二确定单元,用于确定所述音频指纹信息的数据大小是否大于预设阈值;
发送单元,用于在所述音频指纹信息的数据大小大于预设阈值时,将所述音频指纹信息发送至服务器,以供所述服务器查找与所述音频指纹信息匹配的节目信息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510493026.9A CN105142018A (zh) | 2015-08-12 | 2015-08-12 | 基于音频指纹的节目识别方法及装置 |
PCT/CN2016/083836 WO2017024857A1 (zh) | 2015-08-12 | 2016-05-29 | 基于音频指纹的节目识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510493026.9A CN105142018A (zh) | 2015-08-12 | 2015-08-12 | 基于音频指纹的节目识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105142018A true CN105142018A (zh) | 2015-12-09 |
Family
ID=54727203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510493026.9A Pending CN105142018A (zh) | 2015-08-12 | 2015-08-12 | 基于音频指纹的节目识别方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105142018A (zh) |
WO (1) | WO2017024857A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105872089A (zh) * | 2016-05-26 | 2016-08-17 | 无锡天脉聚源传媒科技有限公司 | 一种音频特征传输方法及装置 |
CN105959789A (zh) * | 2016-05-26 | 2016-09-21 | 无锡天脉聚源传媒科技有限公司 | 一种节目频道确定方法及装置 |
WO2017024857A1 (zh) * | 2015-08-12 | 2017-02-16 | 深圳Tcl数字技术有限公司 | 基于音频指纹的节目识别方法及装置 |
CN107404360A (zh) * | 2017-09-08 | 2017-11-28 | 湖南康通电子股份有限公司 | 音频播放方法及装置 |
CN108322770A (zh) * | 2017-11-22 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 视频节目识别方法、相关装置、设备和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
CN101493918A (zh) * | 2008-10-21 | 2009-07-29 | 深圳市牧笛科技有限公司 | 在线音乐盗版监控方法和系统 |
CN102622353A (zh) * | 2011-01-27 | 2012-08-01 | 天脉聚源(北京)传媒科技有限公司 | 一种固定音频检索方法 |
CN103501449A (zh) * | 2013-10-08 | 2014-01-08 | 十分(北京)信息科技有限公司 | 与电视节目关联的视频源推荐方法及推荐装置 |
CN104023247A (zh) * | 2014-05-29 | 2014-09-03 | 腾讯科技(深圳)有限公司 | 获取、推送信息的方法和装置以及信息交互系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8428955B2 (en) * | 2009-10-13 | 2013-04-23 | Rovi Technologies Corporation | Adjusting recorder timing |
US8886531B2 (en) * | 2010-01-13 | 2014-11-11 | Rovi Technologies Corporation | Apparatus and method for generating an audio fingerprint and using a two-stage query |
US20120315014A1 (en) * | 2011-06-10 | 2012-12-13 | Brian Shuster | Audio fingerprinting to bookmark a location within a video |
CN103455513B (zh) * | 2012-06-01 | 2017-03-15 | 广州酷狗计算机科技有限公司 | 音频文件更新方法及更新装置 |
CN104023251B (zh) * | 2014-06-13 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 基于视频的互动方法和系统 |
CN105142018A (zh) * | 2015-08-12 | 2015-12-09 | 深圳Tcl数字技术有限公司 | 基于音频指纹的节目识别方法及装置 |
-
2015
- 2015-08-12 CN CN201510493026.9A patent/CN105142018A/zh active Pending
-
2016
- 2016-05-29 WO PCT/CN2016/083836 patent/WO2017024857A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
CN101493918A (zh) * | 2008-10-21 | 2009-07-29 | 深圳市牧笛科技有限公司 | 在线音乐盗版监控方法和系统 |
CN102622353A (zh) * | 2011-01-27 | 2012-08-01 | 天脉聚源(北京)传媒科技有限公司 | 一种固定音频检索方法 |
CN103501449A (zh) * | 2013-10-08 | 2014-01-08 | 十分(北京)信息科技有限公司 | 与电视节目关联的视频源推荐方法及推荐装置 |
CN104023247A (zh) * | 2014-05-29 | 2014-09-03 | 腾讯科技(深圳)有限公司 | 获取、推送信息的方法和装置以及信息交互系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017024857A1 (zh) * | 2015-08-12 | 2017-02-16 | 深圳Tcl数字技术有限公司 | 基于音频指纹的节目识别方法及装置 |
CN105872089A (zh) * | 2016-05-26 | 2016-08-17 | 无锡天脉聚源传媒科技有限公司 | 一种音频特征传输方法及装置 |
CN105959789A (zh) * | 2016-05-26 | 2016-09-21 | 无锡天脉聚源传媒科技有限公司 | 一种节目频道确定方法及装置 |
CN105959789B (zh) * | 2016-05-26 | 2018-11-20 | 无锡天脉聚源传媒科技有限公司 | 一种节目频道确定方法及装置 |
CN107404360A (zh) * | 2017-09-08 | 2017-11-28 | 湖南康通电子股份有限公司 | 音频播放方法及装置 |
CN107404360B (zh) * | 2017-09-08 | 2020-02-07 | 湖南康通电子股份有限公司 | 音频播放方法及装置 |
CN108322770A (zh) * | 2017-11-22 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 视频节目识别方法、相关装置、设备和系统 |
WO2019101099A1 (zh) * | 2017-11-22 | 2019-05-31 | 腾讯科技(深圳)有限公司 | 视频节目识别方法、设备、终端、系统和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2017024857A1 (zh) | 2017-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10719551B2 (en) | Song determining method and device and storage medium | |
CN105142018A (zh) | 基于音频指纹的节目识别方法及装置 | |
US10097884B2 (en) | Media playback method, client and system | |
US9612791B2 (en) | Method, system and storage medium for monitoring audio streaming media | |
TWI494917B (zh) | 音頻識別方法及裝置 | |
US8699862B1 (en) | Synchronized content playback related to content recognition | |
KR101578279B1 (ko) | 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템 | |
CN104598502A (zh) | 获取播放视频中背景音乐信息的方法、装置及系统 | |
CN107613392A (zh) | 信息处理方法、装置、终端设备及存储介质 | |
CN104091596B (zh) | 一种乐曲识别方法、系统和装置 | |
US9224385B1 (en) | Unified recognition of speech and music | |
TW200402654A (en) | A system and method for providing user control over repeating objects embedded in a stream | |
CN103440330A (zh) | 一种音乐节目信息获取方法和设备 | |
CN105975568B (zh) | 一种音频处理方法及装置 | |
WO2015058651A1 (zh) | 音频文件均衡器参数配置的方法和装置 | |
CN105788610A (zh) | 音频处理方法及装置 | |
CN105845158A (zh) | 一种信息处理方法及客户端 | |
CN108305622B (zh) | 一种基于语音识别的音频摘要文本创建方法及其创建装置 | |
CN102170528B (zh) | 一种新闻节目的分段方法 | |
CN104093038B (zh) | 用于实时流媒体识别服务的测试和监控方法及装置 | |
CN104407699A (zh) | 一种人机交互方法、装置及系统 | |
CN106531202A (zh) | 一种音频处理方法及装置 | |
CN109756628A (zh) | 一种功能按键音效的播放方法、装置及电子设备 | |
CN107196979A (zh) | 基于语音识别的叫号预提醒系统 | |
CN111031382A (zh) | 媒体文件的播放进度控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151209 |