CN103116629A - 一种音频内容的匹配方法和系统 - Google Patents

一种音频内容的匹配方法和系统 Download PDF

Info

Publication number
CN103116629A
CN103116629A CN2013100392200A CN201310039220A CN103116629A CN 103116629 A CN103116629 A CN 103116629A CN 2013100392200 A CN2013100392200 A CN 2013100392200A CN 201310039220 A CN201310039220 A CN 201310039220A CN 103116629 A CN103116629 A CN 103116629A
Authority
CN
China
Prior art keywords
group
audio
sub
frame
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100392200A
Other languages
English (en)
Other versions
CN103116629B (zh
Inventor
易立夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310039220.0A priority Critical patent/CN103116629B/zh
Publication of CN103116629A publication Critical patent/CN103116629A/zh
Priority to PCT/CN2014/070406 priority patent/WO2014117644A1/en
Priority to US14/263,371 priority patent/US20140236936A1/en
Application granted granted Critical
Publication of CN103116629B publication Critical patent/CN103116629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Abstract

本发明适用于音频领域,提供了一种音频内容的匹配方法和系统,所述方法包括:从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频;将所述第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带;将所述第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表;将所述第一组子哈希表和所述第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频;从所述第一组候选音频和所述第二组候选音频中筛选匹配结果。本发明实施例中,在音频子带小波变换后,保留能量最高的几个系数,提升了数据的压缩率,至少两帧连续的音频帧,增加了匹配的准确性。

Description

一种音频内容的匹配方法和系统
技术领域
本发明属于音频领域,尤其涉及一种音频内容的匹配方法和系统。
背景技术
当电视或广播中播放歌曲时,人们如果遇到喜欢的歌曲,通常想知道喜欢的歌曲的名字。音频指纹就是一种获取歌曲名字的技术:获取电视或广播中播放的歌曲的信号;对所述信号进行处理;将经过处理的音频信号与数据库中存储的歌曲进行比对,最终获取电视或广播中播放的歌曲的名字。
但上述技术存在以下缺点:(1)、系统中经过处理后留下的歌曲信号会越来越多,容易造成数据的冗余,这在负载传输中会造成很大的负担;(2)、只获取单个音频片段的匹配结果,容易造成匹配误差。
发明内容
本发明实施例的目的在于提供一种音频内容的匹配方法和系统,以解决现有技术因数据冗余造成的负担和匹配误差的问题。
本发明实施例是这样实现的,一种音频内容的匹配方法,所述方法包括以下步骤:
从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频;
将所述第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带;
将所述第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表;
将所述第一组子哈希表和所述第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频;
从所述第一组候选音频和所述第二组候选音频中筛选匹配结果。
本发明实施例的另一目的在于提供一种音频内容的匹配系统,所述系统包括:
音频帧获取单元,用于从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频;
子带转换单元,用于将所述音频帧获取单元获取的第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带;
子哈希表转换单元,用于将所述子带转换单元装换的第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表;
候选音频获取单元,用于将所述子哈希表转换单元装换的第一组子哈希表和第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频;
匹配结果筛选单元,用于从所述候选音频获取单元获取的第一组候选音频和第二组候选音频中筛选匹配结果。
本发明实施例中,将待匹配音频片段分成子带,对子带进行小波变化后,保留能量最高的子带的系数,通过位置敏感哈希算法将所述系数转换为一组子哈希表,通过分布式存储方法保存所有的子哈希表,获取每组子哈希表的匹配结果,并将每组子哈希表的匹配结果与连续的一帧音频片段的匹配结果进行比对,获取最终的匹配结果,使得音频指纹不会冗余,通过位置敏感哈希算法获得的子哈希表得到全部保存,并通过至少两帧连续的音频片段的比对,增加了匹配的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的音频内容匹配方法的流程图;
图2是本发明实施例提供的音频内容匹配系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例中,将待匹配音频片段分成子带,对子带进行小波变化后,保留能量最高的子带的系数,通过位置敏感哈希算法将所述系数转换为一组子哈希表,通过分布式存储方法保存所有的子哈希表,获取每组子哈希表的匹配结果,并将每组子哈希表的匹配结果与连续的一帧音频片段的匹配结果进行比对,获取最终的匹配结果,使得音频指纹不会冗余,通过位置敏感哈希算法获得的子哈希表得到全部保存,并通过至少两帧连续的音频片段的比对,增加了匹配的准确性。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
如图1所示为本发明实施例提供的音频内容匹配方法的流程图,所述方法包括:
在步骤S101中,从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频。
在本发明实施例中,获取电台中播放的音频片段,所述音频片段即为待匹配的音频片段,从所述音频片段中获取至少两帧连续的音频帧:第一音频帧、第二音频帧。此处需要指出的是,待匹配音频片段可以为歌曲,也可以为演说、辩论等。所述从待匹配音频片段中获取第一音频帧和第二音频帧的步骤,包括:
(1)、通过分帧处理将所述待匹配的音频片段分成连续的音频帧。
在本发明实施例中,将给定的待匹配音频片段按照m秒间隔、n秒窗长的进行分帧处理,即:每帧音频的长度为n秒,每两帧连续音频之间的间隔为m秒。
(2)、从所述音频帧中获取第一音频帧和第二音频帧。
在本发明实施例中,从所述音频帧中获取第一音频帧和第二音频帧。需要指出的是,此处为了方便说明指获取第一音频帧和第二音频帧,但在实际计算中,为了匹配更加精确,可以获取第三音频帧、第四音频帧等更多的音频帧。
在步骤S102中,将所述第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带。
在本发明实施例中,通过快速傅里叶变化将第一音频帧转换为第一组子带,将第二音频帧转换为第二组子带,使得在后续的步骤中,可以通过第一组子带和第二组子带获取音频片段的音频指纹,减少了音频指纹在系统中的冗余。
在步骤S103中,将所述第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表。
在本发明实施例中,音频片段本质上是信号,对所述音频片段进行信号处理,即是对音频信号进行信号处理,通过对所述音频片段进行信号处理,即可获取所述至少两帧音频片段的音频指纹。所述将第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表的步骤,包括:
(1)、对所述第一组子带和第二组子带的能量分别进行小波变化,至少保留所述第一组子带中能量最高的两个小波变换的系数和所述第二组子带中能量最高的两个小波变换的系数,将所述第一组子带中能量最高的小波变换的系数组成第一组系数,将所述第二组子带中能量最高的小波变换的系数组成第二组系数。
在本发明实施例中,第一组子带和第二组子带均至少保留两个小波变换的系数,以使在后续的步骤中,通过所述系数获取的候选音频在每组子带内进行比对。
(2)、对所述第一组系数和所述第二组系数分别进行二进制变化,并通过最小哈希算法将经过二进制变化的所述第一组系数压缩为第一组子指纹,将经过二进制变化的所述第二组系数压缩为第二组子指纹。
(3)、通过位置敏感哈希算法将所述第一组子指纹转换为第一组子哈希表,将所述第二组子指纹转换为第二组子哈希表,并通过分布式存储方法存储所述第一组子哈希表和所述第二组子哈希表。
在本发明实施例中,通过位置敏感哈希算法将所述子指纹分成子哈希表。但是位置敏感哈希算法有一个缺点,即位置敏感哈希算法的取值范围比较窄,具体到本实施例,所述缺点表现为不能保存所有的子哈希表,因此本实施例中加入了分布式存储方法,使得所有的子哈希表都可以得到保存。
在步骤S104中,将所述第一组子哈希表和所述第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频。
在本发明实施例中,将第一组子哈希表和第二组子哈希表分别与数据库中保存的音频片段进行比对,记录每个子哈希表匹配的音频片段的标识,所述标识包括但不限于:名称,在数据库中的编号等。所述获取第一组候选音频和第二组候选音频,具体为:
(1)、假设第一组子哈希表包含:子哈希表1、子哈希表2。子哈希表1匹配音频片段1、音频片段2、音频片段3,子哈希表2匹配音频片段2、音频片段3、音频片段4,则第一组子哈希表的匹配结果为音频片段2和音频片段3,即第一组候选音频为音频片段2和音频片段3。
(2)、假设第二组子哈希表包含:子哈希表3和子哈希表4。子哈希表3匹配音频片段2、音频片段3、音频片段4,子哈希表4匹配音频片段3、音频片段4、音频片段5,则第二组子哈希表的匹配结果为音频片段3和音频片段4,即第二组候选音频为音频片段3和音频片段4。
在步骤S105中,从所述第一组候选音频和所述第二组候选音频中筛选匹配结果。
在本发明实施例中,通过第一组候选音频和第二组候选音频的比较,从其中筛选最终的匹配结果。所述从所述第一组候选音频和所述第二组候选音频中筛选匹配结果,具体为:
(1)、计算所述第一组候选音频和所述第二组候选音频中相同的音频的权重;
(2)、选择所述权重最高的音频作为匹配结果。
在本发明实施例中,将第一组候选音频和第二组候选音频进行比对,如第一组子哈希表的匹配结果为:音频片段2、音频片段3,第二组子哈希表的匹配结果为:音频片段3、音频片段4,则最终的匹配结果为音频片段3。其中权重计算使用现有的计算方法,并且根据实际情况可以使用不同的计算方法,此处不对权重的计算方法进行限定。
本发明实施例中,将待匹配音频片段分成子带,对子带进行小波变化后,保留能量最高的子带的系数,通过位置敏感哈希算法将所述系数转换为一组子哈希表,通过分布式存储方法保存所有的子哈希表,获取每组子哈希表的匹配结果,并将每组子哈希表的匹配结果与连续的一帧音频片段的匹配结果进行比对,获取最终的匹配结果,使得音频指纹不会冗余,通过位置敏感哈希算法获得的子哈希表得到全部保存,并通过至少两帧连续的音频片段的比对,增加了匹配的准确性。
实施例二
如图2所示为本发明实施例提供的音频内容匹配系统的结构图,为了便于说明,仅示出与本发明实施例相关的部分,所述系统包括:
音频帧获取单元201,用于从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频。
在本发明实施例中,获取电台中播放的音频片段,所述音频片段即为待匹配的音频片段,音频帧获取单元201从所述音频片段中获取至少两帧连续的音频帧:第一音频帧、第二音频帧。所述音频帧获取单元201,具体包括:
分帧子单元2011,用于通过分帧处理将所述待匹配的音频片段分成连续的音频帧。
在本发明实施例中,分帧子单元2011将给定的待匹配音频片段按照m秒间隔、n秒窗长的进行分帧处理,即:每帧音频的长度为n秒,每两帧连续音频之间的间隔为m秒。
获取子单元2012,用于从所述分帧子单元2011分成的音频帧中获取第一音频帧和第二音频帧。
在本发明实施例中,获取子单元2012从所述音频帧中获取第一音频帧和第二音频帧。需要指出的是,此处为了方便说明指获取第一音频帧和第二音频帧,但在实际计算中,为了匹配更加精确,可以获取第三音频帧、第四音频帧等更多的音频帧。
在本发明的一个可选实施例中,在所述分帧子单元2011分帧之前,所述音频帧获取单元201还包括:
设置子单元2013,用于设置每帧音频片段的间隔和每帧音频片段的窗长。
子带转换单元202,用于将所述音频帧获取单元201获取的第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带。
在本发明实施例中,子带转换单元202通过快速傅里叶变化将第一音频帧转换为第一组子带,将第二音频帧转换为第二组子带,使得在后续的步骤中,可以通过第一组子带和第二组子带获取音频片段的音频指纹,减少了音频指纹在系统中的冗余。
子哈希表转换单元203,用于将所述子带转换单元202装换的第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表。
在本发明实施例中,音频片段本质上是信号,对所述音频片段进行信号处理,即是对音频信号进行信号处理,通过对所述音频片段进行信号处理,即可获取所述至少两帧音频片段的音频指纹。所述子哈希表转换单元203,具体包括:
系数获取子单元2031,用于对所述第一组子带和第二组子带的能量分别进行小波变化,至少保留所述第一组子带中能量最高的两个小波变换的系数和所述第二组子带中能量最高的两个小波变换的系数,将所述第一组子带中能量最高的小波变换的系数组成第一组系数,将所述第二组子带中能量最高的小波变换的系数组成第二组系数。
在本发明实施例中,第一组子带和第二组子带均至少保留两个小波变换的系数,以使在后续的步骤中,通过所述系数获取的候选音频在每组子带内进行比对。
子指纹获取子单元2032,用于对所述系数获取子单元2031获取的第一组系数和第二组系数分别进行二进制变化,并通过最小哈希算法将经过二进制变化的所述第一组系数压缩为第一组子指纹,将经过二进制变化的所述第二组系数压缩为第二组子指纹。
子哈希表转换子单元2033,用于通过位置敏感哈希算法将所述子指纹获取子单元2032获取的第一组子指纹转换为第一组子哈希表,将所述第二组子指纹转换为第二组子哈希表,并通过分布式存储方法存储所述第一组子哈希表和所述第二组子哈希表。
在本发明实施例中,子哈希表转换子单元2033通过位置敏感哈希算法将所述子指纹分成子哈希表。但是位置敏感哈希算法有一个缺点,即位置敏感哈希算法的取值范围比较窄,具体到本实施例,所述缺点表现为不能保存所有的子哈希表,因此本实施例中加入了分布式存储方法,使得所有的子哈希表都可以得到保存。
候选音频获取单元204,用于将所述子哈希表转换单元203装换的第一组子哈希表和第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频。
在本发明实施例中,将第一组子哈希表和第二组子哈希表分别与数据库中保存的音频片段进行比对,记录每个子哈希表匹配的音频片段的标识,所述标识包括但不限于:名称,在数据库中的编号等。获取第一组候选音频和第二组候选音频,具体为:
(1)、假设第一组子哈希表包含:子哈希表1、子哈希表2。子哈希表1匹配音频片段1、音频片段2、音频片段3,子哈希表2匹配音频片段2、音频片段3、音频片段4,则第一组子哈希表的匹配结果为音频片段2和音频片段3,即第一组候选音频为音频片段2和音频片段3。
(2)、假设第二组子哈希表包含:子哈希表3和子哈希表4。子哈希表3匹配音频片段2、音频片段3、音频片段4,子哈希表4匹配音频片段3、音频片段4、音频片段5,则第二组子哈希表的匹配结果为音频片段3和音频片段4,即第二组候选音频为音频片段3和音频片段4。
匹配结果筛选单元205,用于从所述候选音频获取单元204获取的第一组候选音频和第二组候选音频中筛选匹配结果。
在本发明实施例中,通过第一组候选音频和第二组候选音频的比较,从其中筛选最终的匹配结果。所述匹配结果筛选单元205,具体包括:
权重计算子单元2051,用于计算所述第一组候选音频和所示第二组候选音频中相同的音频的权重;
选择子单元2052,用于选择所述权重计算子单元2051计算的权重最高的音频作为匹配结果。
在本发明实施例中,将第一组候选音频和第二组候选音频进行比对,如第一组子哈希表的匹配结果为:音频片段2、音频片段3,第二组子哈希表的匹配结果为:音频片段3、音频片段4,则最终的匹配结果为音频片段3。其中权重计算使用现有的计算方法,并且根据实际情况可以使用不同的计算方法,此处不对权重的计算方法进行限定。
本发明实施例中,将待匹配音频片段分成子带,对子带进行小波变化后,保留能量最高的子带的系数,通过位置敏感哈希算法将所述系数转换为一组子哈希表,通过分布式存储方法保存所有的子哈希表,获取每组子哈希表的匹配结果,并将每组子哈希表的匹配结果与连续的一帧音频片段的匹配结果进行比对,获取最终的匹配结果,使得音频指纹不会冗余,通过位置敏感哈希算法获得的子哈希表得到全部保存,并通过至少两帧连续的音频片段的比对,增加了匹配的准确性。
本领域普通技术人员可以理解为上述实施例二所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种音频内容的匹配方法,其特征在于,所述方法包括以下步骤:
从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频;
将所述第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带;
将所述第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表;
将所述第一组子哈希表和所述第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频;
从所述第一组候选音频和所述第二组候选音频中筛选匹配结果。
2.如权利要求1所述的方法,其特征在于,所述从待匹配音频片段中获取第一音频帧和第二音频帧的步骤,包括:
通过分帧处理将所述待匹配的音频片段分成连续的音频帧;
从所述音频帧中获取第一音频帧和第二音频帧。
3.如权利要求1所述的方法,其特征在于,所述将所述第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表的步骤,包括:
对所述第一组子带和第二组子带的能量分别进行小波变化,至少保留所述第一组子带中能量最高的两个小波变换的系数和所述第二组子带中能量最高的两个小波变换的系数,将所述第一组子带中能量最高的小波变换的系数组成第一组系数,将所述第二组子带中能量最高的小波变换的系数组成第二组系数;
对所述第一组系数和所述第二组系数分别进行二进制变化,并通过最小哈希算法将经过二进制变化的所述第一组系数压缩为第一组子指纹,将经过二进制变化的所述第二组系数压缩为第二组子指纹;
通过位置敏感哈希算法将所述第一组子指纹转换为第一组子哈希表,将所述第二组子指纹转换为第二组子哈希表,并通过分布式存储方法存储所述第一组子哈希表和所述第二组子哈希表。
4.如权利要求2所述的方法,其特征在于,在所述对所述待匹配音频片段进行分帧处理的步骤之前,所述方法还包括:
设置每帧音频片段的间隔和每帧音频片段的窗长。
5.如权利要求1所述的方法,其特征在于,所述从所述第一组候选音频和所述第二组候选音频中筛选匹配结果,具体为:
计算所述第一组候选音频和所示第二组候选音频中相同的音频的权重;
选择所述权重最高的音频作为匹配结果。
6.一种音频内容的匹配系统,其特征在于,所述系统包括:
音频帧获取单元,用于从待匹配音频片段中获取第一音频帧和第二音频帧,所述第一音频帧和第二音频帧为两帧连续的音频;
子带转换单元,用于将所述音频帧获取单元获取的第一音频帧转换为第一组子带,将所述第二音频帧转换为第二组子带;
子哈希表转换单元,用于将所述子带转换单元装换的第一组子带转换为第一组子哈希表,将所述第二组子带转换为第二组子哈希表;
候选音频获取单元,用于将所述子哈希表转换单元装换的第一组子哈希表和第二组子哈希表分别与数据库中保存的音频片段进行比对,获取第一组候选音频和第二组候选音频;
匹配结果筛选单元,用于从所述候选音频获取单元获取的第一组候选音频和第二组候选音频中筛选匹配结果。
7.如权利要求6所述的系统,其特征在于,所述音频帧获取单元具体包括:
分帧子单元,用于通过分帧处理将所述待匹配的音频片段分成连续的音频帧;
获取子单元,用于从所述分帧子单元分成的音频帧中获取第一音频帧和第二音频帧。
8.如权利要求6所述的系统,其特征在于,所述子哈希表转换单元具体包括:
系数获取子单元,用于对所述第一组子带和第二组子带的能量分别进行小波变化,至少保留所述第一组子带中能量最高的两个小波变换的系数和所述第二组子带中能量最高的两个小波变换的系数,将所述第一组子带中能量最高的小波变换的系数组成第一组系数,将所述第二组子带中能量最高的小波变换的系数组成第二组系数;
子指纹获取子单元,用于对所述系数获取子单元获取的第一组系数和第二组系数分别进行二进制变化,并通过最小哈希算法将经过二进制变化的所述第一组系数压缩为第一组子指纹,将经过二进制变化的所述第二组系数压缩为第二组子指纹;
子哈希表转换子单元,用于通过位置敏感哈希算法将所述子指纹获取子单元获取的第一组子指纹转换为第一组子哈希表,将所述第二组子指纹转换为第二组子哈希表,并通过分布式存储方法存储所述第一组子哈希表和所述第二组子哈希表。
9.如权利要求7所述的系统,其特征在于,在所述分帧子单元分帧之前,所述音频帧获取单元还包括:
设置子单元,用于设置每帧音频片段的间隔和每帧音频片段的窗长。
10.如权利要求6所述的系统,其特征在于,所述匹配结果筛选单元具体包括:
权重计算子单元,用于计算所述第一组候选音频和所示第二组候选音频中相同的音频的权重;
选择子单元,用于选择所述权重计算子单元计算的权重最高的音频作为匹配结果。
CN201310039220.0A 2013-02-01 2013-02-01 一种音频内容的匹配方法和系统 Active CN103116629B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310039220.0A CN103116629B (zh) 2013-02-01 2013-02-01 一种音频内容的匹配方法和系统
PCT/CN2014/070406 WO2014117644A1 (en) 2013-02-01 2014-01-09 Matching method and system for audio content
US14/263,371 US20140236936A1 (en) 2013-02-01 2014-04-28 Matching method and system for audio content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310039220.0A CN103116629B (zh) 2013-02-01 2013-02-01 一种音频内容的匹配方法和系统

Publications (2)

Publication Number Publication Date
CN103116629A true CN103116629A (zh) 2013-05-22
CN103116629B CN103116629B (zh) 2016-04-20

Family

ID=48415002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310039220.0A Active CN103116629B (zh) 2013-02-01 2013-02-01 一种音频内容的匹配方法和系统

Country Status (3)

Country Link
US (1) US20140236936A1 (zh)
CN (1) CN103116629B (zh)
WO (1) WO2014117644A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117644A1 (en) * 2013-02-01 2014-08-07 Tencent Technology (Shenzhen) Company Limited Matching method and system for audio content
CN104991946A (zh) * 2015-07-13 2015-10-21 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
CN105868397A (zh) * 2016-04-19 2016-08-17 腾讯科技(深圳)有限公司 一种歌曲确定方法和装置
CN110830938A (zh) * 2019-08-27 2020-02-21 武汉大学 一种针对室内信号源部署方案筛选的指纹定位快速实现方法
CN113780180A (zh) * 2021-09-13 2021-12-10 江苏环雅丽书智能科技有限公司 一种音频长时指纹提取及匹配方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104900238B (zh) * 2015-05-14 2018-08-21 电子科技大学 一种基于感知滤波的音频实时比对方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101651694A (zh) * 2009-09-18 2010-02-17 北京亮点时间科技有限公司 提供音频相关信息的方法、系统、客户端及服务器
US20120209612A1 (en) * 2011-02-10 2012-08-16 Intonow Extraction and Matching of Characteristic Fingerprints from Audio Signals
CN102870116A (zh) * 2012-06-30 2013-01-09 华为技术有限公司 内容匹配方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6882997B1 (en) * 1999-08-25 2005-04-19 The Research Foundation Of Suny At Buffalo Wavelet-based clustering method for managing spatial data in very large databases
CA2716266C (en) * 2009-10-01 2016-08-16 Crim (Centre De Recherche Informatique De Montreal) Content based audio copy detection
ES2459391T3 (es) * 2011-06-06 2014-05-09 Bridge Mediatech, S.L. Método y sistema para conseguir hashing de audio invariante al canal
CN103116629B (zh) * 2013-02-01 2016-04-20 腾讯科技(深圳)有限公司 一种音频内容的匹配方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101651694A (zh) * 2009-09-18 2010-02-17 北京亮点时间科技有限公司 提供音频相关信息的方法、系统、客户端及服务器
US20120209612A1 (en) * 2011-02-10 2012-08-16 Intonow Extraction and Matching of Characteristic Fingerprints from Audio Signals
CN102870116A (zh) * 2012-06-30 2013-01-09 华为技术有限公司 内容匹配方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吕萍等: "音频匹配技术及其在音频检索中的应用", 《中国声学学会2005年青年学术会议[CYCA 05]论文集》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117644A1 (en) * 2013-02-01 2014-08-07 Tencent Technology (Shenzhen) Company Limited Matching method and system for audio content
CN104991946A (zh) * 2015-07-13 2015-10-21 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
CN104991946B (zh) * 2015-07-13 2021-04-13 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
CN105868397A (zh) * 2016-04-19 2016-08-17 腾讯科技(深圳)有限公司 一种歌曲确定方法和装置
US10719551B2 (en) 2016-04-19 2020-07-21 Tencent Technology (Shenzhen) Company Limited Song determining method and device and storage medium
CN110830938A (zh) * 2019-08-27 2020-02-21 武汉大学 一种针对室内信号源部署方案筛选的指纹定位快速实现方法
CN113780180A (zh) * 2021-09-13 2021-12-10 江苏环雅丽书智能科技有限公司 一种音频长时指纹提取及匹配方法

Also Published As

Publication number Publication date
US20140236936A1 (en) 2014-08-21
CN103116629B (zh) 2016-04-20
WO2014117644A1 (en) 2014-08-07

Similar Documents

Publication Publication Date Title
CN103116629A (zh) 一种音频内容的匹配方法和系统
US10210884B2 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
US11024288B2 (en) Methods and apparatus to segment audio and determine audio segment similarities
WO2019101123A1 (zh) 语音活性检测方法、相关装置和设备
CN103403710A (zh) 对来自音频信号的特征指纹的提取和匹配
US20140135964A1 (en) Music information searching method and apparatus thereof
TW200529548A (en) Adaptive hybrid transform for signal analysis and synthesis
CN101894560B (zh) 一种无参考源的mp3音频清晰度客观评价方法
CN103093761A (zh) 音频指纹检索方法及装置
CN104134444B (zh) 一种基于mmse的歌曲去伴奏方法和装置
WO2024021882A1 (zh) 音频数据处理方法、装置、计算机设备和存储介质
US11430454B2 (en) Methods and apparatus to identify sources of network streaming services using windowed sliding transforms
CN105845149A (zh) 声音信号中主音高的获取方法及系统
CN104885153A (zh) 音频校正设备及其音频校正方法
Kim et al. Robust audio fingerprinting using peak-pair-based hash of non-repeating foreground audio in a real environment
US20230386498A1 (en) Pitch emphasis apparatus, method and program for the same
US10997966B2 (en) Voice recognition method, device and computer storage medium
CN104900239B (zh) 一种基于沃尔什-哈达码变换的音频实时比对方法
CN103180847B (zh) 音乐查询方法和装置
US20160005415A1 (en) Audio signal processing apparatus and audio signal processing method thereof
CN102546034B (zh) 一种语音信号处理方法及设备
US11798577B2 (en) Methods and apparatus to fingerprint an audio signal
Wang et al. Audio fingerprint based on spectral flux for audio retrieval
Zhu [Retracted] Multimedia Recognition of Piano Music Based on the Hidden Markov Model
CN113470630A (zh) 基于大数据的语音识别方法、系统、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20161201

Address after: 510000 Guangzhou, Tianhe District branch Yun Yun Road, No. 16, self built room 2, building 1301

Patentee after: Guangzhou KuGou Networks Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518057 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.

CP02 Change in the address of a patent holder

Address after: No. 315, Huangpu Avenue middle, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU KUGOU COMPUTER TECHNOLOGY Co.,Ltd.

Address before: 510000 room 1301, building 2, No.16 Keyun Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU KUGOU COMPUTER TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder