CN108509558B - 一种抗变速干扰的采样计数音频检索方法 - Google Patents

一种抗变速干扰的采样计数音频检索方法 Download PDF

Info

Publication number
CN108509558B
CN108509558B CN201810243704.XA CN201810243704A CN108509558B CN 108509558 B CN108509558 B CN 108509558B CN 201810243704 A CN201810243704 A CN 201810243704A CN 108509558 B CN108509558 B CN 108509558B
Authority
CN
China
Prior art keywords
audio
turning point
fingerprints
matching
retrieved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810243704.XA
Other languages
English (en)
Other versions
CN108509558A (zh
Inventor
牛保宁
姚姗姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN201810243704.XA priority Critical patent/CN108509558B/zh
Publication of CN108509558A publication Critical patent/CN108509558A/zh
Application granted granted Critical
Publication of CN108509558B publication Critical patent/CN108509558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种抗变速干扰的采样计数音频检索方法,该方法的步骤包括:提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表;提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集;在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果。通过本发明,能够克服现有检索方法中Philips音频指纹无法抵抗变速干扰的不足,在保持检索效率和对各种噪声干扰鲁邦的前提下,增加对变速干扰的抵抗性。

Description

一种抗变速干扰的采样计数音频检索方法
技术领域
本发明涉及音频检索领域,特别是涉及一种抗变速干扰的采样计数音频检索方法。
背景技术
随着新世纪以来互联网在全世界范围的广泛普及、音频编解码技术的迅猛发展以及高容量存储介质的诞生,网络中的数字音频资源数量呈现指数级别的增长。海量的网络数字音频资源给人们带来极大便利的同时,由于现阶段互联网数字音频管理体系和版权保护制度的不规范和不完善,网络用户可以随意上传或下载数字音频资源甚至对音频内容进行更改,这在无形中严重侵犯了数字音频资源版权拥有者的合法权益。
目前主要的音频检索方法分为基于文本和基于内容两大类,而基于内容的音频检索已成为近年来国内外研究的热点。基于内容的音频指纹检索是将待检索音频指纹与音频指纹数据库中的指纹进行相似度匹配,通过比较相似度获取检索结果的过程。
首先,音频指纹是检索准确的基础。提取具有强代表性,高区分性和好鲁棒性的指纹是准确检索的前提,但是没有一种音频指纹对所有类型的噪声干扰都鲁邦。Philips指纹和Shazam指纹是两类典型的指纹代表。许多后续提出的指纹都是根据这两种指纹的核心思想——基于类Philips指纹的频段能量或者类Shazam指纹的频谱峰值信息——进行改进的。Philips指纹无法抵抗大于±4%的变速干扰。Joe等人将这一比例提高到±10%。这是类Philips指纹的常见问题。Quads是类Shazam指纹中最新的代表,它可以抵抗极其严重的变速干扰,但在GSM压缩干扰下表现不佳。
随着大数据时代的到来,保持音频检索系统在应对大规模的音频数据时的高效和精确是一项挑战。采样技术方法(Sampling and Counting, SC)和QUAD是目前解决这个问题的高效的两种音频检索方法。SC通过对子指纹采样和对匹配值计数来确保其高效性,这可以快速滤除大多数不相关的音频,得到一个比原始数据库小很多的候选音频集,来应对后续极为耗时的精确匹配。该策略利用了Philips指纹的特性——连续子指纹的重叠率高达31/32。但是,SC也继承了Philips指纹的缺点,不可抵抗变速干扰。QUAD通过使用Quads指纹可以抵抗变速。但是由于Quads没有连续子指纹重叠的特性,QUAD不能像SC那样使用采样策略来提高检索效率。因此,性能比SC差,尤其是在查询短音频片段时。另外QUAD也很难应对GSM压缩。
发明内容
本发明主要为解决现有问题的不足之处而提供一种抗变速干扰的采样计数音频检索方法。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种抗变速干扰的采样计数音频检索方法,该方法的步骤包括:提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表;提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集;在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果。
其中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配的步骤包括:利用转折点判别方法找到待检索音频片段中的所有转折点,生成转折点判别表;利用转折点判别方法找到参考音频中的转折点;利用基于LSH的转折点对齐方法将参考音频中的转折点与转折点判别表对比,得到转折点匹配对;利用阈值过滤方法来筛选和统计转折点匹配对,得到最终的匹配结果。
其中,音频指纹为飞利浦音频指纹。
其中,利用转折点判别方法找到待检索音频片段中的所有判别点,生成判别表的步骤包括:识别飞利浦指纹的每一32位的二进制子指纹;依次比较飞利浦音频子指纹序列中相邻的两个二进制子指纹,若相邻的两个子指纹高位比特值发生变化,则视为转折点并记录位置。
其中,在利用基于LSH的转折点对齐方法将参考音频中的转折点与转折点判别表对比,得到转折点匹配对的步骤中,基于LSH的转折点对齐方法的步骤包括:
将待检索音频和候选序号集中音频的转折点处的子指纹分别分割成4个8位的子串,将转折点处两个连续的子指纹对应位置的8位连成一个16位的子串,形成4个字串,若待检索音频子指纹和候选序号集中音频的子指纹4个子串中任何一个能匹配成功,则得到一个转折点匹配对。
其中,在利用阈值过滤方法来筛选和统计转折点匹配对,得到最终的匹配结果的步骤中,阈值过滤方法的步骤包括:
设定转折点阈值δno,用以判断一首音频中的某处是否出现转折点;若相邻两个子指纹变化的最高位大于δno,则认为是转折点;
设定转折点误差阈值δerr用以判断待检索音频和候选序号集中的音频的转折点是否匹配;给定待检索音频Aq的转折点Tq处的两个子指纹Fqi-1和Fqi,以及候选序号集中的音频Ar的转折点Tr处的两个子指纹Fri-1和Fri,Tq和Tr的转折点误差定义为Fqi-1和Fri-1,以及Fqi和Fri之间的比特误差之和,若小于δerr,则认为<Tq,Tr>匹配;其中,δerr是大于0的整数,范围0-64;
设定序列异常过滤阈值εseq,用以对任意两个匹配对<Tq-1,Tr-1>和<Tq,Tr>,按Tq由小到大排列,若
Figure 124144DEST_PATH_IMAGE001
=(Tr-Tr-1)/(Tq-Tq-1)为负数或者大于
Figure 549790DEST_PATH_IMAGE001
,则认为序列异常,不列入进一步的考虑范围;其中,
Figure 949548DEST_PATH_IMAGE001
是大于0的实数;
设定速率限制阈值εrate,音频的速率变化超过速率限制阈值εrate时,听觉感受差,筛除超过此范围的音频;其中, εrate是大于0的实数,范围0-2;
设定序列长度阈值εlength和序列权重阈值μrate,用以将剩余的匹配对排列形成序列;所述序列中匹配对个数不能小于εlength;并且匹配对个数需要大于匹配对总数乘以μrate;其中,εlength是大于0的整数,μrate是大于0的实数,范围0-1;
设定相似度权重阈值μsim和相似度过滤阈值εsim,用以由转折点计算的待检索音频片段和参考音频的相似度为Stp=1-64Ntp/Nerr;其中,Ntp表示转折点的个数,是大于0的整数;Nerr表示所有转折点的相邻两个子指纹的比特误差之和,是大于0的整数,范围0-64Ntp
其中,在用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配的步骤之前,还包括步骤:在候选序号集对应的音频指纹中,用基于阈值的固定间隔抽样匹配方法对待检索音频片段的指纹进行精确匹配,获取检索结果。
其中,基于阈值的固定间隔抽样匹配方法的步骤包括:对于包含N个子指纹的待检索音频指纹,在参考音频上选取长度为N的指纹片段;针对选取的两个片段,对每间隔Q帧,分别取一个子指纹并计算相似度;其中Q是一个范围1-N的常数,N为大于零的整数;若相似度不满足所设定的阈值,再向后滑窗,在参考音频上选取另一段长度为N帧的音频片段,重复上述判断过程;直到判断满足相似度阈值而停止,或者滑窗到音频结尾,求出音频的整体相似度,完成一次匹配。
区别于现有技术,本发明的抗变速干扰的采样计数音频检索方法的步骤包括:提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表;提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集;在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果。通过本发明,能够克服现有检索方法中Philips音频指纹无法抵抗变速干扰的不足,在保持检索效率和对各种噪声干扰鲁邦的前提下,增加对变速干扰的抵抗性。
附图说明
图1是本发明提供的一种抗变速干扰的采样计数音频检索方法的流程示意图。
图2是本发明提供的一种抗变速干扰的采样计数音频检索方法的本发明的检索系统逻辑示意图。
具体实施方式
下面结合具体实施方式对本发明的技术方案作进一步更详细的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
参阅图1,图1是本发明提供的一种抗变速干扰的采样计数音频检索方法的流程示意图。该方法的步骤包括:
S110:提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表。
在本发明中,通过使用斐波那契哈希算法,可以根据内存的大小来调整生成索引的大小,减少存储空间的过度使用。
S120:提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集。
加入SC(采样技术)方法,可以快速过滤掉大量不相似音频,得到结果候选集。
S130:在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果。
本发明在进行音频快速检索时,可以达到在不降低精度和检索效率的前提下,扩充检索能力,得到待检索音频片段属于变速干扰类的检索结果。
所述转折点对齐匹配方法包括下述内容:
(1)利用转折点判别方法找到待检索音频片段中的所有转折点,生成判别表;
(2)利用转折点判别方法找到候选参考音频中的转折点;
(3)利用基于LSH的转折点对齐方法将候选参考音频中的转折点与转折点判别表对比,得到转折点匹配对;
(4)利用阈值过滤方法来筛选和统计转折点匹配对,得到最终的匹配结果;
所述转折点判别方法如下:
在对大量指纹进行了可视化分析之后,如果将Philips指纹的32位二进制序列转换成10进制数,并且按照顺序画成图像,则干扰前后的音频有着极为相似的波形走向,且变换前后的对应关系在波形陡峭变换的点处表现明显。我们将这些点定义为转折点,即Philips指纹的32位二进制子指纹序列转换成10进制数并按照顺序画成图像后波形陡峭变换的点,包含变化前后的两个相邻子指纹。而转折点的出现是由于两个连续子指纹之间变化的比特位出现在较高位。观察发现一般子指纹变化的最高位出现在第26位是临界转折点。大于26时转折明显;小于26波形平稳。因此只需要依次比较音频子指纹序列中相邻的两个子指纹,若高27-32位中有位变化,则视为转折点并记录其位置。
所述基于LSH的转折点对齐方法如下:
将32位子指纹分割成4个8位的子串,将转折点处两个连续的子指纹对应位置的8位连成一个16位的子串,只要4个子串有任何一个能匹配成功,则可以认为得到了一个转折点匹配对。
所述阈值过滤内容如下:
①转折点阈值δno:用来判断一首音频中的某处是否出现转折点。若两个子指纹变化的最高位大于δno,则认为是转折点;δno为26;
②转折点误差阈值δerr:用来判断两首音频中的某两个转折点是否匹配;给定待检索音频Aq的转折点Tq处的两个子指纹Fqi-1和Fqi,以及参考音频Ar的转折点Tr处的两个子指纹Fri-1和Fri,Tq和Tr的转折点误差定义为Fqi-1和Fri-1,以及Fqi和Fri之间的比特误差之和,若小于δerr,则认为<Tq, Tr>匹配;δerr是大于0的整数,范围0-64;
③序列异常过滤阈值εseq:对于任意两个匹配对<Tq-1,Tr-1>和<Tq,Tr>,按Tq由小到大排列,若
Figure 530702DEST_PATH_IMAGE001
=(Tr-Tr-1)/(Tq-Tq-1)为负数或者大于εseq,则认为序列异常,不列入进一步的考虑范围;εseq是大于0的实数;
④速率限制阈值εrate:音频的速率变化超过2倍通常来说会提供一个较差的听觉感受,因此此文不考虑超过此范围的音频;εrate是大于0的实数,范围0-2;
⑤序列长度阈值εlength和序列权重阈值μrate:在排除前述异常匹配对之后,剩余匹配对形成序列;首先序列中匹配对个数不能小于εlength;并且匹配对个数需要大于匹配对总数乘以μrate;其中,εlength是大于0的整数,μrate是大于0的实数,范围0-1。
⑥相似度权重阈值μsim和相似度过滤阈值εsim:由转折点计算的待检索音频片段和参考音频的相似度为Stp=1-64Ntp/Nerr;其中,Ntp表示转折点的个数,是大于0的整数;Nerr表示所有转折点的相邻两个子指纹的比特误差之和,是大于0的整数,范围0-64Ntp
在用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配的步骤之前,还包括步骤:在候选序号集对应的音频指纹中,用基于阈值的固定间隔抽样匹配方法对待检索音频片段的指纹进行精确匹配,获取检索结果。
待检索音频片段与候选参考音频的子指纹的相似度用比特误差率(BER)来判断。
Similarity=1-a/b
其中,a代表匹配过程中不相同位的个数,b代表匹配过程中用到的待检索音频片段指纹的长度。
以上转折点对齐匹配方法,包括转折点判别方法、基于LSH的转折点对齐方法和阈值过滤,应用在待检索音频片段的精确匹配中,可以抵抗变速干扰造成的指纹序列无法对齐,实现对变速干扰音频的检索。
具体的,首先生成待检索音频的匹配表,存储结构为<key,No,Tq>。
依次比较待检索音频Aq子指纹序列中相邻的两个子指纹Fqi-1和Fqi,若满足转折点阈值δno,则:
(1)分别取Fqi-1和Fqi对应的4个8位子串Sq(i-1)j和Sqij连成4个16位子串;
(2)将Fqi在整个序列中的位置标号i记录在这4个16位key对应的链表中,用Tq表示;
(3)将16位子串属于Fqi的次序标号j(范围0-3,3代表高位)记录在各自对应的链表中,用No表示。
然后与第二步骤生成的候选集中的音频进行比较并检查匹配结果。对于任一候选集中的参考音频Ar,具体步骤如下:
(1)获取候选参考音频的转折点信息<16b,No,Tr>,根据16位key值在匹配表中找到相应链,并选择与No一致的Tq1,Tq2,…,Tqm
(2)比较转折点Tri-1和Tqi-1,以及转折点Tri和Tqi处的两个连续子指纹得到比特误差值,如果比特误差小于阈值转折点误差阈值δerr,则将结果对<Tq,Tr>放入候选集I并按Tq由小到大排序。
(3)比较候选集I中相邻的匹配对<Tri-1, Tqi-1>和<Tri, Tqi>的比值(Tri-Tri-1)/(Tqi-Tqi-1),如果该比值满足εseq,则将其放入候选集II。
(4)在候选集II中,计算rate=(Tri-Tr1)/(Tqi-Tq1),并找出出现次数最高的rate,若该rate不满足序列长度阈值εlength或序列权重阈值μrate,则本次比较结束。
(5)在候选集II中找到出现次数最高的rate对应的匹配对<Tq,Tr>,计算相对应的连续两个子指纹的比特误差,按照相似度权重阈值μsim和相似度过滤阈值εsim得到相似度。
所述转折点判别方法只需要依次比较音频子指纹序列中相邻的两个子指纹,若高27-32位中有位变化,则视为转折点并记录其位置。
所述基于LSH的转折点对齐方法是将32位子指纹分割成4个8位的子串,并将转折点处两个连续的子指纹对应位置的8位连成一个16位的子串,只要4个子串有任何一个能匹配成功,则可以认为得到了一个转折点匹配对。
阈值过滤内容按照前述的过滤方法,对转折点阈值δno、转折点误差阈值δerr、序列异常过滤阈值εseq、速率限制阈值εrate、序列长度阈值εlength、序列权重阈值μrate、相似度权重阈值μsim和相似度过滤阈值εsim分别进行过滤。
区别于现有技术,本发明的抗变速干扰的采样计数音频检索方法的步骤包括:提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表;提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集;在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果。通过本发明,能够克服现有检索方法中Philips音频指纹无法抵抗变速干扰的不足,在保持检索效率和对各种噪声干扰鲁邦的前提下,增加对变速干扰的抵抗性。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (3)

1.一种抗变速干扰的采样计数音频检索方法,其特征在于,包括:
提取参考音频的指纹,建立音频指纹库,并对音频指纹库中音频的指纹建立Fibonacci哈希索引表;
提取待检索音频的音频指纹,并在音频指纹库的哈希索引表中进行索引检索,利用采样计数方法过滤不相似音频片段,确定待检索音频片段的候选序号集;
在候选序号集对应的指纹中,用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配,获取最终检索结果;
其中,转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配包括步骤:
利用转折点判别方法找到待检索音频片段中的所有转折点,生成转折点判别表;
利用转折点判别方法找到参考音频中的转折点;
利用基于LSH的转折点对齐方法将参考音频中的转折点与转折点判别表对比,得到转折点匹配对;
利用阈值过滤方法来筛选和统计转折点匹配对,得到最终的匹配结果
转折点判别方法包括步骤:
将飞利浦音频指纹作为音频指纹,将飞利浦音频指纹的32位二进制子指纹序列转换成10进制数,并按照顺序画成图像后波形陡峭变换的点作为转折点,转折点包含变化前后的两个相邻子指纹;
转折点的出现是由于两个连续子指纹之间变化的比特位出现在较高位,故依次比较音频子指纹序列中相邻的两个子指纹,若高27-32位中有位变化,则视为转折点并记录其位置;
基于LSH的转折点对齐方法如下:
将相邻的两个子指纹分割成4个8位的子串,将转折点处两个连续的子指纹对应位置的8位连成一个16位的子串,只要4个子串有任何一个能匹配成功,则认为得到了一个转折点匹配对;
阈值过滤方法如下:
设定转折点阈值δno,用来判断一首音频中的某处是否出现转折点;若两个子指纹变化的最高位大于δno,则认为是转折点;
设定转折点误差阈值δerr,用来判断两首音频中的某两个转折点是否匹配;给定待检索音频Aq的转折点Tq处的两个子指纹Fqi-1和Fqi,以及参考音频Ar的转折点Tr处的两个子指纹Fri-1和Fri,Tq和Tr的转折点误差定义为Fqi-1和Fri-1,以及Fqi和Fri之间的比特误差之和,若小于δerr,则认为<Tq, Tr>匹配;
设定序列异常过滤阈值εseq,对于任意两个匹配对<Tq-1,Tr-1>和<Tq,Tr>,按Tq由小到大排列,若
Figure DEST_PATH_IMAGE002
=(Tr-Tr-1)/(Tq-Tq-1)为负数或者大于εseq,则认为序列异常,不列入进一步的考虑范围;
设定速率限制阈值εrate,音频的速率变化超过2倍时,提供较差的听觉感受;
设定序列长度阈值εlength和序列权重阈值μrate,在排除前述异常匹配对之后,剩余匹配对形成序列;序列中匹配对个数不能小于εlength;并且匹配对个数大于匹配对总数乘以μrate
设定相似度权重阈值μsim和相似度过滤阈值εsim,由转折点计算的待检索音频片段和参考音频的相似度为Stp=1-64Ntp/Nerr;其中,Ntp表示转折点的个数,是大于0的整数;Nerr表示所有转折点的相邻两个子指纹的比特误差之和。
2.根据权利要求1所述的抗变速干扰的采样计数音频检索方法,其特征在于,在用转折点对齐匹配方法对待检索音频片段的指纹进行精确匹配的步骤之前,还包括步骤:
在候选序号集对应的音频指纹中,用基于阈值的固定间隔抽样匹配方法对待检索音频片段的指纹进行精确匹配,获取检索结果。
3.根据权利要求1所述的抗变速干扰的采样计数音频检索方法,其特征在于,基于阈值的固定间隔抽样匹配方法的步骤包括:对于包含N个子指纹的待检索音频指纹,在参考音频上选取长度为N的指纹片段;针对选取的两个片段,对每间隔Q帧,分别取一个子指纹并计算相似度;其中Q是一个范围1-N的常数,N为大于零的整数;若相似度不满足所设定的阈值,再向后滑窗,在参考音频上选取另一段长度为N帧的音频片段,重复上述判断过程;直到判断满足相似度阈值而停止,或者滑窗到音频结尾,求出音频的整体相似度,完成一次匹配。
CN201810243704.XA 2018-03-23 2018-03-23 一种抗变速干扰的采样计数音频检索方法 Active CN108509558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810243704.XA CN108509558B (zh) 2018-03-23 2018-03-23 一种抗变速干扰的采样计数音频检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810243704.XA CN108509558B (zh) 2018-03-23 2018-03-23 一种抗变速干扰的采样计数音频检索方法

Publications (2)

Publication Number Publication Date
CN108509558A CN108509558A (zh) 2018-09-07
CN108509558B true CN108509558B (zh) 2021-11-05

Family

ID=63378294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810243704.XA Active CN108509558B (zh) 2018-03-23 2018-03-23 一种抗变速干扰的采样计数音频检索方法

Country Status (1)

Country Link
CN (1) CN108509558B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271501B (zh) * 2018-09-19 2020-12-29 北京容联易通信息技术有限公司 一种音频数据库的管理方法及系统
CN110047515B (zh) * 2019-04-04 2021-04-20 腾讯音乐娱乐科技(深圳)有限公司 一种音频识别方法、装置、设备及存储介质
CN110767248B (zh) * 2019-09-04 2022-03-22 太原理工大学 一种抗变调干扰的音频指纹提取方法
CN112380382B (zh) * 2020-11-23 2024-03-12 北京达佳互联信息技术有限公司 一种音频分类方法、装置及存储介质
CN112784099B (zh) * 2021-01-29 2022-11-11 山西大学 抵抗变调干扰的采样计数音频检索方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290775A (zh) * 2008-06-25 2008-10-22 北京中星微电子有限公司 一种快速实现语音信号变速的方法
CN102053998A (zh) * 2009-11-04 2011-05-11 周明全 一种利用声音方式检索歌曲的方法及系统装置
CN102693720A (zh) * 2009-10-15 2012-09-26 华为技术有限公司 一种音频信号检测方法和装置
CN104121985A (zh) * 2013-04-29 2014-10-29 艾默生电气(美国)控股公司(智利)有限公司 过采样数据的选择性抽取和分析
CN104715033A (zh) * 2015-03-16 2015-06-17 太原理工大学 一种阶梯式音频检索方法
CN107293307A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 音频检测方法及装置
CN107633078A (zh) * 2017-09-25 2018-01-26 北京达佳互联信息技术有限公司 音频指纹提取方法、音视频检测方法、装置及终端

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765215B2 (en) * 2006-08-22 2010-07-27 International Business Machines Corporation System and method for providing a trustworthy inverted index to enable searching of records
US8533489B2 (en) * 2010-09-29 2013-09-10 Microsoft Corporation Searchable symmetric encryption with dynamic updating

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290775A (zh) * 2008-06-25 2008-10-22 北京中星微电子有限公司 一种快速实现语音信号变速的方法
CN102693720A (zh) * 2009-10-15 2012-09-26 华为技术有限公司 一种音频信号检测方法和装置
CN102053998A (zh) * 2009-11-04 2011-05-11 周明全 一种利用声音方式检索歌曲的方法及系统装置
CN104121985A (zh) * 2013-04-29 2014-10-29 艾默生电气(美国)控股公司(智利)有限公司 过采样数据的选择性抽取和分析
CN104715033A (zh) * 2015-03-16 2015-06-17 太原理工大学 一种阶梯式音频检索方法
CN107293307A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 音频检测方法及装置
CN107633078A (zh) * 2017-09-25 2018-01-26 北京达佳互联信息技术有限公司 音频指纹提取方法、音视频检测方法、装置及终端

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A novel algorithm for audio information retrieval based on audio fingerprint;Yan-zhou Qian 等;《2010 International Conference on Information, Networking and Automation (ICINA)》;20101019;第V1-266-V1-270页 *
基于内容的海量音频高效检索;王运生;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150315(第03(2015)期);第I138-2956页,第4.1-4.2节,图4-1 *
基于哼唱的歌曲检索系统的研究与设计;支林;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120415(第04(2012)期);第I138-2408页 *
抗频率变换的采样计数音频检索方法;姚姗姗 等;《计算机工程与应用》;20210412;第1-8页 *
旋律弹性匹配实现Web哼唱检索;李鹏 等;《计算机科学》;20141215;第41卷(第12期);第192-196页 *
音频场景分析与识别方法研究;杨丽;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160815(第08(2016)期);第I138-820页,第2.2节 *

Also Published As

Publication number Publication date
CN108509558A (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN108509558B (zh) 一种抗变速干扰的采样计数音频检索方法
US10210884B2 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
CN103440313B (zh) 基于音频指纹特征的音乐检索系统
US20060041753A1 (en) Fingerprint extraction
US8719884B2 (en) Video identification and search
JP4885842B2 (ja) コンテンツ、特に2つのコンピュータファイルに共通する抽出部分の検索方法
CN1822000A (zh) 一种自动检测新闻事件的方法
CN104715033A (zh) 一种阶梯式音频检索方法
CN110767248B (zh) 一种抗变调干扰的音频指纹提取方法
Naik et al. A ransomware detection method using fuzzy hashing for mitigating the risk of occlusion of information systems
Zhao et al. A retrieval algorithm for encrypted speech based on perceptual hashing
Kamaladas et al. Fingerprint extraction of audio signal using wavelet transform
Yao et al. An efficient cascaded filtering retrieval method for big audio data
Seo An asymmetric matching method for a robust binary audio fingerprinting
US9213703B1 (en) Pitch shift and time stretch resistant audio matching
CN111445924B (zh) 基于自回归模型系数检测定位语音片段内平滑处理的方法
CN111382302B (zh) 一种基于变速模板的音频样例检索方法
CN116884431A (zh) 基于cfcc特征的鲁棒音频复制粘贴篡改检测方法及装置
Yao et al. Enhancing sampling and counting method for audio retrieval with time-stretch resistance
Wang et al. Audio fingerprint based on spectral flux for audio retrieval
Wang et al. Structural fingerprint based hierarchical filtering in song identification
Seo A resilience mask for robust audio hashing
Wang et al. Robust audio fingerprint extraction algorithm based on 2-D chroma
CN111382303B (zh) 一种基于指纹权重的音频样例检索方法
CN110400578B (zh) 哈希码的生成及其匹配方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant