CN101777075A - 并行音频指纹检索方法 - Google Patents
并行音频指纹检索方法 Download PDFInfo
- Publication number
- CN101777075A CN101777075A CN201010106447A CN201010106447A CN101777075A CN 101777075 A CN101777075 A CN 101777075A CN 201010106447 A CN201010106447 A CN 201010106447A CN 201010106447 A CN201010106447 A CN 201010106447A CN 101777075 A CN101777075 A CN 101777075A
- Authority
- CN
- China
- Prior art keywords
- audio
- fingerprint
- parallel
- frequency fingerprint
- searching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Collating Specific Patterns (AREA)
Abstract
并行音频指纹检索方法,包括,1)音频指纹提取步骤:对音频数据库中用户上传的音频文件进行音频指纹编码,提取音频文件指纹;2)音频文件指纹打包步骤:根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包,并将该多个音频指纹包分布到多个并行计算的计算机;3)并行检索步骤:根据待检索音频文件的音频指纹及其指定的时间段,在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索;4)汇总并行计算检索的结果。本发明通过将音频文件指纹按时间排序打包发送至并行计算的计算机中,进行音频和音频指纹的检索,减少了不必要的计算量,大大提高了指纹检索的速度和效率。
Description
技术领域
本发明属于音频指纹检索技术领域,特别涉及一种通过并行计算机进行音频指纹索引的检索方法。
背景技术
随着网络的发展,音频节目呈海量增长之势,如何高效且有效地检索或监管音频内容成为一个重要的问题。音频指纹技术的出现为视频中音频内容的监管和检索提供了一种高效且有效的方法。音频指纹技术中的关键技术是:(1)音频指纹的提取;和(2)音频指纹的检索。音频指纹的提取方法是否有效,直接决定了音频指纹检索的效率和精度;而音频指纹的检索系统则直接决定了整个音频指纹系统的效率和精度。
在2002年的视觉信息最新进展国际会议上(Proceedings of Recent Advances in VisualInformation Systems 2002),Oostveen和Kalker等人在《视频指纹的特征提取方法和数据库策略》(Feature Extraction and a Database Strategy for Video Fingerprinting)这篇文章中,提出了一种音频指纹特征提取方法,但是这种特征提取方法在实际使用中精度不高。另外,在索引方面,该文提出的数据库索引方案有几点不足:(1)候选的指纹文件没有进行过滤,这样会产生较大的、多余的计算量,影响索引的效率;(2)若对每个候选指纹片段进行汉明(Hamming)距离计算的话,运算很大。
发明内容
本发明提供一种并行音频指纹检索方法,以提高音频指纹的检索效率。
为实现上述目的,本发明采用如下技术方案:
一种并行音频指纹检索方法,包括以下步骤:
1)音频指纹提取步骤:对音频数据库中用户上传的音频文件进行音频指纹编码,提取音频文件指纹;
2)音频文件指纹打包步骤:根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包,并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n,每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n;
3)并行检索步骤:根据待检索音频文件的音频指纹及其指定的时间段,在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索;
4)汇总并行计算检索的结果。
进一步地,在所述步骤2)中,将所述多个音频指纹包均匀分布到多个并行计算的计算机上。
进一步地,在所述步骤1)中,设音频指纹编码的总数为M个;在所述步骤2)中,对该M个音频指纹编码按用户上传时间顺序进行排序,每N个音频指纹编码打包成一个文件,得到M/N个音频指纹包;将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
进一步地,所述步骤3)中,还包括一对待检索音频文件的音频指纹提取步骤。
本发明通过将音音频文件指纹按时间排序打包发送至并行计算的计算机中,进行音频和音频指纹的检索,减少了不必要的计算量,大大提高了指纹检索的速度和效率。
附图说明
图1为本发明并行音频指纹检索方法实施例的流程图;
图2为本发明并行音频指纹检索方法实施例的检索流程图。
具体实施方式
如图1所示,一种并行音频指纹检索方法,包括以下步骤:
1)音频指纹提取步骤:对音频数据库中用户上传的音频文件进行音频指纹编码,提取音频文件指纹;
2)音频文件指纹打包步骤:根据音频文件的时间先后顺序将音频文件指纹分成多个音频指纹包,并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n,每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n;
3)并行检索步骤:根据待检索音频文件的音频指纹及其指定的时间段,在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索;
4)汇总并行计算检索的结果。
其中,在所述步骤2)中,将所述多个音频指纹包均匀分布到多个并行计算的计算机上。
其中,在所述步骤1)中,设音频指纹编码的总数为M个;在所述步骤2)中,对该M个音频指纹编码按用户上传时间顺序进行排序,每N个音频指纹编码打包成一个文件,得到M/N个音频指纹包;将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
其中,在所述步骤3)中,还包括一对待检索音频文件的音频指纹提取步骤。即对用户上传待检索的音频文件,在提取其音频指指纹后,根据用户指定的时间段进行检索。
如图2所示,假设待检索音频文件的音频指纹指定的时间段为K,而落在该时间段内的音频指纹包的计算机为计算机K1至计算机K2(1<K1<K2<n),则此时只需要在计算机K1至计算机K2的音频指纹库中进行并行计算检索,而无需在计算机1至K2和计算机K2至n中检索,有效提高了检索的速度和效率。
本发明中并行计算的计算机是指多台可以同时进行计算的计算机。每台计算机上包含一个或者多个音频或音频指纹包,并可运行一个或者多个指纹包来进行匹配检索。
以上所述的实施例仅用于说明本发明的技术思想及特点,其目的在使本领域内的技术人员能够了解本发明的内容并据以实施,当不能仅以本实施例来限定本发明的专利范围,即凡依本发明所揭示的精神所作的同等变化或修饰,仍落在本发明的专利范围内。
Claims (4)
1.一种并行音频指纹检索方法,其特征在于包括以下步骤:
1)音频指纹提取步骤:对音频数据库中用户上传的音频文件进行音频指纹编码,提取音频文件指纹;
2)音频文件指纹打包步骤:根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包,并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n,每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n;
3)并行检索步骤:根据待检索音频文件的音频指纹及其指定的时间段,在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索;
4)汇总并行计算检索的结果。
2.根据权利要求1所述的并行音频指纹检索方法,其特征在于:
在所述步骤2)中,将所述多个音频指纹包均匀分布到多个并行计算的计算机上。
3.根据权利要求2所述的并行音频指纹检索方法,其特征在于:
在所述步骤1)中,设音频指纹编码的总数为M个;在所述步骤2)中,对该M个音频指纹编码按用户上传时间顺序进行排序,每N个音频指纹编码打包成一个文件,得到M/N个音频指纹包;将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
4.根据权利要求1至3中任一权利要求所述的并行音频指纹检索方法,其特征在于:
所述步骤3)中,还包括一对待检索音频文件的音频指纹提取步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010106447.9A CN101777075B (zh) | 2010-02-05 | 2010-02-05 | 并行音频指纹检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010106447.9A CN101777075B (zh) | 2010-02-05 | 2010-02-05 | 并行音频指纹检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101777075A true CN101777075A (zh) | 2010-07-14 |
CN101777075B CN101777075B (zh) | 2015-02-11 |
Family
ID=42513536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010106447.9A Expired - Fee Related CN101777075B (zh) | 2010-02-05 | 2010-02-05 | 并行音频指纹检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101777075B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622353A (zh) * | 2011-01-27 | 2012-08-01 | 天脉聚源(北京)传媒科技有限公司 | 一种固定音频检索方法 |
CN104636474A (zh) * | 2015-02-13 | 2015-05-20 | 王磊 | 构建音频指纹库及检索音频指纹的方法和设备 |
CN104679847A (zh) * | 2015-02-13 | 2015-06-03 | 王磊 | 一种构建在线实时更新海量音频指纹库的方法和设备 |
CN104700103A (zh) * | 2015-04-03 | 2015-06-10 | 广东同盛联合信息技术有限公司 | 一种应用于多生物特征识别的智能身份认证通道的指纹比对方法 |
CN109189969A (zh) * | 2018-10-22 | 2019-01-11 | 镇江悦乐网络科技有限公司 | 一种基于图像序列的三维cg动画检索方法 |
CN110149529A (zh) * | 2018-11-01 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 媒体信息的处理方法、服务器及存储介质 |
CN111400542A (zh) * | 2020-03-20 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 音频指纹的生成方法、装置、设备及存储介质 |
-
2010
- 2010-02-05 CN CN201010106447.9A patent/CN101777075B/zh not_active Expired - Fee Related
Non-Patent Citations (3)
Title |
---|
JOB OOSTVEEN EL AT.: "《Feature Extraction and a Database Strategy for Video Fingerprinting 》", 《VISUAL 2002》 * |
KUNIO KASHINO EL AT.: "《A Quick Search Method for Audio and Video Signals Based on Histogram Pruning》", 《IEEE TRANSACTIONS ON MULTIMEDIA》 * |
V. CEVHER EL AT.: "《JOINT ACOUSTIC-VIDEO FINGERPRINTING OF VEHICLES》", 《IEEE ICASSP》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622353B (zh) * | 2011-01-27 | 2013-10-16 | 天脉聚源(北京)传媒科技有限公司 | 一种固定音频检索方法 |
CN102622353A (zh) * | 2011-01-27 | 2012-08-01 | 天脉聚源(北京)传媒科技有限公司 | 一种固定音频检索方法 |
KR102431806B1 (ko) * | 2015-02-13 | 2022-08-12 | 레이 왕 | 대량 오디오 지문 데이터베이스의 온라인 실시간 업데이트를 구축하는 방법과 장치 |
CN104636474A (zh) * | 2015-02-13 | 2015-05-20 | 王磊 | 构建音频指纹库及检索音频指纹的方法和设备 |
CN104679847A (zh) * | 2015-02-13 | 2015-06-03 | 王磊 | 一种构建在线实时更新海量音频指纹库的方法和设备 |
KR20160100216A (ko) * | 2015-02-13 | 2016-08-23 | 레이 왕 | 대량 오디오 지문 데이터베이스의 온라인 실시간 업데이트를 구축하는 방법과 장치 |
CN104679847B (zh) * | 2015-02-13 | 2019-03-15 | 高第网络技术(北京)有限公司 | 一种构建在线实时更新海量音频指纹库的方法和设备 |
CN104700103A (zh) * | 2015-04-03 | 2015-06-10 | 广东同盛联合信息技术有限公司 | 一种应用于多生物特征识别的智能身份认证通道的指纹比对方法 |
CN109189969A (zh) * | 2018-10-22 | 2019-01-11 | 镇江悦乐网络科技有限公司 | 一种基于图像序列的三维cg动画检索方法 |
CN110149529B (zh) * | 2018-11-01 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 媒体信息的处理方法、服务器及存储介质 |
CN110149529A (zh) * | 2018-11-01 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 媒体信息的处理方法、服务器及存储介质 |
CN111400542A (zh) * | 2020-03-20 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 音频指纹的生成方法、装置、设备及存储介质 |
CN111400542B (zh) * | 2020-03-20 | 2023-09-08 | 腾讯科技(深圳)有限公司 | 音频指纹的生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101777075B (zh) | 2015-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101777075B (zh) | 并行音频指纹检索方法 | |
CN104090886B (zh) | 构建用户实时画像的方法及装置 | |
CN103345514B (zh) | 大数据环境下的流式数据处理方法 | |
US9710507B2 (en) | Organization of data within a database | |
CN103268350B (zh) | 一种互联网舆情信息监测系统及监测方法 | |
CN102799682B (zh) | 一种海量数据预处理方法及其系统 | |
CN103838867A (zh) | 日志处理方法和装置 | |
CN106294815B (zh) | 一种url的聚类方法及装置 | |
CN102799647A (zh) | 网页去重方法和设备 | |
CN102722583A (zh) | 重复数据删除硬件加速装置和方法 | |
CN105302807A (zh) | 一种获取信息类别的方法和装置 | |
CN105930384A (zh) | 基于Hadoop体系的传感云数据存储系统及其实现方法 | |
CN105511812A (zh) | 一种存储系统大数据优化方法及装置 | |
CN103078709A (zh) | 数据冗余识别方法 | |
CN104424251A (zh) | 一种多维度拆分的计算方法以及系统 | |
CN106815254A (zh) | 一种数据处理方法和装置 | |
CN103678293A (zh) | 一种数据存储方法及装置 | |
CN107832344A (zh) | 一种基于storm流计算框架的食品安全网络舆情分析方法 | |
CN106897280A (zh) | 数据查询方法及装置 | |
CN104536830A (zh) | 一种基于MapReduce的KNN文本分类方法 | |
CN110008419A (zh) | 网页去重方法、装置及设备 | |
CN102802090A (zh) | 一种视频版权保护方法及系统 | |
CN106844588A (zh) | 一种基于网络爬虫的用户行为数据的分析方法及系统 | |
CN105005585A (zh) | 一种日志数据的处理方法和装置 | |
CN102622353B (zh) | 一种固定音频检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200514 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Alibaba (China) Co.,Ltd. Address before: 200003 Shanghai Xuhui District Xietu Road No. 1238 Building No. 6, X2 Creative Park Patentee before: SHANGHAI TUDOU NETWORK TECHNOLOGY Co.,Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150211 Termination date: 20210205 |