CN101063970A - 一种基于音频特征码识别技术的音频文件管理方法和系统 - Google Patents

一种基于音频特征码识别技术的音频文件管理方法和系统 Download PDF

Info

Publication number
CN101063970A
CN101063970A CN 200610076396 CN200610076396A CN101063970A CN 101063970 A CN101063970 A CN 101063970A CN 200610076396 CN200610076396 CN 200610076396 CN 200610076396 A CN200610076396 A CN 200610076396A CN 101063970 A CN101063970 A CN 101063970A
Authority
CN
China
Prior art keywords
audio
audio file
feature code
audio feature
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610076396
Other languages
English (en)
Other versions
CN101063970B (zh
Inventor
周欣
程兆炜
沈坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yeelion Online Network Technology Beijing Co Ltd
Original Assignee
Yeelion Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yeelion Online Network Technology Beijing Co Ltd filed Critical Yeelion Online Network Technology Beijing Co Ltd
Priority to CN200610076396.3A priority Critical patent/CN101063970B/zh
Publication of CN101063970A publication Critical patent/CN101063970A/zh
Application granted granted Critical
Publication of CN101063970B publication Critical patent/CN101063970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于音频特征码识别技术的音频文件管理方法和系统。目前的媒体播放器(如windows media player等)以及mp3播放器附带的随机软件(如iTune)等音频文件管理软件在获取音频文件信息时是基于音频文件本身附带的元数据(tag数据),无法保证音频文件元数据的正确性及完整性。为此,本发明提出了一种基于音频文件本身的音频特征识别的音频文件管理方法和系统,通过音频特征码算法为歌曲库中的每首歌曲计算音频特征码(音频特征码),利用音频特征码索引技术为所述音频特征码建立数据库,提供音频文件识别检索服务。所述系统在客户端扫描本地歌曲文件,以音频特征码识别技术为基础,实现音频文件分类整理,本地专辑补全等管理功能,使得用户能够实现对音频文件科学有序的管理。

Description

一种基于音频特征码识别技术的音频文件管理方法和系统
技术领域:
本发明涉及一种计算机音频文件管理技术和系统,尤其涉及到一种计算机音频文件音频特征码识别技术以及基于音频特征识别技术的音频文件管理方法和系统。
背景技术:
随着mp3等计算机数字音频文件的流行,如何在个人计算机上有效的管理成百上千的音频文件成为了一个亟待解决的问题。目前,一些媒体播放器(例如windows media player等)以及一些mp3播放器附带的随机软件(如iTune)等实现了一些音频文件分类管理功能,但是,上述这些音频文件管理软件在获取音频文件信息时是基于音频文件本身附带的元数据(tag数据),tag数据无法保证正确性及完整性。
所以,我们提出了基于音频文件本身的音频特征识别的音频文件管理方法和系统,利用先进的音频特征码技术,更准确地识别音频文件,帮助用户管理数字音频文件。
发明内容
针对现有音频文件管理软件管理方法的局限性,提出更准确的识别用户的数字音频文件的方法,并在此基础上实现完善的音频文件管理功能。
为达到上述的发明目的,本发明采用的技术方案如下:
一种基于音频特征码识别技术的音频文件管理方法,包括以下步骤:
步骤一、于服务器端创建一套音频文件库MDB;
步骤二、为音频文件库MDB中的每首音频文件采用音频特征码算法计算音频特征码FP;
步骤三、把求出的所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;
步骤四、在服务器端根据接收到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;
步骤五、在客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;
步骤六、将扫描识别后的结果存储于本地音频文件库LMDB;
步骤七、在本地音频文件库LMDB的基础上进行音频文件分类,专辑补全等管理。
进一步,在步骤一中,所述音频文件库MDB中的每首歌曲均包含歌曲的部分音频信息,所述部分音频信息是包括采用不同压缩算法的歌曲文件mp3、wma片断或未经压缩的原始音频文件片断。
再进一步,步骤一中,所述音频文件库MDB中的每首歌曲包括音频文件元数据,所述音频文件元数据包括准确的歌手、专辑信息。
步骤二中,所述音频特征码算法步骤如下:
步骤21、将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;
步骤22、将音频文件的时域抽样分成n个重叠的帧Frame;
步骤23、对每个Frame的音频时域抽样进行傅立叶变换映射到频域;
步骤24、将频域数据分成m个频段后计算每个频段的能量值;
步骤25、对相邻帧的m个频段能量值进行比较,升高取1,降低取0从而生成一个包含m个二进制位的整数;
步骤26、对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到n个包含m个二进制位的整数,作为本歌曲的音频特征码FP。
步骤三中,所述音频特征码索引算法采用为歌曲音频特征码FP中的每个整数特征码建立HASH索引,并在HASH算法的基础上建立音频特征码数据库FPDB。在步骤(3)中,采用的算法是为歌曲FP中的每个整数特征码建立HASH索引,在HASH算法的基础上建立FPDB。
步骤四中,在FPDB的基础上,采用apache web server插件的方式运行音频文件检索识别服务程序。为了提高效率,采用了检索识别缓存服务(cache server)。
在步骤五和步骤六中,客户端程序扫描用户本地的磁盘,对扫描出的音频文件采用与步骤二中的音频特征码算法计算音频特征码FP,并通过HTTP协议发送到识别服务器进行音频文件识别,并将结果写入本地数据库LMDB。
在步骤七中,在本地音频文件库LMDB的基础上实现包括本地音频文件分类整理、本地音频文件查询、补全专辑、歌单管理、新歌下载管理的操作。
本发明还公开了一种基于音频特征码识别技术的音频文件管理系统,包括服务器端和客户端,其特征在于服务器端包括音频文件库MDB、音频特征码库FPDB、检索识别引擎和web服务器插件;客户端包括本地音频文件扫描单元、本地音频文件库LMDB和音频文件管理单元;
所述位于服务器端的音频文件库MDB中的音频文件经过音频特征码算法处理后传送至音频特征码库,经过检索识别服务器或检索识别缓存服务器的处理后,通过web服务器插件上载到web服务器,并最终传送至客户端经过本地音频文件扫描单元扫描后,经过本地音频文件库LMDB处理后由音频文件管理单元进行管理。
进一步,所述一种基于音频特征码识别技术的音频文件管理系统中;
所述检索识别引擎包括检索识别服务器和检索识别缓存服务器;
所述web服务器插件包括音频文件识别插件。
所述音频文件库MDB为Music DataBase;
所述音频特征码FP为FingerPring;
所述音频特征码数据库FPDB为FingerPringDataBase;
所述本地音频文件库LMDB为Local Music DataBase;
本发明的有益效果在于:
本发明通过先进的音频特征码检索识别技术,准确的识别音频文件,并在此基础上管理用户计算机上的数字音频文件,使用户电脑上的音频文件井井有条,给电脑音频文件爱好者带来了极大的便利。
附图说明:
附图1是本发明所述的一种基于音频特征码识别技术的音频文件管理
方法工作流程图;
附图2是本发明所述的一种基于音频特征码识别技术的音频文件管理方法中关于音频特征码算法的流程图;
附图3是本发明所述的一种基于音频特征码识别技术的音频文件管理系统的实施例。
具体实施方式:
附图1是本发明所述的一种基于音频特征码识别技术的音频文件管理方法工作流程图。本发明包括如下步骤:在流程101中,于服务器端创建一套音频文件库Music DataBase(简称MDB);进入流程102后,为音频文件库MDB中的每首音频文件执行采用音频特征码算法计算音频特征码FingerPring(简称FP);随后进入流程103,将所求出所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;在流程104中,于服务器端根据接受到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;105流程中,于客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;随后到流程106中,将扫描识别后的结果存储于本地音频文件库LMDB;最后进入流程107,在本地音频文件库LMDB的基础上进行音频文件分类、专辑补全等音频文件管理操作。
附图2是本发明所述的一种基于音频特征码识别技术的音频文件管理方法中关于音频特征码算法的流程图。所述音频特征码算法包括如下步骤:流程201中,将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;流程202中,将音频文件的时域抽样分成256个重叠的帧Frame;流程203中,对每个帧Frame的音频时域抽样进行傅立叶变换映射到频域;流程204中,将频域数据分成32个频段后计算每个频段的能量值,流程205中,对相邻帧的32个频段能量值进行比较,如果升高取1,降低则取0从而进入流程206生成一个包含32个二进制位的整数;最后,对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到256个包含32个二进制位的整数,作为本歌曲的音频特征码FP。
附图3是本发明所述的一种基于音频特征码识别技术的音频文件管理系统的实施例。如图所示,本发明所述系统包括服务器端1和客户端8,其特征在于,服务器端1包括音频文件库MDB 2、音频特征码库FPDB 3、音频文件检索识别引擎7以及音频文件识别插件6,本实施例中,所述音频文件检索识别引擎7还包括检索识别服务器4和检索识别缓存服务器5。所述检索识别服务器4用于执行音频特征码检索操作,所述检索识别缓存服务器5用于对音频文件进行缓存,提高检索性能。所述客户端8包括本地音频文件扫描单元11、本地音频文件库LMDB 9和音频文件管理单元10。所述服务器端1与客户端8之间采用HTTP协议通过互联网通讯。
所述检索识别服务器4用于执行音频特征码检索操作;
所述检索识别缓存服务器5用于对音频文件进行缓存,提高检索性能
所述Web服务器插件:负责接受用户检索请求,并转发给检索识别服务器4或检索识别缓存服务器5。
所述客户端8的音频文件管理系统主要由本机音频文件管理单元10执行,包括执行音频文件分类管理,曲库补全,热歌速递等功能。
本地音频文件扫描识别单元11扫描本地硬盘上的音频文件并访问检索识别服务,生成本地音频文件库,在本地音频文件库LMDB 9的基础上,实现本地音频文件分类整理,本地音频文件查询,补全专辑,歌单管理,新歌下载等多项管理功能。
上述具体实施例仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1、一种基于音频特征码识别技术的音频文件管理方法,包括以下步骤:
步骤一、于服务器端创建一套音频文件库MDB;
步骤二、为音频文件库MDB中的每首音频文件采用音频特征码算法计算音频特征码FP;
步骤三、把求出的所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;
步骤四、在服务器端根据接收到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;
步骤五、在客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;
步骤六、将扫描识别后的结果存储于本地音频文件库LMDB;
步骤七、在本地音频文件库LMDB的基础上进行音频文件分类,专辑补全等管理。
2、如权利要求2所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于,步骤一中,所述音频文件库MDB中的每首歌曲均包含歌曲的部分音频信息,所述部分音频信息是包括采用不同压缩算法的歌曲文件mp3、wma片断或未经压缩的原始音频文件片断。
3、如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:步骤一中,所述音频文件库MDB中的每首歌曲包括音频文件元数据,所述音频文件元数据包括准确的歌手、专辑信息。
4、如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:步骤二中,所述音频特征码算法步骤如下:
步骤21、将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;
步骤22、将音频文件的时域抽样分成n个重叠的帧Frame,;
步骤23、对每个Frame的音频时域抽样进行傅立叶变换映射到频域;
步骤24、将频域数据分成m个频段后计算每个频段的能量值;
步骤25、对相邻帧的m个频段能量值进行比较,升高取1,降低取0从而生成一个包含m个二进制位的整数;
步骤26、对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到n个包含m个二进制位的整数,作为本歌曲的音频特征码FP。
5、如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:步骤三中,所述音频特征码索引算法采用为歌曲音频特征码FP中的每个整数特征码建立HASH索引,并在HASH算法的基础上建立音频特征码数据库FPDB。
6、如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:步骤四中,在FPDB的基础上,采用apache web server插件的方式运行音频文件检索识别服务程序。
7、如权利要求1或6所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:采用检索识别缓存服务cache server。
8、如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:在步骤五和步骤六中,客户端程序扫描用户本地的磁盘,对扫描出的音频文件采用与步骤二中的音频特征码算法计算音频特征码FP,并通过HTTP协议发送到识别服务器进行音频文件识别,并将结果写入本地数据库LMDB。
9、如权利要求1、2、3、4、5、6或8所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于:在步骤七中,在本地音频文件库LMDB的基础上实现包括本地音频文件分类整理、本地音频文件查询、补全专辑、歌单管理、新歌下载管理的操作。
10、一种基于音频特征码识别技术的音频文件管理系统,包括服务器端和客户端,其特征在于服务器端包括音频文件库MDB、音频特征码库FPDB、检索识别引擎和web服务器插件;客户端包括本地音频文件扫描单元、本地音频文件库LMDB和音频文件管理单元;
所述位于服务器端的音频文件库MDB中的音频文件经过音频特征码算法处理后传送至音频特征码库,经过检索识别服务器或检索识别缓存服务器的处理后,通过web服务器插件上载到web服务器,并最终传送至客户端经过本地音频文件扫描单元扫描后,经过本地音频文件库LMDB处理后由音频文件管理单元进行管理。
11、一种基于音频特征码识别技术的音频文件管理系统,其特征在于,所述检索识别引擎包括检索识别服务器和检索识别缓存服务器。
12、一种基于音频特征码识别技术的音频文件管理系统,其特征在于,所述web服务器插件包括音频文件识别插件。
CN200610076396.3A 2006-04-24 2006-04-24 一种基于音频特征码识别技术的音频文件管理方法和系统 Active CN101063970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610076396.3A CN101063970B (zh) 2006-04-24 2006-04-24 一种基于音频特征码识别技术的音频文件管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610076396.3A CN101063970B (zh) 2006-04-24 2006-04-24 一种基于音频特征码识别技术的音频文件管理方法和系统

Publications (2)

Publication Number Publication Date
CN101063970A true CN101063970A (zh) 2007-10-31
CN101063970B CN101063970B (zh) 2014-03-26

Family

ID=38964995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610076396.3A Active CN101063970B (zh) 2006-04-24 2006-04-24 一种基于音频特征码识别技术的音频文件管理方法和系统

Country Status (1)

Country Link
CN (1) CN101063970B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222074A (zh) * 2010-04-16 2011-10-19 腾讯科技(深圳)有限公司 在线歌词数据匹配的方法、装置及后台数据装置
CN102236685A (zh) * 2010-05-07 2011-11-09 盛乐信息技术(上海)有限公司 一种基于音频指纹技术的本地音乐信息重获方法
CN101546323B (zh) * 2008-03-28 2012-05-30 北京华旗资讯数码科技有限公司 快速查找多媒体文件的索引系统及查找方法
CN103348334A (zh) * 2010-10-11 2013-10-09 Est软件公司 云系统以及在云系统中的文件压缩及传送方法
CN103987166A (zh) * 2014-05-09 2014-08-13 苏州乐聚一堂电子科技有限公司 卡拉ok自动识别灯光特效系统
CN104750706A (zh) * 2013-12-26 2015-07-01 贝壳网际(北京)安全技术有限公司 驱动程序信息的提供方法、装置和系统
CN105931634A (zh) * 2016-06-15 2016-09-07 腾讯科技(深圳)有限公司 音频筛选方法和装置
CN107844578A (zh) * 2017-11-10 2018-03-27 阿基米德(上海)传媒有限公司 一种识别音频流中重复片段方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185527B1 (en) * 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
KR100590185B1 (ko) * 1999-11-20 2006-06-14 삼성전자주식회사 부가정보를 포함하는 오디오/비디오데이터의 저장 및검색장치
CN1534515A (zh) * 2003-03-31 2004-10-06 乐金电子(惠州)有限公司 通过文字输入的音频文件检索装置以及检索方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546323B (zh) * 2008-03-28 2012-05-30 北京华旗资讯数码科技有限公司 快速查找多媒体文件的索引系统及查找方法
CN102222074A (zh) * 2010-04-16 2011-10-19 腾讯科技(深圳)有限公司 在线歌词数据匹配的方法、装置及后台数据装置
CN102236685A (zh) * 2010-05-07 2011-11-09 盛乐信息技术(上海)有限公司 一种基于音频指纹技术的本地音乐信息重获方法
CN103348334A (zh) * 2010-10-11 2013-10-09 Est软件公司 云系统以及在云系统中的文件压缩及传送方法
CN103348334B (zh) * 2010-10-11 2016-02-17 Est软件公司 云系统以及在云系统中的文件压缩及传送方法
CN104750706A (zh) * 2013-12-26 2015-07-01 贝壳网际(北京)安全技术有限公司 驱动程序信息的提供方法、装置和系统
CN104750706B (zh) * 2013-12-26 2019-06-04 北京猎豹移动科技有限公司 驱动程序信息的提供方法、装置和系统
CN103987166A (zh) * 2014-05-09 2014-08-13 苏州乐聚一堂电子科技有限公司 卡拉ok自动识别灯光特效系统
CN105931634A (zh) * 2016-06-15 2016-09-07 腾讯科技(深圳)有限公司 音频筛选方法和装置
CN105931634B (zh) * 2016-06-15 2018-09-21 腾讯科技(深圳)有限公司 音频筛选方法和装置
CN107844578A (zh) * 2017-11-10 2018-03-27 阿基米德(上海)传媒有限公司 一种识别音频流中重复片段方法及装置
CN107844578B (zh) * 2017-11-10 2021-08-13 阿基米德(上海)传媒有限公司 一种识别音频流中重复片段方法及装置

Also Published As

Publication number Publication date
CN101063970B (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN101063970A (zh) 一种基于音频特征码识别技术的音频文件管理方法和系统
US11036799B2 (en) Low RAM space, high-throughput persistent key value store using secondary memory
US8635211B2 (en) Trend analysis in content identification based on fingerprinting
US8112477B2 (en) Content identification for peer-to-peer content retrieval
US11762813B2 (en) Quality score compression apparatus and method for improving downstream accuracy
US7747581B1 (en) Network file system-based data storage system
CN108710639B (zh) 一种基于Ceph的海量小文件存取优化方法
Harichandran et al. Bytewise approximate matching: the good, the bad, and the unknown
Breitinger et al. A fuzzy hashing approach based on random sequences and hamming distance
US8634947B1 (en) System and method for identifying digital files
CN1708758A (zh) 改进的音频数据指纹搜索
CN1490736A (zh) 数据流标头对象保护
JP2003005771A (ja) デジタル信号内のオーディオコンテンツの認識装置
Chen et al. An efficient piecewise hashing method for computer forensics
Ali et al. A review of digital forensics methods for JPEG file carving
CN1691016A (zh) 用于在b树上重命名连续键的方法和系统
CN110569245A (zh) 重复数据删除系统中基于强化学习的指纹索引预取方法
US11475061B2 (en) Method and device for detecting duplicate content
Yang et al. A security carving approach for AVI video based on frame size and index
CN1680900A (zh) 许可创建装置、许可创建方法和计算机程序
CN1308840C (zh) 一种获取硬盘中数据的方法
CN1623289A (zh) 基于特征的音频内容识别
Yao et al. Audio identification by sampling sub-fingerprints and counting matches
White et al. Compressing DNA sequence databases with coil
CN101075308A (zh) 一种编辑电子邮件的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
DD01 Delivery of document by public notice

Addressee: Yeelion Online Network Technology (Beijing) Co., Ltd.

Document name: Notification of Decision on Request for Restoration of Right

DD01 Delivery of document by public notice

Addressee: Yeelion Online Network Technology (Beijing) Co., Ltd.

Document name: Notification of an Office Action

DD01 Delivery of document by public notice

Addressee: Yeelion Online Network Technology (Beijing) Co., Ltd.

Document name: Notification that Application Deemed to be Withdrawn

C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 100086, 8 floor, Crowne Plaza Hotel, Zhichun Road 106, Haidian District, Beijing, Beijing

Applicant after: Yeelion Online Network Technology (Beijing) Co., Ltd.

Address before: 100083 Beijing City, Haidian District Zhongguancun Road No. 18 building A block 1906 smartfortune

Applicant before: Yeelion Online Network Technology (Beijing) Co., Ltd.

GR01 Patent grant
GR01 Patent grant