CN103440305A - 音乐检索方法及装置 - Google Patents
音乐检索方法及装置 Download PDFInfo
- Publication number
- CN103440305A CN103440305A CN2013103696049A CN201310369604A CN103440305A CN 103440305 A CN103440305 A CN 103440305A CN 2013103696049 A CN2013103696049 A CN 2013103696049A CN 201310369604 A CN201310369604 A CN 201310369604A CN 103440305 A CN103440305 A CN 103440305A
- Authority
- CN
- China
- Prior art keywords
- melody
- audio
- frequency
- metamessage
- retrieving information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供了一种在服务器端检索音乐的方法和装置以及一种在终端设备中检索音乐的方法和装置。其中,一种在服务器端检索音乐的方法,包括:从终端设备中接收包含有检索信息的音乐检索请求;根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;将所述查找的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。采用本发明所述方法及装置不仅能够获得相同旋律的不同乐曲,还能够获得同一乐曲在不同年代的各个版本。
Description
技术领域
本申请涉及一种在服务器端检索音乐的方法和装置以及一种在终端设备中检索音乐的方法和装置,尤其涉及一种获得相同旋律乐曲的音乐检索技术。
背景技术
目前几乎所有的音乐网站都是通过检索乐曲名的方式在数据库中获得与所述乐曲名同名的乐曲信息;当没有与所述乐曲同名的乐曲时,则采用对所述乐曲名进行分词匹配的方式获得与所述分词相关的乐曲,这样检索出来的乐曲的旋律通常各不一样,而且也不能获得同一乐曲在不同年代的翻唱版本。
发明内容
本发明的目的在于提供一种在服务器端检索音乐的方法和装置以及一种在终端设备中检索音乐的方法和装置,以便检索出旋律相同的不同乐曲以及同一乐曲在不同年代的翻唱版本。
据本发明的一方面,提供一种在服务器端检索音乐的方法,所述包括:从终端设备中接收包含有检索信息的音乐检索请求;根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;将所述查找的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
优选地,所述基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息的步骤包括:从所述查找到的最相关的乐曲中提取两段音频数据;根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
优选地,所述音频特征为255个32位的音频指纹。
优选地,所述从所述查找到的最相关的乐曲中提取两段音频数据的步骤包括:通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
优选地,所述根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息的步骤包括:对所述曲库中的各个音频数据执行如下匹配处理:通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;确定所述计算的两个匹配分数是否都大于给定的阈值;如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
优选地,所述乐曲的元信息还包括各个乐曲对应的年代。
优选地,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
根据发明的另一方面,提供一种在服务器端检索音乐的装置,包括:请求接收单元,用于从终端设备中接收包含有检索信息的音乐检索请求;第一检索单元,用于根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;第二检索单元,用于基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;数据发送单元,用于将所述查找的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
优选地,所述第二检索单元包括:提取单元,用于从所述查找到的最相关的乐曲中提取两段音频数据;匹配单元,用于根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
优选地,所述音频特征为255个32位的音频指纹。
优选地,所述提取单元通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
优选地,所述匹配单元对所述曲库中的各个音频数据执行如下匹配处理:通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;确定所述计算的两个匹配分数是否都大于给定的阈值;如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
优选地,所述乐曲的元信息还包括各个乐曲对应的年代。
优选地,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
根据发明的另一方面,提供一种在终端设备中检索音乐的方法,包括:接收用户在所述终端设备中输入的检索信息;将包含有所述检索信息的音乐检索请求发送至服务器;从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
优选地,所述乐曲的元信息还包括各个乐曲对应的年代。
优选地,所述方法还包括:按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
优选地,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
根据发明的另一方面,提供一种在终端设备中检索音乐的装置,包括:用户接口单元,用于接收用户在所述终端设备中输入的检索信息;请求发送单元,用于将包含有所述检索信息的音乐检索请求发送至服务器;数据接收单元,用于从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
优选地,所述乐曲的元信息还包括各个乐曲对应的年代。
优选地,所述装置还包括:结果展现单元,用于按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
优选地,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
有益效果
与现有技术相比,本发明具有以下优点:本发明不仅能够检索出旋律相同的不同乐曲,而且能够检索出同一乐曲在不同年代的翻唱版本。另外,由于本发明是按照年代顺序对音乐检索结果进行排序和展现的,因此用户还能够查看到同一乐曲在各个年代的不同历史版本,可以更全面地了解所述乐曲的相关知识。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是示出根据本发明的示例性实施例的在服务器端中检索音乐的方法的流程图;
图2是示出根据本发明的示例性实施例的在终端设备中检索音乐的方法的流程图;
图3是示出根据本发明的示例性实施例的在服务器端中检索音乐的装置的结构框图;
图4是示出根据本发明的示例性实施例的在终端设备中检索音乐的装置的结构框图;
图5是示出根据本发明的示例性实施例的音频指纹匹配的示意图;
图6是示出根据本发明的示例性实施例的多版本音频识别的结构框图。
具体实施方式
以下,将参照附图来详细说明本发明的实施例。
本发明的构思是:首先根据用户输入的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;然后基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息。这种检索方式不仅可以检索出旋律相同的不同乐曲,而且还能够获得同一乐曲在不同年代的翻唱版本。
图1示出了本发明一种在服务器端检索音乐的方法的优选实施例的流程图。图3示出的一种在服务器端检索音乐的装置可用于实现图1中所述的方法。
参照图1,在步骤S110,所述装置从终端设备中接收包含有检索信息的音乐检索请求。
在步骤S120,所述装置根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲。
在步骤S130,所述装置基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
具体地,根据本发明的一个可选实施例,步骤S130具体可包括:所述装置从所述查找到的最相关的乐曲中提取两段音频数据;根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
需要说明的是,在本发明中,所述音频特征可采用节拍、旋律、基频以及速度不变性等各种可以表示音频旋律的特征,对此本发明不作具体的限制,由于音频指纹是一种常用的音频特征,且音频指纹又有很多种,下面以音频指纹为例,对本发明作进一步的说明,根据本发明的一个示例性实施例,所述音频特征为255个32位的音频指纹。
具体地,根据本发明所述音频特征为255个32位的音频指纹的示例性实施例,所述装置从所述查找到的最相关的乐曲中提取两段音频数据的具体步骤可包括:所述装置通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
可以看出,采用上述公式可以得到当前帧的相邻频带的能量变化和当前帧的前一帧的相同的相邻频带的能量变化,如果当前帧的相邻频带的能量变化大于当前帧的前一帧的相同的相邻频带的能量变化,即
E(n,m)-E(n,m+1)-(E(m-1,m)-E(n-1,m+1))>0,
则当前帧中相邻频带的前一个频带对应的数值为1;如果当前帧的相邻频带的能量变化小于等于当前帧的前一帧的相同的相邻频带的能量变化,即
E(n,m)-E(n,m+1)-(E(m-1,m)-E(n-1,m+1))≤0,
则当前帧中相邻频带的前一个频带对应的数值为0。以此类推,为当前帧中除最后一个频带以外的每个频带得到一个对应的数值,将每个频带对应的数值组合即可获得当前帧的音频指纹。具体可参看图5示出的某音频指纹匹配示意图。图中所示的每帧数据有33个频带,因此可提取32组相邻频带,对应的可得到32个数值,依据所述得到的32个数值组成音频指纹,该音频指纹是由1和0组成的32位的数据。同理,可采用前面所述方法对音频数据中的每一帧都进行处理,即可得到音频数据中的每一帧对应的一个音频指纹。由于在本发明中重建的音频指纹有256帧,因此可得到255个32位的音频指纹,所述装置依据所述提取的两段音频指纹在在所述曲库中进行匹配,从而得到匹配的音频数据。
具体地,根据本发明所述音频特征为255个32位的音频指纹的示例性实施例,所述装置根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息的具体步骤可包括:所述装置对所述曲库中的各个音频数据执行如下匹配处理:通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;确定所述计算的两个匹配分数是否都大于给定的阈值;如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
需要进一步说明的是,如果存在一组音频数据都是所述提取的音频指纹的音频数据,则取其中匹配分数最高的音频数据作为最终的识别结果。
由此可见,当采用其他不同的音频特征进行提取和匹配时,所述装置可以检索出一组旋律相同的不同乐曲,或者同一乐曲在不同年代的翻唱版本,具体还可参看图6示出的多版本音频识别的结构框图。
此外,为了向所述终端设备上的用户诠释同一首乐曲在不同年代的对应的版本及其音乐特点,根据本发明的一个优选实施例,所述乐曲的元信息还包括各个乐曲对应的年代。
在步骤S140,所述装置将所述查找到的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
所述终端设备接收到与所述检索信息相关的一组旋律相同的乐曲的元信息,将按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
图2示出了本发明一种在终端设备中检索音乐的方法的优选实施例的流程图。图4示出的一种在终端设备中检索音乐的装置可用于实现图2中所述的方法。
参照图2,在步骤S210,所述装置接收用户在所述终端设备中输入的检索信息。
在步骤S220,所述装置将包含有所述检索信息的音乐检索请求发送至服务器。
所述服务器从终端设备中接收包含有检索信息的音乐检索请求;根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;将所述查找到的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
在步骤S230,所述装置从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
为了向所述终端设备上的用户诠释同一首乐曲在不同年代的对应的版本及其音乐特点,根据本发明的一个优选实施例,所述乐曲的元信息还包括各个乐曲对应的年代。
根据本发明所述乐曲的元信息还包括各个乐曲对应的年代的优选实施例,在图2所示的实施例中,还包括:所述装置按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
图3示出了本发明一种在服务器端检索音乐的装置的优选实施例结构框图。
参照图3,所述装置至少请求接收单元301、第一检索单元302、第二检索单元303以及数据发送单元304。
其中,请求接收单元301,用于从终端设备中接收包含有检索信息的音乐检索请求。
第一检索单元302,用于根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲。
第二检索单元303,用于基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
数据发送单元304,用于将所述查找到的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
具体地,根据本发明的一个可选实施例,所述第二检索单元303具体可包括:提取单元(未示出),用于从所述查找到的最相关的乐曲中提取两段音频数据;匹配单元(未示出),用于根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
由于音频指纹是一种常用的音频特征,且音频指纹又有很多种,下面以音频指纹为例,对本发明作进一步的说明,根据本发明的一个示例性实施例,所述音频特征为255个32位的音频指纹。
具体地,根据本发明所述音频特征为255个32位的音频指纹的示例性实施例,所述提取单元(未示出)通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
具体地,根据本发明所述音频特征为255个32位的音频指纹的示例性实施例,所述匹配单元(未示出)对所述曲库中的各个音频数据执行如下匹配处理:通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;确定所述计算的两个匹配分数是否都大于给定的阈值;如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
为了向所述终端设备上的用户诠释同一首乐曲在不同年代的对应的版本及其音乐特点,根据本发明的一个优选实施例,所述乐曲的元信息还包括各个乐曲对应的年代。
图4示出了本发明一种在终端设备中检索音乐的装置的优选实施例结构框图。
参照图4,所述装置至少包括用户接口单元401、请求发送单元402以及数据接收单元403。
其中,用户接口单元401,用于接收用户在所述终端设备中输入的检索信息。
请求发送单元402,用于将包含有所述检索信息的音乐检索请求发送至服务器。
数据接收单元403,用于从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
为了向所述终端设备上的用户诠释同一首乐曲在不同年代的对应的版本及其音乐特点,根据本发明的一个优选实施,所述乐曲的元信息还包括各个乐曲对应的年代。
具体地,根据本发明所述乐曲的元信息还包括各个乐曲对应的年代的优选实施例,在图4所示的实施例中,还包括:结果展现单元(未示出),用于按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
另外,还需要说明的是,在上述各个实施例中,所述检索信息可以是用户输入的关键字、音频和哼唱旋律中的一个。
由此可见,与现有技术相比本发明不仅能够检索出旋律相同的不同乐曲,而且能够检索出同一乐曲在不同年代的翻唱版本。另外,由于本发明是按照年代顺序对音乐检索结果进行排序和展现的,因此用户还能够查看到同一乐曲在各个年代的不同版本,从而使得用户能够从多个角度了解所述乐曲。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或一组步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
尽管已参照优选实施例表示和描述了本发明,但本领域技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行各种修改和变换。
Claims (22)
1.一种在服务器端检索音乐的方法,包括:
从终端设备中接收包含有检索信息的音乐检索请求;
根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;
基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;
将所述查找到的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
2.如权利要求1所述的方法,其特征在于,所述基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息的步骤包括:
从所述查找到的最相关的乐曲中提取两段音频数据;
根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
3.如权利要求2所述的方法,其特征在于,所述音频特征为255个32位的音频指纹。
4.如权利要求3所述的方法,其特征在于,所述从所述查找到的最相关的乐曲中提取两段音频数据的步骤包括:
通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
5.如权利要求4所述的方法,其特征在于,所述根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息的步骤包括:
对所述曲库中的各个音频数据执行如下匹配处理:
通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;
确定所述计算的两个匹配分数是否都大于给定的阈值;
如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;
如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
6.如权利要求5所述的方法,其特征在于,其特征在于,所述乐曲的元信息还包括各个乐曲对应的年代。
7.如权利要求1~6任一项所述的方法,其特征在于,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
8.一种在服务器端检索音乐的装置,包括:
请求接收单元,用于从终端设备中接收包含有检索信息的音乐检索请求;
第一检索单元,用于根据所述接收到的检索信息,在曲库中查找出与所述检索信息最相关的乐曲;
第二检索单元,用于基于所述查找到的最相关的乐曲的音频特征,在所述曲库中查找出与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息;
数据发送单元,用于将所述查找到的与所述检索信息相关的一组旋律相同的乐曲的元信息发送至所述终端设备。
9.如权利要求8所述的装置,其特征在于,所述第二检索单元包括:
提取单元,用于从所述查找到的最相关的乐曲中提取两段音频数据;
匹配单元,用于根据所述提取的两段音频数据,从所述曲库中查找出与所述提取的两段音频数据都匹配的音频数据,并获取所述查找出的音频数据对应的乐曲的元信息。
10.如权利要求9所述的装置,其特征在于,所述音频特征为255个32位的音频指纹。
11.如权利要求10所述的装置,其特征在于,所述提取单元通过如下公式计算所述提取的两段音频数据的每一段音频特征对应的每一位音频指纹:
其中,所述F(n,m)表示音频数据中的第n帧的第m个频带对应的数值;所述E(n,m)-E(n,m+1)表示第n帧中第m个频带与第m+1个频带的能量变化;所述E(n-1,m)-E(n-1,m+1)表示第n-1帧中第m个频带与第m+1个频带的能量变化。
12.如权利要求11所述的装置,其特征在于,所述匹配单元对所述曲库中的各个音频数据执行如下匹配处理:
通过如下公式计算所述提取的两段音频数据的音频指纹与所述曲库中音频数据的音频指纹之间对应的两个匹配分数:
score=1-nomatchsum/(255×32)
其中,所述score表示所述提取的音频指纹与所述曲库的音频指纹的匹配分数;所述nomatchsum表示所述提取的音频指纹与所述曲库的音频指纹的不匹配总数;
确定所述计算的两个匹配分数是否都大于给定的阈值;
如果所述计算的两个匹配分数都大于给定的阈值,则确定所述提取的两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹相匹配,并获取与所述提取两段音频数据的音频指纹相匹配的所述曲库中的音频数据对应的乐曲的元信息;
如果所述计算的两个匹配分数中的任一个不大于给定的阈值,则确定所述提取两段音频数据的音频指纹与所述曲库中的音频数据的音频指纹不匹配。
13.如权利要求12所述的装置,其特征在于,其特征在于,所述乐曲的元信息还包括各个乐曲对应的年代。
14.如权利要求8~13任一项所述的装置,其特征在于,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
15.一种在终端设备中检索音乐的方法,包括:
接收用户在所述终端设备中输入的检索信息;
将包含有所述检索信息的音乐检索请求发送至服务器;
从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
16.如权利要求15所述的方法,其特征在于,所述乐曲的元信息还包括各个乐曲对应的年代。
17.如权利要求16所述的方法,还包括:
按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
18.如权利要求15~17任一项所述的方法,其特征在于,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
19.一种在终端设备中检索音乐的装置,包括:
用户接口单元,用于接收用户在所述终端设备中输入的检索信息;
请求发送单元,用于将包含有所述检索信息的音乐检索请求发送至服务器;
数据接收单元,用于从所述服务器接收与所述检索信息相关的一组旋律相同的乐曲的元信息,其中,所述乐曲的元信息包括各个乐曲对应的乐曲信息。
20.如权利要求19所述的装置,其特征在于,所述乐曲的元信息还包括各个乐曲对应的年代。
21.如权利要求20所述的装置,还包括:
结果展现单元,用于按照所述各个乐曲对应的年代顺序展现所述接收的与所述检索信息相关的一组旋律相同的乐曲的元信息。
22.如权利要求19~21任一项所述的装置,其特征在于,所述检索信息是用户输入的关键字、音频和哼唱旋律中的一个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103696049A CN103440305A (zh) | 2013-08-22 | 2013-08-22 | 音乐检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013103696049A CN103440305A (zh) | 2013-08-22 | 2013-08-22 | 音乐检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103440305A true CN103440305A (zh) | 2013-12-11 |
Family
ID=49693998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013103696049A Pending CN103440305A (zh) | 2013-08-22 | 2013-08-22 | 音乐检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103440305A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105280170A (zh) * | 2015-10-10 | 2016-01-27 | 北京百度网讯科技有限公司 | 一种乐谱演奏的方法和装置 |
CN106776977A (zh) * | 2016-12-06 | 2017-05-31 | 深圳前海勇艺达机器人有限公司 | 搜索音乐的方法及装置 |
CN106909608A (zh) * | 2017-01-09 | 2017-06-30 | 深圳前海勇艺达机器人有限公司 | 基于智能机器人的数据处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101651694A (zh) * | 2009-09-18 | 2010-02-17 | 北京亮点时间科技有限公司 | 提供音频相关信息的方法、系统、客户端及服务器 |
US20120114167A1 (en) * | 2005-11-07 | 2012-05-10 | Nanyang Technological University | Repeat clip identification in video data |
-
2013
- 2013-08-22 CN CN2013103696049A patent/CN103440305A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120114167A1 (en) * | 2005-11-07 | 2012-05-10 | Nanyang Technological University | Repeat clip identification in video data |
CN101651694A (zh) * | 2009-09-18 | 2010-02-17 | 北京亮点时间科技有限公司 | 提供音频相关信息的方法、系统、客户端及服务器 |
Non-Patent Citations (2)
Title |
---|
张敏等: "一种快速的特定音频指纹提取方法", 《计算机工程》, 31 January 2010 (2010-01-31), pages 211 - 213 * |
李伟等: "数字音频指纹技术综述", 《小型微型计算机系统》, 11 November 2008 (2008-11-11) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105280170A (zh) * | 2015-10-10 | 2016-01-27 | 北京百度网讯科技有限公司 | 一种乐谱演奏的方法和装置 |
CN106776977A (zh) * | 2016-12-06 | 2017-05-31 | 深圳前海勇艺达机器人有限公司 | 搜索音乐的方法及装置 |
CN106909608A (zh) * | 2017-01-09 | 2017-06-30 | 深圳前海勇艺达机器人有限公司 | 基于智能机器人的数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103138862B (zh) | 创建表示媒体的签名的装置和方法 | |
EP2234024B1 (en) | Context based video finder | |
EP2791935B1 (en) | Low complexity repetition detection in media data | |
CN109145110B (zh) | 标签查询方法和装置 | |
CN111831911B (zh) | 查询信息的处理方法、装置、存储介质和电子装置 | |
US11556587B2 (en) | Audio matching | |
CN103548076A (zh) | 利用音频信号来识别内容的装置和方法 | |
US9659092B2 (en) | Music information searching method and apparatus thereof | |
KR100676863B1 (ko) | 음악 검색 서비스 제공 시스템 및 방법 | |
CN101014953A (zh) | 音频指纹识别系统和方法 | |
CN101651694A (zh) | 提供音频相关信息的方法、系统、客户端及服务器 | |
US20160005412A1 (en) | Generation of a signature of a musical audio signal | |
CN109117622B (zh) | 一种基于音频指纹的身份认证方法 | |
CN102236685A (zh) | 一种基于音频指纹技术的本地音乐信息重获方法 | |
CN103440305A (zh) | 音乐检索方法及装置 | |
US20060253433A1 (en) | Method and apparatus for knowledge-based music searching and method and apparatus for managing music file | |
CN104915403A (zh) | 一种信息处理方法及服务器 | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
KR100916310B1 (ko) | 오디오 신호처리 기반의 음악 및 동영상간의 교차 추천 시스템 및 방법 | |
JP2013068884A (ja) | ハッシュ関数生成方法、ハッシュ値演算方法、ハッシュ関数生成装置、ハッシュ値演算装置、ハッシュ関数生成プログラム及びハッシュ値演算プログラム | |
CN102214219B (zh) | 音视频内容检索系统及其方法 | |
CN103294696A (zh) | 音视频内容检索方法及系统 | |
CN111198965B (zh) | 一种歌曲检索方法、装置、服务器及存储介质 | |
CN111737523B (zh) | 一种视频标签、搜索内容的生成方法及服务器 | |
Kim et al. | Quick audio retrieval using multiple feature vectors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160615 Address after: 100027 Haidian District, Qinghe Qinghe East Road, No. 23, building two, floor 2108, No., No. 18 Applicant after: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd. Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20131211 |
|
RJ01 | Rejection of invention patent application after publication |