CN106776977A - 搜索音乐的方法及装置 - Google Patents

搜索音乐的方法及装置 Download PDF

Info

Publication number
CN106776977A
CN106776977A CN201611108236.2A CN201611108236A CN106776977A CN 106776977 A CN106776977 A CN 106776977A CN 201611108236 A CN201611108236 A CN 201611108236A CN 106776977 A CN106776977 A CN 106776977A
Authority
CN
China
Prior art keywords
audio
information
frequency
search
frequency fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611108236.2A
Other languages
English (en)
Inventor
孙艺斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Yyd Robot Co Ltd
Original Assignee
Shenzhen Qianhai Yyd Robot Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Yyd Robot Co Ltd filed Critical Shenzhen Qianhai Yyd Robot Co Ltd
Priority to CN201611108236.2A priority Critical patent/CN106776977A/zh
Publication of CN106776977A publication Critical patent/CN106776977A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明提供了一种搜索音乐的方法及装置,方法包括:智能终端可对接收到的用户输入的音频信息进行音频指纹信息的提取,再将提取到的音频指纹信息发送至服务器,然后接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示;相应的,服务器可接收智能终端发送的音频指纹信息,再根据接收到的音频指纹信息在预置的数据库中进行搜索,然后获取搜索结果中包含的搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。以此,更便于用户操作,且可提高搜索的准确率及搜索效率,此外,就服务器的角度而言,无需再通过人工进行音乐资源的分类标注工作,可大大节省人力物力成本。

Description

搜索音乐的方法及装置
技术领域
本发明涉及互联网领域,特别地,涉及一种搜索音乐的方法及装置。
背景技术
随着生活水平的不断提高和互联网技术的飞速发展,从互联网中获取音乐资源已经越来越普遍的应用于人们的日常生活中。现有从互联网中获取音乐资源,通常为用户通过使用智能终端进入音乐相关的网站等,通过手动输入与音乐相关的关键字(比如歌曲名称、演唱者、所属专辑名称、年代,等等)等文本后,向该网站的服务器提出搜索请求,该服务器则可根据用户输入的关键字等文本从其存储的音乐资源中进行搜索,并将搜索结果反馈给智能终端,以便智能终端向用户展示搜索结果,用户则可对展示出的音乐信息进行播放、下载等操作。
在上述现有方案中,存在以下问题,一方面,通过手动输入关键词等文本的方式进行搜索,对用户掌握与音乐相关信息的要求比较高,在用户不知道或者不能准确记得与音乐相关的信息(比如歌曲名称、演唱者等信息)时,则无法进行音乐搜索或者搜索结果不理想,因此,上述搜索方式的搜索效果不理想且搜索效率不高,不能灵活的满足用户需求;另一方面,对于服务器端而言,针对现有搜索音乐的方式,在存储音乐资源时,需要人工将音乐资源进行分类标注(比如,歌曲名称、所属专辑名称、年代,等等),由于服务器中日益增多的音乐资源数量,人工分类标注的工作量非常大,需要消耗大量的人力物力。
发明内容
本发明提供了一种搜索音乐的方法及装置,可提高音乐搜索的效率及准确率,更方便用户进行音乐搜索,且无需在服务器中进行人工分类标注工作,降低了人力物力成本。
为实现上述目的,本发明提出了一种搜索音乐的方法,应用于智能终端,所述方法包括:
接收用户输入的音频信息;
对所述音频信息中的音频指纹信息进行提取;
将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端;
接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
可选的,对所述音频信息中的音频指纹信息进行提取,包括:
对音频信息进行预处理以获得对应的对数语谱图;
对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为所述音频信息对应的音频指纹信息。
可选的,对音频信息进行预处理以获得对应的对数语谱图,包括:
提取音频信息中的脉冲编码调制信号;
对所述脉冲编码调制信号进行分窗加帧处理;
对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
可选的,所述搜索结果信息为预置格式的搜索结果信息;
接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示,包括:
对服务器返回的预置格式的搜索结果信息进行解析以获得对应的搜索结果;
对所述搜索结果进行显示。
本发明还提出了一种搜索音乐的方法,应用于服务器,所述方法包括:
接收智能终端发送的音频指纹信息;
根据接收到的音频指纹信息在预置的数据库中进行搜索;
获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
可选的,预置的数据库中包括音乐数据库,所述音乐数据库的的建立过程,包括:
搜索互联网中的音乐资源,并对搜索到的音乐资源进行下载;
提取所述音乐资源中每个音频文件的描述信息;
建立音频文件及描述信息的第一对应关系表。
可选的,预置的数据库中包括音频指纹数据库,所述音频指纹数据库的建立过程,包括:
对音乐数据中的每个音频文件进行提取音频指纹信息的处理;
使用局部敏感哈希算法对提取到的音频指纹信息进行计算,以得到每个音频指纹信息对应的第一索引信息;
建立音频文件、音频指纹信息及第一索引信息的第二对应关系表。
可选的,对音乐数据中的每个音频文件进行提取音频指纹信息的处理,包括:
对每个音频文件进行预处理以获得对应的对数语谱图;
对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为每个音频文件对应的音频指纹信息。
可选的,对每个音频文件进行预处理以获得对应的对数语谱图,包括:
提取音频文件中的脉冲编码调制信号;
对所述脉冲编码调制信号进行分窗加帧处理;
对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
可选的,将接收到的音频指纹信息在预置的数据库中进行搜索,包括:
使用局部敏感哈希算法对接收到的音频指纹信息进行计算,以得到音频指纹信息对应的第二索引信息;
根据第二索引信息在第二对应关系表中进行搜索;
若第二索引信息与第二对应关系表中任一第一索引信息达到预置匹配度,则将该第一索引信息对应的音频文件作为目标音频文件。
可选的,获取搜索结果信息并发送至智能终端,包括:
根据第一对应关系表,获取搜索到的目标音频文件对应的描述信息,以作为搜索结果信息;
将所述搜索结果信息以预置格式发送至智能终端。
相应的,本发明提出了一种搜索音乐的装置,设置于智能终端中,所述装置包括:
第一接收单元,用于接收用户输入的音频信息;
提取单元,用于对所述音频信息中的音频指纹信息进行提取;
第一发送单元,用于将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端;
第二接收单元,用于接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
本发明还提出了一种搜索音乐的装置,设置于服务器中,所述装置包括:
第三接收单元,用于接收智能终端发送的音频指纹信息;
搜索单元,用于根据接收到的音频指纹信息在预置的数据库中进行搜索;
第二发送单元,用于获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
本发明实施例提供了一种搜索音乐的方法及装置,智能终端可对接收到的用户输入的音频信息进行音频指纹信息的提取,再将提取到的音频指纹信息发送至服务器,然后接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示;相应的,服务器可接收智能终端发送的音频指纹信息,再根据接收到的音频指纹信息在预置的数据库中进行搜索,然后获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。以此,可区别于现有人工输入文本进行音乐搜索的方式,解决用户在不知道或不能清楚记得与音乐相关信息的情况下,而无法搜索或搜索效果不理想的问题,基于通过哼唱或播放的音频信息进行音乐搜索,搜索方式更为灵活及人性化,更便于用户操作,且可提高搜索的准确率及搜索效率,提升用户体验。此外,就服务器的角度而言,无需再通过人工进行音乐资源的分类标注工作,可大大节省人力物力成本。
附图说明
图1是本发明实施例提供的搜索音乐的第一方法流程图;
图2是本发明实施例供的搜索音乐的第一方法中的界面示意图;
图3是本发明实施例提供的搜索音乐的第二方法流程图;
图4是本发明实施例提供的搜索音乐的第一装置示意图;
图5是本发明实施例提供的搜索音乐的第二装置示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
首先需要说明的是,涉及到的实体可包括智能终端及其对应的服务器(比如,可用于保存音乐资源、与音乐资源相关的信息,等等),各实体之间相互独立又相互配合,下面将对具体的实现方式进行详细介绍。
实施例一
参见图1,该实施例一首先从智能终端的角度,提供了一种搜索音乐的方法。
在本实施例中,所述智能终端可包括智能机器人、智能手机、PAD等。
所述方法可以包括如下步骤:
S101,接收用户输入的音频信息。
在具体实现时,本发明实施例中的方案可对应为一个用于搜索音乐的应用(比如,名为“音乐搜索”的APP),在该应用中,可提供用于输入音频信息的操作界面11,在该操作界面11中,可提供多个操作选项,比如,用于启动接收音频信息的第一操作选项12(如,“开始”按钮)、用于停止接收音频信息的第二操作选项13(如,“结束”按钮),等等。
比如,当用户听到一首很喜欢的歌曲,能够记住该歌曲的某段旋律或者能够通过其他终端录制该歌曲的某段旋律,但又不知道该歌曲的任何信息时,则可进入操作界面11后,点击该第一操作选项12,智能终端即可开始接收用户输入的音频信息,此时用户则可对着该智能终端哼唱听到歌曲的旋律或者使用其他终端播放之前录制的歌曲旋律等,在实际应用中,可将接收音频信息的时长控制在一个预置时长内(比如10秒),当用户哼唱或者播放的时间达到预置时长后,则可点击该第二操作选项13,此时则可停止接收音频信息,并将接收到的音频信息进行存储,比如可存储智能终端的存储卡中。
以此,可利用人们对音乐的感知,以自然哼唱的语音作为音频信息进行输入,或者以播放录制的语音作为音频信息进行输入,可更符合人们的生活习性,更人性化,且更方便用于操作。
S102,对所述音频信息中的音频指纹信息进行提取。
在具体实现时,可先对音频信息进行预处理以获得对应的对数语谱图。
在本实施例中,该预处理的过程,可为先提取音频信息中的脉冲编码调制 (PCM,Pulse Code Modulation)信号,再对所述PCM信号进行分窗加帧处理,即每次只处理分窗中的数据,然后对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到音频信息的对数语谱图。
接下来,可对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换,然后选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以将该二进制指纹序列作为所述音频信息对应的音频指纹信息。
其中,经过哈尔小波变换后的对数语谱图会变得不耐噪,且会有所退化,因为图像的主要表现部分是低频区域,所以不用整个小波而是选择top-t个小波系数来对图像进行表示,也就是舍弃其高频区域保留低频区域。由于t取200时具有较好的保真性,所以top小波系数(t)值选取为200,即top-200中的小波系数,为正值的就用二进制的10表示,为负值的就用二进制的01表示,其余不在top-200中的就用二进制的00来表示。
以此,可基于音频信息自身的特征(也即音频指纹信息),作为后续搜索处理的基础,与基于文本输入的搜索,可具有更高的搜索准确率及搜索效率。
S103,将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端。
在将音频信息中的音频指纹信息提取出来之后,可将提取到的音频指纹信息发送至服务器,在本实施例中,比如可通过socket通信将提取到的音频指纹信息发送至服务器,需要说明的是,对于此处的通信方式,本实施例仅为举例说明而并非做任何限制。
服务器在接收到智能终端发送的音频指纹信息后,可根据接收到的音频指纹信息在预置的数据库中进行搜索。
在具体实现时,预置的数据库中可包括预先建立的音乐数据库及音频指纹数据库。
所述音乐数据库的的建立过程,可为:通过网页分析器(Jsoup)技术自动搜索互联网中的音乐资源,使用音乐网站提供的开源下接口对搜索到的音乐资源进行下载并保存,然后对音乐资源中每个音频文件的描述信息进行提取,并根据提取结果,建立音频文件与描述信息之间的对应关系表并保存,在本实施例中,可将该对应关系表称为第一对应关系表。其中,音频文件的描述信息可包 括:演唱者名称、所述专辑名称、音频文件名称、发行年份、音频文件的时长中的一种或几种。
也即,所述音乐数据库中可包括音乐资源、第一对应关系表。
在本实施例中,第一对应关系表可以如下表1的形式存储于音乐数据库中。
音频文件 描述信息
0001 AAAAA
0002 BBBBB
…… ……
表1
所述音频指纹数据库的建立过程,可为:对音乐数据库中的每个音频文件进行提取音频指纹信息的处理。
在具体实现时,可先对每个音频文件进行预处理以获得对应的对数语谱图。
在本实施例中,该预处理的过程,可为先提取音频文件中的脉冲编码调制(PCM,Pulse Code Modulation)信号,再对所述PCM信号进行分窗加帧处理,即每次只处理分窗中的数据,然后对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到音频文件的对数语谱图。
接下来,可对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换,然后选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以将该二进制指纹序列作为所述音频文件对应的音频指纹信息并保存。
然后,使用局部敏感哈希算法(LSH,Local ity Sensit ive Hashing)对提取到的音频指纹信息进行计算,以得到每个音频指纹信息对应的索引信息,在本实施例中,可将此步骤得到的每个音频指纹信息对应的索引信息称为第一索引信息,该第一索引信息中可包括索引号、子指纹等,以便于在搜索音乐的过程中实现对音频指纹信息的快速匹配,提高音频指纹信息匹配的效率。
接下来,可建立音频文件、音频指纹信息、第一索引信息之间的对应关系表并保存,在本实施例中,该对应关系表可称为第二对应关系表。
也即,所述音频指纹数据库中可包括音乐数据库中每个音频文件的音频指纹信息、第二对应关系表。
在本实施例中,第二对应关系表可以如下表2的形式存储于音频指纹数据库中。
音频文件 音频指纹信息 第一索引信息
0001 AAAAA aaaa
0002 BBBBB bbbb
…… ……
表2
基于上述音乐数据库及音频指纹数据库,将接收到的音频指纹信息在预置的数据库中进行搜索的过程,则可为如下:
首先,使用局部敏感哈希算法(LSH,Locality Sensitive Hashing)对接收到的音频指纹信息进行计算,以得到音频指纹信息对应的索引信息,为了与上述第一索引信息进行区分,在本实施例中,可将此步骤得到的索引信息称为第二索引信息。
然后,根据第二索引信息在第二对应关系表中进行搜索,若第二索引信息与第二对应关系表中任一第一索引信息达到预置匹配度,该预置匹配度可根据实际需要进行设置(比如,预置匹配程度为85%以上等),则可将该第一索引信息对应的音频文件作为目标音频文件。
若第二索引信息与第二对应关系表中所有第一索引信息的匹配度均低于预置匹配度,则可认为没有匹配到音频指纹信息,则为搜索失败,即搜索结果为“空”。
在搜索到目标音频文件的情况下,可进一步根据第一对应关系表,获取目标音频文件对应的描述信息以作为搜索结果信息,然后可将所述搜索结果信息组织成预置格式的信息(比如可为JSON格式,XML格式,等等)发送至智能终端;在搜索结果为“空”的情况下,可将预置的表示“搜索失败”的信息发送至智能终端。
S104,接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
在具体实现时,智能终端接收到的服务器返回的搜索结果信息可能为预置 格式的搜索结果信息,也可能是预置的表示“搜索失败”的信息。在搜索结果信息为预置格式的搜索结果信息的情况下,可通过预置的解析对象对所述搜索结果信息进行解析,以获得对应的搜索结果,也即音频文件的描述信息(比如,可为演唱者名称、所述专辑名称、音频文件名称、发行年份、音频文件的时长中的一种或几种。
然后,对上述解析得到的描述信息或“搜索失败”的信息进行显示。
实施例二
该实施例二是与实施例一相对应的服务器端的实现方式,参见图3,该实施例二从服务器的角度提供了一种搜索音乐的方法,该方法可以包括以下步骤:
S201,接收智能终端发送的音频指纹信息。
S202,根据接收到的音频指纹信息在预置的数据库中进行搜索。
其中,预置的数据库中可包括音乐数据库和音频指纹数据库。
其中,所述音乐数据库的的建立过程,可包括:
搜索互联网中的音乐资源,并对搜索到的音乐资源进行下载;
提取所述音乐资源中每个音频文件的描述信息;
建立音频文件及描述信息的第一对应关系表。
其中,预置的数据库中包括音频指纹数据库,所述音频指纹数据库的建立过程,可包括:
对音乐数据中的每个音频文件进行提取音频指纹信息的处理;
使用局部敏感哈希算法对提取到的音频指纹信息进行计算,以得到每个音频指纹信息对应的第一索引信息;
建立音频文件、音频指纹信息及第一索引信息的第二对应关系表。
在具体实现时,对音乐数据中的每个音频文件进行提取音频指纹信息的处理,包括:
首先,对每个音频文件进行预处理以获得对应的对数语谱图。
其中,该预处理的过程,可包括:提取音频文件中的脉冲编码调制信号;对所述脉冲编码调制信号进行分窗加帧处理;对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
然后,对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变 换。
接下来,选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为每个音频文件对应的音频指纹信息。
基于上述音乐数据库及音频指纹数据库,将接收到的音频指纹信息在预置的数据库中进行搜索,具体可包括:
使用局部敏感哈希算法对接收到的音频指纹信息进行计算,以得到音频指纹信息对应的第二索引信息;
根据第二索引信息在第二对应关系表中进行搜索;
若第二索引信息与第二对应关系表中任一第一索引信息达到预置匹配度,则将该第一索引信息对应的音频文件作为目标音频文件。
S203,获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
在实际应用中,可根据第一对应关系表,获取目标音频文件对应的描述信息,以作为搜索结果信息,然后将所述搜索结果信息以预置格式发送至智能终端。
由于实施例二与实施例一是相对应的,因此,相关的具体实现可以参见实施例一中的介绍,这里不再赘述。
本发明实施例提供了一种搜索音乐的方法,智能终端可对接收到的用户输入的音频信息进行音频指纹信息的提取,再将提取到的音频指纹信息发送至服务器,然后接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示;相应的,服务器可接收智能终端发送的音频指纹信息,再根据接收到的音频指纹信息在预置的数据库中进行搜索,然后获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。以此,可区别于现有人工输入文本进行音乐搜索的方式,解决用户在不知道或不能清楚记得与音乐相关信息的情况下,而无法搜索或搜索效果不理想的问题,基于通过哼唱或播放的音频信息进行音乐搜索,搜索方式更为灵活及人性化,更便于用户操作,且可提高搜索的准确率及搜索效率,提升用户体验。此外,就服务器的角度而言,无需再通过人工进行音乐资源的分类标注工作,可大大节省人力物力成本。
与前述实施例一中提供的搜索音乐的方法相对应,本申请实施例还提供了一种搜索音乐的装置。
在本实施例中,所述装置可设置于智能终端中,所述智能终端可为智能机器人、智能手机、PAD等。
查看图4,所述装置可以包括:
第一接收单元41,可用于接收用户输入的音频信息。
提取单元42,可用于对所述音频信息中的音频指纹信息进行提取。
所述提取单元42,可具体用于:
对音频信息进行预处理以获得对应的对数语谱图;
对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为所述音频信息对应的音频指纹信息。
其中,对音频信息进行预处理以获得对应的对数语谱图,可包括:
提取音频信息中的脉冲编码调制信号;
对所述脉冲编码调制信号进行分窗加帧处理;
对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
第一发送单元43,可用于将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端。
第二接收单元44,可用于接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
在实际应用中,所述搜索结果信息可为预置格式的搜索结果信息,基于此,所述第二接收单元44,可具体用于:
对服务器返回的预置格式的搜索结果信息进行解析以获得对应的搜索结果,并对所述搜索结果进行显示。
与前述实施例二中提供的搜索音乐的方法相对应,本申请实施例还提供了一种搜索音乐的装置。
在本实施例中,所述装置可设置于服务器中,所述智能终端可为智能机器人、智能手机、PAD等。
参看图5,所述装置可以包括:
第三接收单元51,可用于接收智能终端发送的音频指纹信息。
搜索单元52,可用于根据接收到的音频指纹信息在预置的数据库中进行搜索。
其中,预置的数据库中包括音乐数据库,所述音乐数据库的的建立过程,可包括:
搜索互联网中的音乐资源,并对搜索到的音乐资源进行下载;
提取所述音乐资源中每个音频文件的描述信息;
建立音频文件及音描述信息的第一对应关系表。
其中,预置的数据库中包括音频指纹数据库,所述音频指纹数据库的建立过程,可包括:
对音乐数据中的每个音频文件进行提取音频指纹信息的处理;
使用局部敏感哈希算法对提取到的音频指纹信息进行计算,以得到每个音频指纹信息对应的第一索引信息;
建立音频文件、音频指纹信息及第一索引信息的第二对应关系表
在实际应用中,对音乐数据中的每个音频文件进行提取音频指纹信息的处理,可包括:
首先,对每个音频文件进行预处理以获得对应的对数语谱图。
其中,所述预处理过程,可包括:提取音频文件中的脉冲编码调制信号;对所述脉冲编码调制信号进行分窗加帧处理;对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
然后,对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
接下来,选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为每个音频文件对应的音频指纹信息。
基于上述音乐数据库和音频指纹数据库,所述搜索单元52,可具体用于:
使用局部敏感哈希算法对接收到的音频指纹信息进行计算,以得到音频指纹信息对应的第二索引信息;
根据第二索引信息在第二对应关系表中进行搜索;
若第二索引信息与第二对应关系表中任一第一索引信息达到预置匹配度, 则将该第一索引信息对应的音频文件作为搜索结果。
第二发送单元53,可用于获取搜索结果中包含的搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
在具体实现时,所述第二发送单元53,可具体用于:
根据第一对应关系表,获取搜索结果中音频文件对应的描述信息,以作为搜索结果信息;
将所述搜索结果信息以预置格式发送至智能终端。
本发明实施例提供了一种搜索音乐的装置,智能终端可对接收到的用户输入的音频信息进行音频指纹信息的提取,再将提取到的音频指纹信息发送至服务器,然后接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示;相应的,服务器可接收智能终端发送的音频指纹信息,再根据接收到的音频指纹信息在预置的数据库中进行搜索,然后获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。以此,可区别于现有人工输入文本进行音乐搜索的方式,解决用户在不知道或不能清楚记得与音乐相关信息的情况下,而无法搜索或搜索效果不理想的问题,基于通过哼唱或播放的音频信息进行音乐搜索,搜索方式更为灵活及人性化,更便于用户操作,且可提高搜索的准确率及搜索效率,提升用户体验。此外,就服务器的角度而言,无需再通过人工进行音乐资源的分类标注工作,可大大节省人力物力成本。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本发明实施例提供的搜索音乐的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种搜索音乐的方法,其特征在于,应用于智能终端,所述方法包括:
接收用户输入的音频信息;
对所述音频信息中的音频指纹信息进行提取;
将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端;
接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
2.根据权利要求1所述的方法,其特征在于,对所述音频信息中的音频指纹信息进行提取,包括:
对音频信息进行预处理以获得对应的对数语谱图;
对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为所述音频信息对应的音频指纹信息。
3.根据权利要求2所述的方法,其特征在于,对音频信息进行预处理以获得对应的对数语谱图,包括:
提取音频信息中的脉冲编码调制信号;
对所述脉冲编码调制信号进行分窗加帧处理;
对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
4.根据权利要求1所述的方法,其特征在于,所述搜索结果信息为预置格式的搜索结果信息;
接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示,包括:
对服务器返回的预置格式的搜索结果信息进行解析以获得对应的搜索结果;
对所述搜索结果进行显示。
5.一种搜索音乐的方法,其特征在于,应用于服务器,所述方法包括:
接收智能终端发送的音频指纹信息;
根据接收到的音频指纹信息在预置的数据库中进行搜索;
获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
6.根据权利要求5所述的方法,其特征在于,预置的数据库中包括音乐数据库,所述音乐数据库的的建立过程,包括:
搜索互联网中的音乐资源,并对搜索到的音乐资源进行下载;
提取所述音乐资源中每个音频文件的描述信息;
建立音频文件及描述信息的第一对应关系表。
7.根据权利要求6所述的方法,其特征在于,预置的数据库中包括音频指纹数据库,所述音频指纹数据库的建立过程,包括:
对音乐数据中的每个音频文件进行提取音频指纹信息的处理;
使用局部敏感哈希算法对提取到的音频指纹信息进行计算,以得到每个音频指纹信息对应的第一索引信息;
建立音频文件、音频指纹信息及第一索引信息的第二对应关系表。
8.根据权利要求7所述的方法,其特征在于,对音乐数据中的每个音频文件进行提取音频指纹信息的处理,包括:
对每个音频文件进行预处理以获得对应的对数语谱图;
对对数语谱图进行分割,并对分割后的对数语谱图进行哈尔小波变换;
选取TOP小波系数并将所述TOP小波系数转换为二进制指纹序列,以作为每个音频文件对应的音频指纹信息。
9.根据权利要求8所述的方法,其特征在于,对每个音频文件进行预处理以获得对应的对数语谱图,包括:
提取音频文件中的脉冲编码调制信号;
对所述脉冲编码调制信号进行分窗加帧处理;
对分窗加帧处理后的数据进行傅里叶变换及对数变换,以得到对数语谱图。
10.根据权利要求7所述的方法,其特征在于,将接收到的音频指纹信息在预置的数据库中进行搜索,包括:
使用局部敏感哈希算法对接收到的音频指纹信息进行计算,以得到音频指纹信息对应的第二索引信息;
根据第二索引信息在第二对应关系表中进行搜索;
若第二索引信息与第二对应关系表中任一第一索引信息达到预置匹配度,则将该第一索引信息对应的音频文件作为目标音频文件。
11.根据权利要求10所述的方法,其特征在于,获取搜索结果信息并发送至智能终端,包括:
根据第一对应关系表,获取搜索到的目标音频文件对应的描述信息,以作为搜索结果信息;
将所述搜索结果信息以预置格式发送至智能终端。
12.一种搜索音乐的装置,其特征在于,设置于智能终端中,所述装置包括:
第一接收单元,用于接收用户输入的音频信息;
提取单元,用于对所述音频信息中的音频指纹信息进行提取;
第一发送单元,用于将提取到的音频指纹信息发送至服务器,以便服务器根据接收到的音频指纹信息进行搜索并将搜索结果信息返回所述智能终端;
第二接收单元,用于接收服务器返回的搜索结果信息,并对所述搜索结果信息对应的搜索结果进行显示。
13.一种搜索音乐的装置,其特征在于,设置于服务器中,所述装置包括:
第三接收单元,用于接收智能终端发送的音频指纹信息;
搜索单元,用于根据接收到的音频指纹信息在预置的数据库中进行搜索;
第二发送单元,用于获取搜索结果信息并发送至智能终端,以便智能终端根据所述搜索结果信息对搜索结果进行显示。
CN201611108236.2A 2016-12-06 2016-12-06 搜索音乐的方法及装置 Pending CN106776977A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611108236.2A CN106776977A (zh) 2016-12-06 2016-12-06 搜索音乐的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611108236.2A CN106776977A (zh) 2016-12-06 2016-12-06 搜索音乐的方法及装置

Publications (1)

Publication Number Publication Date
CN106776977A true CN106776977A (zh) 2017-05-31

Family

ID=58878995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611108236.2A Pending CN106776977A (zh) 2016-12-06 2016-12-06 搜索音乐的方法及装置

Country Status (1)

Country Link
CN (1) CN106776977A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172241A (zh) * 2017-12-27 2018-06-15 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN109726307A (zh) * 2018-12-26 2019-05-07 合肥凯捷技术有限公司 一种跨网互联音频大数据存储检索方法
CN109858237A (zh) * 2019-03-05 2019-06-07 广州酷狗计算机科技有限公司 音频数据采集方法、装置、终端及存储介质
CN110474902A (zh) * 2019-08-14 2019-11-19 中国工商银行股份有限公司 账户绑定的方法、系统、计算设备和介质
CN115798517A (zh) * 2023-02-08 2023-03-14 南京邮电大学 基于语音信息特征数据的商品搜索方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271457A (zh) * 2007-03-21 2008-09-24 中国科学院自动化研究所 一种基于旋律的音乐检索方法及装置
CN102314875A (zh) * 2011-08-01 2012-01-11 北京百度网讯科技有限公司 一种音频文件的识别方法和装置
CN103440305A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 音乐检索方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271457A (zh) * 2007-03-21 2008-09-24 中国科学院自动化研究所 一种基于旋律的音乐检索方法及装置
CN102314875A (zh) * 2011-08-01 2012-01-11 北京百度网讯科技有限公司 一种音频文件的识别方法和装置
CN103440305A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 音乐检索方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴娟: "基于数字指纹的音乐哼唱检索系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172241A (zh) * 2017-12-27 2018-06-15 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN108172241B (zh) * 2017-12-27 2020-11-17 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN109726307A (zh) * 2018-12-26 2019-05-07 合肥凯捷技术有限公司 一种跨网互联音频大数据存储检索方法
CN109858237A (zh) * 2019-03-05 2019-06-07 广州酷狗计算机科技有限公司 音频数据采集方法、装置、终端及存储介质
CN110474902A (zh) * 2019-08-14 2019-11-19 中国工商银行股份有限公司 账户绑定的方法、系统、计算设备和介质
CN110474902B (zh) * 2019-08-14 2022-05-03 中国工商银行股份有限公司 账户绑定的方法、系统、计算设备和介质
CN115798517A (zh) * 2023-02-08 2023-03-14 南京邮电大学 基于语音信息特征数据的商品搜索方法及系统

Similar Documents

Publication Publication Date Title
CN106776977A (zh) 搜索音乐的方法及装置
US10497378B2 (en) Systems and methods for recognizing sound and music signals in high noise and distortion
US11194965B2 (en) Keyword extraction method and apparatus, storage medium, and electronic apparatus
CN107346336B (zh) 基于人工智能的信息处理方法和装置
CN106777177A (zh) 检索方法和装置
CN107105031A (zh) 信息推送方法和装置
CN108829765A (zh) 一种信息查询方法、装置、计算机设备及存储介质
CN107256267A (zh) 查询方法和装置
CN103970793A (zh) 信息查询方法、客户端及服务器
CN108932945A (zh) 一种语音指令的处理方法及装置
CN112650854B (zh) 基于多知识图谱的智能答复方法、装置及计算机设备
CN107656948A (zh) 自动问答系统中的问题聚类处理方法及装置
CN107293307A (zh) 音频检测方法及装置
CN107862058B (zh) 用于生成信息的方法和装置
CN108268450B (zh) 用于生成信息的方法和装置
CN107885873A (zh) 用于输出信息的方法和装置
CN107609047A (zh) 应用推荐方法、装置、移动设备及存储介质
CN107977678A (zh) 用于输出信息的方法和装置
CN106909608A (zh) 基于智能机器人的数据处理方法及装置
CN108280081A (zh) 生成网页的方法和装置
CN114429635A (zh) 书本管理方法
CN109670073A (zh) 一种信息转换方法及装置、交互辅助系统
CN110209804B (zh) 目标语料的确定方法和装置、存储介质及电子装置
CN113032616B (zh) 音频推荐的方法、装置、计算机设备和存储介质
CN113011175A (zh) 一种基于双重渠道特征匹配的语义识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531