CN114661939A - 歌曲匹配方法、介质、装置和计算设备 - Google Patents
歌曲匹配方法、介质、装置和计算设备 Download PDFInfo
- Publication number
- CN114661939A CN114661939A CN202210296516.XA CN202210296516A CN114661939A CN 114661939 A CN114661939 A CN 114661939A CN 202210296516 A CN202210296516 A CN 202210296516A CN 114661939 A CN114661939 A CN 114661939A
- Authority
- CN
- China
- Prior art keywords
- song
- stock
- songs
- audio
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施方式提供了一种歌曲匹配方法、介质、装置和计算设备。该歌曲匹配方法包括:响应于接收到的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。通过根据待匹配歌曲的歌曲属性特征和音频特征检索歌曲特征数据库,使得检索准确性显著提升,为用户带来了更好的体验。
Description
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及一种歌曲匹配方法、介质、装置和计算设备。
背景技术
本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
歌曲检索在互联网中是一种非常常见的功能,在用户端检索歌曲的场景下,通常以歌曲的名字、演唱者、专辑名、作曲者、歌曲标签、歌词等属性来检索对应的曲目。
但在运营商对曲库进行管理场景下,需要对相同旋律的不同版本进行识别和匹配,如翻唱、现场版,这一场景下,仅通过歌曲名字等属性进行识别,存在精准度不够、无法满足不同业务需要的问题。
发明内容
本公开提供一种歌曲匹配方法、介质、装置和计算设备,以解决现有技术中曲库管理场景下的搜索精准度不足的问题。
在本公开实施方式的第一方面中,提供了一种歌曲匹配方法,包括:
响应于接收到的调用请求,调用请求包括待匹配歌曲和进行匹配的应用场景,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;
基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;
确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。
在本公开的一个实施例中,该歌曲匹配方法包括:预先建立的歌曲特征数据库通过如下方式得到:确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征;分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度;基于待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库。
在本公开的一种示例性实施例中,分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度,包括:将任一首待分析库存歌曲的歌曲属性特征和音频特征与任意一个待配对库存歌曲的歌曲属性特征和音频特征进行比对并计算相似度;对每一首待分析库存歌曲执行比对并计算相似度;相应地,基于待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库,包括:将计算得到的每一首待分析库存歌曲与待配对库存歌曲的每一个歌曲属性特征和音频特征的相似度保存到歌曲特征数据库中。
在本公开的一种示例性实施例中,歌曲属性特征包括待分析库存歌曲的国际标准音像制品编码ISRC码、通用产品代码UPC码、名字、演唱者、专辑名、作曲者、歌曲标签和歌词中的至少一个;音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
在本公开的一种示例性实施例中,分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度,包括:基于待分析库存歌曲的音频特征中的常数Q变换特征,得到待分析库存歌曲对应的常数Q变换索引向量;确定曲库中与待分析库存歌曲的常数Q变换索引向量相似度最高的设定数量的库存歌曲,为待配对库存歌曲。
在本公开的一种示例性实施例中,基于音频特征中的常数Q变换特征,得到待分析库存歌曲对应的常数Q变换索引向量,包括:基于音频特征中的常数Q变换特征,将待分析库存歌曲按照高斯混合模型提取设定数量的常数Q变换特征向量,作为待分析库存歌曲的常数Q变换索引向量。
在本公开的一种示例性实施例中,确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征之前,包括以下至少一项:当曲库中添加有新的歌曲时,将新的歌曲作为待分析库存歌曲;当曲库中存在版本更新的歌曲时,将版本更新的歌曲作为待分析库存歌曲;当曲库中没有添加新的歌曲且未存在版本更新的歌曲时,依次将每一首库存歌曲作为待分析库存歌曲。
在本公开的另一实施例中,该歌曲匹配方法包括:确定应用场景要求包含的匹配度条件,匹配度条件包括需要进行匹配的目标音频特征和对应的预先建立的匹配度阈值;确定至少一首库存歌曲与待匹配歌曲的目标音频特征的匹配度;确定目标音频特征的匹配度满足预先建立的匹配度阈值的库存歌曲为目标歌曲。
在本公开的一种示例性实施例中,匹配度值通过以下算法得到:基于字符编辑距离算法,确定待分析库存歌曲与配对库存歌曲的每一个歌曲属性特征的匹配度;基于余弦距离算法,确定待分析库存歌曲与配对库存歌曲的每一个音频特征的匹配度。
在本公开实施方式的第二方面中,提供了一种计算机可读存储介质,包括:
计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如本公开第一方面中的歌曲匹配方法。
在本公开实施方式的第三方面中,提供了一种歌曲匹配装置,包括:
第一确定模块,用于响应于接收到的调用请求,调用请求包括待匹配歌曲和进行匹配的应用场景,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;
检索模块,用于基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;
第二确定模块,用于确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。
在本公开的一种示例性实施例中,检索模块具体用于:通过如下方式得到预先建立的歌曲特征数据库:确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征;分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度;基于待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库。
在本公开的一种示例性实施例中,检索模块具体用于:将任一首待分析库存歌曲的歌曲属性特征和音频特征与任意一个待配对库存歌曲的歌曲属性特征和音频特征进行比对并计算相似度;对每一首待分析库存歌曲执行比对并计算相似度;并,将计算得到的每一首待分析库存歌曲与待配对库存歌曲的每一个歌曲属性特征和音频特征的相似度保存到歌曲特征数据库中。
在本公开的一种示例性实施例中,检索模块具体用于:包含歌曲属性特征;歌曲属性特征包括待分析库存歌曲的国际标准音像制品编码ISRC码、通用产品代码UPC码、名字、演唱者、专辑名、作曲者、歌曲标签和歌词中的至少一个;音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
在本公开的一种示例性实施例中,检索模块具体用于:基于待分析库存歌曲的音频特征中的常数Q变换特征,得到待分析库存歌曲对应的常数Q变换索引向量;确定曲库中与待分析库存歌曲的常数Q变换索引向量相似度最高的设定数量的库存歌曲,为待配对库存歌曲。
在本公开的一种示例性实施例中,检索模块具体用于:基于音频特征中的常数Q变换特征,将待分析库存歌曲按照高斯混合模型提取设定数量的常数Q变换特征向量,作为待分析库存歌曲的常数Q变换索引向量。
在本公开的一种示例性实施例中,第一确定模块还用于:在确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征之前,包括以下至少一项:当曲库中添加有新的歌曲时,将新的歌曲作为待分析库存歌曲;当曲库中存在版本更新的歌曲时,将版本更新的歌曲作为待分析库存歌曲;当曲库中没有添加新的歌曲且未存在版本更新的歌曲时,依次将每一首库存歌曲作为待分析库存歌曲。
在本公开的一种示例性实施例中,第二确定模块具体用于:确定应用场景要求包含的匹配度条件,匹配度条件包括需要进行匹配的目标音频特征和对应的预先建立的匹配度阈值;确定至少一首库存歌曲与待匹配歌曲的目标音频特征的匹配度;确定目标音频特征的匹配度满足预先建立的匹配度阈值的库存歌曲为目标歌曲。
在本公开的一种示例性实施例中,第二确定模块具体用于:通过以下算法得到匹配度值:基于字符编辑距离算法,确定待分析库存歌曲与配对库存歌曲的每一个歌曲属性特征的匹配度;基于余弦距离算法,确定待分析库存歌曲与配对库存歌曲的每一个音频特征的匹配度。
在本公开实施方式的第四方面中,提供了一种计算设备,包括:至少一个处理器;
以及与至少一个处理器通信连接的存储器;
其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使计算设备执行如本公开第一方面中的歌曲匹配方法。
根据本公开实施方式的歌曲匹配方法、介质、装置和计算设备,通过接收包括待匹配歌曲和进行匹配的应用场景的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;然后基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;并确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。由此,可以不仅仅基于歌曲的单个特征或输入的简单关键词搜索对应歌曲,有效保证搜索结果与搜索要求的匹配度,同时通过预先建立的歌曲特征数据库,实现在保证高精准度的同时,提高搜索效率,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式的应用场景图;
图2示意性地示出了根据本公开另一实施例的歌曲匹配方法的流程图;
图3示意性地示出了根据本公开又一实施例的歌曲匹配方法的流程图;
图4示意性地示出了根据本公开再一实施例的歌曲匹配方法的流程图;
图5示意性地示出了根据本公开再一实施例的计算机可读存储介质的结构示意图;
图6示意性地示出了根据本公开再一实施例的歌曲匹配装置的结构示意图;
图7示意性地示出了根据本公开再一实施例的计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种歌曲匹配方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的术语仅用于方便理解,并未表示对含义的限制。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面是本公开中涉及的术语说明:
音频特征向量:通过将音频信号拆分成几个较短的片段/元组,然后计算每个片段/元组的特征值,最终将整段音频的特征值组成一个矩阵序列,用以描述音频的特征。
索引向量:在一个给定音频特征向量的数据集中,按照某种度量方式,检索出与查询向量相近的K个向量,如音频特征向量为[1,2,1,1,2,1,1],则其索引向量可以是前三个向量[1,2,1],也可以是间隔一个向量得到的四个向量[1,1,2,1],或者其他任意方式得到的多个向量。通过索引向量的检索,能够确定包含对应索引向量的音频。
ISRC码:英文全称为International Standard Recording Code,即国际标准音像制品编码,是一个用于鉴别光盘上声音和音像制品的国际代码。一个ISRC编码不能够被重复使用。例如,如果一个音像制品被重新编辑或者发行时间改变,就必须使用一个新的ISRC编码。通过ISRC码能够确定同一首音乐作品的不同发行版本。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
发明概述
本发明人发现,在互联网中通常通过简单的信息来检索一首歌曲,如歌曲的名字、演唱者、专辑名、作曲者、歌曲标签、歌词等。这样的检索方法,结果往往不够精准准确和全面。因为歌曲本身是非结构化信息,而且歌曲的名字、演唱者等信息在歌曲入库的时候是非必要属性,可能存在缺失、歧义、重复等问题,无法确保精准定位到具体的特定歌曲。
除简单信息的检索,还有通过听歌识曲、哼唱识别等进行检索的方式。但这样的技术无法满足曲库在版权管理、入库匹配、音乐人防盗传等场景对歌曲的综合匹配要求。而且为每个要求的场景都搭建一套完整的流程,会带来资源的巨大浪费。
在本方案中,通过用待匹配的歌曲的特征和对应的应用场景结合,能够精确定位歌曲特征数据库匹配度值满足要求的歌曲,从而有效保证检索结果能够符合对应应用场景的需求,保证检索精准度。
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
应用场景总览
首先参考图1所示,在内容推荐中,用户通过客户端100向服务器110发送包含的待匹配歌曲和应用场景的调用请求101,服务器110根据调用请求101从歌曲特征数据库111中检索到满足匹配度值要求的目标歌曲120,并将目标歌曲120发送到对应客户端100,完成歌曲匹配过程。
需说明的是,图1所示场景中客户端100、调用请求101、服务器110、歌曲特征数据库111和目标歌曲120仅以一个为例进行示例说明,但本公开不以此为限制,也就是说,客户端、调用请求、服务器、歌曲特征数据库和目标歌曲的个数可以是任意的。
示例性方法
下面结合图1的应用场景,参考图2至图5来描述根据本公开示例性实施方式的用于歌曲匹配方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
图2为本公开一个实施例提供的歌曲匹配方法的流程图。如图2所示,本实施例提供的歌曲匹配方法包括以下步骤:
步骤S201、响应于接收到的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征。
其中,调用请求包括待匹配歌曲和进行匹配的应用场景。
具体的,调用请求为用户或管理人员在曲库中进行检索时,基于用于选择或输入的检索目标或要求,而自动生成并向服务器发送的请求。产生对应的调用请求的场景例如是,音乐创作者(用户)在客户端基于其最近发行的录音室版本的新歌曲,需要检索有没有相似的侵权作品(如别人在其作品前加了10秒钟的开场白或白噪音后当成自己创作作品)。
调用请求调用的对象为曲库中基于调用请求中待匹配歌曲和应用场景而确定的最相似的目标歌曲或多首目标歌曲的清单。通过向服务器发送调用请求,能够接收到服务器反馈的结果,即该最相似的目标歌曲或多首目标歌曲的清单。
进一步地,应用场景为不同使用者进行检索需要实现的目标,如音乐创作者防盗版/找基于某段旋律的相似创作(以寻找创作灵感)、曲库管理人员检查是否有重复上传的相同曲目/是否有版权冲突的曲目等。基于应用场景不同,对检索精准度和检索特征的要求会存在明显差异。
待匹配歌曲为需要检索时输入的歌曲,具体输入的类型可以是基于预先提供的窗口、菜单、表格等输入和选择具体某个版本的歌曲,也可以是直接上传具体的音频(如该音频未录入对应的特征信息时,还需要录入对应的特征信息),或者从曲库中先通过常规检索方式找到该待匹配歌曲(然后再基于该待匹配歌曲进行检索匹配)。
在具体检索过程中,需要基于待匹配歌曲的歌曲属性特征和音频特征进行检索匹配。其中,歌曲音频特征用于表示组成待匹配歌曲的音频数据的特征(如采样频率、比特率),歌曲属性特征用于表示除音频特征外待匹配歌曲的配置信息(如歌曲名、作者、ISRC码)。歌曲属性特征可以是后续添加的信息。
对应不同应用场景,会预先配置其需要的音频特征和/或歌曲属性特征,如音乐创作者寻找基于某段旋律的相似创作的场景,此时相对于考虑歌曲属性特征,更需要重点考虑的是歌曲音频特征,找到相匹配的内容;而在曲库管理人员检查版权冲突的场景,相对于考虑歌曲音频特征,更需要重点考虑的是歌曲属性特征,如通过ISRC码或发行商确定是否存在相冲突的版权商。
步骤S202、基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值。
具体的,歌曲特征数据库为包含曲库中所有库存歌曲的歌曲属性特征和音频特征,及与任意一个库存歌曲的最相关的至少一首库存歌曲的每个歌曲属性特征和音频特征的匹配度值,该匹配度值为每一首库存歌曲与每一首最相关的库存歌曲的每个特征两两比对得到。
因此,通过查询歌曲特征数据库,能够快速直接地得到匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值。
一些实施例中,若待匹配歌曲为上传的新歌曲,则此时至少一首库存歌曲与待匹配歌曲的匹配度值需要通过计算得到,而非查询歌曲特征数据库中的结果;且计算得到的匹配度值会保存到歌曲特征数据库中,以便下一次查询时调用。
进一步地,匹配度值用于表示库存歌曲与待匹配歌曲每一个特征的关联性程度,如歌手名匹配度值最高的歌曲,通常为同一个歌手或包含同一歌手的歌手组合的歌曲,如歌曲名匹配度值最高的可以是同一首歌的不同录音室版和不同现场版。
步骤S203、确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。
具体的,根据应用场景的要求,会预先确定至少一个特征,并要求(库存歌曲与待匹配歌曲的)该特征的匹配度值满足设定阈值,才能认为该库存歌曲为满足检索要求的目标歌曲。
其中,应用场景中所具体要求的特征及对应的设定阈值为经过预先训练得到的条件,当库存歌曲和待匹配歌曲在该具体要求的特征上的匹配度值满足设定阈值时,就可以确认该库存歌曲为目标歌曲。
目标歌曲可以有一首或者多首,如古典音乐可能有几十个演奏版本,如果包含音乐人上传的个人演奏版本,可能数量更多。
当确定目标歌曲后,会将该目标歌曲从服务器推送到用户侧,完成歌曲匹配和检索的过程。
根据本公开实施方式的歌曲匹配方法,通过接收包括待匹配歌曲和进行匹配的应用场景的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;然后基于该待匹配歌曲的歌曲属性特征和音频特征,查询预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;并确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。由此,可以不仅仅基于歌曲的单个特征或输入的简单关键词搜索对应歌曲,有效保证搜索结果与搜索要求的匹配度,同时通过预先建立的歌曲特征数据库,实现在保证高精准度的同时,提高搜索效率,为用户带来了更好的体验。
图3为本公开一个实施例提供的歌曲匹配方法的流程图。如图3所示,本实施例提供的歌曲匹配方法包括以下步骤:
步骤S301、当曲库中添加有新的歌曲时,将新的歌曲作为待分析库存歌曲。
具体的,在处理调用请求前,需要先建立曲库对应的歌曲特征数据库,并基于曲库的更新,同步对歌曲特征数据库进行更新。
其中,在不同的条件下,对歌曲特征数据库的更新方式不同。
当曲库中添加了新的歌曲时,歌曲特征数据库只需要更新该新添加歌曲的相关数据。在具体实施中,以该新的歌曲为待分析库存歌曲进行处理。
步骤S302、当曲库中存在版本更新的歌曲时,将版本更新的歌曲作为待分析库存歌曲。
具体的,当曲库中的歌曲版本更新,此时就需要基于更新后的该歌曲,更新歌曲特征数据库中的数据。
示例性的,同一版本(或同一ISRC码)的同一首歌,由原来试听版本(如时长仅有1分钟)替换为完整版本(如时长为5分钟),或添加了该歌曲的具体的歌曲属性特征(如添加了发行时间、所属的专辑等信息),就需要增加或更新对音频特征、或歌曲属性特征(如发行时间这一歌曲特征属性)的匹配度值计算。
步骤S303、当曲库中没有添加新的歌曲且未存在版本更新的歌曲时,依次将每一首库存歌曲作为待分析库存歌曲。
具体的,在曲库中没有添加新的歌曲且没有歌曲版本更新时,即建立歌曲特征数据库或定期维护歌曲特征数据库的过程,此时,需要服务器逐个遍历曲库中所有的库存歌曲,并计算该库存歌曲的所有歌曲属性特征、音频特征对应的匹配度值。
步骤S304、确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征。
具体的,在建立或更新歌曲特征数据库时,首先要确定待分析的库存歌曲,并确定该库存歌曲所包含的全部歌曲属性特征(因为可能存在部分属性特征缺乏记录的情况,如缺乏发行商或者发布时间等歌曲属性特征)和音频特征。
进一步地,歌曲属性特征包括待分析库存歌曲的国际标准音像制品编码ISRC码、通用产品代码UPC码、名字、演唱者、专辑名、作曲者、歌曲标签和歌词中的至少一个;音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
具体的,对待分析库存歌曲,能够确定的歌曲属性特征和音频特征越多,在确定与其关联的目标歌曲时的准确性就越高。
其中,不同歌曲属性特征和音频特征可以通过对应处理方式得到,如歌曲属性特征可以直接通过文本或字符读取的方式获取,而旋律特征、和弦特征等需要通过相应的提取模型或提取算法获取。提取模型或提取算法可以直接使用现有音频处理中常用的算法或模型即可。
步骤S305、分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度。
具体的,在计算待分析库存歌曲的歌曲属性特征和音频特征的对应匹配度值时,需要先遍历曲库中的歌曲,找到与待分析库存歌曲相似度满足阈值的歌曲,作为待配对库存歌曲,并计算该待配对库存歌曲与待分析库存歌曲每一个歌曲属性特征和音频特征的相似度,作为最后保存在歌曲特征数据库中的对应匹配度值。
进一步地,具体计算过程包括如下步骤:
步骤一(未示出)、基于待分析库存歌曲的音频特征中的常数Q变换特征,得到待分析库存歌曲对应的常数Q变换索引向量。
具体的,由于如果直接将曲库中的每一首歌曲都依次与待分析库存歌曲进行对比分析,并计算各歌曲属性特征和音频特征的相似度,虽然能够保证结果的全面性,但存在计算量过大,计算耗时过长的问题。
为减小计算量,需要先通过索引向量,快速检索出与待分析库存歌曲存在足够相似度的待配对库存歌曲。再直接计算该待配对库存歌曲与待分析库存歌曲的歌曲属性特征和音频特征的相似度,从而在保证不会损害结果全面性的前提下,减少计算量,提高计算效率。
因此,在本实施例中,由于常数Q变换(英文全文为Constant Qtransform,简称CQT)这一音频特征为每个音频都共用的必要特征,且在不同应用场景下都可以用于检索,因此,选择CQT特征作为索引向量,提取每首库存歌曲基于CQT特征的索引向量,以进行基于CQT的向量检索。
在本公开的一种实施例中,计算CQT索引向量的方法包括:
基于音频特征中的CQT特征,将待分析库存歌曲按照高斯混合模型提取设定数量的CQT特征向量,作为待分析库存歌曲的CQT索引向量。
具体的,CQT相较与其他的音频特征,不受音符基频范围的限制,比梅尔倒谱系数等特征的贡献更大。因此,提取CQT索引向量,能够有效保证其检索待匹配库存歌曲的全面性和准确性。
步骤二(未示出)、确定曲库中与待分析库存歌曲的常数Q变换索引向量相似度最高的设定数量的库存歌曲,为待配对库存歌曲。
具体的,通过遍历曲库中每个库存歌曲的CQT索引向量,找出与待分析库存歌曲的CQT索引向量的差值最小,或者相似度最高的若干个向量,即为待配对库存向量。由于只需要计算CQT索引向量的相似度,计算量较小,能够显著提高遍历计算速度,进而快速找到待配对库存歌曲。
步骤S306、基于待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库。
具体的,在确定待配对库存歌曲之后,就可以基于待配对库存歌曲和待分析库存歌曲的每一个歌曲属性特征和音频特征,依次计算对应的相似度,作为待分析库存歌曲的匹配度值,保存到歌曲特征数据库中。
进一步地,计算相似度并得到歌曲特征数据库的过程可以概括为:
步骤一(未示出)、将任一首待分析库存歌曲的歌曲属性特征和音频特征与任意一个待配对库存歌曲的歌曲属性特征和音频特征进行比对并计算相似度。
具体的,由于库存歌曲的音频特征都有,而歌曲属性特征可能并不是都有,所以对于待分析库存歌曲的每一个音频特征和歌曲属性特征,都要计算对应的相似度,即使待分析库存歌曲没有但待配对库存歌曲有的歌曲属性特征,也需要计算对应的相似度。
其中,当歌曲属性特征或音频特征完全相同时,记为相似度或匹配度值为1,当歌曲属性特征或音频特征完全不同时,记为相似度或匹配度值为0。
示例性的,待分析库存歌曲A有4个音频特征,6个歌曲属性特征,而待配对库存歌曲B有4个音频特征,8个歌曲属性特征(其中与待分析库存歌曲A共有的种类有4个),则需要依次计算待分析库存歌曲的4个音频特征和6个歌曲属性特征与待配对库存歌曲B对应的相似度,还需要计算待配对库存歌曲B有但待分析库存歌曲A没有的4个歌曲属性特征的相似度(此时值均为0)。
步骤二(未示出)、对每一首待分析库存歌曲执行比对并计算相似度。
具体的,对应每个待分析库存歌曲,其对应的待匹配库存歌曲可能有多个,且每个待分析库存歌曲和每个待匹配库存歌曲的相似度会包含多个特征的相似度,因此,需要将这些特征依次进行两两对比和计算。
步骤三(未示出)、将计算得到的每一首待分析库存歌曲与待配对库存歌曲的每一个歌曲属性特征和音频特征的相似度保存到歌曲特征数据库中。
具体的,对应每一个待分析库存歌曲的所有计算得到的相似度,都会作为该待分析库存歌曲的匹配度值,保存到歌曲特征数据库中。
当调用请求发送了待匹配歌曲后,通过确定待匹配歌曲的歌曲属性特征和音频特征后,就能自动确定该待匹配歌曲所对应的库存歌曲,进而找到歌曲特征数据库中与该库存歌曲相关联的待配对库存歌曲及相应的匹配度值,从而根据应用场景的需求,筛选出对应的待配对库存歌曲,作为目标歌曲。
步骤S307、响应于接收到的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征。
其中,调用请求包括待匹配歌曲和进行匹配的应用场景。
步骤S308、基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值。
步骤S309、确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。
具体的,步骤S307至步骤S309与图2所示实施例中的步骤S201至步骤S203内容相同,此处不再赘述。
根据本公开实施方式的歌曲匹配方法,通过曲库中歌曲变化情况,确定对应的待分析库存歌曲,及其歌曲属性特征和音频特征,然后据此找出去哭中的待配对库存歌曲,并计算待配对库存歌曲与待分析库存歌曲每个属性的相似度,再保存到歌曲特征数据库中,从而完成歌曲特征数据库的建立和更新维护,当接收到调用请求后,基于调用请求包含的应用场景和待匹配歌曲,通过检索歌曲特征数据库,可以得到对应的目标歌曲。由此,可以通过歌曲特征数据库预先完成不同歌曲的匹配度的计算,从而只需要根据调用请求包含的应用场景要求,筛选出匹配度满足要求的库存歌曲,再推送到客户端即可,实现了在保证高精准度的同时,显著提高搜索效率,减小实时计算量,为用户带来了更好的体验。
图4为本公开一个实施例提供的歌曲匹配方法的流程图。如图4所示,本实施例提供的歌曲匹配方法包括以下步骤:
步骤S401、响应于接收到的调用请求,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征。
其中,调用请求包括待匹配歌曲和进行匹配的应用场景。
具体的,调用请求可以由用户发送(如查询是否存在相同旋律的不同版本歌曲),也可以由服务器自动生成(如对曲库对应的歌曲特征数据库进行定时维护),因此,需要根据调用请求的来源或调用请求中待匹配歌曲的来源,针对性确定对应的待匹配歌曲。
进一步地,调用请求的歌曲来源包括如下情况:
情况一、若调用请求为对新入库歌曲进行匹配,则确定新入库歌曲的歌曲属性特征和音频特征。
具体的,新入库歌曲可以是用户上传的新歌曲,也可以是用户通过检索程序上传的待匹配歌曲。新入库歌曲可以是曲库中没有的歌曲,也可以是重复上传至曲库中的歌曲。
对于新入库歌曲,都只需要将新入库歌曲作为待匹配歌曲即可,同时,需要基于新入库歌曲,更新歌曲特征数据库中的对应记录。
情况二、若调用请求为对库存歌曲进行匹配,则依次确定库存中全部歌曲的歌曲属性特征和音频特征。
具体的,当待匹配歌曲为数量较多的库存歌曲时,通常调用请求为服务器发出的,此时待匹配歌曲可以是曲库中的全部歌曲,也可以是指定部分(如指定发行商对应)的歌曲。
进一步地,由服务器发出的调用请求,本质上是对歌曲特征数据库的定期更新和维护,或者建立新的歌曲特征数据库。
进一步地,确定待匹配歌曲后,其对应的歌曲属性特征和音频特征通过如下步骤确定:
步骤一(未示出)、确定待匹配歌曲全部歌曲属性特征。
具体的,歌曲属性特征一般是以文字或字符串形式记录的,因此只需要直接读取对应字符信息,即可得到待匹配歌曲的全部歌曲属性特征。
步骤二(未示出)、基于预设的识别模型,对待匹配歌曲进行预处理。
具体的,由于音频特征通常包含在音频文件中,需要专门的模型或算法来提取。
为保证提取结果的准确性,还需要基于预设(或现有的)识别模型,对待匹配歌曲的音频进行预处理。
进一步地,预处理包括以下至少一种:
方式一(未示出)、基于非音乐识别模型,确定待匹配歌曲的音频为音乐音频。
具体的,在对待匹配歌曲的音频文件进行进一步处理之前,首先要确保该音频文件为歌曲或音乐文件,而不是非音乐文件。由于非音乐文件(如电台聊天音频)一般通过其他方法处理和识别,因此,在歌曲处理方法中,需要首先将其排除。
方式二(未示出)、基于静音识别模型,提取待匹配歌曲的音频中除前端和后端静音部分以外的音频。
具体的,音频文件中可能会包含前后端的静音部分,这类情况通常出现在盗传或者盗版音频中(通过在正版音频前后端添加长度不等的静音部分,改变其对应音频特征,伪装成与正版不同的版本,实现盗版目的),通过剔除其前后端静音部分,能够防止盗传的情况,同时保证识别结果的准确性。
方式三(未示出)、基于干声分离模型,提取待匹配歌曲中的主干人声音频。
其中,主干人声音频用于歌手音色、性别识别或歌词识别。
具体的,对于人声演唱类的歌曲,通过干声分离模型,能够提取其中的人声部分,在音频特征分析中,通过单独分析人声部分,在识别翻唱歌曲的应用情景中,能够显著提高识别准确性。
步骤三(未示出)、提取预处理后的待匹配歌曲的音频的特征向量参数,作为待匹配歌曲的音频特征,音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
具体的,通过提取预处理后的待匹配歌曲的音频特征向量,能够有效保证提取的音频特征数据的准确性和可靠性。
步骤S402、基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值。
具体的,本步骤与图2所示实施例中的步骤S202内容相同,此处不再赘述。
步骤S403、确定应用场景要求包含的匹配度条件。
其中,匹配度条件包括需要进行匹配的目标音频特征和对应的预先建立的匹配度阈值。
具体的,对应不同应用场景,对不同的歌曲属性特征和音频特征的匹配度有要求,因此,需要根据应用场景,确定对应的匹配度条件,并确定对应有要求的匹配度值的特征歌曲属性特征和/或音频特征。如翻唱识别的应用场景,可能需要旋律特征、和弦特征、CQT特征和人声识别特征共四个特征的匹配度值满足要求。
进一步地,在服务器发送调用请求的场景下,其对应应用场景的要求为计算所有特征的匹配度值,而不需要考虑匹配度值的阈值要求。
步骤S404、确定至少一首库存歌曲与待匹配歌曲的目标音频特征的匹配度。
具体的,一般库存歌曲与待匹配歌曲的音频特征或歌曲属性特征的匹配度都是预先计算完毕,并保存在歌曲特征数据库中的,只需要读取歌曲特征数据库中的对应结果即可。
但当待匹配歌曲为曲库中未包含的歌曲时,需要将该待匹配歌曲保存或暂存(如该待匹配歌曲没有版权无法保存的情况)到曲库中,然后实时计算该待匹配歌曲对应的各项匹配度值。
具体计算方法可以参考图3所示实施例中的步骤S304至步骤S306,此处不再赘述。
进一步地,匹配度值通过以下算法得到:
基于字符编辑距离算法,确定待分析库存歌曲与配对库存歌曲的每一个歌曲属性特征的匹配度;基于余弦距离算法,确定待分析库存歌曲与配对库存歌曲的每一个音频特征的匹配度。
具体的,由此,对于歌曲属性特征中的字符信息和音频特征中的数学信息,都能够计算出匹配度,从而保证了歌曲属性特征和音频特征的匹配度计算的全面性,进而保证找出的目标歌曲的准确性。
步骤S405、确定目标音频特征的匹配度满足预先建立的匹配度阈值的库存歌曲为目标歌曲。
具体的,匹配度阈值为预先训练得到的结果,对应不同应用场景的阈值要求不同。应用场景要求匹配结果越精准、匹配度要求越高,阈值越高。
示例性的,识别同一个歌曲的不同版本,对旋律特征的匹配度要求为大于0.9即可,对于同一个歌曲的不同翻唱版本的识别,对旋律特征的匹配度要求可能为0.95且要小于1(为1时就是完全相同的版本而不是翻唱的版本了)。
当筛选出通过匹配度要求的库存歌曲,就可以作为目标歌曲,推送到客户端(对应客户端发送的调用请求),或将目标歌曲与待匹配歌曲的匹配度关系保存到歌曲特征数据库(对应服务器发送的调用请求)。
根据本公开实施方式的歌曲匹配方法,通过调用请求发送的来源和应用场景,确定需要进行匹配的待匹配歌曲,并通过歌曲特征数据库得到与待匹配歌曲匹配度最高的库存歌曲,然后基于应用场景确定对应的特征的匹配度满足应用场景的要求,并将满足要求的歌曲确定为目标歌曲。由此,可以根据调用请求的不同,通过歌曲特征数据库和应用场景要求,筛选出匹配度满足要求的库存歌曲作为目标歌曲,实现了在保证高精准度的同时,显著提高搜索效率,减小实时计算工作量,为用户带来了更好的体验。
示例性介质
在介绍了本公开示例性实施方式的方法之后,接下来,参考图5对本公开示例性实施方式的存储介质进行说明。
参考图5所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品50,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性装置
在介绍了本公开示例性实施方式的介质之后,接下来,参考图6对本公开示例性实施方式的歌曲匹配装置进行说明,用于实现上述任一方法实施例中的方法,其实现原理和技术效果与前述方法的实施例类似,在此不再赘述。
本公开提供的歌曲匹配装置600,包括:
第一确定模块610,用于响应于接收到的调用请求,调用请求包括待匹配歌曲和进行匹配的应用场景,基于应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;
检索模块620,用于基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及至少一首库存歌曲与待匹配歌曲的匹配度值;
第二确定模块630,用于确定匹配度值满足应用场景要求的库存歌曲为目标歌曲。
在本公开的一种示例性实施例中,检索模块620具体用于:通过如下方式得到预先建立的歌曲特征数据库:确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征;分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与待分析库存歌曲的歌曲属性特征和音频特征的相似度;基于待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库。
在本公开的一种示例性实施例中,检索模块620具体用于:将任一首待分析库存歌曲的歌曲属性特征和音频特征与任意一个待配对库存歌曲的歌曲属性特征和音频特征进行比对并计算相似度;对每一首待分析库存歌曲执行比对并计算相似度;并,将计算得到的每一首待分析库存歌曲与待配对库存歌曲的每一个歌曲属性特征和音频特征的相似度保存到歌曲特征数据库中。
在本公开的一种示例性实施例中,检索模块620具体用于:包含歌曲属性特征;歌曲属性特征包括待分析库存歌曲的国际标准音像制品编码ISRC码、通用产品代码UPC码、名字、演唱者、专辑名、作曲者、歌曲标签和歌词中的至少一个;音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
在本公开的一种示例性实施例中,检索模块620具体用于:基于待分析库存歌曲的音频特征中的常数Q变换特征,得到待分析库存歌曲对应的常数Q变换索引向量;确定曲库中与待分析库存歌曲的常数Q变换索引向量相似度最高的设定数量的库存歌曲,为待配对库存歌曲。
在本公开的一种示例性实施例中,检索模块620具体用于:基于音频特征中的常数Q变换特征,将待分析库存歌曲按照高斯混合模型提取设定数量的常数Q变换特征向量,作为待分析库存歌曲的常数Q变换索引向量。
在本公开的一种示例性实施例中,第一确定模块610还用于:在确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征之前,包括以下至少一项:当曲库中添加有新的歌曲时,将新的歌曲作为待分析库存歌曲;当曲库中存在版本更新的歌曲时,将版本更新的歌曲作为待分析库存歌曲;当曲库中没有添加新的歌曲且未存在版本更新的歌曲时,依次将每一首库存歌曲作为待分析库存歌曲。
在本公开的一种示例性实施例中,第二确定模块630具体用于:确定应用场景要求包含的匹配度条件,匹配度条件包括需要进行匹配的目标音频特征和对应的预先建立的匹配度阈值;确定至少一首库存歌曲与待匹配歌曲的目标音频特征的匹配度;确定目标音频特征的匹配度满足预先建立的匹配度阈值的库存歌曲为目标歌曲。
在本公开的一种示例性实施例中,第二确定模块630具体用于:通过以下算法得到匹配度值:基于字符编辑距离算法,确定待分析库存歌曲与配对库存歌曲的每一个歌曲属性特征的匹配度;基于余弦距离算法,确定待分析库存歌曲与配对库存歌曲的每一个音频特征的匹配度。
示例性计算设备
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图7对本公开示例性实施方式的计算设备进行说明。
图7显示的计算设备70仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,计算设备70以通用计算设备的形式表现。计算设备40的组件可以包括但不限于:上述至少一个处理单元701、上述至少一个存储单元702,连接不同系统组件(包括处理单元701和存储单元702)的总线703。
总线703包括数据总线、控制总线和地址总线。
存储单元702可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)7021和/或高速缓存存储器7022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)7023。
存储单元702还可以包括具有一组(至少一个)程序模块7024的程序,这样的程序模块7024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备70也可以与一个或多个外部设备704(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口705进行。并且,计算设备70还可以通过网络适配器706与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器706通过总线703与计算设备70的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备70使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了歌曲匹配装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (10)
1.一种歌曲匹配方法,包括如下步骤:
响应于接收到的调用请求,所述调用请求包括待匹配歌曲和进行匹配的应用场景,基于所述应用场景确定待匹配歌曲的歌曲属性特征和/或音频特征;
基于该待匹配歌曲的歌曲属性特征和音频特征,确定预先建立的歌曲特征数据库中与待匹配歌曲的匹配度最高的至少一首库存歌曲,及所述至少一首库存歌曲与所述待匹配歌曲的匹配度值;
确定所述匹配度值满足所述应用场景要求的库存歌曲为目标歌曲。
2.根据权利要求1所述的歌曲匹配方法,所述预先建立的歌曲特征数据库通过如下方式得到:
确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征;
分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与所述待分析库存歌曲的歌曲属性特征和音频特征的相似度;
基于所述待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库。
3.根据权利要求2所述的歌曲匹配方法,所述分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与所述待分析库存歌曲的歌曲属性特征和音频特征的相似度,包括:
将任一首待分析库存歌曲的歌曲属性特征和音频特征与任意一个所述待配对库存歌曲的歌曲属性特征和音频特征进行比对并计算相似度;
对每一首待分析库存歌曲执行所述比对并计算相似度;
相应地,所述基于所述待分析库存歌曲与对应待配对库存歌曲的歌曲属性特征和音频特征的相似度,得到歌曲特征数据库,包括:
将计算得到的每一首所述待分析库存歌曲与所述待配对库存歌曲的每一个歌曲属性特征和音频特征的相似度保存到歌曲特征数据库中。
4.根据权利要求2所述的歌曲匹配方法,所述歌曲属性特征包括待分析库存歌曲的国际标准音像制品编码ISRC码、通用产品代码UPC码、名字、演唱者、专辑名、作曲者、歌曲标签和歌词中的至少一个;所述音频特征包括旋律特征、和弦特征、梅尔倒谱系数特征和常数Q变换特征中的至少一种。
5.根据权利要求2所述的歌曲匹配方法,所述分别计算曲库中每一个待配对库存歌曲的每一个歌曲属性特征和音频特征与所述待分析库存歌曲的歌曲属性特征和音频特征的相似度,包括:
基于所述待分析库存歌曲的音频特征中的常数Q变换特征,得到所述待分析库存歌曲对应的常数Q变换索引向量;
确定所述曲库中与所述待分析库存歌曲的常数Q变换索引向量相似度最高的设定数量的库存歌曲,为所述待配对库存歌曲。
6.根据权利要求5所述的歌曲匹配方法,所述基于所述音频特征中的常数Q变换特征,得到所述待分析库存歌曲对应的常数Q变换索引向量,包括:
基于所述音频特征中的常数Q变换特征,将所述待分析库存歌曲按照高斯混合模型提取设定数量的常数Q变换特征向量,作为所述待分析库存歌曲的常数Q变换索引向量。
7.根据权利要求2所述的歌曲匹配方法,所述确定曲库中的待分析库存歌曲的歌曲属性特征和音频特征之前,包括以下至少一项:
当所述曲库中添加有新的歌曲时,将所述新的歌曲作为待分析库存歌曲;
当所述曲库中存在版本更新的歌曲时,将所述版本更新的歌曲作为待分析库存歌曲;
当所述曲库中没有添加新的歌曲且未存在版本更新的歌曲时,依次将每一首库存歌曲作为待分析库存歌曲。
8.根据权利要求1至7中任一项所述的歌曲匹配方法,所述确定所述匹配度值满足所述应用场景要求的库存歌曲为目标歌曲,包括:
确定所述应用场景要求包含的匹配度条件,所述匹配度条件包括需要进行匹配的目标音频特征和对应的预先建立的匹配度阈值;
确定所述至少一首库存歌曲与所述待匹配歌曲的目标音频特征的匹配度;
确定所述目标音频特征的匹配度满足所述预先建立的匹配度阈值的库存歌曲为目标歌曲。
9.根据权利要求2至7中任一项所述的歌曲匹配方法,所述匹配度值通过以下算法得到:
基于字符编辑距离算法,确定所述待分析库存歌曲与所述配对库存歌曲的每一个歌曲属性特征的匹配度;
基于余弦距离算法,确定所述待分析库存歌曲与所述配对库存歌曲的每一个音频特征的匹配度。
10.一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至9中任一项所述的歌曲匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210296516.XA CN114661939A (zh) | 2022-03-24 | 2022-03-24 | 歌曲匹配方法、介质、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210296516.XA CN114661939A (zh) | 2022-03-24 | 2022-03-24 | 歌曲匹配方法、介质、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114661939A true CN114661939A (zh) | 2022-06-24 |
Family
ID=82031839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210296516.XA Pending CN114661939A (zh) | 2022-03-24 | 2022-03-24 | 歌曲匹配方法、介质、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114661939A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115410544A (zh) * | 2022-08-26 | 2022-11-29 | 镁佳(北京)科技有限公司 | 一种音效处理方法、装置及电子设备 |
CN117390217A (zh) * | 2023-12-13 | 2024-01-12 | 杭州网易云音乐科技有限公司 | 歌曲片段的确定方法、装置、设备和介质 |
-
2022
- 2022-03-24 CN CN202210296516.XA patent/CN114661939A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115410544A (zh) * | 2022-08-26 | 2022-11-29 | 镁佳(北京)科技有限公司 | 一种音效处理方法、装置及电子设备 |
CN115410544B (zh) * | 2022-08-26 | 2024-01-30 | 镁佳(北京)科技有限公司 | 一种音效处理方法、装置及电子设备 |
CN117390217A (zh) * | 2023-12-13 | 2024-01-12 | 杭州网易云音乐科技有限公司 | 歌曲片段的确定方法、装置、设备和介质 |
CN117390217B (zh) * | 2023-12-13 | 2024-05-24 | 杭州网易云音乐科技有限公司 | 歌曲片段的确定方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10095694B2 (en) | Embedding content-based searchable indexes in multimedia files | |
Rubin et al. | Content-based tools for editing audio stories | |
CN114661939A (zh) | 歌曲匹配方法、介质、装置和计算设备 | |
US20070106405A1 (en) | Method and system to provide reference data for identification of digital content | |
WO2008004181A2 (en) | Methods and devices for managing a play-list of digital content | |
US20090028009A1 (en) | Dynamic Mobile CD Music Attributes Database | |
US8751494B2 (en) | Constructing album data using discrete track data from multiple sources | |
EP4150488A1 (en) | Music cover identification with lyrics for search, compliance, and licensing | |
Futrelle et al. | Interdisciplinary research issues in music information retrieval: ISMIR 2000–2002 | |
JP2010257466A (ja) | デジタル・オーディオ・トラック・セット認識システム | |
US8725766B2 (en) | Searching text and other types of content by using a frequency domain | |
JP2019091416A5 (zh) | ||
Allik et al. | Musiclynx: Exploring music through artist similarity graphs | |
JP2000155759A (ja) | 音楽情報検索装置,音楽情報蓄積装置,音楽情報検索方法,音楽情報蓄積方法およびそれらのプログラムを記録した記録媒体 | |
Gurjar et al. | Comparative Analysis of Music Similarity Measures in Music Information Retrieval Systems. | |
CN116343771A (zh) | 一种基于知识图谱的音乐点播语音指令识别方法、装置 | |
CN103870476A (zh) | 检索方法及设备 | |
KR20080107143A (ko) | 오디오 신호처리 기반의 음악 및 동영상 추천 시스템 및방법 | |
CN115329125A (zh) | 一种歌曲串烧拼接方法和装置 | |
US20040182225A1 (en) | Portable custom media server | |
KR102307410B1 (ko) | 리메이크곡 검색 방법, 시스템 및 컴퓨터 프로그램 | |
KR101002732B1 (ko) | 온라인을 통한 디지털 컨텐츠 관리 시스템 | |
CN113127676B (zh) | 信息匹配方法、系统、装置、存储介质及电子设备 | |
KR20190009821A (ko) | 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템 | |
US20110238679A1 (en) | Representing text and other types of content by using a frequency domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |