CN110516109A - 音乐标签的关联方法、装置及存储介质 - Google Patents

音乐标签的关联方法、装置及存储介质 Download PDF

Info

Publication number
CN110516109A
CN110516109A CN201910817788.8A CN201910817788A CN110516109A CN 110516109 A CN110516109 A CN 110516109A CN 201910817788 A CN201910817788 A CN 201910817788A CN 110516109 A CN110516109 A CN 110516109A
Authority
CN
China
Prior art keywords
music
label
vector
feature vector
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910817788.8A
Other languages
English (en)
Other versions
CN110516109B (zh
Inventor
康战辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910817788.8A priority Critical patent/CN110516109B/zh
Publication of CN110516109A publication Critical patent/CN110516109A/zh
Application granted granted Critical
Publication of CN110516109B publication Critical patent/CN110516109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本发明提供了一种音乐标签的关联方法、装置及存储介质;方法包括:获取待关联音乐标签的音乐的文本信息;将音乐的文本信息映射为相应的特征向量;分别获取特征向量与音乐库中各音乐的特征向量的相似度,音乐库中的音乐关联有音乐标签;基于相似度的大小,确定音乐库中与待关联音乐标签的音乐对应的目标音乐;将目标音乐的音乐标签与待关联音乐标签的音乐进行关联,以使关联后的音乐存在与目标音乐相同的音乐标签。通过本发明,能够提高音乐关联音乐标签的效率。

Description

音乐标签的关联方法、装置及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种音乐标签的关联方法、装置及存储介质。
背景技术
为了提高音乐类客户端的用户体验,需要给各种音乐打上相应的音乐标签,以便用户在搜索或者推荐场景下,可以搜索到具有该标签的音乐、或者可以推荐该标签的其他所有音乐。
相关技术中,多采用人工编辑整理的方式,为音乐打上相应的标签,由于人工整理需要大量人力资源,并且所能涉及的音乐标签和音乐数目都有限,使得打标签的效果不理想。
发明内容
本发明实施例提供一种音乐标签的关联方法、装置及存储介质,能够实现自动为音乐关联相应的音乐标签。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种音乐标签的关联方法,包括:
获取待关联音乐标签的音乐的文本信息;
将所述音乐的文本信息映射为相应的特征向量;
分别获取所述特征向量与音乐库中各音乐的特征向量的相似度,所述音乐库中的音乐关联有音乐标签;
基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐;
将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,以使关联后的音乐存在与所述目标音乐相同的音乐标签。
第二方面,本发明实施例还提供一种音乐标签的关联装置,包括:
获取单元,用于获取待关联音乐标签的音乐的文本信息;
映射单元,用于将所述音乐的文本信息映射为相应的特征向量;
计算单元,用于分别获取所述特征向量与音乐库中各音乐的特征向量的相似度,所述音乐库中的音乐关联有音乐标签;
确定单元,用于基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐;
关联单元,用于将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,以使关联后的音乐存在与所述目标音乐相同的音乐标签。
上述方案中,所述映射单元,还用于对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行向量映射,得到所述词序列中各个分词的向量;
将得到的所述各个分词的向量进行拼接,得到对应所述文本信息的所述特征向量。
上述方案中,所述映射单元,还用于对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行编码,得到对应所述词序列的编码向量;
将所述词序列的编码向量输入至词向量模型,得到对应所述文本信息的所述特征向量。
上述方案中,所述确定单元,还用于确定与所述音乐对应的特征向量的相似度最大的第一目标特征向量;
将音乐库中对应所述第一目标特征向量的音乐作为目标音乐。
上述方案中,所述确定单元,还用于获取与所述音乐对应的特征向量的相似度达到相似度阈值的第二目标特征向量;
将音乐库中对应所述第二目标特征向量的音乐作为目标音乐。
上述方案中,所述关联单元,还用于当所述第二目标特征向量的数量为多个时,分别获取各所述第二目标特征向量对应的音乐的音乐标签;
从获取的所述音乐标签中筛选得到不同类型的音乐标签;
将筛选得到的所述不同类型的音乐标签与所述待关联音乐标签的音乐进行关联。
第三方面,本发明实施例还提供一种音乐标签的关联装置,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的音乐标签的关联方法。
第四方面,本发明实施例还提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的音乐标签的关联方法。
本发明实施例具有以下有益效果:
通过将待关联音乐标签的音乐的文本信息映射为对应的特征向量,计算该特征向量与音乐库中的各音乐的特征向量的相似度,进而根据相似度的大小,来确定音乐库中与该待关联音乐标签的音乐对应的目标音乐,将该目标音乐的音乐标签与待关联音乐标签的音乐进行关联;如此,通过对不同音乐的特征向量的相似度计算实现音乐标签的自动关联,提高了为音乐关联音乐标签的效率。
附图说明
图1是本发明实施例提供的音乐标签的关联系统的架构示意图;
图2为本发明实施例提供的音乐标签的关联装置的结构示意图;
图3为本发明实施例提供的音乐标签的关联方法的流程示意图;
图4为本发明实施例提供的一个可选的词向量模型的架构示意图;
图5为本发明实施例提供的一个可选的词向量模型训练过程的示意图;
图6为本发明实施例提供的音乐标签的关联方法的流程示意图;
图7为本发明实施例提供的一个可选的音乐标签的来源示意图;
图8为本发明实施例提供的待关联标签音乐的示意图;
图9为本发明实施例提供的音乐标签的关联装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,描一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)音乐标签,用于表征音乐特征的标识信息,比如儿歌、轻音乐、古风等曲风类的标签;校园、运动、学习工作等场景类的标签;快乐、励志、安静等心情类的标签;
2)分词,是将连续的字序列按照一定的规范重新组合成词序列的过程;
3)损失函数,用来度量模型的预测值与真实值的不一致程度。
基于上述对本发明实施例中涉及的名词和术语的解释,下面对本发明实施例提供的音乐标签的关联系统进行说明,参见图1,图1为本发明实施例提供的音乐标签的关联系统的架构示意图,为实现支撑一个示例性应用,音乐标签的关联系统100包括终端(包括终端400-1和终端400-2)及服务器200,终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
终端(终端400-1和/或终端400-2),用于根据用户的操作,关联用户选定的音乐标签与音乐,并将该关联关系发送给服务器;
在实际应用中,终端可以为智能手机、平板电脑、笔记本电脑等各种类型的用户终端,还可以为可穿戴计算设备、个人数字助理(PDA)、台式计算机、蜂窝电话、媒体播放器、导航设备、游戏机、电视机、或者这些数据处理设备或其他数据处理设备中任意两个或多个的组合。
服务器200,用于获取待关联音乐标签的音乐的文本信息;将音乐的文本信息映射为相应的特征向量;分别获取特征向量与音乐库中各音乐的特征向量的相似度;基于相似度的大小,确定音乐库中与待关联音乐标签的音乐对应的目标音乐;将目标音乐的音乐标签与待关联音乐标签的音乐进行关联;
服务器200,还用于接收终端发送的音乐标签与音乐的关联关系,并存储在音乐库中;
在实际实施时,服务器200既可以为单独配置的支持各种业务的一个服务器,亦可以配置为一个服务器集群。
下面对本发明实施例提供的音乐标签的关联装置的硬件结构做详细说明,参见图2,图2为本发明实施例提供的音乐标签的关联装置的结构示意图,可以理解,图2仅仅示出了音乐标签的关联装置的示例性结构而非全部结构,根据需要可以实施图2示出的部分结构或全部结构。
本发明实施例提供的音乐标签的关联装置包括:至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。音乐标签的关联装置200中的各个组件通过总线系统205耦合在一起。可以理解,总线系统205用于实现这些组件之间的连接通信。总线系统205除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统205。
其中,用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器202可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、闪存(Flash Memory)等。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,StaticRandom Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static RandomAccess Memory)。本发明实施例描述的存储器202旨在包括这些和任意其它适合类型的存储器。
本发明实施例中的存储器202能够存储数据以支持终端(如400-1)的操作。这些数据的示例包括:用于在终端(如400-1)上操作的任何计算机程序,如操作系统和应用程序。其中,操作系统包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
作为本发明实施例提供的音乐标签的关联装置采用软硬件结合实施的示例,本发明实施例所提供的音乐标签的关联装置可以直接体现为由处理器201执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器202,处理器201读取存储器202中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器201以及连接到总线205的其他组件)完成本发明实施例提供的音乐标签的关联方法。
作为示例,处理器201可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
作为本发明实施例提供的音乐标签的关联装置采用硬件实施的示例,本发明实施例所提供的音乐标签的关联装置可以直接采用硬件译码处理器形式的处理器201来执行完成,例如,被一个或多个应用专用集成电路(ASIC,A pplication Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Program mable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件执行实现本发明实施例提供的音乐标签的关联方法。
本发明实施例中的存储器202用于存储各种类型的数据以支持音乐标签的关联装置200的操作。这些数据的示例包括:用于在音乐标签的关联装置200上操作的任何可执行指令,如可执行指令,实现本发明实施例的音乐标签的关联方法的程序可以包含在可执行指令中。
基于上述对音乐标签的关联系统和装置的说明,下面对本发明实施例提供的音乐标签的关联方法进行说明。参见图3,图3为本发明实施例提供的音乐标签的关联方法的流程示意图,在一些实施例中,该训练方法可由服务器或终端实施,或由服务器及终端协同实施,以服务器实施为例,本发明实施例提供的音乐标签的关联方法包括:
步骤301:服务器获取待关联音乐标签的音乐的文本信息。
在一些实施例中,待关联音乐标签的音乐包括已经关联有音乐标签的音乐和未与任何音乐标签建立关联的音乐。针对已经关联有音乐标签的音乐,对该类音乐再次进行标签关联后,可以丰富该音乐的音乐标签类型;针对未关联标签的音乐,对该类音乐进行标签后,可以基于标签对该音乐进行分类;如此,使得用户可以通过不同的标签搜索到该音乐、或者音乐类的客户端也可以基于不同的标签向用户推荐该音乐。
在进行音乐标签关联之前,需要针对该音乐确定适合的、即与该音乐对应的音乐标签,比如可以基于音乐的曲风、演唱者、演奏方式等确定相应的音乐标签。鉴于此,需要先对该待关联音乐标签的音乐进行特征分析。
在实际实施时,可以获取该音乐相关的文本信息,以此作为特征分析的基础。该文本信息可以包括音乐的音乐名词、演奏者、主题歌词等其中的一种或者多种,在本发明实施例中不做限定。
步骤302:将音乐的文本信息映射为相应的特征向量。
在获取到待关联音乐标签的音乐的文本信息之后,将该音乐的文本信息映射成相应的特征向量,以提取该文本信息的相关特征。
在一些实施例中,可通过如下方式实现将音乐的文本信息映射为相应的特征向量:对音乐的文本信息进行分词处理,得到包含多个分词的词序列;分别对词序列中的分词进行向量映射,得到词序列中各个分词的向量;将得到的各个分词的向量进行拼接,得到对应文本信息的特征向量。
在实际应用中,获取到的文本信息是一串中英文文本序列,词语之间没有明显的区分,服务器对文本信息进行处理时,需要先对该文本信息进行分词处理。具体的,可以采用扩充转移网络法、矩阵约束法、最佳匹配法等方式对文本信息进行分词。
经过分词处理的文本信息,形成一个包含多个分词的词序列。比如,原始获取的文本信息是“采蘑菇的小姑娘杨烁儿歌集”,经过分词处理后得到形如“采/蘑菇/的/小姑娘/杨烁/儿歌集”的词序列。
将得到的词序列中的每个分词进行向量映射,即将“采”、“蘑菇”、“的”、“小姑娘”、“杨烁”、“儿歌集”分别进行向量映射,得到各个分词的向量。
将得到的每个分词的向量按序进行拼接,将该拼接得到的向量确定为文本信息的特征向量。
在一些实施例中,还可以通过如下方式将音乐的文本信息映射为相应的特征向量:对音乐的文本信息进行分词处理,得到包含多个分词的词序列;分别对词序列中的分词进行编码,得到对应词序列的编码向量;将词序列的编码向量输入至词向量模型,得到对应文本信息的特征向量。
在实际实施时,除了可以采用向量拼接的方式得到特征向量,还可以基于当前的机器学习技术、采用构建词向量模型的方式,以保证特征向量映射的准确率。
相同地,采用词向量模型映射特征向量时,也首先对音乐的文本信息进行分词处理,得到包含多个分词的词序列。
针对每个分词,对该分词进行编码处理,得到对应该词序列对应的编码向量,比如可以采用one-hot编码的方式。将该词向量对应的编码向量输入构建的词向量模型中,以使词向量模型输出对应文本信息的特征向量。
通过机器学习技术构建的词向量模型需要经过大量的数据训练才能提高自身的输出精度,下面首先对本发明实施例提供的词向量模型进行说明,参见图4,图4为本发明实施例提供的一个可选的词向量模型的架构示意图,该词向量模型是基于word2vec模型构建得到的,包括输入层、隐藏层及输出层。
输入层:通过一个映射矩阵C(矩阵的规模为V*D,其中V是词典大小,V={w1,w2,…w|V|},D是词向量的维度),将N-1个文本信息对应的编码向量映射成N-1个D维向量,然后将这N-1个D维向量首尾相接形成一个D(N-1)的向量,该向量就是词向量模型的输入向量x。
隐藏层:隐藏层的节点个数为h,为了将输入层输出的向量x(维度为D)转化为隐藏层(维度为h)的输入,在输入层和隐藏层之间需要一个参数矩阵H(H的规模为h*D(N-1)),同时需要一个偏置d,该变化可以表示为f(x)=Hx+d,这是一个线性变换,隐藏层的输出需要将经过线性变换的向量再做一次非线性变换,在一些实施例中选择激活函数1为tanh(双曲正切函数),相应的隐藏层的输出就是tanh(Hx+d)。
输出层:从隐藏层到输出层的传递同样需要一个线性变换和一个非线性变换,首先通过线性变换将隐藏层的输出向量的维数转化为和输出层的节点数一致,为了将输出表示成概率分布的形式(每个维度上的值之和为1),需要对输出层的输入(也就是隐藏层的输出)进行一个非线性变换,在一实施例中,采用激活函数2为softmax(归一化指数函数)输出概率分布p。
其中,隐藏层和输出层构成了一个前向反馈神经网络g。
接下来继续基于上述构建的词向量模型对其训练过程进行详细说明,参见图5,图5为本发明实施例提供的词向量模型训练过程的示意图。在一些实施例中,可以通过如下的方式训练词向量模型,以提高模型输出的准确率。
步骤3021:将音乐的文本信息样本所对应的编码向量样本输入至词向量模型,输出对应编码向量样本的特征向量。
首先,获取大量的音乐的文本信息样本;对获取的文本信息样本进行编码,得到文本信息样本对应的编码向量样本,在一些实施例中,通常采用上述的on e-hot编码方式,以提高模型的训练效率。
将编码向量样本作为词向量模型的输入向量,使该词向量模型输出对应该编码向量样本的特征向量。
步骤3022:基于编码向量样本的特征向量及目标特征向量,确定词向量模型的损失函数的值。
模型训练的过程即是对模型中各参数的更新调整过程。将训练样本数据输入到词向量模型的输入层,经过隐藏层,最后达到输出层并输出结果,由于词向量模型的输出结果与实际结果可能有误差,则需要计算输出结果与实际值之间的误差,并将该误差从输出层向隐藏层进行反向传播,直至传播到输入层,进而在反向传播的过程中,根据误差调整模型参数的值;整个训练过程不断迭代上述步骤,直至收敛,以减小模型输出的误差。
基于此,在降低词向量模型输出的特征向量及目标特征向量之间可能存在的误差时,在本发明实施例中,引入了损失函数。服务器基于模型输出的编码向量样本的特征向量及目标特征向量,确定损失函数的值。
在一些实施例中,由于词向量模型通过输出层的softmax归一化函数输出了词向量对应的概率分布,而交叉熵(cross-entropy)可用于度量两个概率分布之间的差异性信息,即计算实际输出概率和期望输出概率之间的距离。因此,可以通过最小化一个交叉熵正则化的损失函数来调整模型参数。
例如:
其中,模型的参数θ包括了矩阵C中的所有元素,以及前向反馈神经网络g的权重系数,R(θ)为模型中所有参数θ的集合。
由于训练样本数据巨大,参数θ的数量是非常多的,在一些实施例中,还可以采用梯度下降优化算法(Stochastic Gradient Descent,SGD)来提高损失函数的计算效率,进而提高训练模型的参数更新速度。
步骤3023:基于词向量模型的损失函数的值,更新词向量模型的模型参数。
基于上述确定的损失函数的值,运用神经网络模型中的反向传播算法逐层更新词向量模型的参数,直至损失函数收敛,以实现对词向量模型的参数的约束和调整。
步骤303:分别获取特征向量与音乐库中各音乐的特征向量的相似度;其中,音乐库中的音乐关联有音乐标签。
在一些实施例中,服务器存储了用户在使用音乐客户端过程中上传的音乐标签和音乐之间的关联关系。服务器基于大量的用户数据,可以生成一个或者多个音乐库,该音乐库中的音乐均关联有对应的音乐标签。该音乐库中的音乐标签即为待关联音乐标签的音乐的候选音乐标签。
在具体实施时,基于上述,提取了待关联音乐标签的音乐对应的特征向量。此时,也可以针对音乐库中的音乐,提取该各个音乐的特征向量,以方便依据音乐的特征实现音乐标签的合理有效地关联。
在提取到每个音乐对应的特征向量后,将待关联音乐标签的音乐对应的特征向量与音乐库中的各个音乐的特征向量分别进行相似度的计算,具体可以依据向量的余弦相似度的计算方法,确定特征向量之间的相似度。
步骤304:基于相似度的大小,确定音乐库中与待关联音乐标签的音乐对应的目标音乐。
在计算出待关联音乐标签的音乐对应的特征向量和保存在音乐库中各个音乐的特征向量之间的相似度以后,基于每个相似度的大小,进而确定待关联音乐标签的音乐所对应的最合适的标签,即根据计算的每个相似度,确定音乐库中对应的目标特征向量、以及对应的目标音乐。
在一些实施例中,可以基于相似度的大小,采用如下方式确定音乐库中与待关联音乐标签的音乐对应的目标音乐:确定与音乐对应的特征向量的相似度最大的第一目标特征向量;将音乐库中对应第一目标特征向量的音乐作为目标音乐。
在实际实施时,将计算得到的每个相似度,按照数值的大小进行排序。由于两个特征向量的相似度越高,说明该两个特征向量对应的音乐的标签越是相近,因此,可以将与音乐对应的特征向量的相似度最大的特征向量作为第一目标特征向量。进而,根据该第一目标特征向量,在保存的音乐库中,查找到与该第一目标特征向量对应的目标音乐。
在一些实施例中,基于相似度的大小,还可以采用如下的方式确定音乐库中与待关联音乐标签的音乐对应的目标音乐:获取与音乐对应的特征向量的相似度达到相似度阈值的第二目标特征向量;将音乐库中对应第二目标特征向量的音乐作为目标音乐。
由于一首音乐可以从不同的分类方式上分配到不同的音乐标签,因此除了可以采用上述的方式确定唯一的音乐标签外,还可以为该音乐找到其他合适的音乐标签。
具体的,可以通过设置阈值的方式,预设一个相似度阈值。在计算得到的所有相似度中,比较得出相似度达到该相似度阈值对应的第二目标特征向量。基于该第二目标特征向量,在音乐库中查找到对应该第二目标特征向量的目标音乐。
步骤305:将目标音乐的音乐标签与待关联音乐标签的音乐进行关联,以使关联后的音乐存在与目标音乐相同的音乐标签。
在确定了目标音乐之后,由于该目标音乐是依据相似度的大小确定的,因此,该目标音乐对应的的音乐标签则与该待关联音乐标签的音乐也是有紧密关系的。如此,则可以将该目标音乐的音乐标签与待关联音乐标签的音乐进行关联,以完成音乐标签的传递,使得该关联后的音乐与目标音乐关联有相同的音乐标签。
具体的,如果确定的目标音乐的音乐标签为“儿歌”,那么该待关联音乐标签的音乐也与该“儿歌”的音乐标签进行关联。
当然,基于上述描述,通过不同的方式可以确定不同数目的目标音乐,因此在一些实施例中,目标音乐有多个的时候,也就是说:当第二目标特征向量的数量为多个时,分别获取各第二目标特征向量对应的音乐的音乐标签;从获取的音乐标签中筛选得到不同类型的音乐标签;将筛选得到的不同类型的音乐标签与待关联音乐标签的音乐进行关联。
实际实施时,通过上述设定相似度阈值的方式,确定的第二目标特征向量可能存在多个,基于此,则获取的音乐标签也是多个。在这种情况下,则需要对音乐标签进行筛选,以获取最适合待关联音乐标签的音乐的音乐标签。具体的,可以根据音乐标签的类型,选择不同类型的音乐标签。该类型指的是音乐标签的类型,如对应“曲风”的标签、对应“演奏方式”的标签、以及对应“语种”的标签等。
例如,针对“采蘑菇的小姑娘”,确定的音乐标签包括“儿歌”、“华语歌曲”、“英文歌曲”、“乐器演奏”和“合唱”,那么则可以针对不同的类型,选择合适的音乐标签,比如对应“语种”的标签可以选择“华语歌曲”、对应“演奏方式”的标签可以选择“合唱”等。
下面继续对本发明实施例提供的音乐标签的关联方法进行说明,参见图6,图6为本发明实施例提供的音乐标签的关联方法的流程示意图,本发明实施例提供的音乐标签的关联方法包括:
步骤601:终端将用户编辑的音乐标签和音乐的关联关系数据上传至服务器。
这里,用户通过在终端上操作音乐客户端(如QQ音乐)创建个人的用户数据,编辑整理个人歌单中音乐与音乐标签的关联关系。终端将用户编辑的数据上传给服务器。
步骤602:服务器接收上传的用户数据并存储,形成音乐库。
这里,音乐库中的音乐都关联有对应的音乐标签。
当然服务器在完善音乐库的时候,还可以获取其他网络平台音乐类的相关信息,比如百度知道等的问答数据,参见图7,图7为本发明实施例提供的一个可选的音乐标签的来源示意图。如图7可见,提问者需要获取毕业典礼上欢快的音乐,网友的回答分别列出了该类相关的音乐:“白桦林”、“同桌的你”、“我们的纪念册”等,因此,服务器在构建音乐库的时候,可以为列举出的音乐关联上“毕业”、“欢快”的音乐标签,以丰富音乐标签的内容,为同样的音乐发现不同的标签。
步骤603:服务器获取待关联音乐标签的音乐的文本信息,并将该文本信息映射为对应的特征向量。
这里,特征向量的确定可以通过分词向量拼接、词向量模型映射等方式完成。
另外,词向量模型为基于word2vec模型构建的,采用上传的用户数据的音乐文本信息样本,根据文本信息样本对应的特征向量、模型输出的目标特征向量及损失函数值对该词向量模型进行训练,以提高模型的输出精度。
步骤604:计算待关联音乐标签的音乐对应的特征向量与音乐库中各音乐的特征向量的相似度。
步骤605a:确定与音乐对应的特征向量的相似度最大的第一目标特征向量,将该第一目标特征向量对应的音乐确定为目标音乐。
步骤605b:确定相似度达到预设相似度阈值对应的第二目标特征向量,将该第二目标特征向量对应的音乐确定为目标音乐。
这里,可以预设相似度阈值,将得到的每个相似度与该相似度阈值进行比较,确定达到该相似度阈值的相似度对应的第二目标特征向量,进而确定对应的目标音乐。
比如,可以预设相似度阈值为0.2,将计算得到的相似度大于0.2的特征向量对应的音乐确定为目标音乐。参见图8,图8为本发明实施例提供的待关联标签音乐的示意图。如图8可知,与音乐库中的关联有“儿歌”标签的音乐的特征向量的相似度达到阈值0.2的是“16别看我只是一只羊”和“17幸福拍手歌”,因此,该“16别看我只是一只羊”和“17幸福拍手歌”可以与“儿歌”的音乐标签进行关联。
这里需要说明的是,步骤605a和步骤605b是确定目标音乐的两种实施方式,不代表执行顺序。
步骤606:将目标音乐的音乐标签与待关联音乐标签的音乐进行关联。
这里,如果目标音乐只有一个,则直接将该目标音乐的音乐标签与待关联音乐标签的音乐进行关联;
如果目标音乐有多个,则可以根据标签的类别,筛选不同类别的音乐标签与该音乐关联。
步骤607:终端根据更新音乐标签和音乐的关联关系,并显示。
这里,终端则可以根据新建立的关联关系,更新音乐标签和音乐的关联关系,从而在不同的音乐标签下,显示该音乐,以实现对音乐的音乐标签的丰富化。
通过将待关联音乐标签的音乐的文本信息映射为对应的特征向量,计算该特征向量与音乐库中的各音乐的特征向量的相似度,进而根据相似度的大小,来确定音乐库中与该待关联音乐标签的音乐对应的目标音乐,将该目标音乐的音乐标签与待关联音乐标签的音乐进行关联;如此,通过对不同音乐的特征向量的相似度计算实现音乐标签的自动关联,提高了为音乐关联音乐标签的效率。
下面继续说明本发明实施例提供的音乐标签的关联装置,在一些实施例中,音乐标签的关联装置可采用软件模块的方式实现。参见图9,图9为本发明实施例提供的音乐标签的关联装置的结构示意图,本发明实施例提供的音乐标签的关联装置900包括:
获取单元901,用于获取待关联音乐标签的音乐的文本信息;
映射单元902,用于将所述音乐的文本信息映射为相应的特征向量;
计算单元903,用于分别获取所述特征向量与音乐库中各音乐的特征向量的相似度,所述音乐库中的音乐关联有音乐标签;
确定单元904,用于基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐;
关联单元905,用于将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,以使关联后的音乐存在与所述目标音乐相同的音乐标签。
在一些实施例中,所述映射单元902,还用于对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行向量映射,得到所述词序列中各个分词的向量;
将得到的所述各个分词的向量进行拼接,得到对应所述文本信息的所述特征向量。
在一些实施例中,所述映射单元902,还用于对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行编码,得到对应所述词序列的编码向量;
将所述词序列的编码向量输入至词向量模型,得到对应所述文本信息的所述特征向量。
在一些实施例中,模型训练单元906,用于将音乐的文本信息样本所对应的编码向量样本输入至所述词向量模型,输出对应所述编码向量样本的特征向量;
基于所述编码向量样本的特征向量及目标特征向量,确定所述词向量模型的损失函数的值;
基于所述词向量模型的损失函数的值,更新所述词向量模型的模型参数。
在一些实施例中,所述确定单元904,还用于确定与所述音乐对应的特征向量的相似度最大的第一目标特征向量;
将音乐库中对应所述第一目标特征向量的音乐作为目标音乐。
在一些实施例中,所述确定单元904,还用于获取与所述音乐对应的特征向量的相似度达到相似度阈值的第二目标特征向量;
将音乐库中对应所述第二目标特征向量的音乐作为目标音乐。
在一些实施例中,所述关联单元905,还用于当所述第二目标特征向量的数量为多个时,分别获取各所述第二目标特征向量对应的音乐的音乐标签;
从获取的所述音乐标签中筛选得到不同类型的音乐标签;
将筛选得到的所述不同类型的音乐标签与所述待关联音乐标签的音乐进行关联。
这里需要指出的是:以上涉及装置的描述,与上述方法描述是类似的,同方法的有益效果描述,不做赘述,对于本发明实施例所述装置中未披露的技术细节,请参照本发明方法实施例的描述。
本发明实施例还提供了一种音乐标签的关联装置,所述装置包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的音乐标签的关联方法。
本发明实施例还提供了一种存储介质,所述存储介质存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的音乐标签的关联方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。

Claims (10)

1.一种音乐标签的关联方法,其特征在于,所述方法包括:
获取待关联音乐标签的音乐的文本信息;
将所述音乐的文本信息映射为相应的特征向量;
分别获取所述特征向量与音乐库中各音乐的特征向量的相似度,所述音乐库中的音乐关联有音乐标签;
基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐;
将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,以使关联后的音乐存在与所述目标音乐相同的音乐标签。
2.如权利要求1所述的方法,其特征在于,所述将所述音乐的文本信息映射为相应的特征向量,包括:
对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行向量映射,得到所述词序列中各个分词的向量;
将得到的所述各个分词的向量进行拼接,得到对应所述文本信息的所述特征向量。
3.如权利要求1所述的方法,其特征在于,所述将所述音乐的文本信息映射为相应的特征向量,包括:
对音乐的文本信息进行分词处理,得到包含多个分词的词序列;
分别对所述词序列中的分词进行编码,得到对应所述词序列的编码向量;
将所述词序列的编码向量输入至词向量模型,得到对应所述文本信息的所述特征向量。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
将音乐的文本信息样本所对应的编码向量样本输入至所述词向量模型,输出对应所述编码向量样本的特征向量;
基于所述编码向量样本的特征向量及目标特征向量,确定所述词向量模型的损失函数的值;
基于所述词向量模型的损失函数的值,更新所述词向量模型的模型参数。
5.如权利要求1所述的方法,其特征在于,所述基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐,包括:
确定与所述音乐对应的特征向量的相似度最大的第一目标特征向量;
将音乐库中对应所述第一目标特征向量的音乐作为目标音乐。
6.如权利要求1所述的方法,其特征在于,所述基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐,包括:
获取与所述音乐对应的特征向量的相似度达到相似度阈值的第二目标特征向量;
将音乐库中对应所述第二目标特征向量的音乐作为目标音乐。
7.如权利要求6所述的方法,其特征在于,所述将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,包括:
当所述第二目标特征向量的数量为多个时,分别获取各所述第二目标特征向量对应的音乐的音乐标签;
从获取的所述音乐标签中筛选得到不同类型的音乐标签;
将筛选得到的所述不同类型的音乐标签与所述待关联音乐标签的音乐进行关联。
8.一种音乐标签的关联装置,其特征在于,所述装置包括:
获取单元,用于获取待关联音乐标签的音乐的文本信息;
映射单元,用于将所述音乐的文本信息映射为相应的特征向量;
计算单元,用于分别获取所述特征向量与音乐库中各音乐的特征向量的相似度,所述音乐库中的音乐关联有音乐标签;
确定单元,用于基于所述相似度的大小,确定所述音乐库中与所述待关联音乐标签的音乐对应的目标音乐;
关联单元,用于将所述目标音乐的音乐标签与所述待关联音乐标签的音乐进行关联,以使关联后的音乐存在与所述目标音乐相同的音乐标签。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
模型训练单元,用于将音乐的文本信息样本所对应的编码向量样本输入至所述词向量模型,输出对应所述编码向量样本的特征向量;
基于所述编码向量样本的特征向量及目标特征向量,确定所述词向量模型的损失函数的值;
基于所述词向量模型的损失函数的值,更新所述词向量模型的模型参数。
10.一种音乐标签的关联装置,其特征在于,所述装置包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至7任一项所述的音乐标签的关联方法。
CN201910817788.8A 2019-08-30 2019-08-30 音乐标签的关联方法、装置及存储介质 Active CN110516109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910817788.8A CN110516109B (zh) 2019-08-30 2019-08-30 音乐标签的关联方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910817788.8A CN110516109B (zh) 2019-08-30 2019-08-30 音乐标签的关联方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110516109A true CN110516109A (zh) 2019-11-29
CN110516109B CN110516109B (zh) 2022-06-07

Family

ID=68628714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910817788.8A Active CN110516109B (zh) 2019-08-30 2019-08-30 音乐标签的关联方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110516109B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328833A (zh) * 2020-11-09 2021-02-05 腾讯科技(深圳)有限公司 标签处理方法、装置及计算机可读存储介质
CN113486197A (zh) * 2021-06-28 2021-10-08 特赞(上海)信息科技有限公司 多媒体的标签管理方法、装置、设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171772A (ja) * 2005-12-26 2007-07-05 Clarion Co Ltd 音楽情報処理装置、音楽情報処理方法および制御プログラム
CN104462537A (zh) * 2014-12-24 2015-03-25 北京奇艺世纪科技有限公司 一种音频数据分类方法及装置
CN105843931A (zh) * 2016-03-30 2016-08-10 广州酷狗计算机科技有限公司 一种进行分类的方法和装置
US20160322066A1 (en) * 2013-02-12 2016-11-03 Google Inc. Audio Data Classification
CN106503184A (zh) * 2016-10-24 2017-03-15 海信集团有限公司 确定目标文本所属业务类别的方法及装置
CN108268544A (zh) * 2016-12-30 2018-07-10 北京酷我科技有限公司 一种歌曲的标注方法及系统
CN110110137A (zh) * 2019-03-19 2019-08-09 咪咕音乐有限公司 一种确定音乐特征的方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171772A (ja) * 2005-12-26 2007-07-05 Clarion Co Ltd 音楽情報処理装置、音楽情報処理方法および制御プログラム
US20160322066A1 (en) * 2013-02-12 2016-11-03 Google Inc. Audio Data Classification
CN104462537A (zh) * 2014-12-24 2015-03-25 北京奇艺世纪科技有限公司 一种音频数据分类方法及装置
CN105843931A (zh) * 2016-03-30 2016-08-10 广州酷狗计算机科技有限公司 一种进行分类的方法和装置
CN106503184A (zh) * 2016-10-24 2017-03-15 海信集团有限公司 确定目标文本所属业务类别的方法及装置
CN108268544A (zh) * 2016-12-30 2018-07-10 北京酷我科技有限公司 一种歌曲的标注方法及系统
CN110110137A (zh) * 2019-03-19 2019-08-09 咪咕音乐有限公司 一种确定音乐特征的方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328833A (zh) * 2020-11-09 2021-02-05 腾讯科技(深圳)有限公司 标签处理方法、装置及计算机可读存储介质
CN112328833B (zh) * 2020-11-09 2024-03-26 腾讯科技(深圳)有限公司 标签处理方法、装置及计算机可读存储介质
CN113486197A (zh) * 2021-06-28 2021-10-08 特赞(上海)信息科技有限公司 多媒体的标签管理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN110516109B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
Briot et al. Deep learning techniques for music generation--a survey
Zhao et al. Learning deep features to recognise speech emotion using merged deep CNN
CN109840287A (zh) 一种基于神经网络的跨模态信息检索方法和装置
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN110210032A (zh) 文本处理方法及装置
CN115393692A (zh) 基于生成式预训练语言模型的联想文本到图像生成方法
CN110232123A (zh) 文本的情感分析方法及其装置、计算设备与可读介质
CN109271539A (zh) 一种基于深度学习的图像自动标注方法及装置
CN111858943A (zh) 音乐情感识别方法及装置、存储介质和电子设备
CN109829482A (zh) 歌曲训练数据处理方法、装置及计算机可读存储介质
CN110136689A (zh) 基于迁移学习的歌声合成方法、装置及存储介质
CN110162766A (zh) 词向量更新方法和装置
CN110516109A (zh) 音乐标签的关联方法、装置及存储介质
CN110377910A (zh) 一种表格描述的处理方法、装置、设备及存储介质
CN108268629A (zh) 基于关键词的图像描述方法和装置、设备、介质、程序
Carta et al. Incremental training of a recurrent neural network exploiting a multi-scale dynamic memory
CN108475346A (zh) 神经随机访问机器
CN110110137A (zh) 一种确定音乐特征的方法、装置、电子设备及存储介质
Zhong et al. MusicCNNs: a new benchmark on content-based music recommendation
US11244166B2 (en) Intelligent performance rating
CN117011745A (zh) 一种数据处理方法、装置、计算机设备以及可读存储介质
Hamanaka et al. Time-span tree leveled by duration of time-span
CN114791950A (zh) 基于词性位置与图卷积网络的方面级情感分类方法及装置
CN113723111A (zh) 一种小样本意图识别方法、装置、设备及存储介质
Law et al. Ltsg: Latent topical skip-gram for mutually improving topic model and vector representations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant