CN114048347A - 歌曲标签整理、访问方法及其装置、设备、介质、产品 - Google Patents

歌曲标签整理、访问方法及其装置、设备、介质、产品 Download PDF

Info

Publication number
CN114048347A
CN114048347A CN202111333487.1A CN202111333487A CN114048347A CN 114048347 A CN114048347 A CN 114048347A CN 202111333487 A CN202111333487 A CN 202111333487A CN 114048347 A CN114048347 A CN 114048347A
Authority
CN
China
Prior art keywords
song
tag
list
inductive
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111333487.1A
Other languages
English (en)
Inventor
肖翔
贺佳敏
梁海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Geshen Information Technology Co ltd
Original Assignee
Guangzhou Geshen Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Geshen Information Technology Co ltd filed Critical Guangzhou Geshen Information Technology Co ltd
Priority to CN202111333487.1A priority Critical patent/CN114048347A/zh
Publication of CN114048347A publication Critical patent/CN114048347A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及歌曲检索技术领域,公开一种歌曲标签整理、访问方法及其装置、设备、介质、产品,所述整理方法包括:获取曲库中的目标歌曲;查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。本申请以歌单为曲库中的目标歌曲的标签素材来源,利用歌单相对应的自有标签集为目标歌曲打标,便于据此为用户所收藏的歌曲制备归纳标签,方便用户精准高效地查询其自身收藏的大量歌曲。

Description

歌曲标签整理、访问方法及其装置、设备、介质、产品
技术领域
本申请涉及歌曲检索技术领域,尤其涉及一种歌曲标签整理、访问方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
随着人们精神文明生活质量的提升,个人歌曲库中的歌曲总量越来越庞大,为方便用户在其曲库中快速访问歌曲,现有技术为用户提供了多种方式用于实现歌曲的快速查找,包括利用歌曲的多种预设属性进行打标、利用歌单进行批量归类、利用其他人工标记进行索引等,这些方式理论上均可以在某种程度上简化用户检索目标歌曲的复杂度,但是,这些方式普遍存在标签颗粒度大、歌曲覆盖不全面等现象,因此,标签分类效果不佳。
另一方面,如果由提供歌曲访问功能的平台官方负责歌曲的打标,利用权威标签来给用户进行歌曲整理,又会涉及大量具有音乐背景的人员进行人工手动标注歌曲标签的问题,以及也带来相应的维护更新的问题,因此不可避免会存在以下具体问题:
1、成本高企,需要专业人力成本长时间的标注积累工作;
2、由于现有曲库的歌曲数量达到千万级,会出现歌曲标签稀疏的问题,同时标签的召回情况也不够乐观。
综上,因为现有歌曲存在标签数据歌曲覆盖不全的问题,所以现有标签数据很难应用在整理歌曲的方向上,针对歌曲整理需求,需要另辟蹊径。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种歌曲标签整理、访问方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品,以实现辅助音乐创作。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种歌曲标签整理方法,包括如下步骤:
获取曲库中的目标歌曲;
查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;
统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。
深化的实施例中,所述查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合的步骤中:
该标签集合的第二标签子集为该目标歌曲所携带的属性数据相映射的属性标签集,和/或,
该标签集合的第三标签子集包含该目标歌曲所携带的人工标记标签,该人工标记标签用于表示目标歌曲所归属的音乐流派。
扩展的实施例中,所述获取曲库中的目标歌曲的步骤之前,包括如下步骤:
采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集。
深化的实施例中,所述采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集,包括如下步骤:
获取所述歌单库中的每个歌单的描述文本;
采用所述神经网络模型中的词向量模型提取所述描述文本的词向量表示;
采用所述神经网络模型中的词编码模型对所述词向量表示进行特征提取,获得相应的文本特征向量;
采用所述神经网络模型中的分类器对所述文本特征向量进行分类,获得分类结果中的多个标签,将所述多个标签存储为所述歌单相对应的自有标签集。
扩展的实施例中,本申请歌曲标签整理方法还包括如下预训练所述神经网络模型的步骤:
获取数据集,该数据集包括多个训练样本,每个训练样本包含一个歌单相对应的描述文本;
对每个训练样本的描述文本进行规则匹配,获得所述描述文本相对应的标签,作为该描述文本的监督标签,使该数据集构成训练集;
在单次训练任务中,采用所述训练集中任意一个训练样本对所述神经网络模型实施训练,获得其对该训练样本的描述文本进行分类后的分类标签;
根据该训练样本中的监督标签计算所述分类标签的损失值,以该损失值对该神经网络模型实施梯度更新,启用所述训练集中的下一训练样本对该神经网络模型实施迭代训练,直至所述神经网络模型收敛而完成当次任务训练,获得所述神经网络模型的中间状态实例;
采用所述神经网络模型的中间状态实例对所述训练集中的各个训练样本的描述文本进行分类预测,利用分类结构匹配预设阈值确定出每个训练样本相对应的分类标签,以所述分类标签更新相应的训练样本的监督标签,完成训练集的更新;
启用下一训练任务,采用更新后的训练集对所述神经网络模型实施任务迭代训练,直至所述神经网络模型的中间状态实例达致收敛状态或者其预测准确率达致预设阈值。
深化的实施例中,所述统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签的步骤之后,还包括如下步骤:
响应用户的歌曲标签整理请求,获取由该用户所收藏的歌曲所构成的歌曲列表;
获取所述歌曲列表中每首收藏歌曲所持有的归纳标签;
根据所述归纳标签对所述歌曲列表中的收藏歌曲进行聚类,存储每个归纳标签与其下属收藏歌曲之间的映射关系数据;
将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示。
扩展的实施例中,所述将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示的步骤之后,包括如下步骤:
响应所述用户针对所述归纳列表中的任意归纳标签提交的歌曲查询请求,根据所述映射关系数据获取由该归纳标签相对应的收藏歌曲构成的归纳歌曲列表;
将所述归纳歌曲列表推送至所述用户的终端设备显示。
适应本申请的目的之一而提供的一种歌曲标签访问方法,包括如下步骤:
响应作用于歌曲整理控件的操作指令而向服务器发送歌曲标签整理请求,以获得服务器整理当前用户的收藏歌曲后返回的用于封装所述收藏歌曲的归纳标签的归纳列表;
解析显示所述归纳列表中的各个归纳标签,将各归纳标签解析为适于响应触控操作的控件;
响应作用于任意所述归纳标签的操作指令而向服务器发送歌曲查询请求,以获得服务器根据该歌曲查询请求查询携带该归纳标签的收藏歌曲所构成的归纳歌曲列表;
解析显示所述归纳歌曲列表中的收藏歌曲,将各首收藏歌曲解析为适于响应触控操作而播放。
较佳的实施例中,所述归纳列表中的归纳标签,属于其下属的各首歌曲所隶属的歌单相映射的自有标签集的共有标签。
适应本申请的目的之一而提供的一种歌曲标签整理装置,包括:曲库调用模块、标签查询模块,以及标签归纳模块,其中,所述曲库调用模块,用于获取曲库中的目标歌曲;所述标签查询模块,用于查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;所述标签归纳模块,用于统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。
适应本申请的目的之一而提供的一种歌曲标签访问装置,包括:一键整理模块、标签列示模块、标签详查模块,以及歌曲显示模块,其中,所述一键整理模块,用于响应作用于歌曲整理控件的操作指令而向服务器发送歌曲标签整理请求,以获得服务器整理当前用户的收藏歌曲后返回的用于封装所述收藏歌曲的归纳标签的归纳列表;所述标签列示模块,用于解析显示所述归纳列表中的各个归纳标签,将各归纳标签解析为适于响应触控操作的控件;所述标签详查模块,用于响应作用于任意所述归纳标签的操作指令而向服务器发送歌曲查询请求,以获得服务器根据该歌曲查询请求查询携带该归纳标签的收藏歌曲所构成的归纳歌曲列表;所述歌曲显示模块,用于解析显示所述归纳歌曲列表中的收藏歌曲,将各首收藏歌曲解析为适于响应触控操作而播放。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的歌曲标签整理、访问方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的歌曲标签整理、访问方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的优势如下:
首先,本申请利用曲库中的目标歌曲所归属的多个歌单,确定由该目标歌曲的各个歌单相对应的自有标签集所构成的标签集合,然后针对该标签集合中的每个标签查询其命中歌单库中的歌单的自有标签集的频次,实现对每一首目标歌曲相对应的标签集合中的每个标签的投票,然后利用标签集合中各个标签的频次高低,确定其中满足预设条件的部分标签作为相应的目标歌曲的归纳标签,由于投票单位是歌单库中的歌单的自有标签集,因此,一个标签的命中频次越高,表示根据所述目标歌曲被大众收藏的歌单的描述文本的语义,该标签越适合于描述其相应的所述目标歌曲,因此,以该标签描述该目标歌曲更为准确,据此,可以实现对曲库中的歌曲的高效准确的标注。
其次,本申请中,据以确定目标歌曲的标签来自与歌单相对应的自有标签集,而歌单的描述文本一般是以场景、心情之类的文字加以描述,因此,其自有标签集中的标签一般也携带相应的场景、心情描述词汇,歌单具有用户自定义的特点,能够更精细、更全面地描述相应的场景、心情等,因此,相应的标签往往也携带了这些特点,据此获得的标签,粒度更细,更符合用户自然思考习惯,因此更能精准体现分类标注效果,还能克服标签稀疏的不足,方便提升标签召回率。
此外,利用歌单的特点来为曲库中的歌曲打标,可以降低人工标注的必要性,有效节省歌曲的标注成本,对于需要处理海量音乐文件的平台方而言,不仅可以大大提升全量曲库的整理效率,还可以节约巨额的人工标注成本。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的歌曲标签整理方法的典型实施例的流程示意图;
图2为本申请实施例中增加前置提取歌单的自有标签集的流程示意图;
图3为本申请实施例中采用的神经网络模型的架构示意图;
图4为本申请实施例中的神经网络模型的工作过程的流程示意图;
图5为本申请实施例中的神经网络模型的训练过程的流程示意图;
图6为本申请实施例中响应歌曲标签整理请求而推送归纳列表的过程的流程示意图;
图7(a)、图7(b)、图7(c)为本申请实施例中终端设备图形用户界面的示意图,分别示意出歌曲整理控件界面、归纳标签显示界面、归纳歌曲列表界面;
图8为本申请实施例中响应歌曲标签整理请求而推送归纳列表、归纳歌曲列表的过程的流程示意图;
图9为本申请的歌曲标签访问方法的典型实施例的流程示意图;
图10为本申请的歌曲标签整理装置的原理框图;
图11为本申请的歌曲标签访问装置的原理框图;
图12为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种歌曲标签整理方法,可被编程为计算机程序产品,部署于服务器中运行而实现,藉此,客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程实现人机交互。
请参阅图1,本申请的歌曲标签整理方法,在其典型实施例中,包括如下步骤:
步骤S3100、获取曲库中的目标歌曲:
提供在线音乐下载和播放互联网服务的平台方的后台服务器,维护一个由海量的歌曲文件组成的曲库。该曲库所采用的数据存储技术可以灵活选用和部署,可以分布式存储或集中存储,均不影响本申请的实施。曲库中的歌曲的数据格式可以涵盖所有已知或未知的格式,包括但不限于以下常见的音频格式:mp3、aac/mp4、ape/flac、wav、wma、amr、mid,此外,考虑到越来越多的歌曲被关联视频内容而实现为音视频流媒体,因此,本申请所称的歌曲的数据格式还包括但不限于如下常见的视频格式:mp4/m4v/3gp/mpg、flv/f4v/swf、avi、gif、wmv、rmvb、mov、mts/m2t、webm/ogg/mkv。应当理解,本申请曲库中的歌曲,是针对其相应的多媒体文件被播放后所展现的内容而言,其所展现的内容为人耳可收听的音乐,通常是一首俗称的歌曲,包括有歌词或无歌词的形式,至于其存储形式及其存储格式,均不影响本申请创造精神的体现。
曲库中海量的歌曲,可以分别被平台中的不同用户所收藏,以便不同的用户可以快捷地访问其自身所收藏的歌曲,用户与其收藏的歌曲之间的映射关系数据,由后台服务器负责维护,据此,用户可以通过相关的映射关系数据,访问自身所合法获取的歌曲。
本申请中,可以通过对曲库中的歌曲进行标签整理,为每首歌曲进行打标,以便实现歌曲的分类和快速访问,为此,需要针对曲库的歌曲中的需要进行标签整理的目标歌曲进行相应的处理。对此,可以针对这些需要进行标签整理的目标歌曲进行相应的调用。
步骤S3200、查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集:
为了实现对目标歌曲的标签整理,本申请借助目标歌曲所属的歌单所携带的自有标签集,来确定每首目标歌曲相对应的标签集合。
一般而言,平台服务器会支持以歌单的形式来实现对多首歌曲的封装。每个歌单一般以一个描述文本作为标题,而封装从曲库中选取的多首歌曲。在后台数组组织上,相应建立所述描述文本到各首相应的歌曲之间的映射关系即可。通常歌单的描述文本所采用的词汇较为灵活,可以通过各种词汇实现对场景、心情等类型内容的描述,来表示歌单所拥有的歌曲的共同特点,以便用户可通过歌单标题一目了然地了解其中各首歌曲之间的共性。
歌单的表现形式也多种多样,例如,歌单可以是平台推荐的,也可以是用户自定义的,因此,可以表现为平台的推荐列表、表现为歌手或发行公司出品的专辑列表,还可以表现为用户的自定义歌单列表等不同形式。
为了描述各个歌单的特点,平台可以预先为每个歌单打标,使每个歌单均拥有一个自有标签集,该自有标签集由一个或多个标签构成。歌单的自有标签集中的标签,既可以是平台根据规则匹配提取关键词形成的,也可以是用户自行定义的,甚至还可以是如本申请后续的实施例所揭示,通过提取歌单的描述文本的深层语义信息进行分类映射所获得的。
故而,海量的歌单构成歌单库,可由后台服务器访问调用。歌单库中可以存储每一歌单与其自身相对应的自有标签集之间的映射关系数据,以便通过一个歌单可以快速获取其相对应的自有标签集。
为了获得每首目标歌曲相对应的标签集合,本实施例中,可以通过查询该目标歌曲所隶属的歌单的自有标签集来实现。不难理解,同一首歌曲可能被不同歌单所收藏,因此,同一目标歌曲可以对应隶属于多个歌单,而每个歌单均拥有自身相对应的自有标签集,因此,对应多个歌单的同一目标歌曲,通过向歌单库查询,可以其得该首目标歌曲所隶属的多个歌单一一对应的多个自有标签集,这些自有标签集的集合构成该首目标歌曲的标签集合的第一标签子集,也即第一标签子集为相应的目标歌曲所映射的多个自有标签集的合集。对于多个自有标签集中包含相同标签的情况,自然被合并为同一标签。至此,针对一首目标歌曲,便可获得其相应的标签集合,本实施例中,该标签集合主要由其中的第一标签子集构成。
在本典型实施例的基础上变通实施的其他实施例中,目标歌曲自身相对应的标签集合,还可以包括第二标签子集和/或第三标签子集。
所述的第二标签子集,可以是每首目标歌曲自身所携带的属性数据相映射的标签所构成的属性标签集,可以由本领域技术人员通过规则匹配或者语义映射的方式,根据歌曲所携带的属性数据进行关联获取,例如:歌曲发行日期可以关联出标签:经典老歌;歌曲语言可以关联中文、英文、粤语等语言类标签,歌曲节拍BPM(BeatPerMinute)可以关联标签:快歌、慢歌,等等。本领域技术人员可据此灵活设定,用于为目标歌曲提供基于歌曲自身属性的分类参考。
所述的第三标签子集,可以是每首目标歌曲自身所携带的人工标记标签,用于表示目标歌曲所属的音乐流派,示例而言,流派类标签包括:古风,摇滚,民谣,电音,DJ等等。一般而言,此类标签可由后台专业人员支持而表现为专业分类标签,用于为目标歌曲的打标提供专业分类参考。
所述的第二标签子集与第三标签子集,均可由本领域技术人员灵活实现,后续可与本申请为目标歌曲所确定的归纳标签一起,构成目标歌曲的标签集合,提供给终端设备进行调用访问。
通过以上的过程,可以看出,后台服务器可以针对曲库中的每首歌曲,通过查询获取其相应的标签集合,这一标签集合未经优化,为针对每首目标歌曲根据以上业务逻辑所提取的全量标签,理论上,这些标签分别从不同角度对目标歌曲进行了描述,故实现对目标歌曲的打标,这一全量的标签集合也可与目标歌曲构成映射关系数据进行存储,以备后续调用。
步骤S3300、统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签:
为了提升对目标歌曲打标描述的精炼程度,本步骤通过对每首目标歌曲的所述标签集合进行过滤优化来实现,本典型实施例中,主要是对所述标签集合中的第一标签子集进行过滤。具体而言,针对每首目标歌曲,统计其相应的标签集中的每个标签命中所述歌单库中歌单相对应的自有标签的频次,也即利用各个自有标签集对目标歌曲的标签集合中的每个标签进行投票,所述频次即为相应的投票数,从而获得由该目标歌曲中每个标签相对应的频次构成的频次序列,然后根据频次高低对该首目标歌曲的标签集合中的各个标签进行逆向排序使频次序列中的标签根据频次自高至低进行排列,最终从排序后的频次序列中选取出预定数量的N个标签,作为该首目标歌曲相对应的最终归纳标签,构成该首歌曲的归纳标签集合。
以上示例中,从频次序列中优选出的归纳标签,被匹配以预设条件,该预设条件被设定为优选出所述频次靠前的N个标签作为目标歌曲的归纳标签,其中N为大于0的正整数。而在其他变通实施的示例中,所述预设条件也可配置为从频次序列中优选出频次大于给定的预设阈值的标签作为归纳标签。诸如此类,表明所述的预设条件可由本领域技术人员灵活设定并编程实现,并不影响本申请的实施。
需要指出的是,在目标歌曲的所述标签集合包含了所述第二标签子集和第三标签子集的实施例中,如果第二标签子集、第三标签子集的标签体系与第一标签子集互相独立,则在进行频次统计时,第二标签子集与第三标签子集均可以不参与统计,而可在后续直接作为归纳标签输出。反之,如果第一标签子集兼容第二标签子集和/或第三标签子集中的标签,则可将第二标签子集与第三标签子集中的标签视同第一标签子集中的标签进行频次统计,也不影响本申请的实施。
根据以上过程,针对曲库中的每首目标歌曲,均可获得其相对应的归纳标签集合,即每首目标歌曲均获得其相对应的一个或多个归纳标签,据此,便可将每首目标歌曲与其归纳标签之间的映射关系数据进行关联存储,以便后续快速获取曲库中每首目标歌曲相对应的归纳标签。不难理解,同一归纳标签可能映射至曲库中的多首目标歌曲,同一目标歌曲一般也会映射至多个归纳标签,目标歌曲与归纳标签之间,构成一种多对多的数据组织形式,通过目标歌曲或者通过归纳标签,均可起到相互索引的作用,为基于目标歌曲查找归纳标签或反之基于归纳标签查找歌曲提供了技术基础。
通过以上对本典型实施例的揭示,可以看出,本申请的实施,具备诸多积极效果,包括但不限于如下方面:
首先,本申请利用曲库中的目标歌曲所归属的多个歌单,确定由该目标歌曲的各个歌单相对应的自有标签集所构成的标签集合,然后针对该标签集合中的每个标签查询其命中歌单库中的歌单的自有标签集的频次,实现对每一首目标歌曲相对应的标签集合中的每个标签的投票,然后利用标签集合中各个标签的频次高低,确定其中满足预设条件的部分标签作为相应的目标歌曲的归纳标签,由于投票单位是歌单库中的歌单的自有标签集,因此,一个标签的命中频次越高,表示根据所述目标歌曲被大众收藏的歌单的描述文本的语义,该标签越适合于描述其相应的所述目标歌曲,因此,以该标签描述该目标歌曲更为准确,据此,可以实现对曲库中的歌曲的高效准确的标注。
其次,本申请中,据以确定目标歌曲的标签来自与歌单相对应的自有标签集,而歌单的描述文本一般是以场景、心情之类的文字加以描述,因此,其自有标签集中的标签一般也携带相应的场景、心情描述词汇,歌单具有用户自定义的特点,能够更精细、更全面地描述相应的场景、心情等,因此,相应的标签往往也携带了这些特点,据此获得的标签,粒度更细,更符合用户自然思考习惯,因此更能精准体现分类标注效果,还能克服标签稀疏的不足,方便提升标签召回率。
此外,利用歌单的特点来为曲库中的歌曲打标,可以降低人工标注的必要性,有效节省歌曲的标注成本,对于需要处理海量音乐文件的平台方而言,不仅可以大大提升全量曲库的整理效率,还可以节约巨额的人工标注成本。
请参阅图2,扩展的实施例中,所述步骤S3100、获取曲库中的目标歌曲的步骤之前,包括如下步骤:
步骤S2000、采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集:
本申请中,为了获得所述歌单库中的歌单相对应的自有标签集,采用预训练的神经网络模型对歌单提取深层语义信息之后分类来实现,经神经网络模型分类之后,获得该深层语义信息映射到预设标签体系中各个标签相对应的分类概率,优选出其中分类概率超过预设阈值的多个标签,便可构成歌单相对应的标签,利用这些标签构成该歌单相对应的自有标签集。据此,歌单库中的每个歌单均可获得其相对应的自有标签集。自有标签集的提取,可由服务器在后台实现。
所述的神经网络模型,其基本原理在于针对歌单中的描述文本进行表示学习,提取出其深层主义信息,然后再行分类,因此,借助基于CNN、RNN等神经网络模型均可实施,例如,采用Bert、AlBert、Electra等模型用于提取描述文本的深层语义信息,采用Softmax用于基于深层语义信息进行多分类处理等。本领域技术人员能够理解,只要根据以上原理采用适当的神经网络模型,在其基础上进行训练,使其习得根据歌单的描述文本而获得该歌单相应的自有标签集的网络架构,均可用于本申请中为歌单提取其自有标签集。利用这种预训练后的神经网络模型提取出每个歌单相对应的自有标签集后,便可将歌单与自有标签集构造为映射关系数据进行存储,以备调用。
深化的实施例中,所述步骤S2000、采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集,请参阅图3,本实施例采用一个更为具体的神经网络模型架构,其中采用AlBert对描述文本进行词向量表示,采用TextCNN对词向量进行上下文梳理,利用模型的轻量特性,来实现更有效率的标签提取成效,据此,本实施例中,如图4所示,所述步骤S2000还包括如下步骤:
步骤S2100、获取所述歌单库中的每个歌单的描述文本:
图3所示的模型中,针对歌单库中的每个歌单,以该歌单的描述文件为输入。由于歌单中的描述文本较为简洁,可以不必设置复杂的预处理操作,或者适量进行文本预处理即可,例如去除其中的表情符、标点符号等。
步骤S2200、采用所述神经网络模型中的词向量模型提取所述描述文本的词向量表示:
本实施例的神经网络模型所采用的AlBert模型是一种轻量模型,AlBert是google开源的深度学习模型框架,常用于自然语言处理NLP领域的文本预训练,在本实施例中由其负责对所述描述文本进行词向量表示,将所述描述文件编码为词向量,以初步获得歌单的深层语义信息,然后提供给TextCNN进行上下文梳理。
步骤S2300、采用所述神经网络模型中的词编码模型对所述词向量表示进行特征提取,获得相应的文本特征向量:
所述神经网络模型中的词编码模型,即TextCNN模型,其通过一维卷积对歌单的描述文本相对应的词向量表示中的上下文信息进行编码梳理,从而获得每个歌单描述文本相对应的文本特征向量。
步骤S2400、采用所述神经网络模型中的分类器对所述文本特征向量进行分类,获得分类结果中的多个标签,将所述多个标签存储为所述歌单相对应的自有标签集:
所述词编码模型获得歌单的描述文本相对应的文本特征向量之后,将文本特征向量全连接映射到分类空间,由多分类器计算出所述文本特征向量映射到预设的标签分类体系中各个标签相对应的分类概率,获得分类结果。至此,根据与分类概率相对应的预设阈值,便可筛选出分类概率高于所述预设阈值的多个标签,构成歌单相应的自有标签集。
此处采用神经网络模型实现对歌单的自有标签集进行构造的相关实施例的引入,丰富了本申请进行目标歌曲打标所需的技术素材。由于神经网络模型经预训练后便可高度智能且准确地将歌单的描述文本映射至标签体系中的多个标签,因此,可以节省人力标注成本,并且可针对海量歌单全程自动化实现,大大提升了利用歌单获得其相对应的自有标签集的效率。
更进一步,由于歌单与其自有标签集中的标签基于深层语义信息进行映射,且歌单本身所采用的词汇具有灵活定义的特点,因此,标签数据覆盖较为全面,方便提取出粒度更为精细的标签,使得后续对曲库中的目标歌曲进行打标时,相应的归纳标签更具精准描述目标歌曲特点的作用。
请参阅图5,扩展的实施例中,本申请歌曲标签整理方法还包括如下预训练前一实施例所采用的神经网络模型的步骤:
步骤S1100、获取数据集,该数据集包括多个训练样本,每个训练样本包含一个歌单相对应的描述文本:
对于平台方而言,可以将其后台数据库中的歌单库或者外部获取的歌单库中的歌单作为数据集,用于制备训练所述神经网络模型所需的训练集。数据集中的每个歌单构成一个相应的训练样本,每个训练样本包含其相应的歌单的描述文本。较佳的,可以对所述描述文件进行适度的文本预处理操作,包括去除表情符、标点符号等。
步骤S1200、对每个训练样本的描述文本进行规则匹配,获得所述描述文本相对应的标签,作为该描述文本的监督标签,使该数据集构成训练集:
为了获得每个训练样本相对应的监督标签,可以预先构建相应的标签体系。一种实施方式中,可以基于规则匹配的原理,判断每个训练样本的描述文件中是否存在预设的标签体系中的标签相对应的文本,若存在,则将相应的标签标注为该描述文本相对应的监督标签。当数据集中的训练样本均被关联其相应的监督标签后,便构成了训练集,可用于对所述神经网络模型实施有监督训练。
不难理解,根据规则匹配获得的歌单相对应的标签是相对较为简单的,为了提升效率,所应用的规则可能较为简单,因此,歌单相对应的标签数量可能尚嫌不够全面,因此后续可通过不断完善训练集中的训练样本的监督标签来迭代完善。
步骤S1300、在单次训练任务中,采用所述训练集中任意一个训练样本对所述神经网络模型实施训练,获得其对该训练样本的描述文本进行分类后的分类标签:
本实施例中,可通过多次训练任务对所述神经网络模型实施任务迭代训练,以便不断升级所述神经网络模型的中间状态实例,最终获得成熟的可使用实例。
在一次训练任务中,通过遍历所述训练集中的每个训练样本,将每个训练样本的描述文本作为所述神经网络模型的输入,由该神经网络模型提取所述神经网络模型的深层语义信息相对应的文本特征向量进行分类,获得相应的分类结果,然后将该训练样本相对应的监督标签用于监督所述神经网络模型的分类结果,所述分类结果中,显示一个或多个分类标签具有较高的分类概率,其中具有较高分类概率的分类标签,可视为相应的歌单所映射的分类标签,可采用所述监督标签对其进行监督。所述神经网络模型基于描述文本提取深层语义信息的过程可参照前一实施例所揭示,此处恕不赘述。
步骤S1400、根据该训练样本中的监督标签计算所述分类标签的损失值,以该损失值对该神经网络模型实施梯度更新,启用所述训练集中的下一训练样本对该神经网络模型实施迭代训练,直至所述神经网络模型收敛而完成当次任务训练,获得所述神经网络模型的中间状态实例:
采用监督标签对神经网络模型的分类结果进行监督时,具体可根据相应的训练样本中的监督标签计算出该训练样本所获得的分类标签之间的损失值,然后根据该损失值对神经网络模型实施梯度更新,修正其网络权重,以使该神经网络模型的损失函数不断逼近收敛。由于采用分类器进行分类,因此,此处可采用交叉熵损失函数计算损失值。
在每一次训练任务中,可以通过计算所述的损失值是否接近于0、是否达致预设范围或者训练集中所有训练样本均已完成调用,而判断是否需要继续调用下一训练样本对所述神经网络模型继续训练。据此,如果以上判断条件任意一项成立,则可结束当次训练任务的训练。否则,回到所述步骤S1300,启用所述训练集中的下一训练样本,继续对所述神经网络模型实施迭代训练,使所述神经网络模型经训练不断逼近收敛状态。
当所述神经网络模型被训练至收敛时,完成当次训练任务,从而获得该神经网络模型执行本次训练任务之后的中间状态实例。理论上,如果出于简化的要求,该中间状态实例也可直接投入本申请中使用,否则,也可以通过本实施例的后续步骤继续提升该神经网络模型的习得能力。
步骤S1500、采用所述神经网络模型的中间状态实例对所述训练集中的各个训练样本的描述文本进行分类预测,利用分类结构匹配预设阈值确定出每个训练样本相对应的分类标签,以所述分类标签更新相应的训练样本的监督标签,完成训练集的更新:
为了提升所述神经网络模型的习得能力,本申请通过增加训练任务对其进行训练,据此,在任意次训练任务之后获得的所述神经网络模型的中间状态实例的基础上,采用该中间状态实例对所述训练集中的训练样本中的歌单描述文本进行分类预测,以便根据每个训练样本预测出的分类结果,为每个训练样本修正其监督标签。
对于每一训练样本被预测获得的分类结果,其中包含描述文本映射到预设标签体系中的各个标签相对应的分类概率,这一分类概率也表征了模型对相应标签的置信度,因此,通过采用相对应于所述分类概率的预设阈值与各个分类概率进行比较,可优选出分类概率高于所述预设阈值的标签作为相应的歌单相映射的一个或多个分类标签,然后,将这些分类标签替换相应的训练样本的监督标签,以此对每一训练样本一一修正,便可完成对所述训练集的更新。不难理解,更新后的训练集中训练样本相对应的监督标签,相对而言,更为丰富准确,其丰富准确程度也取决于所述预设阈值的设定,据此原理,本领域技术人员可灵活调节。
步骤S1600、启用下一训练任务,采用更新后的训练集对所述神经网络模型实施任务迭代训练,直至所述神经网络模型的中间状态实例达致收敛状态或者其预测准确率达致预设阈值:
采用最新的中间状态实例对训练集中的监督标签进行更新后,获得新的训练集,因此,在此基础上,可根据实际需要启动一个新的训练任务,采用最新的训练集,继续对所述神经网络模型进行新一次训练任务的迭代训练。本实施例中,即循环回到所述步骤S1300中执行即可。
判断是否需要启动下一训练任务对所述神经网络模型实施任务迭代训练的依据,可以利用前一次训练任务获得的神经网络模型的中间状态实例对预设的测试集中的训练样本进行分类预测,然后通过判断相应的预测准确率是否达致一个相应的预设阈值来确定是否需要重启训练。所述的测试集,可以是预先从所述训练集中分离出的部分数据,或者参照训练集独立制备的,对此,本领域技术人员可以灵活实施。
具体而言,采用上一次训练任务中的所述神经网络模型的中间状态实例对所述测试集中的各个训练样本逐一进行预测,获得相应的分类标签,再将分类标签与相应训练样本的监督标签进行比较,然后统计各个训练样本被准确预测出与其监督标签一致的分类标签的预测准确率,比较该预测准确率是否超过所述预设阈值,如果超过所述预设阈值则可以不再启用新训练任务进行迭代,否则便可启用新训练任务进行迭代。
另一变通实施的方式中,可由本领域技术人员根据先验知识和其他实测方式决定是否重启任务迭代训练,例如,可在任意一次训练任务执行完成后,观察当前获得的中间状态实例是否达到收敛状态,当达到收敛状态时,便可不再对神经网络模型启用任务迭代训练。
终止训练的神经网络模型,便可投入本申请中使用,利用该神经网络模型可以为歌单库中的各个歌单预测出其相对应的分类标签,这些分类标签便构成了相应的歌单的自有标签集。可以看出,本实施例的实施,丰富了本申请的技术效果,至少表现为如下各方面:
首先,本实施例的神经网络模型基于歌单的描述文本进行深层语义信息的提取,而歌单描述文件中的词汇丰富多样,因此可以更为全面地构建描述粒度更为精细的标签体系,故神经网络模型经训练后所获得的分类能力,能够基于歌单而确定出更为精细的标签用于构造歌单的自有标签集,精细而多样化的描述更便于目标歌曲的检索。
其次,本实施例的神经网络模型在训练过程中,采用同一训练集进行基于任务的多次迭代训练,通过每次训练获得的中间状态实例对训练集的训练样本预测分类标签用于更新相应的监督标签实现对训练集的更新,然后通过每次训练获得的中间状态实例对测试集进行预测,再分析其预测准确率是否达标,据此决定是否启动新的任务迭代训练,在新训练任务中,启用更新后的训练集,如此循环迭代,只需采用适量而非海量的训练样本,即可使神经网络模型的打标能力不断提升,既节省训练成本,又确保神经网络模型的分类精确度。
此外,本实施例中,使神经网络模型基于描述文本的深层语义信息即可映射出相应的标签,其所采用的网络架构较为简单易实现,对平台方而言,成本可控,高效更高,适合对平台方的后台数据进行深度数据挖掘,而体现歌单相应的数据价值。
请参阅图6,深化的实施例中,所述步骤S3300、统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签的步骤之后,每个目标歌曲均拥有了自身相对应的归纳标签集,在此基础上,便可向终端用户开放以归纳标签检索其所收藏的歌曲的服务,为实现这一功能,本实施例中,所述歌曲标签整理方法还包括如下步骤:
步骤S4100、响应用户的歌曲标签整理请求,获取由该用户所收藏的歌曲所构成的歌曲列表:
如图7(a)所示,用户可在其终端设备所安装的应用程序所展示的图形用户界面中,一键触发一个歌曲标签整理请求,该请求被发送至本申请的服务器,该服务器接收该请求后,对其进行响应。
服务器响应所述的请求,而调用所述用户相对应的个人曲库数据,所述个人曲库数据是用户自行收藏的歌曲所构成的数据,用户收藏的形式包括但不限于如下方式:免费购买、付费购买、添加至收藏夹、添加至歌单等,本实施例中,为理解的便利,可将所述个人曲库数据中的歌曲,理解为该用户个人账户相关联的可供该用户播放的全量歌曲。
据此,服务器便可将所述用户相对应的个人曲库数据,即该用户个人账户相关联的全量歌曲所构成的集合视为一个歌曲列表,以便在此歌曲列表的每首收藏歌曲的基础上为用户整理该歌曲列表相对应的归纳标签。
步骤S4200、获取所述歌曲列表中每首收藏歌曲所持有的归纳标签:
如前所述,本申请前文所述的各个实施例,已经对后台曲库中的全量歌曲进行了归纳标签的打标操作,因此,用户歌曲列表中的每首歌曲,理论上均存在与其相映射的一个或多个归纳标签,故而,服务器可以针对该用户的歌曲列表中的每首收藏歌曲,检索出其相对应的归纳标签集合。
步骤S4300、根据所述归纳标签对所述歌曲列表中的收藏歌曲进行聚类,存储每个归纳标签与其下属收藏歌曲之间的映射关系数据:
在获得歌曲列表中的收藏歌曲到其归纳标签集合的映射关系数据的基础上,服务器便可以采用任意聚类算法,根据归纳标签对所述歌曲列表中的收藏歌曲进行聚类。较为简单的方式,根据各个归纳标签统计其对应的收藏歌曲,建立每个归纳标签至其相关联的收藏歌曲之间的映射关系数据即可。当然,也可采用更为复杂的聚类算法来实现,例如可采用K-means聚类算法、均值漂移聚类算法、基于密度的聚类算法、用高斯混合模型(GMM)的最大期望(EM)聚类算法、凝聚层次聚类算法、图团体检测算法等等,可由本领域技术人员根据实际情况选用。最终,用户的歌曲列表中的所有收藏歌曲,会形成一个归纳标签集,可视为一个归纳列表,其中的每个归纳标签至少有一个收藏歌曲与之相映射,每个归纳标签理论上下辖一首或多首所述歌曲列表中的收藏歌曲,且其中一首或多首收藏歌曲可能携带多个所述的归纳标签。
步骤S4400、将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示:
确定出用户的歌曲列表相对应的归纳列表后,便可将其推送至所述用户的终端设备中,由终端设备运行的所述应用程序对其解析后显示到图形用户界面中,如图7(b)所示,至此,使用户实现一键整理其所收藏的全量歌曲的标签。
可选的实施例中,在向用户推送所述归纳列表之前,可先对所述归纳列表中的每个归纳标签所下属的收藏歌曲的数量进行统计,获得每个归纳标签相应的歌曲总量,然后将该歌曲总量关联相应的归纳标签包含于所述归纳列表中,一并推送至所述终端设备中显示。
结合前述的变通实施例,如果后台在歌曲的归纳标签中包含了所述第二标签子集、第三标签子集的标签,则这些标签也可被作为归纳标签原样包含,构成归纳列表的一部分提供给用户终端设备显示。
本实施例方便用户实现一键整理全量收藏歌曲的标签,为终端用户整理其收藏歌曲建立索引机制提供了一站式服务,能大大提升用户整理其收藏歌曲的效率,使用户获得描述更为精细的归纳标签,大幅提升用户体验。
请参阅图8,扩展的实施例中,所述步骤S4400、将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示的步骤之后,包括如下步骤:
步骤S4500、响应所述用户针对所述归纳列表中的任意归纳标签提交的歌曲查询请求,根据所述映射关系数据获取由该归纳标签相对应的收藏歌曲构成的归纳歌曲列表:
用户在如图7(b)所示的界面可以查看其歌曲列表相对应的各个归纳标签,其中,每个归纳标签均以控件的形式展示,因此,通过触控任意归纳标签,便可向服务器发送该归纳标签相对应的歌曲查询请求,该请求中包含对该归纳标签的指定信息,以获得携带该归纳标签的收藏歌曲。
后台服务器接收到用户触发的歌曲查询请求后,响应于该请求,根据指定的归纳标签,从用户的个人曲库数据中查询携带相应的归纳标签的收藏歌曲,构造为归纳歌曲列表。
步骤S4600、将所述归纳歌曲列表推送至所述用户的终端设备显示:
如图7(c)所示,服务器将与指定的归纳标签相对应的归纳歌曲列表推送至用户所在的终端设备之后,由终端设备上运行的相应应用程序对该归纳歌曲列表进行解析,然后在图形用户界面中输出该归纳歌曲列表,展示出该列表中的各首收藏歌曲,且为各首收藏歌曲赋予相应的播放功能,用户通过触控操作任意一首收藏歌曲,便可对该首收藏歌曲执行相应的功能,例如播放、下载到本地等。
本实施例进一步扩展的基于归纳标签的人机交互过程,使用户可以基于归纳标签访问其自身收藏的歌曲的基础上,还可更为便捷的使用相应的收藏歌曲,体现出经精细化分类后的收藏歌曲在使用上的便利性,以及彰显用户体验的改善。
本申请的一种歌曲标签访问方法,可被编程为计算机程序产品,部署于客户端中运行而实现,藉此,客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程实现人机交互。
本申请一种歌曲标签访问方法,请参阅图9,在其典型实施例中,包括如下步骤:
步骤S5100、响应作用于歌曲整理控件的操作指令而向服务器发送歌曲标签整理请求,以获得服务器整理当前用户的收藏歌曲后返回的用于封装所述收藏歌曲的归纳标签的归纳列表:
请回顾图7(a),在终端设备所安装的应用程序所展示的图形用户界面中,显示一个歌曲整理控件,以便用户对其个人曲库数据实现一键打标。所述应用程序一般是后台服务器开放服务的应用程序,也即本方法的计算机程序产品。
当用户触控所述的歌曲整理控件后,所述应用程序便响应相应的触控事件而构造出歌曲标签整理请求,该请求被发送至所述的服务器后,参阅本申请前述实施例所揭示的内容可知,相应的服务器响应该歌曲标签整理请求而为该用户整理其个人曲库数据中的收藏歌曲的归纳标签而获得归纳列表,并将该归纳列表回发给当前用户。由于所述收纳列表封装了该用户的个人曲库数据中所有收藏歌曲相对应的聚类而得的多个归纳标签,因此,所述归纳列表实际上包含了各个归纳标签到该用户的个人曲库数据中全量收藏歌曲之间的索引关系。
步骤S5200、解析显示所述归纳列表中的各个归纳标签,将各归纳标签解析为适于响应触控操作的控件:
终端设备的所述应用程序获得所述的归纳列表中,对其进行解析,获得其中的各个归纳标签,将其显示为如图7(b)所示的界面效果,其中,各个归纳标签被以控件的形式呈现,使得任意一个控件被触控操作后,可触发其所代表的归纳标签相对应的歌曲查询请求。其中,如果所述归纳列表中携带每个归纳标签相对应的歌曲总量,则也可一并在所述的控件中显示。
步骤S5300、响应作用于任意所述归纳标签的操作指令而向服务器发送歌曲查询请求,以获得服务器根据该歌曲查询请求查询携带该归纳标签的收藏歌曲所构成的归纳歌曲列表:
当用户触控任意一个归纳标签相对应的控件后,例如图7(b)中“失恋”相应的控件,相当于向服务器下达了查询该归纳标签相对应的收藏歌曲的操作指令,因此,响应该操作指令,终端设备的所述应用程序触发一个歌曲查询请求,在该请求中包含对相应的归纳标签的指定信息,然后将该歌曲查询请求发送至所述的服务器。
根据前文所揭示的各个实施例所述,服务器响应所述的歌曲查询请求后,根据该请求中的指定的归纳标签,从用户的个人曲库数据中查询该归纳标签相对应的归纳歌曲列表,该归纳歌曲列表包含多首收藏歌曲,其中每首收藏歌曲均携带所述指定的归纳标签。然后,由服务器将该归纳歌曲列表回发给终端设备。
步骤S5400、解析显示所述归纳歌曲列表中的收藏歌曲,将各首收藏歌曲解析为适于响应触控操作而播放:
终端设备的所述应用程序获得服务器推送的所述归纳歌曲列表之后,解析该归纳歌曲列表,然后将各首收藏歌曲的摘要信息显示到图形用户界面中,如图7(c)所示,其中,可为各首收藏歌曲关联相应的播放、下载、分享控件等,使其适于响应触控操作而被播放、下载、分享等。
由此可见,终端设备触控所述的歌曲整理控件获取的所述归纳列表中,其中的归纳标签,属于其下属的各首收藏歌曲所隶属的歌单相映射的自有标签集的共有标签,根据这一业务逻辑,使得用户可以快速便捷地整理出其个人收藏歌曲相对应的标签体系,方便其快速查找收藏歌曲,提升歌曲检索访问效率。
本实施例改善了终端设备处的用户体验,用户通过一键操作便可实现对其自身的个人曲库数据的整理,建立分类索引,所获得的归纳标签更为精细地描述各首收藏歌曲的特点,更方便用户调用自身所拥有的歌曲数据。
请参阅图10,本申请提供的一种歌曲标签整理装置,适应本申请的歌曲标签整理方法进行功能化部署,包括:曲库调用模块3100、标签查询模块3200,以及标签归纳模块3300,其中,所述曲库调用模块3100,用于获取曲库中的目标歌曲;所述标签查询模块3200,用于查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;所述标签归纳模块3300,用于统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。
深化的实施例中,所述标签查询模块3200,包括:该标签集合的第二标签子集为该目标歌曲所携带的属性数据相映射的属性标签集,和/或,该标签集合的第三标签子集包含该目标歌曲所携带的人工标记标签,该人工标记标签用于表示目标歌曲所归属的音乐流派。
扩展的实施例中,本申请的歌曲标签整理装置,还包括:模型训练模块,用于采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集。
深化的实施例中,所述模型训练模块,包括:歌单获取子模块,用于获取所述歌单库中的每个歌单的描述文本;向量编码子模块,用于采用所述神经网络模型中的词向量模型提取所述描述文本的词向量表示;特征提取子模块,用于采用所述神经网络模型中的词编码模型对所述词向量表示进行特征提取,获得相应的文本特征向量;标签确定子模块,用于采用所述神经网络模型中的分类器对所述文本特征向量进行分类,获得分类结果中的多个标签,将所述多个标签存储为所述歌单相对应的自有标签集。
扩展的实施例中,本申请歌曲标签整理装置还包括:数据集调用子模块,用于获取数据集,该数据集包括多个训练样本,每个训练样本包含一个歌单相对应的描述文本;初始标注子模块,用于对每个训练样本的描述文本进行规则匹配,获得所述描述文本相对应的标签,作为该描述文本的监督标签,使该数据集构成训练集;训练执行子模块,用于在单次训练任务中,采用所述训练集中任意一个训练样本对所述神经网络模型实施训练,获得其对该训练样本的描述文本进行分类后的分类标签;样本迭代子模块,用于根据该训练样本中的监督标签计算所述分类标签的损失值,以该损失值对该神经网络模型实施梯度更新,启用所述训练集中的下一训练样本对该神经网络模型实施迭代训练,直至所述神经网络模型收敛而完成当次任务训练,获得所述神经网络模型的中间状态实例;预测更新子模块,用于采用所述神经网络模型的中间状态实例对所述训练集中的各个训练样本的描述文本进行分类预测,利用分类结构匹配预设阈值确定出每个训练样本相对应的分类标签,以所述分类标签更新相应的训练样本的监督标签,完成训练集的更新;训练集迭代子模块,用于启用下一训练任务,采用更新后的训练集对所述神经网络模型实施任务迭代训练,直至所述神经网络模型的中间状态实例达致收敛状态或者其预测准确率达致预设阈值。
深化的实施例中,所述标签归纳模块3300,包括:整理响应模块,用于响应用户的歌曲标签整理请求,获取由该用户所收藏的歌曲所构成的歌曲列表;标签搜查模块,用于获取所述歌曲列表中每首收藏歌曲所持有的归纳标签;歌曲聚类模块,用于根据所述归纳标签对所述歌曲列表中的收藏歌曲进行聚类,存储每个归纳标签与其下属收藏歌曲之间的映射关系数据;归纳推送模块,用于将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示。
扩展的实施例中,本申请的歌曲标签整理装置,还包括:标签查歌模块,用于响应所述用户针对所述归纳列表中的任意归纳标签提交的歌曲查询请求,根据所述映射关系数据获取由该归纳标签相对应的收藏歌曲构成的归纳歌曲列表;歌曲推送模块,用于将所述归纳歌曲列表推送至所述用户的终端设备显示。
请参阅图11,本申请提供的一种歌曲标签访问装置,适应本申请的歌曲标签访问方法进行功能化部署,包括:一键整理模块5100、标签列示模块5200、标签详查模块5300,以及歌曲显示模块5400,其中,所述一键整理模块5100,用于响应作用于歌曲整理控件的操作指令而向服务器发送歌曲标签整理请求,以获得服务器整理当前用户的收藏歌曲后返回的用于封装所述收藏歌曲的归纳标签的归纳列表;所述标签列示模块5200,用于解析显示所述归纳列表中的各个归纳标签,将各归纳标签解析为适于响应触控操作的控件;所述标签详查模块5300,用于响应作用于任意所述归纳标签的操作指令而向服务器发送歌曲查询请求,以获得服务器根据该歌曲查询请求查询携带该归纳标签的收藏歌曲所构成的归纳歌曲列表;所述歌曲显示模块5400,用于解析显示所述归纳歌曲列表中的收藏歌曲,将各首收藏歌曲解析为适于响应触控操作而播放。
较佳的实施例中,所述归纳列表中的归纳标签,属于其下属的各首歌曲所隶属的歌单相映射的自有标签集的共有标签。
为解决上述技术问题,本申请实施例还提供计算机设备。如图12所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种歌曲标签整理、访问方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的歌曲标签整理、访问方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图10、图11中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的歌曲标签整理、访问装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的歌曲标签整理、访问方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请以歌单为曲库中的目标歌曲的标签素材来源,利用歌单相对应的自有标签集为目标歌曲打标,便于据此为用户所收藏的歌曲制备归纳标签,方便用户精准高效地查询其自身收藏的大量歌曲。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (12)

1.一种歌曲标签整理方法,其特征在于,包括如下步骤:
获取曲库中的目标歌曲;
查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;
统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。
2.根据权利要求1所述的歌曲标签整理方法,其特征在于,所述查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合的步骤中:
该标签集合的第二标签子集为该目标歌曲所携带的属性数据相映射的属性标签集,和/或,
该标签集合的第三标签子集包含该目标歌曲所携带的人工标记标签,该人工标记标签用于表示目标歌曲所归属的音乐流派。
3.根据权利要求1所述的歌曲标签整理方法,其特征在于,所述获取曲库中的目标歌曲的步骤之前,包括如下步骤:
采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集。
4.根据权利要求3所述的歌曲标签整理方法,其特征在于,所述采用预训练的神经网络模型提取所述歌单库中每个歌单的描述文本在语义上相关联的多个标签,将提取出的多个标签存储为该歌单相应的自有标签集,包括如下步骤:
获取所述歌单库中的每个歌单的描述文本;
采用所述神经网络模型中的词向量模型提取所述描述文本的词向量表示;
采用所述神经网络模型中的词编码模型对所述词向量表示进行特征提取,获得相应的文本特征向量;
采用所述神经网络模型中的分类器对所述文本特征向量进行分类,获得分类结果中的多个标签,将所述多个标签存储为所述歌单相对应的自有标签集。
5.根据权利要求4所述的歌曲标签整理方法,其特征在于,还包括如下预训练所述神经网络模型的步骤:
获取数据集,该数据集包括多个训练样本,每个训练样本包含一个歌单相对应的描述文本;
对每个训练样本的描述文本进行规则匹配,获得所述描述文本相对应的标签,作为该描述文本的监督标签,使该数据集构成训练集;
在单次训练任务中,采用所述训练集中任意一个训练样本对所述神经网络模型实施训练,获得其对该训练样本的描述文本进行分类后的分类标签;
根据该训练样本中的监督标签计算所述分类标签的损失值,以该损失值对该神经网络模型实施梯度更新,启用所述训练集中的下一训练样本对该神经网络模型实施迭代训练,直至所述神经网络模型收敛而完成当次任务训练,获得所述神经网络模型的中间状态实例;
采用所述神经网络模型的中间状态实例对所述训练集中的各个训练样本的描述文本进行分类预测,利用分类结构匹配预设阈值确定出每个训练样本相对应的分类标签,以所述分类标签更新相应的训练样本的监督标签,完成训练集的更新;
启用下一训练任务,采用更新后的训练集对所述神经网络模型实施任务迭代训练,直至所述神经网络模型的中间状态实例达致收敛状态或者其预测准确率达致预设阈值。
6.根据权利要求1至5中任意一项所述的歌曲标签整理方法,其特征在于,所述统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签的步骤之后,还包括如下步骤:
响应用户的歌曲标签整理请求,获取由该用户所收藏的歌曲所构成的歌曲列表;
获取所述歌曲列表中每首收藏歌曲所持有的归纳标签;
根据所述归纳标签对所述歌曲列表中的收藏歌曲进行聚类,存储每个归纳标签与其下属收藏歌曲之间的映射关系数据;
将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示。
7.根据权利要求6所述的歌曲标签整理方法,其特征在于,所述将包含所有归纳标签的归纳列表推送至所述用户的终端设备显示的步骤之后,包括如下步骤:
响应所述用户针对所述归纳列表中的任意归纳标签提交的歌曲查询请求,根据所述映射关系数据获取由该归纳标签相对应的收藏歌曲构成的归纳歌曲列表;
将所述归纳歌曲列表推送至所述用户的终端设备显示。
8.一种歌曲标签访问方法,其特征在于,包括如下步骤:
响应作用于歌曲整理控件的操作指令而向服务器发送歌曲标签整理请求,以获得服务器整理当前用户的收藏歌曲后返回的用于封装所述收藏歌曲的归纳标签的归纳列表;
解析显示所述归纳列表中的各个归纳标签,将各归纳标签解析为适于响应触控操作的控件;
响应作用于任意所述归纳标签的操作指令而向服务器发送歌曲查询请求,以获得服务器根据该歌曲查询请求查询携带该归纳标签的收藏歌曲所构成的归纳歌曲列表;
解析显示所述归纳歌曲列表中的收藏歌曲,将各首收藏歌曲解析为适于响应触控操作而播放。
9.根据权利要求8所述的歌曲标签访问方法,其特征在于,所述归纳列表中的归纳标签,属于其下属的各首歌曲所隶属的歌单相映射的自有标签集的共有标签。
10.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至9中任意一项所述的方法的步骤。
11.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至9中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
12.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至9任意一项中所述方法的步骤。
CN202111333487.1A 2021-11-11 2021-11-11 歌曲标签整理、访问方法及其装置、设备、介质、产品 Pending CN114048347A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111333487.1A CN114048347A (zh) 2021-11-11 2021-11-11 歌曲标签整理、访问方法及其装置、设备、介质、产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111333487.1A CN114048347A (zh) 2021-11-11 2021-11-11 歌曲标签整理、访问方法及其装置、设备、介质、产品

Publications (1)

Publication Number Publication Date
CN114048347A true CN114048347A (zh) 2022-02-15

Family

ID=80208393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111333487.1A Pending CN114048347A (zh) 2021-11-11 2021-11-11 歌曲标签整理、访问方法及其装置、设备、介质、产品

Country Status (1)

Country Link
CN (1) CN114048347A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024066893A1 (zh) * 2022-09-26 2024-04-04 北京字跳网络技术有限公司 一种多媒体作品的处理方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024066893A1 (zh) * 2022-09-26 2024-04-04 北京字跳网络技术有限公司 一种多媒体作品的处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11599714B2 (en) Methods and systems for modeling complex taxonomies with natural language understanding
WO2022078102A1 (zh) 一种实体识别方法、装置、设备以及存储介质
CN103294815B (zh) 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
CN109408622B (zh) 语句处理方法及其装置、设备和存储介质
US9449271B2 (en) Classifying resources using a deep network
WO2018072071A1 (zh) 知识图谱构建系统及方法
CN111753060A (zh) 信息检索方法、装置、设备及计算机可读存储介质
KR101754473B1 (ko) 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템
WO2021098648A1 (zh) 文本推荐方法、装置、设备及介质
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
US20110295823A1 (en) Method and apparatus for modeling relations among data items
CN109451147B (zh) 一种信息展示方法及装置
CN108369806B (zh) 可配置的通用语言理解模型
JP5469046B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
WO2023160500A1 (zh) 百科信息展示方法、装置、设备和介质
CN111078835A (zh) 简历评估方法、装置、计算机设备及存储介质
CN103412903B (zh) 基于兴趣对象预测的物联网实时搜索方法及系统
CN114065750A (zh) 商品信息匹配、发布方法及其装置、设备、介质、产品
CN114218426A (zh) 音乐视频推荐方法及其装置、设备、介质、产品
CN101763211A (zh) 语意实时分析联想操控系统及方法
CN114048347A (zh) 歌曲标签整理、访问方法及其装置、设备、介质、产品
CN114818674A (zh) 商品标题关键词提取方法及其装置、设备、介质、产品
CN111460215B (zh) 音频数据处理方法、装置、计算机设备以及存储介质
CN113407775A (zh) 视频搜索方法、装置及电子设备
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination