CN111125424B - 提取歌曲核心歌词的方法、装置、设备及存储介质 - Google Patents

提取歌曲核心歌词的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111125424B
CN111125424B CN201911368040.0A CN201911368040A CN111125424B CN 111125424 B CN111125424 B CN 111125424B CN 201911368040 A CN201911368040 A CN 201911368040A CN 111125424 B CN111125424 B CN 111125424B
Authority
CN
China
Prior art keywords
lyrics
song
determining
sentence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911368040.0A
Other languages
English (en)
Other versions
CN111125424A (zh
Inventor
万鑫瑞
周蓝珺
潘树燊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN201911368040.0A priority Critical patent/CN111125424B/zh
Publication of CN111125424A publication Critical patent/CN111125424A/zh
Application granted granted Critical
Publication of CN111125424B publication Critical patent/CN111125424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种提取歌曲核心歌词的方法、装置、设备及存储介质,属于计算机技术领域。本申请实施例提供的方法,获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;对于所述目标歌曲的歌词中的各歌词句,在所述歌词中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其他歌词句之间的相似度,确定所述歌词句对应的权值分数;基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词。采用本申请,可以有效解决相关技术中缺乏一种提取歌曲核心歌词的方法的技术问题。

Description

提取歌曲核心歌词的方法、装置、设备及存储介质
技术领域
本申请计算机技术领域,特别涉及一种提取歌曲核心歌词的方法、装置、设备及存储介质。
背景技术
核心歌词是歌曲的完整歌词中最能够体现歌曲思想的歌词片段,一般为一个或多个歌词句。因此,从整个歌词挑选核心歌词,对准确表达整个歌词的思想十分重要。
在整个歌词中挑选核心歌词时,现有技术往往只提取整首歌词中副歌部分的重复歌词句,将提取的歌词句作为核心歌词。
在实现本申请的过程中,发明人发现相关技术至少存在以下问题:
有些时候能够体现歌曲思想的核心歌词不一定出现在副歌部分,并且副歌多次重复,因此,通过上述方式提取核心歌词的准确性较差。
发明内容
为了解决相关技术中存在的技术问题,本申请实施例提供了一种提取歌曲核心歌词的方法、装置、设备及存储介质。所述提取歌曲核心歌词的方法、装置、设备及存储介质的技术方案如下:
第一方面,提供了一种提取歌曲核心歌词的方法,所述方法包括:
获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;
根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;
对于所述目标歌曲的歌词中的各歌词句,在所述歌词句中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其他歌词句之间的相似度,确定所述歌词句对应的权值分数;
基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词。
可选的,所述获取目标歌曲中各歌词句的特征向量,包括:
基于所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定所述目标歌曲的歌词中各歌词句的特征向量。
可选的,所述基于所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定目标歌曲的歌词中各歌词句的特征向量,包括:
去除所述目标歌曲的歌词中各歌词句包含的语气词;
将经过去除处理后的各歌词句,分别输入所述特征提取模型,得到所述目标歌曲的歌词中各歌词句的特征向量。
可选的,所述基于所述歌词句与所述其他歌词句之间的相似度,确定所述歌词句对应的权值分数,包括:
将所述歌词句与所述其他歌词句的相似度,以及每个所述其他歌词句,输入权值计算模型,得到所述歌词句的权值分数。
可选的,所述基于各歌词句对应的权值分数,确定所述目标歌曲的核心歌词,包括:
将权值分数超过预设阈值的歌词句,确定为所述目标歌曲的核心歌词;
或者,
将权值分数最高的预设数目个歌词句,确定为所述目标歌曲的核心歌词。
第二方面,提供了一种提取歌曲核心歌词的装置,所述装置包括:
获取模块,用于获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;
相似度确定模块,用于根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;
权值分数确定模块,用于对于所述目标歌曲的歌词中的各歌词句,在所述歌词句中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其他歌词句之间的相似度,确定所述歌词句对应的权值分数,进而确定所述各歌词句对应的权值分数;
核心歌词确定模块,用于基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词。
可选的,所述获取模块,用于:
基于所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定所述目标歌曲的歌词中各歌词句的特征向量。
可选的,所述获取模块,用于:
去除所述目标歌曲的歌词中各歌词句包含的语气词;
将经过去除处理后的各歌词句,分别输入所述特征提取模型,得到所述目标歌曲的歌词中各个歌词句的特征向量。
可选的,所述权值分数确定模块用于:
将所述歌词句与所述其他歌词句的相似度,以及每个所述其他歌词句,输入权值计算模型,得到所述歌词句对应的权值分数。
可选的,所述核心歌词确定模块用于:
将权值分数超过预设阈值的歌词句,确定为所述目标歌曲的核心歌词;
或者,
将权值分数最高的预设数目个歌词句,确定为所述目标歌曲的核心歌词。
第三方面,提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如第一方面所述的提取歌曲核心歌词的方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如第一方面所述的提取歌曲核心歌词的方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的方法,确定目标歌曲的歌词中各歌词句之间的相似度,基于歌词句间的相似度,确定每个歌词句的权值分数,进而确定目标歌曲的核心歌词。本申请实施例提供的方法,提供了一种提取歌曲核心歌词的方法,从而,确定歌曲中核心歌词。可见,本申请实施例能够提供提取歌曲核心歌词的方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种提取歌曲核心歌词的流程图;
图2是本申请实施例提供的一种歌词句关系图;
图3是本申请实施例提供的一种提取歌曲核心歌词的结构示意图;
图4是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供了一种提取歌曲核心歌词的方法,该方法可以由计算机设备实现。其中,该计算机设备可以是技术人员所使用的终端,终端可以是手机、平板电脑、笔记本电脑等移动终端,也可以是台式计算机等固定终端,也可以是服务器。本申请实施例中,以执行主体为终端为例进行方案的详细说明,其它情况与之类似,本申请实施例不在赘述。
本申请实施例提供的方法,可以应用在歌曲提供平台,如歌曲播放应用程序、歌曲信息网站等,具体的用于依据核心歌词表达的思想,对该歌曲进行分曲提供平台对其歌曲库中的每首歌曲分别提取核心歌词,进而可以基于核心歌词对歌曲进行分类,还可以基于核心歌词对歌曲进行用户定向推荐,还可以对歌手的曲风进行分析,还可以对热门歌曲的曲风进行分析,等等。
本申请实施例,可以对歌词的歌词句之间的相似度进行分析,对歌词句进行打分,以确定核心歌词。
如图1所示,该方法的处理流程可以包括如下步骤:
步骤101,获取目标歌曲中各歌词句的特征向量,目标歌曲包括多个歌词句。
其中,目标歌曲可以是需要提取核心歌词的歌曲,歌词句可以是以句子的形式存在的歌词,例如“十年之前”,目标歌曲中可以包括多个歌词句。
在实施中,获取到目标歌曲的歌词,并对目标歌曲的歌词进行划分,获得目标歌曲中的多个歌词句,并对每个歌词句提取特征向量,获取到目标歌曲中各歌词句的特征向量。
可选的,基于目标歌曲的歌词中各歌词句,以及特征提取模型,确定目标歌曲的歌词中各歌词句的特征向量。
其中,特征提取模型可以对各歌词句进行提取特征信息,可以表征语言特征和数字之间的对应关系。特征提取模型可以是机器学习模型,通过对大量歌曲中歌词的歌词句进行训练得到。在本实施例中,特征向量可称作句向量。
在实施中,将音乐领域中的歌词数据作为原始文本,建立训练集的样本。将样本中的任意两个歌词句输入TFIDF算法(Term Frequency-Inverse Document Frequency,词项频率-逆文档频率),基于该算法获取基准相似度。将该任意两个歌词句,输入特征提取模型,输出两个歌词句分别对应的特征向量,将得到的两个特征向量输入相似度计算公式,获取两个歌词句分别对应特征向量的相似度,与基准相似度进行比较。确定模型输出的相似度与两个歌词句之间基准相似度的差异信息,基于差异信息和预设的训练算法,确定特征提取模型中各待调整的模型参数的调整值,进而对模型参数进行数值调整,从而完成一次训练。然后再获取其它样本数据,重复上述过程。这样,通过大量样本的训练,得到最终的特征提取模型。其中,预设在上述训练模型过程中,进行训练的大量歌曲可以为中文歌曲,也可以为其它语言的歌曲。
基于训练好的特征提取模型,对目标歌曲中歌词的每个歌词句进行特征提取,确定目标歌曲中歌词的每个歌词句的特征向量。
可选的,可以先去除歌词句的语气词再进行特征提取,相应处理可以如下:去除目标歌曲的歌词中各歌词句中包含的语气词,将经过去除处理后的各歌词句,分别输入特征提取模型,得到目标歌曲歌词中每个歌词句的特征向量。
由于语气词大都为了突出情感而存在,或者为了押韵而存在,将歌词中的语气词进行提取,对综合表达出整个歌词的核心思想用处不大。且语气词在歌曲的副歌部分大量存在,会造成歌曲中副歌部分的任意两个歌词句之间的相似度过高,为了降低语气词对计算相似度的影响,可以去除语气词。
在实施中,在获取目标歌曲的歌词之后,可以通过歌曲中歌词的每一个字与语气词库中的每一个语气词进行对比,识别歌曲中歌词的语气词,并对歌曲中歌词的语气词进行删除处理。其中,可以由技术人员将所有的语气词放入库,进而获得语气词库。
步骤102,根据各歌词句的特征向量,确定各歌词句之间的相似度。
其中,相似度用于体现歌词句之间的文本或意思的接近程度。
在实施中,确定目标歌曲中歌词的每个歌词句,基于预定的算法,将各个歌词句进行对比,确定目标歌曲中歌词的各歌词句之间的相似度。
可选的,基于特征提取模型,对目标歌曲中歌词的每个歌词句的特征信息进行提取,获取目标歌曲中歌词的每个歌词句对应的特征向量,将歌词句对应的特征向量作为句向量,通过确定任意两个句向量之间的相似度,来确定各歌词句之间的相似度。
在确定每个句向量的相似度时,可以基于每个句向量中的任意两个句向量,通过公式确定每个句向量中的任意两个句向量之间的相似度。
其中,可以表示第一句向量,/>可以表示第二句向量,/>可以表示第一句向量和第二句向量的相似度,其中,第一句向量和第二句向量表示任意两个句向量。
在确定每个句向量的影响程度时,也可以基于每个句向量中的任意两个句向量,通过公式确定每个句向量中的任意两个句向量之间的相似度。
其中,Xi可以表示第一句向量的第i个坐标,Yi可以表示第二句向量的第i个坐标,d可以表示第一句向量和第二句向量的相似度,其中,第一句向量和第二句向量表示任意两个句向量。
通过上述方式确定出任意两个句向量之间的相似度,并将任意两个句向量之间的相似度作为两个句向量分别对应的歌词句之间的相似度。
步骤103,对于目标歌曲的歌词中的各歌词句,在歌词中确定与歌词句之间的时间差不超过预设阈值的其它歌词句,基于歌词句与其他歌词句之间的相似度,确定歌词句对应的权值分数。
其中,权值分数可以表示权值分数对应的歌词句综合表达整个歌词核心思想的能力,即相对权威性数值。当权值分数越大时,该权值分数对应的歌词句综合表达整个歌词核心思想的能力越大,当权值分数越小时,该权值分数对应的歌词句综合表达整个歌词核心思想的能力越小。在本申请中,可以通过筛选出的权值分数,确定该权值分数对应的歌词句,进而获得目标歌曲中的核心歌词。
在实施中,通过歌词句关系图确定出与某一歌词句之间的时间差不超过预设阈值的其它歌词句,并在获取某一歌词句与其他歌词句之间的相似度之后,可以进一步计算每个歌词句的权值分数。计算权值分数的算法可以根据需求任意选择,例如,可以简单的将某歌词句与其它各歌词句的相似度相加,作为权值分数,或者,也可以在考虑相似度的同时,考虑歌词句的内容,共同计算权值分数。
通过歌词句关系图确定出与某一歌词句之间的时间差不超过预设阈值的其它歌词句的具体过程如下:构建歌词句关系图,歌词句关系图中包括多个节点,其中,任一节点对应一个歌词句,在时间差小于预设阈值的歌词句对应的节点之间建立连线,该连线称作边,对于任一个边,记录权重值,该权重值为该边连接的两个节点对应的歌词句之间的相似度。请参见图3,图3是本申请实施例提供的一种歌词句关系图,图3中,S1-S8表示节点,边上的数字表示权重,由图3可知,S1同S2、S3相连接,用以表示这些节点在同一时间间隔。其中,预设阈值可以由技术人员设定,在一首歌曲的歌词中,时间上比较接近的歌词句意思会比较接近,所以统计这些歌词句之间的相似度对歌曲核心歌词句的选取价值比较大,所以设置此时间间隔用于对歌词进行分析。
通过在歌词句关系图中,筛选出与某一歌词句对应的节点相连的节点,确定这些节点对应的歌词句,进而就确定出与该歌词句之间的时间差不超过预设阈值的其它歌词句。
在本实施例中,获取歌词句关系图,获取节点与其他节点之间的权重,及其他节点,输入权值计算模型,获取任一歌词句的权值分数。
进一步的,将音乐领域中的大量歌词作为样本,获取样本中的任一歌曲,获取该歌曲中歌词的歌词句,基于人的理解,对这些歌词句进行权值分数评分,将这些分数作为基准权值分数。
进一步的,在该目标歌曲中歌词的歌词句关系图中,确定任一节点,任一节点对应任一歌词句,确定预设阈值内的歌词句对应的节点,这些节点之间建立边,其中,并将任意两个歌词句之间的相似度作为该任意两个歌词句分别对应两个节点之间的权重。
进一步的,确定该歌词句关系图,提取节点与其他节点之间的权重,及其他节点,输入权值计算模型,输出节点的权值分数。确定模型输出的权值分数与基准权值分数的差异信息,基于差异信息和预设的训练算法,确定特征提取模型参数的调整值,进而对权值计算模型参数进行数值调整,从而完成一次训练。然后再获取样本训练集中其他歌词句关系图,重复上述过程。这样,通过大量样本的训练,得到训练完成的权值计算模型。
进一步的,提取歌词句关系图中的某一节点与其他节点之间的权重,及其他节点,输入训练完成的权值计算模型中,输出某一节点的权值分数,进而获得每个节点的权值分数。根据每个节点对应的歌词句,以及每个节点的权值分数,进而确定每个歌词句对应的权值分数。
步骤104,基于各歌词句对应的权值分数,确定目标歌曲的核心歌词。
在实施中,确定具有相同句式的歌词句,保留具有相同句式的歌词句中的一个歌词句,对具有相同句式的其他歌词句进行滤除,获取滤除剩余的歌词句。通过滤除剩余的歌词句,确定这些歌词句分别对应的权值分数,基于该权值分数,确定核心歌词。
将具有相同句式的歌词句进行滤除,可以滤除掉具有相同意思的歌词句,从而避免核心歌词出现重复意思的情况。
基于权值分数确定核心歌词的方式可以多种多样,下面给出了两种可行的方式:
方式一,将权值分数超过预设阈值的歌词句,确定为目标歌曲的核心歌词。
在实施中,将每一歌词句的权值分数与预设阈值进行比较,当任一歌词句的权值分数大于预设阈值时,将该权值分数对应的歌词句进行提取并作为核心歌词,当任一歌词句的权值分数小于预设阈值时,则该权值分数对应的歌词句不作为核心歌词。
方式二,将权值分数最高的预设数目个歌词句,确定为目标歌曲的核心歌词。
在实施中,确定每个歌词句对应的权值分数,基于排序算法,对每个权值分数从大到小进行排序,从最大的权值分数开始筛选,筛选出预设数目个相对权值分数,确定这些权值分数对应的歌词句,将该歌词句作为目标歌曲的核心歌曲。需要说明的是,在确定核心歌词之后,确定任一核心歌词在目标歌曲中出现的顺序,然后依据该顺序对核心歌词进行排序,便于后续过程中的歌词分析。
本申请实施例提供的方法,确定目标歌曲的歌词中各歌词句之间的相似度,基于歌词句间的相似度,确定每个歌词句的权值分数,进而确定目标歌曲的核心歌词。本申请实施例提供的方法,提供了一种提取歌曲核心歌词的方法,从而确定歌曲中核心歌词。
基于相同的技术构思,本申请实施例还提供了一种提取歌曲核心歌词的装置,如图3所示,该装置包括:
获取模块301,用于获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;
相似度确定模块302,用于根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;
权值分数确定模块303,用于对于所述目标歌曲的歌词中的各歌词句,在所述歌词中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其他歌词句之间的相似度,确定所述歌词句对应的权值分数;
核心歌词确定模块304,用于基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词。
可选的,所述获取模块301,用于:
基于所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定所述目标歌曲的歌词中各歌词句的特征向量。
可选的,所述获取模块301,用于:
去除所述目标歌曲的歌词中各歌词句包含的语气词;
将经过去除处理后的各歌词句,分别输入特征提取模型,得到所述目标歌曲的歌词中各歌词句的特征向量。
可选的,所述权值分数确定模块303,用于:
将所述歌词句与所述其他歌词句的相似度,以及每个所述其他歌词句,输入权值计算模型,得到所述歌词句对应的权值分数。
可选的,所述核心歌词确定模块304,用于:
将权值分数超过预设阈值的歌词句,确定为所述目标歌曲的核心歌词;
或者,
将权值分数最高的预设数目个歌词句,确定为所述目标歌曲的核心歌词。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是:上述实施例提供的提取歌曲核心歌词的装置在提取歌曲核心歌词时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的提取歌曲核心歌词的装置与提取歌曲核心歌词的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4是本申请实施例提供的一种终端的结构框图。该终端400可以是便携式移动终端,比如:智能手机、平板电脑。终端400还可能被称为用户设备、便携式终端等其他名称。
通常,终端400包括有:处理器401和存储器402。
处理器401可以包括一个或多个处理核心,比如4核心处理器、4核心处理器等。处理器401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是有形的和非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器401所执行以实现本申请中提供的提取歌曲核心歌词的方法。
在一些实施例中,终端400还可选包括有:外围设备接口403和至少一个外围设备。具体地,外围设备包括:射频电路404、显示屏405、摄像头组件406、音频电路407、定位组件408和电源409中的至少一种。
外围设备接口403可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中,处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上;在一些其他实施例中,处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。显示屏405还具有采集在显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。显示屏405用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏405可以为一个,设置终端400的前面板;在另一些实施例中,显示屏405可以为至少两个,分别设置在终端400的不同表面或呈折叠设计;在再一些实施例中,显示屏405可以是柔性显示屏,设置在终端400的弯曲表面上或折叠面上。甚至,显示屏405还可以设置成非矩形的不规则图形,也即异形屏。显示屏405可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件406用于采集图像或视频。可选地,摄像头组件406包括前置摄像头和后置摄像头。通常,前置摄像头用于实现视频通话或自拍,后置摄像头用于实现照片或视频的拍摄。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能,主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能。在一些实施例中,摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路407用于提供用户和终端400之间的音频接口。音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器401进行处理,或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路407还可以包括耳机插孔。
定位组件408用于定位终端400的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件408可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源409用于为终端400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端400还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于:加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。
加速度传感器411可以检测以终端400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器401可以根据加速度传感器411采集的重力加速度信号,控制显示屏405以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器412可以检测终端400的机体方向及转动角度,陀螺仪传感器412可以与加速度传感器411协同采集用户对终端400的3D动作。处理器401根据陀螺仪传感器412采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器413可以设置在终端400的侧边框和/或显示屏405的下层。当压力传感器413设置在终端400的侧边框时,可以检测用户对终端400的握持信号,根据该握持信号进行左右手识别或快捷操作。当压力传感器413设置在显示屏405的下层时,可以根据用户对显示屏405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器414用于采集用户的指纹,以根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置终端400的正面、背面或侧面。当终端400上设置有物理按键或厂商Logo时,指纹传感器414可以与物理按键或厂商Logo集成在一起。
光学传感器415用于采集环境光强度。在一个实施例中,处理器401可以根据光学传感器415采集的环境光强度,控制显示屏405的显示亮度。具体地,当环境光强度较高时,调高显示屏405的显示亮度;当环境光强度较低时,调低显示屏405的显示亮度。在另一个实施例中,处理器401还可以根据光学传感器415采集的环境光强度,动态调整摄像头组件406的拍摄参数。
接近传感器416,也称距离传感器,通常设置在终端400的正面。接近传感器416用于采集用户与终端400的正面之间的距离。在一个实施例中,当接近传感器416检测到用户与终端400的正面之间的距离逐渐变小时,由处理器401控制显示屏405从亮屏状态切换为息屏状态;当接近传感器416检测到用户与终端400的正面之间的距离逐渐变大时,由处理器401控制显示屏405从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图4中示出的结构并不构成对终端400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述实施例中提取歌曲核心歌词的方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种提取歌曲核心歌词的方法,其特征在于,所述提取歌曲核心歌词的方法包括:
获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;
根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;
对于所述目标歌曲的歌词中的各歌词句,在所述歌词中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其它歌词句之间的相似度,确定所述歌词句对应的权值分数,包括:构建歌词句关系图,所述歌词句关系图中包括多个节点,每个节点对应一个歌词句;在时间差小于预设阈值的歌词句对应的节点之间建立连线;将与目标歌词句对应的节点相连的节点对应的歌词句,作为与所述目标歌词句之间的时间差不超过预设阈值的其他歌词句,所述目标歌词句为所述目标歌曲中任一歌词句;将所述目标歌词句与所述其他歌词句的相似度,以及每个所述其他歌词句,输入权值计算模型,得到所述目标歌词句对应的权值分数;
基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词;
其中,所述获取目标歌曲中各歌词句的特征向量,包括:
获取目标歌曲的歌词,将目标歌曲中歌词的每一个字与语气词库中的每一个语气词进行对比,识别目标歌曲的歌词中的语气词,对目标歌曲的歌词中的语气词进行删除处理;确定删除处理后目标歌曲中各歌词句的特征向量;
所述基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词,包括:
确定具有相同句式的歌词句,保留具有相同句式的歌词句中的一个歌词句,对具有相同句式的其他歌词句进行滤除,获取滤除剩余的歌词句分别对应的权值分数;
基于排序算法对各个权值分数从大到小进行排序,从最大的权值分数开始筛选,筛选出预设数目个权值分数,将所述预设数目个权值分数对应的歌词句确定为所述目标歌曲的核心歌词。
2.根据权利要求1所述的提取歌曲核心歌词的方法,其特征在于,所述获取目标歌曲中各歌词句的特征向量,包括:
基于删除处理后所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定所述目标歌曲的歌词中各歌词句的特征向量。
3.根据权利要求1所述的提取歌曲核心歌词的方法,其特征在于,所述基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词,还包括:
将权值分数超过预设阈值的歌词句,确定为所述目标歌曲的核心歌词。
4.一种确定提取歌曲核心歌词的装置,其特征在于,所述装置包括:
获取模块,用于获取目标歌曲中各歌词句的特征向量,所述目标歌曲包括多个歌词句;
相似度确定模块,用于根据所述各歌词句的特征向量,确定所述各歌词句之间的相似度;
权值分数确定模块,用于对于所述目标歌曲的歌词中的各歌词句,在所述歌词中确定与所述歌词句之间的时间差不超过预设阈值的其它歌词句,基于所述歌词句与所述其它歌词句之间的相似度,确定所述歌词句对应的权值分数;
核心歌词确定模块,用于基于所述各歌词句对应的权值分数,确定所述目标歌曲的核心歌词;
所述权值分数确定模块,用于构建歌词句关系图,所述歌词句关系图中包括多个节点,每个节点对应一个歌词句;在时间差小于预设阈值的歌词句对应的节点之间建立连线;将与目标歌词句对应的节点相连的节点对应的歌词句,作为与所述目标歌词句之间的时间差不超过预设阈值的其他歌词句,所述目标歌词句为所述目标歌曲中任一歌词句;将所述目标歌词句与所述其他歌词句的相似度,以及每个所述其他歌词句,输入权值计算模型,得到所述目标歌词句对应的权值分数;
其中,所述获取模块,具体用于:获取目标歌曲的歌词,将目标歌曲中歌词的每一个字与语气词库中的每一个语气词进行对比,识别目标歌曲的歌词中的语气词,对目标歌曲的歌词中的语气词进行删除处理;确定删除处理后目标歌曲中各歌词句的特征向量;
所述核心歌词确定模块,具体用于:
确定具有相同句式的歌词句,保留具有相同句式的歌词句中的一个歌词句,对具有相同句式的其他歌词句进行滤除,获取滤除剩余的歌词句分别对应的权值分数;
基于排序算法对各个权值分数从大到小进行排序,从最大的权值分数开始筛选,筛选出预设数目个权值分数,将所述预设数目个权值分数对应的歌词句确定为所述目标歌曲的核心歌词。
5.根据权利要求4所述的确定提取歌曲核心歌词的装置,其特征在于,所述获取模块,用于:
基于所述目标歌曲的歌词中各歌词句,以及特征提取模型,确定所述目标歌曲的歌词中各歌词句的特征向量。
6.根据权利要求4所述的确定提取歌曲核心歌词的装置,其特征在于,所述核心歌词确定模块,用于:
将权值分数超过预设阈值的歌词句,确定为所述目标歌曲的核心歌词。
7.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至3任一项所述的提取歌曲核心歌词的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至3任一项所述的提取歌曲核心歌词的方法。
CN201911368040.0A 2019-12-26 2019-12-26 提取歌曲核心歌词的方法、装置、设备及存储介质 Active CN111125424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911368040.0A CN111125424B (zh) 2019-12-26 2019-12-26 提取歌曲核心歌词的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911368040.0A CN111125424B (zh) 2019-12-26 2019-12-26 提取歌曲核心歌词的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111125424A CN111125424A (zh) 2020-05-08
CN111125424B true CN111125424B (zh) 2024-01-09

Family

ID=70503218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911368040.0A Active CN111125424B (zh) 2019-12-26 2019-12-26 提取歌曲核心歌词的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111125424B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597823B (zh) * 2020-06-01 2023-08-15 腾讯科技(深圳)有限公司 中心词提取方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133213A (zh) * 2017-05-06 2017-09-05 广东药科大学 一种基于算法的文本摘要自动提取方法与系统
CN107797990A (zh) * 2017-10-18 2018-03-13 渡鸦科技(北京)有限责任公司 用于确定文本核心语句的方法和装置
CN108009135A (zh) * 2016-10-31 2018-05-08 深圳市北科瑞声科技股份有限公司 生成文档摘要的方法和装置
CN108228541A (zh) * 2016-12-22 2018-06-29 深圳市北科瑞声科技股份有限公司 生成文档摘要的方法和装置
CN108920466A (zh) * 2018-07-27 2018-11-30 杭州电子科技大学 一种基于word2vec和TextRank的科技文本关键词提取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189470B2 (en) * 2012-05-31 2015-11-17 Hewlett-Packard Development Company, L.P. Generation of explanatory summaries
US9886501B2 (en) * 2016-06-20 2018-02-06 International Business Machines Corporation Contextual content graph for automatic, unsupervised summarization of content

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009135A (zh) * 2016-10-31 2018-05-08 深圳市北科瑞声科技股份有限公司 生成文档摘要的方法和装置
CN108228541A (zh) * 2016-12-22 2018-06-29 深圳市北科瑞声科技股份有限公司 生成文档摘要的方法和装置
CN107133213A (zh) * 2017-05-06 2017-09-05 广东药科大学 一种基于算法的文本摘要自动提取方法与系统
CN107797990A (zh) * 2017-10-18 2018-03-13 渡鸦科技(北京)有限责任公司 用于确定文本核心语句的方法和装置
CN108920466A (zh) * 2018-07-27 2018-11-30 杭州电子科技大学 一种基于word2vec和TextRank的科技文本关键词提取方法

Also Published As

Publication number Publication date
CN111125424A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN110471858B (zh) 应用程序测试方法、装置及存储介质
CN110556127B (zh) 语音识别结果的检测方法、装置、设备及介质
CN110688082B (zh) 确定音量的调节比例信息的方法、装置、设备及存储介质
CN110277106B (zh) 音频质量确定方法、装置、设备及存储介质
CN111048111B (zh) 检测音频的节奏点的方法、装置、设备及可读存储介质
CN110956971B (zh) 音频处理方法、装置、终端及存储介质
CN111524501B (zh) 语音播放方法、装置、计算机设备及计算机可读存储介质
WO2020103550A1 (zh) 音频信号的评分方法、装置、终端设备及计算机存储介质
CN108320756B (zh) 一种检测音频是否是纯音乐音频的方法和装置
CN112735429B (zh) 确定歌词时间戳信息的方法和声学模型的训练方法
WO2022057435A1 (zh) 基于搜索的问答方法及存储介质
CN111428079B (zh) 文本内容处理方法、装置、计算机设备及存储介质
CN111081277B (zh) 音频测评的方法、装置、设备及存储介质
CN112667844A (zh) 检索音频的方法、装置、设备和存储介质
CN110837557B (zh) 摘要生成方法、装置、设备及介质
CN110675473B (zh) 生成gif动态图的方法、装置、电子设备及介质
CN113744736B (zh) 命令词识别方法、装置、电子设备及存储介质
CN113362836B (zh) 训练声码器方法、终端及存储介质
CN110867194A (zh) 音频的评分方法、装置、设备及存储介质
CN111125424B (zh) 提取歌曲核心歌词的方法、装置、设备及存储介质
CN108831423B (zh) 提取音频数据中主旋律音轨的方法、装置、终端及存储介质
CN113724739B (zh) 检索音频和训练声学模型的方法、终端及存储介质
CN113343709B (zh) 意图识别模型的训练方法、意图识别方法、装置及设备
CN112786025B (zh) 确定歌词时间戳信息的方法和声学模型的训练方法
CN112487162B (zh) 确定文本语义信息的方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant