CN103488782B - 一种利用歌词识别音乐情感的方法 - Google Patents

一种利用歌词识别音乐情感的方法 Download PDF

Info

Publication number
CN103488782B
CN103488782B CN201310460411.4A CN201310460411A CN103488782B CN 103488782 B CN103488782 B CN 103488782B CN 201310460411 A CN201310460411 A CN 201310460411A CN 103488782 B CN103488782 B CN 103488782B
Authority
CN
China
Prior art keywords
lyrics
lyric
training set
song
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310460411.4A
Other languages
English (en)
Other versions
CN103488782A (zh
Inventor
何慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201310460411.4A priority Critical patent/CN103488782B/zh
Publication of CN103488782A publication Critical patent/CN103488782A/zh
Application granted granted Critical
Publication of CN103488782B publication Critical patent/CN103488782B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Auxiliary Devices For Music (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了音乐资源管理和音乐资源检索技术领域中的一种利用歌词识别音乐情感的方法。包括将已经标注音乐情感的歌曲的歌词放入歌词训练集中;预处理歌词训练集中每首歌曲的歌词得到歌词的特征集合;确定歌词训练集的优化特征集合;计算歌词训练集中每首歌曲的歌词的特征权值向量并形成歌词训练集的特征权值矩阵;建立歌词训练集的优化特征集合中的特征与音乐情感之间的特征指示函数;建立歌词训练集中每首歌曲的歌词与音乐情感的最大熵模型;计算所述最大熵模型,得到条件概率的最优解和最优拉格朗日乘子向量;最后计算待识别的歌词的音乐情感。本发明克服了通过音频文件确定音乐情感存在的训练和识别花费时间长、占用内存大等问题。

Description

一种利用歌词识别音乐情感的方法
技术领域
本发明属于音乐资源管理和音乐资源检索技术领域,尤其涉及一种利用歌词识别音乐情感的方法。
背景技术
随着计算机网络的不断发展和日益普及,人们可以方便快捷的获取日益丰富的音乐资源,因此人们迫切需要新的技术对音乐资源进行管理,实现对海量音乐资源的有效的检索和访问。传统的音乐检索仅限于对音乐歌曲名称、歌手姓名、作词人、作曲人等音乐的参照信息的检索,而这样的检索远远无法满足人们从音乐内容上对音乐的检索和管理。
音乐情感是刻画音乐作品的一种很重要的信息,对音乐所表达的情感进行准确识别可以帮助人们更快捷的检索和访问适合自己的音乐。申请号为200910063035.9、名称为“一种数字音乐情感的识别方法”的中国发明专利(公开号:CN101599271A),申请号为200910110671.2、名称为“音乐情感距离的度量方法”的中国发明专利(公开号:CN101697278A),以及申请号为201310060278.3,名称为“一种基于云基因表达式编程的音乐情感识别方法”的中国发明专利(公开号:CN103116646A)分别给出了一种音乐情感的识别方法。这些现有技术提供的对音乐情感的识别手段,大多是通过对音乐的音频信号进行分析来识别音乐的情感色彩。这类方法首先提取音乐的声学特征参数和音乐乐理特征参数,然后通过对分类器训练进行数字音乐的情感识别。由于音频文件本身比较庞大,即使是被压缩成MP3格式,通常一首歌曲也要占据4M的空间,如果利用计算机对成百上千首歌曲进行情感色彩的训练和识别,需要花费大量的内存空间和时间。况且,大多数用户都是在手机、MP3等移动设备上对音乐进行检索和访问,因此在内存较小、计算速度不够高的移动设备上利用音频信号分析和识别音乐的情感色彩是非常困难的,现有这些方法无法很好的满足用户的需要。
发明内容
本发明的目的在于,提供一种利用歌词识别音乐情感的方法,用于解决现有技术在进行音乐情感识别时存在的缺陷。
为了实现上述目的,本发明提出的技术方案是,一种利用歌词识别音乐情感的方法,其特征是所述方法包括:
步骤1:将已经标注音乐情感的n首歌曲的歌词放入歌词训练集L中;
步骤2:预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合Fi;其中,Fi是第i首歌曲的歌词的特征集合,i=1,2,...,n;
步骤3:根据公式确定歌词训练集的特征集合FL
步骤4:在歌词训练集的特征集合FL中,将出现次数小于设定阈值的特征删除,得到歌词训练集的优化特征集合Fopt={t1,t2,...,tm};其中,tk为歌词训练集的优化特征集合中的特征,k=1,2,...,m,m为歌词训练集的优化特征集合中的特征数量;
步骤5:计算歌词训练集中每首歌曲的歌词的特征权值向量li并形成歌词训练集的特征权值矩阵N;
其中,li是第i首歌曲的歌词的特征权值向量;
步骤6:建立歌词训练集的优化特征集合Fopt中的特征与音乐情感之间的特征指示函数fk(li,c);
其中,当歌词训练集的优化特征集合Fopt中的特征tk是第i首歌曲的歌词的特征集合Fi中的特征,并且第i首歌曲的歌词的音乐情感为c时,fk(li,c)=1;当歌词训练集的优化特征集合Fopt中的特征tk不是第i首歌曲的歌词的特征集合Fi中的特征或者第i首歌曲的歌词的音乐情感不为c时,fk(li,c)=0;
步骤7:建立歌词训练集中每首歌曲的歌词与音乐情感的最大熵模型,包括目标函数和约束条件;
所述目标函数为:
其中,H(P)为P(c|li)的熵,且 H ( P ) = - Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i ) P ( c | l i ) log P ( c | l i ) ;
P(c|li)为歌词训练集中第i首歌曲的歌词的音乐情感为c的条件概率;
C为由歌词训练集L中每首歌曲的歌词的音乐情感组成的集合;
#(li)为歌词训练集中第i首歌曲的歌词在歌词训练集中出现的频数,|L|为歌词训练集中歌曲的总数;
所述约束条件包括:
P(c|li)≥0,i=1,2,...n且
Σ c ∈ C P ( c | l i ) = 1 , i = 1,2 , . . . , n ;
Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i ) P ( c | l i ) f k ( l i , c ) = Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i , c ) f k ( l i , c ) ;
其中,#(li,c)为歌词训练集中第i首歌曲的歌词的音乐情感为c的统计频数;
步骤8:采用拉格朗日乘子法计算所述最大熵模型,得到条件概率P(c|li)的最优解和最优拉格朗日乘子向量Λ=(λ12,...,λk,...,λm);
其中,ZΛ(li)为归一化因子且
步骤9:预处理待识别的歌词得到待识别的歌词的特征集合Fnew
步骤10:计算待识别的歌词的特征权值向量lnew
步骤11:根据公式计算待识别的歌词的音乐情感c*
其中, Z Λ ( l new ) = Σ c ∈ C exp ( Σ k = 1 m λ k h k ( l i , c ) v k ) ;
vk为待识别的歌词的特征权值向量lnew的第k个分量。
所述预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合Fi/预处理待识别的歌词得到待识别的歌词的特征集合Fnew具体包括如下子步骤:
子步骤101:对歌词训练集L中每首歌曲的歌词/待识别的歌词进行中文分词,得到初始分词词条;
子步骤102:对初始分词词条进行词性标注,并保留词性为形容词、动词、名次和副词的词条,从而得到预处理词条序列;
子步骤103:设定N值并令r=1;
子步骤104:将预处理词条序列中r个相邻的词条作为特征放入特征集合Fi r/特征集合中;i=1,2,...,n,n为歌词训练集L中的歌曲数;
子步骤105:判断r≥N是否成立,如果r≥N,则执行子步骤106;否则,令r=r+1,返回子步骤104;
子步骤106:将作为歌词训练集L中每首歌曲的歌词的特征集合Fi/待识别的歌词的特征集合Fnew
所述计算歌词训练集中每首歌曲的歌词的特征权值向量li/待识别的歌词的特征权值向量lnew具体为:
将歌词训练集的优化特征集合Fopt中的特征依次与歌词训练集中第i首歌曲的歌词的特征集合Fi中的特征/待识别的歌词的特征集合Fnew中的特征进行比较,如果歌词训练集的优化特征集合Fopt中的特征出现在第i首歌曲的歌词的特征集合Fi/待识别的歌词的特征集合Fnew中,则将第i首歌曲的歌词的特征权值向量li/待识别的歌词的特征权值向量lnew的相应分量设置为1;如果歌词训练集的优化特征集合Fopt中的特征未出现在第i首歌曲的歌词的特征集合Fi/待识别的歌词的特征集合Fnew中,则将第i首歌曲的歌词的特征权值向量li/待识别的歌词的特征权值向量lnew的相应分量设置为0;其中,i=1,2,...,n,n为歌词训练集L中的歌曲数。
所述歌词训练集的特征权值矩阵N由歌词训练集中每首歌曲的歌词的特征权值向量li组成,特征权值矩阵N的第i行为第i首歌曲的歌词的特征权值向量li;其中,i=1,2,...,n,n为歌词训练集L中的歌曲数。
本发明通过歌词确定音乐情感,克服了通过音频文件确定音乐情感存在的训练和识别花费时间长、占用内存大等问题,有效解决了用户对音乐情感的快速识别需求,并实现了移动设备上对音乐进行检索和访问的目标。
附图说明
图1是利用歌词识别音乐情感的方法流程图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
图1是利用歌词识别音乐情感的方法流程图,如图1所示,本发明提供的方法包括:
步骤1:将已经标注音乐情感的n首歌曲的歌词放入歌词训练集L中。
本发明使用已经标注音乐情感的歌曲的歌词作为歌词训练集,通过训练该歌词训练集,得到相关信息,用来评价待识别的歌词。歌词训练集中的歌词,都是已经标注音乐情感的歌词,将歌词训练集中每首歌曲的歌词的音乐情感组成的集合,作为音乐情感集合C。
步骤2:预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合Fi
对于歌词训练集L中每首歌曲的歌词,先要进行预处理,从而得到每首歌曲的歌词的特征集合。本实施例以歌词“我要给你我的追求还有我的自由”为例,说明预处理的过程。该过程包括如下子步骤:
子步骤101:对歌词训练集L中每首歌曲的歌词进行中文分词,得到初始分词词条。
对歌词“我要给你我的追求还有我的自由”进行中文分词,得到初始分词词条为:我、要、给、你、我的、追求、还有、我的、自由。
子步骤102:对初始分词词条进行词性标注,并保留词性为形容词、动词、名次和副词的词条,从而得到预处理词条序列。
对上述词条进行词性标注,保留词性为形容词、动词、名次和副词的词条后,得到的预处理词条序列为:{要,给,追求,自由}。
接下来,子步骤103-106将利用N-gram语言模型获取预处理词条序列的特征集合。
子步骤103:设定N值并令r=1。N即N-gram语言模型中的设定值,本实施例取N=3。
子步骤104:将预处理词条序列中r个相邻的词条作为特征放入特征集合Fi r中。
当r=1时,预处理词条序列中1个相邻的词条作为特征放入特征集合Fi 1中,则Fi 1={要,给,追求,自由}。
当r=2时,预处理词条序列中2个相邻的词条作为特征放入特征集合Fi 2中,则Fi 2={要给,给追求,追求自由}。
当r=3时,预处理词条序列中3个相邻的词条作为特征放入特征集合Fi 3中,则Fi 3={要给追求,给追求自由}。
子步骤105:判断r≥N是否成立,如果r≥N,则执行子步骤106;否则,令r=r+1,返回子步骤104。
当r=3时,满足条件r≥N,执行子步骤106。
子步骤106:将作为歌词训练集L中每首歌曲的歌词的特征集合Fi。即将Fi=Fi 1∪Fi 2∪Fi 3作为歌词训练集L中第i首歌曲的歌词的特征集合,从而有Fi={要,给,追求,自由,要给,给追求,追求自由,要给追求,给追求自由}。子步骤101-106中,i=1,2,...,n,n为歌词训练集L中的歌曲数量。
步骤3:根据公式确定歌词训练集的特征集合FL
由于上一步骤中,已经得到了每首歌曲的歌词的特征集合Fi,因此将他们的并集作为整个歌词训练集的特征集合,即有比如,在本实施例中,如果歌词训练集中有两首歌曲的歌词,第一首歌曲的歌词的特征集合为:
F1={要,给,追求,自由,要给,给追求,追求自由,要给追求,给追求自由}第二首歌曲的歌词的特征集合为:
F2={到底,爱,不爱,到底爱,爱不爱,到底爱不爱}
则FL={到底,爱,不爱,到底爱,爱不爱,到底爱不爱,要,给,追求,自由,要给,给追求,追求自由,要给追求,给追求自由}。
步骤4:在歌词训练集的特征集合FL中,将出现次数小于设定阈值的特征删除,得到歌词训练集的优化特征集合Fopt={t1,t2,...,tm}。
设定阈值的目的是减少特征向量的维数。当整个歌词训练集中的特征出现的次数小于这个阈值时,将该特征从特征集合中删除。本实施例中,如果特征“到底爱不爱”、“给追求”、“要给追求”,“给追求自由”出现的次数小于设定的阈值,则将它们从特征集合FL中删除,那么歌词训练集的优化特征集合Fopt={到底,爱,不爱,到底爱,爱不爱,要,给,追求,自由,要给,追求自由},歌词训练集的优化特征集合Fopt中的特征数量为11个。
步骤5:计算歌词训练集中每首歌曲的歌词的特征权值向量li并形成歌词训练集的特征权值矩阵N。
计算歌词训练集中每首歌曲的歌词的特征权值向量li具体为:将歌词训练集的优化特征集合Fopt中的特征依次与歌词训练集中第i首歌曲的歌词的特征集合Fi中的特征进行比较,如果歌词训练集的优化特征集合Fopt中的特征出现在第i首歌曲的歌词的特征集合Fi中,则将第i首歌曲的歌词的特征权值向量li的相应分量设置为1。如果歌词训练集的优化特征集合Fopt中的特征未出现在第i首歌曲的歌词的特征集合Fi中,则将第i首歌曲的歌词的特征权值向量li的相应分量设置为0。
以上述优化特征集合Fopt和第一首歌曲的歌词特征集合F1为例,优化特征集合Fopt的前5个特征{到底,爱,不爱,到底爱,爱不爱}都没有出现在第一首歌曲的歌词特征集合F1中,因此第一首歌曲的歌词的特征权值向量l1的前5个分量都为0。而优化特征集合Fopt的后6个特征{要,给,追求,自由,要给,追求自由}都出现在第一首歌曲的歌词特征集合F1中,因此第一首歌曲的歌词的特征权值向量l1的后6个分量都为1。由此,l1=(0,0,0,0,0,1,1,1,1,1,1)。同理可得,l2=(1,1,1,1,1,0,0,0,0,0,0)。
进一步,歌词训练集的特征权值矩阵N由歌词训练集中每首歌曲的歌词的特征权值向量li组成,特征权值矩阵N的第i行为第i首歌曲的歌词的特征权值向量li。由此,本实施例中的特征权值矩阵 N = 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 .
步骤6:建立歌词训练集的优化特征集合Fopt中的特征与音乐情感之间的特征指示函数fk(li,c)。
其中,特征指示函数
第一条件为:当歌词训练集的优化特征集合Fopt中的特征tk是第i首歌曲的歌词的特征集合Fi中的特征,并且第i首歌曲的歌词的音乐情感为c。
第二条件为:当歌词训练集的优化特征集合Fopt中的特征tk不是第i首歌曲的歌词的特征集合Fi中的特征或者第i首歌曲的歌词的音乐情感不为。
假设本实施例中的第一首歌曲的歌词情感为c1,第一首歌曲的歌词情感为c2,则由于优化特征集合Fopt中的第1个特征不是第1首歌曲的歌词的特征集合F1中的特征,因此有f1(l1,c1)=0。以此类推,可以计算出所有fk(l1,c1)和fk(l2,c2)的值,比如f6(l1,c1)=1,f1(l2,c2)=1,f6(l2,c2)=0。其中,k=1,2,...,m,m为优化特征集合Fopt中的特征数。
当然,fk(li,c)的值还可以根据下述方式计算,即当第i首歌曲的歌词的特征权值向量li的第k个分量为1且第i首歌曲的歌词的音乐情感为c时,fk(li,c)=1。否则,fk(li,c)=0。这是由歌曲的歌词的特征权值向量的定义决定的,因为如果第i首歌曲的歌词的特征权值向量的第k个分量为1,恰好表明优化特征集合Fopt中的第k个特征tk出现在第i首歌曲的歌词的特征集合Fi中。
步骤7:建立歌词训练集中每首歌曲的歌词与音乐情感的最大熵模型,包括目标函数和约束条件。
其中,目标函数为:
H(P)为P(c|li)的熵,且P(c|li)为歌词训练集中第i首歌曲的歌词的音乐情感为c的条件概率。C为由歌词训练集L中每首歌曲的歌词的音乐情感组成的集合。#(li)为歌词训练集中第i首歌曲的歌词在歌词训练集中出现的频数,|L|为歌词训练集中歌曲的总数。P为P(c|li)的缩写。
约束条件包括:
(1)P(c|li)≥0,i=1,2,...n且
(2) Σ c ∈ C P ( c | l i ) = 1 , i = 1,2 , . . . , n .
(3) Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i ) P ( c | l i ) f k ( l i , c ) = Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i , c ) f k ( l i , c ) .
其中,#(li,c)为歌词训练集中第i首歌曲的歌词的音乐情感为c统计频数。
上述公式中,歌词训练集中第i首歌曲的歌词在歌词训练集中出现的频数#(li),可以通过特征权值矩阵N来进行计算。第i首歌曲的歌词的特征权值向量li位于特征权值矩阵N的第i行,因此只需考察与特征权值矩阵N的第i行的元素完全相同的行的行数,即可得到第i首歌曲的歌词在歌词训练集中出现的频数#(li)。这是因为,在特征权值矩阵N中,元素完全相同的两行代表两首歌曲的歌词的特征权值完全相同,也就意味着两首歌曲的歌词相同。
另外,在本发明中,|L|为歌词训练集中歌曲的总数,实际就是n。当然,|L|也可以通过特征权值矩阵N计算。因为特征权值矩阵N的每一行代表一个歌词向量,因此特征权值矩阵N的行数即歌词向量数,也即歌曲总数。
步骤8:采用拉格朗日乘子法计算所述最大熵模型,得到条件概率P(c|li)的最优解和最优拉格朗日乘子向量Λ=(λ12,...,λk,...,λm)。
上述带约束条件的目标函数的求解问题,实际上是一个最优化问题,通过常用的最优化求解方法即可计算出结果。本发明采用拉格朗日乘子法,即对每个特征函数fk(li,c)都引入一个拉格朗日乘子λk,整个参数向量记为Λ=(λ1,...,λk,...),则拉格朗日最优化目标为:
ξ ( P , Λ ) = - Σ 1 ≤ i ≤ n , c ∈ C P ~ ( l i ) P ( c | l i ) log P ( c | l i ) + Σ k = 1 m λ k ( Σ 1 ≤ i ≤ n , c ∈ C ( P ~ ( l i ) P ( c | l i ) f k ( l i , c ) - P ~ ( l i , c ) f k ( l i , c ) )
按照最优化理论推导,可以得到P的最优解的参数形式:
P Λ ( c | l i ) = exp ( - 1 + Σ k = 1 m λ k f k ( l i , c ) )
由于PΛ(c|li)是条件概率,因此满足概率和为1的性质,即经过推导即可得到:
P Λ ( c | l i ) = 1 Z Λ ( l i ) exp ( Σ k λ k f k ( l i , c ) )
其中,ZΛ(li)为归一化因子且使得PΛ(c|li)满足条件概率的性质。从上式中不难发现,参数向量Λ=(λk)中,每个λk是其对应的特征fk的权重参数,表明特征fk在模型中的重要性,λk值越大,指示对应的特征fk越重要。
最大熵模型的最优求解有GIS、IIS等算法和工具包实现,求解出最优参数向量Λ=(λk),进而形成歌词情感识别模型。
步骤9:预处理待识别的歌词得到待识别的歌词的特征集合Fnew
预处理待识别的歌词得到待识别的歌词的特征集合Fnew与预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合相同,具体过程可参见子步骤101-子步骤106,此处不再赘述。
步骤10:计算待识别的歌词的特征权值向量lnew
计算待识别的歌词的特征权值向量lnew的方法与步骤5中计算歌词训练集中每首歌曲的歌词的特征权值向量li的方法一样。
步骤11:根据公式计算待识别的歌词的音乐情感c*
当获得特征权值向量lnew后,通过由歌词训练集得到的最优拉格朗日乘子向量Λ=(λ12,...,λk,...,λm),可以计算出待识别的歌词的音乐情感c*,其计算公式为:
c * = arg max c P ( c | l new ) = arg max c P Λ ( c | l new ) = arg max c 1 Z Λ ( l new ) exp ( Σ k = 1 m λ k h k ( l i , c ) v k )
其中, Z Λ ( l new ) = Σ c ∈ C exp ( Σ k = 1 m λ k h k ( l i , c ) v k ) 为归一化因子。
即对于某一个特征tk和音乐情感c,如果歌词训练集中任意一首歌曲的歌词的特征权值向量li存在fk(li,c)=1,则hk(li,c)=1;如果歌词训练集中所有歌曲的歌词的特征权值向量li都有fk(li,c)=0,则hk(li,c)=0。vk为待识别的歌词lnew的特征权值向量v的第k个分量。
通过上述方法计算出来的音乐情感c*为后验概率最大的类别,被模型判定为待识别歌词的音乐情感。
本发明通过歌词确定音乐情感,解决了常用技术通过音频文件确定音乐情感存在的训练和识别花费时间长、占用内存大等问题,达到了用户对音乐情感快速识别和移动设备上对音乐进行检索和访问的目的。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (2)

1.一种利用歌词识别音乐情感的方法,其特征是所述方法包括:
步骤1:将已经标注音乐情感的n首歌曲的歌词放入歌词训练集L中;
步骤2:预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合Fi;其中,Fi是第i首歌曲的歌词的特征集合,i=1,2,...,n,n为歌词训练集L中的歌曲数;
所述预处理歌词训练集L中每首歌曲的歌词得到歌词的特征集合Fi具体包括如下子步骤:
子步骤201:对歌词训练集L中每首歌曲的歌词进行中文分词,得到初始分词词条;
子步骤202:对初始分词词条进行词性标注,并保留词性为形容词、动词、名词和副词的词条,从而得到预处理词条序列;
子步骤203-206将利用N-gram语言模型获取预处理词条序列的特征集合;
子步骤203:设定N值并令r=1,N即N-gram语言模型中的设定值;
子步骤204:将预处理词条序列中每r个相邻的词条结合起来,并将结合后的词条作为特征放入特征集合Fi r中;
子步骤205:判断r≥N是否成立,如果r≥N,则执行子步骤206;否则,令r=r+1,返回子步骤204;
子步骤206:将作为歌词训练集L中每首歌曲的歌词的特征集合Fi
步骤3:根据公式确定歌词训练集的特征集合FL
步骤4:在歌词训练集的特征集合FL中,将出现次数小于设定阈值的特征删除,得到歌词训练集的优化特征集合Fopt={t1,t2,...,tk,...,tm};其中,tk为歌词训练集的优化特征集合中的特征,k=1,2,...,m,m为歌词训练集的优化特征集合中的特征数量;
步骤5:计算歌词训练集中每首歌曲的歌词的特征权值向量li并形成歌词训练集的特征权值矩阵N;
其中,li是第i首歌曲的歌词的特征权值向量;将歌词训练集的优化特征集合Fopt中的特征依次与歌词训练集中第i首歌曲的歌词的特征集合Fi中的特征进行比较,如果歌词训练集的优化特征集合Fopt中的特征出现在第i首歌曲的歌词的特征集合Fi中,则将第i首歌曲的歌词的特征权值向量li的相应分量设置为1;如果歌词训练集的优化特征集合Fopt中的特征未出现在第i首歌曲的歌词的特征集合Fi中,则将第i首歌曲的歌词的特征权值向量li的相应分量设置为0;其中,i=1,2,...,n,n为歌词训练集L中的歌曲数;
步骤6:建立歌词训练集的优化特征集合Fopt中的特征与音乐情感之间的特征指示函数fk(li,c);
其中,当歌词训练集的优化特征集合Fopt中的特征tk是第i首歌曲的歌词的特征集合Fi中的特征,并且第i首歌曲的歌词的音乐情感为c时,fk(li,c)=1;当歌词训练集的优化特征集合Fopt中的特征tk不是第i首歌曲的歌词的特征集合Fi中的特征或者第i首歌曲的歌词的音乐情感不为c时,fk(li,c)=0;
步骤7:建立歌词训练集中每首歌曲的歌词与音乐情感的最大熵模型,包括目标函数和约束条件;
所述目标函数为:
其中,H(P)为P(c|li)的熵,且
P(c|li)为歌词训练集中第i首歌曲的歌词的音乐情感为c的条件概率;
C为由歌词训练集L中每首歌曲的歌词的音乐情感组成的集合;
#(li)为歌词训练集中第i首歌曲的歌词在歌词训练集中出现的频数,|L|为歌词训练集中歌曲的总数;
所述约束条件包括:
P(c|li)≥0,i=1,2,...n且
Σ c ∈ C P ( c | l i ) = 1 , i = 1 , 2 , ... , n ;
Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i ) P ( c | l i ) f k ( l i , c ) = Σ 1 ≤ i ≤ n c ∈ C P ~ ( l i , c ) f k ( l i , c ) ;
其中,#(li,c)为歌词训练集中第i首歌曲的歌词的音乐情感为c的统计频数;
步骤8:采用拉格朗日乘子法计算所述最大熵模型,得到条件概率P(c|li)的最优解和最优拉格朗日乘子向量Λ=(λ12,...,λk,...,λm);
其中,ZΛ(li)为归一化因子且
步骤9:预处理待识别的歌词得到待识别的歌词的特征集合Fnew;具体包括如下子步骤:
子步骤901:对待识别的歌词进行中文分词,得到初始分词词条;
子步骤902:对初始分词词条进行词性标注,并保留词性为形容词、动词、名词和副词的词条,从而得到预处理词条序列;
子步骤903-906将利用N-gram语言模型获取预处理词条序列的特征集合;
子步骤903:设定N值并令r=1,N即N-gram语言模型中的设定值;
子步骤904:将预处理词条序列中每r个相邻的词条结合起来,并将结合后的词条作为特征放入特征集合中;
子步骤905:判断r≥N是否成立,如果r≥N,则执行子步骤906;否则,令r=r+1,返回子步骤904;
子步骤906:将作为待识别的歌词的特征集合Fnew
步骤10:计算待识别的歌词的特征权值向量lnew;将歌词训练集的优化特征集合Fopt中的特征依次与待识别的歌词的特征集合Fnew中的特征进行比较,如果歌词训练集的优化特征集合Fopt中的特征出现在待识别的歌词的特征集合Fnew中,则将待识别的歌词的特征权值向量lnew的相应分量设置为1;如果歌词训练集的优化特征集合Fopt中的特征未出现在待识别的歌词的特征集合Fnew中,则将待识别的歌词的特征权值向量lnew的相应分量设置为0;
步骤11:根据公式计算待识别的歌词的音乐情感c*
其中,
vk为待识别的歌词的特征权值向量lnew的第k个分量。
2.根据权利要求1所述的方法,其特征是所述歌词训练集的特征权值矩阵N由歌词训练集中每首歌曲的歌词的特征权值向量li组成,特征权值矩阵N的第i行为第i首歌曲的歌词的特征权值向量li;其中,i=1,2,...,n,n为歌词训练集L中的歌曲数。
CN201310460411.4A 2013-09-30 2013-09-30 一种利用歌词识别音乐情感的方法 Expired - Fee Related CN103488782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310460411.4A CN103488782B (zh) 2013-09-30 2013-09-30 一种利用歌词识别音乐情感的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310460411.4A CN103488782B (zh) 2013-09-30 2013-09-30 一种利用歌词识别音乐情感的方法

Publications (2)

Publication Number Publication Date
CN103488782A CN103488782A (zh) 2014-01-01
CN103488782B true CN103488782B (zh) 2016-07-27

Family

ID=49829008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310460411.4A Expired - Fee Related CN103488782B (zh) 2013-09-30 2013-09-30 一种利用歌词识别音乐情感的方法

Country Status (1)

Country Link
CN (1) CN103488782B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106228977B (zh) * 2016-08-02 2019-07-19 合肥工业大学 基于深度学习的多模态融合的歌曲情感识别方法
CN106292424A (zh) * 2016-08-09 2017-01-04 北京光年无限科技有限公司 针对人形机器人的音乐数据处理方法及装置
CN108268880A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种行业类别的识别方法及装置
CN106919673B (zh) * 2017-02-21 2019-08-20 浙江工商大学 基于深度学习的文本情绪分析系统
CN108763438B (zh) * 2018-05-25 2022-08-05 广州钱柜软件科技有限公司 一种基于云平台的音乐分类管理方法
CN109063069A (zh) * 2018-07-23 2018-12-21 天翼爱音乐文化科技有限公司 歌曲标签确定方法、装置、计算机设备和可读存储介质
CN112487237B (zh) * 2020-12-14 2022-10-18 重庆邮电大学 基于自适应cnn和半监督自训练模型的音乐分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739430A (zh) * 2008-11-21 2010-06-16 中国科学院计算技术研究所 一种基于关键词的文本情感分类器的训练方法和分类方法
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置
GB2490877A (en) * 2011-05-11 2012-11-21 British Broadcasting Corp Processing audio data for producing metadata and determining aconfidence value based on a major or minor key

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005113099A2 (en) * 2003-05-30 2005-12-01 America Online, Inc. Personalizing content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739430A (zh) * 2008-11-21 2010-06-16 中国科学院计算技术研究所 一种基于关键词的文本情感分类器的训练方法和分类方法
GB2490877A (en) * 2011-05-11 2012-11-21 British Broadcasting Corp Processing audio data for producing metadata and determining aconfidence value based on a major or minor key
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Music Emotion Recognition from Lyrics: A Comparative Study;Ricardo Malheiro等;《International Workshop on Machine Learning and Music, ECML/PKDD, Prague, 2013》;20130927;全文 *
Music Emotion Recognition:From Content- to Context-Based Models;Mathieu Barthet等;《9th International Symposium, CMMR 2012, London, UK》;20120622;全文 *
基于TF--IDF的音频和歌词特征融合模型的音乐情感分析研究;程一峰;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130315;全文 *
面向中文歌词的音乐情感分类研究;刘冬平;《中国优秀硕士学位论文全文数据库 信息科技辑》;20111115;全文 *
音乐内容和歌词相结合的歌曲情感分类方法研究;孙向琨;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120615;全文 *

Also Published As

Publication number Publication date
CN103488782A (zh) 2014-01-01

Similar Documents

Publication Publication Date Title
CN103488782B (zh) 一种利用歌词识别音乐情感的方法
US10977447B2 (en) Method and device for identifying a user interest, and computer-readable storage medium
CN108288468B (zh) 语音识别方法及装置
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN106897428B (zh) 文本分类特征提取方法、文本分类方法及装置
US8392414B2 (en) Hybrid audio-visual categorization system and method
US10713298B2 (en) Video retrieval methods and apparatuses
WO2018086470A1 (zh) 关键词提取方法、装置和服务器
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
US9218821B2 (en) Measuring content coherence and measuring similarity
CN110619051B (zh) 问题语句分类方法、装置、电子设备及存储介质
CN111090771B (zh) 歌曲搜索方法、装置及计算机存储介质
Hu et al. Latent topic model for audio retrieval
CN104350490A (zh) 用于组织与产品相关的数据的方法、装置以及计算机可读介质
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
Kiktova-Vozarikova et al. Feature selection for acoustic events detection
WO2020077825A1 (zh) 论坛社区应用管理方法、装置、设备及可读存储介质
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
US8301619B2 (en) System and method for generating queries
CN110162775A (zh) 确定意图识别准确度的方法、装置及计算机设备
CN109271624A (zh) 一种目标词确定方法、装置及存储介质
CN112183102A (zh) 基于注意力机制与图注意力网络的命名实体识别方法
CN115795030A (zh) 文本分类方法、装置、计算机设备和存储介质
CN106710588B (zh) 语音数据句类识别方法和装置及系统
CN112925912A (zh) 文本处理方法、同义文本召回方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160727

Termination date: 20170930