CN115422947A - 一种基于深度学习的古诗词配乐方法及系统 - Google Patents

一种基于深度学习的古诗词配乐方法及系统 Download PDF

Info

Publication number
CN115422947A
CN115422947A CN202211162535.XA CN202211162535A CN115422947A CN 115422947 A CN115422947 A CN 115422947A CN 202211162535 A CN202211162535 A CN 202211162535A CN 115422947 A CN115422947 A CN 115422947A
Authority
CN
China
Prior art keywords
music
model
emotion
classification
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211162535.XA
Other languages
English (en)
Inventor
白晓东
红格尔
王祎琳
陈振宇
张睿彤
白佳琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Minzu University
Original Assignee
Dalian Minzu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Minzu University filed Critical Dalian Minzu University
Priority to CN202211162535.XA priority Critical patent/CN115422947A/zh
Publication of CN115422947A publication Critical patent/CN115422947A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本申请涉及配乐领域,尤其涉及一种基于深度学习的古诗词配乐方法及系统。方法包括:构建音乐分类模型;构建音乐库,通过音乐分类模型分别确定音乐库中音乐文件的音乐情感类型;基于深度学习构建古诗词分类模型;输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果;基于预设的特征匹配模型,根据待匹配文本的主题分类结果和情感分类结果,确定可匹配的音乐情感类型并且在音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。本申请通过构建关于古诗词情感的古诗词分类模型,可以有针对性地对古诗词文本所表达的情感进行分析并且迅速地基于古诗词文本的情感进行音乐匹配。

Description

一种基于深度学习的古诗词配乐方法及系统
技术领域
本申请涉及配乐领域,尤其涉及一种基于深度学习的古诗词配乐方法及系统。
背景技术
中国古典诗词是中华文化库中的瑰宝,不仅承担着提高文学素养的作用,也是弘扬中华优秀传统文化的重要手段。随着多媒体教学法的广泛普及,教师为了更顺利地推进教学活动,需要经常查找并获取与古诗词相匹配的背景音乐资源。
但是,海量的音乐作品造成了严重的信息过载问题,导致在检索与授课内容相匹配的音乐作品时,消耗了大量的不必要的时间与精力。因此,如何实现针对古诗词的音乐检索成为了一个极其重要的问题。
相较于普通文本信息,古诗词中凝练了大量的意象,旨在表达作者丰富的情感思想,因此古诗词文本分析的重点是结构、文字之间的连接关系以及诗词整体表现出的“意境”,把握住古诗词表达情感才能为其匹配合适的音乐。
目前,市面上存在一些根据文本信息进行配乐的方法,但是基本上都只是单纯的进行文本特征提取从而进行音乐的匹配,而忽略了古诗词相比于普通文本的的特点,导致无法给予古诗词文本相较于普通文本的同样准确的匹配率,最终给用户带来了极差的体验,因此,如何实现基于古诗词文本内容的音乐检索是一个亟需解决的问题。
发明内容
本申请提供了一种基于深度学习的古诗词配乐方法及系统,能够解决现有的基于文本信息进行配乐的技术无法给予古诗词文本相较于普通文本的同样准确的匹配率的问题。
第一方面,本申请的技术方案是一种基于深度学习的古诗词配乐方法,包括:
S1:构建关于音乐情感的音乐分类模型;可通过输入音乐文件至所述音乐分类模型,用于相应地确定音乐文件的音乐情感类型;
S2:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型;
S3:基于深度学习构建关于古诗词情感的古诗词分类模型;可通过输入古诗词文本至所述古诗词分类模型,用于相应地确定古诗词文本的主题分类结果和情感分类结果;
S4:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果;
S5:基于预设的特征匹配模型,根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型并且在音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
可选地,所述音乐分类模型包括:音乐特征模型、音乐识别模型和分类认知模型;
所述音乐特征模型,用于确定音乐文件中音乐基本单元的音乐特征;
所述音乐识别模型,用于确定音乐文件中音乐基本单元的音乐情感类型;
所述分类认知模型,用于根据音乐文件中音乐基本单元的音乐特征和音乐情感类型,确定音乐文件的音乐情感类型。
可选地,所述音乐特征模型中的音乐特征包括:音高、音强、旋律方向、速度、节拍和音色;
以及,所述音乐特征模型包括:Hevner情感环模型;
以及,所述分类认知模型基于决策树理论确定音乐文件的音乐情感类型。
可选地,所述古诗词分类模型包括:主题分类模型FastText和情感分类模型BiLSTM;
以及,所述步骤S3包括:
S31:构建包括若干个古诗词的诗词库,以及对诗词库中的若干个古诗词进行预处理,得到预处理文库;
S32:在预处理文库中挑选出训练集和测试集;
S33:根据训练需求,通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText和情感分类模型BiLSTM;
可通过输入音乐文件至所述主题分类模型FastText,用于相应地确定音乐文件的主题分类结果;可通过输入音乐文件至所述情感分类模型BiLSTM,用于相应地确定音乐文件的情感分类结果。
可选地,所述步骤S31包括:
S311:基于包含诗词内容的语料库和包含情感标签的知识库,构建起包含古诗词内容和古诗词对应情感标签的的诗词库;
S312:去除诗词库中的若干个古诗词的标点符号,分别得到若干个古诗词的纯文本;
S313:基于预设标准对纯文本进行切分,得到相应于若干个古诗词的切分文本;
S314:通过Python中的Gensim自然语言处理工具包使用Word2Vec模型将若干个切分文本转化为相应于若干个古诗词的词向量,得到预处理文库。
可选地,所述步骤S313中的预设标准可为以字为单位,也可为以词为单位。
可选地,所述步骤S33包括:
S331:设置输入层,输入词向量并采用n-gram语言模型扩充特征词,增加文本的时序特征;设置隐藏层,对文本中的词向量进行叠加平均;设置输出层,输出SoftMax分类概率;
S332:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText;
S333:设置输入层,输入词向量;设置映射层,将句中的每一个词都映射成固定长度的向量;设置LSTM层,用双向的LSTM对进入此层的向量进行计算,得到更高级别的句子向量;设置Attention层,对双向LSTM的结果加权;设置输出层;
S334:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
可选地,所述步骤S2包括:
S21:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型和相应于音乐情感类型的音乐情感标签;
以及,所述步骤S4包括:
S41:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果,以及确定相应于主题分类结果的古诗词主题标签和相应于情感分类结果的古诗词情感标签;
以及,所述步骤S5包括:
S51:构建基于音乐情感标签、古诗词主题标签和古诗词情感标签的初始数据集;
S52:通过初始训练集对随机森林算法模型进行训练,得到特征匹配模型;
S53:基于特征匹配模型,根据待匹配文本的古诗词主题标签和古诗词情感标签,确定相应于待匹配文本的可匹配的音乐情感标签并且在音乐库中搜索相应于可匹配的音乐情感标签的音乐文件,确定相应于待匹配文本的匹配音乐。
第二方面,本申请的技术方案是一种基于深度学习的古诗词配乐系统,包括:模型构建模块、音乐库模块、音乐分类模块、古诗词输入模块、古诗词分类模块和匹配模块;
所述模型构建模块,用于构建音乐分类模型和古诗词分类模型;
所述音乐库模块,用于存储音乐库;
所述音乐分类模块,用于存储音乐分类模型,以及通过音乐分类模型确定若干个音乐文件的音乐情感类型;所述音乐库模块还用于存储已确定音乐情感类型的音乐库;
所述古诗词输入模块,用于获取待配乐的古诗词并且确定待配乐的古诗词的待匹配文本,以及传送待匹配文本;
所述古诗词分类模块,用于存储古诗词分类模型,用于接收待匹配文本并且通过古诗词分类模型确定待匹配文本的主题分类结果和情感分类结果;
所述匹配模块,用于存储预设的特征匹配模型,以及根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型,以及通过所述音乐库模块在已确定音乐情感类型的音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
可选地,所述模型构建模块包括:文本获取单元、数据预处理单元、数据转化单元、主题分类单元和情感分类单元;
所述文本获取单元,构建包括若干个古诗词的诗词库;
所述数据预处理单元,用于对诗词库中的若干个古诗词进行预处理,得到预处理文库;
所述数据转化单元,用于在预处理文库中挑选出训练集和测试集;
所述主题分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText;
所述情感分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
有益效果:
本申请通过构建基于古诗词文本的关于古诗词情感的古诗词分类模型,可以有针对性地对古诗词文本所表达的情感进行分析,因此在确定好音乐情感类型的基础上,迅速地基于古诗词文本的情感进行音乐匹配,整个过程智能简便,准确率高而且效率高,因此能够解决现有的基于文本信息进行配乐的技术无法给予古诗词文本相较于普通文本的同样准确的匹配率的问题。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中一种基于深度学习的古诗词配乐方法的流程示意图;
图2为本申请实施例中音乐识别模型的Hevner模型的示意图;
图3为本申请实施例中一种基于深度学习的古诗词配乐系统的结构示意图;
其中,1-模型构建模块;2-音乐库模块;3-音乐分类模块;4-古诗词输入模块;5-古诗词分类模块;6-匹配模块。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。
针对古诗词进行音乐检索,主要包括两个方面,一方面,需要对文本信息进行处理,即从中提取出情感基调、文本特征等信息;另一方面,面对海量的音乐作品数据库,需要精准有效的从中检索出与文本信息相匹配的背景音乐。
在文本信息处理方面,机器学习和深度学习都被广泛应用且有着优秀的表现。在自然语言处理领域中,文本识别技术、语义识别技术可以将古典诗词从主题和情感方面进行有效的分类和标识。其中文本情感分析是指通过计算机技术对文本的主客观性、观点、情绪等的挖掘和分析,对文本的情感倾向做出分类判断。音乐和文本是人类描述情感信息的两种符号系统。实现文本和音乐之间的匹配常常需要建立这两个符号系统之间的语义对应关系,从而实现两种系统描述情感的对应。传统机器学习方法领域的分类算法有支持向量机、回归模型、随机森林等。除此之外,深度学习的各种NLP神经网络算法使得文本识别技术、语义识别技术更加成熟。基于深度学习的情感分析也逐渐成为主流,该方法将文本向量化成能够被计算机计算的连续向量,同时结合各种深度学习模型针对上下文进行建模提取特征。
音乐分析,本质上是对音乐的检索,传统的音乐检索方式有基于文本的音乐检索和基于内容的音乐检索。基于文本的音乐检索这一过程依赖人工标注,通过将音乐属性作为关键字,如音乐名称、作曲人姓名、歌词信息等,与数据库中的音乐信息对比进行检索和匹配。但该方式存在明显的局限性:在实际检索过程中,用户可能无法提供有效的音乐属性信息,对于无明确关键字信息这一情况,并且文本信息对音乐自身属性的表达并不全面,该方式目前无法满足用户的检索需求。基于内容的音乐检索方法以音乐本身拥有的属性特征作为出发点,提取可以表征音乐的特征,如频谱、相位、旋律、音色等,相关检索技术有哼唱音乐检索、乐谱自动转换等。音乐也是情感传递的一种载体,文本情感分析与音频情感分析提取出的情感色彩和情感趋向性可作为文本与音乐匹配的依据。音乐的情感识别分析本质上是一个多分类问题,主要包含两个步骤:情感特征提取和情感识别。情感特征的提取和识别涉及多方面的专业知识,如声学特征,情感分类算法、情感语料等。情感识别则是将语音信息通过传感器获得语音信号,通过对语音信号的提取识别出情感特征,最后将得到的情感特征进行识别判断。
(一)本申请实施例提供了一种基于深度学习的古诗词配乐方法,如图1所示,图1为本申请实施例中一种基于深度学习的古诗词配乐方法的流程示意图,方法包括:
S1:构建关于音乐情感的音乐分类模型。可通过输入音乐文件至音乐分类模型,用于相应地确定音乐文件的音乐情感类型。
具体地,音乐分类模型包括:音乐特征模型、音乐识别模型和分类认知模型。音乐识别模型作为最终分类的基础,选择尤为重要。音乐识别模型中最为通用、常见的有Hevner模型、Thayer模型、TWC模型和PAD模型等。
其中,音乐特征模型是分类认知模型的输入,用于确定音乐文件中音乐基本单元的音乐特征。
一首完整的音乐分为若干小节,小节作为音乐的基本单元。
低层特征如能量特征、频域特征、时域特征、乐音特征和感知特征等,与人认知层面的情感间接相关;高层特征与情感之间有更强且更直接的相关性,如速度、节拍、伴奏、和弦、调式等。
音高:小节的平均音高。
Figure BDA0003860725520000061
音强:小节的平均音强。
Figure BDA0003860725520000062
旋律方向:音高和音符时长都有可能影响旋律方向。
Figure BDA0003860725520000063
速度:音乐速度的快慢影响着情感表达。通常轻快的音乐速度较快,严肃、庄重的音乐速度较慢。这里使用单个音符时长来衡量,单个音符的时长越短则音乐速度越快,反之则越慢。
Figure BDA0003860725520000071
节拍:衡量节奏的单位。节拍对音乐情感的表现也起到重要作用。节拍可以从MIDI音乐文件中直接读取。
音色:不同乐器产生的音色不同,而音色特征常常间接的反应音乐的情感主体。如萧、二胡用于表达悲伤的情感,笛子、贝斯用于演奏欢快的乐曲。通过对MIDI音乐文件进行分析得到乐曲音色信息。
使用上述六个音乐特征,包括音高、音强、旋律方向、速度、节拍、音色,构成音乐的特征向量,用音乐特征向量来表示音乐基本单元的情感。表示为:X=[Pitch,Velocity,Melody,Tempo,Beat,Tone],X作为分类认知模型的输入。
音乐识别模型,具体记载分类标准,用于确定音乐文件中音乐基本单元的音乐情感类型。
在一些实施例中,如图2所示,图2为本申请实施例中音乐识别模型的Hevner模型的示意图,由隶属于八个类别的67个形容词组成,每个类别中的形容词为近义词,用来表示相近的情感,并且八个类别根据相互关系构成了一个环形图,称为Hevner情感环模型。
分类认知模型,用于根据音乐文件中音乐基本单元的音乐特征和音乐情感类型,确定音乐文件的音乐情感类型。
在一些实施例中,分类认知模型基于决策树理论确定音乐文件的音乐情感类型。
S2:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型。
其中,步骤S2包括:
S21:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型和相应于音乐情感类型的音乐情感标签。
S3:基于深度学习构建关于古诗词情感的古诗词分类模型。可通过输入古诗词文本至古诗词分类模型,用于相应地确定古诗词文本的主题分类结果和情感分类结果。
具体地,古诗词分类模型可通过输入古诗词文本,经过模型处理得到该古诗词文本的主题分类结果和情感分类结果,其中主题分类的结果主要是根据古诗词文本中文字字面表达的含义,将古诗词文本进行字面含义上的主题分类;情感分类的结果是通过分析古诗词文本中诗句所要表达的情感信息,将古诗词文本根据蕴含的情感进行分类。
主题分类结果和情感分类结果各自起到不同的作用,但是又相互协同,对应生成的古诗词主题标签和古诗词情感标签能够更好的确定与古诗词对应的“音乐情感类型”,从而能够更精确的体现出古诗词文本与音乐文件之间的匹配关系,提高古诗词配乐的准确性。
古诗词分类模型包括:主题分类模型FastText和情感分类模型BiLSTM。
其中,步骤S3包括:
S31:构建包括若干个古诗词的诗词库,以及对诗词库中的若干个古诗词进行预处理,得到预处理文库。
其中,步骤S31包括:
S311:基于包含诗词内容的语料库和包含情感标签的知识库,构建起包含古诗词内容和古诗词对应情感标签的的诗词库。
S312:去除诗词库中的若干个古诗词的标点符号,分别得到若干个古诗词的纯文本。
S313:基于预设标准对纯文本进行切分,得到相应于若干个古诗词的切分文本。
具体地,预设标准可为以字为单位,也可为以词为单位。
S314:通过Python中的Gensim自然语言处理工具包使用Word2Vec模型将若干个切分文本转化为相应于若干个古诗词的词向量,得到预处理文库。
具体地,在文本预处理部分,分词是进行自然语言处理的重要步骤,中文分词与英文分词区别较大,古诗词是一种具有人文内涵且凝练性高的中文文本,随着中国古典诗词语料库的不断建设,可以使用针对于古汉语处理的NLP工具包甲言进行分词,还有其它的中文分词包值得使用,如SegTag、Jieba、PkuSeg。
在完成分词后,文本会出现大量的单字,例如语气助词、连接词、代词等无实际意义的单字被称为停用词,可以将停用词进行过滤去除,提高模型的效率,常用的停用词表有哈工大停用词表、百度停用词表、机器智能实验室停用词库。
在分词的基础上,可以通过中国古典诗词语料库确定每个词的情感含义,对词语进行情感标注,通过某种算法将整首诗词中词语情感合一,生成整首诗词的情感标签。
文本预处理后,进行文本向量化。文本向量化又称词嵌入,词嵌入是指把一个维数是所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组是映射到实数域上的向量。将文本转化为计算机可以看懂的语言,常用的文本向量化有one-hot编码、TF-IDF矩阵、word2Vec模型。其中,word2Vec模型为常用的词嵌入方法,通过设置虚拟空间维度和词语的最低保存词频即可实现词嵌入处理。
S32:在预处理文库中挑选出训练集和测试集。
S33:根据训练需求,通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText和情感分类模型BiLSTM。
可通过输入音乐文件至主题分类模型FastText,用于相应地确定音乐文件的主题分类结果。可通过输入音乐文件至情感分类模型BiLSTM,用于相应地确定音乐文件的情感分类结果。
其中,步骤S33包括:
S331:设置输入层,输入词向量并采用n-gram语言模型扩充特征词,增加文本的时序特征。设置隐藏层,对文本中的词向量进行叠加平均。设置输出层,输出SoftMax分类概率。
S332:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText。
S333:设置输入层,输入词向量。设置映射层,将句中的每一个词都映射成固定长度的向量。设置LSTM层,用双向的LSTM对进入此层的向量进行计算,得到更高级别的句子向量。设置Attention层,对双向LSTM的结果加权。设置输出层。
S334:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
S4:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果。
其中,步骤S4包括:
S41:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果,以及确定相应于主题分类结果的古诗词主题标签和相应于情感分类结果的古诗词情感标签。
S5:基于预设的特征匹配模型,根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型并且在音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
其中,步骤S5包括:
S51:构建基于音乐情感标签、古诗词主题标签和古诗词情感标签的初始数据集。
S52:通过初始训练集对随机森林算法模型进行训练,得到特征匹配模型。
S53:基于特征匹配模型,根据待匹配文本的古诗词主题标签和古诗词情感标签,确定相应于待匹配文本的可匹配的音乐情感标签并且在音乐库中搜索相应于可匹配的音乐情感标签的音乐文件,确定相应于待匹配文本的匹配音乐。
(二)本申请实施例还提供了一种基于深度学习的古诗词配乐系统,如图3所示,图3为本申请实施例中一种基于深度学习的古诗词配乐系统的结构示意图,系统包括:模型构建模块1、音乐库模块2、音乐分类模块3、古诗词输入模块4、古诗词分类模块5和匹配模块6。
模型构建模块1,用于构建音乐分类模型和古诗词分类模型。
具体地,模型构建模块1包括:文本获取单元、数据预处理单元、数据转化单元、主题分类单元和情感分类单元。
文本获取单元,构建包括若干个古诗词的诗词库。
数据预处理单元,用于对诗词库中的若干个古诗词进行预处理,得到预处理文库。
具体地,数据预处理单元用于将从诗词库获得的古诗词文本和待匹配文本进行标点符号去除,按字切分,可选的,按词切分,对类标进行onehot化。
数据转化单元,用于在预处理文库中挑选出训练集和测试集。
主题分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText。
情感分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
音乐库模块2,用于存储音乐库。
音乐分类模块3,用于存储音乐分类模型,以及通过音乐分类模型确定若干个音乐文件的音乐情感类型。音乐库模块2还用于存储已确定音乐情感类型的音乐库。
古诗词输入模块4,用于获取待配乐的古诗词并且确定待配乐的古诗词的待匹配文本,以及传送待匹配文本。
古诗词分类模块5,用于存储古诗词分类模型,用于接收待匹配文本并且通过古诗词分类模型确定待匹配文本的主题分类结果和情感分类结果。
匹配模块6,用于存储预设的特征匹配模型,以及根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型,以及通过音乐库模块2在已确定音乐情感类型的音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
具体地,匹配模块6用于构建、训练并测试随机森林分类算法模型,将音乐库中匹配的音乐随机化推荐给用户。
以上对本申请的实施例进行了详细说明,但内容仅为本申请的较佳实施例,不能被认为用于限定本申请的实施范围。凡依本申请范围所作的均等变化与改进等,均应仍属于本申请的专利涵盖范围之内。

Claims (10)

1.一种基于深度学习的古诗词配乐方法,其特征在于,包括:
S1:构建关于音乐情感的音乐分类模型;可通过输入音乐文件至所述音乐分类模型,用于相应地确定音乐文件的音乐情感类型;
S2:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型;
S3:基于深度学习构建关于古诗词情感的古诗词分类模型;可通过输入古诗词文本至所述古诗词分类模型,用于相应地确定古诗词文本的主题分类结果和情感分类结果;
S4:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果;
S5:基于预设的特征匹配模型,根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型并且在音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
2.根据权利要求1所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述音乐分类模型包括:音乐特征模型、音乐识别模型和分类认知模型;
所述音乐特征模型,用于确定音乐文件中音乐基本单元的音乐特征;
所述音乐识别模型,用于确定音乐文件中音乐基本单元的音乐情感类型;
所述分类认知模型,用于根据音乐文件中音乐基本单元的音乐特征和音乐情感类型,确定音乐文件的音乐情感类型。
3.根据权利要求2所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述音乐特征模型中的音乐特征包括:音高、音强、旋律方向、速度、节拍和音色;
以及,所述音乐特征模型包括:Hevner情感环模型;
以及,所述分类认知模型基于决策树理论确定音乐文件的音乐情感类型。
4.根据权利要求1所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述古诗词分类模型包括:主题分类模型FastText和情感分类模型BiLSTM;
以及,所述步骤S3包括:
S31:构建包括若干个古诗词的诗词库,以及对诗词库中的若干个古诗词进行预处理,得到预处理文库;
S32:在预处理文库中挑选出训练集和测试集;
S33:根据训练需求,通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText和情感分类模型BiLSTM;
可通过输入音乐文件至所述主题分类模型FastText,用于相应地确定音乐文件的主题分类结果;可通过输入音乐文件至所述情感分类模型BiLSTM,用于相应地确定音乐文件的情感分类结果。
5.根据权利要求4所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述步骤S31包括:
S311:基于包含诗词内容的语料库和包含情感标签的知识库,构建起包含古诗词内容和古诗词对应情感标签的的诗词库;
S312:去除诗词库中的若干个古诗词的标点符号,分别得到若干个古诗词的纯文本;
S313:基于预设标准对纯文本进行切分,得到相应于若干个古诗词的切分文本;
S314:通过Python中的Gensim自然语言处理工具包使用Word2Vec模型将若干个切分文本转化为相应于若干个古诗词的词向量,得到预处理文库。
6.根据权利要求5所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述步骤S313中的预设标准可为以字为单位,也可为以词为单位。
7.根据权利要求5所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述步骤S33包括:
S331:设置输入层,输入词向量并采用n-gram语言模型扩充特征词,增加文本的时序特征;设置隐藏层,对文本中的词向量进行叠加平均;设置输出层,输出SoftMax分类概率;
S332:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText;
S333:设置输入层,输入词向量;设置映射层,将句中的每一个词都映射成固定长度的向量;设置LSTM层,用双向的LSTM对进入此层的向量进行计算,得到更高级别的句子向量;设置Attention层,对双向LSTM的结果加权;设置输出层;
S334:通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
8.根据权利要求1所述的一种基于深度学习的古诗词配乐方法,其特征在于,所述步骤S2包括:
S21:构建包括若干个音乐文件的音乐库,通过音乐分类模型分别确定音乐库中若干个音乐文件的音乐情感类型和相应于音乐情感类型的音乐情感标签;
以及,所述步骤S4包括:
S41:获取待配乐的古诗词的待匹配文本,输入待匹配文本至古诗词分类模型,确定待匹配文本的主题分类结果和情感分类结果,以及确定相应于主题分类结果的古诗词主题标签和相应于情感分类结果的古诗词情感标签;
以及,所述步骤S5包括:
S51:构建基于音乐情感标签、古诗词主题标签和古诗词情感标签的初始数据集;
S52:通过初始训练集对随机森林算法模型进行训练,得到特征匹配模型;
S53:基于特征匹配模型,根据待匹配文本的古诗词主题标签和古诗词情感标签,确定相应于待匹配文本的可匹配的音乐情感标签并且在音乐库中搜索相应于可匹配的音乐情感标签的音乐文件,确定相应于待匹配文本的匹配音乐。
9.一种基于深度学习的古诗词配乐系统,其特征在于,包括:模型构建模块、音乐库模块、音乐分类模块、古诗词输入模块、古诗词分类模块和匹配模块;
所述模型构建模块,用于构建音乐分类模型和古诗词分类模型;
所述音乐库模块,用于存储音乐库;
所述音乐分类模块,用于存储音乐分类模型,以及通过音乐分类模型确定若干个音乐文件的音乐情感类型;所述音乐库模块还用于存储已确定音乐情感类型的音乐库;
所述古诗词输入模块,用于获取待配乐的古诗词并且确定待配乐的古诗词的待匹配文本,以及传送待匹配文本;
所述古诗词分类模块,用于存储古诗词分类模型,用于接收待匹配文本并且通过古诗词分类模型确定待匹配文本的主题分类结果和情感分类结果;
所述匹配模块,用于存储预设的特征匹配模型,以及根据待匹配文本的主题分类结果和情感分类结果,确定相应于待匹配文本的可匹配的音乐情感类型,以及通过所述音乐库模块在已确定音乐情感类型的音乐库中搜索相应于可匹配的音乐情感类型的音乐文件,确定相应于待匹配文本的匹配音乐。
10.根据权利要求9所述的一种基于深度学习的古诗词配乐系统,其特征在于,所述模型构建模块包括:文本获取单元、数据预处理单元、数据转化单元、主题分类单元和情感分类单元;
所述文本获取单元,构建包括若干个古诗词的诗词库;
所述数据预处理单元,用于对诗词库中的若干个古诗词进行预处理,得到预处理文库;
所述数据转化单元,用于在预处理文库中挑选出训练集和测试集;
所述主题分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的主题分类模型FastText;
所述情感分类单元,用于通过训练集训练模型并且通过测试集测试模型,得到相应于训练需求的情感分类模型BiLSTM。
CN202211162535.XA 2022-09-23 2022-09-23 一种基于深度学习的古诗词配乐方法及系统 Pending CN115422947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211162535.XA CN115422947A (zh) 2022-09-23 2022-09-23 一种基于深度学习的古诗词配乐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211162535.XA CN115422947A (zh) 2022-09-23 2022-09-23 一种基于深度学习的古诗词配乐方法及系统

Publications (1)

Publication Number Publication Date
CN115422947A true CN115422947A (zh) 2022-12-02

Family

ID=84204302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211162535.XA Pending CN115422947A (zh) 2022-09-23 2022-09-23 一种基于深度学习的古诗词配乐方法及系统

Country Status (1)

Country Link
CN (1) CN115422947A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628256A (zh) * 2023-05-22 2023-08-22 杭州晨星创文网络科技有限公司 一种用于数据库平台的诗词分类方法及系统
CN117313748A (zh) * 2023-11-24 2023-12-29 中电科大数据研究院有限公司 面向政务问答的多特征融合语义理解方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628256A (zh) * 2023-05-22 2023-08-22 杭州晨星创文网络科技有限公司 一种用于数据库平台的诗词分类方法及系统
CN117313748A (zh) * 2023-11-24 2023-12-29 中电科大数据研究院有限公司 面向政务问答的多特征融合语义理解方法及装置
CN117313748B (zh) * 2023-11-24 2024-03-12 中电科大数据研究院有限公司 面向政务问答的多特征融合语义理解方法及装置

Similar Documents

Publication Publication Date Title
CN106997382B (zh) 基于大数据的创新创意标签自动标注方法及系统
CN110674339B (zh) 一种基于多模态融合的中文歌曲情感分类方法
Lo et al. Cost-sensitive multi-label learning for audio tag annotation and retrieval
CN115422947A (zh) 一种基于深度学习的古诗词配乐方法及系统
CN112487237B (zh) 基于自适应cnn和半监督自训练模型的音乐分类方法
KR20220134695A (ko) 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법
TWI389100B (zh) 語音情緒的分類方法及其情緒語意模型的建立方法
Ünal et al. A hierarchical approach to makam classification of Turkish makam music, using symbolic data
CN109446313A (zh) 一种基于自然语言分析的排序系统及方法
Turnbull et al. Modelling music and words using a multi-class naıve bayes approach
Nagavi et al. Overview of automatic Indian music information recognition, classification and retrieval systems
Van Balen Audio description and corpus analysis of popular music
CN116933782A (zh) 一种电商文本关键词提取处理方法及系统
Çoban Turkish music genre classification using audio and lyrics features
Wu et al. Research on song sentiment binary classification based on Chinese lyrics
Kanchana et al. Comparison of genre based tamil songs classification using term frequency and inverse document frequency
Akhter et al. A Study of Implementation of Deep Learning Techniques for Text Summarization
Moon et al. How to Retrieve Music using Mood Tags in a Folksonomy
CN117093718B (zh) 基于云算力和大数据技术的知识图谱海量非结构化集成方法
Ring et al. Finding ‘Lucy in Disguise’: the misheard lyric matching problem
Kher Music Composer Recognition from MIDI Representation using Deep Learning and N-gram Based Methods
Abdolahi et al. Textual Coherence improvement of extractive document summarization using greedy approach and word vectors
Parra et al. Unsupervised tagging of spanish lyrics dataset using clustering
Kao et al. Automated generation of sinhala lyrics using recurrent neural networks
Chen et al. Design of Music Style Classification Teaching System based on BP Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination