CN113920969A - 信息处理方法、装置、电子设备及存储介质 - Google Patents
信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113920969A CN113920969A CN202111178341.4A CN202111178341A CN113920969A CN 113920969 A CN113920969 A CN 113920969A CN 202111178341 A CN202111178341 A CN 202111178341A CN 113920969 A CN113920969 A CN 113920969A
- Authority
- CN
- China
- Prior art keywords
- melody
- information
- coding
- processed
- chord
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 27
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000015654 memory Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 17
- 238000012552 review Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 12
- 238000003062 neural network model Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- ASTNLROMDNGJLS-UHFFFAOYSA-N hot-7 Chemical compound CCCSC1=CC(OC)=C(CCNO)C=C1OC ASTNLROMDNGJLS-UHFFFAOYSA-N 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
- G10H1/0025—Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/101—Music Composition or musical creation; Tools or processes therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/101—Music Composition or musical creation; Tools or processes therefor
- G10H2210/111—Automatic composing, i.e. using predefined musical rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/311—Neural networks for electrophonic musical instruments or musical processing, e.g. for musical recognition or control, automatic composition or improvisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
本申请公开了一种信息处理方法、装置、电子设备及存储介质,具体实现方案为:根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。采用本申请,可以基于编码自动生成高质量的旋律。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种信息处理方法、装置、电子设备及存储介质。
背景技术
自信息革命以来,音乐和多媒体的传播方式在短时间内发生了天翻地覆的变化。这种质的变化使得市场对各类音乐的需求呈现了爆发式的增长:无论是以流行音乐或艺术创作为主要元素的单曲、专辑、MV、卡拉OK,还是使用音乐作为辅助的短视频、广告、动画、宣传片和影视作品,抑或是使用音乐作为背景内容的电台、主播、公共空间音乐,都需要大量的原创音乐。如何基于编码自动生成高质量的旋律,成为本领域内亟待解决的技术问题。
发明内容
本申请提供了一种信息处理方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种信息处理方法,包括:
根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;
根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
根据本申请的另一方面,提供了一种信息处理装置,包括:
编码模块,用于根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;
旋律生成模块,用于根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本申请任意一实施例所提供的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本申请任意一项实施例所提供的方法。
采用本申请,可以根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果,其中,该待处理旋律信息包括该待处理旋律信息的旋律总长度及该待处理旋律信息的旋律开头部分,从而可以根据该编码结果及旋律生成模型,得到与该待匹配和弦信息对应的目标旋律信息,该目标旋律信息即为基于编码自动生成的高质量旋律。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的一信息处理方法的流程示意图;
图2是根据本申请实施例的信息处理装置的组成结构示意图;
图3是用来实现本申请实施例的信息处理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
计算机自动旋律生成技术指,将乐谱以离散的数值形式表示,以和弦进行、速度、类型等为条件,用算法自动生成旋律。针对这项技术,现有技术方案主要包括:1)基于旋律库和音乐规则进行旋律生成或拼接;2)基于评价函数使用搜索算法生成旋律,搜索算法包括启发式搜索或遗传算法;3)使用神经网络进行旋律序列生成,大多为通过使用RNN或LSTM模型对后一个音进行预测完成旋律生成。
对于上述第1)类方案而言,可以生成模版化的旋律,但受限制于有限的旋律库和规则,多样性和创新性较差,音乐规则也较难总结和穷尽。对于上述第2)类方案而言,评价函数难以确定有效,虽然可以生成不依赖已有旋律库的旋律,但是质量较差;对于上述第3)类方案而言,可以无需编写大量规则,即可期望模型通过训练生成比较好的旋律,但是其大多使用的LSTM模型难以学习旋律在长程上的逻辑,使得生成的旋律随机性较大,乐句之间难以出现模进等技法,在主题性上也不如基于规则的旋律生成方法。
采用本申请,可以基于简单的乐理规则从旋律及和弦中提取特征和编码,并作为神经网络的输入,从而输出得到一段与和弦进行相匹配的旋律。其中,该输出得到的旋律,是基于用户指定的该和弦及该旋律总长度和旋律的开头所生成的,是与和弦相匹配的旋律。采用本申请,不仅可以避免编写复杂的音乐规则或评价函数,且生成的旋律也具备一定的长程关系和作曲技法,旋律质量高且具备创新性。由于实现了对用户指定的和弦进行旋律的生成处理,因此,生成的是一段与和弦进行相匹配的旋律,且由于旋律受到给定和弦约束,旋律的好听程度比没有和弦约束要更好,且风格和情感可以由和弦控制;相同条件下多次生成有一定的多样性,并可以出现一定的作曲技法。
本申请的实施例,提供了一种信息处理方法,图1是根据本申请实施例的信息处理方法的流程示意图,该方法可以应用于信息处理装置,例如,该装置可以部署于终端或服务器或其它处理设备执行的情况下,可以执行编码处理、旋律生成等等。其中,终端可以为用户设备(UE,User Equipment)、移动设备、蜂窝电话、无绳电话、个人数字处理(PDA,Personal Digital Assistant)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,包括:
S101、根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分。
S102、根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
S101-S102的一示例中,该目标旋律信息受到给定的该待匹配和弦的约束,比如,可以基于用户给定的该待匹配和弦信息、及该待处理旋律信息的旋律总长度、及该待处理旋律信息的旋律开头部分生成该目标旋律信息,从而,该目标旋律信息与用户给定的该待匹配和弦信息相对应,该目标旋律信息的好听程度比没有该待匹配和弦信息约束要更好,且该目标旋律信息的风格和情感可以由该待匹配和弦信息进行随机控制,则伴随该随机控制,在相同条件下可以多次生成不同的目标旋律信息,从而目标旋律信息呈现多样性。
一实施方式中,所述根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果,包括:基于所述预配置的乐理策略,从所述待处理旋律信息及所述待匹配和弦信息中提取第一特征向量,以进行所述编码处理,得到所述编码结果。或者,基于该预配置的乐理策略,得到与目标旋律信息接近的旋律特征,将所述旋律特征作为第二特征向量,以进行所述编码处理,得到所述编码结果。
其中,该预配置的乐理策略可以为简单的乐理规则,则可以基于该乐理规则可以从待处理旋律信息及待匹配和弦信息中分析出:对该目标旋律信息的预测可能有帮助的特征,将该特征编码,构造为第一特征向量(第一特征向量包含在上述编码结果中)后作为该旋律生成模型的输入;或者,通过基于该预配置的乐理策略推理出可能生成该目标旋律信息的旋律音作为旋律特征,将该旋律特征的编码,构造为第二特征向量(第二特征向量包含在上述编码结果中)后作为该旋律生成模型的输入。
一实施方式中,所述根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,包括:基本旋律编码、旋律回看编码、和弦编码、位置编码、和弦旋律关系编码、类型编码中的至少一种编码方式。
一实施方式中,还包括:将所述待处理旋律信息映射为多维信息,以执行所述独热编码的编码处理;根据不同八度内相同音名的音关系,将所述待处理旋律信息进行音名拆分,以执行所述音名拆分编码的编码处理。
一实施方式中,还包括:所述待处理旋律信息以固定间隔重复的情况下,获取以所述固定间隔描述的回看距离;判断对应所有回看距离位置的第一和弦信息与对应当前位置的第二和弦是否相同,如果相同,则将与第二和弦相同的第一和弦信息记为和弦旋律关系编码。
一实施方式中,还包括:所述待处理旋律信息存在旋律起承转合的情况下,获取所述待处理旋律信息中当前位置的第一旋律信息,所述第一旋律信息在所述旋律起承转合所构成的位置区间内;根据所述第一旋律信息在所述位置区间内的相对位置,执行所述位置编码的编码处理。
一实施方式中,还包括:获取乐谱信息;按照预设节拍,从所述乐谱信息中提取包含乐句信息的乐段构建信息;根据所述乐段构建信息得到乐段结构,所述乐段结构包括针对所述待处理旋律信息以小节为单位划分得到的多个旋律序列。比如,所述小节为首小节的情况下,所述首小节的位置根据所述乐段结构开始的第一个和弦来判断。之后,以所述乐段结构为单位进行数据收集,得到用于训练所述旋律生成模型的样本数据集。
其中,所述样本数据集包括:所述待处理旋律信息对应的总小节数、所述待处理旋律信息对应的速度、所述乐段结构的分类特征、所述待处理旋律信息中旋律首音相对于首小节的位置差值、所述乐段结构的整体和弦、所述乐段结构起始位置任意长度的旋律。
一实施方式中,所述根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息,包括:所述旋律生成模型包含长短时记忆层及全连接层的情况下,将所述编码结果输入所述长短时记忆层,得到在所述长短时记忆层实现隐状态更新的更新后编码结果;将所述更新后编码结果输入所述全连接层进行映射,得到对应所述更新后编码结果的分类概率,根据所述分类概率得到所述目标旋律信息。
应用示例:
应用本申请实施例一处理流程包括如下内容:
一、数据的收集、表示、预处理及神经网络模型
收集乐谱,并以乐段为单位进行记录,构成数据集。一个乐段需要记录移调至C大调或a小调后的旋律及和弦进行,旋律首小节位置,总小节数b,速度qpm,乐段的分类特征t。其中首小节位置根据乐段开始的第一个和弦来判断,规定首小节的第一拍为乐段的0时刻,旋律首音相对于首小节的位置差值记为Δst,若乐段的旋律开始于首小节前,称提前部分的旋律为弱起旋律,Δst<0;若开始于首小节第一拍或之后,则没有弱起旋律,Δst≥0。
确定每拍量化长度SPQ为4,例如对于四四拍的歌曲,每小节的旋律用16个数值来表示。考虑弱起的情况,一个乐段的旋律需用N个数值表示,N=16×b+Δst,限定只选取符合-32≤Δst<16,b≥4的乐段,一个乐段的旋律表示为M=m0…mN-1,其中,mi,i∈{0,1,...,N-1}描述了时刻 时的旋律情况。若存在音符或休止符的开始时间不等于某一个ti,则调整其开始时间使之等于其附近的一个ti。可以将整个旋律八度移动,使得旋律满足:
旋律值的种类数共有Nm=62类。
同样的,可以将C大调或a小调中可能出现的和弦分为Nc=62类,一个乐段的和弦进行表示为C=c0…cN-1,ci∈{0,1,...,Nc-1},i∈{0,1,...,N-1}。ci表示ti时刻正在弹奏的和弦类型编号。
需要解决的具体任务是:已知总小节数b,速度qpm,乐段的分类特征t,旋律首音相对于首小节的位置差值Δst,全乐段的和弦进行c0…cN-1,乐段起始开始的任意长度的旋律m0…mk,0≤k<N,预测乐段剩余部分的旋律mk+1…mN-1。
二、编码
基于简单的乐理规则,从旋律和和弦中分析对预测可能有帮助的特征,或通过推理给出可能的旋律音作为特征,构造为特征向量,将该特征向量作为神经网络模型的输入,具体的,包括如下多种旋律编码方式。
1)基本旋律编码
对一个旋律值a进行编码。分为独热编码和音名拆分编码,可采用独热编码和音名拆分编码。设One_hotk表示将数值映射为k维的独热向量,且可以保证数值的可能取值种类不超过k。0k表示k维零向量。
音名拆分编码:为强调不同八度内相同音名的音的关系,编码分为音名编码xpitch,八度编码xoctave,状态编码xstatus三部分,则具体的编码表示为:
xmelody_seperate(a)=concat(xstatus(a),xoctave(a),xstatus(a))
2)旋律回看编码
流行歌中常出现旋律以固定的间隔的重复的手法,其重复间隔通常为一拍半,两拍,一小节,两小节,在四四拍中,回看距离dlookback∈Dlookback={6,8,16,32,64,128}。当预测位置i的旋律时,将位于其之前dlookback的旋律值的基本旋律编码作为当前位的旋律回看编码,可以更加直接的在当前位给模型输入欲重复的旋律值,从而实现旋律的重复手法。旋律回看编码xmelody_lookback计算方法为:
xmelody_lookback(i)=concat(xmelody_lookback(i,6),xmelody_lookback(i,8),xmelody_lookback(i,16),xmelody_lookbxmelody_lookback(i,64),xmelody_lookback(i,128))
3)和弦编码
和弦编码采用独热编码,C大调或a小调中可能出现的和弦分为Nc=62类,和弦值为a的编码为
4)位置编码
流行歌曲乐段内旋律存在起承转合关系,可以大致归结于当前旋律音受其在乐段内的相对位置影响。将该相对位置进行编码可使得模型可以生成具有一定结构的旋律。
数据中乐段最大小节数记为bmax。当预测旋律序列的第i位mi时,其绝对位置p=i+Δst。
前向位置编码,作为位置编码的一种处理方式,编码预测位相对乐段0时刻距离的二进制编码:
反向位置编码,作为位置编码的另一种处理方式,编码预测位相对乐段最后一小节的末尾的距离,乐段总小节数b,有:
位置功能编码,作为位置编码的又一种处理方式,编码当前绝对位置p决定的此处旋律在整乐段中的可能的功能。分别编码以下特征:
xneg表示是否处于弱起小节,一示例如下:
xpart1表示是否处于乐段开始部分,一示例如下:
xpart2表示是否处于乐段半终止部分,一示例如下:
xpart3表示是否处于乐段再现部分,该部分通常重复乐段开始部分并做一些改变,一示例如下:
xpart4表示是否处于乐段结束部分,一示例如下:
位置功能编码的一示例如下:xfunc(p)=
(xneg(p),xpart1(p),xpart2(p),xpart3(p),xpart4(p))
5)和弦旋律关系编码
需要结合旋律与和弦的编码。
回看位和弦相同编码,作为和弦旋律关系编码的一种处理方式,旋律是否出现重复和和弦是否开始重复关系很大,对于所有回看距离dlookback∈
Dlookback处的和弦,判断其是否与当前位和弦相同,将此信息编码成
xchord_equal(i),一示例如下:
xchord_equal(i)=(xchord_equal(i,6),xchord_equal(i,8),xchord_equal(i,16),xchord_equal(i,32),xchord_equal(i,64),xchord_equal(i,128))
模进推理编码,作为和弦旋律关系编码的另一种处理方式,旋律的模进通常伴随着和弦也有类似模进的关系,只考虑模进的两句旋律音均为自然大小调音列,和弦根音也为自然大小调音的情况,其他情况该编码为0向量。自然大小调下两音p1,p2∈{0,1,...,6}。数字分别对应C大调的CDEFGAB,两音的级数差Δp=min(|(p1-p2)mod 7|,|(p2-p1)mod 7|)。模进距离dsequence∈Dsequence={8,16,32}。考虑距预测位置模进距离,简称模进位的旋律与和弦预测位置的和弦ci与旋律mi,两和弦的根音的级数差若为Δp,只考虑Δp∈{1,2}的情况,两旋律音的级数差也为Δp,此时有两种情况,预测位的旋律音比模进位旋律音高,此时为向上模进,预测位的旋律音比模进位低,为向下模进。scale_alter(a,Δp)表示将音a在C大调内增加Δp个级数后的音,使用基本旋律编码xmelody对两个推理出的模进音进行编码后合并,作为模进推理编码,一示例如下:
6)类型编码
速度编码,作为类型编码的一种处理方式,流行歌速度区间为40≤qpm<220,速度的大幅度变化对旋律和节奏有较强影响,但在一定范围内速度的微小变化没有很大影响。采用20为一个区间对速度进行分类,共9类不同的速度类型,进行独热编码:
段落类型编码,作为类型编码的另一种处理方式,每个乐段有段落类型t,其取值和含义为:
乐段类型编码为:
xtype(t)=One_hot7(t)
三、训练神经网络模型
1)训练神经网络模型的数据构造
对每个乐段数据D={b,qpm,Δst,t,M,C},可构建N个训练数据,其中第k∈{0,1,...,N-1}个数据的输入为b,qpm,Δst,t,C,m0,...,mk-1,输出为mk。对输入分别按前文所属述进行编码,把结果拼接为k时的模型输入xk:
xk=concat(xmelody_seperate(mk-1),xmelody_lookback(k),xchord(ck),xforward_pos(k+Δst),xforward_pos(k+Δst),xfunc(k+Δst),xchord_equal(k),xsequence_infer(k),xqpm(qpm),xtype(t))
2)神经网络模型的结构
旋律生成模型由一个隐含层为d=256维的长短时记忆单元LSTM和一个d×Nm维的全连接层W组成:
hk=LSTM(hk-1,xk)
yk=Softmax(Whk)
每一步,通过LSTM在k-1时的隐状态hk-1和k时的输入xk更新隐状态hk,然后通过全连接层将隐状态映射为mk的分布yk。
训练时,调整模型参数θ,优化如下损失函数:
生成时,通过yk采样出mk,再带入下一步,迭代生成。
采用本应用示例,基于简单的乐理规则,从旋律和和弦中提取特征和编码,通过推理给出可能的旋律音作为神经网络模型输入的旋律,用编码代替复杂的神经网络来自动生成旋律,实现了使用乐理规则和深度学习结合的方法进行自动旋律生成,既可以保证无需编写大量规则,保证生成旋律的差异性和质量,又能使得生成的旋律具有一定乐理规则,结构和作曲手法。
根据本申请的实施例,提供了一种信息处理装置,图2是根据本申请实施例的信息处理装置的组成结构示意图,如图2所示,包括:编码模块41,用于根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;旋律生成模块42,用于根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
一实施方式中,所述编码模块,用于基于所述预配置的乐理策略,从所述待处理旋律信息及所述待匹配和弦信息中提取第一特征向量,以进行所述编码处理,得到所述编码结果;或者,基于所述预配置的乐理策略,得到与目标旋律信息接近的旋律特征,将所述旋律特征作为第二特征向量,以进行所述编码处理,得到所述编码结果。
一实施方式中,所述编码模块,用于基本旋律编码、旋律回看编码、和弦编码、位置编码、和弦旋律关系编码、类型编码中的至少一种编码方式。
一实施方式中,还包括预处理模块,用于将所述待处理旋律信息映射为多维信息,以执行所述独热编码的编码处理;根据不同八度内相同音名的音关系,将所述待处理旋律信息进行音名拆分,以执行所述音名拆分编码的编码处理。
一实施方式中,所述编码模块,还用于所述待处理旋律信息以固定间隔重复的情况下,获取以所述固定间隔描述的回看距离;判断对应所有回看距离位置的第一和弦信息与对应当前位置的第二和弦是否相同,如果相同,则将与第二和弦相同的第一和弦信息记为和弦旋律关系编码。
一实施方式中,所述编码模块,还用于所述待处理旋律信息存在旋律起承转合的情况下,获取所述待处理旋律信息中当前位置的第一旋律信息,所述第一旋律信息在所述旋律起承转合所构成的位置区间内;根据所述第一旋律信息在所述位置区间内的相对位置,执行所述位置编码的编码处理。
一实施方式中,还包括训练模块,用于获取乐谱信息;按照预设节拍,从所述乐谱信息中提取包含乐句信息的乐段构建信息;根据所述乐段构建信息得到乐段结构,所述乐段结构包括针对所述待处理旋律信息以小节为单位划分得到的多个旋律序列;以所述乐段结构为单位进行数据收集,得到用于训练所述旋律生成模型的样本数据集;所述样本数据集包括:所述待处理旋律信息对应的总小节数、所述待处理旋律信息对应的速度、所述乐段结构的分类特征、所述待处理旋律信息中旋律首音相对于首小节的位置差值、所述乐段结构的整体和弦、所述乐段结构起始位置任意长度的旋律。
一实施方式中,所述旋律生成模块,用于所述旋律生成模型包含长短时记忆层及全连接层的情况下,将所述编码结果输入所述长短时记忆层,得到在所述长短时记忆层实现隐状态更新的更新后编码结果;将所述更新后编码结果输入所述全连接层进行映射,得到对应所述更新后编码结果的分类概率,根据所述分类概率得到所述目标旋律信息。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图3所示,是用来实现本申请实施例的信息处理方法的电子设备的框图。该电子设备可以为前述部署设备或代理设备。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图3所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图3中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的信息处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的信息处理方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的信息处理方法对应的程序指令/模块。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的信息处理方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
信息处理方法的电子设备,还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图3中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (18)
1.一种信息处理方法,其特征在于,所述方法包括:
根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;
根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
2.根据权利要求1所述的方法,其特征在于,所述根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果,包括:
基于所述预配置的乐理策略,从所述待处理旋律信息及所述待匹配和弦信息中提取第一特征向量,以进行所述编码处理,得到所述编码结果;或者,
基于所述预配置的乐理策略,得到与目标旋律信息接近的旋律特征,将所述旋律特征作为第二特征向量,以进行所述编码处理,得到所述编码结果。
3.根据权利要求1所述的方法,其特征在于,所述根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,包括:
基本旋律编码、旋律回看编码、和弦编码、位置编码、和弦旋律关系编码、类型编码中的至少一种编码方式。
4.根据权利要求3所述的方法,其特征在于,还包括:
将所述待处理旋律信息映射为多维信息,以执行所述独热编码的编码处理;
根据不同八度内相同音名的音关系,将所述待处理旋律信息进行音名拆分,以执行所述音名拆分编码的编码处理。
5.根据权利要求3所述的方法,其特征在于,还包括:
所述待处理旋律信息以固定间隔重复的情况下,获取以所述固定间隔描述的回看距离;
判断对应所有回看距离位置的第一和弦信息与对应当前位置的第二和弦是否相同,如果相同,则将与第二和弦相同的第一和弦信息记为和弦旋律关系编码。
6.根据权利要求3所述的方法,其特征在于,还包括:
所述待处理旋律信息存在旋律起承转合的情况下,获取所述待处理旋律信息中当前位置的第一旋律信息,所述第一旋律信息在所述旋律起承转合所构成的位置区间内;
根据所述第一旋律信息在所述位置区间内的相对位置,执行所述位置编码的编码处理。
7.根据权利要求1-6中任一项所述的方法,其特征在于,还包括:
获取乐谱信息;
按照预设节拍,从所述乐谱信息中提取包含乐句信息的乐段构建信息;
根据所述乐段构建信息得到乐段结构,所述乐段结构包括针对所述待处理旋律信息以小节为单位划分得到的多个旋律序列;
以所述乐段结构为单位进行数据收集,得到用于训练所述旋律生成模型的样本数据集;
所述样本数据集包括:所述待处理旋律信息对应的总小节数、所述待处理旋律信息对应的速度、所述乐段结构的分类特征、所述待处理旋律信息中旋律首音相对于首小节的位置差值、所述乐段结构的整体和弦、所述乐段结构起始位置任意长度的旋律。
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息,包括:
所述旋律生成模型包含长短时记忆层及全连接层的情况下,将所述编码结果输入所述长短时记忆层,得到在所述长短时记忆层实现隐状态更新的更新后编码结果;
将所述更新后编码结果输入所述全连接层进行映射,得到对应所述更新后编码结果的分类概率,根据所述分类概率得到所述目标旋律信息。
9.一种信息处理装置,其特征在于,所述装置包括:
编码模块,用于根据预配置的乐理策略,将待处理旋律信息及待匹配和弦信息进行编码处理,得到编码结果;其中,所述待处理旋律信息包括所述待处理旋律信息的旋律总长度及所述待处理旋律信息的旋律开头部分;
旋律生成模块,用于根据所述编码结果及旋律生成模型,得到与所述待匹配和弦信息对应的目标旋律信息。
10.根据权利要求9所述的装置,其特征在于,所述编码模块,用于:
基于所述预配置的乐理策略,从所述待处理旋律信息及所述待匹配和弦信息中提取第一特征向量,以进行所述编码处理,得到所述编码结果;或者,
基于所述预配置的乐理策略,得到与目标旋律信息接近的旋律特征,将所述旋律特征作为第二特征向量,以进行所述编码处理,得到所述编码结果。
11.根据权利要求9所述的装置,其特征在于,所述编码模块,用于:
基本旋律编码、旋律回看编码、和弦编码、位置编码、和弦旋律关系编码、类型编码中的至少一种编码方式。
12.根据权利要求11所述的装置,其特征在于,还包括预处理模块,用于:
将所述待处理旋律信息映射为多维信息,以执行所述独热编码的编码处理;
根据不同八度内相同音名的音关系,将所述待处理旋律信息进行音名拆分,以执行所述音名拆分编码的编码处理。
13.根据权利要求11所述的装置,其特征在于,所述编码模块,还用于:
所述待处理旋律信息以固定间隔重复的情况下,获取以所述固定间隔描述的回看距离;
判断对应所有回看距离位置的第一和弦信息与对应当前位置的第二和弦是否相同,如果相同,则将与第二和弦相同的第一和弦信息记为和弦旋律关系编码。
14.根据权利要求11所述的装置,其特征在于,所述编码模块,还用于:
所述待处理旋律信息存在旋律起承转合的情况下,获取所述待处理旋律信息中当前位置的第一旋律信息,所述第一旋律信息在所述旋律起承转合所构成的位置区间内;
根据所述第一旋律信息在所述位置区间内的相对位置,执行所述位置编码的编码处理。
15.根据权利要求9-14中任一项所述的装置,其特征在于,还包括训练模块,用于:
获取乐谱信息;
按照预设节拍,从所述乐谱信息中提取包含乐句信息的乐段构建信息;
根据所述乐段构建信息得到乐段结构,所述乐段结构包括针对所述待处理旋律信息以小节为单位划分得到的多个旋律序列;
以所述乐段结构为单位进行数据收集,得到用于训练所述旋律生成模型的样本数据集;
所述样本数据集包括:所述待处理旋律信息对应的总小节数、所述待处理旋律信息对应的速度、所述乐段结构的分类特征、所述待处理旋律信息中旋律首音相对于首小节的位置差值、所述乐段结构的整体和弦、所述乐段结构起始位置任意长度的旋律。
16.根据权利要求9-14中任一项所述的装置,其特征在于,所述旋律生成模块,用于:
所述旋律生成模型包含长短时记忆层及全连接层的情况下,将所述编码结果输入所述长短时记忆层,得到在所述长短时记忆层实现隐状态更新的更新后编码结果;
将所述更新后编码结果输入所述全连接层进行映射,得到对应所述更新后编码结果的分类概率,根据所述分类概率得到所述目标旋律信息。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111178341.4A CN113920969A (zh) | 2021-10-09 | 2021-10-09 | 信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111178341.4A CN113920969A (zh) | 2021-10-09 | 2021-10-09 | 信息处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113920969A true CN113920969A (zh) | 2022-01-11 |
Family
ID=79238605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111178341.4A Pending CN113920969A (zh) | 2021-10-09 | 2021-10-09 | 信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113920969A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114756734A (zh) * | 2022-03-08 | 2022-07-15 | 上海暖禾脑科学技术有限公司 | 基于机器学习的乐曲分段情感标注系统及方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124088A (ja) * | 1992-10-12 | 1994-05-06 | Casio Comput Co Ltd | メロディ分析装置 |
JPH10222166A (ja) * | 1997-02-03 | 1998-08-21 | Kawai Musical Instr Mfg Co Ltd | 自動伴奏装置 |
JP2017182089A (ja) * | 2017-06-09 | 2017-10-05 | カシオ計算機株式会社 | 自動作曲装置、方法、およびプログラム |
US10068557B1 (en) * | 2017-08-23 | 2018-09-04 | Google Llc | Generating music with deep neural networks |
CN109727590A (zh) * | 2018-12-24 | 2019-05-07 | 成都嗨翻屋科技有限公司 | 基于循环神经网络的音乐生成方法及装置 |
CN110120211A (zh) * | 2019-03-28 | 2019-08-13 | 北京灵动音科技有限公司 | 基于旋律结构的旋律生成方法及装置 |
WO2020080239A1 (ja) * | 2018-10-19 | 2020-04-23 | ソニー株式会社 | 情報処理方法、情報処理装置及び情報処理プログラム |
US20200302902A1 (en) * | 2019-03-22 | 2020-09-24 | Mixed In Key Llc | Lane and rhythm-based melody generation system |
CN113035161A (zh) * | 2021-03-17 | 2021-06-25 | 平安科技(深圳)有限公司 | 基于和弦的歌曲旋律生成方法、装置、设备及存储介质 |
CN113140202A (zh) * | 2021-04-25 | 2021-07-20 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN113158642A (zh) * | 2021-04-25 | 2021-07-23 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-10-09 CN CN202111178341.4A patent/CN113920969A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124088A (ja) * | 1992-10-12 | 1994-05-06 | Casio Comput Co Ltd | メロディ分析装置 |
JPH10222166A (ja) * | 1997-02-03 | 1998-08-21 | Kawai Musical Instr Mfg Co Ltd | 自動伴奏装置 |
JP2017182089A (ja) * | 2017-06-09 | 2017-10-05 | カシオ計算機株式会社 | 自動作曲装置、方法、およびプログラム |
US10068557B1 (en) * | 2017-08-23 | 2018-09-04 | Google Llc | Generating music with deep neural networks |
WO2020080239A1 (ja) * | 2018-10-19 | 2020-04-23 | ソニー株式会社 | 情報処理方法、情報処理装置及び情報処理プログラム |
CN111465979A (zh) * | 2018-10-19 | 2020-07-28 | 索尼公司 | 信息处理方法、信息处理装置和信息处理程序 |
CN109727590A (zh) * | 2018-12-24 | 2019-05-07 | 成都嗨翻屋科技有限公司 | 基于循环神经网络的音乐生成方法及装置 |
US20200302902A1 (en) * | 2019-03-22 | 2020-09-24 | Mixed In Key Llc | Lane and rhythm-based melody generation system |
CN110120211A (zh) * | 2019-03-28 | 2019-08-13 | 北京灵动音科技有限公司 | 基于旋律结构的旋律生成方法及装置 |
CN113035161A (zh) * | 2021-03-17 | 2021-06-25 | 平安科技(深圳)有限公司 | 基于和弦的歌曲旋律生成方法、装置、设备及存储介质 |
CN113140202A (zh) * | 2021-04-25 | 2021-07-20 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN113158642A (zh) * | 2021-04-25 | 2021-07-23 | 北京灵动音科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
ZIXUN GUO: "Hierarchical recurrent neural networks for conditional melody generation with long-term structure", 《ARXIV 》, 19 February 2021 (2021-02-19) * |
白勇: "基于深度强化学习的音乐生成研究与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》, 15 February 2021 (2021-02-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114756734A (zh) * | 2022-03-08 | 2022-07-15 | 上海暖禾脑科学技术有限公司 | 基于机器学习的乐曲分段情感标注系统及方法 |
CN114756734B (zh) * | 2022-03-08 | 2023-08-22 | 上海暖禾脑科学技术有限公司 | 基于机器学习的乐曲分段情感标注系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10559300B2 (en) | Generating target sequences from input sequences using partial conditioning | |
CN107680580B (zh) | 文本转换模型训练方法和装置、文本转换方法和装置 | |
US10109264B2 (en) | Composing music using foresight and planning | |
Sturm et al. | Folk music style modelling by recurrent neural networks with long short term memory units | |
CN110264991A (zh) | 语音合成模型的训练方法、语音合成方法、装置、设备及存储介质 | |
CN112542155B (zh) | 歌曲合成方法及模型训练方法、装置、设备与存储介质 | |
JP7298115B2 (ja) | プログラム、情報処理方法、及び電子機器 | |
CN110782871B (zh) | 一种韵律停顿预测方法、装置以及电子设备 | |
CN113012665B (zh) | 音乐生成方法及音乐生成模型的训练方法 | |
CN111767694B (zh) | 文本生成方法、装置和计算机可读存储介质 | |
Zixun et al. | Hierarchical recurrent neural networks for conditional melody generation with long-term structure | |
CN114048289A (zh) | 语言模型训练方法、文案生成方法以及相关设备 | |
CN113920968B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
McLeod et al. | A modular system for the harmonic analysis of musical scores using a large vocabulary | |
CN113920969A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN113158642A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN113838443A (zh) | 音频合成方法、装置、计算机可读存储介质及电子设备 | |
Mikami | Long short-term memory recurrent neural network architectures for generating music and japanese lyrics | |
CN113591472B (zh) | 歌词生成方法、歌词生成模型训练方法、装置及电子设备 | |
KR20170128070A (ko) | 순환형 신경망에 기반한 작곡 방법 | |
CN116702770A (zh) | 长文本的生成方法、装置、终端及存储介质 | |
CN115375806A (zh) | 舞蹈动作预测模型训练方法、舞蹈合成方法、设备和产品 | |
CN116343723A (zh) | 旋律生成方法、装置、存储介质及计算机设备 | |
CN110959172A (zh) | 演奏解析方法及程序 | |
CN115273806A (zh) | 歌曲合成模型的训练方法和装置、歌曲合成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |