CN117114937A - 基于人工智能的练习曲目的生成方法及生成装置 - Google Patents
基于人工智能的练习曲目的生成方法及生成装置 Download PDFInfo
- Publication number
- CN117114937A CN117114937A CN202311149693.6A CN202311149693A CN117114937A CN 117114937 A CN117114937 A CN 117114937A CN 202311149693 A CN202311149693 A CN 202311149693A CN 117114937 A CN117114937 A CN 117114937A
- Authority
- CN
- China
- Prior art keywords
- exercise
- student
- music
- generating
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000013135 deep learning Methods 0.000 claims abstract description 22
- 230000000694 effects Effects 0.000 claims abstract description 22
- 230000002787 reinforcement Effects 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 64
- 230000009471 action Effects 0.000 claims description 35
- 239000000203 mixture Substances 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 19
- 230000007774 longterm Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 abstract description 5
- 238000011161 development Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000008713 feedback mechanism Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
- G06Q50/2057—Career enhancement or continuing education service
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提出了一种基于人工智能的练习曲目的生成方法及生成装置,生成方法包括:A10,收集多个维度的学生数据;A20,通过多任务深度学习网络对收集的所述学生数据进行处理,构建学生模型;A30,利用强化学习算法,结合所述学生模型,生成练习曲目。本发明利用深度学习技术收集和分析学生的数据,构建个性化的学生模型,以准确地反映出学生的技术水平和音乐偏好。基于深度强化学习进行曲目生成,可以生成与学生的技术水平和音乐偏好相匹配的练习曲目,丰富了练习曲目的多样性,提高学习兴趣和练习效果。而且,可以根据反馈信息更新学生模型,改善曲目生成的策略,不断地适应学生的发展和变化,提高了乐曲生成的质量和满足度。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的练习曲目的生成方法及生成装置。
背景技术
传统上,钢琴学习者通常需要通过练习一系列固定的乐曲来提升他们的技术水平。这些乐曲可能来自教科书或由老师推荐,它们固定且不易修改。尽管这些乐曲在技巧和音乐理论方面都有很好的教育效果,但是他们的固定性和难以个性化的特点,使得学生在学习过程中可能感到乏味或挫败。
现有的自动音乐生成技术主要依赖于循环神经网络(RNN)。这种类型的网络能够处理序列数据,并能捕获到序列中的时间依赖关系。然而,这种技术在处理复杂的音乐序列时存在缺陷。尽管可以生成具有一定音乐感的旋律,但其对于更复杂的音乐结构(如和弦进程或音乐形式)的理解和生成能力相对较弱。
相关技术中,提出一种被称为"AIVA"(Artificial Intelligence VirtualArtist)的音乐作曲AI。AIVA通过学习大量的古典音乐作品,使用深度学习技术生成新的音乐。AIVA主要使用循环神经网络(RNN)进行学习和生成。然而,AIVA主要用于创建新的音乐作品,而不是为个体学生定制练习曲目。此外,AIVA的技术侧重于生成连贯的旋律,而较少考虑到音乐中的其他元素,如音符的时长、力度和和弦等。
综上所述,现有技术的主要缺点包括以下几点:
钢琴练习曲目的固定性和个性化程度不足:由于传统的练习曲目是固定的,对学生的技巧和兴趣缺乏个性化的反馈,导致学习过程中可能感到乏味或挫败。这可能对学生的学习效果和持久度产生负面影响。
自动音乐生成的局限性:现有的自动音乐生成技术,如使用循环神经网络(RNN)的技术,虽然能生成具有一定音乐感的旋律,但在处理复杂的音乐结构(如和弦进程或音乐形式)的理解和生成能力相对较弱。
缺乏对音乐多元性的处理:现有的自动音乐生成技术通常只关注音符的选择,而较少考虑音乐的其他元素,如音符的时长、力度和和弦等。这使得生成的音乐可能在丰富性和动听性上受到限制。
发明内容
本发明要解决的技术问题是如何通过人工智能生成高质量练习曲目,本发明提出一种基于人工智能的练习曲目的生成方法及生成装置。
根据本发明实施例的基于人工智能的练习曲目的生成方法,包括:
A10,收集多个维度的学生数据;
A20,通过多任务深度学习网络对收集的所述学生数据进行处理,构建学生模型;
A30,利用强化学习算法,结合所述学生模型,生成练习曲目。
根据本发明的一些实施例,所述生成方法还包括:A40,基于学生对所述练习曲目的评价反馈,对所述学生模型和曲目生成的算法进行优化。
在本发明的一些实施例中,步骤A40中,基于学生对所述练习曲目的评价反馈计算评价函数,所述评价函数为:
R=wM*RM+wF*RF+wL*RL;
其中,RM为用于评价所述练习曲目的质量的音乐理论评价值,wM为音乐理论评价值的权重;
RF为所述练习曲目练习过程中的实时反馈评价值,wF为实时反馈评价值的权重;
RL为所述练习曲目的长期学习效果评价值,wL为长期学习效果评价值的权重。
根据本发明的一些实施例,步骤A10包括:练习数据、反馈信息及辅助信息;
所述练习数据包括:弹奏乐曲、弹奏速度、按键力度、练习时间、练习频率和乐曲复杂度;
所述反馈信息包括:练习曲目的喜好度评价和技术进步自评;
所述辅助信息包括:学生的年龄、音乐基础知识水平和偏好的音乐风格。
在本发明的一些实施例中,步骤A20中,所述多任务深度学习网络包括:
练习数据子网络,用于基于所述练习数据提取学生的技术水平特征;
反馈信息子网络,用于基于所述反馈信息提取学生的偏好特征;
辅助信息子网络,用于基于所述辅助信息提取学生的个人信息特征;
所述练习数据子网络、所述反馈信息子网络及所述辅助信息子网络之间通过隐藏层进行信息共享。
根据本发明的一些实施例,步骤A30具体包括:
A31,设计智能体,所述智能体的状态空间包括当前的音乐序列和学生模型,动作空间包括音符、音符的时长、力度、和弦类型;
A32,在每个时间步,所述智能体根据当前的状态和策略网络,选择一个动作,生成一个音符,同时指定所述音符的时长、力度和和弦类型;
A33,将所述音符加入到当前的音乐序列中,生成新的状态,并根据当前的音乐序列和学生模型,计算出用于评价智能体的动作的奖励。
在本发明的一些实施例中,步骤A32中,所述智能体的策略网络由深度神经网络实现,输入为所述智能体的状态,输出为在动作空间中各个动作的概率分布,智能体在每个时间步根据当前的状态和策略网络选择一个动作。
根据本发明的一些实施例,步骤A33中,基于预设的奖励函数计算所述奖励,所述奖励函数包括乐曲的音乐性、乐曲的多元性和与学生模型的匹配程度;
所述乐曲的音乐性包括:旋律连贯性、和声适当性音乐理论规则;
所述乐曲的多元性包括:音符时长和力度的变化性、和弦类型的多样性;
与学生模型的匹配程度包括:乐曲难度应适合学生的技术水平,乐曲风格应符合学生的音乐偏好。
根据本发明实施例的基于人工智能的练习曲目的生成装置,包括:
收集模块,用于收集多个维度的学生数据;
模型构建模块,用于通过多任务深度学习网络对收集的所述学生数据进行处理,构建学生模型;
练习曲目生成模块,用于利用强化学习算法,结合所述学生模型,生成练习曲目。
根据本发明的一些实施例,所述生成装置还包括:
优化模块,用于基于学生对所述练习曲目的评价反馈,对所述学生模型和曲目生成的算法进行优化。
本发明具有如下有益效果:
本发明的练习曲目的生成具有个性化和持续学习的特性。通过利用深度学习技术收集和分析学生的练琴数据,本发明可以构建一个个性化的学生模型,该模型可以准确地反映出学生的技术水平和音乐偏好。然后,通过基于深度强化学习进行曲目生成,可以生成与学生的技术水平和音乐偏好相匹配的练习曲目。本发明大大丰富了练习曲目的多样性,提高了学生的学习兴趣和效果。
另外,本发明的练习曲目生成方法具有持续学习和进步的能力。当学生进行练习并提供反馈后,可以根据反馈信息进行自我评价和调整,更新学生模型,改善曲目生成的策略。由此,能够不断地适应学生的发展和变化,进一步提高了乐曲生成的质量和满足度。
附图说明
图1为根据本发明实施例的基于人工智能的练习曲目的生成方法流程图;
图2为根据本发明实施例的基于人工智能的练习曲目的生成装置组成示意图。
附图标记:
生成装置100,
收集模块10,模型构建模块20,练习曲目生成模块30,优化模块40。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明中说明书中对方法流程的描述及本发明说明书附图中流程图的步骤并非必须按步骤标号严格执行,方法步骤是可以改变执行顺序的。而且,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
针对现有技术缺点,本发明提出一种能生成针对个体学生的个性化练习曲目的智能系统。该系统应具有以下特点:一是能根据学生的实际情况和需求生成个性化的练习曲目,提高学习的兴趣和效果;二是采用更先进的自动音乐生成技术,使得生成的曲目在音乐结构和音乐感上都更优秀;三是考虑音乐的多元性,使得生成的曲目在丰富性和动听性上更出色。
如图1所示,根据本发明实施例的基于人工智能的练习曲目的生成方法,包括:
A10,收集多个维度的学生数据;
需要说明的是,本申请可以从多个方面收集学生数据,例如,收集的数据可以包括练习数据、反馈信息及辅助信息等,以使收集的学生数据可以更完整的反映学生的曲目练习情况。
A20,通过多任务深度学习网络对收集的学生数据进行处理,构建学生模型;
可以理解的是,由于上述从多个维度收集学生数据,因此,可以使构建的学生模型更加个性化,更加符合学生的实际情况。
A30,利用强化学习算法,结合学生模型,生成练习曲目。
根据本发明实施例的基于人工智能的练习曲目的生成方法,练习曲目的生成具有个性化和持续学习的特性。通过利用深度学习技术收集和分析学生的练琴数据,本发明可以构建一个个性化的学生模型,该模型可以准确地反映出学生的技术水平和音乐偏好。然后,通过基于深度强化学习进行曲目生成,可以生成与学生的技术水平和音乐偏好相匹配的练习曲目。本发明大大丰富了练习曲目的多样性,提高了学生的学习兴趣和效果。
根据本发明的一些实施例,生成方法还包括:A40,基于学生对练习曲目的评价反馈,对学生模型和曲目生成的算法进行优化。在本发明的一些实施例中,步骤A40中,基于学生对练习曲目的评价反馈计算评价函数,评价函数为:
R=wM*RM+wF*RF+wL*RL;
其中,RM为用于评价练习曲目的质量的音乐理论评价值,wM为音乐理论评价值的权重;
RF为练习曲目练习过程中的实时反馈评价值,wF为实时反馈评价值的权重;
RL为练习曲目的长期学习效果评价值,wL为长期学习效果评价值的权重。
也就是说,本发明的练习曲目生成方法具有持续学习和进步的能力。当学生进行练习并提供反馈后,可以根据反馈信息进行自我评价和调整,更新学生模型,改善曲目生成的策略。由此,能够不断地适应学生的发展和变化,进一步提高了乐曲生成的质量和满足度。
根据本发明的一些实施例,步骤A10包括:练习数据、反馈信息及辅助信息;
练习数据包括:弹奏乐曲、弹奏速度、按键力度、练习时间、练习频率和乐曲复杂度;
反馈信息包括:练习曲目的喜好度评价和技术进步自评;
辅助信息包括:学生的年龄、音乐基础知识水平和偏好的音乐风格。
可见,本发明的曲目生成方法考虑了音乐的多种元素,包括音符的选择、时长、力度、和弦类型等,从而使生成的乐曲更丰富、更和谐。这不仅提升了乐曲的听感,更能激发学生的兴趣和想象力,提高他们对音乐创作的理解和欣赏能力。
在本发明的一些实施例中,步骤A20中,多任务深度学习网络包括:
练习数据子网络,用于基于练习数据提取学生的技术水平特征;
反馈信息子网络,用于基于反馈信息提取学生的偏好特征;
辅助信息子网络,用于基于辅助信息提取学生的个人信息特征;
练习数据子网络、反馈信息子网络及辅助信息子网络之间通过隐藏层进行信息共享。
根据本发明的一些实施例,步骤A30具体包括:
A31,设计智能体,智能体的状态空间包括当前的音乐序列和学生模型,动作空间包括音符、音符的时长、力度、和弦类型;
A32,在每个时间步,智能体根据当前的状态和策略网络,选择一个动作,生成一个音符,同时指定音符的时长、力度和和弦类型;
A33,将音符加入到当前的音乐序列中,生成新的状态,并根据当前的音乐序列和学生模型,计算出用于评价智能体的动作的奖励。
在本发明的一些实施例中,步骤A32中,智能体的策略网络由深度神经网络实现,输入为智能体的状态,输出为在动作空间中各个动作的概率分布,智能体在每个时间步根据当前的状态和策略网络选择一个动作。
根据本发明的一些实施例,步骤A33中,基于预设的奖励函数计算奖励,奖励函数包括乐曲的音乐性、乐曲的多元性和与学生模型的匹配程度;
乐曲的音乐性包括:旋律连贯性、和声适当性音乐理论规则;
乐曲的多元性包括:音符时长和力度的变化性、和弦类型的多样性;
与学生模型的匹配程度包括:乐曲难度应适合学生的技术水平,乐曲风格应符合学生的音乐偏好。
如图2所示,根据本发明实施例的基于人工智能的练习曲目的生成装置100,包括:收集模块10、模型构建模块20及练习曲目生成模块30。
其中,收集模块10用于收集多个维度的学生数据;
模型构建模块20用于通过多任务深度学习网络对收集的学生数据进行处理,构建学生模型;
练习曲目生成模块30用于利用强化学习算法,结合学生模型,生成练习曲目。
根据本发明实施例的基于人工智能的练习曲目的生成装置100,练习曲目的生成具有个性化和持续学习的特性。通过利用深度学习技术收集和分析学生的练琴数据,本发明可以构建一个个性化的学生模型,该模型可以准确地反映出学生的技术水平和音乐偏好。然后,通过基于深度强化学习进行曲目生成,可以生成与学生的技术水平和音乐偏好相匹配的练习曲目。本发明大大丰富了练习曲目的多样性,提高了学生的学习兴趣和效果。
根据本发明的一些实施例,生成装置100还包括:优化模块40,用于基于学生对练习曲目的评价反馈,对学生模型和曲目生成的算法进行优化。
也就是说,本发明的练习曲目生成装置具有持续学习和进步的能力。当学生进行练习并提供反馈后,可以根据反馈信息进行自我评价和调整,更新学生模型,改善曲目生成的策略。由此,能够不断地适应学生的发展和变化,进一步提高了乐曲生成的质量和满足度。
下面参照附图以钢琴的练习曲目的生成为例对本发明进行详细描述。可以理解的是,下述描述仅是示例性描述,而不应理解为对本发明的具体限制。例如,本发明还可以用于除钢琴外的其他乐器的练习曲目的生成。
本发明提出的基于人工智能的钢琴练习曲目生成方法,包括:
A10,数据收集:从多个方面收集学生的数据,包括:
实时练习数据,如弹奏乐曲、弹奏速度、按键力度、练习时间和乐曲复杂度。
学生的反馈信息,如练习曲目的喜好度评价和技术进步自评。
辅助信息,如学生的年龄、音乐基础知识水平和偏好的音乐风格。
A20,学生模型构建:利用特定的多任务深度学习网络(MTDLN)对收集到的数据进行处理,构建个性化的学生模型。
A30,曲目生成:基于学生模型,采用强化学习(Reinforcement Learning,RL)算法来进行曲目的生成。强化学习模型会根据学生的技术水平、音乐偏好等特性,以及音乐的音乐性、多元性等因素,自动生成个性化的练习曲目。
A40,评价反馈:将生成的曲目提供给学生进行练习,并收集他们的反馈信息,以不断优化学生模型和曲目生成算法。
以下对上述方法各步骤进行详细描述:
A10,数据收集:
在本步骤中,关注的核心是学生的钢琴练习数据。这部分数据的收集可以包括多种方式。一方面,系统可以直接通过钢琴练习软件或硬件设备(如智能钢琴)收集学生的实时练习数据,包括他们弹奏的乐曲、弹奏的速度、按键的力度等。另一方面,系统还会记录学生的练习时间、练习频率、乐曲的复杂度等信息。
除了实时的练习数据,还会收集学生的反馈信息,如对练习曲目的喜好度评价、自我评估的技术进步等。这部分数据通常通过在线调查或者在练习软件中的反馈功能进行收集。
此外,为了更全面地理解学生的音乐学习情况和需求,还会收集一些辅助信息,如学生的年龄、音乐基础知识水平、偏好的音乐风格等。这些信息可以通过注册时的问卷调查或者在线学习平台的用户信息进行收集。
所有这些数据,包括实时的练习数据、反馈信息和辅助信息,都会被系统整合在一起,用于构建个性化的学生模型,从而更准确地生成符合学生需求和偏好的练习曲目。
构建学生模型:
本发明的一大创新点在于使用深度学习方法来构建学生模型。具体来说,使用了一种特别设计的多任务深度学习网络(Multi-task Deep Learning Network,MTDLN)。该网络是为了解决同时处理学生的练习数据、反馈信息和辅助信息等多源异构数据的问题。
在这个多任务深度学习网络中,每个任务对应一个子网络。其中,实时练习数据子网络用于提取学生的技术水平特征,反馈信息子网络用于提取学生的偏好特征,辅助信息子网络用于提取学生的个人信息特征。这三个子网络共享一部分底层的隐藏层,使得他们可以在学习过程中共享信息,提高模型的泛化能力。
具体来说,假设有一个学生的数据集D={x1,x2,...,xn},其中xi代表一个学生的所有数据,包括实时练习数据、反馈信息和辅助信息。目标是训练一个深度学习网络f,使得它能够将每个学生的数据xi映射到一个学生模型yi,即yi=f(xi)。
每个子网络可以用以下公式进行描述:
实时练习数据子网络:y1i=f1(xi1;W1);
反馈信息子网络:y2i=f2(xi2;W2);
辅助信息子网络:y3i=f3(xi3;W3);
其中,xi1,xi2,xin分别代表学生i的实时练习数据、反馈信息和辅助信息,f1,f2,f3分别代表三个子网络的函数形式,W1,W2,W3分别代表三个子网络的参数。每个子网络的参数通过最小化对应的损失函数来进行学习。例如,实时练习数据子网络的参数W1通过最小化预测技术水平与实际技术水平之间的差异来学习,即:
minW1∑(y1i-f1(xi1;W1))2;
通过这样的方式,可以根据学生的多源异构数据构建出个性化的学生模型,更准确地理解学生的技术水平和音乐偏好,从而生成更符合学生需求和偏好的练习曲目。
曲目生成:
本发明采用强化学习(Reinforcement Learning,RL)算法来进行曲目的生成。首先,设计了一个智能体,它的状态空间包括当前的音乐序列和学生模型,动作空间包括音乐的多种元素,包括音符、音符的时长、力度、和弦类型等。每种元素的可选范围是预先设定的,比如音符可以选择从C1到B7的所有半音,时长可以选择从八分音符到全音符,力度可以选择从pp到ff,和弦类型可以选择大和弦、小和弦、增和弦、减和弦等。
在每个时间步,智能体会根据当前的状态和策略网络,选择一个动作,也就是生成一个音符,同时指定该音符的时长、力度和和弦类型。然后,这个音符会被加入到当前的音乐序列中,生成新的状态。此时,环境会根据新的音乐序列和学生模型,计算出一个奖励,用于评价智能体的动作。奖励的计算是基于设计的奖励函数,该函数包括三个部分,分别对应乐曲的音乐性、多元性和与学生模型的匹配程度。
乐曲的音乐性包括旋律连贯性、和声适当性等音乐理论规则。对于旋律连贯性,可以通过计算相邻音符间的音程距离来衡量。对于和声适当性,可以通过检查音乐序列中和弦类型和音符是否匹配来衡量。这些规则都可以通过现有的音乐理论知识进行编程实现。
乐曲的多元性包括音符时长和力度的变化性、和弦类型的多样性等因素。可以通过计算音乐序列中这些元素的标准差或者其他度量多样性的统计量来衡量。需要注意的是,多元性不仅仅是随机性,过度的随机性会导致乐曲听起来没有规律、混乱。因此,本发明在设计奖励函数时,会对多元性和音乐性进行适当的平衡。
与学生模型的匹配程度主要是指乐曲难度应适合学生的技术水平,乐曲风格应符合学生的音乐偏好。对于乐曲难度,可以通过统计乐曲中复杂的音乐元素(如大跨度的跳音、复杂的和弦等)的数量来衡量。对于乐曲风格,可以通过比较乐曲和学生偏好的风格样本在某种音乐特征上的相似性来衡量。例如,可以使用深度学习模型来提取音乐序列的特征,然后计算这些特征与学生模型中的偏好风格特征的相似性。
智能体的策略网络由深度神经网络实现,输入是智能体的状态,输出是在动作空间中各个动作的概率分布。智能体在每个时间步都会根据当前的状态和策略网络选择一个动作。本发明使用策略梯度方法来更新策略网络的参数,以使得累积奖励最大化。
这种强化学习的曲目生成方法,可以根据学生模型自动调整乐曲的难度和风格,同时保证乐曲具有良好的音乐性和多元性,使得乐曲既适合钢琴练习,又具有足够的吸引力,从而提高学生的学习效果和体验。
以下通过数学公式来对以上的算法进行说明:
s:智能体的状态,包括已经生成的音乐序列和学生模型。
a:智能体的动作,包括音符、时长、力度、和弦类型等音乐元素的组合。
θ:策略网络的参数。
R(s,a):在状态s下采取动作a获得的即时奖励。
Q(s,a):在状态s下采取动作a的行动价值函数,表示从状态s开始采取动作a,然后按照策略π采取动作能够获得的期望累积奖励。
那么,智能体的策略π可以表示为:
π(a|s;θ)=P[At=a|St=s,θ];
其中,At和St分别是时间t的动作和状态。策略π是一个条件概率分布,表示在状态s下采取动作a的概率。智能体在每个时间步根据策略π和当前状态选择动作。
本发明使用策略梯度方法来更新策略网络的参数,以使得期望累积奖励最大化。策略梯度定理给出了期望累积奖励关于策略参数的梯度,表达式为:
其中,J(θ)是期望累积奖励,Eπ表示按照策略π的期望。这个公式的意思是,本发明通过增加在长期回报高的状态-动作对(s,a)下选择动作a的概率,来增加期望累积奖励。
最后,奖励函数可以设计为考虑乐曲的音乐性、多元性和与学生模型的匹配程度:
R(s,a)=αRmusic(s,a)+βRdiversity(s,a)+γRmatch(s,a);
其中,α、β、γ是权重系数,用来平衡三个因素的重要性。Rmusic、Rdiversity、Rmatch分别表示音乐性、多元性和匹配程度的奖励。
评价反馈:
评价反馈是一个关键的环节,它决定了智能体是否能有效地学习和进步。在本发明中,提出了一种新颖的评价反馈机制,该机制综合考虑了音乐理论、学生的实时反馈和长期学习效果。
具体来说,评价反馈机制由三部分组成:
1、音乐理论评价:本发明构建了一个音乐理论评价模型,该模型根据音乐理论(如和声、旋律、节奏等)来评价生成的乐曲的质量。设M为音乐理论评价模型,f为生成的乐曲,音乐理论评价值为RM=M(f)。
2、实时反馈评价:本发明收集学生在练习过程中的实时反馈,如练习难度、乐曲喜好度等,来评价生成的乐曲。设F为学生的实时反馈,实时反馈评价值为RF=F(s,a),其中s是学生的状态,a是学生的动作。
3、长期学习效果评价:本发明通过跟踪学生的学习进度和学习成果来评价生成的乐曲对学生长期学习效果的影响。设L为学生的学习效果评价模型,长期学习效果评价值为RL=L(s)。
综合以上三部分,本发明的总评价函数为R=wM*RM+wF*RF+wL*RL,其中wM,wF,wL为各部分的权重,这些权重可以根据实际需要进行调整。
通过这种方式,本发明的评价反馈机制能够从多个角度全面地评价生成的乐曲,并提供有用的反馈来指导智能体进行学习和改进。
综上所述,本发明的钢琴练习曲目的生成方案具备如下特点:
个性化学习模型:通过收集和分析学生的练习数据,构建个性化的学生模型。这一模型能够有效地反映学生的技术水平和音乐偏好,为生成个性化的练习曲目提供基础。
基于强化学习的曲目生成机制:采用深度强化学习算法,以个性化学生模型和音乐理论为引导,生成个性化的练习曲目。该机制不仅能生成与学生技术水平和音乐偏好相匹配的曲目,还能通过学习过程不断优化曲目生成效果。
多元素音乐生成:考虑音乐中的多种元素(如音符、时长、力度、和弦等),使生成的乐曲更丰富、更和谐。
综合评价反馈机制:通过结合音乐理论评价、学生实时反馈和长期学习效果评价,提出一种全面的评价反馈机制。该机制能够全面地评价生成的乐曲,并提供有用的反馈来指导智能体进行学习和改进。
独特的奖励函数设计:奖励函数不仅考虑乐曲的音乐性(如旋律连贯性、和声适当性等),还考虑乐曲的多元性(如音符时长和力度的变化性、和弦类型的多样性等),并且还考虑乐曲与学生模型的匹配程度,以鼓励生成与学生特性相匹配的乐曲。
自动化、智能化的钢琴练习系统:基于以上技术,构建一种能够自动生成个性化练习曲目的智能钢琴练习系统。该系统能够提高学生的学习效率和兴趣,同时也有利于教师进行教学管理和辅导。
本发明具有如下有益效果:
本发明的练习曲目的生成具有个性化和持续学习的特性。通过利用深度学习技术收集和分析学生的练琴数据,本发明可以构建一个个性化的学生模型,该模型可以准确地反映出学生的技术水平和音乐偏好。然后,通过设计一个基于深度强化学习的曲目生成装置,可以生成与学生的技术水平和音乐偏好相匹配的练习曲目。这种方法大大丰富了练习曲目的多样性,提高了学生的学习兴趣和效果。
另一方面,本发明的系统具有持续学习和进步的能力。当学生通过系统进行练习并提供反馈后,系统可以根据反馈信息进行自我评价和调整,更新学生模型,改善曲目生成的策略。这种迭代更新的过程,使得我们的系统能够不断地适应学生的发展和变化,进一步提高了乐曲生成的质量和满足度。
此外,本发明的系统考虑了音乐的多种元素,包括音符的选择、时长、力度、和弦类型等,从而使生成的乐曲更丰富、更和谐。这不仅提升了乐曲的听感,更能激发学生的兴趣和想象力,提高他们对音乐创作的理解和欣赏能力。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。
Claims (10)
1.一种基于人工智能的练习曲目的生成方法,其特征在于,包括:
A10,收集多个维度的学生数据;
A20,通过多任务深度学习网络对收集的所述学生数据进行处理,构建学生模型;
A30,利用强化学习算法,结合所述学生模型,生成练习曲目。
2.根据权利要求1所述的基于人工智能的练习曲目的生成方法,其特征在于,
A40,基于学生对所述练习曲目的评价反馈,对所述学生模型和曲目生成的算法进行优化。
3.根据权利要求2所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A40中,基于学生对所述练习曲目的评价反馈计算评价函数,所述评价函数为:
R=wM*RM+wF*RF+wL*RL;
其中,RM为用于评价所述练习曲目的质量的音乐理论评价值,wM为音乐理论评价值的权重;
RF为所述练习曲目练习过程中的实时反馈评价值,wF为实时反馈评价值的权重;
RL为所述练习曲目的长期学习效果评价值,wL为长期学习效果评价值的权重。
4.根据权利要求1所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A10包括:练习数据、反馈信息及辅助信息;
所述练习数据包括:弹奏乐曲、弹奏速度、按键力度、练习时间、练习频率和乐曲复杂度;
所述反馈信息包括:练习曲目的喜好度评价和技术进步自评;
所述辅助信息包括:学生的年龄、音乐基础知识水平和偏好的音乐风格。
5.根据权利要求1所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A20中,所述多任务深度学习网络包括:
练习数据子网络,用于基于所述练习数据提取学生的技术水平特征;
反馈信息子网络,用于基于所述反馈信息提取学生的偏好特征;
辅助信息子网络,用于基于所述辅助信息提取学生的个人信息特征;
所述练习数据子网络、所述反馈信息子网络及所述辅助信息子网络之间通过隐藏层进行信息共享。
6.根据权利要求1所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A30具体包括:
A31,设计智能体,所述智能体的状态空间包括当前的音乐序列和学生模型,动作空间包括音符、音符的时长、力度、和弦类型;
A32,在每个时间步,所述智能体根据当前的状态和策略网络,选择一个动作,生成一个音符,同时指定所述音符的时长、力度和和弦类型;
A33,将所述音符加入到当前的音乐序列中,生成新的状态,并根据当前的音乐序列和学生模型,计算出用于评价智能体的动作的奖励。
7.根据权利要求6所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A32中,所述智能体的策略网络由深度神经网络实现,输入为所述智能体的状态,输出为在动作空间中各个动作的概率分布,智能体在每个时间步根据当前的状态和策略网络选择一个动作。
8.根据权利要求6所述的基于人工智能的练习曲目的生成方法,其特征在于,步骤A33中,基于预设的奖励函数计算所述奖励,所述奖励函数包括乐曲的音乐性、乐曲的多元性和与学生模型的匹配程度;
所述乐曲的音乐性包括:旋律连贯性、和声适当性音乐理论规则;
所述乐曲的多元性包括:音符时长和力度的变化性、和弦类型的多样性;
与学生模型的匹配程度包括:乐曲难度应适合学生的技术水平,乐曲风格应符合学生的音乐偏好。
9.一种基于人工智能的练习曲目的生成装置,其特征在于,包括:
收集模块,用于收集多个维度的学生数据;
模型构建模块,用于通过多任务深度学习网络对收集的所述学生数据进行处理,构建学生模型;
练习曲目生成模块,用于利用强化学习算法,结合所述学生模型,生成练习曲目。
10.根据权利要求9所述的基于人工智能的练习曲目的生成装置,其特征在于,所述生成装置还包括:
优化模块,用于基于学生对所述练习曲目的评价反馈,对所述学生模型和曲目生成的算法进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311149693.6A CN117114937B (zh) | 2023-09-07 | 2023-09-07 | 基于人工智能的练习曲目的生成方法及生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311149693.6A CN117114937B (zh) | 2023-09-07 | 2023-09-07 | 基于人工智能的练习曲目的生成方法及生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117114937A true CN117114937A (zh) | 2023-11-24 |
CN117114937B CN117114937B (zh) | 2024-06-14 |
Family
ID=88805430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311149693.6A Active CN117114937B (zh) | 2023-09-07 | 2023-09-07 | 基于人工智能的练习曲目的生成方法及生成装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117114937B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165746A1 (en) * | 2016-12-09 | 2018-06-14 | Alibaba Group Holding Limited | Network Interaction System |
CN111723938A (zh) * | 2020-05-06 | 2020-09-29 | 华南理工大学 | 一种基于指法规则和强化学习的钢琴指法自动生成方法 |
CN112307214A (zh) * | 2019-07-26 | 2021-02-02 | 株式会社理光 | 一种基于深度强化学习的推荐方法及推荐装置 |
US20210110458A1 (en) * | 2019-10-09 | 2021-04-15 | Target Brands, Inc. | Faceted item recommendation system |
CN112820361A (zh) * | 2019-11-15 | 2021-05-18 | 北京大学 | 一种基于对抗模仿学习的药物分子生成方法 |
CN113095488A (zh) * | 2021-04-29 | 2021-07-09 | 电子科技大学 | 一种基于多智能体最大熵强化学习的合作博弈方法 |
CN113094495A (zh) * | 2021-04-21 | 2021-07-09 | 上海松鼠课堂人工智能科技有限公司 | 深度强化学习的学习路径演示方法、装置、设备及介质 |
CN113190761A (zh) * | 2021-05-25 | 2021-07-30 | 贵州广播电视大学(贵州职业技术学院) | 基于深度强化学习的个性化学习系统及方法 |
CN113434563A (zh) * | 2021-07-12 | 2021-09-24 | 北京高思博乐教育科技股份有限公司 | 自适应学习路径推荐中的强化学习方法及系统 |
CN113449183A (zh) * | 2021-06-18 | 2021-09-28 | 华中科技大学 | 基于离线用户环境和动态奖励的交互式推荐方法和系统 |
CN113792929A (zh) * | 2021-04-26 | 2021-12-14 | 青岛大学 | 交通流量预测方法、电子设备及存储介质 |
CN114595923A (zh) * | 2022-01-11 | 2022-06-07 | 电子科技大学 | 一种基于深度强化学习的群体教学推荐系统 |
CN114815840A (zh) * | 2022-04-29 | 2022-07-29 | 中国科学技术大学 | 基于深度强化学习的多智能体路径规划方法 |
CN115829693A (zh) * | 2022-12-27 | 2023-03-21 | 广东工业大学 | 基于因果反事实的上下文老虎机延迟反馈推荐方法和系统 |
CN116456493A (zh) * | 2023-04-20 | 2023-07-18 | 无锡学院 | 一种基于深度强化学习算法的d2d用户资源分配方法及存储介质 |
CN116663470A (zh) * | 2023-05-19 | 2023-08-29 | 西北工业大学 | 一种完全可编程阀门阵列生物芯片的控制逻辑布线方法 |
-
2023
- 2023-09-07 CN CN202311149693.6A patent/CN117114937B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165746A1 (en) * | 2016-12-09 | 2018-06-14 | Alibaba Group Holding Limited | Network Interaction System |
CN112307214A (zh) * | 2019-07-26 | 2021-02-02 | 株式会社理光 | 一种基于深度强化学习的推荐方法及推荐装置 |
US20210110458A1 (en) * | 2019-10-09 | 2021-04-15 | Target Brands, Inc. | Faceted item recommendation system |
CN112820361A (zh) * | 2019-11-15 | 2021-05-18 | 北京大学 | 一种基于对抗模仿学习的药物分子生成方法 |
CN111723938A (zh) * | 2020-05-06 | 2020-09-29 | 华南理工大学 | 一种基于指法规则和强化学习的钢琴指法自动生成方法 |
CN113094495A (zh) * | 2021-04-21 | 2021-07-09 | 上海松鼠课堂人工智能科技有限公司 | 深度强化学习的学习路径演示方法、装置、设备及介质 |
CN113792929A (zh) * | 2021-04-26 | 2021-12-14 | 青岛大学 | 交通流量预测方法、电子设备及存储介质 |
CN113095488A (zh) * | 2021-04-29 | 2021-07-09 | 电子科技大学 | 一种基于多智能体最大熵强化学习的合作博弈方法 |
CN113190761A (zh) * | 2021-05-25 | 2021-07-30 | 贵州广播电视大学(贵州职业技术学院) | 基于深度强化学习的个性化学习系统及方法 |
CN113449183A (zh) * | 2021-06-18 | 2021-09-28 | 华中科技大学 | 基于离线用户环境和动态奖励的交互式推荐方法和系统 |
CN113434563A (zh) * | 2021-07-12 | 2021-09-24 | 北京高思博乐教育科技股份有限公司 | 自适应学习路径推荐中的强化学习方法及系统 |
CN114595923A (zh) * | 2022-01-11 | 2022-06-07 | 电子科技大学 | 一种基于深度强化学习的群体教学推荐系统 |
CN114815840A (zh) * | 2022-04-29 | 2022-07-29 | 中国科学技术大学 | 基于深度强化学习的多智能体路径规划方法 |
CN115829693A (zh) * | 2022-12-27 | 2023-03-21 | 广东工业大学 | 基于因果反事实的上下文老虎机延迟反馈推荐方法和系统 |
CN116456493A (zh) * | 2023-04-20 | 2023-07-18 | 无锡学院 | 一种基于深度强化学习算法的d2d用户资源分配方法及存储介质 |
CN116663470A (zh) * | 2023-05-19 | 2023-08-29 | 西北工业大学 | 一种完全可编程阀门阵列生物芯片的控制逻辑布线方法 |
Non-Patent Citations (4)
Title |
---|
NELSON VITHAYATHIL VARGHESE 等: "A Hybrid Multi-Task Learning Approach for Optimizing Deep Reinforcement Learning Agents", 《IEEE ACCESS》, vol. 9, 12 March 2021 (2021-03-12), pages 44681 - 44703, XP011845911, DOI: 10.1109/ACCESS.2021.3065710 * |
柳玉洋: "基于卷积神经网络和深度强化学习的音乐推荐算法研究", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》, no. 9, 15 September 2022 (2022-09-15), pages 086 - 135 * |
王慧琴 等: "基于多智能体强化学习值分解的优化算法", 《电子测量技术》, vol. 46, no. 7, 30 April 2023 (2023-04-30), pages 73 - 79 * |
金天成 等: "基于深度强化学习与程序分析的OJ习题推荐模型", 《计算机科学》, vol. 50, no. 8, 3 August 2023 (2023-08-03), pages 58 - 67 * |
Also Published As
Publication number | Publication date |
---|---|
CN117114937B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wei et al. | College music education and teaching based on AI techniques | |
Tatar et al. | Musical agents: A typology and state of the art towards musical metacreation | |
Linson et al. | Distributed cognition, ecological theory, and group improvisation | |
Le Groux et al. | Towards adaptive music generation by reinforcement learning of musical tension | |
Zheng et al. | [Retracted] Training Strategy of Music Expression in Piano Teaching and Performance by Intelligent Multimedia Technology | |
Lei et al. | Deep learning dual neural networks in the construction of learning models for online courses in piano education | |
Xue et al. | The Piano‐Assisted Teaching System Based on an Artificial Intelligent Wireless Network | |
Han et al. | An evaluation of AI-based college music teaching using AHP and MOORA | |
Gu et al. | Modeling Piano Interpretation Using Switching Kalman Filter. | |
Bisesi et al. | A computational model of immanent accent salience in tonal music | |
Gimenes et al. | Emergent worldviews: An ontomemetic approach to musical intelligence | |
CN117114937B (zh) | 基于人工智能的练习曲目的生成方法及生成装置 | |
Doke | Collaborative learning among high school students in an alternative styles strings ensemble | |
Wei | A Study of piano timbre teaching in the context of artificial intelligence interaction | |
Dong | Using deep learning and genetic algorithms for melody generation and optimization in music | |
Soto | Mariachi and Western Art Music in the Preparation of Future Teachers: Nurturing the Bimusical Complexities of Mexican-American Students. | |
Ostermann et al. | Evaluating Creativity in Automatic Reactive Accompaniment of Jazz Improvisation. | |
Wang | Fuzzy logical system for personalized vocal music instruction and psychological awareness in colleges using big data | |
Ruan et al. | Exploring Neural Network-Based Analysis for Vocal Music Teaching Quality in Virtual Reality Solution | |
Thompson | Researching Technological Advancements Through Alternative Methods of Music Education to Engage Students in the Digital Age | |
Song | Applications Of Artificial Intelligence-Assisted Computing In “Piano Education” | |
Yuan | Influencing Factors and Modeling Methods of Vocal Music Teaching Quality Supported by Artificial Intelligence Technology | |
Berlin | Content Analysis of Guitar Repertoire for Young People: The Michelson and Suzuki Collections | |
Souvaliotis | Learning EDM The “Schooling” of Electronic Dance Musicians | |
Li | Study on Integration and Application of Artificial Intelligence and Wireless Network in Piano Music Teaching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |