CN112734142A

CN112734142A - 基于深度学习的资源学习路径规划方法及装置

Info

Publication number: CN112734142A
Application number: CN202110362642.6A
Authority: CN
Inventors: 杨德杰
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2021-04-30
Anticipated expiration: 2041-04-02
Also published as: CN112734142B

Abstract

本发明公开了基于深度学习的资源学习路径规划方法、装置、计算机设备及存储介质，涉及人工智能技术，包括先实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；之后在虚拟对象数据库中根据筛选条件获取目标数据组成样本集，以进行模型训练得到预测模型；最后若接收到当前课程子轨迹信息初始输入特征，将其输入至预测模型进行运算得到输出结果。实现了基于因学习课程而使得虚拟对象级别上升的学习课程轨迹得到样本数据对预测模型进行训练，得到的预测模型能够根据输入的课程轨迹输出推荐学习课程轨迹，因利用深度学习模型能提高预测精准度，而且能学习到更多的特征输入，模型更加的灵活。

Description

基于深度学习的资源学习路径规划方法及装置

技术领域

本发明涉及人工智能的智能决策技术领域，尤其涉及一种基于深度学习的资源学习路径规划方法、装置、计算机设备及存储介质。

背景技术

教育培训的重要目标之一是针对用户个性化需求实现差异化的培训课程推荐，只有满足不同个体的培训需求，才能在有限培训资源的情况下实现培训效果最大化。目前，常见的教育培训方式是在线教育，在线教育实现课程推荐一方面要因人而异匹配内容，另外需要根据每个对象的实习情况推荐最优的学习路径。

个性化学习路径是指根据学习者的个人能力和现状提供个性化的资源学习序列，从而提升学习者的学习效率和学习效果。而个性化学习路径的生成过程是指根据学习者的特点及内外部因素来决定学习对象的学习顺序的过程。

已有的学习路径规划方法如遗传算法、粒子群优化等是一类启发式方法，存在随机性强、评价函数较难设定，以及训练时间长、易陷入局部最优解等问题。

发明内容

本发明实施例提供了一种基于深度学习的资源学习路径规划方法、装置、计算机设备及存储介质，旨在解决现有技术中在线教育平台的学习路径规划方法如遗传算法、粒子群优化等是一类启发式方法，存在随机性强、评价函数较难设定，以及训练时间长、易陷入局部最优解等问题。

第一方面，本发明实施例提供了一种基于深度学习的资源学习路径规划方法，其包括：

若检测到任意用户端上传的学习数据，获取所述学习数据对应的数据标签，将学习数据根据所述数据标签保存至对应的存储区域；

实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；其中，所述虚拟对象数据库中存储有若干条学习数据点击记录，每一条学习数据点击记录对应一条知识学习记录数据；

在虚拟对象数据库中根据预设的筛选条件获取目标数据组成样本集，根据所述样本集中各目标虚拟对象对应的学习记录轨迹进行模型训练，得到预测模型；以及

若接收到当前课程子轨迹信息初始输入特征，获取与所述当前课程子轨迹信息初始输入特征对应的当前课程子轨迹信息调整输入特征，将所述当前课程子轨迹信息调整输入特征输入至预测模型进行运算，得到输出结果。

第二方面，本发明实施例提供了一种基于深度学习的资源学习路径规划装置，其包括：

数据标签获取单元，用于若检测到任意用户端上传的学习数据，获取所述学习数据对应的数据标签，将学习数据根据所述数据标签保存至对应的存储区域；

点击记录采集单元，用于实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；其中，所述虚拟对象数据库中存储有若干条学习数据点击记录，每一条学习数据点击记录对应一条知识学习记录数据；

预测模型训练单元，用于在虚拟对象数据库中根据预设的筛选条件获取目标数据组成样本集，根据所述样本集中各目标虚拟对象对应的学习记录轨迹进行模型训练，得到预测模型；以及

输出结果获取单元，用于若接收到当前课程子轨迹信息初始输入特征，获取与所述当前课程子轨迹信息初始输入特征对应的当前课程子轨迹信息调整输入特征，将所述当前课程子轨迹信息调整输入特征输入至预测模型进行运算，得到输出结果。

第三方面，本发明实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的基于深度学习的资源学习路径规划方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于深度学习的资源学习路径规划方法。

本发明实施例提供了一种基于深度学习的资源学习路径规划方法、装置、计算机设备及存储介质，包括先实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；之后在虚拟对象数据库中根据筛选条件获取目标数据组成样本集，以进行模型训练得到预测模型；最后若接收到当前课程子轨迹信息初始输入特征，将其输入至预测模型进行运算得到输出结果。实现了基于因学习课程而使得虚拟对象级别上升的学习课程轨迹得到样本数据对预测模型进行训练，得到的预测模型能够根据输入的课程轨迹输出推荐学习课程轨迹，因利用深度学习模型能提高预测精准度，而且能学习到更多的特征输入，模型更加的灵活。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于深度学习的资源学习路径规划方法的应用场景示意图；

图2为本发明实施例提供的基于深度学习的资源学习路径规划方法的流程示意图；

图3为本发明实施例提供的基于深度学习的资源学习路径规划方法的子流程示意图；

图4为本发明实施例提供的基于深度学习的资源学习路径规划装置的示意性框图；

图5为本发明实施例提供的基于深度学习的资源学习路径规划装置中预测模型训练单元的示意性框图；

图6为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1为本发明实施例提供的基于深度学习的资源学习路径规划方法的应用场景示意图；图2为本发明实施例提供的基于深度学习的资源学习路径规划方法的流程示意图，该基于深度学习的资源学习路径规划方法应用于服务器中，该方法通过安装于服务器中的应用软件进行执行。

如图2所示，该方法包括步骤S110~S140。

S110、若检测到任意用户端上传的学习数据，获取所述学习数据对应的数据标签，将学习数据根据所述数据标签保存至对应的存储区域。

在本实施例中，任意一个虚拟对象（从广义上理解为任意用户）可使用用户端（例如平板电脑、智能手机等）登录服务器对应的用户交互界面后，上传文本、视频等格式的学习数据，这些学习数据可以在服务器中实现共享从而被其他用户在线观看或是下载观看。

在存储用户上传的学习数据之前，需要获取学习数据的数据标签（也可以理解为课程类型，也就是表示当前的学习数据对应的课程类型，如财经类课程、科普类课程等），学习数据的数据标签可以是虚拟对象上传前手动完成打标签，也可以是上传至服务器后将通预先训练的数据分类模型确定该学习数据的数据标签。

具体实施时，通预先训练的数据分类模型确定该学习数据的数据标签时，从学习数据分别为文本类型或视频类型来说明具体分类过程。

例如，当学习数据为文本类型的数据时，可以通过文章主题提取模型（如LDA模型）获取所述学习数据对应的主题（主题本质上就是核心关键词）后，判断该主题所归属的类别（一般预先设置了主题与数据标签的对应清单，也就在这一清单中可以知道每一主题对应哪一数据标签），从而以该主题所归属的类别来获取所述学习数据对应的数据标签。

例如，当学习数据为视频类型的数据时，可以截取该学习数据的前30秒钟的语音数据作为局部语音数据（若学习数据对应的视频时长不满30秒，在获取全部的语音数据作为局部语音数据），将局部语音数据通过语音识别模型（如N-gram模型，也即多元模型）进行语音识别得到对应的文本识别结果，之后可参考文本类型的学习数据的数据标签获取过程，从而得到了该视频类型的学习数据所对应的数据标签。

在一实施例中，步骤S110之后还包括：

根据每一学习数据对应的课程时长、课程评论次数、是否收藏属性值，与学习数据对应的课程类型组成各学习数据分别对应的课程实际特征；

对每一学习数据随机分配一个唯一的课程编号用于唯一标识学习数据。

其中，在获取了学习数据对应的数据标签后，将学习数据根据所述数据标签保存至对应的存储区域，从而将具有相同数据标签的学习数据存储在同一区域。而且每一学习数据存储在服务器中对应的存储区域后，可以实时统计该学习数据对应的课程时长、课程评论次数、是否收藏等属性值，从而与学习数据对应的课程类型组成该学习数据对应的课程实际特征。而且每一学习数据在存储在服务器中，服务器会对其随机分配一个唯一的课程编号，以唯一标识该学习数据。

S120、实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；其中，所述虚拟对象数据库中存储有若干条学习数据点击记录，每一条学习数据点击记录对应一条知识学习记录数据。

在本实施例中，多个虚拟对象上传至服务器并存储的学习数据共同组成了知识课程数据库。其他任意的虚拟对象可以登陆服务器后查看任意的学习数据，从而采集到大量虚拟对象的知识学习记录。

S130、在虚拟对象数据库中根据预设的筛选条件获取目标数据组成样本集，根据所述样本集中各目标虚拟对象对应的学习记录轨迹进行模型训练，得到预测模型。

在本实施例中，为了获取对基于当前的学习数据查看记录进行未来的学习数据推荐的预测模型，可以预先设置筛选条件（例如在该筛选条件中设置了限定时间区间和虚拟对象当前级别上升限定条件，筛选出在限定时间区间内虚拟对象因为观看了学习数据而使得其级别得到上升的知识学习记录）筛选出目标数据组成样本集。获取样本集中每一目标数据对应的目标虚拟对象后，可以获取每一目标虚拟对象在限定时间区间内的学习数据点击历史记录从而组成学习记录轨迹，由每一学习记录轨迹进行输入特征和输出特征划分后，即可组成训练集进行模型训练，得到用于基于当前的学习数据查看记录进行未来的学习数据推荐的预测模型。

在一实施例中，以学习数据为视频类型为例，且学习数据应用于在线培训场景，如图3所示，步骤S130包括以下步骤S101~S106：

S101、在本地的虚拟对象数据库中根据预设的筛选条件获取目标数据，组成样本集；其中，所述样本集中包括若干个虚拟对象数据集，每一虚拟对象数据集对应一个虚拟对象，每一虚拟对象数据集均包括若干条知识学习记录数据。

在本实施例中，在服务器的本地存储了大量虚拟对象（具体实施时虚拟对象可以是业务员、学生、保险代理人等角色）对应的知识学习记录数据。在服务器的本地存储了大量的知识课程数据以组成知识课程数据库，当某一虚拟对象登录服务器并在知识课程数据库中选择知识课程进行学习，则在服务器中存储与该虚拟对象对应的一条知识学习记录数据。例如，在服务器中按日记录各虚拟对象对应的知识学习记录数据（也就是在服务器中按日期建立数据表，每一日期对应的数据表中存储有当日所有已有学习记录的虚拟对象对应的知识学习记录），则选取某一天其中的一条知识学习记录数据1来举例说明其所包括的具体信息。

在知识学习记录数据1中至少包括虚拟对象唯一识别码、虚拟对象当前级别、课程编号、课程学习持续时间。通过虚拟对象唯一识别码可以确定是哪一用户登录服务器并选中知识课程数据库中的知识课程进行学习，通过虚拟对象当前级别可以确定用户当前最新的用户级别（例如虚拟对象是保险代理人时，其可以是保险代理人在保险公司代理人级别体系中的评级），通过课程编号可以确定用户此次登录学习了哪一课程，通过课程学习持续时间可以确定用户此次登录学习该课程的持续时间。

在知识学习记录数据中虚拟对象当前级别和课程编号是重要的参考参数，所设置的筛选条件一般包括限定时间区间（例如当前日期对应的年份是2020年，可设置限定时间区间为最近两年，也就是2018年1月1日-2019年12月31日），还包括虚拟对象当前级别有上升趋势（假设虚拟对象当前级别的评定周期是一个季度，某一虚拟对象对应在2018年第一季度对应的虚拟对象当前级别是2且在2018年第二季度对应的虚拟对象当前级别是3，此时可以认为该虚拟对象当前级别有上升趋势）。通过上述设置的筛选条件，可以筛选出满足条件的目标虚拟对象，而每一目标虚拟对象是对应一个虚拟对象数据集且该虚拟对象数据集包括若干条知识学习记录数据。

在一实施例中，步骤S101包括：

获取所述筛选条件对应的限定时间区间和虚拟对象当前级别上升限定条件；

根据所述限定时间区间在本地的虚拟对象数据库中筛选获取初始筛选数据，组成初始筛选数据集；

将所述初始筛选数据集中的初始筛选数据根据虚拟对象唯一识别码进行分组，得到与各虚拟对象唯一识别码分别对应的虚拟对象数据集；其中，每一虚拟对象数据集中所包括知识学习记录数据按时间升序排序；

根据所述虚拟对象当前级别上升限定条件在与各虚拟对象唯一识别码分别对应的虚拟对象数据集中筛选出满足条件的虚拟对象数据集，组成样本集。

在本实施例中，可以参考上述举例将限定时间区间设置为当年年份之前的最近完整两年，将虚拟对象当前级别上升限定条件设置为虚拟对象当前级别按季度统计为上升序列。

这样，先根据所述限定时间区间在本地的虚拟对象数据库中筛选获取初始筛选数据，组成初始筛选数据集。通过初步筛选，减少了作为候选样本数据的数据量。

之后，为了清楚的获知每一虚拟对象在限定时间区间内的知识学习记录，根据虚拟对象唯一识别码对所述初始筛选数据集中的初始筛选数据进行分组，这样就能获知各虚拟对象唯一识别码分别对应的虚拟对象数据集，且每一虚拟对象数据集中所包括知识学习记录数据按时间升序排序。

最后，为了筛选多个虚拟对象中在限定时间区间内通过学习知识课程使得虚拟对象当前级别得到了提升的目标虚拟对象，可以根据所述虚拟对象当前级别上升限定条件在与各虚拟对象唯一识别码分别对应的虚拟对象数据集中筛选出满足条件的虚拟对象数据集，组成样本集。

在一实施例中，所述根据所述虚拟对象当前级别上升限定条件在与各虚拟对象唯一识别码分别对应的虚拟对象数据集中筛选出满足条件的虚拟对象数据集，组成样本集，包括：

获取各虚拟对象数据集按照季度统计分别对应的虚拟对象当前级别，组成与各虚拟对象数据集对应的虚拟对象级别序列；

将各虚拟对象级别序列中每一序列值均减去前一位序列值，得到与各虚拟对象数据集分别对应的虚拟对象级别调整序列；其中，各虚拟对象级别调整序列中第一个序列值取0；

若有虚拟对象级别调整序列中的序列值均为非负数，判定该虚拟对象级别调整序列对应的虚拟对象数据集满足所述虚拟对象当前级别上升限定条件，将该虚拟对象级别调整序列对应的虚拟对象数据集加入样本集。

在本实施例中，例如若限定时间区间为2018年1月1日-2019年12月31日，有虚拟对象在2018年第一季度中每天对应的虚拟对象当前级别为1，则该虚拟对象在2018年第一季度对应的虚拟对象当前级别为1；同样的，该虚拟对象在2018年第一季度中每天对应的虚拟对象当前级别为2，则该虚拟对象在2018年第二季度对应的虚拟对象当前级别为2；该虚拟对象在2018年第三季度对应的虚拟对象当前级别为3，则该虚拟对象在2018年第三季度对应的虚拟对象当前级别为3；该虚拟对象在2018年第四季度对应的虚拟对象当前级别为3，则该虚拟对象在2018年第三季度对应的虚拟对象当前级别为3；该虚拟对象在2019年第一季度对应的虚拟对象当前级别为4，则该虚拟对象在2019年第一季度对应的虚拟对象当前级别为4；该虚拟对象在2019年第二季度对应的虚拟对象当前级别为4，则该虚拟对象在2019年第二季度对应的虚拟对象当前级别为4；该虚拟对象在2019年第三季度对应的虚拟对象当前级别为5，则该虚拟对象在2019年第三季度对应的虚拟对象当前级别为5；该虚拟对象在2019年第四季度对应的虚拟对象当前级别为5，则该虚拟对象在2019年第四季度对应的虚拟对象当前级别为5。由上可知，该虚拟对象在限定时间区间对应的虚拟对象级别序列为[1 2 3 3 4 4 5 5]。

之后将虚拟对象级别序列[1 2 3 3 4 4 5 5]中每一序列值均减去前一位序列值，得到与各虚拟对象数据集分别对应的虚拟对象级别调整序列[0 1 1 0 1 0 1 0]。由于该虚拟对象的虚拟对象级别调整序列中均为非负数，可以判定该虚拟对象级别调整序列对应的虚拟对象数据集满足所述虚拟对象当前级别上升限定条件，将该虚拟对象级别调整序列对应的虚拟对象数据集加入样本集。直至与各虚拟对象唯一识别码分别对应的虚拟对象数据集中满足虚拟对象当前级别上升限定条件的虚拟对象数据集均筛选出并加入至样本集中之后，得到最终的样本集。

S102、获取所述样本集中各虚拟对象数据集对应的知识学习记录数据，组成各虚拟对象数据集分别对应的学习课程名称轨迹信息。

在本实施例中，由于所述样本集中各虚拟对象数据集对应一个虚拟对象，故按时间升序顺序获取各虚拟对象数据集对应的学习课程名称后，即可组成与各虚拟对象数据集分别对应的学习课程名称轨迹信息。例如，某一虚拟对象A的虚拟对象数据集中包括100条知识学习记录数据，这100条知识学习记录数据对应了100个学习课程名称，而每一学习课程名称又对应唯一的一个课程编号，这样将这100个课程编号按照学习的时间先后顺序依次排列组成一个编号序列，即得到了虚拟对象A的虚拟对象数据集对应的学习课程名称轨迹信息。

S103、将各学习课程名称轨迹信息按照预设的移动步长和第一划分窗口长度划分为多个课程子轨迹信息。

在本实施例中，当获取了各虚拟对象对应的学习课程名称轨迹信息后，可以参照移动分窗的方式将每一学习课程名称轨迹信息均切分为多个课程子轨迹信息。例如，上述举例的虚拟对象A对应的学习课程名称轨迹信息包括100个课程编号，组成的编号序列中有100个序列值，每一序列值对应一个课程编号。若将移动步长设置为5，且第一划分窗口长度设置为15，则首先以该学习课程名称轨迹信息中第1个课程标号为起点选出15个序列值，得到第一个课程子轨迹信息。之后由于窗口的移动步长为5，故第二次以该学习课程名称轨迹信息中第6个课程标号为起点选出15个序列值，得到第二个课程子轨迹信息。以此类推，直至以该学习课程名称轨迹信息中第86个课程标号为起点选出15个序列值，得到第18个课程子轨迹信息。

其他学习课程名称轨迹信息的划分方式也是参考虚拟对象A对应的学习课程名称轨迹信息的划分方式，最终可以快速的得到大量的课程子轨迹信息。

S104、将各课程子轨迹信息按照预设的第二划分窗口长度划分为课程子轨迹信息初始输入特征，以及课程子轨迹信息初始输出特征。

在本实施例中，当获取了大量的课程子轨迹信息后，各课程子轨迹信息对应的序列长度都是与第一划分窗口长度相同，此时为了更快的生成用于训练预测课程学习轨迹的预测模型的训练样本，可以将每一个课程子轨迹信息按照预设的第二划分窗口长度划分，也就是每一课程子轨迹信息对应的序列被划分成了两个部分，前面一部分序列值组成的序列作为课程子轨迹信息初始输入特征，后面一部分序列值组成的序列作为课程子轨迹信息初始输出特征。其中，所述第二划分窗口长度小于所述第一划分窗口长度。

在一实施例中，步骤S104包括：

获取各课程子轨迹信息中的起始序列值，以起始序列值为起点并根据所述第二划分窗口长度将各课程子轨迹信息均划分为前划分部分和后划分部分，将各课程子轨迹信息的前划分部分作为课程子轨迹信息初始输入特征，将各课程子轨迹信息的后划分部分作为课程子轨迹信息初始输出特征。

例如虚拟对象A对应的某一课程子轨迹信息包括15个课程编号，将所述第二划分窗口长度设置为10，则上述15个课程编号中前10个课程编号划分一组组成该课程子轨迹信息对应的课程子轨迹信息初始输入特征，上述15个课程编号中后5个课程编号划分一组组成该课程子轨迹信息对应的课程子轨迹信息初始输出特征。

S105、获取各课程子轨迹信息初始输入特征中每一课程编号对应的课程特征，组成与各课程子轨迹信息初始输入特征分别对应的课程子轨迹信息调整输入特征。

在本实施例中，由于每一课程编号对应的课程是对应有该课程的课程实际特征，如课程类型、课程时长、课程评论次数、是否收藏。例如某一课程编号031对应的课程实际特征是[1 20 1000 1],其中1表示该课程类型对应编号为1，20表示课程时长为20分钟，1000表示课程评论次数为1000次，1表示课程已被收藏。通过这一转换，将各课程子轨迹信息初始输入特征转换为了信息维度更多的课程子轨迹信息调整输入特征，这样所训练出来的预测模型更加准确。

S106、将各课程子轨迹信息调整输入特征作为待训练预测模型的输入，并将各课程子轨迹信息调整输入特征对应的课程子轨迹信息初始输出特征作为待训练预测模型的输出，对所述待训练预测模型进行训练，得到预测模型。

在本实施例中，例如某虚拟对象的前10门课程对应的特征（如课程类型、课程时长、课程评论次数、是否收藏）如xt=(xt1,xt2,…,xtn)， xt代表前10门课程中的第t门课，xti代表xt这门课程的第i个特征，则该课程子轨迹信息调整输入特征X=(x1,x2,..xt,..,x10)。该前10门课程之后的5门课程的编号分别是Y1、Y2、Y3、Y4、Y5，则与该课程子轨迹信息调整输入特征X对应的课程子轨迹信息初始输出特征Y= (Y1,Y2,Y3,Y4,Y5)，这样每一组（X，Y）作为一条样本数据去对待训练预测模型进行训练，而经过多组样本数据完成训练后，得到最终的预测模型。

在一实施例中，所述待训练预测模型为加入了注意力机制的LSTM模型。

在本实施例中，利用训练神经网络中的LSTM（Long Short-Term Memory）模型，并设计其网络结构为Sequence to Sequence结构（N-M结构），并加入attention机制（即注意力机制），使其记忆能力增强。将上述多个样本数据放入LSTM模型进行学习训练，参数通过网络搜索进行调优，最终得到预测模型。

S140、若接收到当前课程子轨迹信息初始输入特征，获取与所述当前课程子轨迹信息初始输入特征对应的当前课程子轨迹信息调整输入特征，将所述当前课程子轨迹信息调整输入特征输入至预测模型进行运算，得到输出结果。

在本实施例中，某一用户端登录服务器在一段时间内学习了10门课程，这10分课程对应的课程编号组成一个当前课程子轨迹信息初始输入特征，由于每一课程编号是对应一个课程实际特征，可以参照步骤S105中的处理过程获取与所述当前课程子轨迹信息初始输入特征对应的当前课程子轨迹信息调整输入特征。

最后将所述当前课程子轨迹信息调整输入特征输入至预测模型进行运算后，即可得到预测的5门课程编号作为推荐学习轨迹，并作为输出结果输出至该当前课程子轨迹信息初始输入特征对应虚拟对象的接收端。

该方法基于因学习课程而使得虚拟对象级别上升的学习课程轨迹得到样本数据对预测模型进行训练，得到的预测模型能够根据输入的课程轨迹输出推荐学习课程轨迹，因利用深度学习模型能提高预测精准度，而且能学习到更多的特征输入，模型更加的灵活。

本发明实施例还提供一种基于深度学习的资源学习路径规划装置，该基于深度学习的资源学习路径规划装置用于执行前述基于深度学习的资源学习路径规划方法的任一实施例。具体地，请参阅图4，图4是本发明实施例提供的基于深度学习的资源学习路径规划装置的示意性框图。该基于深度学习的资源学习路径规划装置100可以配置于服务器中。

如图4所示，基于深度学习的资源学习路径规划装置100包括：数据标签获取单元110、点击记录采集单元120、预测模型训练单元130、输出结果获取单元140。

数据标签获取单元110，用于若检测到任意用户端上传的学习数据，获取所述学习数据对应的数据标签，将学习数据根据所述数据标签保存至对应的存储区域。

在本实施例中，在本实施例中，任意一个虚拟对象（从广义上理解为任意用户）可使用用户端（例如平板电脑、智能手机等）登录服务器对应的用户交互界面后，上传文本、视频等格式的学习数据，这些学习数据可以在服务器中实现共享从而被其他用户在线观看或是下载观看。

在一实施例中，基于深度学习的资源学习路径规划装置100还包括：

课程实际特征获取单元，用于根据每一学习数据对应的课程时长、课程评论次数、是否收藏属性值，与学习数据对应的课程类型组成各学习数据分别对应的课程实际特征；

课程编号分配单元，用于对每一学习数据随机分配一个唯一的课程编号用于唯一标识学习数据。

点击记录采集单元120，用于实时采集虚拟对象的学习数据点击记录，并存储至虚拟对象数据库；其中，所述虚拟对象数据库中存储有若干条学习数据点击记录，每一条学习数据点击记录对应一条知识学习记录数据。

预测模型训练单元130，用于在虚拟对象数据库中根据预设的筛选条件获取目标数据组成样本集，根据所述样本集中各目标虚拟对象对应的学习记录轨迹进行模型训练，得到预测模型。

在一实施例中，以学习数据为视频类型为例，且学习数据应用于在线培训场景，如图5所示，预测模型训练单元130包括：样本集获取单元101、课程轨迹信息获取单元102、子轨迹信息获取单元103、子轨迹信息划分单元104、调整输入特征获取单元105、待训练预测模型训练单元106。

样本集获取单元101，用于在本地的虚拟对象数据库中根据预设的筛选条件获取目标数据，组成样本集；其中，所述样本集中包括若干个虚拟对象数据集，每一虚拟对象数据集对应一个虚拟对象，每一虚拟对象数据集均包括若干条知识学习记录数据。

在一实施例中，样本集获取单元101包括：

筛选条件解析单元，用于获取所述筛选条件对应的限定时间区间和虚拟对象当前级别上升限定条件；

初始筛选数据集获取单元，用于根据所述限定时间区间在本地的虚拟对象数据库中筛选获取初始筛选数据，组成初始筛选数据集；

虚拟对象数据集获取单元，用于将所述初始筛选数据集中的初始筛选数据根据虚拟对象唯一识别码进行分组，得到与各虚拟对象唯一识别码分别对应的虚拟对象数据集；其中，每一虚拟对象数据集中所包括知识学习记录数据按时间升序排序；

虚拟对象数据集筛选单元，用于根据所述虚拟对象当前级别上升限定条件在与各虚拟对象唯一识别码分别对应的虚拟对象数据集中筛选出满足条件的虚拟对象数据集，组成样本集。

在一实施例中，所述虚拟对象数据集筛选单元，包括：

虚拟对象级别序列获取单元，用于获取各虚拟对象数据集按照季度统计分别对应的虚拟对象当前级别，组成与各虚拟对象数据集对应的虚拟对象级别序列；

虚拟对象级别调整序列获取单元，用于将各虚拟对象级别序列中每一序列值均减去前一位序列值，得到与各虚拟对象数据集分别对应的虚拟对象级别调整序列；其中，各虚拟对象级别调整序列中第一个序列值取0；

上升限定条件判断单元，用于若有虚拟对象级别调整序列中的序列值均为非负数，判定该虚拟对象级别调整序列对应的虚拟对象数据集满足所述虚拟对象当前级别上升限定条件，将该虚拟对象级别调整序列对应的虚拟对象数据集加入样本集。

课程轨迹信息获取单元102，用于获取所述样本集中各虚拟对象数据集对应的知识学习记录数据，组成各虚拟对象数据集分别对应的学习课程名称轨迹信息。

子轨迹信息获取单元103，用于将各学习课程名称轨迹信息按照预设的移动步长和第一划分窗口长度划分为多个课程子轨迹信息。

子轨迹信息划分单元104，用于将各课程子轨迹信息按照预设的第二划分窗口长度划分为课程子轨迹信息初始输入特征，以及课程子轨迹信息初始输出特征。

在一实施例中，子轨迹信息划分单元还用于：

例如，虚拟对象A对应的某一课程子轨迹信息包括15个课程编号，将所述第二划分窗口长度设置为10，则上述15个课程编号中前10个课程编号划分一组组成该课程子轨迹信息对应的课程子轨迹信息初始输入特征，上述15个课程编号中后5个课程编号划分一组组成该课程子轨迹信息对应的课程子轨迹信息初始输出特征。

调整输入特征获取单元105，用于获取各课程子轨迹信息初始输入特征中每一课程编号对应的课程特征，组成与各课程子轨迹信息初始输入特征分别对应的课程子轨迹信息调整输入特征。

待训练预测模型训练单元106，用于将各课程子轨迹信息调整输入特征作为待训练预测模型的输入，并将各课程子轨迹信息调整输入特征对应的课程子轨迹信息初始输出特征作为待训练预测模型的输出，对所述待训练预测模型进行训练，得到预测模型。

输出结果获取单元140，用于若接收到当前课程子轨迹信息初始输入特征，获取与所述当前课程子轨迹信息初始输入特征对应的当前课程子轨迹信息调整输入特征，将所述当前课程子轨迹信息调整输入特征输入至预测模型进行运算，得到输出结果。

该装置基于因学习课程而使得虚拟对象级别上升的学习课程轨迹得到样本数据对预测模型进行训练，得到的预测模型能够根据输入的课程轨迹输出推荐学习课程轨迹，因利用深度学习模型能提高预测精准度，而且能学习到更多的特征输入，模型更加的灵活。

上述基于深度学习的资源学习路径规划装置可以实现为计算机程序的形式，该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6，图6是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图6，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行基于深度学习的资源学习路径规划方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行基于深度学习的资源学习路径规划方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图6中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本发明实施例公开的基于深度学习的资源学习路径规划方法。

本领域技术人员可以理解，图6中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图6所示实施例一致，在此不再赘述。

应当理解，在本发明实施例中，处理器502可以是中央处理单元 (CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路 (Application Specific IntegratedCircuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现本发明实施例公开的基于深度学习的资源学习路径规划方法。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备 ( 可以是个人计算机，服务器，或者网络设备等 ) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U 盘、移动硬盘、只读存储器 (ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于深度学习的资源学习路径规划方法，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的资源学习路径规划方法，其特征在于，所述在虚拟对象数据库中根据预设的筛选条件获取目标数据组成样本集，根据所述样本集中各目标虚拟对象对应的学习记录轨迹进行模型训练，得到预测模型，包括：

在本地的虚拟对象数据库中根据预设的筛选条件获取目标数据，组成样本集；其中，所述样本集中包括若干个虚拟对象数据集，每一虚拟对象数据集对应一个虚拟对象，每一虚拟对象数据集均包括若干条知识学习记录数据；

获取所述样本集中各虚拟对象数据集对应的知识学习记录数据，组成各虚拟对象数据集分别对应的学习课程名称轨迹信息；

将各学习课程名称轨迹信息按照预设的移动步长和第一划分窗口长度划分为多个课程子轨迹信息；

将各课程子轨迹信息按照预设的第二划分窗口长度划分为课程子轨迹信息初始输入特征，以及课程子轨迹信息初始输出特征；

获取各课程子轨迹信息初始输入特征中每一课程编号对应的课程特征，组成与各课程子轨迹信息初始输入特征分别对应的课程子轨迹信息调整输入特征；

将各课程子轨迹信息调整输入特征作为待训练预测模型的输入，并将各课程子轨迹信息调整输入特征对应的课程子轨迹信息初始输出特征作为待训练预测模型的输出，对所述待训练预测模型进行训练，得到预测模型。

3.根据权利要求2所述的基于深度学习的资源学习路径规划方法，其特征在于，所述在本地的虚拟对象数据库中根据预设的筛选条件获取目标数据，组成样本集，包括：

4.根据权利要求3所述的基于深度学习的资源学习路径规划方法，其特征在于，所述根据所述虚拟对象当前级别上升限定条件在与各虚拟对象唯一识别码分别对应的虚拟对象数据集中筛选出满足条件的虚拟对象数据集，组成样本集，包括：

5.根据权利要求2所述的基于深度学习的资源学习路径规划方法，其特征在于，所述将各学习课程名称轨迹信息按照预设的移动步长和第一划分窗口长度划分为多个课程子轨迹信息，包括：

6.根据权利要求2所述的基于深度学习的资源学习路径规划方法，其特征在于，所述待训练预测模型为加入了注意力机制的LSTM模型。

7.根据权利要求1所述的基于深度学习的资源学习路径规划方法，其特征在于，所述若检测到任意用户端上传的学习数据，获取所述学习数据对应的数据标签，将学习数据根据所述数据标签保存至对应的存储区域之后，还包括：

8.一种基于深度学习的资源学习路径规划装置，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于深度学习的资源学习路径规划方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于深度学习的资源学习路径规划方法。