CN113822776B

CN113822776B - 课程推荐方法、装置、设备及存储介质

Info

Publication number: CN113822776B
Application number: CN202111149531.3A
Authority: CN
Inventors: 王蓉
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2023-11-03
Anticipated expiration: 2041-09-29
Also published as: CN113822776A

Abstract

本发明涉及人工智能领域，公开了一种课程推荐方法、装置、设备及存储介质。所述方法包括：获取用户数据集和历史观看数据集，并对其进行预处理，得到训练数据集和预测数据集；调用网络模型，计算多分类概率分布；构建正则项损失函数，并将正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，进而计算多分类概率分布的损失值；根据该损失值，调整网络模型的参数以得到课程推荐模型；调用课程推荐模型，对预测数据集进行处理，得到预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频。本发明通过构建正则项损失函数，从而解耦用户潜在的多个维度的兴趣面，进而提升模型预测的准确性。

Description

课程推荐方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及一种课程推荐方法、装置、设备及存储介质。

背景技术

课程推荐的目的是估计用户学习该课程的可能性，为用户推荐用户感兴趣的课程，从而降低平台用户的流失率，它已成为在线教育平台课程推荐系统中的核心任务之一。对于在线教育平台的课程推荐模型，有必要捕获用户行为数据背后的潜在用户兴趣。

现有课程的推荐方法，其准确性较低，推荐的课程与历史课程相似度较高，长时间推荐同一类型的课程并不能满足用户需求。

发明内容

本发明的主要目的在于解决现有课程推荐方法准确性低的问题。

本发明第一方面提供了一种课程推荐方法，包括：

获取用户数据集和历史观看数据集，其中，所述用户数据集中包括多个用户的个人信息，所述历史观看数据集中包括每个所述用户历史观看的课程视频信息；

对所述用户数据集和所述历史观看数据集进行预处理，得到训练数据集和预测数据集；

调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；

构建正则项损失函数，并将所述正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于所述目标总损失函数，计算所述多分类概率分布对应的损失值，其中，所述正则项损失函数用于建立用户与多个候选课程视频之间关系表达，所述候选课程视频为用户可能感兴趣的课程视频；

根据所述多分类概率分布对应的损失值，调整所述网络模型的网络参数，得到课程推荐模型；

调用所述课程推荐模型，对所述预测数据集进行处理，得到所述预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，所述目标课程视频被点击观看的概率大于预设阈值。

可选的，在本发明第一方面的第一种实现方式中，所述对所述用户数据集和所述历史观看数据集进行预处理，得到训练数据集和预测数据集包括：

基于预设的卷积神经网络，分别对所述用户数据集和所述历史观看数据集进行特征提取，得到每个用户的个人信息向量和观看课程向量；

调用所述卷积神经网络中的全连接层，将每个用户的个人信息向量和观看课程向量进行拼接，得到多个用户样本向量；

基于预设的划分比例，将所述用户样本向量划分为训练用户样本向量和预测用户样本向量；

分别基于所述训练用户样本向量和所述预测用户样本向量，构建训练数据集和预测数据集。

可选的，在本发明第一方面的第二种实现方式中，所述调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布包括：

调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量；

调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量；

调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布，其中，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率。

可选的，在本发明第一方面的第三种实现方式中，所述训练样本的特征向量包括离散特征向量和连续特征向量，在所述调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量之后，在所述调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量之前，还包括：

调用所述网络模型中的嵌入层网络，对所述离散特征向量和所述连续特征向量进行降维处理。

可选的，在本发明第一方面的第四种实现方式中，所述隐藏层网络中包括因子分解网络和深度神经网络，所述调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量包括：

调用所述因子分解网络，对所述离散特征向量进行特征交叉，得到交叉特征向量，其中，所述交叉向量用于表示离散特征向量之间的关联关系；

调用所述深度神经网络，对所述连续特征向量进行非线性激活，得到目标特征向量。

可选的，在本发明第一方面的第五种实现方式中，所述输出层网络中包括多分类器，所述调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布包括：

调用所述多分类器，分别对所述交叉特征向量和所述目标特征向量进行平均，得到平均特征向量，并根据预设的得分函数，计算所述平均特征向量对应的多个初始分类得分；

基于预设的扩散函数，对每个初始分类得分进行值扩散，得到多个目标分类得分；

对每个目标分类得分进行归一化处理，得到多分类概率分布，其中，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率。

可选的，在本发明第一方面的第六种实现方式中，所述根据所述多分类概率分布对应的损失值，调整所述网络模型的网络参数，得到课程推荐模型包括：

将所述多分类概率分布对应的损失值输入至所述网络模型中；

根据所述多分类概率分布对应的损失值和随机梯度下降算法，对所述网络模型的网络参数进行迭代更新，直至所述网络模型收敛，确定当前的网络参数为目标参数，得到课程推荐模型。

本发明第二方面提供了一种课程推荐装置，包括：

数据获取模块，用于获取用户数据集和历史观看数据集，其中，所述用户数据集中包括多个用户的个人信息，所述历史观看数据集中包括每个所述用户历史观看的课程视频信息；

数据预处理模块，用于对所述用户数据集和所述历史观看数据集进行预处理，得到训练数据集和预测数据集；

模型计算模块，用于调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；

损失值计算模块，用于构建正则项损失函数，并将所述正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于所述目标总损失函数，计算所述多分类概率分布对应的损失值，其中，所述正则项损失函数用于建立用户与多个候选课程视频之间关系表达，所述候选课程视频为用户可能感兴趣的课程视频；

参数调整模块，用于根据所述多分类概率分布对应的损失值，调整所述网络模型的网络参数，得到课程推荐模型；

模型预测模块，用于调用所述课程推荐模型，对所述预测数据集进行处理，得到所述预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，所述目标课程视频被点击观看的概率大于预设阈值。

可选的，在本发明第二方面的第一种实现方式中，所述数据获取模块具体包括：

特征提取单元，用于基于预设的卷积神经网络，分别对所述用户数据集和所述历史观看数据集进行特征提取，得到每个用户的个人信息向量和观看课程向量；

向量拼接单元，用于调用所述卷积神经网络中的全连接层，将每个用户的个人信息向量和观看课程向量进行拼接，得到多个用户样本向量；

样本划分单元，用于基于预设的划分比例，将所述用户样本向量划分为训练用户样本向量和预测用户样本向量；

数据集构建单元，用于分别基于所述训练用户样本向量和所述预测用户样本向量，构建训练数据集和预测数据集。

可选的，在本发明第二方面的第二种实现方式中，所述模型计算模块具体包括：

数据编码单元，用于调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量；

特征学习单元，用于调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量；

概率计算单元，用于调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布，其中，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率。

可选的，在本发明第二方面的第三种实现方式中，模型计算模块具体包括：

向量降维单元，用于调用所述网络模型中的嵌入层网络，对所述离散特征向量和所述连续特征向量进行降维处理；

可选的，在本发明第二方面的第四种实现方式中，所述特征学习单元具体用于：

可选的，在本发明第二方面的第五种实现方式中，所述概率计算单元具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述参数调整模块具体包括：

输入单元，用于将所述多分类概率分布对应的损失值输入至所述网络模型中；

更新单元，用于根据所述多分类概率分布对应的损失值和随机梯度下降算法，对所述网络模型的网络参数进行迭代更新，直至所述网络模型收敛，确定当前的网络参数为目标参数，得到课程推荐模型。

本发明第三方面提供了一种课程推荐设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述课程推荐设备执行上述的课程推荐方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的课程推荐方法。

本发明提供的技术方案中，通过获取用户数据集和历史观看数据集，并对其进行预处理，从而得到训练数据集和预测数据集，其次通过预设的网络模型来计算计算训练数据集中每个课程视频被点击观看的概率，然后构建一个正则项函数来作为预设推荐损失函数的辅助函数，从而构建目标总损失函数，并通过该总损失函数来调整网络模型的参数，得到课程推荐模型，最后调用该课程推荐模型处理预测数据集中的数据，并输出目标课程视频。本发明通过引入一个正则项损失函数，从而解耦用户潜在的多个维度的兴趣面，使其更关注于用户与多个兴趣视频之间的关系表达，进而提升模型预测的准确性。

附图说明

图1为本发明实施例中课程推荐方法的第一个实施例示意图；

图2为本发明实施例中课程推荐方法的第二个实施例示意图；

图3为本发明实施例中课程推荐方法的第三个实施例示意图；

图4为本发明实施例中课程推荐方法的第四个实施例示意图；

图5为本发明实施例中课程推荐装置的一个实施例示意图；

图6为本发明实施例中课程推荐装置的另一个实施例示意图；

图7为本发明实施例中课程推荐设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种课程推荐方法、装置、设备及存储介质，监控效率更高。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本发明中的服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中课程推荐方法的一个实施例包括：

101、获取用户数据集和历史观看数据集，其中，用户数据集中包括多个用户的个人信息，历史观看数据集中包括每个用户历史观看的课程视频信息；

可以理解的是，用户的个人信息可包括用户的姓名、用户的年龄、用户的性别等信息，在本实施例并不做限定。历史观看数据集中包括每个用户在预设的时间跨度内观看的课程视频信息集合(例如包括课程视频的名称和课程视频的简介)，时间跨度在本实施例并不做限定，例如预设的时间跨度为两年，则历史观看数据集中包括每个用户在过去两年内观看的课程视频信息集合。

102、对用户数据集和历史观看数据集进行预处理，得到训练数据集和预测数据集；

可以理解的是，预处理即将历史用户数据集和历史观看数据集进行数据整合，并按照一定的数据划分比例将数据整合后得到的数据划分为两部分，将一部分作为模型的训练数据集，用于训练模型，另一部分则作为模型的预测数据集，用于预测(推荐)用户感兴趣的课程。

具体的，服务器首先基于预设的卷积神经网络，分别对用户数据集和历史观看数据集进行特征提取，得到每个用户的个人信息向量和观看课程向量，卷积神经网络(Convolutional Neural Networks，CNN)可采用LeNet、AlexNet、VGG等，本实施例对其并不做限定，其中，卷积神经网络中输入的为文本数据，对应的卷积处理即为一维卷积。

其次将每个用户的个人信息向量和观看课程向量输入至卷积神经网络中的全连接层网络中进行拼接，从而得到多个用户样本向量；

然后基于预设的划分比例，将用户样本向量划分为训练用户样本向量和预测用户样本向量，预设的划分比例基于业务需求决定，例如业务需求中要求80％的样本数据作为训练用户样本向量，构建训练数据集，用于模型的训练，剩下的20％样本数据则作为预测用户样本向量，构建预测数据集，用于模型的预测；最后基于训练用户样本向量和预测用户样本向量，构建训练数据集和预测数据集。

103、调用预设的网络模型，计算训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；

应当理解的是，在本实施例中，该预测模型采用深度因子分解机模型(DeepFactorization Machines，DeepFM)，该模型主要由因子分解机(Factorization Machines，FM)和深度神经网络(Deep Neural Networks，DNN)两部分组成，其中DNN网络作为该预测模型的主干网络，FM网络作为辅助网络，两者共享同样的输入层，从而同时学习低阶和高阶的特征交叉过程，最后将DNN网络与FM网络的输出向量及其权重输入至该预测模型的全连接层中，从而计算出每个课程视频被点击观看的概率。

104、构建正则项损失函数，并将正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于目标总损失函数，计算多分类概率分布对应的损失值，其中，正则项损失函数用于建立用户与多个候选课程视频之间关系表达，候选课程视频为用户可能感兴趣的课程视频；

可以理解的是，为避免过度拟合用户与其历史观看视频之间的关系，服务器构建一个正则项损失函数L2作为模型损失函数L1(即推荐损失函数)的辅助函数，从而解耦用户潜在的多个维度的兴趣面，使其更关注于多个用户与多个兴趣视频之间的关系表达，其中，推荐损失函数L1请参考公式一：

L1＝-yln(z)+(1-y)ln(1-z)

公式一

正则项损失函数L2请参考公式二：

目标总损失函数L3请参考公式三：

L3＝∑_t∈T((1-θ)L1+θL2)

公式三

其中，y和z为两个不同的用户，k为用户可能感兴趣视频的个数，T为模型训练次数，θ为预设的值，用于平衡L1函数和L2函数。

105、根据多分类概率分布对应的损失值，调整网络模型的网络参数，得到课程推荐模型；

可以理解的是，多分类概率分布的损失值大小用于表示预测结果与实际结果之间的误差，当损失值越小时，表示预测结果越准确。服务器根据该损失值大小，迭代调整模型的网络参数，然后再次进行训练及计算对应的损失值，直至模型收敛时，确定效果最优的网络参数，从而得到课程推荐模型。

具体的，服务器将将所述多分类概率分布对应的损失值输入至所述预测模型中，将损失值从预测模型的输出层向隐藏层反向传播，直至传播到该预测模型的输入层。在反向传播的过程中，根据损失值，随机选取一个点方向作梯度下降，并根据梯度下降的结果，对模型输入层和隐藏层中特征向量的权重进行迭代更新，每一次权重更新后重新计算对应的多分类概率分布及其损失值，直至模型收敛时，例如当损失值小于预设的阈值时，确定当前网络参数为目标参数，得到课程推荐模型。

106、调用课程推荐模型，对预测数据集进行处理，得到预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，目标课程视频被点击观看的概率大于预设阈值。

可以理解的是，服务器对课程推荐模型进行参数初始化后，将预测数据集输入至该模型中，经过输入层的特征提取及多层感知网络(MLP)对其计算后，得到预测数据集对应的课程点击观看概率分布T，例如T＝[“深度学习”：0.6，“离散数学”：0.35，“线性代数”：0.55，“数据分析”：0.25]，预设阈值为0.5，将课程名称“深度学习”和“线性代数”作为目标课程视频进行输出，推荐给相应的用户。

本实施例中，通过引入一个正则项损失函数，从而来解耦用户潜在的多个维度的兴趣面，使其更关注于用户与多个兴趣视频之间的关系表达，进而提升模型预测的准确性。

参阅图2，本发明实施例中课程推荐方法的第二个实施例包括：

201、获取用户数据集和历史观看数据集，其中，用户数据集中包括多个用户的个人信息，历史观看数据集中包括每个用户历史观看的课程视频信息；

202、对用户数据集和历史观看数据集进行预处理，得到训练数据集和预测数据集；

其中，步骤201-202与上述步骤101-102的执行步骤类似，具体此处不再赘述。

203、调用网络模型中的输入层网络，对训练数据集的每条数据进行编码，得到训练样本的特征向量；

可以理解的是，输入层网络中主要包括多层翻译网络(Transformer)，Transformer在结构上包括编码器(Encoder)和解码器(Decoder)，分别用于编码和解码，服务器将数据输入该预测模型的输入层，并调用输入层中的Transformer网络，对样本数据进行快速编码(包括字嵌入、段落嵌入、位置编码等)，从而将文本数据翻译为模型能够识别的特征向量，值得一提的是，在编码过程中，Transformer中引入自注意力机制，通过该自注意力机制学习前后相邻节点的权重，从而学习多个用户的兴趣之间的潜在关联关系。

可选的，在一较佳的实施例中，为提升模型的计算速度，该预测模型的输入层和隐藏层之间还引入一个嵌入层，服务器通过调用该嵌入层对高维稀疏的离散特征向量、连续特征向量进行降维处理(即调用一个1*1大小的卷积核与其做乘法运算)，从而将其压缩为稠密的低维向量。

204、调用网络模型中的隐藏层网络，并基于训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量；

可以理解的是，模型的隐藏层网络中包括主干网络(DNN网络)和辅助网络(FM网络)，服务器通过调用主干网络来学习连续特征向量中非线性分布的数据特征，例如视频简介所属的视频名称、视频名称对应的用户个人信息等等，从而尽可能地将用户、视频等信息以及它们之间的关系引入到新的向量表示中，同时，利用辅助网络来提取离散特征向量之间的特征关联关系，例如视频名称与观看次数，其中视频名称为文本型，而观看次数为数值型，常规情况下模型无法识别这两个特征之间的关系，此情况下可利用该辅助网络，提取两者之间的关联关系。

205、调用网络模型中的输出层网络，对交叉特征向量和目标特征向量进行计算，得到多分类概率分布，其中，多分类概率分布用于表示训练数据集中的每个课程视频被点击观看的概率；

可以理解的是，服务器将DNN网络输出的连续特征向量和FM网络输出的交叉特征向量输入至模型的输出层网络中，并基于一个多分类器，将其映射到(0,1)数值区间内，即一个多分类的概率分布。

206、构建正则项损失函数，并将正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于目标总损失函数，计算多分类概率分布对应的损失值，其中，正则项损失函数用于建立用户与多个候选课程视频之间关系表达，候选课程视频为用户可能感兴趣的课程视频；

207、根据多分类概率分布对应的损失值，调整网络模型的网络参数，得到课程推荐模型；

208、调用课程推荐模型，对预测数据集进行处理，得到预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，目标课程视频被点击观看的概率大于预设阈值。

其中，步骤206-208与上述步骤104-106的执行步骤类似，具体此处不再赘述。

本实施例中，详细描述网络模型计算多分类概率分布的过程，通过对数据特征进行量化表达后进行数学计算，从而准确预测每个课程视频被点击观看的概率。

参阅图3，本发明实施例中课程推荐方法的第三个实施例包括：

301、获取用户数据集和历史观看数据集，其中，用户数据集中包括多个用户的个人信息，历史观看数据集中包括每个用户历史观看的课程视频信息；

302、对用户数据集和历史观看数据集进行预处理，得到训练数据集和预测数据集；

303、调用网络模型中的输入层网络，对训练数据集的每条数据进行编码，得到训练样本的特征向量，其中，训练样本的特征向量包括离散特征向量和连续特征向量；

其中，步骤301-303与上述步骤201-203的执行步骤类似，具体此处不再赘述。

304、调用网络模型中的因子分解网络，对离散特征向量进行特征交叉，得到交叉特征向量，其中，交叉向量用于表示离散特征向量之间的关联关系；

可以理解的是，服务器通过该预测模型中的因子分解网络，对每个离散特征向量进行特征交叉处理，从而提取离散型训练样本之间的关联关系。对于离散型的特征而言，其特征交叉即对应的求笛卡尔积，具体的，例如存在离散型训练样本A和离散型训练样本B，该离散型训练样本A存在3个特征向量，分别为a1，a2，a3，该离散型训练样本B存在2个特征向量，分别为b1，b2，对其做特征交叉，可以得到6个新的特征向量，分别为a1_b1，a1_b2，a2_b1，a2_b2，a3_b1，a3_b2。

305、调用网络模型中的深度神经网络，对连续特征向量进行非线性激活，得到目标特征向量；

可以理解的是，每个连续特征向量中的数据既有线性的分布，也有非线性的分布，服务器通过深度神经网络对每个连续特征向量进行非线性激活，具体的，通过预设的激活函数(如Relu函数)对连续特征向量进行非线性变化，从而学习更多的特征表达。

306、调用网络模型中的输出层网络，对交叉特征向量和目标特征向量进行计算，得到多分类概率分布，其中，多分类概率分布用于表示训练数据集中的每个课程视频被点击观看的概率；

307、构建正则项损失函数，并将正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于目标总损失函数，计算多分类概率分布对应的损失值，其中，正则项损失函数用于建立用户与多个候选课程视频之间关系表达，候选课程视频为用户可能感兴趣的课程视频；

308、根据多分类概率分布对应的损失值，调整网络模型的网络参数，得到课程推荐模型；

309、调用课程推荐模型，对预测数据集进行处理，得到预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，目标课程视频被点击观看的概率大于预设阈值。

其中，步骤306-309与上述步骤205-208的执行步骤类似，具体此处不再赘述。

本实施例中，详细描述了特征学习的过程，通过对样本数据进行特征交叉和非线性变化，从而从非结构化的数据样本中提取结构化的数据特征，并根据提取到的结构化的数据特征计算相应概率，进而提高预测的准确性。

参阅图4，本发明实施例中课程推荐方法的第四个实施例包括：

401、获取用户数据集和历史观看数据集，其中，用户数据集中包括多个用户的个人信息，历史观看数据集中包括每个用户历史观看的课程视频信息；

402、对用户数据集和历史观看数据集进行预处理，得到训练数据集和预测数据集；

403、调用网络模型中的输入层网络，对训练数据集的每条数据进行编码，得到训练样本的特征向量；

404、调用网络模型中的隐藏层网络，并基于训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量；

其中，步骤401-404与上述步骤201-204的执行步骤类似，具体此处不再赘述。

405、调用多分类器，分别对交叉特征向量和目标特征向量进行平均，得到平均特征向量，并根据预设的得分函数，计算平均特征向量对应的多个初始分类得分；

应当理解的是，本实施例中采用的多分类器为Softmax分类器，服务器首先将包含离散数据之间的交叉关系的交叉特征向量，以及包含连续数据中线性分布和非线性分布的目标特征向量求和后，计算对应的平均向量；其次，根据分类器中预设的得分函数，计算该平均向量在不同情况下(多个分类标签，此处为课程名称标签)的多个初始分类得分(即课程名称标签—初始分类得分之间的分布T)，例如T＝[A:3.2，B:5.1，C:-1.7]，其中，A、B、C均为课程名称。

406、基于预设的扩散函数，对每个初始分类得分进行值扩散，得到多个目标分类得分；

可以理解的是，平均向量对应的多个初始分类得分之间的数据离散度较小，服务器通过预设的扩散函数，例如exp函数(求初始分类得分的e的x幂，e为欧拉数，即一个无限不循环小数，x为该初始分类得分)将其进行值扩散(数值的扩大)，当得分越大时，其数据离散度越大，结果愈加明显，例如将分布T进行值扩散，得到分布X＝[A:，B:，C:]，即X＝[A:24.5，B:164.0，C:0.18]。

407、对每个目标分类得分进行归一化处理，得到多分类概率分布，其中，多分类概率分布用于表示训练数据集中的每个课程视频被点击观看的概率；

可以理解的是，归一化处理(Normalize)的目的在于将数据映射为0至1之间的小数(即一个概率)，例如对分布X进行归一处理，通过将分布X中的每个目标分类得分进行求和，得到总得分，然后计算每个分类得分与总得分之间的比例，得到多分类概率分布Z＝[A:0.13，B:0.87，C:0.00]。

408、构建正则项损失函数，并将正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于目标总损失函数，计算多分类概率分布对应的损失值，其中，正则项损失函数用于建立用户与多个候选课程视频之间关系表达，候选课程视频为用户可能感兴趣的课程视频；

409、根据多分类概率分布对应的损失值，调整网络模型的网络参数，得到课程推荐模型；

410、调用课程推荐模型，对预测数据集进行处理，得到预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，目标课程视频被点击观看的概率大于预设阈值。

其中，步骤408-410与上述步骤206-208的执行步骤类似，具体此处不再赘述。

本实施例中，详细描述了计算多分类概率分布的过程，通过分类器计算平均向量的得分，并将其归一化至0至1的区间内，从而将分析问题转换为概率问题。

上面对本发明实施例中课程推荐方法进行了描述，下面对本发明实施例中课程推荐装置进行描述，请参阅图5，本发明实施例中课程推荐装置的一个实施例包括：

数据获取模块501，用于获取用户数据集和历史观看数据集，其中，所述用户数据集中包括多个用户的个人信息，所述历史观看数据集中包括每个所述用户历史观看的课程视频信息；

数据预处理模块502，用于对所述用户数据集和所述历史观看数据集进行预处理，得到训练数据集和预测数据集；

模型计算模块503，用于调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；

损失值计算模块504，用于构建正则项损失函数，并将所述正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于所述目标总损失函数，计算所述多分类概率分布对应的损失值，其中，所述正则项损失函数用于建立用户与多个候选课程视频之间关系表达，所述候选课程视频为用户可能感兴趣的课程视频；

参数调整模块505，用于根据所述多分类概率分布对应的损失值，调整所述网络模型的网络参数，得到课程推荐模型；

模型预测模块506，用于调用所述课程推荐模型，对所述预测数据集进行处理，得到所述预测数据集中每个课程视频被点击观看的概率，并输出目标课程视频，其中，所述目标课程视频被点击观看的概率大于预设阈值。

参阅图6，本发明实施例中课程推荐装置的另一个实施例包括：

其中，所述数据预处理模块502具体包括：

特征提取单元5021，用于基于预设的卷积神经网络，分别对所述用户数据集和所述历史观看数据集进行特征提取，得到每个用户的个人信息向量和观看课程向量；

向量拼接单元5022，用于调用所述卷积神经网络中的全连接层，将每个用户的个人信息向量和观看课程向量进行拼接，得到多个用户样本向量；

样本划分单元5023，用于基于预设的划分比例，将所述用户样本向量划分为训练用户样本向量和预测用户样本向量；

数据集构建单元5024，用于分别基于所述训练用户样本向量和所述预测用户样本向量，构建训练数据集和预测数据集。

其中，所述模型计算模块503具体包括：

数据编码单元5031，用于调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量；

特征学习单元5032，用于调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量；

概率计算单元5033，用于调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布，其中，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率。

其中，所述参数调整模块505具体包括：

输入单元5051，用于将所述多分类概率分布对应的损失值输入至所述网络模型中；

更新单元5052，用于根据所述多分类概率分布对应的损失值和随机梯度下降算法，对所述网络模型的网络参数进行迭代更新，直至所述网络模型收敛，确定当前的网络参数为目标参数，得到课程推荐模型。

本发明实施例中，模块化的设计让课程推荐装置各部位的硬件专注于某一功能的实现，最大化实现了硬件的性能，同时模块化的设计也降低了装置的模块之间的耦合性，更加方便维护。

上面图5和图6从模块化功能实体的角度对本发明实施例中的课程推荐装置进行详细描述，下面从硬件处理的角度对本发明实施例中课程推荐设备进行详细描述。

图7是本发明实施例提供的一种课程推荐设备的结构示意图，该课程推荐设备700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)710(例如，一个或一个以上处理器)和存储器720，一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中，存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对课程推荐设备700中的一系列指令操作。更进一步地，处理器710可以设置为与存储介质730通信，在课程推荐设备700上执行存储介质730中的一系列指令操作。

课程推荐设备700还可以包括一个或一个以上电源740，一个或一个以上有线或无线网络接口750，一个或一个以上输入输出接口760，和/或，一个或一个以上操作系统731，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图7示出的课程推荐设备结构并不构成对课程推荐设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种课程推荐设备，所述课程推荐设备包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述各实施例中的所述课程推荐方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述课程推荐方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种课程推荐方法，其特征在于，所述课程推荐方法包括：

调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；所述调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布包括：

调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量，输入层网络中主要包括多层翻译网络，服务器将数据输入至输入层网络，输入层网络中引入自注意力机制，通过自注意力机制学习前后相邻节点的权重；

调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量，隐藏层网络中包括主干网络和辅助网络，通过调用主干网络来学习连续特征向量中非线性分布的数据特征，通过调用辅助网络来提取离散特征向量之间的特征关联关系，连续特征向量中包括视频简介所属的视频名称和视频名称对应的用户个人信息，离散特征向量中包括视频名称与观看次数；

调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率；

2.根据权利要求1所述的课程推荐方法，其特征在于，所述对所述用户数据集和所述历史观看数据集进行预处理，得到训练数据集和预测数据集包括：

3.根据权利要求1所述的课程推荐方法，其特征在于，所述训练样本的特征向量包括离散特征向量和连续特征向量，在所述调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量之后，在所述调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量之前，还包括：

4.根据权利要求3所述的课程推荐方法，其特征在于，所述隐藏层网络中包括因子分解网络和深度神经网络，所述调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量包括：

调用所述因子分解网络，对所述离散特征向量进行特征交叉，得到交叉特征向量，其中，所述交叉特征向量用于表示离散特征向量之间的关联关系；

5.根据权利要求1所述的课程推荐方法，其特征在于，所述输出层网络中包括多分类器，所述调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布包括：

6.根据权利要求1-5中任意一项所述的课程推荐方法，其特征在于，所述根据所述多分类概率分布对应的损失值，调整所述网络模型的网络参数，得到课程推荐模型包括：

7.一种课程推荐装置，其特征在于，所述课程推荐装置包括：

模型计算模块，用于调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布；所述调用预设的网络模型，计算所述训练数据集中的每个课程视频被点击观看的概率，得到多分类概率分布包括：调用所述网络模型中的输入层网络，对所述训练数据集的每条数据进行编码，得到训练样本的特征向量，输入层网络中主要包括多层翻译网络，服务器将数据输入至输入层网络，输入层网络中引入自注意力机制，通过自注意力机制学习前后相邻节点的权重；调用所述网络模型中的隐藏层网络，并基于所述训练样本的特征向量，进行特征学习，得到交叉特征向量和目标特征向量，隐藏层网络中包括主干网络和辅助网络，通过调用主干网络来学习连续特征向量中非线性分布的数据特征，通过调用辅助网络来提取离散特征向量之间的特征关联关系，连续特征向量中包括视频简介所属的视频名称和视频名称对应的用户个人信息，离散特征向量中包括视频名称与观看次数；调用所述网络模型中的输出层网络，对所述交叉特征向量和所述目标特征向量进行计算，得到多分类概率分布，所述多分类概率分布用于表示所述训练数据集中的每个课程视频被点击观看的概率；损失值计算模块，用于构建正则项损失函数，并将所述正则项损失函数作为预设推荐损失函数的辅助函数，得到目标总损失函数，并基于所述目标总损失函数，计算所述多分类概率分布对应的损失值，其中，所述正则项损失函数用于建立用户与多个候选课程视频之间关系表达，所述候选课程视频为用户可能感兴趣的课程视频；

8.一种课程推荐设备，其特征在于，所述课程推荐设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述课程推荐设备执行如权利要求1-6中任意一项所述的课程推荐方法。

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-6中任一项所述的课程推荐方法。