CN109800822A

CN109800822A - 相似课程的确定方法、装置、设备和存储介质

Info

Publication number: CN109800822A
Application number: CN201910101713.XA
Authority: CN
Inventors: 于莹; 朱孟阳; 王海娟; 秦梦霖; 罗金平
Original assignee: Beijing Calorie Information Technology Co Ltd
Current assignee: Beijing Calorie Information Technology Co Ltd
Priority date: 2019-01-31
Filing date: 2019-01-31
Publication date: 2019-05-24

Abstract

本发明公开了一种相似课程的确定方法、装置、设备和存储介质。获取至少两门课程的特征向量；根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵；基于所述课程相似矩阵确定相似课程。本发明实施例提供了一种相似课程的确定方法，通过使用课程特征向量计算课程相似度确定相似课程，可提高相似课程的确定效率，降低用户选择相似课程时的识别困难问题。

Description

相似课程的确定方法、装置、设备和存储介质

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种相似课程的确定方法、装置、设备和存储介质。

背景技术

近年来，健身风潮频起，民众关注度逐年上升，另外由于国内移动互联网技术进步和AR/VR技术的兴起，智能手机硬件升级迅速，具备多种传感器，越来越多的软件开发者将目光转向健身软件领域。

目前健身软件产品中，用户使用软件进行健身课程探索时，主要使用推荐、专题和属性筛选等方式进行探索，但是由于健身课程专业程度较高，不同课程之间的关系多种多样，用户在选择相似课程时会出现课程体系和课程逻辑识别的困难，用户很难发现满意的相似课程。

发明内容

本发明提供一种相似课程的确定方法，以实现高效确定相似课程，降低用户相似课程的识别困难。

第一方面，本发明实施例提供了一种相似课程的确定方法，包括：

获取至少两门课程的特征向量；

根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵；

基于所述课程相似矩阵确定相似课程。

第二方面，本发明实施例还提供了一种相似课程的确定装置，包括：

特征向量获取模块，用于获取至少两门课程的特征向量；

相似矩阵生成模块，用于根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵；

相似课程确定模块，用于基于所述课程相似矩阵确定相似课程。

第三方面，本发明实施例还提供了一种设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例中任一所述的相似课程的确定方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本发明实施例中任一所述的相似课程的确定方法。

本发明通过获取各课程的特征向量，根据对应课程的特征向量确定每两门课程间的相似度，并将该相似度生成课程相似矩阵，基于课程相似矩阵确定相似课程，解决了相似课程的确定问题，提高相似课程的确定效率，降低用户识别相似课程的困难度。

附图说明

图1是本发明实施例一提供的一种相似课程的确定方法的流程图；

图2是本发明实施例二提供的一种相似课程的确定方法的流程图；

图3是本发明实施例二提供的一种相似课程的展示效果示意图；

图4为本发明实施例二提供的确定目标结果矩阵的实现流程图；

图5是本发明实施例三提供的一种相似课程的确定装置的结构示意图；

图6是本发明实施例四提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的一种相似课程的确定方法的流程图，本实施例可适用于确定相似课程得情况，该方法可以由相似课程的确定装置来执行，具体包括如下步骤：

步骤101、获取至少两门课程的特征向量。

其中，课程可以是健身课程，可选的，课程还可以包括语言课程和演讲课程等学习课程，特征向量可以是用于表征课程具体的数据组成的向量，特征具体可以包括课程名、时长、课程难度和用户评分等。

具体的，可以获取存储的各课程的相关信息，提取信息中表征课程特征的参数，将提取到的对应各课程的参数组成特征向量。

步骤102、根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵。

其中，课程相似度可以是根据课程向量计算出来的相似度，计算课程相似度可以包括计算余弦相似度、欧几里得距离、曼哈顿距离和明可夫斯距离等；课程相似矩阵可以是存放课程相似度的矩阵，矩阵中每列或者每行对应一门课程，例如，课程相似矩阵中第一列对应肌肉拉伸课程，则第一列中的相似度为肌肉拉伸课程与其他课程的相似度。

具体的，可以使用获得的对应各课程的特征向量，每两门课程计算一个课程的相似度，可以将生成的相似度存放在矩阵中作为课程相似矩阵。

步骤103、基于所述课程相似矩阵确定相似课程。

其中，相似课程可以是通过计算得到的相似课程的集合。

具体的，可以获取到课程相似矩阵中存储的各课程间的相似度值，根据各课程间的相似度值确定不同课程之间的相似关系；还可以使用包括主成分分析法、局部线性嵌入法和拉普拉斯特征映射法等降维方法处理课程相似矩阵，使得课程相似矩阵的维度降低，并可视化维度降低后的课程相似矩阵，根据可视化矩阵获取确定相似课程所属的集合，示例性的，可以将降维后的课程相似矩阵的一行或者一列的数值作为可视化图像的坐标点，可以使用不同图像标识不同的课程。

本发明实施例通过获取各课程存储的数据，提取其中的特征向量，根据特征向量两两确定课程相似度并将生成的课程相似度组成课程相似矩阵，根据课程相似矩阵确定相似课程，解决了相似课程的确定问题，降低了用户识别相似课程的难度，可提高相似课程识别效率。

实施例二

图2是本发明实施例二提供的一种相似课程的确定方法的流程图。本发明实施例是在上述实施例的基础上，提出的一种可选方案，参见图2，本发明实施例提供的相似课程的确定方法包括：

步骤201、获取至少两门课程的课程信息和用户参与信息表。

其中，课程信息可以是数据库中各课程存储的信息，包括课程难度、时长、肌肉点和卡路里等基本信息，用户参与信息表可以是存储课程参与的相关信息的数据表，用户参与信息表存储的信息可以包括课程完成人数、课程退出人数、参与课程总人数和课程反馈值等。

具体的，可以获取存储的课程相关的程难度、时长、肌肉点和卡路里等基本信息和存储有课程完成人数、课程退出人数、参与课程总人数和课程反馈值等信息的用户参与信息表。

步骤202、基于各所述课程的课程信息，提取各所述课程的课程难度、时长、肌肉点和卡路里数据作为相应的静态特征值。

其中，课程难度可以是参与课程训练的难度，可以通过评分或者星级进行分级，时长可以是课程训练所需的时间长短，肌肉点可以是参与课程训练能够锻炼的肌肉部位，卡路里可以是参与课程训练消耗的卡路里消耗值，静态特征值可以是课程信息中不会发生变换的参数值，例如课程唯一标识号等。

具体的，可以基于获取到的各课程的课程信息，提取对应各课程的课程难度、时长、肌肉点和卡路里数据作为静态特征值，提取静态特征值的方式可以包括字符匹配和SQL语句等。

步骤203、基于各所述课程的用户参与信息表，统计各所述课程的完成率、退出率和用户反馈值并作为相应的动态特征值。

其中，完成率可以是完成对应课程训练人数占全部参与课程人数的比率，退出率可以是未完成对应课程训练人数占全部参与课程人数的比率，用户反馈值可以是所有用户对课程评分的平均值或加权平均值，动态特征值可是课程信息中随着时间变化会产生变换的课程参数，例如课程参与人数等，用户反馈值可以是用户对课程的反馈评价值，例如用户课程评分和用户评价信息等。

具体的，可以获取存储在用户参与信息表中对应各课程的用户参与信息，统计出对应各课程的完成率、退出率和用户反馈值等数据，将统计得到的完成率、退出率和用户反馈值作为对应课程的动态特征值。

步骤204、合并各所述课程的静态特征值和动态特征值，形成各所述课程的特征向量。

其中，特征向量可以是对应课程的特征值的集合。

具体的，可以将获取到的静态特征值和动态特征值，按照固定顺序排列生成对应课程的特征向量。

步骤205、针对每门课程，基于各所述特征向量及给定的相似度计算公式，确定所述课程与其他各所述课程的相似度值。

其中，相似度计算公式可以是余弦相似度计算公式i和j取值范围可以是[0,n],n为课程总数，第i个课程与第j个课程相似度值可以是S_i，a_i可以第i个课程对应的特征向量，b_j可以是第j个课程的特征向量，可选的，相似度计算公式还可以是计算课程与其他课程特征向量的欧几里得距离、曼哈顿距离和明可夫斯基距离等，将计算得到得距离作为所述课程与其他各所述课程得相似度值。

具体的，可以针对每门课程，使用特征向量与其他课程的特征向量按照公式计算出每两门课程间的相似度值。

步骤206、确定所述课程对应的业务权重值，将所述业务权重值与各所述相似度值的乘积作为所述课程与相应课程的课程相似度。

其中，业务权重值可以是根据课程所处场景和课程所需专业知识共同确定的权重值。

具体的，可以根据课程的场景和需要的专业知识确定对应每门课程的权重值，可选的，业务权重值可以预先设置，使用确定的业务权重值加权对应课程的相似度，加权的方式可以采用业务权重值与相似度值乘积的方式，可以将加权后的相似度作为相应课程的课程相似度。

进一步的，可以理解的是使用业务权重值加权相似度值的方式不仅限于乘积，还可以包括加法、减法和乘方运算等。

步骤207、以设定顺序排列各所述课程相似度，获得所述课程对应的相似度向量。

其中，设定顺序可以是预设好的对应课程的顺序，例如，设定顺序可以是肌肉锻炼课程、耐力锻炼课程和爆发锻炼课程的顺序，可以将肌肉锻炼课程与耐力锻炼课程、肌肉锻炼课程与爆发锻炼课程的课程相似度合并为对应肌肉锻炼课程的相似度向量，耐力锻炼课程和肌肉锻炼课程、耐力锻炼课程与爆发锻炼课程的课程相似度合并为对应耐力锻炼课程的相似度向量；相似度向量可以是存储有课程相似度的向量，各相似度向量对应各课程。

具体的，可以按照预设设定的顺序，将对应课程的课程相似度进行排列，可以将排列后生成的向量作为对应该课程的相似向量。

步骤208、以各所述课程的相似度向量为列向量，合并形成课程相似矩阵。

其中，列向量可以是对应课程的相似度向量，不同列向量可以对应不同课程，课程相似矩阵可以是存储课程相似度的矩阵。

具体的，可以将生成的对应各课程的相似度向量作为相似矩阵中的列向量，可选的，相似度向量还可以是课程相似矩阵中的行向量，可以按照课程的顺序排列对应课程的相似度向量组成课程相似矩阵，例如，课程的顺序是肌肉锻炼课程、耐力锻炼课程和爆发锻炼课程，那么以第一列向量为肌肉锻炼课程对应相似度向量，第二列向量为耐力锻炼课程对应相似度向量，第三列向量为爆发锻炼课程对应相似度向量的顺序组成课程相似矩阵。

步骤209、降维处理所述课程相似矩阵，得到设定维度的目标结果矩阵。

其中，降维处理可以是将高维矩阵变为低维矩阵的操作，降维处理的方法可以包括t分布随机邻居嵌入(t-distributed Stochastic Neighbor Embedding，t-SNE)、线性判别分析(Linear Discriminant Analysis，LDA)、主成分分析(Principal ComponentAnalysis，PCA)和局部线性嵌入(Locally Linear Embedding，LLE)等，例如，将100*100的矩阵变为100*2的矩阵，预设维度可以是课程相似矩阵降低到的目标维度，可以是2维或者3维，目标结果矩阵可以是行数对应课程数量、列数对应目标维度的矩阵，还可以是列数对应课程数量、行数对应目标维度的矩阵，目标结果矩阵可以具有与课程相似矩阵中相同的课程对应关系，也就是目标结果矩阵的课程相似程度与课程相似矩阵相同，目标结果矩阵每个列向量可对应一门课程。

具体的，可以采用t-SNE、LDA、PCA和LLE等降维算法，将课程相似矩阵的行数或者列数变为目标维度，可以将降维后的矩阵作为目标结果矩阵，降维算法可以包括线性降维和非线性降维算法。

可选地，本实施例进一步对降维处理所述课程相似矩阵，得到设定维度的目标结果矩阵进行了优化，图4为本发明实施例二提供的确定目标结果矩阵的实现流程图，如图4所示，该目标结果矩阵确定具体包括如下操作：

步骤2091、获取所述课程相似矩阵的困惑度、设定维度及设置的降维迭代次数，并随机生成维度为所述设定维度的初始结果矩阵。

在本实施例中，所述困惑度可以用来衡量第一条件概率和第二条件概率下预测的准确度，可以提前进行预设；设定维度可以是课程相似矩阵降维的目标维度；降维迭代次数可以是初始结果矩阵使用梯度更新的次数。初始结果矩阵可以是随机生成的矩阵，矩阵中的数值可以随机生成。

步骤2092、确定所述课程相似矩阵中各第一列向量在所述困惑度前提下的第一条件概率。

在本实施例中，所述第一条件概率可以是课程相似矩阵中目标列向量与其他列向量为邻域的概率，可以根据公式计算得到，x_i可以是目标列向量，x_j可以是其他列向量，σ_i可以是以目标列向量为中心的正态分布方差。

S2093、基于各所述第一列向量对应的第一条件概率及给定的梯度公式，迭代更新所述初始结果矩阵直至达到所述降维迭代次数，获得目标结果矩阵。

具体的，可以获取预先设定的困惑度、设定维度和降维迭代次数，可以根据获取到的设定维度确定初始结果矩阵的行数和列数，使用随机函数生成初始结果矩阵中的各个数值，可以在获取到的困惑度的前提条件下根据公式计算课程相似矩阵中各列向量的第一条件概率，可以根据各列向量的第一条件概率和困惑度和设定维度使用迭代的方式更新初始结果矩阵，直到迭代次数达到降维迭代次数的要求，获取到目标结果矩阵。

进一步地，本实施例将所述基于各所述第一列向量对应的第一条件概率及给定的梯度公式，迭代更新所述初始结果矩阵直至达到所述降维迭代次数，获得目标结果矩阵，具体化为下述步骤：

S1、确定所述初始结果矩阵中各第二列向量在所述困惑度前提下的第二条件概率。

其中，第二列向量可以时初始结果矩阵中的列向量，第二列向量与第一列向量的位置相同，例如第一列向量在课程相似矩阵中的位置是第二列，则第二列向量在初始结果矩阵中的位置也是第二列，第二条件概率可以是初始结果矩阵中各列向量与其他列向量为邻域的概率，可以通过公式计算得到，其中y_i可以是第二列向量，y_j可以是其他列向量。

具体的，可以针对初始结果矩阵中的各列向量分别计算在困惑度的前提下使用公式计算对应各第二列向量的第二条件概率。

S2、基于各所述第一条件概率、各所述第二条件概率及所述梯度公式，确定所述初始结果矩阵中各第二列向量的梯度值。

其中，梯度值可以是结果矩阵更新使用的数值，可以通过梯度公式计算得到。

具体的，可以根据获取的第一条件概率和第二条件概率代入梯度公式按初始结果矩阵中列向量所处的位置逐个计算对应的梯度值。

进一步的，所述梯度公式可以表示为Δy_i＝4∑_j(P_i|j-Q_i|j)(y_i-y_j)(1+‖y_i-y_j‖²)^-1，其中，Δy_i为初始结果矩阵第i个列向量对应的梯度值，P_i|j为课程相似矩阵中第i个列向量与第j个列向量为邻域的条件下的第一条件概率，Q_i|j为初始结果矩阵中第i个列向量与第j个列向量为邻域的条件下的第二条件概率；y_i为初始结果矩阵中的第i个列向量；y_j为初始结果矩阵中的第j个列向量，且i≠j。

具体的，可以获取课程相似矩阵中各列向量，根据列向量的在课程相似矩阵中的位置确定其对应的课程，按照课程顺序，可以计算初始结果矩阵中第二列向量对应的第二条件概率，将对应的第一条件概率的值和第二条件概率的值带入梯度公式Δy_i＝4∑_j(P_i|j-Q_i|j)(y_i-y_j)(1+‖y_i-y_j‖²)^-1中计算得到对应列向量的梯度值。

S3、基于各所述梯度值更新相应的第二列向量，并基于更新后的各所述第二列向量构成新的初始结果矩阵。

其中，更新可以是在第二列向量数值的基础上通过包括加减乘除等运算方式获取新的第二列向量数值的过程。

具体的，可以获取各第二列向量对应的梯度值，在各第二列向量向量值的基础上，可以加上对应的梯度值，实现各第二列向量的更新操作，可以将更新后得第二列向量按照对应课程的顺序重新构成初始结果矩阵。

S4、如果当前迭代次数小于所述降维迭代次数，则返回重新执行第二条件概率的确定操作，如果当前迭代次数大于等于所述降维迭代次数，则将初始结果矩阵作为目标结果矩阵。

其中，当前迭代次数可以是重复执行S1-S4的次数。

具体的，如果S1-S4的重复执行次数小于降维迭代次数，可以返回S1继续执行第二条件概率的确定操作，如果S1-S4的重复执行次数大于等于降维迭代次数，可以将初始结果矩阵作为目标结果矩阵。

步骤210、确定所述目标结果矩阵中各列向量关联的目标课程，并将各列向量的向量值作为相应目标课程的坐标信息。

其中，目标结果矩阵中的各列向量可以分别对应一门课程，可以根据列向量在目标矩阵中的位置确定对应课程的唯一标识号，向量值可以是各列向量内的具体数值。

具体的，可以根据目标结果矩阵各列向量在目标结果矩阵中的位置确定对应的目标课程，例如课程排列顺序为肌肉锻炼课程、耐力锻炼课程和爆发锻炼课程，那么目标结果矩阵中第一个列向量对应的目标课程可以是肌肉锻炼课程、第二个列向量对应的目标课程可以是耐力锻炼课程和第三个列向量对应的目标课程可以是爆发锻炼课程，可以将各列向量中的具体数值分别作为对应目标课程的空间坐标信息，例如，耐力锻炼课程对应列向量为则耐力锻炼课程对应的空间点坐标为(1，2)。

步骤211、在坐标系中基于各所述坐标信息展示各所述目标课程，并基于展示结果确定相似课程。

其中，坐标系可以是各课程对应坐标信息所处的坐标系。

具体的，可以基于各坐标信息在对应坐标信息处生成对应各目标课程的展示图像，以展示图像的方式展示各目标课程间相似关系，相似程度大的目标课程对应的展示图像可以靠近，相似程度低的目标课程对应的展示图像可以远离，通过展示结果确定相似的课程，参见图3，根据图中各课程对应图像的距离可以确定课程11与课程12、课程13是相似课程，课程14和课程15是相似课程，课程16与课程17、课程18是相似课程。可以理解的是，根据坐标信息展示各所述目标课程的方式不仅限于图3示出的方式，展示的还可以包括三维空间图像，展示图中还可以包括目标课程的相关信息，目标课程的展示图可以具有不同形状和颜色以标识不同目标课程。进一步的，在坐标系中基于各所述坐标信息展示各所述目标课程，并基于展示结果确定相似课程，包括：

获取各所述目标课程的坐标信息，根据所述坐标信息计算各所述目标课程间的坐标距离；根据所述坐标距离生成对应各所述目标课程的展示图像，并根据所述坐标信息展示各所述展示图像；根据所述展示图像的展示结果确定相似课程。

其中，坐标信息可以是目标结果矩阵中各目标课程对应的列向量值对应的空间坐标信息，例如，耐力锻炼课程对应列向量为则耐力锻炼课程对应的空间坐标信息为(1，2)，坐标距离可以是各目标课程空间坐标信息之间的距离，可以包括欧几里得距离、曼哈顿距离和明可夫斯基距离等，展示图像可以是对应目标课程的展示图形，例如圆形、圆球、方形和立方体等，展示结果可以包括但不限于展示图像的大小、形状、颜色和各展示图像间的距离。

具体的，可以获取各目标课程的坐标信息，根据坐标信息计算各目标课程坐标之间的坐标距离，可以为坐标距离小于阈值的目标课程生成相同的展示图像，例如，耐力课程和肌肉训练课程的坐标距离小于阈值2，那么可以为耐力课程和肌肉训练课程生成相同的展示图像，可选的，阈值可以是人为设定或者根据算法自动生成，进一步的，还可以将坐标距离大于等于阈值的目标课程生成相同的展示图像，可以将生成的各展示图像根据对应目标课程的坐标信息展示在坐标系中，根据各展示图像的距离、大小、形状和颜色等展示信息可以确定相似课程，例如具有相同形状展示图像的目标课程可以是相似课程。

本发明实施例通过获取课程存储的课程信息和用户参与信息表，获取到对应课程的课程难度、时长、肌肉点和卡路里作为静态特征，将获取到的课程完成率、退出率和用户反馈值作为动态特征值，将静态特征值和动态特征值合并为对应课程的特征向量，针对各课程使用相似度公式计算各课程间的相似度值，并对特征向量加权生成课程相似度向量，以各课程相似度向量合并形成课程相似矩阵，降维处理课程相似矩阵生成目标结果矩阵，将目标结果矩阵列向量作为对应课程的坐标信息，并于坐标系内展示，用于确定相似课程；通过使用静态特征和动态特征构成特征值，准确获取课程信息，提高确定相似课程的准确度，降维课程相似矩阵，使得目标结果矩阵可视化，提高了用户体验程度，降低了识别相似课程的困难。

进一步的，上述实施例还可以包括：监测各所述课程的状态函数输出值，并当所述状态函数输出值改变时更新所述课程的用户参与信息表。

其中，状态函数可以是用监测用户参与课程情况的函数，状态函数输出值可以是用于参与课程情况的具体数值，例如，课程参与人数增加1000人。

具体的，可以监测各课程对应的状态函数输出值，当状函数输出值发生改变时更改对应课程的用户参与信息表中的具体参数，示例性，当监测到参与课程人数增加时，更改用户参与信息表中对应课程的参与人数。

实施例三

图5是本发明实施例三提供的一种相似课程的确定装置的结构示意图。本发明实施例所提供的相似课程的确定装置可执行本发明任意实施例所提供的相似课程的确定方法，具备执行方法相应的功能模块和有益效果。参见图5，本实施例提供的装置包括：特征向量获取模块401、相似矩阵生成模块402和相似课程确定模块403。

其中，特征向量获取模块401，用于获取至少两门课程的特征向量。

相似矩阵生成模块402，用于根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵。

相似课程确定模块403，用于基于所述课程相似矩阵确定相似课程。

本发明实施例通过特征向量获取模块获取各课程的特征向量，相似矩阵生成模块根据对应课程的特征向量确定每两门课程间的相似度，并将该相似度生成课程相似矩阵，相似课程确定模块基于课程相似矩阵确定相似课程，解决了相似课程的确定问题，降低用户识别相似课程的困难程度，可反应课程之间的内在联系。

进一步的，相似矩阵生成模块包括：

相似度计算单元，用于针对每门课程，基于各所述特征向量及给定的相似度计算公式，确定所述课程与其他各所述课程的相似度值。

加权单元，用于确定所述课程对应的业务权重值，将所述业务权重值与各所述相似度值的乘积作为所述课程与相应课程的课程相似度。

相似度向量获取单元，用于以设定顺序排列各所述课程相似度，获得所述课程对应的相似度向量。

相似矩阵生成单元，用于以各所述课程的相似度向量为列向量，合并形成课程相似矩阵。

进一步的，相似课程确定模块包括：

降维单元，用于降维处理所述课程相似矩阵，得到设定维度的目标结果矩阵。

目标课程确定单元，用于确定所述目标结果矩阵中各列向量关联的目标课程，并将各列向量的向量值作为相应目标课程的坐标信息。

相似课程确定单元，用于在坐标系中基于各所述坐标信息展示各所述目标课程，并基于展示结果确定相似课程。

进一步的，降维单元包括：

初始化子单元，用于获取所述课程相似矩阵的困惑度、设定维度及设置的降维迭代次数，并随机生成维度为所述设定维度的初始结果矩阵。

概率确定子单元，用于确定所述课程相似矩阵中各第一列向量在所述困惑度前提下的第一条件概率。

矩阵生成子单元，用于基于各所述第一列向量对应的第一条件概率及给定的梯度公式，迭代更新所述初始结果矩阵直至达到所述降维迭代次数，获得目标结果矩阵。

进一步的，矩阵生成子单元包括：

条件迭代构件，用于确定所述初始结果矩阵中各第二列向量在所述困惑度前提下的第二条件概率。

梯度值迭代构件，用于基于各所述第一条件概率、各所述第二条件概率及所述梯度公式，确定所述初始结果矩阵中各第二列向量的梯度值。

更新迭代构件，用于基于各所述梯度值更新相应的第二列向量，并基于更新后的各所述第二列向量构成新的初始结果矩阵；

迭代停止确定构建，用于如果当前迭代次数小于所述降维迭代次数，则返回重新执行第二条件概率的确定操作，如果当前迭代次数大于等于所述降维迭代次数，则将初始结果矩阵作为目标结果矩阵。

进一步的，所述相似课程确定单元包括：

坐标距离计算子单元，用于获取各所述目标课程的坐标信息，根据所述坐标信息计算各所述目标课程间的坐标距离。

图像展示子单元，用于根据所述坐标距离生成对应各所述目标课程的展示图像，并根据所述坐标信息展示各所述展示图像。

相似课程确定子单元，用于根据所述展示图像的展示结果确定相似课程。

进一步的，特征向量获取模块包括：

信息获取单元，用于获取至少两门课程的课程信息和用户参与信息表。

静态特征提取单元，基于各所述课程的课程信息，提取各所述课程的课程难度、时长、肌肉点和卡路里数据作为相应的静态特征值。

动态特征提取单元，用于基于各所述课程的用户参与信息表，统计各所述课程的完成率、退出率和用户反馈值并作为相应的动态特征值。

特征向量生成单元，用于合并各所述课程的静态特征值和动态特征值，形成各所述课程的特征向量。

进一步的，特征向量获取模块还包括：

动态参数更新单元，用于监测各所述课程的状态函数输出值，并当所述状态函数输出值改变时更新所述课程的用户参与信息表。

实施例四

图6是本发明实施例四提供的一种设备的结构示意图。如图6所示，该设备包括处理器70、存储器71、输入装置72和输出装置73；设备中处理器70的数量可以是一个或多个，图6中以一个处理器70为例；设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器71作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的相似课程的确定方法对应的程序模块(例如，相似课程的确定装置中的特征向量获取模块401、相似矩阵生成模块402和相似课程确定模块403)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的相似课程的确定方法。

存储器71可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器71可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器71可进一步包括相对于处理器70远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置72可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种相似课程的确定方法，该方法包括：

获取至少两门课程的特征向量；

基于所述课程相似矩阵确定相似课程。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的相似课程的确定方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述相似课程的确定装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种相似课程的确定方法，其特征在于，包括：

获取至少两门课程的特征向量；

基于所述课程相似矩阵确定相似课程。

2.根据权利要求1所述的方法，其特征在于，所述根据各所述特征向量，确定每两门课程的课程相似度，并基于各所述课程相似度生成课程相似矩阵，包括：

针对每门课程，基于各所述特征向量及给定的相似度计算公式，确定所述课程与其他各所述课程的相似度值；

确定所述课程对应的业务权重值，将所述业务权重值与各所述相似度值的乘积作为所述课程与相应课程的课程相似度；

以设定顺序排列各所述课程相似度，获得所述课程对应的相似度向量；

以各所述课程的相似度向量为列向量，合并形成课程相似矩阵。

3.根据权利要求1所述的方法，其特征在于，所述基于所述课程相似矩阵确定相似课程，包括：

降维处理所述课程相似矩阵，得到设定维度的目标结果矩阵；

确定所述目标结果矩阵中各列向量关联的目标课程，并将各列向量的向量值作为相应目标课程的坐标信息；

在坐标系中基于各所述坐标信息展示各所述目标课程，并基于展示结果确定相似课程。

4.根据权利要求3所述的方法，其特征在于，所述降维处理所述课程相似矩阵，得到设定维度的目标结果矩阵，包括：

获取所述课程相似矩阵的困惑度、设定维度及设置的降维迭代次数，并随机生成维度为所述设定维度的初始结果矩阵；

确定所述课程相似矩阵中各第一列向量在所述困惑度前提下的第一条件概率；

基于各所述第一列向量对应的第一条件概率及给定的梯度公式，迭代更新所述初始结果矩阵直至达到所述降维迭代次数，获得目标结果矩阵。

5.根据权利要求4所述的方法，其特征在于，所述基于各所述第一列向量对应的第一条件概率及给定的梯度公式，迭代更新所述初始结果矩阵直至达到所述降维迭代次数，获得目标结果矩阵，包括：

确定所述初始结果矩阵中各第二列向量在所述困惑度前提下的第二条件概率；

基于各所述第一条件概率、各所述第二条件概率及所述梯度公式，确定所述初始结果矩阵中各第二列向量的梯度值；

基于各所述梯度值更新相应的第二列向量，并基于更新后的各所述第二列向量构成新的初始结果矩阵；

如果当前迭代次数小于所述降维迭代次数，则返回重新执行第二条件概率的确定操作，如果当前迭代次数大于等于所述降维迭代次数，则将初始结果矩阵作为目标结果矩阵。

6.根据权利要求3所述的方法，其特征在于，所述在坐标系中基于各所述坐标信息展示各所述目标课程，并基于展示结果确定相似课程，包括：

获取各所述目标课程的坐标信息，根据所述坐标信息计算各所述目标课程间的坐标距离；

根据所述坐标距离生成对应各所述目标课程的展示图像，并根据所述坐标信息展示各所述展示图像；

根据所述展示图像的展示结果确定相似课程。

7.根据权利要求1所述的方法，其特征在于，所述获取至少两门课程的特征向量，包括：

获取至少两门课程的课程信息和用户参与信息表；

基于各所述课程的课程信息，提取各所述课程的课程难度、时长、肌肉点和卡路里数据作为相应的静态特征值；

基于各所述课程的用户参与信息表，统计各所述课程的完成率、退出率和用户反馈值并作为相应的动态特征值；

合并各所述课程的静态特征值和动态特征值，形成各所述课程的特征向量。

8.根据权利要求7所述的方法，其特征在于，还包括：

监测各所述课程的状态函数输出值，并当所述状态函数输出值改变时更新所述课程的用户参与信息表。

9.一种相似课程的确定装置，其特征在于，包括：

特征向量获取模块，用于获取至少两门课程的特征向量；

10.一种设备，其特征在于，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8中任一所述的相似课程的确定方法。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8中任一所述的相似课程的确定方法。