CN110309411A

CN110309411A - 一种资源推荐方法及装置

Info

Publication number: CN110309411A
Application number: CN201810215483.5A
Authority: CN
Inventors: 李小文; 李晟; 郭洪波; 王艳彬; 杨东; 雷敏; 邢荣荣; 李关乐
Original assignee: China Mobile Communications Group Co Ltd
Current assignee: China Mobile Communications Group Co Ltd
Priority date: 2018-03-15
Filing date: 2018-03-15
Publication date: 2019-10-08

Abstract

本发明实施例公开了一种资源推荐方法，该方法包括：从教育数据中提取至少两种维度的第一指标信息；对至少两种维度的第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；根据至少两种维度的公共指标信息，得到对应的至少两种维度的公共指标权重信息；根据至少两种维度的公共指标信息和公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；根据至少两种维度的分值信息得到资源推荐信息。

Description

一种资源推荐方法及装置

技术领域

本发明涉及计算机技术领域中的推荐技术，尤其涉及一种资源推荐方法及装置。

背景技术

随着信息技术迅速发展，特别是从互联网到移动互联网，创造了跨时空的生活、工作和学习方式，使知识获取的方式发生了根本变化。教与学可以不受时间、空间和地点条件的限制，知识获取渠道灵活与多样化。

在线教育又称远程教育、在线学习，是指一种通过应用信息科技和互联网技术进行内容传播和快速学习的方法，突破了时间和空间的限制，可以提升学习效率，还可以跨越因地域等方面造成的教育资源不平等分配，使教育资源共享化，降低学习的门槛。目前，在线教育已得到了广泛应用。然而随着教育资源的增多，如何从众多的教育资源中推选出适合用户的资源，是教育平台亟待解决的问题。

现有技术中，教育平台在向用户推荐教育资源时，常用的方法为根据用户的学习特点和教育资源的学习效果之间的关联模型，对用户在教育资源的学习效果进行预测，向用户推荐预测结果最佳的教育资源。然而在建立用户的学习特点和教育资源学习效果之间的关联模型时，用户的学习特点数据的获取是通过问卷调查的方式进行的，可实施性和准确性差，并且每个用户的特点差别较大，关联模型中用户的学习特点具有群体性，不足以准确定义每个用户的学习特点，教育资源推荐的针对性差。

另外一种教育平台向用户推荐教育资源的方法为，基于用户的当前地理位置信息、兴趣点信息和预先配置的待推荐教育资源信息中的至少一项向用户推荐教育资源。然而在获取用户的当前地理位置信息时，是根据基站数据得到的，存在位置漂移的误差，导致教育资源推荐的准确性差。

发明内容

为解决上述技术问题，本发明实施例期望提供一种资源推荐方法及装置，能够根据用户偏好的指标信息向用户推荐用户偏好下的优质教育资源，提高教育资源推荐的可实施性，实现教育资源的个性化精确推荐。

本发明的技术方案是这样实现的：

本发明实施例提供了一种资源推荐方法，所述方法包括：

从教育数据中提取至少两种维度的第一指标信息；

对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；

根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息；

根据至少两种维度的所述公共指标信息和所述公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；

根据至少两种维度的所述分值信息得到资源推荐信息。

在上述方案中，所述对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息，包括：

根据至少两种维度的所述第一指标信息，得到对应的至少两种维度的指标数据信息；

对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的所述公共指标信息。

在上述方案中，所述对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的公共指标信息，包括：

根据至少两种维度的所述指标数据信息，得到对应的至少两种维度的第二指标信息和第二指标方差贡献率信息；

根据至少两种维度的所述第二指标信息和所述第二指标方差贡献率信息，得到对应的至少两种维度的所述公共指标信息。

在上述方案中，所述对至少两种维度的所述指标数据信息分别进行主成分分析之前，所述方法还包括：

根据预设数据预处理模型对至少两种维度的所述指标数据信息分别进行数据预处理，得到对应的至少两种维度的待处理指标数据信息；

相应地，所述对至少两种维度的所述指标数据信息分别进行主成分分析，包括：

对至少两种维度的所述待处理指标数据信息分别进行主成分分析。

在上述方案中，所述根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息，包括：

根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标数据信息；

对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息。

在上述方案中，所述对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息，包括：

根据预设概率模型对至少两种维度的所述公共指标数据信息分别计算概率，得到对应的至少两种维度的公共指标概率数据信息；

根据预设熵值模型对至少两种维度的所述公共指标概率数据信息和所述公共指标数据信息分别计算熵值，得到对应的至少两种维度的公共指标熵值信息；

根据预设权重模型对至少两种维度的所述公共指标熵值信息分别计算权重，得到对应的至少两种维度的所述公共指标权重信息。

在上述方案中，所述对至少两种维度的所述公共指标数据信息分别进行熵值分析之前，所述方法还包括：

根据所述预设数据预处理模型对至少两种维度的所述公共指标数据信息分别进行所述数据预处理，得到对应的至少两种维度的待处理公共指标数据信息；

相应地，所述对至少两种维度的所述公共指标数据信息分别进行熵值分析，包括：

对至少两种维度的所述待处理公共指标数据信息分别进行熵值分析。

在上述方案中，所述至少两种维度的所述分值信息包括时间分值信息、学科分值信息和学科资源分值信息，所述根据至少两种维度的所述分值信息得到资源推荐信息，包括：

根据所述时间分值信息、所述学科分值信息和所述学科资源分值信息，得到时间、学科和学科资源的推荐信息。

本发明实施例提供了一种资源推荐装置，所述装置至少包括：处理器、存储器、以及通信总线；所述通信总线用于实现所述处理器和所述存储器之间的连接通信；所述处理器用于执行所述存储器中存储的数据程序，以执行以下步骤：

从教育数据中提取至少两种维度的第一指标信息；对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息；根据至少两种维度的所述公共指标信息和所述公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；根据至少两种维度的所述分值信息得到资源推荐信息。

本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现上述所述的方法。

本发明实施例提供了一种资源推荐方法及装置，首先，从教育数据中提取至少两种维度的第一指标信息；然后，对至少两种维度的第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；以及根据至少两种维度的公共指标信息，得到对应的至少两种维度的公共指标权重信息；最后，根据至少两种维度的公共指标信息和公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；并根据至少两种维度的分值信息得到资源推荐信息。采用上述技术实现方案，由于能够根据用户偏好的指标信息向用户推荐用户偏好下的优质教育资源，提高了教育资源推荐的可实施性，实现了教育资源的个性化精确推荐。

附图说明

图1为本发明实施例提供的一种资源推荐方法的实现流程示意图；

图2为本发明实施例提供的根据指标数据信息进行熵值分析的流程示意图；

图3为本发明实施例提供的一种示例性的资源推荐方法的实现流程示意图；

图4为本发明实施例提供的一种资源推荐装置的结构示意图一；

图5为本发明实施例提供的一种资源推荐装置的结构示意图二

图6为本发明实施例提供的一种资源推荐装置的结构示意图三。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

实施例一

图1为本发明实施例提供的一种资源推荐方法的实现流程示意图，如图1所示，在本发明实施例中，资源推荐方法的步骤如下：

S101、从教育数据中提取至少两种维度的第一指标信息；

需要说明的是，用户对教育平台的使用包括页面或资源的查看操作，深度使用还包括对页面或资源的收藏、点赞等操作行为，教育平台记录用户的操作行为，便得到了丰富的教育数据。一般来说，该教育数据存储于教育平台对应的数据库中，当需要利用教育数据进行处理时，从数据库中获取对应的教育数据。

在本发明实施例中，维度表征的是指标的类型，至少两种维度的指标信息即至少两种类型的指标信息。这里，至少两种维度的指标信息可以为两种维度的指标信息，也可以为三种维度的指标信息，甚至更多种维度的指标信息，本发明实施例对此不作限定。

优选地，至少两种维度的指标信息为至少一种为资源指标信息，至少一种为表征用户特征的指标信息。

示例性地，至少两种维度的指标信息可以为时间指标信息和学科资源指标信息，还可以为学科偏好指标信息和学科资源指标信息，也可以为时间指标信息、学科指标信息和学科资源指标信息。

在统计学中，指标是能够说明总体数量特征的综合表述，通常用一系列的属性表示指标信息。比如，在统计用户使用教育平台的时间信息时，用户标识、页面访问次数、页面访问时长、点赞次数、踩次数、收藏次数、评论次数、访问时长、登录次数、上网设备类型和有效浏览时间等就是第一指标信息，该第一指标信息从不同的方面反映了用户使用时间的特征；又比如，在统计用户在教育平台中进行学科学习信息时，用户标识、点赞次数、踩次数、收藏次数、好评次数、差评次数、页面访问次数、学科访问时长、用户注册学科、完成学科学习情况和学科有效访问时长等就是第一指标信息，该第一指标信息从不同的方面反映了用户进行学科学习的特征；再比如，在统计教育平台中学科资源信息时，热度、价值度、好评度等就是第一指标信息，该第一指标信息从不同的方面反映了学科资源的数量特征。

在本发明实施例中，第一指标信息仅是指标名称，该指标名称体现事物质的规定性，事物量的规定性通过指标数值体现。比如，页面访问次数为888次，其中页面访问次数为指标名称，888次为指标数值。

在本发明实施例中，通过对教育数据的分析以及根据需统计的信息，从教育数据中提取能够表征需统计信息的一系列属性名称，作为该需统计信息的第一指标信息，即所有的指标名称的总称。对应地，指标数值根据对应的指标名称，从教育数据中通过统计、计算获得，也可通过现有技术数据获取方法得到，本发明实施例对此不作限定。

需要说明的是，从教育数据中提取第一指标信息可由人工方式进行提取，也可以借助其他算法或工具进行提取，本发明实施例对此不作限定。

S102、对至少两种维度的第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；

实际应用时，对需统计的信息提取的第一指标信息中，多个指标之间往往存在着一定的关联，并且指标的数量较多，有时多达十几个，甚至更多，如果直接将这些指标纳入分析，分析过程复杂，指标之间难以取舍。此时，需将指标维数降低以便于描述、理解和分析。一般来说，通过主成分分析法来降低指标维数，一方面减少指标的数量，另一方面降低各指标间的关联关系。

需要说明的是，主成分分析是指通过线性变换，将原来的多个指标组合成相互独立的少数几个能充分反映总体信息特征的指标，从而在不丢掉主要信息的前提下避开了指标间共线性的问题，便于进一步分析。主成分分析中，提取出的每个主成分指标都是第一指标信息的线性组合。比如，第一指标信息为：x₁，x₂，则一共可提取两个新指标作为主成分指标：y₁，y₂，x₁，x₂，y₁，y₂的线性组合如表达式(1)所示，其中，l₁₁、l₁₂、l₂₁、l₂₂为常数。

具体地，根据至少两种维度的第一指标信息，得到对应的至少两种维度的指标数据信息；对至少两种维度的指标数据信息分别进行主成分分析，得到对应的至少两种维度的公共指标信息。其中，公共指标信息包括公共指标和公共指标与第一指标信息的线性关系。

在进行主成分分析时，每个主成分指标对应有方差贡献率。方差贡献率是指单个主成分指标引起的变异占总变异的比例，表征此主成分指标对结果的影响力大小；累计方差贡献率是所有主成分指标引起的变异占总变异比例，表征所有主成分指标对结果的合计影响力。方差贡献率与累计方差贡献率两者的关系是：各主成分指标的方差贡献率相加和等于累计方差贡献率。原则上，第一指标信息与主成分指标信息在数量上相同，提取时，如果将这些主成分指标信息全部提取出来作为公共指标，就会失去利用主成分分析来简化第一指标信息的意义。一般来说，根据各主成分指标的方差贡献率对主成分指标进行降序排列，提取前2至3个主成分指标就已包含了第一指标信息90％以上的信息，剩下的主成分指标在分析时可以忽略不计。

具体地，根据至少两种维度的指标数据信息，得到对应的至少两种维度的第二指标信息和第二指标方差贡献率信息；根据至少两种维度的第二指标信息和第二指标方差贡献率信息，得到对应的至少两种维度的公共指标信息。其中，第二指标信息与上述所描述的只成分指标为同一概念，第二指标信息包括第二指标和第二指标与第一指标信息的线性关系。

需要说明的是，对指标数据信息进行主成分分析之前，需根据预设数据预处理模型对至少两种维度的指标数据信息分别进行数据预处理，得到对应的至少两种维度的待处理指标数据信息；相应地，对至少两种维度的指标数据信息分别进行主成分分析，包括：对至少两种维度的待处理指标数据信息分别进行主成分分析。

还需要说明的是，数据预处理是指在主要的数据处理以前对数据进行的一些处理。现实世界中数据大体上都是不完整，不一致的脏数据，无法直接进行分析，或分析结果差强人意。为了提高数据分析的质量产生了数据预处理技术。数据预处理有多种方法：数据清理，数据集成，数据变换，数据归约等，本发明实施例对此不作限定。

可以理解的是，通过数据预处理，大大提高了数据分析的质量，降低了实际数据分析所需要的时间。

示例性的，在进行数据预处理的过程中，对于值为空的指标数值可以用0填充；为防止利用指标数值进行计算时分母为0，可以将计算表达式的分子分母对应的指标数值同时加1后相除；为减少极值的影响，可以对指标数值进行log变换，然后进行归一化处理。

需要说明的是，由于第一指标信息为至少两种维度，对这两种维度的第一指标信息分别进行降维处理，于是得到对应的至少两种维度的公共指标信息。

S103、根据至少两种维度的公共指标信息，得到对应的至少两种维度的公共指标权重信息；

需要说明的是，权重是从多个指标中分出各个指标的轻重。比如，学生期末总评的指标有学生平时成绩、期中考成绩和期末考成绩三个指标，但是这三个指标所占期末总评的比重不一样，如果平时成绩占30％，期中考成绩占30％，期末考成绩占40％，那么平时成绩的权重为0.3，期中考试成绩的权重为0.3，期末考试成绩的权重为0.4。这里，公共指标权重信息是指各个公共指标在整体评价中的相对重要程度。

在本发明实施例中，根据至少两种维度的公共指标信息，分别通过权重的设定，得到对应的至少两种维度的公共指标权重信息。

需要说明的是，权重的设定方法包括主观经验法、主次指标排队分类法、专家调查法、熵值法等，本发明实施例对此不作限制。

示例性的，熵值法是指用来判断某个指标的离散程度的数学方法。离散程度越大，对该指标对综合评价的影响越大。在信息论中，熵是对不确定性的一种度量。信息量越大，不确定性就越小，熵也就越小；信息量越小，不确定性越大，熵也越大。根据熵的特性，通过计算熵值来判断一个事件的随机性及无序程度，也可以用熵值来判断指标的离散程度，指标的离散程度越大，该指标对综合评价的影响越大。因此，根据各项指标的变异程度，可利用信息熵这个工具，计算出各个指标的权重，为多指标综合评价提供依据。

具体地，根据至少两种维度的公共指标信息，得到对应的至少两种维度的公共指标数据信息；对至少两种维度的公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的公共指标权重信息。

图2为本发明实施例提供的根据指标数据信息进行熵值分析的流程示意图，如图2所示，对至少两种维度的公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的公共指标权重信息的具体步骤为：

S201、根据预设概率模型对至少两种维度的公共指标数据信息分别计算概率，得到对应的至少两种维度的公共指标概率数据信息；

需要说明的是，预设概率模型为进行概率计算的公式，具体通过该概率计算公式，再根据公共指标数据信息计算每个样本的公共指标数值在对应的公共指标中出现的概率，从而得到公共指标概率数据信息。

S202、根据预设熵值模型对至少两种维度的公共指标概率数据信息和公共指标数据信息分别计算熵值，得到对应的至少两种维度的公共指标熵值信息；

需要说明的是，预设熵值模型为进行熵值计算的公式，具体通过该熵值计算公式，再根据公共指标概率数据信息和公共指标数据信息计算各个公共指标的熵值，从而得到公共指标熵值信息。

S203、根据预设权重模型对至少两种维度的公共指标熵值信息分别计算权重，得到对应的至少两种维度的公共指标权重信息。

需要说明的是，预设权重模型为进行权重计算的公式，具体通过该权重计算公式，再根据公共指标熵值数据信息计算各个公共指标的权重，从而得到公共指标权重信息。

这里，对至少两种维度的公共指标数据信息分别进行熵值分析之前还包括：根据预设数据预处理模型对至少两种维度的公共指标数据信息分别进行数据预处理，得到对应的至少两种维度的待处理公共指标数据信息；相应地，对至少两种维度的公共指标数据信息分别进行熵值分析为对至少两种维度的待处理公共指标数据信息分别进行熵值分析。

S104、根据至少两种维度的公共指标信息和公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；

需要说明的是，分值是通过数值表示事物在一特定方面高度的信息值。在得到公共指标信息后，通过公共指标与第一指标信息的线性关系以及第一指标信息中各指标对应的指标数值，计算公共指标数值信息，再根据对应的公共指标权重信息，通过加权求和得到分值信息。

S105、根据至少两种维度的分值信息得到资源推荐信息。

在得到了不同维度的分值信息后，便可根据该分值信息提取特定分值范围内的信息，从而得到与至少两种维度信息相关的资源推荐信息。

优选地，至少两种维度的分值信息包括时间分值信息、学科分值信息和学科资源分值信息，根据至少两种维度的分值信息得到资源推荐信息，包括：根据时间分值信息、学科分值信息和学科资源分值信息，得到时间、学科和学科资源的推荐信息。

可以理解的是，采用上述技术实现方案，由于能够根据用户偏好的指标信息向用户推荐用户偏好下的优质教育资源，提高了教育资源推荐的可实施性，实现了教育资源的个性化精确推荐。

以一个现实应用场景为例对本发明实施例阐述如下：

图3为本发明实施例提供的一种示例性的资源推荐方法的实现流程示意图，应用本发明实施例的一个具体场景为教育平台在用户偏好的时间点推荐其偏好学科下的优质教育资源，如图3所示，该具体应用包括以下步骤：

S301、从教育平台数据库中提取教育数据；

需要说明的是，教育平台是为满足广大学者摄取知识的应用平台，具体教育平台可以包括在线教育平台和本地教育平台，在本发明实施例中的一具体应用中，以在线教育平台为例进行说明。

还需要说明的是，教育平台接收用户的操作指令，生成了操作记录，这些操作记录一般存储在后台数据库中，构成了教育数据。当需要通过教育数据进行分析时，可从后台数据库中直接导出，还可以通过爬虫方式获取，以及其他现有获取数据的方式进行教育数据的获取，本发明实施例对此不作限定。

S302、从教育数据中提取时间指标信息、学科指标信息和学科资源指标信息；

在本发明实施例中，从教育数据中提取所有用户近3个月在教育平台操作的和用户时间相关的操作行为数据，通过对这些操作行为数据进行整理、分析，确定时间指标信息，如表1所示，具体包括：用户标识、页面访问次数、页面访问时长、点赞次数、踩次数、收藏次数、评论次数、访问时长、登录次数、上网设备类型和有效浏览时间；从教育数据中提取所有用户近3个月在教育平台操作的和用户偏好学科相关的操作行为数据，通过对这些操作行为数据进行整理、分析，确定学科指标信息，如表2所示，具体包括：用户标识、点赞次数、踩次数、收藏次数、好评次数、差评次数、页面访问次数、学科访问时长、用户注册学科、完成学科学习情况和学科有效访问时长；以及从教育数据中提取所有用户近3个月在教育平台操作的和学科资源相关的操作行为数据，通过对这些操作行为数据进行整理、分析，确定学科资源指标信息，如表3所示，具体包括：热度、价值度、好评度，其中，热度用近三个月资源访问次数进行衡量，价值度用近三个月资源收藏次数进行衡量，好评度用近三个月资源点赞人数或者近三个月资源点赞人数与近三个月资源踩人数来衡量。这里，操作行为数据包括用户对页面或资源的查看操作，以及对页面或资源的收藏、点赞等操作行为留下的数据记录。

指标序号	指标符合	指标名称
			1	a<sub>1</sub>	用户标识
2	a<sub>2</sub>	页面访问次数
			3	a<sub>3</sub>	页面访问时长
4	a<sub>4</sub>	点赞次数
			5	a<sub>5</sub>	踩次数
6	a<sub>6</sub>	收藏次数
			7	a<sub>7</sub>	评论次数
8	a<sub>8</sub>	访问时长
			9	a<sub>9</sub>	登录次数
10	a<sub>10</sub>	上网设备类型
			11	a<sub>11</sub>	有效浏览时间

表1

指标序号	指标符合	指标名称
			1	b<sub>1</sub>	用户标识
2	b<sub>2</sub>	点赞次数
			3	b<sub>3</sub>	踩次数
4	b<sub>4</sub>	收藏次数
			5	b<sub>5</sub>	好评次数
6	b<sub>6</sub>	差评次数
			7	b<sub>7</sub>	页面访问次数
8	b<sub>8</sub>	学科访问时长
			9	b<sub>9</sub>	用户注册学科
10	b<sub>10</sub>	完成学科学习情况
			11	b<sub>11</sub>	学科有效访问时长

表2

指标序号	指标符合	指标名称
			1	c<sub>1</sub>	热度
2	c<sub>2</sub>	价值度
			3	c<sub>3</sub>	好评度

表3

S303、根据时间指标信息、学科指标信息和学科资源指标信息，得到对应的时间指标数据信息、学科指标数据信息以及学科资源指标数据信息；

在得到了时间指标信息为：a₁，a₂，a₃，a₄，a₅，a₆，a₇，a₈，a₉，a₁₀，a₁₁；学科指标信息为：b₁，b₂，b₃，b₄，b₅，b₆，b₇，b₈，b₉，b₁₀，b₁₁；以及学科资源指标信息为：c₁，c₂，c₃；之后，选取m个用户对应的教育数据，分别与时间指标信息、学科指标信息和学科资源指标信息得到对应的时间数据A_m*11、B_m*11和C_m*11，其中A_m*11和B_m*11表示m行11列的数据矩阵，C_m*3表示m行3列的数据矩阵。

S304、根据预设数据预处理模型对时间指标数据信息、学科指标数据信息和学科资源指标数据信息分别进行数据预处理，得到对应的待处理时间指标数据信息、待处理学科指标数据信息和待处理学科资源指标数据信息；

这里，由于有的指标会出现值的缺失、极值等现象，需要对这些时间数据、学科数据和学科资源数据进行数据预处理。

具体地，首先，用0值填充缺失值；然后，用log变换以及归一法对数据进行避免极值处理。其中，进行log变换时，可采用公式(2)，进行归一化处理时，可采用公式(3)；最后得到待处理时间指标数据信息A“_m*11、待处理学科指标数据信息B“_m*11和待处理学科资源指标数据信息C“_m*3：

x‘_ij＝log(x_ij+1) (2)

其中，x_ij为一数据矩阵中第i行第j列对应的值，x‘_ij为该数据矩阵经过log变换后的第i行第j列对应的值，i属于该数据矩阵行表示的整数数值范围内，j数据该数据矩阵列表示的整数数值范围内。

其中，min(x‘_j)为该数据矩阵中第j列中数值最小者，max(x‘_j)为该数据矩阵中第j列中数值最大者，x‘_ij为该数据矩阵经过log变换后的第i行第j列对应的数值，i属于该数据矩阵行表示的整数数值范围内，x“_ij为该数据矩阵经过归一化处理后的第i行第j列对应的数值，j属于该数据矩阵列表示的整数数值范围内。

S305、对待处理时间指标数据信息、待处理学科指标数据信息和待处理学科资源指标数据信息分别进行主成分分析，得到对应的时间公共指标信息、学科公共指标信息和学科资源公共指标信息；

由于各指标信息中的多个指标之间存在着关联性，并且时间指标信息和学科指标信息中所包含的指标个数为11个，使得利用这些时间指标信息、学科指标信息以及学科资源指标信息进行教育数据的分析时，分析过程较复杂，而且得到的分析结果也并不一定合理。因此，需对时间指标信息、学科指标信息以及学科资源指标信息进行降维处理，用少量的具有代表性的公共指标信息代替时间指标信息、学科指标信息以及学科资源指标信息进行分析。

具体地，首先，对待处理时间指标数据信息、待处理学科指标数据信息和待处理学科资源指标数据信息进行旋转，得到时间主成分指标信息与时间指标信息的线性组合，学科主成分指标信息与学科指标信息的线性组合，学科资源主成分指标信息与学科资源指标信息的线性组合，以及各个时间主成分指标的方差贡献率、学科主成分指标的方差贡献率和学科资源主成分指标的方差贡献率，其中，时间主成分指标信息与时间指标信息的线性组合如表达式(4)所示：

是时间主成分指标信息的矩阵表示形式，R_m*11是根据A“_m*11通过求的相关矩阵，并计算该相关矩阵的特征向量得到的时间主成分变换矩阵。

学科主成分指标信息与学科指标信息的线性组合如表达式(5)所示：

是学科主成分指标信息的矩阵表示形式，S_m*11是根据B“_m*11通过求的相关矩阵，并计算该相关矩阵的特征向量得到的学科主成分变换矩阵。

学科资源主成分指标信息与学科资源指标信息的线性组合如表达式(6)所示：

是学科资源主成分指标信息的矩阵表示形式，T_m*3是根据C“_m*3通过求的相关矩阵，并计算该相关矩阵的特征向量得到的学科资源主成分变换矩阵。

其次，根据方差贡献率分别对时间主成分指标信息、学科主成分指标信息以及学科资源主成分指标信息进行降序排列，分别从最大方差贡献率依次选取累计方差贡献率大于80％的主成分指标信息，作为时间公共指标信息：o₁、o₂、o₃，学科公共指标信息：p₁、p₂、p₃，学科资源公共指标信息：q₁、q₂、q₃。最后，将时间公共指标和时间公共指标与时间指标信息的线性表达式、学科公共指标和学科公共指标与学科指标信息的线性表达式、学科资源公共指标和学科资源公共指标与学科资源指标信息的线性表达式作为时间公共指标信息、学科公共指标信息和学科资源公共指标信息。

其中，时间公共指标与时间指标信息的线性表达式如表达式(7)所示：

学科公共指标与学科指标信息的线性表达式如表达式(8)所示：

学科公共指标与学科指标信息的线性表达式如表达式(9)所示：

S306、根据时间公共指标信息、学科公共指标信息和学科资源公共指标信息，得到对应的时间公共指标数据信息、学科公共指标数据信息和学科资源公共指标数据信息；

在得到时间公共指标信息、学科公共指标信息和学科资源公共指标信息之后，需要对时间公共指标：o₁、o₂、o₃，学科公共指标：p₁、p₂、p₃，学科资源公共指标：q₁、q₂、q₃，进行指标权重的分配。此时，选取m个用户对应的教育数据，再根据时间公共指标和时间公共指标与时间指标信息的线性表达式、学科公共指标和学科公共指标与学科指标信息的线性表达式、学科资源公共指标和学科资源公共指标与学科资源指标信息的线性表达式，得到时间公共指标数据信息O_m*3、学科公共指标数据信息P_m*3和学科资源公共指标数据新Q_m*3。

另外，需要对O_m*3、P_m*3和Q_m*3根据上述公式(2)进行log变换，之后再根据上述公式(3)进行归一化处理，最终得到待处理时间公共指标数据信息O“_m*3、待处理学科公共指标数据信息P“_m*3和待处理学科资源公共指标数据信息Q“_m*3。

S307、根据预设概率模型对时间公共指标数据信息、学科公共指标数据信息和学科资源公共指标数据信息分别计算概率，得到对应的时间公共指标概率数据信息、学科公共指标概率数据信息和学科资源公共指标概率数据信息；

在计算各公共指标所占的权重时，采用熵值法进行各公共指标权重的计算。这里，通过公式(10)计算第i(0＜i≤m)个样本中第j(0＜j≤3)个公共指标出现的概率：

其中，X_ij为第i个样本的第j个公共指标对应的数值，为m个样本的第j个公共指标对应数值的加权求和。对应于根据公式(10)计算时间公共指标各样本的各时间公共指标出现的概率，得到时间公共指标概率数据信息对应于根据公式(10)计算学科公共指标各样本的各学科公共指标出现的概率，得到学科公共指标概率数据信息对应于根据公式(10)计算学科资源公共指标各样本的各学科资源公共指标出现的概率，得到学科资源公共指标概率数据信息

S308、根据预设熵值模型对时间公共指标概率数据信息、学科公共指标概率数据信息和学科资源公共指标概率数据信息分别计算熵值，得到对应的时间公共指标熵值数据信息、学科公共指标熵值数据信息和学科资源公共指标熵值数据信息；

在计算各公共指标所占的权重时，当得到各样本的各公共指标的概率数据信息后，根据该公共指标的概率数据信息，分别计算该公共指标的每个公共指标的熵值信息。具体地，通过公式(11)计算第j(0＜j≤3)个公共指标的熵值信息：

其中，X_ij为第i(0＜i≤m)个样本的第j个公共指标对应的数值，f(X_ij)为第i个样本的第j个公共指标对应的概率值，ln(m)为对样本个数m取ln对数。对应计算得到时间公共指标熵值数据信息：学科公共指标熵值数据信息：学科资源公共指标熵值数据信息：

S309、根据预设权重模型对时间公共指标熵值数据信息、学科公共指标熵值数据信息和学科资源公共指标熵值数据信息分别计算权重，得到对应的时间公共指标权重数据信息、学科公共指标权重数据信息和学科资源公共指标权重数据信息；

在计算各公共指标所占的权重时，当得到各公共指标的熵值数据信息后，根据该熵值数据信息，计算公共指标的权重数据信息。具体地，通过公式(12)计算第j(0＜j≤3)个公共指标的权重信息：

其中，e_j为第j个公共指标的权重数值，为对1减去第k个公共指标的权重数值的结果的加权求和，这里由于公共指标的个数均为三个，因此是对3个1减去公共指标的权重数值进行加权求和。于是计算得到时间公共指标权重数据信息：学科公共指标权重数据信息：学科资源公共指标权重数据信息：

S310、根据时间公共指标权重数据信息、学科公共指标权重数据信息和学科资源公共指标权重数据信息分别计算分值，得到时间分值信息、学科分值信息和学科资源分值信息；

在得到了公共指标信息以及该公共指标的权重信息之后，可以计算该维度下不同类别的得分信息。具体地，通过公式(13)计算第i个样本在该维度下不同类别的分值信息：

其中，w_j为第j个公共因子指标的权重数值，代表第i个样本在第G个类别的第j个公共指标数值，代表第i个样本在第G个类别的分值，另外，由于时间公共指标、学科公共指标和学科资源的公共指标的个数均为3个，因此，是对3个w_j与乘积的加权求和。这里，对于用户时间，按每3个小时一个时段进行划分，共得到8个时段，于是类别G为：u₁、u₂、u₃、u₄、u₅、u₆、u₇、u₈；假定第i个用户有语文、数学、英语和计算机4门偏好的学科，于是类别G为：v₁、v₂、v₃、v₄；假定语文这门学科的资源有语文1-30两种类别，于是类别G为：z₁、z₂、…z₃₀

需要说明的是，学科资源的指标提取、公共指标的确定、公共指标的权重计算和该学科资源的分值计算可以是针对教育平台的全部学科资源，也可以是针对用户偏好学科确定后对该学科对应的学科资源进行的指标信息的提取、公共指标信息的确定、公共指标的权重计算和该学科资源的分值计算，本发明实施例对此不作限定。

S311、根据时间分值信息、学科分值信息和学科资源分值信息，得到时间、学科和学科资源的推荐信息。

对应于一用户的时间分值信息，共包括8个时间段的分值，对该8个时间段的分值进行倒序排列，输出该用户的前三个时间段：9:00-12:00，15:00-18:00和18:00-21:00；对应于一用户的学科分值信息，共包括4门学科的分值，对该4门学科的分值进行倒序排列，输出该用户最喜欢浏览的1门学科：语文；对应于语文资源分值信息，共包括两种语文资源的分值，从中选取分值较大的前10个资源语文6、语文9、语文11、语文15、语文16、语文30、语文2、语文27、语文7、语文5作为为该用户推荐的资源。于是，可得到三条推荐信息：在9:00-12:00时向该用户推荐语文6、语文9、语文11、语文15、语文16、语文30、语文2、语文27、语文7、语文5这些学科资源，在15:00-18:00时向该用户推荐语文6、语文9、语文11、语文15、语文16、语文30、语文2、语文27、语文7、语文5这些学科资源，以及在18:00-21:00时向该用户推荐语文6、语文9、语文11、语文15、语文16、语文30、语文2、语文27、语文7、语文5这些学科资源。

需要说明的是，在S301-S311中，所涉及到的数值仅为了解释本发明实施例，并不是对本发明实施例的限定。

可以理解的是，时间和学科的指标信息由主成分分析法提取公共指标信息，再由熵值法确定每个公共指标的权重信息，既避免了复杂的指标加权计算，又通过客观方法确定权重而保证了准确性。教育资源的品质评估中的分值计算时，用熵值法确定指标权重，能够通过用户的访问浏览等行为有效判断每个学科教育资源的好坏，保证了所推荐资源的品质；同时，教育平台根据每个用户的学科和时间特征，为用户在最偏好的时段、推荐其最偏好学科下的品质较好的教育资源，可以有效避免用户的流失；另外，在用户偏好的时间段推荐其最偏好的学科教育资源，实现了一种应用于教育网站的精准营销方法，也为个性化营销提供了支撑，不仅拓宽了营销内容，而且增加了营销的成功率。

实施例二

基于与实施例一同样的发明构思，本发明实施例提供了一种资源推荐装置，如图4所示，该装置包括：

提取单元41，用于从教育数据中提取至少两种维度的第一指标信息；

处理单元42，用于对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息；

获取单元43，用于根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息；

计算单元44，用于根据至少两种维度的所述公共指标信息和所述公共指标权重信息分别计算分值，得到对应的至少两种维度的分值信息；

所述获取单元43，还用于根据至少两种维度的所述分值信息得到资源推荐信息。

可选地，所述处理单元42，具体用于根据至少两种维度的所述第一指标信息，得到对应的至少两种维度的指标数据信息；以及对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的所述公共指标信息。

可选地，所述处理单元42，具体还用于根据至少两种维度的所述指标数据信息，得到对应的至少两种维度的第二指标信息和第二指标方差贡献率信息；以及根据至少两种维度的所述第二指标信息和所述第二指标方差贡献率信息，得到对应的至少两种维度的所述公共指标信息。

可选地，如图5所示，所述装置还包括：

预处理单元45，用于根据预设数据预处理模型对至少两种维度的所述指标数据信息分别进行数据预处理，得到对应的至少两种维度的待处理指标数据信息；

相应地，所述处理单元42，具体用于对至少两种维度的所述待处理指标数据信息分别进行主成分分析。

可选地，所述获取单元43，具体用于根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标数据信息；以及对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息。

可选地，所述获取单元43，具体还用于根据预设概率模型对至少两种维度的所述公共指标数据信息分别计算概率，得到对应的至少两种维度的公共指标概率数据信息；以及根据预设熵值模型对至少两种维度的所述公共指标概率数据信息和所述公共指标数据信息分别计算熵值，得到对应的至少两种维度的公共指标熵值信息；以及根据预设权重模型对至少两种维度的所述公共指标熵值信息分别计算权重，得到对应的至少两种维度的所述公共指标权重信息。

可选地，所述预处理单元45，还用于根据所述预设数据预处理模型对至少两种维度的所述公共指标数据信息分别进行所述数据预处理，得到对应的至少两种维度的待处理公共指标数据信息；

相应地，所述获取单元43，具体用于对至少两种维度的所述待处理公共指标数据信息分别进行熵值分析。

可选地，所述至少两种维度的所述分值信息包括时间分值信息、学科分值信息和学科资源分值信息，所述获取单元43，还具体用于根据所述时间分值信息、所述学科分值信息和所述学科资源分值信息，得到时间、学科和学科资源的推荐信息。

在实际应用中，上述提取单元41、处理单元42、获取单元43、计算单元44和预处理单元45可由位于检测设备上的上的处理器实现，具体为中央处理器(CPU，CentralProcessing Unit)、微处理器(MPU，Microprocessor Unit)、数字信号处理器(DSP，DigitalSignal Processing)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等实现。

本发明提供了一种资源推荐装置，如图6所示，所述装置至少包括：处理器46、存储器47、以及通信总线48；所述通信总线用于实现所述处理器46和所述存储器47之间的连接通信；所述处理器46用于执行所述存储器47中存储的数据程序，以执行以下步骤：

在本发明实施例中，进一步地，所述处理器46，具体用于根据至少两种维度的所述第一指标信息，得到对应的至少两种维度的指标数据信息；以及对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的所述公共指标信息。

在本发明实施例中，进一步地，所述处理器46，具体还用于根据至少两种维度的所述指标数据信息，得到对应的至少两种维度的第二指标信息和第二指标方差贡献率信息；以及根据至少两种维度的所述第二指标信息和所述第二指标方差贡献率信息，得到对应的至少两种维度的所述公共指标信息。

在本发明实施例中，进一步地，所述处理器46，还具体用于根据预设数据预处理模型对至少两种维度的所述指标数据信息分别进行数据预处理，得到对应的至少两种维度的待处理指标数据信息；

相应地，所述处理器46，具体用于对至少两种维度的所述待处理指标数据信息分别进行主成分分析。

在本发明实施例中，进一步地，所述处理器46，具体用于根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标数据信息；以及对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息。

在本发明实施例中，进一步地，所述处理器46，具体还用于根据预设概率模型对至少两种维度的所述公共指标数据信息分别计算概率，得到对应的至少两种维度的公共指标概率数据信息；以及根据预设熵值模型对至少两种维度的所述公共指标概率数据信息和所述公共指标数据信息分别计算熵值，得到对应的至少两种维度的公共指标熵值信息；以及根据预设权重模型对至少两种维度的所述公共指标熵值信息分别计算权重，得到对应的至少两种维度的所述公共指标权重信息。

在本发明实施例中，进一步地，所述处理器46，还具体用于根据所述预设数据预处理模型对至少两种维度的所述公共指标数据信息分别进行所述数据预处理，得到对应的至少两种维度的待处理公共指标数据信息；

相应地，所述处理器46，具体用于对至少两种维度的所述待处理公共指标数据信息分别进行熵值分析。

在本发明实施例中，进一步地，所述至少两种维度的所述分值信息包括时间分值信息、学科分值信息和学科资源分值信息，所述处理器46具体用于根据所述时间分值信息、所述学科分值信息和所述学科资源分值信息，得到时间、学科和学科资源的推荐信息。

本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如实施例一所述的方法。

具体地，本实施例中的一种资源推荐方法对应的程序指令可以被存储在光盘，硬盘，U盘等存储介质上，当存储介质中的与一种资源推荐方法对应的程序指令被一电子设备读取或被执行时，包括如下步骤：

在本发明实施例中，进一步地，对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

根据至少两种维度的所述第一指标信息，得到对应的至少两种维度的指标数据信息；对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的所述公共指标信息。

在本发明实施例中，进一步地，对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的公共指标信息时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

根据至少两种维度的所述指标数据信息，得到对应的至少两种维度的第二指标信息和第二指标方差贡献率信息；根据至少两种维度的所述第二指标信息和所述第二指标方差贡献率信息，得到对应的至少两种维度的所述公共指标信息。

在本发明实施例中，进一步地，对至少两种维度的所述指标数据信息分别进行主成分分析之前，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

相应地，对至少两种维度的所述指标数据信息分别进行主成分分析时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

在本发明实施例中，进一步地，根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标数据信息；对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息。

在本发明实施例中，进一步地，对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

根据预设概率模型对至少两种维度的所述公共指标数据信息分别计算概率，得到对应的至少两种维度的公共指标概率数据信息；根据预设熵值模型对至少两种维度的所述公共指标概率数据信息和所述公共指标数据信息分别计算熵值，得到对应的至少两种维度的公共指标熵值信息；根据预设权重模型对至少两种维度的所述公共指标熵值信息分别计算权重，得到对应的至少两种维度的所述公共指标权重信息。

在本发明实施例中，进一步地，对至少两种维度的所述公共指标数据信息分别进行熵值分析之前，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

相应地，对至少两种维度的所述公共指标数据信息分别进行熵值分析时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

在本发明实施例中，进一步地，所述至少两种维度的所述分值信息包括时间分值信息、学科分值信息和学科资源分值信息，根据至少两种维度的所述分值信息得到资源推荐信息时，上述一个或者多个程序被上述一个或者多个处理器执行，具体实现以下步骤：

可以理解的是，由于能够根据用户偏好的指标信息向用户推荐用户偏好下的优质教育资源，提高了教育资源推荐的可实施性，实现了教育资源的个性化精确推荐。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种资源推荐方法，其特征在于，所述方法包括：

从教育数据中提取至少两种维度的第一指标信息；

根据至少两种维度的所述分值信息得到资源推荐信息。

2.根据权利要求1所述的方法，其特征在于，所述对至少两种维度的所述第一指标信息分别进行指标降维处理，得到对应的至少两种维度的公共指标信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述对至少两种维度的所述指标数据信息分别进行主成分分析，得到对应的至少两种维度的公共指标信息，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述对至少两种维度的所述指标数据信息分别进行主成分分析之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据至少两种维度的所述公共指标信息，得到对应的至少两种维度的公共指标权重信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述对至少两种维度的所述公共指标数据信息分别进行熵值分析，得到对应的至少两种维度的所述公共指标权重信息，包括：

7.根据权利要求5或6所述的方法，其特征在于，所述对至少两种维度的所述公共指标数据信息分别进行熵值分析之前，所述方法还包括：

8.根据权利要求1所述的方法，其特征在于，所述至少两种维度的所述分值信息包括时间分值信息、学科分值信息和学科资源分值信息，所述根据至少两种维度的所述分值信息得到资源推荐信息，包括：

9.一种资源推荐装置，其特征在于，所述装置至少包括：处理器、存储器、以及通信总线；所述通信总线用于实现所述处理器和所述存储器之间的连接通信；所述处理器用于执行所述存储器中存储的数据程序，以执行以下步骤：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1-8任一项所述的方法。