CN106022723A

CN106022723A - 一种就业信息个性化推荐方法

Info

Publication number: CN106022723A
Application number: CN201610334570.3A
Authority: CN
Inventors: 李晨; 杨成; 张迎亚; 易芃
Original assignee: Communication University of China
Current assignee: Communication University of China
Priority date: 2016-05-19
Filing date: 2016-05-19
Publication date: 2016-10-12

Abstract

一种就业信息个性化推荐方法，其包括：根据目标用户的用户信息确定目标用户申请过的职位集合，得到第一职位集合，根据第一职位集合确定第一用户集合，获取第一用户集合中用户所申请过的所有职位，得到候选职位集合；根据第一职位集合分别计算目标用户对候选职位集合中各个候选职位的初始偏好度；利用职位权重和/或用户权重对各个候选职位的初始偏好度进行修正，得到各个候选职位的修正偏好度，根据各个候选职位的修正偏好度生成针对目标用户的推荐职位。该方法能够使得最终得到的推荐职位与目标用户更加匹配，从而提高了就业信息推荐的准确性、有效性和可靠性。

Description

一种就业信息个性化推荐方法

技术领域

本发明涉及就业信息推荐技术领域，具体地说，涉及一种就业信息个性化推荐方法。

背景技术

求职者简历信息中“所学专业”这个属性在求职过程中极为重要，若应聘者所学专业与职位需求不匹配，会大大降低求职的成功率。当计算两位求职者个人信息的相似度时，“所学专业”也是非常重要的属性。

现有方法多是采用空间余弦向量相似性来度量两个专业之间的相似程度，而这种度量方式存在准确度差的问题。例如，“会计学”专业和“社会学”专业在字面上相似程度非常高，用余弦向量表示二者，得到的相似度是66.7％，然而实际上这两个专业所学内容相差很多。相反，“会计学”专业毕业生和“财务管理”专业毕业生经常竞聘相同的职位，而采用空间余弦向量的方式所得到的这两者的相似度为0。

另一个问题是，在现实的招聘环境中，用人单位所发布的招聘职位介绍中，专业要求有时并不那么明朗、清晰和全面。举例来说，某互联网公司招聘研发工程师，职位要求中这样描述：“计算机或相关专业”。某毕业生所学专业为“软件工程”，他完全符合该职位的一切要求，但他在传统的网络求职方式中，使用信息检索的方式筛选“专业”为“软件工程”，所搜索得出的职位可能并不包含这一条信息。

在某些情况下，甚至大多数信息聚合类求职网站中根本没有提供专业筛选功能。因为绝大多数用人单位发布招聘信息时，发布的是一整段关于职位描述、职位需求的自由文本，“专业要求”就蕴含于其中，这些求职网站为求省事，并不会将专业要求单独作为格式化文本提取出来。而针对该问题，求职学生能做的就是不断浏览更多的招聘信息，人为判断自己所学的专业“软件工程”是否符合职位描述中的“计算机或相关专业”要求。

基于上述情况，亟需一种能够准确进行就业信息推荐的方法。

发明内容

为解决上述问题，本发明提供了一种就业信息个性化推荐方法，所述方法包括：

候选职位集合生成步骤，根据目标用户的用户信息确定所述目标用户申请过的职位集合，得到第一职位集合，根据所述第一职位集合确定第一用户集合，获取所述第一用户集合中用户所申请过的所有职位，得到候选职位集合；

用户初始偏好度确定步骤，根据所述第一职位集合分别计算所述目标用户对所述候选职位集合中各个候选职位的初始偏好度；

推荐职位生成步骤，利用职位权重和/或用户权重对所述各个候选职位的初始偏好度进行修正，得到所述各个候选职位的修正偏好度，根据所述各个候选职位的修正偏好度生成针对于所述目标用户的推荐职位。

根据本发明的一个实施例，根据如下表达式计算各个候选职位的修正偏好度：

p r e f (U_{i}, {Item}_{j}^{i}) = {pref}_{o} (U_{i}, {Item}_{j}^{i}) * ω_{H} ({Item}_{j}^{i})

或，

其中，和分别表示用户U_i对候选职位集合Itemⁱ中第j个候选职位的初始偏好度和修正偏好度，和分别表示候选职位的职位权重和用户权重。

根据本发明的一个实施例，在所述候选职位集合生成步骤中，统计申请了所述第一职位集合中职位的用户，得到所述第一用户集合。

根据本发明的一个实施例，根据如下表达式计算各个候选职位的初始偏好度：

{pref}_{o} (U_{i}, {Item}_{j}^{i}) = Σ_{l = 1}^{K} s i m J ({Item}_{l}^{U_{i}}, {Item}_{j}^{i})

其中，表示用户U_i对候选职位集合Itemⁱ中第j个候选职位的初始偏好度，K表示第一职位集合所包含的职位数量，表示第一职位集合中第l个职位与候选职位集合Itemⁱ中第j个候选职位的相似度。

根据本发明的一个实施例，确定所述候选职位集合中各个职位的职位权重的步骤包括：

分别计算所述候选职位集合中一职位与所述第一职位集合中各个职位之间的相似度，得到第一相似度集合；

选取所述第一相似度集合中的最大相似度，根据所述最大相似度计算该职位的职位权重。

根据本发明的一个实施例，根据如下表达式计算所述候选职位集合中各个职位的职位权重：

ω_{H} ({Item}_{j}^{i}) = 1 + m a x (s i m J ({Item}_{j}^{i}, {Item}_{m}^{U_{i}})), {Item}_{m}^{U_{i}} &Element; {Item}^{U_{i}}

其中，分别表示候选职位的职位权重，表示候选职位与第一职位集合中第m个职位之间的相似度。

根据本发明的一个实施例，根据如下表达式计算两个职位之间的相似度：

s i m J ({Item}_{x}, {Item}_{y}) = Π_{l = 1}^{q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) * \frac{Σ_{l = q + 1}^{Q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}})}{Q - q}

f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) = \{\begin{matrix} 0 ... ... J_{l}^{{Item}_{x}} &NotEqual; J_{l}^{{Item}_{y}} \\ 1 ... ... J_{l}^{{Item}_{x}} = J_{l}^{{Item}_{y}} \end{matrix}

其中，simJ(Item_x,Item_y)表示职位Item_x与职位Item_y之间的相似度，和分别表示职位Item_x与职位Item_y的职位信息中第l个参数，Q表示职位信息包含参数的总数，q表示职位信息中所包含的第一类型参数的数量。

根据本发明的一个实施例，确定所述候选职位集合中各个候选职位的用户权重的步骤包括：

对于所述候选职位集合中的任一候选职位，获取申请过该候选职位的用户集合，得到第二用户集合；

计算所述目标用户与第二用户集合中各个用户之间的用户相似度，根据计算得到的用户相似度计算该候选职位的用户权重。

根据本发明的一个实施例，根据如下表达计算所述候选职位集合中各个职位的用户权重：

ω_{U} ({Item}_{j}^{i}) = 1 + m a x (s i m (U_{i}, U_{o})), U_{o} &Element; U^{{Item}_{j}^{i}}

其中，表示候选职位的用户权重，sim(U_i,U_o)表示用户U_i与用户U_o之间的用户相似度，表示申请过候选职位的用户集合。

根据本发明的一个实施例，计算两个用户之间的用户相似度的步骤包括：

分别获取两个用户的专业信息，并根据所述专业信息计算这两个用户之间的专业相似度；

分别获取两个用户的简历信息，并根据所述简历信息计算这两个用户之间的简历信息相似度；

根据所述专业相似度和简历信息相似度，计算这两个用户之间的用户相似度。

根据本发明的一个实施例，根据如下表达式计算两个用户之间的用户相似度：

s i m (U_{i}, U_{o}) = a * s i m M (m_{U_{i}}, m_{U_{o}}) + b * s i m B (U_{i}, U_{o})

其中，sim(U_i,U_o)表示用户U_i与用户U_o之间的用户相似度，和simB(U_i,U_o)分别表示用户U_i与用户U_o之间的专业相似度和简历信息相似度，a和b分别表示专业相似度和简历信息相似度的加权系数。

根据本发明的一个实施例，根据如下表达式计算专业相似度：

s i m M (m_{a}, m_{b}) = \{\begin{matrix} 0 & S (m_{a}, m_{b}) < ϵ \\ m a x (C (m_{a} &RightArrow; m_{b}), C (m_{b} &RightArrow; m_{a})) & S (m_{a}, m_{b}) &GreaterEqual; ϵ \end{matrix}

其中，simM(m_a,m_b)表示专业m_a与专业m_b之间的相似度，S(m_a,m_b)表示专业m_a与专业m_b之间的支持度，ε表示预设支持度阈值，C(m_a→m_b)表示专业m_a到专业m_b的置信度，C(m_b→m_a)表示专业m_b到专业m_a的置信度。

根据本发明的一个实施例，根据如下表达式计算两个专业之间的支持度：

S (m_{a}, m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| I |}

其中，S(m_a,m_b)表示专业m_a与专业m_b之间的支持度，|*|表示集合*中元素的个数，表示招聘时同时招聘了专业m_a和专业m_b的职位集合，I_n表示已完成招聘的职位集合I中的第n个职位，表示职位I_n的受聘人员的专业集合。

根据本发明的一个实施例，

根据如下表达式计算置信度C(m_a→m_b)：

C (m_{a} &RightArrow; m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{a} &Element; M^{I_{n}}, I_{m} &Element; I} |}

根据如下表达式计算置信度C(m_b→m_a)：

C (m_{b} &RightArrow; m_{a}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{b} &Element; M^{I_{n}}, I_{m} &Element; I} |}

其中，|*|表示集合*中元素的个数，表示招聘时同时招聘了专业m_a和专业m_b的职位集合，表示招聘时招聘了专业m_a的职位集合，招聘时招聘了专业m_b的职位集合，I_n表示已完成招聘的职位集合I中的第n个职位，表示职位I_n的受聘人员的专业集合。

根据本发明的一个实施例，根据如下表达计算两个用户之间的简历信息相似度：

s i m B (U_{i}, U_{o}) = \frac{Σ_{r = 1}^{R} ω_{l} * f (S_{r}^{U_{i}}, S_{r}^{U_{o}})}{Σ_{r = 1}^{R} ω_{r}}

f (S_{r}^{U_{i}}, S_{r}^{U_{o}}) = \{\begin{matrix} 0 ... ... S_{r}^{U_{i}} &NotEqual; S_{r}^{U_{o}} \\ 1 ... ... S_{r}^{U_{i}} = S_{r}^{U_{o}} \end{matrix}

其中，simB(U_i,U_o)表示用户U_i与用户U_o之间的简历信息相似度，ω_r表示简历信息中的第r个信息的权重，表示用户U_i与用户U_o的简历信息中的第r个信息的相似度，R表示简历信息中所包含信息的总数。

根据本发明的一个实施例，在所述推荐职位生成步骤中，将修正偏好度最高的预设数量的候选职位作为推荐职位。

本发明所提供的就业信息推荐方法在计算得到用户对各个候选职位的初始偏好度的基础上，通过引入职位权重和用户权重来对初始偏好度进行修正，并根据修正偏好度来生成推荐职位，这样能够使得得到最终得到的推荐职位与目标用户更加匹配，从而提高了就业信息推荐的准确性、有效性和可靠性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要的附图做简单的介绍：

图1是根据本发明一个实施例的就业信息个性化推荐方法的流程图；

图2是根据本发明一个实施例的计算某一职位的职位权重的流程图；

图3是根据本发明一个实施例的计算用户权重的流程图；

图4是根据本发明一个实施例的计算两个用户之间的用户相似度的流程图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例以及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。

同时，在以下说明中，出于解释的目的而阐述了许多具体细节，以提供对本发明实施例的彻底理解。然而，对本领域的技术人员来说显而易见的是，本发明可以不用这里的具体细节或者所描述的特定方式来实施。

另外，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

考虑到就业信息推荐过程中，可用职位的有效期较短，系统中待分析的职位数量往往远远小于求职用户的数量，同时，职位需求的稳定性在一定程度上要高于用户求职意向的稳定性，因此本发明所提供的方法采用了基于项目的协同过滤算法来实现就业信息的个性化推荐。

假设用户集合为U:{U₁,U₂,...,U_N}，其中，U_i表示用户集合中的第i个用户，N表示用户集合中用户总数，由于针对各个用户的就业信息推荐原理以及过程相同，因此为了描述的方便，以下以用户U_i作为目标用户为例来对本实施例所提供的就业信息个性化推荐方法的实现原理以及实现过程作进一步的说明。

图1示出了本实施例所提供的就业信息个性化推荐方法的流程图。

如图1所示，本实施例所提供的就业信息推荐方法首先在步骤S101中根据目标用户的用户信息确定目标用户申请过的职位集合，从而得到第一职位集合。具体地，由于目标用户U_i使用就业信息推荐系统进行过求职，因此该就业信息推荐系统的数据库中会存储有目标用户U_i所申请过的职位，该方法可以根据用户ID等用户信息来检索就业信息推荐系统的数据库中的相关数据来确定第一职位集合。

本实施例中，第一职位集合可以表示为其中，表示第一职位集合中的第j个职位，K表示第一职位集合中所包含的职位总数。

需要指出的是，在本发明的其他实施例中，该方法在步骤S101中还可以采用其他合理的方式来确定出第一职位集合，本发明不限于此。

当得到第一职位集合后，该方法在步骤S102中根据第一职位集合来确定第一用户集合，并获取第一用户集合中用户所申请过的所有职位，从而得到候选职位集合。

本实施例中，该方法会在步骤S102中针对第一职位集合中的每一个职位，检索申请过该职位的用户，通过整合便可以得到申请过第一职位集合中职位的所有用户的集合，从而得到第一用户集合。

对于第一用户集合中的各个用户，通过检索该用户所申请过的职位，通过整合也就可以得到申请了第一职位集合中职位的用户所申请过的职位，即候选职位集合。而候选职位集合中的各个职位即为潜在的符合目标用户U_i期望的职位。本实施例中，对于目标用户U_i，其候选职位集合可以表示为P表示候选职位集合所包含的候选职位的总数。

如果两个不同用户申请了同一职位，那么显然这两个用户之间存在一定的相似性。这可能是两个用户所学专业可能相同或相似，也可能是两个用户的工作精力相同或相似，抑或是其他原因使得这两个用户能够申请同一职位。而对于一个用户所申请过的其他职位，另一个用户也很可能同样能够适应该职位的要求。因此本实施例所提供的方法在确定候选职位集合时，首先通过确定哪些用户申请了目标用户U_i曾经申请的职位，随后统计这些用户所申请的职位集合，从而确定出候选职位集合。

如图1所示，当得到候选职位集合后，该方法在步骤S103中根据第一职位集合分别计算目标用户U_i对候选职位集合Itemⁱ中各个候选职位的初始偏好度。其中，目标用户U_i对各个候选职位的偏好度能够定量地反映出目标用户对各个候选职位的喜好程度。

具体地，本实施例中，该方法在步骤S103中根据如下表式来计算目标用户U_i对各个候选职位的初始偏好度：

{pref}_{o} (U_{i}, {Item}_{j}^{i}) = Σ_{l = 1}^{K} s i m J ({Item}_{l}^{U_{i}}, {Item}_{j}^{i}) - - - (1)

其中，表示目标用户U_i对候选职位集合Itemⁱ中第j个候选职位的初始偏好度，表示第一职位集合中第l个职位与候选职位集合Itemⁱ中第j个候选职位的相似度。

其中，两个职位之间的相似度优选地可以根据职位的基本职位信息来计算得到。对于某一职位Item_j来说，其职位信息可以表示为：

J_{{Item}_{j}} = {J_{1}^{{Item}_{j}}, J_{2}^{{Item}_{j}}, ..., J_{Q}^{{Item}_{j}}} - - - (2)

其中，Q表示职位信息包含参数的总数。

而对于两个职位Item_x和Item_y来说，这两个职位之间的相似度simJ(Item_x,Item_y)可以根据如下表达式计算得到：

s i m J ({Item}_{x}, {Item}_{y}) = Π_{l = 1}^{q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) * \frac{Σ_{l = q + 1}^{Q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}})}{Q - q} - - - (3)

f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) = \{\begin{matrix} 0 ... ... J_{l}^{{Item}_{x}} &NotEqual; J_{l}^{{Item}_{y}} \\ 1 ... ... J_{l}^{{Item}_{x}} = J_{l}^{{Item}_{y}} \end{matrix} - - - (4)

其中，q表示职位信息中所包含的第一类型参数的数量。

本实施例中，某一职位的职位信息中的第一类型参数表征对于相似度取值影响较大的参数，而第二类型参数表征相似度取值影响较小的参数。

本实施例中，各个职位的基本职位信息优选地可以包括：所属领域、学历要求、职位名称、工作地点以及工作类型等5个参数。因此对于职位Item_j来说，上述表达式(2)中的参数Q的取值为5。而对于上述5个参数来说，所述领域和学历要求对于相似度取值的影响较大，这两个参数属于第一类型参数；而其余参数对于相似度取值的影响较小，其属于第二类型参数。因此，本实施例中，表达式(4)中参数q的取值为2。

因此，本实施例中，两个职位之间的相似度具体地可以根据如下表达式计算得到：

s i m J ({Item}_{x}, {Item}_{y}) = Π_{l = 1}^{2} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) * \frac{Σ_{l = 3}^{5} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}})}{3} - - - (5)

f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) = \{\begin{matrix} 0 ... ... J_{l}^{{Item}_{x}} &NotEqual; J_{l}^{{Item}_{y}} \\ 1 ... ... J_{l}^{{Item}_{x}} = J_{l}^{{Item}_{y}} \end{matrix} - - - (6)

需要指出的是，在本发明的其他实施例中，各个职位的职位信息还可以包含其他合理参数，本发明不限于此。

利用目标用户U_i对各个候选职位的初始偏好度虽然能够在一定程度上达到向目标用户推荐就业信息的目的，但是所推荐的就业信息往往与目标用户U_i的匹配程度不高。为此，本实施例所提供的方法引入了额外的参数来对步骤S103中所得到的初始偏好程度的取值进行修正，从而改善最终得到的推荐职位的准确度。

如图1所示，在得到目标用户U_i对各个候选职位的初始偏好度后，本方法在步骤S104中利用职位权重和用户权重来对各个候选职位的初始偏好度初始偏好度进行修正，从而得到目标用户对各个候选职位的修正偏好度。

在得到各个候选职位的修正偏好度后，该方法便可以在步骤S105中根据各个候选职位的修正偏好度生成推荐职位。具体地，本方法在步骤S105中根据各个候选职位的修正偏好度的取值大小，按照取值由大到小的顺序对候选职位集合中的所有候选职位进行排序，并选取排位最为考前的预设数量的候选职位来作为推荐职位。

本实施例中，根据如下表达式来计算目标用户对各个候选职位的修正偏好度：

p r e f (U_{i}, {Item}_{j}^{i}) = {pref}_{o} (U_{i}, {Item}_{j}^{i}) * ω_{H} ({Item}_{j}^{i}) * ω_{U} ({Item}_{j}^{i}) - - - (7)

其中，表示目标用户U_i对候选职位集合Itemⁱ中第j个候选职位的修正偏好度，和分别表示候选职位的职位权重和用户权重。

职位权重能够反映目标用户历史投递职位自身的特征属性，图2示出了本实施例中计算某一职位的职位权重的流程图。

如图2所示，本实施例中，该方法在计算候选职位集合Itemⁱ中各个职位的职位权重时，首先在步骤S201中分别计算该候选职位与第一职位集合中个恶搞职位之间的相似度，从而得到第一相似度集合。在得到第一相似度集合后，该方法在步骤S202中选取第一相似度集合中的最大相似度，并根据最大相似度计算该候选职位的职位权重。

该方法在步骤S201中计算某候选职位与第一职位集合中各个职位之间的相似度时，其实现原理与实现过程如上表达式(5)和表达式(6)所涉及的内容类似，故在此不再赘述。

在得到该候选职位与第一职位集合中各个职位之间的相似度后，该方法在步骤S202中根据如下表达式计算该候选职位的职位权重：

ω_{H} ({Item}_{j}^{i}) = 1 + \max (s i m J ({Item}_{j}^{i}, {Item}_{m}^{U_{i}})), {Item}_{m}^{U_{i}} &Element; {Item}^{U_{i}} - - - (8)

在计算用户对职位可能的偏好程度时，与目标用户更相似的用户对首选职位的偏好权重值应该更大。因此，在计算目标用户U_i对候选职位的偏好度时，需要引入对申请过候选职位的用户与目标用户U_i之间相似度(即用户相似度)的权重考量。

具体地，如图3所示，本实施例所提供的方法在计算候选职位的用户权重时，首先在步骤S301中获取申请过候选职位的用户集合，从而得到得第二用户集合

在步骤S302中，计算目标用户与第二用户集合中各个用户之间的用户相似度。本实施例中，两个用户之间的用户相似度优选地利用这两个用户之间的专业相似度和简历信息相似度来计算。

“所学专业”这个属性在求职过程中扮演着即为重要的角色，如果应聘者所学专业与职位需求不匹配，那么会大大降低用户的求职成功率。而简单地从字面角度来对用户的专业进行分析，得出的专业相似度可靠性不高。本实施例所提供的方法通过分析发现，同一职位的申请者的专业分布相似度往往很高，因此本方法通过分析同一职位的申请专业分析来挖掘专业之间的相似度。

如图4所示，本实施例所提供的方法在计算两个用户之间的用户相似度时，首先在步骤S401中分别获取这两个用户的专业信息，并根据专业信息计算这两个用户之间的专业相似度。

具体地，本方法通过计算两个个专业之间的支持度和置信度来计算来两个用户之间的专业相似度。其中，两个专业之间的支持度可以根据下表达式计算得到：

S (m_{a}, m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| I |} - - - (9)

而在计算两个专业之间的置信度时，本方法将分别计算专业m_a到专业m_b的置信度C(m_a→m_b)和专业m_b到专业m_a的置信度C(m_b→m_a)。

具体地，本实施例中，专业m_a到专业m_b的置信度C(m_a→m_b)优选地可以根据如下表达式计算得到：

C (m_{a} &RightArrow; m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{a} &Element; M^{I_{n}}, I_{m} &Element; I} |} - - - (10)

专业m_a的置信度C(m_b→m_a)的置信度C(m_b→m_a)则可以根据如下表达式计算得到：

C (m_{b} &RightArrow; m_{a}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{b} &Element; M^{I_{n}}, I_{m} &Element; I} |} - - - (11)

其中，表示招聘时招聘了专业m_a的职位集合，招聘时招聘了专业m_b的职位集合，I_n表示已完成招聘的职位集合I中的第n个职位，表示职位I_n的受聘人员的专业集合。

在得到两个专业之间的支持度和置信度后，两个用户之间的专业相似度simM(m_a,m_b)便可以根据如下表达式计算得到：

s i m M (m_{a}, m_{b}) = \{\begin{matrix} 0 & S (m_{a}, m_{b}) < ϵ \\ m a x (C (m_{a} &RightArrow; m_{b}), C (m_{b} &RightArrow; m_{a})) & S (m_{a}, m_{b}) &GreaterEqual; ϵ \end{matrix} - - - (12)

其中，simM(m_a,m_b)表示专业m_a与专业m_b之间的相似度，S(m_a,m_b)表示专业m_a与专业m_b之间的支持度，ε表示预设支持度阈值，

如图4所示，在得到两个用户之间的专业相似度后，该方法将在步骤S402中分别获取这两个用户之间的简历信息，并根据所获取的简历信息计算这两个用户之间的简历信息相似度。

本实施例中，该方法通过两个用户的简历信息中的特定参数来计算这两个用户的简历信息相似度。具体地，两个用户之间的简历信息相似度优选地可以根据下表达式计算得到：

s i m B (U_{i}, U_{o}) = \frac{Σ_{r = 1}^{R} ω_{l} * f (S_{r}^{U_{i}}, S_{r}^{U_{o}})}{Σ_{r = 1}^{R} ω_{r}} - - - (13)

f (S_{r}^{U_{i}}, S_{r}^{U_{o}}) = \{\begin{matrix} 0 ... ... S_{r}^{U_{i}} &NotEqual; S_{r}^{U_{o}} \\ 1 ... ... S_{r}^{U_{i}} = S_{r}^{U_{o}} \end{matrix} - - - (14)

其中，simB(U_i,U_o)表示用户U_i与用户U_o之间的简历信息相似度，ω_r表示简历信息中的第r个信息的权重，表示用户U_i与用户U_o的简历信息中的第r个信息和的相似度，R表示简历信息中所包含信息的总数。

本实施例中，在计算两个用户之间的简历信息相似度时，优选地从性别、学历、地区以及政治面貌私个方便来进行计算。因此，上述表达式(13)和(14)便可以相应地表示为：

s i m B (U_{i}, U_{o}) = \frac{Σ_{r = 1}^{4} ω_{r} * f (S_{r}^{U_{i}}, S_{r}^{U_{o}})}{Σ_{r = 1}^{4} ω_{r}} - - - (15)

f (S_{r}^{U_{i}}, S_{r}^{U_{o}}) = \{\begin{matrix} 0 ... ... S_{r}^{U_{i}} &NotEqual; S_{r}^{U_{o}} \\ 1 ... ... S_{r}^{U_{i}} = S_{r}^{U_{o}} \end{matrix} - - - (16)

在得到两个用户之间的专业相似度和简历信息相似度后，该方法便可以在步骤S403中根据专业相似度和简历信息相似度来计算出这两个用户之间的用户相似度。

具体地，本实施例中，采用对专业相似度和简历信息相似度加权求和的方式来计算两个用户之间的用户相似度，即存在：

s i m (U_{i}, U_{o}) = a * s i m M (m_{U_{i}}, m_{U_{o}}) + b * s i m B (U_{i}, U_{o}) - - - (17)

其中，sim(U_i,U_o)表示用户U_i与用户U_o之间的用户相似度，a和b分别表示专业相似度和简历信息相似度的加权系数。本实施例中，加权系数a和b优选地分别设定为0.6和0.4。

需要指出的是，在本发明的其他实施例中，在计算两个用户之间的用户相似度的过程中，还可以先计算这两个用户之间的简历信息相似度，再计算这两个用户之间的专业相似度，即图4中的步骤S401与步骤S402的执行顺序颠倒，本发明不限于此。

再次如图3所示，在得到目标用户与第二用户集合中各个用户之间的用户相似度后，该方法在步骤S303中根据步骤S302中所得到的用户相似度计算该候选职位的用户权重。

具体地，候选职位的用户权重优选地可以根据如下表达式计算得到：

ω_{U} ({Item}_{j}^{i}) = 1 + m a x (s i m (U_{i}, U_{o})), U_{o} &Element; U^{{Item}_{j}^{i}} - - - (18)

需要指出的是，在本法阿明的其他实施例中，还可以采用其他合理方式来计算各个候选职位的用户权重，本发明不限于此。

需要指出的是，在本发明的其他实施例中，根据实际需要，还可以仅利用职位权重或用户权重来对各个候选职位的初始偏好度进行修正，本发明不限于此。其中，当仅利用职位权重对各个候选职位的初始偏好度进行修正时，各个候选职位的修正偏好度可以采用如下表达式计算得到：

p r e f (U_{i}, {Item}_{j}^{i}) = {pref}_{o} (U_{i}, {Item}_{j}^{i}) * ω_{H} ({Item}_{j}^{i}) - - - (19)

当仅利用用户权重对各个候选职位的初始偏好度进行修正时，各个候选职位的修正偏好度可以采用如下表达式计算得到：

p r e f (U_{i}, {Item}_{j}^{i}) = {pref}_{o} (U_{i}, {Item}_{j}^{i}) * ω_{U} ({Item}_{j}^{i}) - - - (20)

从上述描述中可以看出，本发明所提供的就业信息推荐方法在计算得到用户对各个候选职位的初始偏好度的基础上，通过引入职位权重和用户权重来对初始偏好度进行修正，并根据修正偏好度来生成推荐职位，这样能够使得得到最终得到的推荐职位与目标用户更加匹配，从而提高了就业信息推荐的准确性、有效性和可靠性。

应该理解的是，本发明所公开的实施例不限于这里所公开的特定处理步骤，而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是，在此使用的术语仅用于描述特定实施例的目的，而并不意味着限制。

说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。

虽然上述示例用于说明本发明在一个或多个应用中的原理，但对于本领域的技术人员来说，在不背离本发明的原理和思想的情况下，明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此，本发明由所附的权利要求书来限定。

Claims

1.一种就业信息个性化推荐方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，根据如下表达式计算各个候选职位的修正偏好度：

p r e f (U_{i}, {Item}_{j}^{i}) = {pref}_{o} (U_{i}, {Item}_{j}^{i}) * ω_{H} ({Item}_{j}^{i})

或，

3.如权利要求1或2所述的方法，其特征在于，在所述候选职位集合生成步骤中，统计申请了所述第一职位集合中职位的用户，得到所述第一用户集合。

4.如权利要求1～3中任一项所述的方法，其特征在于，根据如下表达试计算各个候选职位的初始偏好度：

{pref}_{o} (U_{i}, {Item}_{j}^{i}) = Σ_{l = 1}^{K} s i m J ({Item}_{l}^{U_{i}}, {Item}_{j}^{i})

5.如权利要求1～4中任一项所述的方法，其特征在于，确定所述候选职位集合中各个职位的职位权重的步骤包括：

6.如权利要求5所述的方法，其特征在于，根据如下表达式计算所述候选职位集合中各个职位的职位权重：

ω_{H} ({Item}_{j}^{i}) = 1 + m a x (s i m J ({Item}_{j}^{i}, {Item}_{m}^{U_{i}})), {Item}_{m}^{U_{i}} &Element; {Item}^{U_{i}}

7.如权利要求4～6中任一项所述的方法，其特征在于，根据如下表达式计算两个职位之间的相似度：

s i m J ({Item}_{x}, {Item}_{y}) = Π_{l = 1}^{q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) * \frac{Σ_{l = q + 1}^{Q} f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}})}{Q - q}

f (J_{l}^{{Item}_{x}}, J_{l}^{{Item}_{y}}) = \{\begin{matrix} 0 ... ... J_{l}^{{Item}_{x}} &NotEqual; J_{l}^{{Item}_{y}} \\ 1 ... ... J_{l}^{{Item}_{x}} = J_{l}^{{Item}_{y}} \end{matrix}

8.如权利要求1～7中任一项所述的方法，其特征在于，确定所述候选职位集合中各个候选职位的用户权重的步骤包括：

9.如权利要求8所述的方法，其特征在于，根据如下表达计算所述候选职位集合中各个职位的用户权重：

ω_{U} ({Item}_{j}^{i}) = 1 + m a x (s i m (U_{i}, U_{o})), U_{o} &Element; U^{{Item}_{j}^{i}}

10.如权利要求8或9所述的方法，其特征在于，计算两个用户之间的用户相似度的步骤包括：

11.如权利要求10所述的方法，其特征在于，根据如下表达式计算两个用户之间的用户相似度：

s i m (U_{i}, U_{o}) = a * s i m M (m_{U_{i}}, m_{U_{o}}) + b * s i m B (U_{i}, U_{o})

12.如权利要求10或11所述的方法，其特征在于，根据如下表达式计算专业相似度：

s i m M (m_{a}, m_{b}) = \{\begin{matrix} 0 & S (m_{a}, m_{b}) < ϵ \\ m a x (C (m_{a} &RightArrow; m_{b}), C (m_{b} &RightArrow; m_{a})) & S (m_{a}, m_{b}) &GreaterEqual; ϵ \end{matrix}

13.如权利要求12所述的方法，其特征在于，根据如下表达式计算两个专业之间的支持度：

S (m_{a}, m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| I |}

14.如权利要求12或13所述的方法，其特征在于，

根据如下表达式计算置信度C(m_a→m_b)：

C (m_{a} &RightArrow; m_{b}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{a} &Element; M^{I_{n}}, I_{m} &Element; I} |}

根据如下表达式计算置信度C(m_b→m_a)：

C (m_{b} &RightArrow; m_{a}) = \frac{| {I_{n} | m_{a} &Element; M^{I_{n}}, m_{b} &Element; M^{I_{n}}, I_{n} &Element; I} |}{| {I_{m} | m_{b} &Element; M^{I_{n}}, I_{m} &Element; I} |}

15.如权利要求10～14中任一项所述的方法，其特征在于，根据如下表达计算两个用户之间的简历信息相似度：

s i m B (U_{i}, U_{o}) = \frac{Σ_{r = 1}^{R} ω_{l} * f (S_{r}^{U_{i}}, S_{r}^{U_{o}})}{Σ_{r = 1}^{R} ω_{r}}

f (S_{r}^{U_{i}}, S_{r}^{U_{o}}) = \{\begin{matrix} 0 ... ... S_{r}^{U_{i}} &NotEqual; S_{r}^{U_{o}} \\ 1 ... ... S_{r}^{U_{i}} = S_{r}^{U_{o}} \end{matrix}

16.如权利要求1～15中任一项所述的方法，其特征在于，在所述推荐职位生成步骤中，将修正偏好度最高的预设数量的候选职位作为推荐职位。