CN106022723A - 一种就业信息个性化推荐方法 - Google Patents

一种就业信息个性化推荐方法 Download PDF

Info

Publication number
CN106022723A
CN106022723A CN201610334570.3A CN201610334570A CN106022723A CN 106022723 A CN106022723 A CN 106022723A CN 201610334570 A CN201610334570 A CN 201610334570A CN 106022723 A CN106022723 A CN 106022723A
Authority
CN
China
Prior art keywords
user
item
candidate
similarity
represent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610334570.3A
Other languages
English (en)
Inventor
李晨
杨成
张迎亚
易芃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201610334570.3A priority Critical patent/CN106022723A/zh
Publication of CN106022723A publication Critical patent/CN106022723A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种就业信息个性化推荐方法,其包括:根据目标用户的用户信息确定目标用户申请过的职位集合,得到第一职位集合,根据第一职位集合确定第一用户集合,获取第一用户集合中用户所申请过的所有职位,得到候选职位集合;根据第一职位集合分别计算目标用户对候选职位集合中各个候选职位的初始偏好度;利用职位权重和/或用户权重对各个候选职位的初始偏好度进行修正,得到各个候选职位的修正偏好度,根据各个候选职位的修正偏好度生成针对目标用户的推荐职位。该方法能够使得最终得到的推荐职位与目标用户更加匹配,从而提高了就业信息推荐的准确性、有效性和可靠性。

Description

一种就业信息个性化推荐方法
技术领域
本发明涉及就业信息推荐技术领域,具体地说,涉及一种就业信息个性化推荐方法。
背景技术
求职者简历信息中“所学专业”这个属性在求职过程中极为重要,若应聘者所学专业与职位需求不匹配,会大大降低求职的成功率。当计算两位求职者个人信息的相似度时,“所学专业”也是非常重要的属性。
现有方法多是采用空间余弦向量相似性来度量两个专业之间的相似程度,而这种度量方式存在准确度差的问题。例如,“会计学”专业和“社会学”专业在字面上相似程度非常高,用余弦向量表示二者,得到的相似度是66.7%,然而实际上这两个专业所学内容相差很多。相反,“会计学”专业毕业生和“财务管理”专业毕业生经常竞聘相同的职位,而采用空间余弦向量的方式所得到的这两者的相似度为0。
另一个问题是,在现实的招聘环境中,用人单位所发布的招聘职位介绍中,专业要求有时并不那么明朗、清晰和全面。举例来说,某互联网公司招聘研发工程师,职位要求中这样描述:“计算机或相关专业”。某毕业生所学专业为“软件工程”,他完全符合该职位的一切要求,但他在传统的网络求职方式中,使用信息检索的方式筛选“专业”为“软件工程”,所搜索得出的职位可能并不包含这一条信息。
在某些情况下,甚至大多数信息聚合类求职网站中根本没有提供专业筛选功能。因为绝大多数用人单位发布招聘信息时,发布的是一整段关于职位描述、职位需求的自由文本,“专业要求”就蕴含于其中,这些求职网站为求省事,并不会将专业要求单独作为格式化文本提取出来。而针对该问题,求职学生能做的就是不断浏览更多的招聘信息,人为判断自己所学的专业“软件工程”是否符合职位描述中的“计算机或相关专业”要求。
基于上述情况,亟需一种能够准确进行就业信息推荐的方法。
发明内容
为解决上述问题,本发明提供了一种就业信息个性化推荐方法,所述方法包括:
候选职位集合生成步骤,根据目标用户的用户信息确定所述目标用户申请过的职位集合,得到第一职位集合,根据所述第一职位集合确定第一用户集合,获取所述第一用户集合中用户所申请过的所有职位,得到候选职位集合;
用户初始偏好度确定步骤,根据所述第一职位集合分别计算所述目标用户对所述候选职位集合中各个候选职位的初始偏好度;
推荐职位生成步骤,利用职位权重和/或用户权重对所述各个候选职位的初始偏好度进行修正,得到所述各个候选职位的修正偏好度,根据所述各个候选职位的修正偏好度生成针对于所述目标用户的推荐职位。
根据本发明的一个实施例,根据如下表达式计算各个候选职位的修正偏好度:
p r e f ( U i , Item j i ) = pref o ( U i , Item j i ) * ω H ( Item j i )
或,
或,
其中,分别表示用户Ui对候选职位集合Itemi中第j个候选职位的初始偏好度和修正偏好度,分别表示候选职位的职位权重和用户权重。
根据本发明的一个实施例,在所述候选职位集合生成步骤中,统计申请了所述第一职位集合中职位的用户,得到所述第一用户集合。
根据本发明的一个实施例,根据如下表达式计算各个候选职位的初始偏好度:
pref o ( U i , Item j i ) = Σ l = 1 K s i m J ( Item l U i , Item j i )
其中,表示用户Ui对候选职位集合Itemi中第j个候选职位的初始偏好度,K表示第一职位集合所包含的职位数量,表示第一职位集合中第l个职位与候选职位集合Itemi中第j个候选职位的相似度。
根据本发明的一个实施例,确定所述候选职位集合中各个职位的职位权重的步骤包括:
分别计算所述候选职位集合中一职位与所述第一职位集合中各个职位之间的相似度,得到第一相似度集合;
选取所述第一相似度集合中的最大相似度,根据所述最大相似度计算该职位的职位权重。
根据本发明的一个实施例,根据如下表达式计算所述候选职位集合中各个职位的职位权重:
ω H ( Item j i ) = 1 + m a x ( s i m J ( Item j i , Item m U i ) ) , Item m U i ∈ Item U i
其中,分别表示候选职位的职位权重,表示候选职位与第一职位集合中第m个职位之间的相似度。
根据本发明的一个实施例,根据如下表达式计算两个职位之间的相似度:
s i m J ( Item x , Item y ) = Π l = 1 q f ( J l Item x , J l Item y ) * Σ l = q + 1 Q f ( J l Item x , J l Item y ) Q - q
f ( J l Item x , J l Item y ) = 0 ... ... J l Item x ≠ J l Item y 1 ... ... J l Item x = J l Item y
其中,simJ(Itemx,Itemy)表示职位Itemx与职位Itemy之间的相似度,分别表示职位Itemx与职位Itemy的职位信息中第l个参数,Q表示职位信息包含参数的总数,q表示职位信息中所包含的第一类型参数的数量。
根据本发明的一个实施例,确定所述候选职位集合中各个候选职位的用户权重的步骤包括:
对于所述候选职位集合中的任一候选职位,获取申请过该候选职位的用户集合,得到第二用户集合;
计算所述目标用户与第二用户集合中各个用户之间的用户相似度,根据计算得到的用户相似度计算该候选职位的用户权重。
根据本发明的一个实施例,根据如下表达计算所述候选职位集合中各个职位的用户权重:
ω U ( Item j i ) = 1 + m a x ( s i m ( U i , U o ) ) , U o ∈ U Item j i
其中,表示候选职位的用户权重,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,表示申请过候选职位的用户集合。
根据本发明的一个实施例,计算两个用户之间的用户相似度的步骤包括:
分别获取两个用户的专业信息,并根据所述专业信息计算这两个用户之间的专业相似度;
分别获取两个用户的简历信息,并根据所述简历信息计算这两个用户之间的简历信息相似度;
根据所述专业相似度和简历信息相似度,计算这两个用户之间的用户相似度。
根据本发明的一个实施例,根据如下表达式计算两个用户之间的用户相似度:
s i m ( U i , U o ) = a * s i m M ( m U i , m U o ) + b * s i m B ( U i , U o )
其中,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,和simB(Ui,Uo)分别表示用户Ui与用户Uo之间的专业相似度和简历信息相似度,a和b分别表示专业相似度和简历信息相似度的加权系数。
根据本发明的一个实施例,根据如下表达式计算专业相似度:
s i m M ( m a , m b ) = 0 S ( m a , m b ) < &epsiv; m a x ( C ( m a &RightArrow; m b ) , C ( m b &RightArrow; m a ) ) S ( m a , m b ) &GreaterEqual; &epsiv;
其中,simM(ma,mb)表示专业ma与专业mb之间的相似度,S(ma,mb)表示专业ma与专业mb之间的支持度,ε表示预设支持度阈值,C(ma→mb)表示专业ma到专业mb的置信度,C(mb→ma)表示专业mb到专业ma的置信度。
根据本发明的一个实施例,根据如下表达式计算两个专业之间的支持度:
S ( m a , m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | I |
其中,S(ma,mb)表示专业ma与专业mb之间的支持度,|*|表示集合*中元素的个数,表示招聘时同时招聘了专业ma和专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
根据本发明的一个实施例,
根据如下表达式计算置信度C(ma→mb):
C ( m a &RightArrow; m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m a &Element; M I n , I m &Element; I } |
根据如下表达式计算置信度C(mb→ma):
C ( m b &RightArrow; m a ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m b &Element; M I n , I m &Element; I } |
其中,|*|表示集合*中元素的个数,表示招聘时同时招聘了专业ma和专业mb的职位集合,表示招聘时招聘了专业ma的职位集合,招聘时招聘了专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
根据本发明的一个实施例,根据如下表达计算两个用户之间的简历信息相似度:
s i m B ( U i , U o ) = &Sigma; r = 1 R &omega; l * f ( S r U i , S r U o ) &Sigma; r = 1 R &omega; r
f ( S r U i , S r U o ) = 0 ... ... S r U i &NotEqual; S r U o 1 ... ... S r U i = S r U o
其中,simB(Ui,Uo)表示用户Ui与用户Uo之间的简历信息相似度,ωr表示简历信息中的第r个信息的权重,表示用户Ui与用户Uo的简历信息中的第r个信息的相似度,R表示简历信息中所包含信息的总数。
根据本发明的一个实施例,在所述推荐职位生成步骤中,将修正偏好度最高的预设数量的候选职位作为推荐职位。
本发明所提供的就业信息推荐方法在计算得到用户对各个候选职位的初始偏好度的基础上,通过引入职位权重和用户权重来对初始偏好度进行修正,并根据修正偏好度来生成推荐职位,这样能够使得得到最终得到的推荐职位与目标用户更加匹配,从而提高了就业信息推荐的准确性、有效性和可靠性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是根据本发明一个实施例的就业信息个性化推荐方法的流程图;
图2是根据本发明一个实施例的计算某一职位的职位权重的流程图;
图3是根据本发明一个实施例的计算用户权重的流程图;
图4是根据本发明一个实施例的计算两个用户之间的用户相似度的流程图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
考虑到就业信息推荐过程中,可用职位的有效期较短,系统中待分析的职位数量往往远远小于求职用户的数量,同时,职位需求的稳定性在一定程度上要高于用户求职意向的稳定性,因此本发明所提供的方法采用了基于项目的协同过滤算法来实现就业信息的个性化推荐。
假设用户集合为U:{U1,U2,...,UN},其中,Ui表示用户集合中的第i个用户,N表示用户集合中用户总数,由于针对各个用户的就业信息推荐原理以及过程相同,因此为了描述的方便,以下以用户Ui作为目标用户为例来对本实施例所提供的就业信息个性化推荐方法的实现原理以及实现过程作进一步的说明。
图1示出了本实施例所提供的就业信息个性化推荐方法的流程图。
如图1所示,本实施例所提供的就业信息推荐方法首先在步骤S101中根据目标用户的用户信息确定目标用户申请过的职位集合,从而得到第一职位集合。具体地,由于目标用户Ui使用就业信息推荐系统进行过求职,因此该就业信息推荐系统的数据库中会存储有目标用户Ui所申请过的职位,该方法可以根据用户ID等用户信息来检索就业信息推荐系统的数据库中的相关数据来确定第一职位集合。
本实施例中,第一职位集合可以表示为其中,表示第一职位集合中的第j个职位,K表示第一职位集合中所包含的职位总数。
需要指出的是,在本发明的其他实施例中,该方法在步骤S101中还可以采用其他合理的方式来确定出第一职位集合,本发明不限于此。
当得到第一职位集合后,该方法在步骤S102中根据第一职位集合来确定第一用户集合,并获取第一用户集合中用户所申请过的所有职位,从而得到候选职位集合。
本实施例中,该方法会在步骤S102中针对第一职位集合中的每一个职位,检索申请过该职位的用户,通过整合便可以得到申请过第一职位集合中职位的所有用户的集合,从而得到第一用户集合。
对于第一用户集合中的各个用户,通过检索该用户所申请过的职位,通过整合也就可以得到申请了第一职位集合中职位的用户所申请过的职位,即候选职位集合。而候选职位集合中的各个职位即为潜在的符合目标用户Ui期望的职位。本实施例中,对于目标用户Ui,其候选职位集合可以表示为P表示候选职位集合所包含的候选职位的总数。
如果两个不同用户申请了同一职位,那么显然这两个用户之间存在一定的相似性。这可能是两个用户所学专业可能相同或相似,也可能是两个用户的工作精力相同或相似,抑或是其他原因使得这两个用户能够申请同一职位。而对于一个用户所申请过的其他职位,另一个用户也很可能同样能够适应该职位的要求。因此本实施例所提供的方法在确定候选职位集合时,首先通过确定哪些用户申请了目标用户Ui曾经申请的职位,随后统计这些用户所申请的职位集合,从而确定出候选职位集合。
如图1所示,当得到候选职位集合后,该方法在步骤S103中根据第一职位集合分别计算目标用户Ui对候选职位集合Itemi中各个候选职位的初始偏好度。其中,目标用户Ui对各个候选职位的偏好度能够定量地反映出目标用户对各个候选职位的喜好程度。
具体地,本实施例中,该方法在步骤S103中根据如下表式来计算目标用户Ui对各个候选职位的初始偏好度:
pref o ( U i , Item j i ) = &Sigma; l = 1 K s i m J ( Item l U i , Item j i ) - - - ( 1 )
其中,表示目标用户Ui对候选职位集合Itemi中第j个候选职位的初始偏好度,表示第一职位集合中第l个职位与候选职位集合Itemi中第j个候选职位的相似度。
其中,两个职位之间的相似度优选地可以根据职位的基本职位信息来计算得到。对于某一职位Itemj来说,其职位信息可以表示为:
J Item j = { J 1 Item j , J 2 Item j , ... , J Q Item j } - - - ( 2 )
其中,Q表示职位信息包含参数的总数。
而对于两个职位Itemx和Itemy来说,这两个职位之间的相似度simJ(Itemx,Itemy)可以根据如下表达式计算得到:
s i m J ( Item x , Item y ) = &Pi; l = 1 q f ( J l Item x , J l Item y ) * &Sigma; l = q + 1 Q f ( J l Item x , J l Item y ) Q - q - - - ( 3 )
f ( J l Item x , J l Item y ) = 0 ... ... J l Item x &NotEqual; J l Item y 1 ... ... J l Item x = J l Item y - - - ( 4 )
其中,q表示职位信息中所包含的第一类型参数的数量。
本实施例中,某一职位的职位信息中的第一类型参数表征对于相似度取值影响较大的参数,而第二类型参数表征相似度取值影响较小的参数。
本实施例中,各个职位的基本职位信息优选地可以包括:所属领域、学历要求、职位名称、工作地点以及工作类型等5个参数。因此对于职位Itemj来说,上述表达式(2)中的参数Q的取值为5。而对于上述5个参数来说,所述领域和学历要求对于相似度取值的影响较大,这两个参数属于第一类型参数;而其余参数对于相似度取值的影响较小,其属于第二类型参数。因此,本实施例中,表达式(4)中参数q的取值为2。
因此,本实施例中,两个职位之间的相似度具体地可以根据如下表达式计算得到:
s i m J ( Item x , Item y ) = &Pi; l = 1 2 f ( J l Item x , J l Item y ) * &Sigma; l = 3 5 f ( J l Item x , J l Item y ) 3 - - - ( 5 )
f ( J l Item x , J l Item y ) = 0 ... ... J l Item x &NotEqual; J l Item y 1 ... ... J l Item x = J l Item y - - - ( 6 )
需要指出的是,在本发明的其他实施例中,各个职位的职位信息还可以包含其他合理参数,本发明不限于此。
利用目标用户Ui对各个候选职位的初始偏好度虽然能够在一定程度上达到向目标用户推荐就业信息的目的,但是所推荐的就业信息往往与目标用户Ui的匹配程度不高。为此,本实施例所提供的方法引入了额外的参数来对步骤S103中所得到的初始偏好程度的取值进行修正,从而改善最终得到的推荐职位的准确度。
如图1所示,在得到目标用户Ui对各个候选职位的初始偏好度后,本方法在步骤S104中利用职位权重和用户权重来对各个候选职位的初始偏好度初始偏好度进行修正,从而得到目标用户对各个候选职位的修正偏好度。
在得到各个候选职位的修正偏好度后,该方法便可以在步骤S105中根据各个候选职位的修正偏好度生成推荐职位。具体地,本方法在步骤S105中根据各个候选职位的修正偏好度的取值大小,按照取值由大到小的顺序对候选职位集合中的所有候选职位进行排序,并选取排位最为考前的预设数量的候选职位来作为推荐职位。
本实施例中,根据如下表达式来计算目标用户对各个候选职位的修正偏好度:
p r e f ( U i , Item j i ) = pref o ( U i , Item j i ) * &omega; H ( Item j i ) * &omega; U ( Item j i ) - - - ( 7 )
其中,表示目标用户Ui对候选职位集合Itemi中第j个候选职位的修正偏好度,分别表示候选职位的职位权重和用户权重。
职位权重能够反映目标用户历史投递职位自身的特征属性,图2示出了本实施例中计算某一职位的职位权重的流程图。
如图2所示,本实施例中,该方法在计算候选职位集合Itemi中各个职位的职位权重时,首先在步骤S201中分别计算该候选职位与第一职位集合中个恶搞职位之间的相似度,从而得到第一相似度集合。在得到第一相似度集合后,该方法在步骤S202中选取第一相似度集合中的最大相似度,并根据最大相似度计算该候选职位的职位权重。
该方法在步骤S201中计算某候选职位与第一职位集合中各个职位之间的相似度时,其实现原理与实现过程如上表达式(5)和表达式(6)所涉及的内容类似,故在此不再赘述。
在得到该候选职位与第一职位集合中各个职位之间的相似度后,该方法在步骤S202中根据如下表达式计算该候选职位的职位权重:
&omega; H ( Item j i ) = 1 + max ( s i m J ( Item j i , Item m U i ) ) , Item m U i &Element; Item U i - - - ( 8 )
其中,分别表示候选职位的职位权重,表示候选职位与第一职位集合中第m个职位之间的相似度。
在计算用户对职位可能的偏好程度时,与目标用户更相似的用户对首选职位的偏好权重值应该更大。因此,在计算目标用户Ui对候选职位的偏好度时,需要引入对申请过候选职位的用户与目标用户Ui之间相似度(即用户相似度)的权重考量。
具体地,如图3所示,本实施例所提供的方法在计算候选职位的用户权重时,首先在步骤S301中获取申请过候选职位的用户集合,从而得到得第二用户集合
在步骤S302中,计算目标用户与第二用户集合中各个用户之间的用户相似度。本实施例中,两个用户之间的用户相似度优选地利用这两个用户之间的专业相似度和简历信息相似度来计算。
“所学专业”这个属性在求职过程中扮演着即为重要的角色,如果应聘者所学专业与职位需求不匹配,那么会大大降低用户的求职成功率。而简单地从字面角度来对用户的专业进行分析,得出的专业相似度可靠性不高。本实施例所提供的方法通过分析发现,同一职位的申请者的专业分布相似度往往很高,因此本方法通过分析同一职位的申请专业分析来挖掘专业之间的相似度。
如图4所示,本实施例所提供的方法在计算两个用户之间的用户相似度时,首先在步骤S401中分别获取这两个用户的专业信息,并根据专业信息计算这两个用户之间的专业相似度。
具体地,本方法通过计算两个个专业之间的支持度和置信度来计算来两个用户之间的专业相似度。其中,两个专业之间的支持度可以根据下表达式计算得到:
S ( m a , m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | I | - - - ( 9 )
其中,S(ma,mb)表示专业ma与专业mb之间的支持度,|*|表示集合*中元素的个数,表示招聘时同时招聘了专业ma和专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
而在计算两个专业之间的置信度时,本方法将分别计算专业ma到专业mb的置信度C(ma→mb)和专业mb到专业ma的置信度C(mb→ma)。
具体地,本实施例中,专业ma到专业mb的置信度C(ma→mb)优选地可以根据如下表达式计算得到:
C ( m a &RightArrow; m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m a &Element; M I n , I m &Element; I } | - - - ( 10 )
专业ma的置信度C(mb→ma)的置信度C(mb→ma)则可以根据如下表达式计算得到:
C ( m b &RightArrow; m a ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m b &Element; M I n , I m &Element; I } | - - - ( 11 )
其中,表示招聘时招聘了专业ma的职位集合,招聘时招聘了专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
在得到两个专业之间的支持度和置信度后,两个用户之间的专业相似度simM(ma,mb)便可以根据如下表达式计算得到:
s i m M ( m a , m b ) = 0 S ( m a , m b ) < &epsiv; m a x ( C ( m a &RightArrow; m b ) , C ( m b &RightArrow; m a ) ) S ( m a , m b ) &GreaterEqual; &epsiv; - - - ( 12 )
其中,simM(ma,mb)表示专业ma与专业mb之间的相似度,S(ma,mb)表示专业ma与专业mb之间的支持度,ε表示预设支持度阈值,
如图4所示,在得到两个用户之间的专业相似度后,该方法将在步骤S402中分别获取这两个用户之间的简历信息,并根据所获取的简历信息计算这两个用户之间的简历信息相似度。
本实施例中,该方法通过两个用户的简历信息中的特定参数来计算这两个用户的简历信息相似度。具体地,两个用户之间的简历信息相似度优选地可以根据下表达式计算得到:
s i m B ( U i , U o ) = &Sigma; r = 1 R &omega; l * f ( S r U i , S r U o ) &Sigma; r = 1 R &omega; r - - - ( 13 )
f ( S r U i , S r U o ) = 0 ... ... S r U i &NotEqual; S r U o 1 ... ... S r U i = S r U o - - - ( 14 )
其中,simB(Ui,Uo)表示用户Ui与用户Uo之间的简历信息相似度,ωr表示简历信息中的第r个信息的权重,表示用户Ui与用户Uo的简历信息中的第r个信息的相似度,R表示简历信息中所包含信息的总数。
本实施例中,在计算两个用户之间的简历信息相似度时,优选地从性别、学历、地区以及政治面貌私个方便来进行计算。因此,上述表达式(13)和(14)便可以相应地表示为:
s i m B ( U i , U o ) = &Sigma; r = 1 4 &omega; r * f ( S r U i , S r U o ) &Sigma; r = 1 4 &omega; r - - - ( 15 )
f ( S r U i , S r U o ) = 0 ... ... S r U i &NotEqual; S r U o 1 ... ... S r U i = S r U o - - - ( 16 )
在得到两个用户之间的专业相似度和简历信息相似度后,该方法便可以在步骤S403中根据专业相似度和简历信息相似度来计算出这两个用户之间的用户相似度。
具体地,本实施例中,采用对专业相似度和简历信息相似度加权求和的方式来计算两个用户之间的用户相似度,即存在:
s i m ( U i , U o ) = a * s i m M ( m U i , m U o ) + b * s i m B ( U i , U o ) - - - ( 17 )
其中,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,a和b分别表示专业相似度和简历信息相似度的加权系数。本实施例中,加权系数a和b优选地分别设定为0.6和0.4。
需要指出的是,在本发明的其他实施例中,在计算两个用户之间的用户相似度的过程中,还可以先计算这两个用户之间的简历信息相似度,再计算这两个用户之间的专业相似度,即图4中的步骤S401与步骤S402的执行顺序颠倒,本发明不限于此。
再次如图3所示,在得到目标用户与第二用户集合中各个用户之间的用户相似度后,该方法在步骤S303中根据步骤S302中所得到的用户相似度计算该候选职位的用户权重。
具体地,候选职位的用户权重优选地可以根据如下表达式计算得到:
&omega; U ( Item j i ) = 1 + m a x ( s i m ( U i , U o ) ) , U o &Element; U Item j i - - - ( 18 )
其中,表示候选职位的用户权重,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,表示申请过候选职位的用户集合。
需要指出的是,在本法阿明的其他实施例中,还可以采用其他合理方式来计算各个候选职位的用户权重,本发明不限于此。
需要指出的是,在本发明的其他实施例中,根据实际需要,还可以仅利用职位权重或用户权重来对各个候选职位的初始偏好度进行修正,本发明不限于此。其中,当仅利用职位权重对各个候选职位的初始偏好度进行修正时,各个候选职位的修正偏好度可以采用如下表达式计算得到:
p r e f ( U i , Item j i ) = pref o ( U i , Item j i ) * &omega; H ( Item j i ) - - - ( 19 )
当仅利用用户权重对各个候选职位的初始偏好度进行修正时,各个候选职位的修正偏好度可以采用如下表达式计算得到:
p r e f ( U i , Item j i ) = pref o ( U i , Item j i ) * &omega; U ( Item j i ) - - - ( 20 )
从上述描述中可以看出,本发明所提供的就业信息推荐方法在计算得到用户对各个候选职位的初始偏好度的基础上,通过引入职位权重和用户权重来对初始偏好度进行修正,并根据修正偏好度来生成推荐职位,这样能够使得得到最终得到的推荐职位与目标用户更加匹配,从而提高了就业信息推荐的准确性、有效性和可靠性。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。

Claims (16)

1.一种就业信息个性化推荐方法,其特征在于,所述方法包括:
候选职位集合生成步骤,根据目标用户的用户信息确定所述目标用户申请过的职位集合,得到第一职位集合,根据所述第一职位集合确定第一用户集合,获取所述第一用户集合中用户所申请过的所有职位,得到候选职位集合;
用户初始偏好度确定步骤,根据所述第一职位集合分别计算所述目标用户对所述候选职位集合中各个候选职位的初始偏好度;
推荐职位生成步骤,利用职位权重和/或用户权重对所述各个候选职位的初始偏好度进行修正,得到所述各个候选职位的修正偏好度,根据所述各个候选职位的修正偏好度生成针对于所述目标用户的推荐职位。
2.如权利要求1所述的方法,其特征在于,根据如下表达式计算各个候选职位的修正偏好度:
p r e f ( U i , Item j i ) = pref o ( U i , Item j i ) * &omega; H ( Item j i )
或,
或,
其中,分别表示用户Ui对候选职位集合Itemi中第j个候选职位的初始偏好度和修正偏好度,分别表示候选职位的职位权重和用户权重。
3.如权利要求1或2所述的方法,其特征在于,在所述候选职位集合生成步骤中,统计申请了所述第一职位集合中职位的用户,得到所述第一用户集合。
4.如权利要求1~3中任一项所述的方法,其特征在于,根据如下表达试计算各个候选职位的初始偏好度:
pref o ( U i , Item j i ) = &Sigma; l = 1 K s i m J ( Item l U i , Item j i )
其中,表示用户Ui对候选职位集合Itemi中第j个候选职位的初始偏好度,K表示第一职位集合所包含的职位数量,表示第一职位集合中第l个职位与候选职位集合Itemi中第j个候选职位的相似度。
5.如权利要求1~4中任一项所述的方法,其特征在于,确定所述候选职位集合中各个职位的职位权重的步骤包括:
分别计算所述候选职位集合中一职位与所述第一职位集合中各个职位之间的相似度,得到第一相似度集合;
选取所述第一相似度集合中的最大相似度,根据所述最大相似度计算该职位的职位权重。
6.如权利要求5所述的方法,其特征在于,根据如下表达式计算所述候选职位集合中各个职位的职位权重:
&omega; H ( Item j i ) = 1 + m a x ( s i m J ( Item j i , Item m U i ) ) , Item m U i &Element; Item U i
其中,分别表示候选职位的职位权重,表示候选职位与第一职位集合中第m个职位之间的相似度。
7.如权利要求4~6中任一项所述的方法,其特征在于,根据如下表达式计算两个职位之间的相似度:
s i m J ( Item x , Item y ) = &Pi; l = 1 q f ( J l Item x , J l Item y ) * &Sigma; l = q + 1 Q f ( J l Item x , J l Item y ) Q - q
f ( J l Item x , J l Item y ) = 0 ... ... J l Item x &NotEqual; J l Item y 1 ... ... J l Item x = J l Item y
其中,simJ(Itemx,Itemy)表示职位Itemx与职位Itemy之间的相似度,分别表示职位Itemx与职位Itemy的职位信息中第l个参数,Q表示职位信息包含参数的总数,q表示职位信息中所包含的第一类型参数的数量。
8.如权利要求1~7中任一项所述的方法,其特征在于,确定所述候选职位集合中各个候选职位的用户权重的步骤包括:
对于所述候选职位集合中的任一候选职位,获取申请过该候选职位的用户集合,得到第二用户集合;
计算所述目标用户与第二用户集合中各个用户之间的用户相似度,根据计算得到的用户相似度计算该候选职位的用户权重。
9.如权利要求8所述的方法,其特征在于,根据如下表达计算所述候选职位集合中各个职位的用户权重:
&omega; U ( Item j i ) = 1 + m a x ( s i m ( U i , U o ) ) , U o &Element; U Item j i
其中,表示候选职位的用户权重,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,表示申请过候选职位的用户集合。
10.如权利要求8或9所述的方法,其特征在于,计算两个用户之间的用户相似度的步骤包括:
分别获取两个用户的专业信息,并根据所述专业信息计算这两个用户之间的专业相似度;
分别获取两个用户的简历信息,并根据所述简历信息计算这两个用户之间的简历信息相似度;
根据所述专业相似度和简历信息相似度,计算这两个用户之间的用户相似度。
11.如权利要求10所述的方法,其特征在于,根据如下表达式计算两个用户之间的用户相似度:
s i m ( U i , U o ) = a * s i m M ( m U i , m U o ) + b * s i m B ( U i , U o )
其中,sim(Ui,Uo)表示用户Ui与用户Uo之间的用户相似度,和simB(Ui,Uo)分别表示用户Ui与用户Uo之间的专业相似度和简历信息相似度,a和b分别表示专业相似度和简历信息相似度的加权系数。
12.如权利要求10或11所述的方法,其特征在于,根据如下表达式计算专业相似度:
s i m M ( m a , m b ) = 0 S ( m a , m b ) < &epsiv; m a x ( C ( m a &RightArrow; m b ) , C ( m b &RightArrow; m a ) ) S ( m a , m b ) &GreaterEqual; &epsiv;
其中,simM(ma,mb)表示专业ma与专业mb之间的相似度,S(ma,mb)表示专业ma与专业mb之间的支持度,ε表示预设支持度阈值,C(ma→mb)表示专业ma到专业mb的置信度,C(mb→ma)表示专业mb到专业ma的置信度。
13.如权利要求12所述的方法,其特征在于,根据如下表达式计算两个专业之间的支持度:
S ( m a , m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | I |
其中,S(ma,mb)表示专业ma与专业mb之间的支持度,|*|表示集合*中元素的个数,表示招聘时同时招聘了专业ma和专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
14.如权利要求12或13所述的方法,其特征在于,
根据如下表达式计算置信度C(ma→mb):
C ( m a &RightArrow; m b ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m a &Element; M I n , I m &Element; I } |
根据如下表达式计算置信度C(mb→ma):
C ( m b &RightArrow; m a ) = | { I n | m a &Element; M I n , m b &Element; M I n , I n &Element; I } | | { I m | m b &Element; M I n , I m &Element; I } |
其中,|*|表示集合*中元素的个数,表示招聘时同时招聘了专业ma和专业mb的职位集合,表示招聘时招聘了专业ma的职位集合,招聘时招聘了专业mb的职位集合,In表示已完成招聘的职位集合I中的第n个职位,表示职位In的受聘人员的专业集合。
15.如权利要求10~14中任一项所述的方法,其特征在于,根据如下表达计算两个用户之间的简历信息相似度:
s i m B ( U i , U o ) = &Sigma; r = 1 R &omega; l * f ( S r U i , S r U o ) &Sigma; r = 1 R &omega; r
f ( S r U i , S r U o ) = 0 ... ... S r U i &NotEqual; S r U o 1 ... ... S r U i = S r U o
其中,simB(Ui,Uo)表示用户Ui与用户Uo之间的简历信息相似度,ωr表示简历信息中的第r个信息的权重,表示用户Ui与用户Uo的简历信息中的第r个信息的相似度,R表示简历信息中所包含信息的总数。
16.如权利要求1~15中任一项所述的方法,其特征在于,在所述推荐职位生成步骤中,将修正偏好度最高的预设数量的候选职位作为推荐职位。
CN201610334570.3A 2016-05-19 2016-05-19 一种就业信息个性化推荐方法 Pending CN106022723A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610334570.3A CN106022723A (zh) 2016-05-19 2016-05-19 一种就业信息个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610334570.3A CN106022723A (zh) 2016-05-19 2016-05-19 一种就业信息个性化推荐方法

Publications (1)

Publication Number Publication Date
CN106022723A true CN106022723A (zh) 2016-10-12

Family

ID=57096240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610334570.3A Pending CN106022723A (zh) 2016-05-19 2016-05-19 一种就业信息个性化推荐方法

Country Status (1)

Country Link
CN (1) CN106022723A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649885A (zh) * 2017-01-13 2017-05-10 深圳爱拼信息科技有限公司 一种专业类与标准专业名的匹配方法及系统
CN108897789A (zh) * 2018-06-11 2018-11-27 西南科技大学 一种跨平台的社交网络用户身份识别方法
CN110968771A (zh) * 2018-09-29 2020-04-07 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112182383A (zh) * 2020-09-28 2021-01-05 平安数字信息科技(深圳)有限公司 第二岗位的推荐方法、装置以及计算机设备
CN115309998A (zh) * 2022-10-11 2022-11-08 中教智网(北京)信息技术有限公司 一种基于大数据的就业推荐方法及系统
CN117473251A (zh) * 2023-10-10 2024-01-30 北京华普亿方科技集团股份有限公司 基于大数据的用户求职意向分析方法及系统
CN110968771B (zh) * 2018-09-29 2024-05-28 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649885A (zh) * 2017-01-13 2017-05-10 深圳爱拼信息科技有限公司 一种专业类与标准专业名的匹配方法及系统
CN108897789A (zh) * 2018-06-11 2018-11-27 西南科技大学 一种跨平台的社交网络用户身份识别方法
CN110968771A (zh) * 2018-09-29 2020-04-07 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN110968771B (zh) * 2018-09-29 2024-05-28 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112182383A (zh) * 2020-09-28 2021-01-05 平安数字信息科技(深圳)有限公司 第二岗位的推荐方法、装置以及计算机设备
CN112182383B (zh) * 2020-09-28 2023-11-14 深圳平安智汇企业信息管理有限公司 第二岗位的推荐方法、装置以及计算机设备
CN115309998A (zh) * 2022-10-11 2022-11-08 中教智网(北京)信息技术有限公司 一种基于大数据的就业推荐方法及系统
CN117473251A (zh) * 2023-10-10 2024-01-30 北京华普亿方科技集团股份有限公司 基于大数据的用户求职意向分析方法及系统

Similar Documents

Publication Publication Date Title
CN106022723A (zh) 一种就业信息个性化推荐方法
KR101917271B1 (ko) 인터넷기반 사회 연결망 서비스에서 회원 프로필의 순위 및 등급 산출 시스템 및 방법과 이를 위한 기록매체
Attia et al. " Architect Friendly": a comparison of ten different building performance simulation tools
Lartigue et al. Multi-objective optimization of building envelope for energy consumption and daylight
CN108921221A (zh) 用户特征的生成方法、装置、设备及存储介质
Geambaşu et al. Influence factors for the choice of a software development methodology
Mi et al. Probabilistic graphical models for boosting cardinal and ordinal peer grading in MOOCs
US20150154564A1 (en) Weighted evaluation comparison
Kurilovas et al. New MCEQLS fuzzy AHP methodology for evaluating learning repositories: a tool for technological development of economy
US8745083B1 (en) System and method for matching candidates with personnel needs
US11720860B1 (en) Systems and methods for processing and presentation of advisor-related data
WO2005070004A2 (en) System and method for aiding commercial property assessment
US20170048340A1 (en) College readiness predictor and selection service using profile manager and translation validation
US20060190319A1 (en) Realtime, structured, paperless research methodology for focus groups
CN103839105B (zh) 行程推荐方法和装置
Larsson et al. Cardinal and rank ordering of criteria—addressing prescription within weight elicitation
Turunç et al. THE IMPACT OF LEADERSHIP STYLES ON ETHICAL BEHAVIOUR.
CN105912549A (zh) 一种内容推荐方法及其装置
CN107918652A (zh) 一种利用多模态网络学习进行基于社交关系的电影推荐的方法
Armacost et al. Decision support for the career field selection process at the US Air Force Academy
Barrett et al. Two approaches to describing the development of students’ reasoning about length
Liu et al. Data-driven design paradigm in engineering problems
Wachnik An Analysis of Effectiveness Factors in the Completion of it Projects–the supplier’s Perspective
CN110262906A (zh) 接口标签推荐方法、装置、存储介质和电子设备
Chang et al. A Hybrid MCDM Approach for Taiwanese Tour Guides Selection.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012