CN109885761A - 一种人力资源企业的职位和人才匹配和推荐方法 - Google Patents

一种人力资源企业的职位和人才匹配和推荐方法 Download PDF

Info

Publication number
CN109885761A
CN109885761A CN201910066076.7A CN201910066076A CN109885761A CN 109885761 A CN109885761 A CN 109885761A CN 201910066076 A CN201910066076 A CN 201910066076A CN 109885761 A CN109885761 A CN 109885761A
Authority
CN
China
Prior art keywords
job hunter
expert
job
user
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910066076.7A
Other languages
English (en)
Inventor
朱蔚恒
龙舜
樊广源
蔡跳
王会进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN201910066076.7A priority Critical patent/CN109885761A/zh
Publication of CN109885761A publication Critical patent/CN109885761A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人力资源企业的职位和人才匹配和推荐方法,具体涉及网络招聘领域,具体包括协同过滤推荐方案、基于专家智慧推荐方案和整合方案。本发明使求职者无需输入准确的搜索关键词:省去求职者构造合适关键词的过程,也就避免了检索需要依赖查询关键词精确匹配所带来的问题,职位推荐方案为求职者推荐其可能感兴趣的职位信息;线下互动,主动推送:通过职位推荐,招聘网站可以定期将求职者可能感兴趣的职位主动地推送到求职者注册的邮箱或者手机上;职位过滤:职位检索的其中一个目的就是过滤相关度低求职者兴趣不大的职位,用户感兴趣的职位推荐的结果一般来说也就数十个职位,这一做法可以降低用户的信息过载负担。

Description

一种人力资源企业的职位和人才匹配和推荐方法
技术领域
本发明涉及网络招聘技术领域,更具体地说,本发明涉及一种人力资源企业的职位和人才匹配和推荐方法。
背景技术
当前,网络招聘的一个典型的求职交互过程大致如下:招聘人员通过网络招聘平台发布职位的信息,然后等待求职者的应聘。求职者在网络招聘平台完善个人简历之后,通过平台的搜索引擎查询相关的职位信息,然后选择感兴趣的职位进行投递。在收到职位的应聘申请之后,招聘人员审核求职者的简历是否符合职位的要求,若该简历符合要求则进行更深一步的了解,常见方式是预约面试。否则忽略或者拒绝该求职者的应聘申请。在这个求职交互过程当中,网络招聘平台的搜索引擎起着关键的作用,检索结果的好坏直接影响着求职者投递简历的多寡。当前的搜索引擎大都基于词的匹配,而这种词的匹配必然存在以下三个问题:1、大多数关键词的匹配是精确的匹配检索,返回的结果对所有的求职者都一样,并没有考虑到不同求职者的个性化需求;2、大部分的求职者都不熟悉信息检索技术,不了解如何通过更好得构造关键词提高检索效率,求职者所构造的关键词可能含义太广,也可能太具体,导致检索质量低下;3、检索结果可能包含数百甚至上千条招聘信息,求职者一般仅仅关注前面的数十条。
目前,常见的解决方案是通过全文检索引擎建立并定时更新职位信息的索引。但对职位的检索仍然采用精确匹配的方式,所以不能很好地解决由于词的匹配所带来的职位检索问题。此外,职位检索的结果仅仅按职位发布时间的先后次序呈现给求职者,并没有考虑到不同求职者的个性化需求
专利申请公布号CN102117323A的发明专利公开了一种推荐求职简历的处理方法和系统,该方法包括建立会员简历数据库、以及企业的职位信息,设定招聘职位要求是否为必须和优先级;根据招聘职位要求是否为必须以及优先级,结合职位要求和简历的匹配规则,依次和求职简历的关键属性进行精确匹配,依据匹配度排序精准推送符合要求的求职简历给招聘组织。该方法和系统使招聘组织能够精准筛选到相应的候选人,提升招聘效率,减低招聘成本,同时不会遗漏合格的求职简历;
该发明采用的不是协同过滤的推荐方法,因此算法的成效取决于属性的设置和用户能提供的内容,这个要求比较高,实际人力资源企业运作中一般没法从大量普通客户那里得到详尽资料的,所以算法的可用性存疑。另一方面,基于词的精确匹配的方法的实用性也有很大局限。
专利申请公布号CN104933239A的发明专利公开了一种基于混合模型的个性化职位信息推荐系统及实现方法,推荐系统自上而下包括表现层,推荐层,信息抽取层和信息采集层;层与层之间通过共享数据实现衔接;信息采集层负责编写网络爬虫程序;信息抽取层负责从特征页面中解析原始的职位信息,将底层获取的特征链接上传至HDFS文件系统;推荐层负责整个职位推荐系统的推荐引擎算法;表现层向用户提供交互界面,将推荐层计算出的推荐项目,通过网页的形式向求职者展现。本发明的推荐系统一定程度上降低了系统冷启动和矩阵稀疏性带来的影响,推荐的结果更全面和精确,增强系统的粘性和用户体验;
该发明与本发明的方案想法类似,但是对其中的推荐算法没有详尽说明,而且没有本发明方案提出的利用专家经验的部分。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种人力资源企业的职位和人才匹配和推荐方法,通过结合协同过滤推荐和基于专家智慧推荐两种推荐方法的职位推荐方案,协同过滤推荐根据求职者应聘历史挖掘得到他对应聘职位的偏好向量,并计算各职位的特征向量,然后通过计算两者的匹配程度评估匹配程度并排序;而基于专家智慧的方案则首先找出求职系统中的专家即那些应聘职位多且所投职位与简历匹配度高的用户,通过计算用户间相似度找到与当前求职者相似的专家;最后根据专家的应聘职位及对其的评分进行推荐。两者的整合方案则要算出专家的影响力(影响力越高,该专家所应聘的职位越值得推荐);然后通过计算用户间相似度,找到与当前求职者相似度符合条件的专家及普通用户;最后根据专家和普通用户的应聘职位及对其的评分选择合适的职位。
为实现上述目的,本发明提供如下技术方案:一种人力资源企业的职位和人才匹配和推荐方法,具体包括协同过滤推荐方案、基于专家智慧推荐方案和整合方案;
(一)协同过滤推荐方案
记录如下形式的交互历史{(ut,Ot,Dt)},其中t是某次具体的交互会话的索引下标,构建推荐系统,将协同竞争过滤的问题定义为:考虑在推荐系统里的用户-系统交互过程如下:有用户u∈U:={1,2,3,...,M}和项目i∈I:={1,2,3,...,N},其中,U表示整个用户空间,I表示整个项目空间,Ot表示用户可选的上下文或者提供集,Dt表示用户做决定的项目集合,而i*表示Dt集合里的一个项目;
当一个用户进入系统后,系统为其推荐项目的一个集合O={i1,i2,i3,...,il},而用户u则从O中选择一个子集或者为空,D∈Ο,然后对子集D进行相应的操作,例如应聘某个职位,购买某件商品;最终可以实现为一个用户生成一个推荐使得用户的满意度最大;
协同竞争过滤基于一个give-and-take命题:一个合理的决定要使得效益最大化,要满足i*=argmaxi∈Oπui;其中πui表示效益,而πui=rui-cui,rui表示项目i对用户u的价值,cui=max{rui”:i'∈O\i}表示用户u为获得项目i而需要为之付出的代价;所述效益最大化也称为局部最优,局部指在Ot的情况下的最优;
将协同竞争过滤的问题转换成以下目标函数:
或者表示为:
上述两个式子表示用户选择结果集中的项目,它们的效用均大于其它未被选择的项目;
为解决上述局部最优解,提出两个具体的模型:
Softmax模型
Hinge模型
通过随机梯度下降方法可以得出较满意的结果,该方法通过不断地重复以下两个步骤进行,在迭代过程中要不断更新不同的参数:
对于所有项目i∈Ot使用来更新Φi
对于每个用户u,使用来更新Φu
其中η是学习率,两个模型的梯度可以使用下面的式子计算:
其中H(·)是Heaviside函数,比如:如果x>0,H(x)=1,否则H(x)=0;
将人力资源企业保持的大量求职者应聘职位的历史记录表示为{userID,recruitID,date}的形式,其中userID是求职的编号,recruitID是职位的编号,date则表示求职者应聘职位的时间;
职位推荐思路为:
首先计算出所有求职者的偏好向量和职位的特性向量,然后针对每个求职者计算其与所有职位的内积,并按内积结果的降序排列,最后返回前N个作为职位推荐的结果,为了得到这些向量,借助协同竞争过滤的两个模型进行学习,得到职位推荐程序流程:
上述算法中,需要为每个求职者产生待计算推荐职位的候选集,不足在于耗时和低准确度,耗时的具体原因为:把整个职位空间当候选集增加了计算推荐职位的时间,所述低准确度的具体原因为:把整个职位空间当候选集时,必然存在许多不真实的噪音,这种噪音的存在会降低职位推荐的准确性;
为解决上述耗时和低准确度的问题,通过挖掘其它有用的信息来缩小候选集,减少计算时间并提高推荐的准确度;
改进职位候选集的现实基础是绝大多数求职者在较长的时间内只关注某种类型的职位,这基本符合求职的实际情况,结合岗位类别和求职者的具体应聘记录来产生候选集,具体做法是:a.将某个求职者所有应聘过的职位聚集在一起,然后找到所有与这些被应聘过的职位同属于一个岗位类别的其他职位并把它们作为候选集;b.对职位建模生成一个职位的kd-树,并通过该树寻找相似的职位;c.完成建模后,将某个求职者所有应聘过的职位聚集在一起,然后针对每一个职位从kd-树中找出与其相似的S个职位,所有这些相似的职位的集合作为该求职者待推荐的职位候选集;
为缓解职位推荐中的冷启动问题,采用根据相近求职者的情况为新求职者提供参考,从而为新求职者提供职位推荐,该算法如下:
procedure Adjust:Φu,θ,S,U
Adjust需要Φu,θ,S,U四个参数,U表示需要为其推荐职位的求职者集合,格式为{userID,appliedCount},其中userID是求职者的编号,appliedCount是其应聘职位的数量;如果一个求职者暂时还没有应聘,那么其值为零;θ是求职者成为被参考者时最小应聘职位的数量;Φu表示U里面出现过的求职者的偏爱向量,如果一个求职者还没有应聘过任何职位,那么其向量应该为全零;S表示从求职者kd-树中寻找的相似求职者的数量;
程序开始后把U按照其应聘职位的数量否大于等于θ分成U1和U2集合,U2是需要调整的求职者的集合,U1是被U2参考的求职者集合;用集合U1构建求职者kd-树,然后对U2中的每一个求职者,找出与其最相近的S个求职者集合SUs,然后计算集合SUs里面的向量各个维度的平均值Φavg,最后把Φavg和Φu按下面的公式进行组合:
Φu←wΦu+(1-w)Φavg
w←u.appliedCount/θ
其中w的值为求职者应聘职位的数量除以阈值θ,当求职者没有任何的应聘记录时,w为零,那么求职者的向量全部用参考者的向量均值表示,当w越大表示越注重求职者自身的偏好向量;
(二)基于专家智慧推荐方案
为解决基于协同过滤的职位推荐中可能面对的数据稀疏的问题,引入专家智慧的想法,定义网络求职者用户是一个由元组组成的集合,每一个元组代表一个职位在该求职者投递简历时的状态(也就是求职者对职位的评分),而专家集e:{e1,e2,...,e3}是全体求职者用户的一个子集,子集中的每一个用户ei是满足以下准则的用户:
1)ei的元组数目超过某一个阈值T1
2)ei中每一个项目的评分rei,item落在该项目得分的T2置信区间内;
3)ei所有的项目评分满足以下的公式:
其中,ei,item表示ei对项目item的评分,表示ei对item的评分,meanei,item表示ei评分时,项目item得分的平均值;
由于网络求职中的专家在在求职中表现出的一个显著特点就是与职位的匹配度比较高,因此求职者应聘某个职位后应当计算求职者能力条件与职位要求之间的匹配度并加上该值,求职者u对职位i的评分ru,i则可以表示为:
ru,i=c+match(u,i)
其中c表示求职者应聘该职位后对职位的基础评分,每个求职者对职位的基础评分都为一个常量,match(u,i)则表示求职者与职位的匹配度;采用欧几里德距离公式来计算根据求职者和职位两个特征向量之间的匹配度,将求职者u对职位i的评分具体化为:
其中αu和βi分别为求职者向量和职位向量;
(三)整合方案
结合以上两种推荐方案的协同过滤框架,需要在普通求职者集合中查找目标用户的最近邻,包括专家和普通用户,但需要考虑何时采用一般用户的意见,何时采用专家的意见;
在得到求职者的最近邻集合后,接着要预测最近邻对未评分职位的评分值,并用预测评分值尽量将求职者-职位评分矩阵填满;求职者对未评分职位的评分预测值的计算公式如下:
其中sim(ra,rb)表示求职者a与其最近邻用户b之间的相似度,则分别表示求职者a、b各自对所有职位评分的均值;从该公式可以看出传统的计算方法在目标用户的评分均值的基础上加上一个修正值,不仅综合了最近邻用户对未评分项目的评分,而且还考虑到了目标用户与最近邻用户之间的相似度,用相似度对最近邻用户的评分进行加权;
定义用户的影响力:对于普通用户,其影响力大小为1,对于专家用户集中的专家ei,其影响力表示为:
其中表示专家ei对职位recruit的评分,表示专家ei评分时职位recruit所获得评分的均值,meanrecruit表示职位recruit最终获得评分的均值,Recruit(ei)则表示专家ei评过分的职位集(即申请过的职位);
从该公式可以看出,如果专家的评分具有预见性和代表性,那么该专家在对职位评分时,职位当时的评分均值与该专家的评分之间存在一定的差值,并且差值会慢慢减小,最终职位的评分均值与专家给出的评分会很接近,所以预测越准确的专家其影响力越大,的值也就越大,相反亦然。
整合方案引入上述专家影响力来对专家的评分进行加权修正,公式如下:
其中Expert(a)表示专家集,表示专家影响力;对于普通的最近邻求职者,其影响力定义为1;对于专家求职者,影响力作为一个影响因子对专家求职者的评分进行修正,如果专家的影响力越大,其对未评分职位的影响也越大,最终的预测值也会越大,该职位就越有可能被推荐出来;
最后根据各职位的综合预测值从高到低向求职者推送推荐职位列表。
在一个优选地实施方式中,所述职位推荐思路中,应聘记录很好的反映求职者对其应聘职位的偏好程度,这个偏好可以使用隐因子模型方法计算得到,即假设职位的各方面特性可以使用一个向量来表示,而用另外一个向量表示求职者对各种特性的偏好程度,将两个向量进行内积计算,得到的结果可以表示求职者对该职位的总体偏好程度,值越大,求职者就越喜欢该职位,该职位就越值得推荐给求职者。
在一个优选地实施方式中,所述基于专家智慧的职位推荐本质上是基于专家用户的协同推荐,在海量的数据中发现一些与目标用户兴趣爱好相似的专家称为邻居,采用Pearson相似度计算求职者间的相似度,然后将这些邻居喜欢的职位组成一个序列推荐给目标用户,称为最近邻模型,且相关算法已经公开,在此不另赘述。
在一个优选地实施方式中,所述用户的影响力判断依据:在专家用户集中寻找最近邻用户时需要反映出现实生活中人们对普通用户和专家的信任和接受程度常有不同,然而由于求职者之间并没有足够的相关交互,直接利用求职者对专家的信任程度来作为最近邻选择的影响因素不可行,假设求职者对专家的信任程度即专家的影响力,专家的影响力越大求职者对其越信任,影响力很大的专家对事物的预测是越准确的,在职位推荐中则体现在求职专家对职位的评分反映出职位评分的发展趋势。
本发明的技术效果和优点:
1、本发明的核心是结合协同过滤推荐和基于专家智慧推荐两种推荐方法的职位推荐方案,协同过滤推荐根据求职者应聘历史挖掘得到他对应聘职位的偏好向量,并计算各职位的特征向量,然后通过计算两者的匹配程度评估匹配程度并排序;而基于专家智慧的方案则首先找出求职系统中的专家即那些应聘职位多且所投职位与简历匹配度高的用户,通过计算用户间相似度找到与当前求职者相似的专家;最后根据专家的应聘职位及对其的评分进行推荐;两者的整合方案则要算出专家的影响力(影响力越高,该专家所应聘的职位越值得推荐);然后通过计算用户间相似度,找到与当前求职者相似度符合条件的专家及普通用户;最后根据专家和普通用户的应聘职位及对其的评分选择合适的职位;
2、本发明使求职者无需输入准确的搜索关键词:省去求职者构造合适关键词的过程,也就避免了检索需要依赖查询关键词精确匹配所带来的问题,职位推荐方案为求职者推荐其可能感兴趣的职位信息;
3、线下互动,主动推送:通过职位推荐,招聘网站可以定期将求职者可能感兴趣的职位主动地推送到求职者注册的邮箱或者手机上,而在线职位检索无法完成此功能;
4、职位过滤:职位检索的其中一个目的就是过滤相关度低求职者兴趣不大的职位,用户感兴趣的职位推荐的结果一般来说也就数十个职位,这一做法可以降低用户的信息过载负担。
5、由此可见,职位推荐能在很大程度上解决或者缓解由于词的匹配而带来的职位检索问题,把求职者被动的获取数据的过程转换成招聘网站主动的推送职位信息。
具体实施方式
下面将结合本发明中的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明提供了一种人力资源企业的职位和人才匹配和推荐方法,具体包括协同过滤推荐方案、基于专家智慧推荐方案和整合方案;
(一)协同过滤推荐方案
记录如下形式的交互历史{(ut,Ot,Dt)},其中t是某次具体的交互会话的索引下标,构建推荐系统,将协同竞争过滤的问题定义为:考虑在推荐系统里的用户-系统交互过程如下:有用户u∈U:={1,2,3,...,M}和项目i∈I:={1,2,3,...,N},其中,U表示整个用户空间,I表示整个项目空间,Ot表示用户可选的上下文或者提供集,Dt表示用户做决定的项目集合,而i*表示Dt集合里的一个项目;
当一个用户进入系统后,系统为其推荐项目的一个集合O={i1,i2,i3,...,il},而用户u则从O中选择一个子集或者为空,D∈O,然后对子集D进行相应的操作,例如应聘某个职位,购买某件商品;最终可以实现为一个用户生成一个推荐使得用户的满意度最大;
协同竞争过滤基于一个give-and-take命题:一个合理的决定要使得效益最大化,要满足i*=argmaxi∈Oπui;其中πui表示效益,而πui=rui-cui,rui表示项目i对用户u的价值,cui=max{rui”:i'∈O\i}表示用户u为获得项目i而需要为之付出的代价;所述效益最大化也称为局部最优,局部指在Ot的情况下的最优;
将协同竞争过滤的问题转换成以下目标函数:
或者表示为:
上述两个式子表示用户选择结果集中的项目,它们的效用均大于其它未被选择的项目;
为解决上述局部最优解,提出两个具体的模型:
Softmax模型
Hinge模型
通过随机梯度下降方法可以得出较满意的结果,该方法通过不断地重复以下两个步骤进行,在迭代过程中要不断更新不同的参数:
对于所有项目i∈Ot使用来更新Φi
对于每个用户u,使用来更新Φu
其中η是学习率,两个模型的梯度可以使用下面的式子计算:
其中H(·)是Heaviside函数,比如:如果x>0,H(x)=1,否则H(x)=0;
将人力资源企业保持的大量求职者应聘职位的历史记录表示为{userID,recruitID,date}的形式,其中userID是求职的编号,recruitID是职位的编号,date则表示求职者应聘职位的时间;
职位推荐思路为:
首先计算出所有求职者的偏好向量和职位的特性向量,然后针对每个求职者计算其与所有职位的内积,并按内积结果的降序排列,最后返回前N个作为职位推荐的结果,为了得到这些向量,借助协同竞争过滤的两个模型进行学习,得到职位推荐程序流程:
上述算法中,需要为每个求职者产生待计算推荐职位的候选集,不足在于耗时和低准确度,耗时的具体原因为:把整个职位空间当候选集增加了计算推荐职位的时间,所述低准确度的具体原因为:把整个职位空间当候选集时,必然存在许多不真实的噪音,这种噪音的存在会降低职位推荐的准确性;
为解决上述耗时和低准确度的问题,通过挖掘其它有用的信息来缩小候选集,减少计算时间并提高推荐的准确度;
改进职位候选集的现实基础是绝大多数求职者在较长的时间内只关注某种类型的职位,这基本符合求职的实际情况,结合岗位类别和求职者的具体应聘记录来产生候选集,具体做法是:a.将某个求职者所有应聘过的职位聚集在一起,然后找到所有与这些被应聘过的职位同属于一个岗位类别的其他职位并把它们作为候选集;b.对职位建模生成一个职位的kd-树,并通过该树寻找相似的职位;c.完成建模后,将某个求职者所有应聘过的职位聚集在一起,然后针对每一个职位从kd-树中找出与其相似的S个职位,所有这些相似的职位的集合作为该求职者待推荐的职位候选集;
为缓解职位推荐中的冷启动问题,采用根据相近求职者的情况为新求职者提供参考,从而为新求职者提供职位推荐,该算法如下:
Adjust需要Φu,θ,S,U四个参数,U表示需要为其推荐职位的求职者集合,格式为{userID,appliedCount},其中userID是求职者的编号,appliedCount是其应聘职位的数量;如果一个求职者暂时还没有应聘,那么其值为零;θ是求职者成为被参考者时最小应聘职位的数量;Φu表示U里面出现过的求职者的偏爱向量,如果一个求职者还没有应聘过任何职位,那么其向量应该为全零;S表示从求职者kd-树中寻找的相似求职者的数量;
程序开始后把U按照其应聘职位的数量否大于等于θ分成U1和U2集合,U2是需要调整的求职者的集合,U1是被U2参考的求职者集合;用集合U1构建求职者kd-树,然后对U2中的每一个求职者,找出与其最相近的S个求职者集合SUs,然后计算集合SUs里面的向量各个维度的平均值Φavg,最后把Φavg和Φu按下面的公式进行组合:
Φu←wΦu+(1-w)Φavg
w←u.appliedCount/θ
其中w的值为求职者应聘职位的数量除以阈值θ,当求职者没有任何的应聘记录时,w为零,那么求职者的向量全部用参考者的向量均值表示,当w越大表示越注重求职者自身的偏好向量;
(二)基于专家智慧推荐方案
为解决基于协同过滤的职位推荐中可能面对的数据稀疏的问题,引入专家智慧的想法,定义网络求职者用户是一个由元组组成的集合,每一个元组代表一个职位在该求职者投递简历时的状态(也就是求职者对职位的评分),而专家集e:{e1,e2,...,e3}是全体求职者用户的一个子集,子集中的每一个用户ei是满足以下准则的用户:
1)ei的元组数目超过某一个阈值T1
2)ei中每一个项目的评分rei,item落在该项目得分的T2置信区间内;
3)ei所有的项目评分满足以下的公式:
其中,ei,item表示ei对项目item的评分,表示ei对item的评分,meanei,item表示ei评分时,项目item得分的平均值;
由于网络求职中的专家在在求职中表现出的一个显著特点就是与职位的匹配度比较高,因此求职者应聘某个职位后应当计算求职者能力条件与职位要求之间的匹配度并加上该值,求职者u对职位i的评分ru,i则可以表示为:
ru,i=c+match(u,i)
其中c表示求职者应聘该职位后对职位的基础评分,每个求职者对职位的基础评分都为一个常量,match(u,i)则表示求职者与职位的匹配度;采用欧几里德距离公式来计算根据求职者和职位两个特征向量之间的匹配度,将求职者u对职位i的评分具体化为:
其中αu和βi分别为求职者向量和职位向量;
(三)整合方案
结合以上两种推荐方案的协同过滤框架,需要在普通求职者集合中查找目标用户的最近邻,包括专家和普通用户,但需要考虑何时采用一般用户的意见,何时采用专家的意见;
在得到求职者的最近邻集合后,接着要预测最近邻对未评分职位的评分值,并用预测评分值尽量将求职者-职位评分矩阵填满;求职者对未评分职位的评分预测值的计算公式如下:
其中sim(ra,rb)表示求职者a与其最近邻用户b之间的相似度,则分别表示求职者a、b各自对所有职位评分的均值;从该公式可以看出传统的计算方法在目标用户的评分均值的基础上加上一个修正值,不仅综合了最近邻用户对未评分项目的评分,而且还考虑到了目标用户与最近邻用户之间的相似度,用相似度对最近邻用户的评分进行加权;
定义用户的影响力:对于普通用户,其影响力大小为1,对于专家用户集中的专家ei,其影响力表示为:
其中表示专家ei对职位recruit的评分,表示专家ei评分时职位recruit所获得评分的均值,meanrecruit表示职位recruit最终获得评分的均值,Recruit(ei)则表示专家ei评过分的职位集(即申请过的职位);
从该公式可以看出,如果专家的评分具有预见性和代表性,那么该专家在对职位评分时,职位当时的评分均值与该专家的评分之间存在一定的差值,并且差值会慢慢减小,最终职位的评分均值与专家给出的评分会很接近,所以预测越准确的专家其影响力越大,的值也就越大,相反亦然。
整合方案引入上述专家影响力来对专家的评分进行加权修正,公式如下:
其中Expert(a)表示专家集,表示专家影响力;对于普通的最近邻求职者,其影响力定义为1;对于专家求职者,影响力作为一个影响因子对专家求职者的评分进行修正,如果专家的影响力越大,其对未评分职位的影响也越大,最终的预测值也会越大,该职位就越有可能被推荐出来;
最后根据各职位的综合预测值从高到低向求职者推送推荐职位列表。
通过结合协同过滤推荐和基于专家智慧推荐两种推荐方法的职位推荐方案,协同过滤推荐根据求职者应聘历史挖掘得到他对应聘职位的偏好向量,并计算各职位的特征向量,然后通过计算两者的匹配程度评估匹配程度并排序;而基于专家智慧的方案则首先找出求职系统中的专家即那些应聘职位多且所投职位与简历匹配度高的用户,通过计算用户间相似度找到与当前求职者相似的专家;最后根据专家的应聘职位及对其的评分进行推荐。两者的整合方案则要算出专家的影响力(影响力越高,该专家所应聘的职位越值得推荐);然后通过计算用户间相似度,找到与当前求职者相似度符合条件的专家及普通用户;最后根据专家和普通用户的应聘职位及对其的评分选择合适的职位。
实施例2:
所述职位推荐思路中,应聘记录很好的反映求职者对其应聘职位的偏好程度,这个偏好可以使用隐因子模型方法计算得到,即假设职位的各方面特性可以使用一个向量来表示,而用另外一个向量表示求职者对各种特性的偏好程度,将两个向量进行内积计算,得到的结果可以表示求职者对该职位的总体偏好程度,值越大,求职者就越喜欢该职位,该职位就越值得推荐给求职者;
实施例3:
所述基于专家智慧的职位推荐本质上是基于专家用户的协同推荐,在海量的数据中发现一些与目标用户兴趣爱好相似的专家称为邻居,采用Pearson相似度计算求职者间的相似度,然后将这些邻居喜欢的职位组成一个序列推荐给目标用户,称为最近邻模型,且相关算法已经公开,在此不另赘述;
实施例4:
所述用户的影响力判断依据:在专家用户集中寻找最近邻用户时需要反映出现实生活中人们对普通用户和专家的信任和接受程度常有不同,然而由于求职者之间并没有足够的相关交互,直接利用求职者对专家的信任程度来作为最近邻选择的影响因素不可行,假设求职者对专家的信任程度即专家的影响力,专家的影响力越大求职者对其越信任,影响力很大的专家对事物的预测是越准确的,在职位推荐中则体现在求职专家对职位的评分反映出职位评分的发展趋势。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种人力资源企业的职位和人才匹配和推荐方法,其特征在于:具体包括协同过滤推荐方案、基于专家智慧推荐方案和整合方案;
(一)协同过滤推荐方案
记录如下形式的交互历史{(ut,Ot,Dt)},其中t是某次具体的交互会话的索引下标,构建推荐系统,将协同竞争过滤的问题定义为:考虑在推荐系统里的用户-系统交互过程如下:有用户u∈U:={1,2,3,...,M}和项目i∈I:={1,2,3,...,N},其中,U表示整个用户空间,I表示整个项目空间,Ot表示用户可选的上下文或者提供集,Dt表示用户做决定的项目集合,而i*表示Dt集合里的一个项目;
当一个用户进入系统后,系统为其推荐项目的一个集合O={i1,i2,i3,...,il},而用户u则从O中选择一个子集或者为空,D∈O,然后对子集D进行相应的操作,例如应聘某个职位,购买某件商品;最终可以实现为一个用户生成一个推荐使得用户的满意度最大;
协同竞争过滤基于一个give-and-take命题:一个合理的决定要使得效益最大化,要满足i*=argmaxi∈Oπui;其中πui表示效益,而πui=rui-cui,rui表示项目i对用户u的价值,cui=max{rui′:i'∈O\i}表示用户u为获得项目i而需要为之付出的代价;所述效益最大化也称为局部最优,局部指在Ot的情况下的最优;
将协同竞争过滤的问题转换成以下目标函数:
或者表示为:
上述两个式子表示用户选择结果集中的项目,它们的效用均大于其它未被选择的项目;
为解决上述局部最优解,提出两个具体的模型:
Softmax模型
Hinge模型
s.t.:
通过随机梯度下降方法可以得出较满意的结果,该方法通过不断地重复以下两个步骤进行,在迭代过程中要不断更新不同的参数:
对于所有项目i∈Ot使用来更新Φi
对于每个用户u,使用来更新Φu
其中η是学习率,两个模型的梯度可以使用下面的式子计算:
其中Η(·)是Heaviside函数,比如:如果x>0,H(x)=1,否则H(x)=0;
将人力资源企业保持的大量求职者应聘职位的历史记录表示为{userID,recruitID,date}的形式,其中userID是求职的编号,recruitID是职位的编号,date则表示求职者应聘职位的时间;
职位推荐思路为:
首先计算出所有求职者的偏好向量和职位的特性向量,然后针对每个求职者计算其与所有职位的内积,并按内积结果的降序排列,最后返回前N个作为职位推荐的结果,为了得到这些向量,借助协同竞争过滤的两个模型进行学习,得到职位推荐程序流程:
上述算法中,需要为每个求职者产生待计算推荐职位的候选集,不足在于耗时和低准确度,耗时的具体原因为:把整个职位空间当候选集增加了计算推荐职位的时间,所述低准确度的具体原因为:把整个职位空间当候选集时,必然存在许多不真实的噪音,这种噪音的存在会降低职位推荐的准确性;
为解决上述耗时和低准确度的问题,通过挖掘其它有用的信息来缩小候选集,减少计算时间并提高推荐的准确度;
改进职位候选集的现实基础是绝大多数求职者在较长的时间内只关注某种类型的职位,这基本符合求职的实际情况,结合岗位类别和求职者的具体应聘记录来产生候选集,具体做法是:a.将某个求职者所有应聘过的职位聚集在一起,然后找到所有与这些被应聘过的职位同属于一个岗位类别的其他职位并把它们作为候选集;b.对职位建模生成一个职位的kd-树,并通过该树寻找相似的职位;c.完成建模后,将某个求职者所有应聘过的职位聚集在一起,然后针对每一个职位从kd-树中找出与其相似的S个职位,所有这些相似的职位的集合作为该求职者待推荐的职位候选集;
为缓解职位推荐中的冷启动问题,采用根据相近求职者的情况为新求职者提供参考,从而为新求职者提供职位推荐,该算法如下:
Adjust需要Φu,θ,S,U四个参数,U表示需要为其推荐职位的求职者集合,格式为{userID,appliedCount},其中userID是求职者的编号,appliedCount是其应聘职位的数量;如果一个求职者暂时还没有应聘,那么其值为零;θ是求职者成为被参考者时最小应聘职位的数量;Φu表示U里面出现过的求职者的偏爱向量,如果一个求职者还没有应聘过任何职位,那么其向量应该为全零;S表示从求职者kd-树中寻找的相似求职者的数量;
程序开始后把U按照其应聘职位的数量否大于等于θ分成U1和U2集合,U2是需要调整的求职者的集合,U1是被U2参考的求职者集合;用集合U1构建求职者kd-树,然后对U2中的每一个求职者,找出与其最相近的S个求职者集合SUs,然后计算集合SUs里面的向量各个维度的平均值Φavg,最后把Φavg和Φu按下面的公式进行组合:
Φu←wΦu+(1-w)Φavg
w←u.appliedCount/θ
其中w的值为求职者应聘职位的数量除以阈值θ,当求职者没有任何的应聘记录时,w为零,那么求职者的向量全部用参考者的向量均值表示,当w越大表示越注重求职者自身的偏好向量;
(二)基于专家智慧推荐方案
为解决基于协同过滤的职位推荐中可能面对的数据稀疏的问题,引入专家智慧的想法,定义网络求职者用户是一个由元组组成的集合,每一个元组代表一个职位在该求职者投递简历时的状态(也就是求职者对职位的评分),而专家集e:{e1,e2,...,e3}是全体求职者用户的一个子集,子集中的每一个用户ei是满足以下准则的用户:
1)ei的元组数目超过某一个阈值T1
2)ei中每一个项目的评分rei,item落在该项目得分的T2置信区间内;
3)ei所有的项目评分满足以下的公式:
其中,ei,item表示ei对项目item的评分,表示ei对item的评分,meanei,item表示ei评分时,项目item得分的平均值;
由于网络求职中的专家在在求职中表现出的一个显著特点就是与职位的匹配度比较高,因此求职者应聘某个职位后应当计算求职者能力条件与职位要求之间的匹配度并加上该值,求职者u对职位i的评分ru,i则可以表示为:
ru,i=c+match(u,i)
其中c表示求职者应聘该职位后对职位的基础评分,每个求职者对职位的基础评分都为一个常量,match(u,i)则表示求职者与职位的匹配度;采用欧几里德距离公式来计算根据求职者和职位两个特征向量之间的匹配度,将求职者u对职位i的评分具体化为:
其中αu和βi分别为求职者向量和职位向量;
(三)整合方案
结合以上两种推荐方案的协同过滤框架,需要在普通求职者集合中查找目标用户的最近邻,包括专家和普通用户,但需要考虑何时采用一般用户的意见,何时采用专家的意见;
在得到求职者的最近邻集合后,接着要预测最近邻对未评分职位的评分值,并用预测评分值尽量将求职者-职位评分矩阵填满;求职者对未评分职位的评分预测值的计算公式如下:
其中sim(ra,rb)表示求职者a与其最近邻用户b之间的相似度,则分别表示求职者a、b各自对所有职位评分的均值;从该公式可以看出传统的计算方法在目标用户的评分均值的基础上加上一个修正值,不仅综合了最近邻用户对未评分项目的评分,而且还考虑到了目标用户与最近邻用户之间的相似度,用相似度对最近邻用户的评分进行加权;
定义用户的影响力:对于普通用户,其影响力大小为1,对于专家用户集中的专家ei,其影响力表示为:
其中表示专家ei对职位recruit的评分,表示专家ei评分时职位recruit所获得评分的均值,meanrecruit表示职位recruit最终获得评分的均值,Recruit(ei)则表示专家ei评过分的职位集(即申请过的职位);
从该公式可以看出,如果专家的评分具有预见性和代表性,那么该专家在对职位评分时,职位当时的评分均值与该专家的评分之间存在一定的差值,并且差值会慢慢减小,最终职位的评分均值与专家给出的评分会很接近,所以预测越准确的专家其影响力越大,的值也就越大,相反亦然。
整合方案引入上述专家影响力来对专家的评分进行加权修正,公式如下:
其中Expert(a)表示专家集,表示专家影响力;对于普通的最近邻求职者,其影响力定义为1;对于专家求职者,影响力作为一个影响因子对专家求职者的评分进行修正,如果专家的影响力越大,其对未评分职位的影响也越大,最终的预测值也会越大,该职位就越有可能被推荐出来;
最后根据各职位的综合预测值从高到低向求职者推送推荐职位列表。
2.根据权利要求1所述的一种人力资源企业的职位和人才匹配和推荐方法,其特征在于:所述职位推荐思路中,应聘记录很好的反映求职者对其应聘职位的偏好程度,这个偏好可以使用隐因子模型方法计算得到,即假设职位的各方面特性可以使用一个向量来表示,而用另外一个向量表示求职者对各种特性的偏好程度,将两个向量进行内积计算,得到的结果可以表示求职者对该职位的总体偏好程度,值越大,求职者就越喜欢该职位,该职位就越值得推荐给求职者。
3.根据权利要求1所述的一种人力资源企业的职位和人才匹配和推荐方法,其特征在于:所述基于专家智慧的职位推荐本质上是基于专家用户的协同推荐,在海量的数据中发现一些与目标用户兴趣爱好相似的专家称为邻居,采用Pearson相似度计算求职者间的相似度,然后将这些邻居喜欢的职位组成一个序列推荐给目标用户,称为最近邻模型,且相关算法已经公开,在此不另赘述。
4.根据权利要求1所述的一种人力资源企业的职位和人才匹配和推荐方法,其特征在于:所述用户的影响力判断依据:在专家用户集中寻找最近邻用户时需要反映出现实生活中人们对普通用户和专家的信任和接受程度常有不同,然而由于求职者之间并没有足够的相关交互,直接利用求职者对专家的信任程度来作为最近邻选择的影响因素不可行,假设求职者对专家的信任程度即专家的影响力,专家的影响力越大求职者对其越信任,影响力很大的专家对事物的预测是越准确的,在职位推荐中则体现在求职专家对职位的评分反映出职位评分的发展趋势。
CN201910066076.7A 2019-01-24 2019-01-24 一种人力资源企业的职位和人才匹配和推荐方法 Pending CN109885761A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910066076.7A CN109885761A (zh) 2019-01-24 2019-01-24 一种人力资源企业的职位和人才匹配和推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910066076.7A CN109885761A (zh) 2019-01-24 2019-01-24 一种人力资源企业的职位和人才匹配和推荐方法

Publications (1)

Publication Number Publication Date
CN109885761A true CN109885761A (zh) 2019-06-14

Family

ID=66926647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910066076.7A Pending CN109885761A (zh) 2019-01-24 2019-01-24 一种人力资源企业的职位和人才匹配和推荐方法

Country Status (1)

Country Link
CN (1) CN109885761A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110895755A (zh) * 2019-11-25 2020-03-20 上海沃锐企业发展有限公司 职位匹配方法以及装置、设备、存储介质
CN111026944A (zh) * 2019-11-20 2020-04-17 北京字节跳动网络技术有限公司 一种信息处理的方法、装置、介质和电子设备
CN111222842A (zh) * 2019-12-23 2020-06-02 福建亿能达信息技术股份有限公司 一种医疗人员ai智能招聘系统
CN111798217A (zh) * 2020-07-10 2020-10-20 河北冀联人力资源服务集团有限公司 数据分析系统及方法
CN112487161A (zh) * 2020-11-26 2021-03-12 北京智源人工智能研究院 一种面向企业需求的专家推荐方法、装置、介质及设备
CN112732768A (zh) * 2020-12-30 2021-04-30 陈正和 基于平台终端的舞者求职方法及电子设备
CN114282106A (zh) * 2021-12-22 2022-04-05 北京网聘咨询有限公司 一种职位信息快速投递方法
CN114742520A (zh) * 2022-03-22 2022-07-12 深圳壹账通科技服务有限公司 岗位匹配方法、装置、设备及存储介质
CN115526590A (zh) * 2022-09-16 2022-12-27 深圳今日人才信息科技有限公司 一种结合专家知识和算法的高效人岗匹配与复推方法
CN116340460A (zh) * 2023-03-17 2023-06-27 杭州东方网升科技股份有限公司 职位推荐方法、系统与存储介质
CN116977034A (zh) * 2023-09-22 2023-10-31 北京世纪飞讯科技有限公司 一种基于大数据的互联网品牌用户管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294816A (zh) * 2013-06-09 2013-09-11 广东倍智人才管理咨询有限公司 一种为求职者推荐职位的方法和职位推荐系统
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
CN108446886A (zh) * 2018-01-31 2018-08-24 合肥和钧正策信息技术有限公司 基于大数据的人才招聘系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294816A (zh) * 2013-06-09 2013-09-11 广东倍智人才管理咨询有限公司 一种为求职者推荐职位的方法和职位推荐系统
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
CN108446886A (zh) * 2018-01-31 2018-08-24 合肥和钧正策信息技术有限公司 基于大数据的人才招聘系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
樊广源: "南方人才网数据仓库及职位推荐研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
蔡跳: "基于专家智慧的职位推荐研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026944A (zh) * 2019-11-20 2020-04-17 北京字节跳动网络技术有限公司 一种信息处理的方法、装置、介质和电子设备
CN111026944B (zh) * 2019-11-20 2023-04-18 北京字节跳动网络技术有限公司 一种信息处理的方法、装置、介质和电子设备
CN110895755A (zh) * 2019-11-25 2020-03-20 上海沃锐企业发展有限公司 职位匹配方法以及装置、设备、存储介质
CN111222842A (zh) * 2019-12-23 2020-06-02 福建亿能达信息技术股份有限公司 一种医疗人员ai智能招聘系统
CN111798217A (zh) * 2020-07-10 2020-10-20 河北冀联人力资源服务集团有限公司 数据分析系统及方法
CN112487161A (zh) * 2020-11-26 2021-03-12 北京智源人工智能研究院 一种面向企业需求的专家推荐方法、装置、介质及设备
CN112732768A (zh) * 2020-12-30 2021-04-30 陈正和 基于平台终端的舞者求职方法及电子设备
CN114282106B (zh) * 2021-12-22 2023-07-25 北京网聘咨询有限公司 一种职位信息快速投递方法
CN114282106A (zh) * 2021-12-22 2022-04-05 北京网聘咨询有限公司 一种职位信息快速投递方法
CN114742520A (zh) * 2022-03-22 2022-07-12 深圳壹账通科技服务有限公司 岗位匹配方法、装置、设备及存储介质
CN115526590A (zh) * 2022-09-16 2022-12-27 深圳今日人才信息科技有限公司 一种结合专家知识和算法的高效人岗匹配与复推方法
CN115526590B (zh) * 2022-09-16 2023-08-04 深圳今日人才信息科技有限公司 一种结合专家知识和算法的高效人岗匹配与复推方法
CN116340460A (zh) * 2023-03-17 2023-06-27 杭州东方网升科技股份有限公司 职位推荐方法、系统与存储介质
CN116340460B (zh) * 2023-03-17 2023-09-01 杭州东方网升科技股份有限公司 职位推荐方法、系统与存储介质
CN116977034A (zh) * 2023-09-22 2023-10-31 北京世纪飞讯科技有限公司 一种基于大数据的互联网品牌用户管理方法及系统
CN116977034B (zh) * 2023-09-22 2023-12-08 北京世纪飞讯科技有限公司 一种基于大数据的互联网品牌用户管理方法及系统

Similar Documents

Publication Publication Date Title
CN109885761A (zh) 一种人力资源企业的职位和人才匹配和推荐方法
Zhang et al. Can consumer-posted photos serve as a leading indicator of restaurant survival? Evidence from Yelp
Wu et al. Integrated churn prediction and customer segmentation framework for telco business
Price et al. Computational support for academic peer review: A perspective from artificial intelligence
Wu et al. Optimal marketing strategy: A decision-making with ANP and TOPSIS
Wu et al. The supplier selection application based on two methods: VIKOR algorithm with entropy method and Fuzzy TOPSIS with vague sets method
Casson et al. The discovery of opportunities: Extending the economic theory of the entrepreneur
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
US20080147630A1 (en) Recommender and payment methods for recruitment
CN107958317A (zh) 一种众包项目中选取众包参与人的方法和装置
CN110070391A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN108921702A (zh) 基于大数据的园区招商方法及装置
CN112612942B (zh) 一种基于社交大数据的基金推荐系统及方法
CN113742492B (zh) 保险方案生成方法、装置、电子设备及存储介质
CN106469353B (zh) 一种面向大数据的项目合作企业智慧筛选排序方法
CN111222410A (zh) 一种基于人脸识别的店商消费行为分析引导营销系统
CN108876536A (zh) 基于最近邻信息的协同过滤推荐方法
CN109559152A (zh) 一种网络营销方法、系统及计算机存储介质
CN111932106B (zh) 一种有效实用的云制造任务与服务资源匹配方法
CN109919651A (zh) 对象的推送方法及装置
CN113111250A (zh) 业务推荐方法、装置、相关设备及存储介质
CN110516709B (zh) 基于层级聚类的传媒客户价值模型建立方法
CN113672797A (zh) 一种内容推荐方法及装置
Ahamed et al. A recommender system based on deep neural network and matrix factorization for collaborative filtering
CN114862506A (zh) 一种基于深度强化学习的金融产品推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614