CN106203935B - 基于用户生成内容及用户关系的技能评估与岗位匹配方法 - Google Patents

基于用户生成内容及用户关系的技能评估与岗位匹配方法 Download PDF

Info

Publication number
CN106203935B
CN106203935B CN201510316358.XA CN201510316358A CN106203935B CN 106203935 B CN106203935 B CN 106203935B CN 201510316358 A CN201510316358 A CN 201510316358A CN 106203935 B CN106203935 B CN 106203935B
Authority
CN
China
Prior art keywords
user
keyword
users
skills
technical ability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510316358.XA
Other languages
English (en)
Other versions
CN106203935A (zh
Inventor
唐锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510316358.XA priority Critical patent/CN106203935B/zh
Publication of CN106203935A publication Critical patent/CN106203935A/zh
Application granted granted Critical
Publication of CN106203935B publication Critical patent/CN106203935B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于用户生成内容及用户关系的技能评估与岗位匹配方法,其特征:首先提取出用户生成内容包含的技能关键词,形成用户在某个技能关键词下发表内容的统计信息。然后计算用户技能关键词得分。再通过用户技能关键词得分计算出用户声望得分初值,将其在用户关系网络中迭代计算得出最终的用户声望得分。至此建立起由用户技能关键词得分和用户声望得分组成的用户技能评估模型。从用户技能评估模型构建用于将用户和岗位进行匹配的查询库,查询库中的条目为由技能关键词作为索引对应由具有该技能关键词的用户、用户技能关键词得分、用户声望得分组成的列表。将岗位的技能需求部分拆分为技能关键词集合,使用这些关键词在查询库中查找与之匹配的用户。

Description

基于用户生成内容及用户关系的技能评估与岗位匹配方法
技术领域
本发明涉及到数据挖掘,特别是对用户生成内容及用户关系的挖掘以进行 技能评估与岗位匹配。
背景技术
一直以来招聘方对求职者的初步筛选主要依靠简历来完成。随着web技术 的发展,求职者对简历的投递以及招聘方对简历的收集都从线下转移到了线上。 简历的投递更加方便导致滥投简历情况严重,同时,人才已经成为社会最重要 的资源,招聘方需要主动出击查找符合需求的简历。这样一来简历筛选的工作 量日益加剧,一些有效的加快简历筛选的方法已经被提了出来。例如,申请号 为201110216654.4的发明专利《一种从简历库中快速检索简历的方法》,申请号 为201410617426.1的发明专利《一种简历模型匹配系统及方法》,申请号为 201310598050.X的发明专利《简历邮件筛选系统及方法》。
但是由于互联网的分布式特性以及只能依靠道德进行约束致使简历造假的 成本底下,出现了简历虚假夸大问题。通常用户并不会及时更新他们发布在网 络上的简历。这导致基于简历的求职者筛选方案还会遇到简历更新不及时的问 题。
随着互联网的深度普及,用户在网络上发表了海量的内容,同时人际关系 网络也搬到了线上。通过这些数据完成对用户技能的认定和评估并据此完成求 职者与岗位的匹配具有了高度可行性。基于用户生成内容及用户关系对求职者 进行技能评估,能够解决基于传统简历进行求职者筛选的各种弊端。申请号为 201310538500.6的发明专利《一种基于社交网络的招聘信息匹配方法》提供一 种利用社交网络用户个人信息、社交网络用户发布的数据、社交网络用户的一 级和二级好友进行求职者初步筛选的方法。虽然没有基于简历进行筛选的各种 问题,但仍然具有以下缺陷导致其难以实际利用。
第一,仅仅使用社交网络上的数据难以全方位评估用户实力;第二,把招 聘需求中规则化的能够进行精确匹配的可以作为过滤条件的学历、经验年限、 期望工作地点等信息和其它信息抽取成了一个关键词集合,这在进行匹配时会 产生主题漂移导致不能查找到符合要求的候选人;第三,关键词匹配方法不明 确,仅仅提到了使用微博API接口,事实上不同的匹配方法对匹配结果有很大 的影响;第四,所提到的用户列表的初始能量值与用户能力并无相关性,导致 后续步骤中利用好友为用户的岗位匹配度背书的操作没有事实依据;第五,在 岗位匹配时仅仅利用了关系网络中一级好友和二级好友。
发明内容
为解决背景技术中的问题,本发明提供了一种全方位使用用户生成内容和 用户关系完成用户与岗位技能需求匹配的方案。本发明能够避免了传统基于简 历的求职者初步筛选所具有简历筛选任务量大、简历虚假夸大、简历更新不及 时的问题。同时,本发明提出得技能评估模型、技能需求匹配方法,解决了申 请号为201310538500.6的发明专利所提供方法的上述问题。
本发明的技术方案是:
首先提取出用户生成内容中包含的技能关键词,并记录下该篇数据与技能 关键词的对应关系,并逐渐形成用户在某个技能关键词下发表内容的统计信息, 包括篇数、字数、评论数、关注数、赞同数、反对数等。如果某类用户生成内 容不包含某种统计信息,那么其值直接取0;如,在用户在BBS中提出的问题 可能不包含评论数、赞同数、反对数,那么这些统计信息直接取0值。
用户在某个技能关键词所代表的技术上的精通程度与用户在该技能关键字 上发表内容的数量、热度和认可程度正相关。经验表明他们之间的关系并不是 线性的,而是一种对数关系;也就是,当用户发表内容继续增多时并不表明用 户的精通程度线性的增加,实际上精通程度的增加略少。所以表示用户在某个 技能关键词所代表技能上的精通程度的数值化表示,即用户技能关键词得分的 计算公式为:
P=logN(1+a·Piece+b·Length+c·Remark+d·Pros-e·Cons)
其中Piece表示篇数,Length表示字数,Remark表示评论数,Pros表示赞 同数,Cons表示反对数;a、b、c、d、e分别为他们的系数。底N越大用户技 能关键词得分P的增长速度越缓慢,其值可以取自然对数e或者10等,还可以 根据具体行业的实际情况确定。系数a默认可以取1,b可以取数据来源站该类 型内容平均字数的倒数,c可以取数据来源站该类型内容的平均评论数的倒数, d和e可以取数据来源站该类型内容平均赞同和反对数之和的倒数。
在实现技能知识分享、技能成果分享和技能讨论的博客、社区等网站的用 户中形成了一种由关注和被关注构成的用户关系网络。一个用户关注另一个用 户能够表示前者对后者的技能水平表示认可。一个技能水平高超的用户所认可 的其它用户的技能水平也会是高超的;反之,一个技能水平普通的用户认可的 其它用户的技能水平不一定是高超的。也就是说,一个用户的关注者的水平从 侧面反映了这个用户的技能水平,这个用户的关注者的技能水平又能够被他们 的关注者从侧面进行反映,如此便形成了一种网状依赖关系。在这种网状关系 中,由一个用户的所有关注者、所有关注者的关注者、以此递推以致无限层次 的关注者所反映出来的用户的技能水平的数值化表示称作用户声望得分。下面给出用户声望得分的初值设定与计算方法。
以用户技能关键词得分之和除以用户技能关键词数量得出平均得分,将大 于等于平均得分的用户技能关键词得分之和除以大于等于平均得分的用户技能 关键词数量再次得出一个平均得分。将这个平均得分作为用户声望得分的初值, 并将其在用户关系网络中进行传播。传播策略为将某个用户的当前声望得分平 均分配给他所关注的其它用户。在下一次迭代前在用户的原始用户声望得分上 加上由其关注者传递过来的声望得分。使用该方法进行迭代计算,直至所有用 户的连续两次计算出的用户声望得分之差小于某个给定的经验值时结束。
至此个人技能评估模型建立完成,它由用户技能关键词得分和用户声望得 分组成。需要注意的是,用户关系网络只存在于某一个网站内部,因此需要分 网站计算出得分,再利用求和或者求均值的方法计算出求职用户的最终声望得 分。
为了将这种个人技能模型用于岗位匹配,需要将其转换为一种利于检索的 结构,即将技能关键词作为索引对应由具有该技能关键词的用户、用户技能关 键词得分、用户声望得分组成的列表。把所有的这类列表集合在一起组成一个 查询库。
通常,某项技能被越多的人掌握,那么它的价值就越低。所以还要统计出 技能关键词用户频数,即具有某个技能关键词的用户数量。然后计算出技能关 键词用户逆频率。技能关键词用户逆频率本质上是用户数量与技能关键词用户 频数的比值。为了易于使用给出了下列规范化的计算公式,其中numUsers是用 户数量,userFreq是技能关键词用户频数。
岗位需求的年龄、学历、经验、求职意向等部分采用传统的方法进行过滤。 岗位需求的技能需求部分需要采用一定的方法转换为技能关键词集合。转换方 法可以使用技能关键词库进行分词,也可以由招聘方直接提供。然后使用技能 关键词集合在前述“查询库”中检索出与技能关键词匹配的用户,并按照匹配 度进行排序。
匹配度的计算可以采用空间向量模型。首先将岗位技能需求的各个技能关 键词的权重组成一个向量(Wq1,Wq2,Wq3,…,Wqi),Wqi表示岗位技能需求关键词 集合中某个技能关键词Wi的权重,这个权重由岗位需求方指定,如果未指定默 认全是1。
然后创建出由用户在岗位技能需求关键词集合上的权重组成的向量 (Wu1,Wu2,Wu3,…,Wui)。如果用户不拥有技能关键词Wi,那么Wui的取值为0。 否则Wui按照如下公式进行取值。
Wui=IUF×(P+a×R)
其中IUF为技能关键词用户逆频率,P为用户技能关键词得分,R是用户声 望得分,a是用于调整R对权重影响程度的系数,a的取值范围推荐为[0,0.5)。
最终的匹配度Cos(q,u)计算公式为:
为了便于计算,下面给出一个计算匹配度的经验公式:
其中Cuw!=0表示用户权重向量中权重值不为零的分量的数目,Cq表示岗位 技能需求关键词的数目,q表示岗位技能需求关键词权重向量,Wqi为岗位技能 需求关键词的权重,u表示用户在岗位技能需求关键词上的权重向量,Wui为用 户在岗位技能需求关键词上的权重。
最后招聘方在按照匹配度排序的求职用户列表中挑选人员进入下一轮的招 聘流程。
具体实施方式
下面是本发明的实施例。本发明不局限于下面的优选实施方式,任何人应 该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或者相近似 的技术方案,均属于本发明的保护范围。
首先在用户生成内容中提取所有技能关键词,并计算包含技能关键词的用 户生成内容的统计信息。
然后根据技能关键词的统计信息计算出用户技能关键词得分以及用户声望 得分。
再组建以技能关键词为索引对应由具有该技能关键词的用户、用户技能关 键词得分、用户声望得分组成的列表为条目的查询库。
最后从岗位需求的技能需求部分提取技能关键词集合,在前述查询库中查 找匹配岗位技能需求的用户列表,并按照匹配度进行排列,供招聘方从中选择。

Claims (1)

1.基于用户生成内容及用户关系的技能评估与岗位匹配方法,其通过用户生成内容和用户关系创建由用户技能关键词得分和用户声望得分组成的用户技能评估模型,将岗位的技能需求部分拆分成技能关键词,并为各技能关键词赋权重,然后在由用户技能评估模型创建的查询库中查询与岗位技能需求匹配的用户,其特征在于:
所述用户技能关键词得分的计算公式为:
P=logN(1+a·Piece+b·Length+c·Remark+d·Pros-e·Cons)
其中Piece表示篇数,Length表示字数,Remark表示评论数,Pros表示赞同数,Cons表示反对数,a、b、c、d、e分别为他们的系数;
所述用户声望得分的初值与用户技能关键词得分正相关,迭代将用户声望得分均匀增加至所关注的其他用户,收敛后停止迭代,得出最终用户声望得分;
所述用户技能评估模型的构成为由技能关键词作为索引值对应由具有该技能关键词的用户、用户技能关键词得分、用户声望得分组成的列表;
所述查询与岗位技能需求匹配的用户,其匹配程度由提供的岗位技能需求关键词及其权重向量与用户在岗位技能需求关键词上的权重向量通过以下公式确定:
其中q表示岗位技能需求关键词权重向量,Wqi为岗位技能需求关键词的权重,其值由岗位需求方指定,如果未指定默认全是1,u表示用户在岗位技能需求关键词上的权重向量,Wui为用户在岗位技能需求关键词上的权重,其计算公式为:
Wui=IUF×(P+a×R)
其中IUF为技能关键词用户逆频率,P为用户技能关键词得分,R是用户声望得分,a是用于调整R对权重影响程度的系数,技能关键词用户逆频率的计算公式为:
其中numUsers是用户数量,userFreq是技能关键词用户频数。
CN201510316358.XA 2015-06-11 2015-06-11 基于用户生成内容及用户关系的技能评估与岗位匹配方法 Expired - Fee Related CN106203935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510316358.XA CN106203935B (zh) 2015-06-11 2015-06-11 基于用户生成内容及用户关系的技能评估与岗位匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510316358.XA CN106203935B (zh) 2015-06-11 2015-06-11 基于用户生成内容及用户关系的技能评估与岗位匹配方法

Publications (2)

Publication Number Publication Date
CN106203935A CN106203935A (zh) 2016-12-07
CN106203935B true CN106203935B (zh) 2019-11-05

Family

ID=57459939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510316358.XA Expired - Fee Related CN106203935B (zh) 2015-06-11 2015-06-11 基于用户生成内容及用户关系的技能评估与岗位匹配方法

Country Status (1)

Country Link
CN (1) CN106203935B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506389B (zh) * 2017-07-27 2020-05-19 北京德塔精要信息技术有限公司 一种提取职位技能需求的方法和装置
CN107609835B (zh) * 2017-07-28 2023-04-18 国网辽宁省电力有限公司 一种电网人力配置应用系统及方法
CN107870976A (zh) * 2017-09-25 2018-04-03 平安科技(深圳)有限公司 简历识别装置、方法及计算机可读存储介质
CN108304539A (zh) * 2018-01-30 2018-07-20 平安科技(深圳)有限公司 人才数据库建立方法、装置及存储介质
JP7030583B2 (ja) * 2018-03-20 2022-03-07 株式会社フォーラムエンジニアリング シラバスを利用したマッチング装置
CN108829676A (zh) * 2018-06-11 2018-11-16 安徽引航科技有限公司 基于文本分析技术的人才专业能力评估方法
JP7231186B2 (ja) * 2018-08-28 2023-03-01 ファインディ株式会社 技術力判断支援システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236716A (zh) * 2011-07-12 2011-11-09 上海简胜企业管理咨询有限公司 一种求职者与招聘职位匹配的系统及匹配方法
CN103544312A (zh) * 2013-11-04 2014-01-29 成都数之联科技有限公司 一种基于社交网络的招聘信息匹配方法
CN103778228A (zh) * 2014-01-24 2014-05-07 五八同城信息技术有限公司 利用即时通讯系统实现简历信息定向推广的方法
CN103810169A (zh) * 2012-11-06 2014-05-21 腾讯科技(深圳)有限公司 一种挖掘社区领域专家的方法和装置
CN104239393A (zh) * 2013-06-18 2014-12-24 成功要素股份有限公司 候选人简档的自动物色和筛选

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236716A (zh) * 2011-07-12 2011-11-09 上海简胜企业管理咨询有限公司 一种求职者与招聘职位匹配的系统及匹配方法
CN103810169A (zh) * 2012-11-06 2014-05-21 腾讯科技(深圳)有限公司 一种挖掘社区领域专家的方法和装置
CN104239393A (zh) * 2013-06-18 2014-12-24 成功要素股份有限公司 候选人简档的自动物色和筛选
CN103544312A (zh) * 2013-11-04 2014-01-29 成都数之联科技有限公司 一种基于社交网络的招聘信息匹配方法
CN103778228A (zh) * 2014-01-24 2014-05-07 五八同城信息技术有限公司 利用即时通讯系统实现简历信息定向推广的方法

Also Published As

Publication number Publication date
CN106203935A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN106203935B (zh) 基于用户生成内容及用户关系的技能评估与岗位匹配方法
CN108363804A (zh) 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN106598950B (zh) 一种基于混合层叠模型的命名实体识别方法
CN102332025B (zh) 一种智能垂直搜索方法和系统
CN110196946A (zh) 一种基于深度学习的个性化推荐方法
CN108665323A (zh) 一种用于理财产品推荐系统的集成方法
KR20080027237A (ko) 사회망에서 사용자들의 일치성 점수화
CN103823888A (zh) 一种基于节点亲密度的社交网站好友推荐方法
CN101510856A (zh) 一种sns网络中成员关系圈的提取方法和装置
CN104035987B (zh) 一种微博网络用户影响力排名方法
Rodriguez et al. Feature selection for job matching application using profile matching model
CN107562947A (zh) 一种移动时空感知下动态即时推荐服务模型建立方法
CN109902235A (zh) 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法
CN110334286A (zh) 一种基于信任关系的个性化推荐方法
CN109033132A (zh) 利用知识图谱计算文本和主体相关度的方法以及装置
CN102542409A (zh) 一种基于社会化网络系统的招聘信息展现方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN109636337A (zh) 一种基于大数据的人才库构建方法及电子设备
WO2010037314A1 (zh) 一种搜索的方法、系统和装置
CN111078859B (zh) 一种基于引用次数的作者推荐方法
CN107545444A (zh) 一种业务广告数据推荐方法以及装置
CN115775026A (zh) 一种基于组织相似度的联邦学习方法
CN112085158A (zh) 一种基于堆栈降噪自编码器的图书推荐方法
CN106022475B (zh) 基于动态自适应混沌蚁群算法的Web服务组合方法
CN105468780B (zh) 一种微博文本中产品名实体的规范化方法及装置

Legal Events

Date Code Title Description
DD01 Delivery of document by public notice

Addressee: Tang Rui

Document name: Notification of Passing Preliminary Examination of the Application for Invention

C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191105