CN109754233B - 一种智能推荐职位信息的方法和系统 - Google Patents
一种智能推荐职位信息的方法和系统 Download PDFInfo
- Publication number
- CN109754233B CN109754233B CN201910060095.9A CN201910060095A CN109754233B CN 109754233 B CN109754233 B CN 109754233B CN 201910060095 A CN201910060095 A CN 201910060095A CN 109754233 B CN109754233 B CN 109754233B
- Authority
- CN
- China
- Prior art keywords
- resume
- job
- information data
- matching degree
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 46
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 18
- 238000011161 development Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 4
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 6
- 230000007115 recruitment Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种智能推荐职位信息的方法和系统,包括:采集模块,采集职位JD信息和简历信息;职位解析模块,将职位JD信息解析为与职位信息数据相关的字段;简历解析模块,将简历信息解析为与简历信息数据相关的字段;职位模型数据库,用于存储解析出的职位信息数据;简历模型数据库,用于存储解析出的简历信息数据;简历推荐模块,用于简历筛选和过滤,计算候选简历与职位JD的匹配度,将候选简历根据与职位JD的匹配度进行排序。本发明能够为各个职位JD推选出匹配度较高的简历,同时也便于为简历推送匹配度较高的职位JD,为了企业和求职者提供精确的简历推荐或职位推荐,减轻了筛选和浏览简历或职位的工作量,提高工作效率,为求职者寻找合适的职位提供了方便。
Description
技术领域
本发明涉及计算机数据处理技术领域,尤其涉及一种智能推荐职位信息的方法和系统。
背景技术
企业在招聘员工时,通常会去招聘网站、猎头等网站来寻找想要的员工。这些网站往往根据用户输入的关键词、筛选条件匹配符合要求的简历。企业HR每天浏览这些简历,根据业务部门的招聘要求,从中挑选出比较符合的候选人简历。然后下载这些简历获取简历的联系方式,最后通过电话预约,面试申请、笔试、口试等一系列操作完成招聘流程。
通常情况下,一个HR需要管理几个不同招聘网站的企业账号,每天从这些不同网站上搜索关键词并指定筛选条件,浏览海量的简历,然后从这些简历中选择出符合条件的候选人。在这个过程中,HR需要自己总结出职位关键词,浏览所有根据关键词搜索到的简历,再从中反复筛选出符合的简历。这显然增加了HR搜索的难度和阅读的工作量。
同时一般招聘网站主要是根据用户输入的关键词等条件进行全文检索,即关键词查询简历,这种查询的简历仍谈非常粗糙,并且条件过于死板,使得许多不必要的简历和因为关键词问题匹配不到但内容有效的简历漏掉,导致HR少了许多候选人的选择。
除此之外,不同网站简历的格式,字段不同,限制了简历在同一维度进行评测。对于HR来说,如果能够有一个系统将网站上的简历处理、解析并且根据自己招聘的职位推荐出自己想要的简历,同时又可以借助来帮助自己学习、理解发布的职位,总结提炼关键词。从而省下大量的阅读无效简历的时间,降低职位理解的专业门槛。
发明内容
本发明所要解决的技术问题是提供一种能够精确筛选简历的职位推荐方法及系统。
为解决上述技术问题,本发明的技术方案是:一种智能推荐职位信息的方法,包括以下步骤:
获取职位JD,并解析出所述职位JD的职位信息数据,从所述职位信息数据的工作内容中提取所述职位JD的关键字标签,并将所述工作内容转换成语义矩阵向量;
获取简历,并解析所述简历的简历信息数据,从所述简历信息数据的工作经历中提取所述简历的关键字标签,将所述工作经历转换成矩阵向量;
设置符合所述职位JD的条件,将所述简历的关键字标签与所述职位JD的关键字标签进行匹配,召回符合所述职位JD条件且与所述职位JD的关键字标签匹配度高的简历作为候选简历;
将所述职位JD工作内容的语义矩阵向量与所述候选简历工作经历的矩阵向量进行相似度匹配,过滤掉不匹配及匹配度较低的候选简历;
将过滤后留下的候选简历通过排序算法进行计算,得出各候选简历的Rank值,根据所述Rank值对候选简历进行排序,其中,Rank值为职位JD与简历的匹配度。
作为优选的技术方案,还包括创建并更新职位模型数据库和简历模型数据库的步骤,所述职位模型数据库和简历模型数据库分别用于存储经过解析的职位JD信息数据和简历信息数据。
作为优选的技术方案,从所述职位JD中解析的职位信息数据,除工作内容之外,还包括:学历、地域要求、年龄、性别、职级、职位、专业、工作年限、薪资、职位加分项。
作为优选的技术方案,从所述简历中解析的简历信息数据,除工作经历之外,还包括:学历、性别、期望工作地、工作年限、求职状态、毕业院校、专业、期望薪资、期望行业、证书、特殊技能、政治面貌、名企经历、专利数量、发布时间、职位发展路径、工作稳定性。
作为优选的技术方案,所述排序算法的公式是
其中,Rank(j,r)表示对于一个职位j与一份简历r的匹配度;
G(Mi)表示采用回归类算法(Additive Regression)梯度提升回归树来构建指数;
Mi为解析的简历与职位JD之间形成的关系特征矩阵;
表示对于一个职位j,简历r中的工作经历和职位描述文本的加权相似度与权重的乘积,权重根据工作经历距离当前时间衰减;
PMI(j,Ti)表示对于一个职位j所包含的关键词标签的PMI值,用于准确地反馈出所述关键词标签在职位j上的权重;
表示加分项的累加值;
α为相关系数,对数值进行缩放避免量纲不统一导致的特征失效;
其中,关系特征矩阵的组成包括:学历的高低;工作年限时长;求职状态类别;学校类别;专业是否符合;期望薪资高低;期望行业是否符合;是否具有名企经历;简历与职位的职位发展路径差值;工作稳定性数值;
加分项包括:特别技能;语言;政治面貌;证书;简历解析的加分项;专利数量。
一种智能推荐职位信息的系统,包括:
采集模块,采集企业用户发布的职位JD信息和求职者发布的简历信息;
职位解析模块,将企业用户发布的职位JD信息解析为与职位信息数据相关的字段,匹配对应的职位JD模型;
简历解析模块,将求职者发布的简历信息解析为与简历信息数据相关的字段,匹配对应的简历模型;
职位模型数据库,用于存储解析出的职位信息数据;
简历模型数据库,用于存储解析出的简历信息数据;
简历推荐模块,用于简历筛选和过滤,计算候选简历与职位JD的匹配度,将候选简历根据与职位JD的匹配度进行排序,输出与职位JD的匹配度高的简历,以及与简历匹配度高的职位JD。
作为优选的技术方案,职位推荐系统还包括:
系统数据库,用于储存采集模块采集的职位JD和简历数据;
职位推荐库,用于存储由所述简历推荐模块推荐的职位;
简历推荐库,用于存储由所述简历推荐模块推荐的简历。
进一步的,职位推荐系统还包括:
同步模块,用于将从不同平台采集的同一人的简历数据或同一职位数据同步更新;
监控模块,用于跟踪并记录各模块的执行情况记录日志,监控和展示各单元执行的任务量。
由于采用了上述技术方案,本发明的有益效果是:本发明能够将职位JD和简历中将多种职位信息数据和简历信息数据分别提取出来,为职位JD和简历设置关键字标签用于简历的过滤和筛选,通过提取职位JD的工作内容以及简历的工作经历,将二者通过排序算法计算出匹配度,为各个职位JD推选出匹配度较高的简历,同时也便于为简历推送匹配度较高的职位JD,为了企业和求职者提供精确的简历推荐或职位推荐,减轻了筛选和浏览简历或职位的工作量,提高工作效率,为求职者寻找合适的职位提供了方便。
本发明能够将不同平台上的职位JD数据和简历数据同步,为简历推荐和求职提供了便利条件。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的工作流程图;
图2是本发明实施例的原理框图。
具体实施方式
如图1和图2共同所示,本发明实施例提供了一种智能推荐职位信息的方法和系统,职位推荐方法主要包括以下步骤:
获取职位JD,并解析出职位JD的职位信息数据,包括:工作内容、学历、地域要求、年龄、性别、职级、职位、专业、工作年限、薪资、职位加分项。
从职位信息数据的工作内容中提取职位JD的关键字标签,并将工作内容转换成语义矩阵向量;
获取简历,并解析简历的简历信息数据,包括:工作经历、学历、性别、期望工作地、工作年限、求职状态、毕业院校、专业、期望薪资、期望行业、证书、特殊技能、政治面貌、名企经历、专利数量、发布时间、职位发展路径、工作稳定性。
从简历信息数据的工作经历中提取简历的关键字标签,将工作经历转换成矩阵向量;
设置符合职位JD的条件,将简历的关键字标签与职位JD的关键字标签进行匹配,召回符合职位JD条件且与职位JD的关键字标签匹配度高的简历作为候选简历;
将职位JD工作内容的语义矩阵向量与候选简历工作经历的矩阵向量进行相似度匹配,过滤掉不匹配及匹配度较低的候选简历;
将过滤后留下的候选简历通过排序算法进行计算,得出各候选简历的Rank值,根据Rank值对候选简历进行排序,其中,Rank值为职位JD与简历的匹配度。
职位推荐系统,包括:
采集模块,采集企业用户发布的职位JD信息和求职者发布的简历信息;
职位解析模块,将企业用户发布的职位JD信息解析为与职位信息数据相关的字段,匹配对应的职位JD模型;
简历解析模块,将求职者发布的简历信息解析为与简历信息数据相关的字段,匹配对应的简历模型;
职位模型数据库,用于存储解析出的职位信息数据;
简历模型数据库,用于存储解析出的简历信息数据;
简历推荐模块,用于简历筛选和过滤,计算候选简历与职位JD的匹配度,将候选简历根据与职位JD的匹配度进行排序,输出与职位JD的匹配度高的简历,以及与简历匹配度高的职位JD。
系统数据库,用于储存采集模块采集的职位JD和简历数据;
职位推荐库,用于存储由简历推荐模块推荐的职位;
简历推荐库,用于存储由简历推荐模块推荐的简历。
同步模块,用于将从不同平台采集的同一人的简历数据或同一职位数据同步更新。
监控模块,用于跟踪并记录各模块的执行情况记录日志,监控和展示各单元执行的任务量。
职位解析模块,进行职位JD解析的步骤如下:
步骤101,获取发布的职位JD。
招聘平台的系统用户将发布的职位JD录入到系统数据库中,可以定期从系统数据库中读取该职位JD,读取的职位JD会被系统加载等待解析。
步骤102,获取采集、录入的简历。
采集简历包括从数据库中读取由外部采集系统采集到的简历,以及招聘网站同步的简历,读取的简历会被系统加载等待解析;或直接将简历录入简历解析模块,将职位JD直接录入职位解析模块。
步骤103,解析职位JD。
职位JD的解析是将用户录入或读取的职位JD解析为标准的字段,匹配相应的模型,为简历推荐到职位提供职位信息的标准数据,然后将解析完的职位信息数据保存到职位模型数据库,
步骤103具体包括:
步骤10301,职位JD学历解析:学历会从博士/博士后、硕士到初中被分为若干级别,根据用户输入的学历要求,识别出描述的学历最低要求,作为推荐因子用于推荐。
步骤10302,职位JD地域解析:预设中国地图数据表包含中国各个省市区所对应的信息,根据读取或输入的职位JD的工作地域解析,通过图计算获取适合该职位的若干地域,作为推荐因子用于推荐。
步骤10303,职位JD年龄解析:根据职位JD的年龄范围解析出年龄要求,作为推荐因子用于推荐。
步骤10304,职位JD性别解析:少量职位对性别有所倾向,解析出性别要求作为推荐因子。
步骤10305,职位JD职级解析:职级是职位的一个程度,分为管理职级和技术职级,分别在系统中预设默认等级,如助理、主管、经理、总监,工程师、研究员、资深工程师、首席科学家等。职级预设表中包含后缀词和修饰词用于判断预测职位JD中适用于的职级范围。例如,对于招聘总监,推荐范围是招聘经理或招聘总监,但招聘专员或实习生就不合适。
其中,职级预设表中采用大量的简历职位名称数据分析后训练、标注而成,部分可以根据人的专业知识手动调整。包含职位后缀词和修饰词,例如,后缀词有工程师、科学家、经理、专员、研究员等,修饰词包括资深、首席、高级等。通过回归预测算法将职位JD中的职级预测到一个合理范围内。
步骤10306,职位JD专业解析:专业是高等学校中所分的学业门类,在数据库中预设中国各个高等学校所开设的专业,分别对应于哲学、经济学、法学等,一级学科代码所对应的学科。根据职位JD中倾向的专业进行解析识别。例如,心理学专业优先,会识别出心理学并作为推荐因子。
步骤10307,职位JD工作年限解析:根据输入职位的工作年限范围解析成推荐因子用于推荐,例如,具有10年工作经验等。
步骤10308,职位JD薪资解析。系统输入职位的薪资范围解析成推荐因子用于推荐。
步骤10309,职位JD加分项解析:加分项指职位JD中有些特殊的点,如果简历中包含这些点则会对简历的匹配有加分作用。通过预置的模型数据存储在职位模型数据库中。例如,拥有海外工作经历、重点大学优先、熟练自动化办公工具等。通过预设及整理训练出一批短语标签模型,并且在系统运行过程中不断补充完善短语标签。
若职位JD中需要包含指定标签时,则会作为推荐因子用于推荐。
步骤10310,职位JD工作内容解析:职位JD的工作内容可以是职位描述文本,也可以是对该职位匹配的优秀简历的工作内容。
根据训练学习的语义模型,其中学习语料覆盖各行各业的简历内容,囊括词频高频和中频的关键词标签。职位JD工作内容会根据该模型将原本无法进行计算的文本数据转换生成语义矩阵向量,用于语义的比较和计算。其中通过该矩阵向量,进行职位聚类、相似度匹配、分类回归等计算。
系统会将简历不断转换为语料,专业人员通过分词工具和新词发现工具不断将新词配置到分词列表中,从何不断迭代更新模型。使其能够覆盖处理更多带有生僻词的文本描述。
步骤10311,职位JD关键词标签解析:根据工作内容描述文本中提取相关关键词标签作为职位JD的标签,用于简历召回。
职位JD解析会通过以上解析方法,将原本不利于计算机处理计算的文本数据信息等价转换为数值信息,以便于之后的推荐算法模块进行简历推荐。
职位解析模块解析的职位信息数据存储在职位模型数据库中。
简历解析模块进行简历解析的步骤如下:
步骤104,解析简历。
解析简历是将内容不规则、字段不统一、计算机难以处理的文本化信息标准化为计算机以及算法方便处理但是信息量基本等价的数值信息的过程。同样的简历有许多指标可以量化和标准化,,然后将解析完的简历数据保存到数据库,
步骤10401,简历学历解析:学历从博士/博士后、硕士到初中被分为若干级别,系统会识别出描述的学历。
步骤10402,简历性别解析:识别简历中的人物性别,例如,男或女。
步骤10403,简历期望工作地解析:预设中国地图数据表包含中国各个省市区所对应的信息,根据简历中的期望工作地识别解析,通过图计算获取适合的若干地域。
步骤10404,简历工作年限解析:识别简历的工作年限,例如,工作了多少年。
步骤10405,简历求职状态解析:识别简历的求职状态,例如,离职,正在找工作、在职,看看新机会等。
步骤10406,简历学校解析:识别简历中的最高学历的毕业院校,预设学校库分为985/211、普通高效、民办高校、海外优秀高校、海外普通高校等。其中学校库中存储学校名称、学校简称等对应关系。
步骤10407,简历专业解析:与职位JD中的专业要求类似,识别简历中的学科和一级学科代码所对应的学科。
步骤10408,简历期望薪资解析:识别简历中的期望薪资数据,统一单位,例如,年薪10万以下、10万~14万等。
步骤10409,简历期望行业解析:建立行业数据库,行业数据库包含第一类目和第二类目,第一类目例如,计算机/互联网/通信/电子、销售/客服/技术支持等,第二类目例如,计算机软件、销售管理。
根据行业数据库中的信息识别简历中的期望行业字段。
步骤10410,简历工作经历解析:简历工作经历一般会大于等于1个,工作经历的解析是对简历中的每个工作经历进行信息(数值化)转化,权重分配。前者与职位JD工作内容解析类似,主要采用语义模型对文本描述进行信息转化成矩阵向量,形成一个关于工作经历的矩阵,作为和职位JD工作内容(职位描述或优秀简历工作经历)作相关度比较计算。后者是根据工作经历离当前时间的远近分配权重,越近权重越高,反之则越低。
步骤10411,简历特别技能解析:识别并统计简历中的特别技能,例如,熟练掌握word使用、擅长ps等。该解析字段用于推荐的加分项。
步骤10412,简历语言解析:识别简历中的语言,例如,英语4级、英语6级、日语、韩语等。
步骤10413,简历政治面貌解析:识别简历中的政治面貌,例如,党员、群众等。
步骤10414,简历证书解析:识别简历中的证书,例如,《计算机证书》、《中级会计证书》、《中级口译证书》等。
步骤10415,简历名企经历解析:识别工作经历中的公司名称,通过公司名称识别出企业标准名、简称,并通过企业数据库匹配名企名录,统计简历中在名企中工作的时间长度。
步骤10416,简历专利数量解析:识别简历中是否在任职期间发表过专利,专利发表的数量。
步骤10417,简历发布时间解析:识别简历的发布的时间,解析为标准时间格式。
步骤10418,简历加分项解析:识别简历的加分项,类似于职位JD的加分项,通过预先设置的短语标签,识别简历中是否具有这些加分项。短语标签同职位JD的加分项中提到的例如,拥有海外工作经历、重点大学优先、熟练自动化办公工具等。
步骤10419,简历职位发展路径解析:识别简历中工作经历中职位名称,类似于职位JD对职位路径的识别方法,只关注前两个工作经历的职位名称。若工作经历只有一个,则以第一个为主。
步骤10420,简历工作稳定性解析:工作稳定性指简历中的工作经历持续时间和工作经历数的协同变化程度,若短时间内工作经历越多则越不稳定,反之则越稳定。系统会根据稳定性公式计算得出简历中工作稳定型。
步骤10421,简历关键词标签解析:系统会通过简历中的工作经历、项目经历、技能、语言、教育经历提取关键词标签,类似于职位JD的关键词标签提取,用于简历召回。
简历解析模块解析的简历信息数据解析在简历模型数据库中。
简历推荐模块,读取已经解析完的职位信息数据和简历信息数据,通过排序算法,计算得出职位JD匹配度高的简历,结合图1,其具体步骤如下:
步骤1051,获取解析职位JD,读取已经解析完毕需要推荐简历的职位JD。包括数据获取单元,用于查询数据库中的表数据,例如采用JDBC,通过SQL语句进行数据查询。
步骤1052,召回简历:设置职位JD的条件,根据该条件搜索查询出一批符合条件的简历。应该满足职位JD的条件为:
符合职位JD关键词标签的简历;
不低于要求的最低学历;
简历期望工作地包含在要求的地域中;
在要求的年龄范围内;
在要求的职级范围内;
在要求的工作年限范围内;
在要求的薪资范围内;
该职位已经推荐过的简历不再召回;
根据简历发布时间范围倒序召回指定数据简历。
符合以上条件的简历会作为候选简历进入下一个步骤。
步骤1053,内容匹配计算,用于找出简历工作内容与职位JD工作内容匹配的简历,不匹配的简历将在这个步骤中被过滤:
先对召回的简历进行敏感词过滤,敏感词由用户提供,包含敏感词的简历会被过滤。
通过职位JD工作内容解析出的文本矩阵向量和简历的工作经历解析出的矩阵向量进行相似度匹配计算,当值地域某阈值时则认为简历与职位内容不匹配,值越高则认为匹配度越高。对不匹配的简历进行过滤,匹配的简历根据计算得出的匹配度作为推荐因子保留到下一个步骤。
步骤1054,排序计算:
通过之前召回简历和内容匹配计算两个步骤,简历已经和职位JD相关并且在符合的范围内,该步骤用于对剩下的简历进行排序,以此帮助用户可以将注意力聚焦在最适合的简历上。排序算法由三部分组成,包括:关系特征矩阵、内容相关度和加分项。
解析的简历和职位JD形成关系特征矩阵,关系特征矩阵由以下组成:
学历的高低;
工作年限时长;
求职状态类别;
学校类别;
专业是否符合;
期望薪资高低;
期望行业是否符合;
是否具有名企经历;
简历与职位的职位发展路径差值;
工作稳定性数值;
内容相关度由以下组成:
工作经历相关度高低;
关键词标签PMI值
系统通过对该关系特征矩阵进行回归类算法计算,并且加上简历加分项来构成排序数值,其中加分项由以下组成:
特别技能;
语言;
政治面貌;
证书;
简历解析的加分项;
专利数量;
本发明提出了一种协同上述因素,由排序模型输出得到的Rank值,其中排序模型的计算公式为:
其中
Rank(j,r)表示对于一个职位j,一份简历r的匹配度;
G(Mi)表示采用回归类算法(Additive Regression)梯度提升回归树来构建指数,Mi为关系特征矩阵;
表示对于一个职位j,简历r中的工作经历和职位描述文本的加权相似度,再乘以权重,权重根据工作经历距离当前时间进行衰减,例如,最近的工作经历权重越高,反之越低,取所有工作经历相似度的最高值;
PMI(j,Ti)表示对于一个职位j,它所包含的关键词标签的PMI值,该值可以准确地反馈出标签在该职位j上的权重,例如:
{(培训体系,3.02),(讲师,2.90),(人力资源总监,2.76),…,(ERP,-0.63)}
表示加分项的累加值;
α为相关系数,对数值进行缩放避免量纲不统一导致的特征失效。
本发明中将简历的额外特征(学历等)、简历的工作经历匹配度以及加分项看成影响简历质量的三个部分,其中前两个特征采用协同加权的方式进行组合,这种方式可以将两类特征有效的结合起来,还可以根据α针对业务需求增强或降低特征的权重对排序的影响。
根据候选简历的排序,将与职位JD匹配度高的简历推送给企业用户,将与简历匹配度高的职位推送给求职者。
同步模块,分别是职位同步,将外部录入、外部采集系统、外部应用系统等收录的职位JD读取并且提交给职位解析单元来执行;简历同步,将外部录入、外部采集系统、外部应用系统等收录的简历读取并且提交给简历解析单元来执行;白名单职位JD同步,用于分配同步的所有职位JD哪些需要提交给推荐单元上线,哪些需要冻结下线。
通过同步模块更新职位模型数据库和简历模型数据库。
本发明中,职位解析模块运行在一个单独的工作线程上,主要负责两个任务,对同步单元和采集单元读取的职位JD进行解析;然后保存解析后的数据到职位模型数据库中。
简历解析单元可以同时运行在多个线程上,主要取决于部署服务器的物理环境cpu核数以及需要处理的简历数量。简历解析单元主要负责四个任务,分别是读取的简历数据进行拼接,将一份简历数据搜集拼接成一份完整的简历数据,因为在简历的存储时,根据数据的特性和用途,会采用不同的方式存储在系统数据库中,包括数据库存储、索引文件存储、三元组存储以及值键对存储等,将一份打散存储的简历还原;然后对简历进行解析;接着会对简历进行去重,用于对不同平台收录的同一个人的简历归并到最新的一份简历上;最后对解析的简历保存到简历模型数据库和索引文件中。其中索引文件是指借助于分词器,能够对文本进行快速查询、搜索的介质。
同步模块运行在一个独立线程上,提供处理任务的定时机制,所谓定时机制是对所执行的任务能够在指定的时间、执行频次上触发并执行任务。同步模块主要负责三个任务,分别是职位同步,将外部录入、外部采集系统、外部应用系统等收录的职位JD读取并且提交给职位解析模块来执行;简历同步,将外部录入、外部采集系统、外部应用系统等收录的简历读取并且提交给简历解析模块来执行;白名单职位JD同步,该任务用于分配同步的所有职位JD哪些需要提交给简历推荐模块上线,哪些需要冻结下线。
简历推荐模块可以同时运行在多个线程上,这主要取决于部署服务器的物理环境cpu核数以及需要处理的职位数量。该单元的任务为接收白名单职位JD,对每一个职位进行推荐简历,具体方法步骤为获得解析职位JD、召回简历、内容匹配度计算和排序计算。该单元具有定时触发机制,可以调整触发时间和触发频次适应业务要求。
监控单元运行在一个独立的线程上,对本发明中各单元的执行情况记录日志,监控和展示各单元执行的任务数量,剩余为执行的任务数量,方便开发、运维人员及时跟踪系统生产状况,应对状况外的情况。
以上显示和描述了本发明的基本原理、主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (7)
1.一种智能推荐职位信息的方法,其特征在于,包括以下步骤:
获取职位JD,并解析出所述职位JD的职位信息数据,从所述职位信息数据的工作内容中提取所述职位JD的关键字标签,并将所述工作内容转换成语义矩阵向量;
获取简历,并解析所述简历的简历信息数据,从所述简历信息数据的工作经历中提取所述简历的关键字标签,将所述工作经历转换成矩阵向量;
设置符合所述职位JD的条件,将所述简历的关键字标签与所述职位JD的关键字标签进行匹配,召回符合所述职位JD条件且与所述职位JD的关键字标签匹配度高的简历作为候选简历;
将所述职位JD工作内容的语义矩阵向量与所述候选简历工作经历的矩阵向量进行相似度匹配,过滤掉不匹配及匹配度低的候选简历;
将过滤后留下的候选简历通过排序算法进行计算,得出各候选简历的Rank值,根据所述Rank值对候选简历进行排序,其中,Rank值为职位JD与简历的匹配度;
所述排序算法的公式是
其中,Rank(j,r)表示对于一个职位j与一份简历r的匹配度;
G(Mi)表示采用回归类算法(Additive Regression)梯度提升回归树来构建指数;
Mi为解析的简历与职位JD之间形成的关系特征矩阵;
Similarity(j,r)表示对于一个职位j,简历r中的工作经历和职位描述文本的加权相似度与权重的乘积,权重根据工作经历距离当前时间衰减;
PMI(j,Ti)表示对于一个职位j所包含的关键词标签的PMI值,用于准确地反馈出所述关键词标签在职位j上的权重;
表示加分项的累加值;
α为相关系数,对数值进行缩放避免量纲不统一导致的特征失效;
其中,关系特征矩阵的组成包括:学历的高低;工作年限时长;求职状态类别;学校类别;专业是否符合;期望薪资高低;期望行业是否符合;是否具有名企经历;简历与职位的职位发展路径差值;工作稳定性数值;
加分项包括:特别技能;语言;政治面貌;证书;简历解析的加分项;专利数量。
2.如权利要求1所述的一种智能推荐职位信息的方法,其特征在于:还包括创建并更新职位模型数据库和简历模型数据库的步骤,所述职位模型数据库和简历模型数据库分别用于存储经过解析的职位JD信息数据和简历信息数据。
3.如权利要求1所述的一种智能推荐职位信息的方法,其特征在于:从所述职位JD中解析的职位信息数据,除工作内容之外,还包括:学历、地域要求、年龄、性别、职级、职位、专业、工作年限、薪资、职位加分项。
4.如权利要求1所述的一种智能推荐职位信息的方法,其特征在于:从所述简历中解析的简历信息数据,除工作经历之外,还包括:学历、性别、期望工作地、工作年限、求职状态、毕业院校、专业、期望薪资、期望行业、证书、特殊技能、政治面貌、名企经历、专利数量、发布时间、职位发展路径、工作稳定性。
5.一种智能推荐职位信息的系统,应用于如权利要求1-4任意一项所述的一种智能推荐职位信息的方法,其特征在于,包括:
采集模块,采集企业用户发布的职位JD信息和求职者发布的简历信息;
职位解析模块,将企业用户发布的职位JD信息解析为与职位信息数据相关的字段,匹配对应的职位JD模型;
简历解析模块,将求职者发布的简历信息解析为与简历信息数据相关的字段,匹配对应的简历模型;
职位模型数据库,用于存储解析出的职位信息数据;
简历模型数据库,用于存储解析出的简历信息数据;
简历推荐模块,用于简历筛选和过滤,计算候选简历与职位JD的匹配度,将候选简历根据与职位JD的匹配度进行排序,输出与职位JD的匹配度高的简历,以及与简历匹配度高的职位JD。
6.如权利要求5所述的一种智能推荐职位信息的系统,其特征在于,还包括:
系统数据库,用于储存采集模块采集的职位JD和简历数据;
职位推荐库,用于存储由所述简历推荐模块推荐的职位;
简历推荐库,用于存储由所述简历推荐模块推荐的简历。
7.如权利要求5所述的一种智能推荐职位信息的系统,其特征在于,还包括:
同步模块,用于将从不同平台采集的同一人的简历数据或同一职位数据同步更新;
监控模块,用于跟踪并记录各模块的执行情况记录日志,监控和展示各单元执行的任务量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910060095.9A CN109754233B (zh) | 2019-01-29 | 2019-01-29 | 一种智能推荐职位信息的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910060095.9A CN109754233B (zh) | 2019-01-29 | 2019-01-29 | 一种智能推荐职位信息的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109754233A CN109754233A (zh) | 2019-05-14 |
CN109754233B true CN109754233B (zh) | 2024-05-07 |
Family
ID=66404841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910060095.9A Active CN109754233B (zh) | 2019-01-29 | 2019-01-29 | 一种智能推荐职位信息的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109754233B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069806B (zh) * | 2019-05-21 | 2024-04-05 | 杭州海康威视数字技术股份有限公司 | 简历筛选方法、装置、电子设备及存储介质 |
CN110297972B (zh) * | 2019-06-12 | 2021-07-27 | 北京网聘咨询有限公司 | 高效的简历投递系统 |
CN110399475A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 基于人工智能的简历匹配方法、装置、设备及存储介质 |
CN110633894A (zh) * | 2019-08-15 | 2019-12-31 | 中国平安财产保险股份有限公司 | 岗位数据处理方法、装置、设备及介质 |
CN110781658B (zh) * | 2019-10-14 | 2023-08-25 | 抖音视界有限公司 | 简历解析方法、装置、电子设备和存储介质 |
CN112749943A (zh) * | 2019-10-30 | 2021-05-04 | 何敬文 | 一种基于地图标记的在线求职招聘系统 |
CN111160850A (zh) * | 2019-12-11 | 2020-05-15 | 浙江微元智能科技股份有限公司 | 一种适用于人员甄别的匹配系统及其匹配方法 |
CN111144723A (zh) * | 2019-12-17 | 2020-05-12 | 埃摩森网络科技(上海)有限公司 | 人岗匹配推荐方法及系统、存储介质 |
CN111105209B (zh) * | 2019-12-17 | 2023-07-21 | 上海沃锐企业发展有限公司 | 适用于人岗匹配推荐系统的职位简历匹配方法及装置 |
CN112256877A (zh) * | 2019-12-30 | 2021-01-22 | 北京来也网络科技有限公司 | 结合rpa和ai的简历筛选方法、装置、设备及存储介质 |
CN111198970A (zh) * | 2020-01-02 | 2020-05-26 | 中科鼎富(北京)科技发展有限公司 | 一种匹配简历方法、装置、电子设备及存储介质 |
CN113742563B (zh) * | 2020-05-28 | 2023-08-18 | 北京百度网讯科技有限公司 | 工作预测模型的建立和工作推荐方法、装置、设备及介质 |
CN111967858A (zh) * | 2020-08-29 | 2020-11-20 | 深圳呗佬智能有限公司 | 一种人才智能推荐方法、系统、计算机设备及存储介质 |
CN112232773A (zh) * | 2020-10-19 | 2021-01-15 | 北京人人众包科技有限公司 | 软件推荐方法及系统 |
CN112258032A (zh) * | 2020-10-22 | 2021-01-22 | 上海腾竞商务咨询有限公司 | 一种基于人才数据的招聘服务方法 |
CN112287109A (zh) * | 2020-10-29 | 2021-01-29 | 北京希瑞亚斯科技有限公司 | 信息匹配方法、装置、电子设备及计算机可读存储介质 |
CN113221013A (zh) * | 2021-06-04 | 2021-08-06 | 金保信社保卡科技有限公司 | 职业发展规划应用方法及系统 |
CN113610503A (zh) * | 2021-08-11 | 2021-11-05 | 中国平安人寿保险股份有限公司 | 简历信息处理方法、装置、设备及介质 |
CN113849740A (zh) * | 2021-09-29 | 2021-12-28 | 河北冀联人力资源服务集团有限公司 | 一种基于分类器的用工推荐方法、系统及可读存储介质 |
CN115456584A (zh) * | 2022-09-16 | 2022-12-09 | 深圳今日人才信息科技有限公司 | 基于深度学习模型和专家系统的相似jd召回与推荐方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN106649885A (zh) * | 2017-01-13 | 2017-05-10 | 深圳爱拼信息科技有限公司 | 一种专业类与标准专业名的匹配方法及系统 |
CN106777296A (zh) * | 2016-12-30 | 2017-05-31 | 深圳爱拼信息科技有限公司 | 一种基于语义匹配的人才搜索推荐方法及系统 |
CN106980961A (zh) * | 2017-03-02 | 2017-07-25 | 中科天地互联网科技(苏州)有限公司 | 一种简历筛选匹配方法及系统 |
CN107357917A (zh) * | 2017-07-20 | 2017-11-17 | 北京拉勾科技有限公司 | 一种简历搜索方法及计算设备 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110078154A1 (en) * | 2009-09-28 | 2011-03-31 | Accenture Global Services Gmbh | Recruitment screening tool |
US10776757B2 (en) * | 2016-01-04 | 2020-09-15 | Facebook, Inc. | Systems and methods to match job candidates and job titles based on machine learning model |
-
2019
- 2019-01-29 CN CN201910060095.9A patent/CN109754233B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN106777296A (zh) * | 2016-12-30 | 2017-05-31 | 深圳爱拼信息科技有限公司 | 一种基于语义匹配的人才搜索推荐方法及系统 |
CN106649885A (zh) * | 2017-01-13 | 2017-05-10 | 深圳爱拼信息科技有限公司 | 一种专业类与标准专业名的匹配方法及系统 |
CN106980961A (zh) * | 2017-03-02 | 2017-07-25 | 中科天地互联网科技(苏州)有限公司 | 一种简历筛选匹配方法及系统 |
CN107357917A (zh) * | 2017-07-20 | 2017-11-17 | 北京拉勾科技有限公司 | 一种简历搜索方法及计算设备 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109754233A (zh) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754233B (zh) | 一种智能推荐职位信息的方法和系统 | |
CN110825882B (zh) | 一种基于知识图谱的信息系统管理方法 | |
US11106664B2 (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
US10691732B1 (en) | Text understanding methods and system for matching job and resume documents | |
US6728695B1 (en) | Method and apparatus for making predictions about entities represented in documents | |
Haustein | Multidimensional journal evaluation: Analyzing scientific periodicals beyond the impact factor | |
EP3224735A2 (en) | Systems and methods to determine and utilize conceptual relatedness between natural language sources | |
CN102597991A (zh) | 文档分析与关联系统及方法 | |
KR101505858B1 (ko) | 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템 | |
CN113886604A (zh) | 一种职位知识图谱生成方法和系统 | |
CN113678118A (zh) | 数据提取系统 | |
US20220107980A1 (en) | Providing an object-based response to a natural language query | |
CN114090861A (zh) | 一种基于知识图谱的教育领域搜索引擎构建方法 | |
CN112445894A (zh) | 基于人工智能的商务智能系统及其分析方法 | |
CN112015907A (zh) | 一种学科知识图谱快速构建方法、装置及存储介质 | |
KR20200064490A (ko) | 프로필 자동생성서버 및 방법 | |
RU2546064C1 (ru) | Распределенная система и способ языкового перевода | |
CN115879901B (zh) | 一种智能人事自助服务平台 | |
Havens et al. | Uncertainty and inclusivity in gender bias annotation: An annotation taxonomy and annotated datasets of British English text | |
US20230044287A1 (en) | Semantics based data and metadata mapping | |
CN113254623B (zh) | 数据处理方法、装置、服务器、介质及产品 | |
Dorn et al. | Meta-search in human resource management | |
CN116303983A (zh) | 一种关键词推荐方法、装置及电子设备 | |
Collard et al. | Parmesan: mathematical concept extraction for education |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |