CN111078835A - 简历评估方法、装置、计算机设备及存储介质 - Google Patents
简历评估方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111078835A CN111078835A CN201911236037.3A CN201911236037A CN111078835A CN 111078835 A CN111078835 A CN 111078835A CN 201911236037 A CN201911236037 A CN 201911236037A CN 111078835 A CN111078835 A CN 111078835A
- Authority
- CN
- China
- Prior art keywords
- resume
- skill
- vector
- target
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
Abstract
本发明实施例公开了一种简历评估方法、装置、计算机设备及存储介质,包括下述步骤:获取目标简历的技能标签信息;根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。通过这种方法,对简历中的技能进行进一步确认,以技能标签为依据生成简历向量作为评估基础,提高简历评估的效率和有效性。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种简历评估方法、装置、计算机设备及存储介质。
背景技术
互联网的普及和大数据时代的到来为网络招聘带来了得天独厚的优势和难得的机遇。网络招聘已成为求职者求职应聘的重要途径之一,但网络上发布职位的爆炸性增长,引发信息超载问题,企业难以在大量的求职应聘者中快速定位目标人选。
目前许多企业HR对于应聘者投递的简历往往还采用人工识别、判断、筛选的方式,针对于不同的岗位有着不同的需求,特别是在于专业技能上,HR缺乏相关从业经历,很难可以对每一个岗位涉及的相关专业知识和技能都有所了解,因此,对于评估HR能力要求较高,并且不同HR的认识水平高度不一致,准确性局限较大。另一方面,现有的招聘过程中,企业还倾向于通过招聘网站寻找人才,大多数此类招聘网站的特点在于通过社交网络、行为数据等对应聘者进行全面刻画,对应聘者的兴趣、性格、能力进行全方位评估,帮助企业找到合适的人才,但其存在的问题是:这种方式较为依赖个人的经验判断,且在长时间的筛选、评估中,评估人容易对重复浏览相似的内容感觉到疲劳,从而影响到招聘效率和主观判断。
发明内容
本发明实施例能够提供一种提高简历评估筛选效率和可信度的简历评估方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种简历评估方法,包括以下步骤:
获取目标简历的技能标签信息;
根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;
将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。
可选地,所述根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量的步骤,包括以下步骤:
获取目标岗位的岗位需求信息,其中,所述岗位需求信息包括目标岗位的需求技能;
根据所述需求技能确定所述技能权重;
根据所述技能权重与所述技能标签信息生成对应的特征向量作为目标简历的简历向量。
可选地,所述获取目标简历的技能标签信息的步骤之前,包括以下步骤:
获取目标简历;
提取所述目标简历的文本信息,所述文本信息包括目标简历中的技能关键字;
根据所述技能关键字生成所述技能标签。
可选地,所述根据所述技能关键字生成所述技能标签的步骤,包括以下步骤:
根据所述技能关键字与预设的知识图谱链接补充以得到技能实体;
定义所述技能实体为所述技能标签。
可选地,所述根据所述技能关键字与预设的知识图谱链接补充以得到技能实体的步骤,包括下述步骤:
根据所述技能关键字在所述知识图谱中查找指定的关系链接;
定义所述关系链接所对应的实体为所述技能实体。
可选地,还包括构建所述知识图谱的步骤,所述构建所述知识图谱的步骤,包括下述步骤:
获取待抽取资料;
根据预设的抽取规则在所述待抽取资料中抽取实体元组;
根据所述实体元组构建所述知识图谱。
可选地,所述将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果的步骤,包括下述步骤:
计算所述简历向量与所述标准向量之间的向量距离;
在预设的数据库中查找与所述向量距离具有映射关系的评估等级;
根据所述评估等级确定所述目标简历的评估结果。
为解决上述技术问题,本发明实施例还提供一种简历评估装置,包括:
获取模块,用于获取目标简历的技能标签信息;
处理模块,用于根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;
执行模块,用于将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。
可选地,所述简历评估装置,还包括:
第一获取子模块,用于获取目标岗位的岗位需求信息,其中,所述岗位需求信息包括目标岗位的需求技能;
第一确定子模块,用于根据所述需求技能确定所述技能权重;
第一处理子模块,用于根据所述技能权重与所述技能标签信息生成对应的特征向量作为目标简历的简历向量。
可选地,所述简历评估装置,还包括:
第二获取子模块,用于获取目标简历;
第一提取子模块,用于提取所述目标简历的文本信息,所述文本信息包括目标简历中的技能关键字;
第二处理子模块,用于根据所述技能关键字生成所述技能标签。
可选地,所述简历评估装置,还包括:
第一链接子模块,用于根据所述技能关键字与预设的知识图谱链接补充以得到技能实体;
第一执行子模块,用于定义所述技能实体为所述技能标签。
可选地,所述简历评估装置,还包括:
第一查找子模块,用于根据所述技能关键字在所述知识图谱中查找指定的关系链接;
第二执行子模块,用于定义所述关系链接所对应的实体为所述技能实体。
可选地,所述简历评估装置,还包括:
第三获取子模块,用于获取待抽取资料;
第一抽取子模块,用于根据预设的抽取规则在所述待抽取资料中抽取实体元组;
第三处理子模块,用于根据所述实体元组构建所述知识图谱。
可选地,所述简历评估装置,还包括:
第一计算子模块,用于计算所述简历向量与所述标准向量之间的向量距离;
第二查找子模块,用于在预设的数据库中查找与所述向量距离具有映射关系的评估等级;
第二确定子模块,用于根据所述评估等级确定所述目标简历的评估结果。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述简历评估方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述简历评估方法的步骤。
本发明实施例的有益效果是:通过以技能标签为依据生成简历特征向量的方式,使简历中的技能信息在简历筛选和评估时产生较大的影响;利用岗位需求设置对应的权重,与岗位相匹配的技能在生成向量时具备更大的影响程度,同一简历对于不同岗位会根据岗位的需求生成不同的特征向量,使简历向量在针对于指定岗位时具有更高的可信度;将简历向量与标准向量进行对比,可以有效地确定目标简历是否符合目标岗位的需求,根据对比的结果确定简历的评估结果,使简历筛选和评估更加准确和有效。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例简历评估方法的基本流程示意图;
图2为本发明实施例生成简历向量的流程示意图;
图3为本发明实施例生成目标简历技能标签的流程示意图;
图4为本发明实施例根据关键字确定技能标签的流程示意图;
图5为本发明实施例确定技能实体的流程示意图;
图6为本发明实施例构建知识图谱的流程示意图;
图7为本发明实施例确定评估结果的流程示意图;
图8为本发明实施例简历评估装置的基本结构框图;
图9为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunicationsService,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PersonalDigitalAssistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(GlobalPositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(MobileInternetDevice,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体地请参阅图1,图1为本实施例简历评估方法的基本流程示意图。
如图1所示,一种简历评估方法,包括以下步骤:
S1100、获取目标简历的技能标签信息;
在获取到待评估的简历之后,将简历转换为文本,并对文本进行识别,提取其中的关键词汇或字段。具体地,将文本与预设的词汇库中的关键字进行匹配,将匹配到的关键字作为这份简历的关键字,词汇库中存储有专业、技能、岗位等多个类别的关键字,例如专业类包括“机械设计”、“会计学”和“材料学”等等,技能类包括“office”、“HTML5”和“CAD”等,岗位类包括“行政”、“专利代理人”和“绘图员”等等,词汇库所存储的类别和内容可以根据实际的情况进行调整。
在获取到简历的关键字之后,通过预设的知识图谱对关键字进行链接与补充,得到简历中技能等内容的上下位概念,利用注意力模型对岗位相关技能实体进行全文定位,关联相关或者相似的技能,将得到的实体作为简历的标签。例如通过匹配得到面试人员的简历中包含了“CSS”和“HTML5”两个技能,知识图谱中两个实体的上位概念对应的实体为“前端开发”,可以得到该简历的其中一个标签为“前端开发”。又如,岗位要求为“前端开发”,预设的注意力模型中根据目标岗位中的要求对不同的技能标签设置了对应的注意力权重,如“CSS”和“HTML5”等多个相关性较高的技能标签具备较高的注意力权重值,而相关性较低的“CAD”和“3DMAX”具备较低的注意力权重值甚至权重值为0,根据注意力权重将简历信息与岗位需求进行对齐与匹配,从而在简历信息中筛选出符合岗位需求的技能标签。通过注意力模型对简历信息中前端开发包括的技能实体以及关联度较高的技能实体进行焦点锁定,匹配到简历中存在相关前端开发的技能为“CSS”和“HTML5”,以及相关联的内容,如:“测试”、“性能优化”等。通过知识图谱和注意力模型,实现对简历中各个技能或专业的关键字进行快速的匹配,得到上位概念作为简历的标签,当简历中的关键字链接不到上位概念时,将关键字自身作为标签。
S1200、根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;
预设一个特征提取模型,针对每个岗位,该模型用于将输入的简历的技能标签信息为简历生成特征向量。具体地,首先获取目标岗位对应的岗位需求,岗位需求包括技能、学历、专业等等,根据岗位的需求建立简历特征提取模型,模型根据每一个岗位的技能要求和简历的标签信息将简历转化为特征向量,在模型进行分类的过程中,根据岗位需求对不同的关键字设置各自的权重值,例如“专利代理人”一职中,标签“理工科”的权重较高,而标签“会计学”的权重较低甚至为0;标签“CAD”的权重较高,而标签“Premiere”的权重较低。根据实际的岗位不同,根据岗位的说明和需求,识别并提取岗位对应的技能要求和隐含要求,并根据岗位需求匹配对应的技能标签,逐步优化收敛各自的标签权重值,通过训练得到收敛的模型作为岗位特征提取模型。
在获取简历的技能标签信息之后,获取到岗位特征提取模型,将岗位的技能需求信息和简历标签信息输入到特征提取模型中,定义特征提取模型输出的特征向量为目标简历的简历向量。
S1300、将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量;
每一个岗位对应设置有一个标准向量,用于作为该岗位的简历筛选和对比参照,标准向量为较贴合该岗位需求的简历的特征向量,可以根据岗位需求设计一份标准简历,提取标准简历的技能标签然后输入到特征提取模型中,将得到的特征向量作为标准向量。在得到了简历的特征向量之后,计算特征向量与标准向量之间的欧氏距离,用于反映简历与岗位要求的技能匹配程度。当欧氏距离小于预设的距离阈值时,则简历的评估结果为技能基本符合岗位需求;否则,则为不符合。阈值的设定可以根据实际情况进行调整,例如当简历的量比较大,岗位需求人员较少,需要加强筛选限制,加大匹配简历精确度时,可以减小技能要求欧氏距离阈值的取值;当简历量较少,需要放松筛选限制,只需要进行粗略匹配时,则可以提高技能要求欧氏距离阈值的取值。
在一些实施方式中,对于向量之间的距离设置有多个梯度,每个梯度对应一个欧氏距离范围以及评估等级,通过设置A、B、C和D四个等级代表不同的匹配符合程度。简历技能与岗位的匹配程度随评估等级由A向D递减,即等级A为非常匹配,等级D为不匹配。等级A对应的距离范围为0~1,等级二对应的距离范围为1~2,以此类推,当计算得到向量距离为0.5时,判断简历技能与岗位需求的评估等级为A,当计算得到的向量距离为1.2时,判断简历技能与岗位需求的评估等级为B。评估等级可以作为简历的一个属性,以供人事管理人员进行参考,也可以作为筛选的条件,例如在简历查找时,首先筛选出评估等级A的简历,在评估等级A的简历看完之后,再筛选出评估等级B的简历,以方便简历管理人员可以更加快速地查找到匹配程度较高的人员。
如图2所示,步骤S1200具体包括以下步骤:
S1210、获取目标岗位的岗位需求信息,其中,所述岗位需求信息包括目标岗位的需求技能;
在招聘信息或者岗位要求中提取岗位的需求信息,其中包括该岗位的需求技能。需求技能可以分为多个等级,例如必须技能和加分技能等,例如对于制图员一职,必须技能为“CAD”,在招聘信息中体现为“熟练掌握CAD”,而加分技能为“英语”,在招聘信息中体现为“英语4级及以上者优先”。根据招聘信息或岗位要求中特定的字词将技能分为多个等级,对提取出来的需求技能进行分类,分类的方式可以根据实际的情况进行调整,例如需要更加详细地对技能进行分级时,可以增加技能分类的数量,如分为必须技能,次要技能和加分技能等多种分类。
S1220、根据所述需求技能确定所述技能权重;
预设的数据库中存储有大量的技能标签,在获取到目标岗位的需求技能之后,根据需求技能确定各个技能标签的技能权重。具体地,根据提取出来需求技能,确定需求技能对应的技能标签的技能权重较重,而需求技能中不存在的技能权重较低,甚至为0。对于需求技能中不同的技能分类,根据各分类的重要性不同,区别性地设置技能权重,例如将需求技能分为必须技能和加分技能的情况下,必技能的权重值为1,加分技能的权重值为0.8,以体现出各个技能在岗位需求中不同的重要程度。
S1230、根据所述技能权重与所述技能标签信息生成对应的特征向量作为目标简历的简历向量;
预设一个特征提取模型,针对每个岗位,该模型用于将输入的简历的技能标签信息为简历生成特征向量。具体地,首先获取目标岗位对应的技能权重,根据岗位的技能权重建立简历特征提取模型,模型根据每一个岗位的技能权重和简历的技能标签信息将简历转化为特征向量,在模型进行分类的过程中,根据实际的岗位不同,以岗位的技能权重为依据,逐步优化收敛各岗位的标签权重值,通过训练得到收敛的模型作为岗位特征提取模型。
将岗位的技能需求信息和简历标签信息输入到特征提取模型中,模型根据简历的技能标签和目标岗位的标签权重值对简历技能进行分类,根据分类结果确定向量各个维度的数值,最终生成特征向量。定义特征提取模型输出的特征向量为目标简历的简历向量。
通过岗位需求确定各个技能的权重值,使简历技能在针对目标岗位的筛选时体现出不同影响力,岗位硬性要求技能影响力较高,与岗位无关的技能影响力较低,使提取出的简历向量更加符合实际需求情况,以提高简历评估和筛选的准确性。
如图3所示,步骤S1100之前还包括以下步骤:
S1010、获取目标简历;
通过企业系统或招聘平台获取到应聘人员的简历作为目标简历。
S1020、提取所述目标简历的文本信息,所述文本信息包括目标简历中的技能关键字;
在获取到待评估的简历之后,将简历转换为文本,并对文本进行识别,提取其中的关键词汇或字段。具体地,将文本与预设的词汇库中的关键字进行匹配,将匹配到的关键字作为这份简历的技能关键字。词汇库中存储有针对于各个技能的预设关键字,例如“office”、“HTML5”和“CAD”等等,词汇库所存储的类别和内容可以根据实际的情况进行调整。
S1030、根据所述技能关键字生成所述技能标签;
在获取到简历的关键字之后,通过预设的知识图谱对关键字进行链接与补充,得到简历中技能等内容的上下位概念,利用注意力模型对岗位相关技能实体进行全文定位,关联相关或者相似的技能,将得到的实体作为简历的标签。例如通过匹配得到应聘人员的简历中包含了“CSS”和“HTML5”两个技能,知识图谱中两个实体的上位概念对应的实体为“前端开发”,可以得到该简历的其中一个标签为“前端开发”。又如,岗位要求为“前端开发”,预设的注意力模型中根据目标岗位中的要求对不同的技能标签设置了对应的注意力权重,如“CSS”和“HTML5”等多个相关性较高的技能标签具备较高的注意力权重值,而相关性较低的“CAD”和“3DMAX”具备较低的注意力权重值甚至权重值为0,根据注意力权重将简历信息与岗位需求进行对齐与匹配,从而在简历信息中筛选出符合岗位需求的技能标签。通过注意力模型对简历信息中前端开发包括的技能实体以及关联度较高的技能实体进行焦点锁定,匹配到简历中存在相关前端开发的技能为“CSS”和“HTML5”,以及相关联的内容,如:“测试”、“性能优化”等。通过知识图谱和注意力模型,实现对简历中各个技能或专业的关键字进行快速的匹配,得到上位概念作为简历的标签,当简历中的关键字链接不到上位概念时,将关键字自身作为标签。
通过在简历中提取关键字作为简历的技能标签,有效地概括了简历中的信息,为简历评估时提供依据,使简历与岗位需求的匹配结果更加客观有效,同时提高简历评估的效率。
如图4所示,步骤S1030具体包括以下步骤:
S1031、根据所述技能关键字与预设的知识图谱链接补充以得到技能实体;
在获取到简历的技能关键字之后,通过预设的知识图谱对技能关键字进行链接与补充,得到简历中技能关键字的上下位概念和关联实体等。例如通过抽取得到应试人员的简历中包含了“CSS”和“HTML5”两个技能关键字,知识图谱中两个实体的上位概念对应的实体为“前端开发”,可以链接得到该简历的其中一个技能实体为“前端开发”。通过知识图谱对简历信息中前端开发包括的技能实体以及关联度较高的技能实体进行链接,补充得到简历中存在相关前端开发的技能为实体“CSS”和“HTML5”,以及相关联的内容,如:“测试”、“性能优化”等,作为对应的技能实体。
S1032、定义所述技能实体为所述技能标签;
将通过知识图谱进行链接补充得到的对应技能实体作为目标简历的技能标签。
利用知识图谱对简历中的技能进行上位或关联,拓展出新的技能标签,能够做到对同类技能的打标,对某技能的上下级关系的关联打标,可以更加深入的提取简历潜在的技能信息,使技能标签更加真实全面。
如图5所示,步骤S1031具体包括下述步骤:
S1033、根据所述技能关键字在所述知识图谱中查找指定的关系链接;
在获取到目标简历的技能关键字之后,根据知识图谱中定位到该关键字,并以指定的关系或属性进行实体链接。具体地,预设有一定量的指定关系或属性,如“属于”、“包括”或“相近”等等,但不限于此,在获取到技能关键字之后,查找技能关键字在知识图谱中的位置,并以此查找相关的关系或属性,例如技能关键字为“CSS”,在知识图谱中查找“CSS”实体,然后查找与该实体具有指定关系或属性的元组,如对应的关系为“包括”的实体元组为(前端开发,包括,CSS)。
S1034、定义所述关系链接所对应的实体为所述技能实体;
将根据技能关键字查找出指定的关系链接所对应的另一个实体为链接得到的技能实体,例如以技能关键字“CSS”查找得到实体元组为(前端开发,包括,CSS),定义“前端开发”为本次链接得到的技能实体。
通过指定的关系链接拓展技能实体的方式,可以有效发掘简历技能的潜在信息,例技能标签可以更加客观全面的概括简历中的技能信息。
如图6所示,还包括下述步骤:
S2100、获取待抽取资料;
通过对大量博客、新闻等公开的文本数据资源,以及公司内部HR相关文字资料,获取到待抽取资料,包括简历、职位要求、专业和技能等等
S2200、根据预设的抽取规则在所述待抽取资料中抽取实体元组;
从抓取到的文本数据中抽取与技能相关的信息,抽取规则主要包括实体抽取、关系抽取和属性抽取。首先从数据源中抽取出命名实体,得到的是一系列离散的命名实体,例如“CSS”、“HTML5”“前端开发”,再进一步从相关数据中提取出实体之间的关联关系,通过关系将实体联系起来,例如“前端开发包括CSS”和“前端开发包括HTML5”,进而将多个关系形成网状的知识结构。而属性抽取的目标是从不同信息源中采集特定实体的属性信息,例如针对某个职位,可以从岗位描述中得到其学历要求、技能要求等信息。在针对技能类实体关系或属性关系进行抽取时,获取到技能所涉及到的领域深度,生成对应的上下位关系或从属关系,例如node.js技术比javascript或者css更加具体。在一些实施方式中,针对于每个不同的类别,从数据源中挑选出若干属于该类别的实体元组或已标记的句子作为种子,找到包含这些种子的数据,形成正则表达式或文法模式,例如在某个平台各个岗位特定位置的文本中可以抽取到(岗位,需求,专业)、(岗位,需求,技能)或者从高校网站的特定位置可以抽取到(专业,属于,行业)、(专业,学习,技能)等等元组。在另一些实施方式中,可以根据获取到的已有实体或知识图谱中已构建的知识对抓取数据中的内容进行精准匹配或模糊匹配。通过上述方式模式抽取HR相关数据源中出现的其他技能实体及其属性,形成简历的技能三元组。
S2300、根据所述实体元组构建所述知识图谱;
获取到了实体、关系以及实体的属性信息之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体,例如,技能“CAD绘图”涉及到的可能是机械方向、电子方向或者建筑方向等,技能“三维制图”可能是三角建模或者四角建模等等。根据实体所存在的句子或段落进行前后词汇的匹配,确定该实体所属的分类。在一些实施方式中,可以根据知识图谱中已有的实体进行实体链接,首先从文本中抽取得到的实体对象,将其链接到知识图谱中对应的正确实体对象,根据给定的实体指称项,从知识图谱中选出一组候选实体对象,判断知识图谱中的同名实体与之是否代表不同的含义以及知识图谱中是否存在其他命名实体与之表示相同的含义,在确认知识图谱中对应的正确实体对象之后,将该实体指称项链接到知识图谱中对应实体,以补充构建知识图谱。
通过构建知识图谱,在简历技能标签提取时对工作或项目经历中的技能关键字进行补充链接,挖掘上下位信息,加强简历的技能标签的可信度。
如图7所示,步骤S1300具体包括下述步骤:
S1310、计算所述简历向量与所述标准向量之间的向量距离;
每一个岗位对应设置有一个标准向量,用于作为该岗位的简历筛选和对比参照,标准向量为较贴合该岗位需求的简历的特征向量,可以根据岗位需求设计一份标准简历,提取标准简历的技能标签然后输入到特征提取模型中,将得到的特征向量作为标准向量。在得到了简历的特征向量之后,计算特征向量与标准向量之间的欧氏距离,用于反映简历与岗位要求的技能匹配程度。
S1320、在预设的数据库中查找与所述向量距离具有映射关系的评估等级;
对于向量之间的距离设置有多个梯度,每个梯度对应一个欧氏距离范围以及评估等级,评估等级的数量可以根据实际情况进行设置,例如以A、B、C和D四个等级代表不同的匹配符合程度时,简历技能与岗位的匹配程度随评估等级由A向D递减,即等级A为非常匹配,等级D为不匹配。等级A对应的距离范围为0~1,等级二对应的距离范围为1~2,以此类推,当计算得到向量距离为0.5时,在数据库中查找与向量距离0.5具有映射关系的评估等级为A,当计算得到的向量距离为1.2时,在数据库中查找与向量距离1.2具有映射关系的评估等级为B。
S1330、根据所述评估等级确定所述目标简历的评估结果;
根据得到的评估等级确定目标简历的评估结果,例如当评估等级最高时,对应的评估结果为非常匹配,当评估等级较低时,对应的评估结果为不匹配。
评估等级可以作为简历的一个属性,以供人事管理人员进行参考,也可以作为筛选的条件,例如在简历查找时,首先筛选出评估等级A的简历,在评估等级A的简历看完之后,再筛选出评估等级B的简历,以方便简历管理人员可以更加快速地查找到匹配程度较高的人员。
通过简历向量与标准向量之间的距离确定评估结果,可以快速并有效地确定简历与目标岗位的匹配程度,并且为简历的筛选提供客观的依据。
为解决上述技术问题,本发明实施例还提供一种简历评估装置。具体请参阅图8,图8为本实施简历评估装置的基本结构框图。
如图8所示,简历评估装置,包括:获取模块2100、处理模块2200和执行模块2300。其中,获取模块用于获取目标简历的技能标签信息;处理模块用于根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;执行模块用于将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。
通过以技能标签为依据生成简历特征向量的方式,使简历中的技能信息在简历筛选和评估时产生较大的影响;利用岗位需求设置对应的权重,与岗位相匹配的技能在生成向量时具备更大的影响程度,同一简历对于不同岗位会根据岗位的需求生成不同的特征向量,使简历向量在针对于指定岗位时具有更高的可信度;将简历向量与标准向量进行对比,可以有效地确定目标简历是否符合目标岗位的需求,根据对比的结果确定简历的评估结果,使简历筛选和评估更加准确和有效。
在一些实施方式中,简历评估装置还包括:第一获取子模块、第一确定子模块、第一处理子模块。其中第一获取子模块用于获取目标岗位的岗位需求信息,其中,所述岗位需求信息包括目标岗位的需求技能;第一确定子模块用于根据所述需求技能确定所述技能权重;第一处理子模块用于根据所述技能权重与所述技能标签信息生成对应的特征向量作为目标简历的简历向量。
在一些实施方式中,简历评估装置还包括:第二获取子模块、第一提取子模块、第二处理子模块。其中,第二获取子模块用于获取目标简历;第一提取子模块用于提取所述目标简历的文本信息,所述文本信息包括目标简历中的技能关键字;第二处理子模块用于根据所述技能关键字生成所述技能标签。
在一些实施方式中,简历评估装置还包括:第一链接子模块、第一执行子模块。其中,第一链接子模块用于根据所述技能关键字与预设的知识图谱链接补充以得到技能实体;第一执行子模块用于定义所述技能实体为所述技能标签。
在一些实施方式中,简历评估装置还包括:第一查找子模块、第二执行子模块。其中,第一查找子模块用于根据所述技能关键字在所述知识图谱中查找指定的关系链接;第二执行子模块用于定义所述关系链接所对应的实体为所述技能实体。
在一些实施方式中,简历评估装置还包括:第三获取子模块、第一抽取子模块、第三处理子模块。其中,第三获取子模块用于获取待抽取资料;第一抽取子模块用于根据预设的抽取规则在所述待抽取资料中抽取实体元组;第三处理子模块用于根据所述实体元组构建所述知识图谱。
在一些实施方式中,简历评估装置还包括:第一计算子模块、第二查找子模块、第二确定子模块。其中,第一计算子模块用于计算所述简历向量与所述标准向量之间的向量距离;第二查找子模块用于在预设的数据库中查找与所述向量距离具有映射关系的评估等级;第二确定子模块用于根据所述评估等级确定所述目标简历的评估结果。
为解决上述技术问题,本发明实施例还提供一种计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。如图9所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种简历评估方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种简历评估方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中获取模块2100、处理模块2200和执行模块2300的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有简历评估装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述简历评估方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种简历评估方法,其特征在于,包括以下步骤:
获取目标简历的技能标签信息;
根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;
将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。
2.如权利要求1所述的简历评估方法,其特征在于,所述根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量的步骤,包括以下步骤:
获取目标岗位的岗位需求信息,其中,所述岗位需求信息包括目标岗位的需求技能;
根据所述需求技能确定所述技能权重;
根据所述技能权重与所述技能标签信息生成对应的特征向量作为目标简历的简历向量。
3.如权利要求1所述的简历评估方法,其特征在于,所述获取目标简历的技能标签信息的步骤之前,包括以下步骤:
获取目标简历;
提取所述目标简历的文本信息,所述文本信息包括目标简历中的技能关键字;
根据所述技能关键字生成所述技能标签。
4.如权利要求3所述的简历评估方法,其特征在于,所述根据所述技能关键字生成所述技能标签的步骤,包括以下步骤:
根据所述技能关键字与预设的知识图谱链接补充以得到技能实体;
定义所述技能实体为所述技能标签。
5.如权利要求4所述的简历评估方法,其特征在于,所述根据所述技能关键字与预设的知识图谱链接补充以得到技能实体的步骤,包括下述步骤:
根据所述技能关键字在所述知识图谱中查找指定的关系链接;
定义所述关系链接所对应的实体为所述技能实体。
6.如权利要求5所述的简历评估方法,其特征在于,还包括构建所述知识图谱的步骤,所述构建所述知识图谱的步骤,包括下述步骤:
获取待抽取资料;
根据预设的抽取规则在所述待抽取资料中抽取实体元组;
根据所述实体元组构建所述知识图谱。
7.如权利要求1所述的简历评估方法,其特征在于,所述将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果的步骤,包括下述步骤:
计算所述简历向量与所述标准向量之间的向量距离;
在预设的数据库中查找与所述向量距离具有映射关系的评估等级;
根据所述评估等级确定所述目标简历的评估结果。
8.一种简历评估装置,其特征在于,包括:
获取模块,用于获取目标简历的技能标签信息;
处理模块,用于根据所技能标签信息和预设的特征提取规则生成所述目标简历的简历向量,其中,所述特征提取规则为根据预设的岗位需求信息确定对应的技能权重,根据所述技能权重将所述技能标签信息转化为特征向量的信息处理规则;
执行模块,用于将所述简历向量与预设的标准向量进行对比,根据对比结果确定所述目标简历的评估结果,其中,所述标准向量为根据所述岗位需求信息所生成的特征向量。
9.一种计算机设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-7任意一项所述的简历评估方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种简历评估方法,所述方法包括上述权利要求1-7任意一项所述的简历评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911236037.3A CN111078835A (zh) | 2019-12-05 | 2019-12-05 | 简历评估方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911236037.3A CN111078835A (zh) | 2019-12-05 | 2019-12-05 | 简历评估方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111078835A true CN111078835A (zh) | 2020-04-28 |
Family
ID=70313183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911236037.3A Pending CN111078835A (zh) | 2019-12-05 | 2019-12-05 | 简历评估方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111078835A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767390A (zh) * | 2020-06-28 | 2020-10-13 | 北京百度网讯科技有限公司 | 技能词评估方法及装置、电子设备、计算机可读介质 |
CN111861268A (zh) * | 2020-07-31 | 2020-10-30 | 平安金融管理学院(中国·深圳) | 候选人推荐方法、装置、电子设备及存储介质 |
CN112287109A (zh) * | 2020-10-29 | 2021-01-29 | 北京希瑞亚斯科技有限公司 | 信息匹配方法、装置、电子设备及计算机可读存储介质 |
CN112364133A (zh) * | 2020-11-17 | 2021-02-12 | 深圳平安智汇企业信息管理有限公司 | 岗位画像生成方法、装置、设备及存储介质 |
CN113434687A (zh) * | 2021-07-22 | 2021-09-24 | 高向咨询(深圳)有限公司 | 自动简历查找方法、自动招聘系统、计算机存储介质 |
CN115495554A (zh) * | 2022-09-23 | 2022-12-20 | 深圳今日人才信息科技有限公司 | 一种简历信息模块化的评估方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7650286B1 (en) * | 2003-04-18 | 2010-01-19 | Algomod Technologies Corporation | Recruitment vendor management system and method |
CN109492164A (zh) * | 2018-11-26 | 2019-03-19 | 北京网聘咨询有限公司 | 一种简历的推荐方法、装置、电子设备及存储介质 |
CN110019689A (zh) * | 2019-04-17 | 2019-07-16 | 北京网聘咨询有限公司 | 职位匹配方法和职位匹配系统 |
CN110059923A (zh) * | 2019-03-13 | 2019-07-26 | 平安科技(深圳)有限公司 | 岗位画像和简历信息的匹配方法、装置、设备及存储介质 |
CN110084571A (zh) * | 2019-05-08 | 2019-08-02 | 软通智慧科技有限公司 | 一种简历筛选方法、装置、服务器和介质 |
CN110443571A (zh) * | 2019-07-16 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 基于知识图谱进行简历评估的方法、装置及设备 |
-
2019
- 2019-12-05 CN CN201911236037.3A patent/CN111078835A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7650286B1 (en) * | 2003-04-18 | 2010-01-19 | Algomod Technologies Corporation | Recruitment vendor management system and method |
CN109492164A (zh) * | 2018-11-26 | 2019-03-19 | 北京网聘咨询有限公司 | 一种简历的推荐方法、装置、电子设备及存储介质 |
CN110059923A (zh) * | 2019-03-13 | 2019-07-26 | 平安科技(深圳)有限公司 | 岗位画像和简历信息的匹配方法、装置、设备及存储介质 |
CN110019689A (zh) * | 2019-04-17 | 2019-07-16 | 北京网聘咨询有限公司 | 职位匹配方法和职位匹配系统 |
CN110084571A (zh) * | 2019-05-08 | 2019-08-02 | 软通智慧科技有限公司 | 一种简历筛选方法、装置、服务器和介质 |
CN110443571A (zh) * | 2019-07-16 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 基于知识图谱进行简历评估的方法、装置及设备 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767390A (zh) * | 2020-06-28 | 2020-10-13 | 北京百度网讯科技有限公司 | 技能词评估方法及装置、电子设备、计算机可读介质 |
CN111861268A (zh) * | 2020-07-31 | 2020-10-30 | 平安金融管理学院(中国·深圳) | 候选人推荐方法、装置、电子设备及存储介质 |
CN112287109A (zh) * | 2020-10-29 | 2021-01-29 | 北京希瑞亚斯科技有限公司 | 信息匹配方法、装置、电子设备及计算机可读存储介质 |
CN112364133A (zh) * | 2020-11-17 | 2021-02-12 | 深圳平安智汇企业信息管理有限公司 | 岗位画像生成方法、装置、设备及存储介质 |
CN113434687A (zh) * | 2021-07-22 | 2021-09-24 | 高向咨询(深圳)有限公司 | 自动简历查找方法、自动招聘系统、计算机存储介质 |
CN115495554A (zh) * | 2022-09-23 | 2022-12-20 | 深圳今日人才信息科技有限公司 | 一种简历信息模块化的评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN111078835A (zh) | 简历评估方法、装置、计算机设备及存储介质 | |
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN111190997B (zh) | 一种使用神经网络和机器学习排序算法的问答系统实现方法 | |
CN112148889A (zh) | 一种推荐列表的生成方法及设备 | |
CN106708929B (zh) | 视频节目的搜索方法和装置 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN108959305A (zh) | 一种基于互联网大数据的事件抽取方法及系统 | |
CN110782123A (zh) | 决策方案的匹配方法、装置、计算机设备及存储介质 | |
CN117290489B (zh) | 一种行业问答知识库快速构建方法与系统 | |
KR20220134695A (ko) | 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법 | |
WO2023010427A1 (en) | Systems and methods generating internet-of-things-specific knowledge graphs, and search systems and methods using such graphs | |
KR20160149050A (ko) | 텍스트 마이닝을 활용한 순수 기업 선정 장치 및 방법 | |
CN111414471B (zh) | 用于输出信息的方法和装置 | |
CN113254507A (zh) | 一种数据资产目录智能构建盘点方法 | |
CN109582868A (zh) | 基于词向量加权、支持向量回归和用户点击偏好的搜索推荐方法 | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN110737824A (zh) | 内容查询方法和装置 | |
KR20120047622A (ko) | 디지털 콘텐츠 관리 시스템 및 방법 | |
CN106570196B (zh) | 视频节目的搜索方法和装置 | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
CN110688559A (zh) | 一种检索方法及装置 | |
CN111143515A (zh) | 文本匹配方法及装置 | |
CN115982322A (zh) | 一种水利行业设计领域知识图谱的检索方法及检索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |