CN106682871A - 确定简历级别的方法及装置 - Google Patents

确定简历级别的方法及装置 Download PDF

Info

Publication number
CN106682871A
CN106682871A CN201611156099.XA CN201611156099A CN106682871A CN 106682871 A CN106682871 A CN 106682871A CN 201611156099 A CN201611156099 A CN 201611156099A CN 106682871 A CN106682871 A CN 106682871A
Authority
CN
China
Prior art keywords
resume
characteristic information
rating model
rank
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611156099.XA
Other languages
English (en)
Inventor
李鹏
于洋
郭振强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 58 Information Technology Co Ltd
Original Assignee
Beijing 58 Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing 58 Information Technology Co Ltd filed Critical Beijing 58 Information Technology Co Ltd
Priority to CN201611156099.XA priority Critical patent/CN106682871A/zh
Publication of CN106682871A publication Critical patent/CN106682871A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种确定简历级别的方法及装置。该方法包括:获取目标简历的特征信息,所述特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉;根据所述特征信息及预设分类算法,确定所述目标简历的级别。本发明可以帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员。

Description

确定简历级别的方法及装置
技术领域
本发明涉及人员招聘,尤其涉及一种确定简历级别的方法及装置。
背景技术
在招聘业务线中,存有着大量的人员投递的简历。招聘人员需要在这海量的简历中找到所需的工作人员,任务量大,且查找工作单调乏味。
发明内容
本发明提供一种确定简历级别的方法及装置,可帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员。
第一方面,本发明提供一种确定简历级别的方法,包括:获取目标简历的特征信息,所述特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉;根据所述特征信息及预设分类算法,确定所述目标简历的级别。
进一步地,所述获取目标简历的特征信息,包括:提取所述目标简历的特征;对所述特征进行特征处理,获得所述特征信息,所述特征信息为特征类型与特征数据的对应关系。
进一步地,所述根据所述特征信息及预设分类算法,确定所述目标简历的级别,包括:将所述特征信息输入至简历评级模型,确定所述目标简历的级别,所述简历评级模型是根据逻辑回归算法获得的。
进一步地,所述根据逻辑回归算法获得所述简历评级模型之后,所述方法还可以包括:采用验证矩阵对所述简历评级模型进行调优处理,获得优化后的简历评级模型,所述验证矩阵用于优化所述简历评级模型,所述验证矩阵包括受试者工作特征曲线ROC曲线、平衡F分数和召回率。
进一步地,不同行业所对应的所述简历评级模型不同。
第二方面,本发明提供一种确定简历级别的装置,包括:获取模块,用于获取目标简历的特征信息,所述特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉;处理模块,用于根据所述获取模块获得的所述特征信息及预设分类算法,确定所述目标简历的级别。
进一步地,所述获取模块具体用于:提取所述目标简历的特征;对所述特征进行特征处理,获得所述特征信息,所述特征信息为特征类型与特征数据的对应关系。
进一步地,所述处理模块具体用于:将所述特征信息输入至简历评级模型,确定所述目标简历的级别,所述简历评级模型是根据逻辑回归算法获得的。
进一步地,所述处理模块还可以用于:在根据逻辑回归算法获得所述简历评级模型之后,采用验证矩阵对所述简历评级模型进行调优处理,获得优化后的简历评级模型,所述验证矩阵用于优化所述简历评级模型,所述验证矩阵包括受试者工作特征曲线ROC曲线、平衡F分数和召回率。
进一步地,不同行业所对应的所述简历评级模型不同。
本发明提供的确定简历级别的方法及装置,根据应聘者简历的特征信息,结合预设分类算法,确定该应聘者简历的级别,可以帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明确定简历级别的方法实施例一的流程图;
图2为本发明获取测试样本集合的示意图;
图3为本发明获取训练模型的示意图;
图4为本发明获取优化模型的示意图;
图5为本发明确定简历级别的装置实施例一的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
现有技术中,招聘企业在找寻简历的时,无法有效的认知简历所有者所处的一个明确的层级,例如有些企业希望招聘高端人才,但是目前简历的各种显示信息中无明确的表明,企业需要花费大量时间阅读简历信息,才能从中筛选出需要的人才,既耗时又费力。
基于上述问题,本发明提供一种确定简历级别的方法及装置,通过确定简历的级别,级别例如为新人、一般、精英、资深及更高等,以帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员,提升用户体验;且,能够使简历投递人员了解自身水平,加强对自身的定位理解。
图1为本发明确定简历级别的方法实施例一的流程图,如图1所示,本实施例的方法包括:
S101、获取目标简历的特征信息,该特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉。
其中,基本信息例如为年龄、学历及毕业学校等。
S102、根据特征信息及预设分类算法,确定该目标简历的级别。
该步骤中,预设分类算法具体为预先设定的基于机器学习的分类算法,包括但不限于逻辑回归算法。其中,机器学习(Machine Learning,简称:ML)主要使用归纳、综合方法。
基于机器学习的分类算法主要是将样本集分为训练样本集合和测试样本集合;使用其中的训练样本集合进行训练获得训练模型;之后,再使用其中的测试样本集合对该训练模型进行测试优化,得到最后的优化模型。
结合本实施例,首先,在简历数据库中抽取部分简历;对该部分简历中每一简历,根据该简历对应的特征信息,采用预定的级别,例如为新人、一般、精英、资深及更高共四类,确定简历的级别,从而确定测试样本集合,如图2所示,其中,虚线部分为特征信息示例说明,具体参考图示,此处不再一一赘述;采用预设分类算法对该训练样本集合进行训练,获得训练模型,如图3所示;最后,采用测试样本集合对该训练模型进行测试优化,得到最后的优化模型,即下文中提及的简历评级模型,如图4所示。其中,测试样本集合中,可将简历、该简历的特征信息与该简历的级别根据简历标识(例如ID或名称)进行对应,例如图3中所示的“简历A_1简历A_1的特征信息简历A_1的级别。
补充说明的是,在对该训练模型进行测试优化,得到最后的优化模型的过程中,根据测试样本集合中简历的测试结果进行样本集、预设分类算法参数和特征信息的调整,以得到最优模型。例如,样本集调整可以包括训练样本集合和测试样本集合的比例设置和样本集采集数量调整等;预设分类算法参数调整可以包括损失参数的设置、正则化规则的设置、正则系数的设置和迭代次数的调整等;特征信息调整可以包括特征的选取、特征离散化的设置以及特征标准化的调整,等等。上述仅为示例说明,具体样本集、预设分类算法参数和特征信息的调整可根据实际需求进行设置,本发明不对其进行限制。
可选地,该步骤可以包括:将特征信息输入至简历评级模型,确定目标简历的级别,该简历评级模型是根据逻辑回归算法获得的。
本实施例提供的确定简历级别的方法,根据应聘者简历的特征信息,结合预设分类算法,确定该应聘者简历的级别,可以帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员。
在上述实施例的基础上,获取目标简历的特征信息可以包括:提取目标简历的特征;对特征进行特征处理,获得特征信息,该特征信息为特征类型与特征数据的对应关系。
首先,提取目标简历的特征,包括:基本特征、工作特征、技能特征和荣誉特征等。
然后,对于上述特征处理,获得特征信息。具体如下:
1、对基本特征进行特征处理获得基本信息
基本特征中主要包含对于确定级别有用的信息,基本信息例如年龄、婚否和学历等。
与基本特征相对应,基本信息例如为:年龄23、婚否否、学历硕士。
2、对工作特征进行特征处理获得工作经历
工作特征主要包含以往的工作的公司、公司规模、每段工作经历的年限、在工作中主要担当的职责、日常的汇报对象、日常的下属信息等。
与工作特征相对应,工作经历例如为:公司腾讯、年限4。
因为用户的简历实际是通过在网站中填选后生成,所以相关信息已经存储为结构化数据存储于数据库中,并不需要进行分词后的结构化处理。
3、对技能特征进行特征处理获得专业技能
专业技能处理最终形式为:技能名称使用时长。例如,JAVA 10。
4、对荣誉特征进行特征处理获得过往荣誉
通过有效归类,将荣誉特征拆分为以下几种:在校荣誉、公司荣誉、社会荣誉和专业荣誉等。
过往荣誉处理最终形式为:荣誉类型荣誉获取数量,例如,公司荣誉3。
进一步地,在根据逻辑回归算法获得简历评级模型之后,该方法还可以包括:采用验证矩阵对简历评级模型进行调优处理,获得优化后的简历评级模型。其中,验证矩阵用于优化简历评级模型,该验证矩阵可以包括受试者工作特征曲线(receiver operatingcharacteristic curve:简称ROC)曲线、平衡F分数(包括F1SCORE和F2SCORE)和召回率(RECALL),等等,如图4所示。
另外,由于不同行业在能力水平上的划分有较大的差别,所以在将样本集输入到预设分类算法之前,根据不同的行业,将简历进行二次拆分,按照不同的行业输入到对应的预设分类算法中,最终生成的简历评级模型实际为多个,每一个行业都会有一个简历评级模型。
图5为本发明确定简历级别的装置实施例一的结构示意图,如图5所示,本实施例确定简历级别的装置10包括:获取模块11和处理模块12。其中,获取模块11和处理模块12耦接。
该获取模块11,用于获取目标简历的特征信息。该特征信息可以包括应聘者基本信息、工作经历、专业技能和过往荣誉,等等
该处理模块12,用于根据获取模块11获得的特征信息及预设分类算法,确定目标简历的级别。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理类似,此处不再赘述。
可选地,获取模块11可具体用于:提取目标简历的特征;对目标简历的特征进行特征处理,获得特征信息。该特征信息可以具体为特征类型与特征数据的对应关系。
可选地,处理模块12可具体用于:将特征信息输入至简历评级模型,确定目标简历的级别。其中,该简历评级模型可以是处理模块12根据逻辑回归算法获得的,但本发明不以此为限制,也就是说,简历评级模型也可以是处理模块12根据其他预设分类算法获得的,其他预设分类算法例如为基于支撑向量机的分类算法,等等。
进一步地,处理模块12还可以用于:在根据逻辑回归算法获得简历评级模型之后,采用验证矩阵对简历评级模型进行调优处理,获得优化后的简历评级模型。该验证矩阵用于优化所述简历评级模型。具体地,验证矩阵可以包括ROC曲线、平衡F分数(包括F1SCORE和F2SCORE)和召回率等。
还需说明的是,不同行业所对应的简历评级模型可相同或不同。当不同行业所对应的简历评级模型不同时,处理模块12分别根据逻辑回归算法获得不同行业的简历评级模型。也即,不同行业的简历评级模型对应的训练样本集合及测试样本集合均是基于各自行业的。
本实施例提供的确定简历级别的装置,根据应聘者简历的特征信息,结合预设分类算法,确定该应聘者简历的级别,可以帮助招聘人员根据应聘者简历的级别更好的识别应聘者的优秀程度,更为有效的搜寻各种等级需求的人员。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可获取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种确定简历级别的方法,其特征在于,包括:
获取目标简历的特征信息,所述特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉;
根据所述特征信息及预设分类算法,确定所述目标简历的级别。
2.根据权利要求1所述的方法,其特征在于,所述获取目标简历的特征信息,包括:
提取所述目标简历的特征;对所述特征进行特征处理,获得所述特征信息,所述特征信息为特征类型与特征数据的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述根据所述特征信息及预设分类算法,确定所述目标简历的级别,包括:
将所述特征信息输入至简历评级模型,确定所述目标简历的级别,所述简历评级模型是根据逻辑回归算法获得的。
4.根据权利要求3所述的方法,其特征在于,所述根据逻辑回归算法获得所述简历评级模型之后,所述方法还包括:
采用验证矩阵对所述简历评级模型进行调优处理,获得优化后的简历评级模型,所述验证矩阵用于优化所述简历评级模型,所述验证矩阵包括受试者工作特征曲线ROC曲线、平衡F分数和召回率。
5.根据权利要求3或4所述的方法,其特征在于,不同行业所对应的所述简历评级模型不同。
6.一种确定简历级别的装置,其特征在于,包括:
获取模块,用于获取目标简历的特征信息,所述特征信息包括应聘者基本信息、工作经历、专业技能和过往荣誉;
处理模块,用于根据所述获取模块获得的所述特征信息及预设分类算法,确定所述目标简历的级别。
7.根据权利要求6所述的装置,其特征在于,所述获取模块具体用于:
提取所述目标简历的特征;对所述特征进行特征处理,获得所述特征信息,所述特征信息为特征类型与特征数据的对应关系。
8.根据权利要求6所述的装置,其特征在于,所述处理模块具体用于:
将所述特征信息输入至简历评级模型,确定所述目标简历的级别,所述简历评级模型是根据逻辑回归算法获得的。
9.根据权利要求8所述的装置,其特征在于,所述处理模块还用于:
在根据逻辑回归算法获得所述简历评级模型之后,采用验证矩阵对所述简历评级模型进行调优处理,获得优化后的简历评级模型,所述验证矩阵用于优化所述简历评级模型,所述验证矩阵包括受试者工作特征曲线ROC曲线、平衡F分数和召回率。
10.根据权利要求8或9所述的装置,其特征在于,不同行业所对应的所述简历评级模型不同。
CN201611156099.XA 2016-12-14 2016-12-14 确定简历级别的方法及装置 Pending CN106682871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611156099.XA CN106682871A (zh) 2016-12-14 2016-12-14 确定简历级别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611156099.XA CN106682871A (zh) 2016-12-14 2016-12-14 确定简历级别的方法及装置

Publications (1)

Publication Number Publication Date
CN106682871A true CN106682871A (zh) 2017-05-17

Family

ID=58868936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611156099.XA Pending CN106682871A (zh) 2016-12-14 2016-12-14 确定简历级别的方法及装置

Country Status (1)

Country Link
CN (1) CN106682871A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921497A (zh) * 2018-06-05 2018-11-30 北京纳人网络科技有限公司 信息处理方法及装置
CN109087003A (zh) * 2018-08-03 2018-12-25 四川民工加网络科技有限公司 流动性工人的档案生成方法及装置
WO2019085457A1 (zh) * 2017-11-01 2019-05-09 平安科技(深圳)有限公司 应聘人员验证定级方法、应用服务器及计算机可读存储介质
CN110851582A (zh) * 2018-07-25 2020-02-28 北京京东尚科信息技术有限公司 文本处理方法及系统、计算机系统和计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019085457A1 (zh) * 2017-11-01 2019-05-09 平安科技(深圳)有限公司 应聘人员验证定级方法、应用服务器及计算机可读存储介质
CN108921497A (zh) * 2018-06-05 2018-11-30 北京纳人网络科技有限公司 信息处理方法及装置
CN110851582A (zh) * 2018-07-25 2020-02-28 北京京东尚科信息技术有限公司 文本处理方法及系统、计算机系统和计算机可读存储介质
CN109087003A (zh) * 2018-08-03 2018-12-25 四川民工加网络科技有限公司 流动性工人的档案生成方法及装置

Similar Documents

Publication Publication Date Title
Du et al. CUS-heterogeneous ensemble-based financial distress prediction for imbalanced dataset with ensemble feature selection
CN109859052B (zh) 一种投资策略的智能推荐方法、装置、存储介质和服务器
CN107545422A (zh) 一种套现检测方法及装置
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN106682871A (zh) 确定简历级别的方法及装置
CN102541920A (zh) 联合基于用户和项目的协同过滤提高准确度的方法及装置
KR101599675B1 (ko) 빅 데이터 기술에 기반한 기업 뉴스 검색 기술을 이용한 기업 신용 위험도 예측 장치 및 방법
US20200257762A1 (en) Text classification and sentimentization with visualization
CN107545038A (zh) 一种文本分类方法与设备
CN106294882A (zh) 数据挖掘方法以及装置
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN107563560A (zh) 一种业务量预测方法、装置、设备、存储介质
CN114022269A (zh) 一种公共信用领域企业信用风险评估方法
CN111382948A (zh) 对企业发展潜力进行量化评估的方法及装置
CN107909254A (zh) 一种高新技术企业认定自助申报的方法
CN110782349A (zh) 一种模型训练方法和系统
CN101178721A (zh) 一种对论坛中有用帖子信息进行分类并整理的方法
Uriarte et al. Web scraping based online consumer price index: The “IPC Online” case
CN109035025A (zh) 评价股票评论可靠性的方法和装置
CN113723737A (zh) 一种基于企业画像的政策匹配方法、装置、设备及介质
CN107480188B (zh) 一种审计业务数据处理方法和计算机设备
CN116579804A (zh) 一种节假日商品销量预测方法、装置及计算机存储介质
Kulagina et al. Regional features of functioning of the geoinformation analytical system of innovative potential
CN115660608B (zh) 一种一站式的创新创业孵化方法
KR101265975B1 (ko) 미래 기술 가치 평가 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517

RJ01 Rejection of invention patent application after publication