CN117114202A - 一种简历投递概率预估方法、装置、设备及存储介质 - Google Patents
一种简历投递概率预估方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117114202A CN117114202A CN202311252804.6A CN202311252804A CN117114202A CN 117114202 A CN117114202 A CN 117114202A CN 202311252804 A CN202311252804 A CN 202311252804A CN 117114202 A CN117114202 A CN 117114202A
- Authority
- CN
- China
- Prior art keywords
- resume
- preset
- job seeker
- information
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 32
- 238000012216 screening Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000007115 recruitment Effects 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012512 characterization method Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种简历投递概率预估方法、装置、设备及存储介质,涉及数据处理技术领域,包括:对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对若干数据序列进行处理,得到各个简历的关键数据;基于预设分类标签对若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;对相关系数和相应的关键数据进行点乘处理,并基于注意力机制、点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;利用归一化指数函数,并结合意向程度计算若干简历的求职者将相应简历投递至目标公司的概率。这样一来,提升了简历筛选的效率,减少无效面试。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种简历投递概率预估方法、装置、设备及存储介质。
背景技术
求职者在求职的过程中是通过招聘要求来判断自身能否有面试邀约及通过面试,同时公司的找睥睨人员需要耗费大量时间对海量简历进行筛选。随着求职者越来越多,公司招聘的成本不断提高,降低无效面试是提高公司的入职的重要保证。
因此,如何有效筛选简历是本领域要解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种简历投递概率预估方法、装置、设备及存储介质,可以提高简历的筛选效率,减少无效面试的次数。其具体方案如下:
第一方面,本申请提供了一种简历投递概率预估方法,包括:
对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;
基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;
对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;
利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
可选的,所述对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据,包括:
根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历;
基于预设求职者标签对所述筛选后简历中的内容进行预处理,并根据处理后内容确定与所述预设求职者标签对应的标签,以得到与所述筛选后简历对应的若干数据序列;
根据预设门控循环单元对所述若干数据序列中表征求职者工作经历的信息进行处理,以得到各个简历的关键数据。
可选的,所述根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历,包括:
根据所述若干简历中的手机号信息对所述若干简历进行标识,得到标识后简历;
判断所述标识后简历中是否存在表征工作经历的工作信息,以将存在工作信息的标识后简历从所述若干简历中筛选出来,得到若干个筛选后简历。
可选的,所述基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数,包括:
根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历;
通过预设图注意力网络对单个分类标签对应的所述分类后简历之间的相关性进行计算,得到相关系数。
可选的,所述根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历,包括:
根据预设标签配置方式,并根据所述若干数据序列对所述若干简历配置标签,得到若干简历标签;
利用预设分类标签对所述若干简历标签进行分类,以得到分类后简历标签,并将所述分类后简历标签对应的简历确定为分类后简历。
可选的,所述基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度,包括:
确定目标公司的招聘岗位;
从若干个所述分类后简历中筛选出与所述招聘岗位相匹配的若干目标简历;
基于注意力机制、与所述若干目标简历对应的所述点乘后向量和预设意向程度计算参数,计算出所述若干目标简历对应的求职者对所述目标公司的意向程度。
可选的,所述利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率,包括:
确定目标公司的当前招聘信息;所述当前招聘信息包括招聘岗位和招聘时间段;
根据所述当前招聘信息,并利用预设权重计算公式对所述意向程度进行处理,得到与所述意向程度对应的求职者在所述招聘时间段对所述目标公司的注意力权重系数;
利用归一化指数函数、预设概率计算参数和所述注意力权重系数预估所述简历的求职者将相应简历投递至所述目标公司的概率。
第二方面,本申请提供了一种简历投递概率预估装置,包括:
简历信息处理模块,用于对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;
简历分类模块,用于基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;
意向程度计算模块,用于对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;
投递概率计算模块,用于利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如上述的简历投递概率预估方法。
第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的简历投递概率预估方法。
由此可见,本申请可以对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;然后基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;再对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;然后利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。这样一来,本申请对简历进行多次处理分类,通过预设图注意力网络得到各个简历之间的相关系数,深层次挖掘简历中的数据特征,然后基于注意力机制计算各个简历对目标公司的意向程度,进一步利用归一化指数函数计算各个简历的求职者将相应简历投递至目标公司的概率;能够有效捕捉简历之间的关系,再预估求职者将简历投递至目标公司的概率,可以提高简历筛选效率,尽可能减少无效面试的次数。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种简历投递概率预估方法流程图;
图2为本申请公开的一种具体的简历投递概率预估网络架构示意图;
图3为本申请公开的一种具体的图注意力神经网络架构示意图;
图4为本申请公开的一种简历投递概率预估装置结构示意图;
图5为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1所示,本发明实施例公开了一种简历投递概率预估方法,包括:
步骤S11、对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据。
本申请中,首先对若干简历的信息进行预处理,得到其中的数据序列;之后利用预设门控循环对若干数据序列进行处理,得到各个简历中的关键数据。在具体的实施例中,所述对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据,可以包括:根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历;基于预设求职者标签对所述筛选后简历中的内容进行预处理,并根据处理后内容确定与所述预设求职者标签对应的标签,以得到与所述筛选后简历对应的若干数据序列;根据预设门控循环单元对所述若干数据序列中表征求职者工作经历的信息进行处理,以得到各个简历的关键数据。具体的,首先可以根据简历中表征求职者的工作经历的工作信息对若干简历进行筛选,剔除工作信息为空的简历,得到工作信息不为空的若干个筛选后简历。之后,可以根据预设求职者标签分别对这些筛选后简历的内容进行处理,得到简历对应数据序列。比如,按照基本信息打标签:性别、年龄、家乡、学历、学校等;或者按照求职意向打标签:之前的工作经历的入职公司、入职岗位、入职地点、期望薪酬、入职时间等;例如求职者A,性别男,学历211或985学校或硕士以上,计算机相关专业,工作经历中有大厂或中厂公司。这样可以为简历对应的求职者添加“名企背景”“985或211”“硕士”“计算机”等标签。然后根据预设门控循环单元对简历对应的数据序列中求职者的工作信息进行处理;比如,某个求职者在2017年7月毕业,工作经历为2022.1-至今,A公司,Java后端开发;2019.06 -2021.08,B公司,Java开发;2017.08-2019.05,C公司,Java开发、大数据开发工程师;这样可以得到与求职者的工作信息对应的数组数据,并存放在预设集合中。在GRU(GateRecurrent Unit,门控循环单元)模型中处理得到各个简历的关键数据,该数据由两部分组成:一是使用GRU中重置门存储过去相关的重要数据(工作信息中的数据),另一个是加上当前时刻输入的重要数据(当前存在招聘信息的目标公司)。
在一种具体的实施例中,所述根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历,可以包括:根据所述若干简历中的手机号信息对所述若干简历进行标识,得到标识后简历;判断所述标识后简历中是否存在表征工作经历的工作信息,以将存在工作信息的标识后简历从所述若干简历中筛选出来,得到若干个筛选后简历。具体的,可以根据简历中的手机号来进行区分,分别标识各个简历对应的字段数据,得到标识后简历;再基于标识后简历中表征求职者工作经历的工作信息对简历进行筛选,最终得到工作信息不为空的若干个筛选后简历。
步骤S12、基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数。
本申请中,可以基于预设分类标签将若干简历分为一类,并根据预设图注意力网络对分类后简历进行处理,可以得到单个分类标签下各个简历之间的相关系数。在具体的实施例中,所述基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数,可以包括:根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历;通过预设图注意力网络对单个分类标签对应的所述分类后简历之间的相关性进行计算,得到相关系数。具体的,可以根据简历对应的数据序列中表征求职者的专业、学校和年龄对若干简历进行分类,将与预设分类标签相匹配的简历划分为一类,得到若干组分类后简历;比如,将年龄差不大于三岁的求职者划分为一类,或者将同校同专业的求职者划分为一类。之后通过预设图注意力网络对中心节点与邻居节点的相关系数,其中每个求职者为一个节点,同类的求职者邻居节点,中心节点为预设分类标签中的分类标准。这样可以计算出邻居节点与中心节点之间的相似度(可以利用余弦相似度计算),即为相关系数。
在具体的实施例中,所述根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历,可以包括:根据预设标签配置方式,并根据所述若干数据序列对所述若干简历配置标签,得到若干简历标签;利用预设分类标签对所述若干简历标签进行分类,以得到分类后简历标签,并将所述分类后简历标签对应的简历确定为分类后简历。具体的,首先根据预设标签配置方式为若干简历配置标签,得到分类后简历标签,其中标签可以包括年龄(范围)、专业和学校(层次);这样的分类后简历标签对应的若干个简历为该标签下的分类后简历。
步骤S13、对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度。
本申请中,得到简历之间的相关系数后,可以将相关系数和通过预设门控循环单元得到关键数据(向量)进行点乘处理,得到点乘后向量;然后基于注意力机制,点乘后向量和预设意向程度计算参数,来计算各个简历对应的求职者对目标公司的意向程度。在具体的实施例中,所述基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度,可以包括:确定目标公司的招聘岗位;从若干个所述分类后简历中筛选出与所述招聘岗位相匹配的若干目标简历;基于注意力机制、与所述若干目标简历对应的所述点乘后向量和预设意向程度计算参数,计算出所述若干目标简历对应的求职者对所述目标公司的意向程度。具体的,首先确定目标公司的招聘岗位,从若干个分类后简历中筛选出与招聘岗位匹配的目标简历;再基于注意力机制、与所述若干目标简历对应的所述点乘后向量和预设意向程度计算参数,计算出所述若干目标简历对应的求职者对所述目标公司的意向程度。在具体的实施例中,将简历的关键数据对应的向量Xt和GAT(Graph Attention Networks,图注意力机制网络)模型(预设图注意力网络)输出的相关系数q点乘,可通过以下公式得到点乘后向量dt:
dt=Xt×qt;
其中,t为与当前的招聘信息对应的当前时间。
进一步的,可以通过双曲正切函数计算意向程度kt,公式如下所示:
kt=tanh(Wtdt+bt)(1≤t≤i-1);
其中,Wt,bt分别是权重矩阵和偏置向量,dt为点乘后向量,t为当前的时间,i表征目标公司发布招聘信息的次数及相应的招聘时间信息。
步骤S14、利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
进一步,在具体的实施例中,所述利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率,可以包括:确定目标公司的当前招聘信息;所述当前招聘信息包括招聘岗位和招聘时间段;根据所述当前招聘信息,并利用预设权重计算公式对所述意向程度进行处理,得到与所述意向程度对应的求职者在所述招聘时间段对所述目标公司的注意力权重系数;利用归一化指数函数、预设概率计算参数和所述注意力权重系数预估所述简历的求职者将相应简历投递至所述目标公司的概率。具体的,确定目标公司的当前招聘信息,可以理解的是,该当前招聘信息包括招聘岗位和相应的招聘时间段;然后根据该招聘信息,并利用预设权重计算公式对意向程度进行处理,可以得到意向程度对应的求职者在当前招聘信息的招聘时间段内对目标公司的注意力权重系数;之后,利用归一化指数函s数,预设概率计算参数和得到的注意力权重系数可以预估求职者将简历投递至目标公司的概率。在具体的实施例中,可以通过以下公式计算注意力权重系数at:
其中,kt为t时刻求职者对目标公司的意向程度,p为变量,i为序号。
进一步的,预估求职者将简历投递至目标公司的概率时,可以通过以下公式计算概率y:
其中,Wu,bu分别为预设权重矩阵和偏置向量,u表示单个的求职者。
在一种具体的实施例中,可以通过如图2所示的网络架构对各个简历进行处理,以预测各求职者将简历投递至目标公司的概率。具体的,首先通过输出层处理各简历,得到相应的数据序列(Zt为时间t下的简历对应的数据序列);然后嵌入层利用GRU对数据序列处理得到各个简历的关键数据X;相应的,通过图注意力机制网络可以计算得到各简历之间的相关系数q;结合相关系数q,即对q和X进行点乘,并引入注意力机制,对点乘后向量d进行计算,可以得到求职者对目标公司的意向程度a,再经过输出层的归一化指数函数(sofmax)可以得到各求职者将简历投递至目标公司的概率y。需要指出的是,如图3所示,计算各简历之间的相关系数时,使用图注意力机制网络,具体包括:对简历进行分类,得到同类求职者(对应的简历为W),经过图注意力机制网络中的sofmax处理之后,可以得到各简历对应的求职者对目标公司的注意力权重系数a;进一步的,可以根据同类求职者中各个简历之间相关系数q计算相应的注意力权重系数,a12表示q1对其他求职者q2的注意力相关系数,可以通过拼接(concat)或取平均(avg)的方式进行计算。可以理解的是,不同时间上公司招聘岗位可能会不同,例如前两个季度可能招聘需求比较少,后两个季度公司可能为了提高销售业绩,扩大招聘人数,专业限制会放宽,本申请可以考虑当前及历史时间的公司的招聘信息,以计算求职者被目标公司招录的概率。
由此可见,本申请可以对简历进行多次处理分类,通过预设图注意力网络得到各个简历之间的相关系数,深层次挖掘简历中的数据特征,然后基于注意力机制计算各个简历对目标公司的意向程度,进一步利用归一化指数函数计算各个简历的求职者将相应简历投递至目标公司的概率;能够有效捕捉简历之间的关系,再预估求职者将简历投递至目标公司的概率,可以提高简历筛选效率,减少无效面试的次数。
如图4所示,本申请实施例公开了一种简历投递概率预估装置,包括:
简历信息处理模块11,用于对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;
简历分类模块12,用于基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;
意向程度计算模块13,用于对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;
投递概率计算模块14,用于利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
由此可见,本申请对简历进行多次处理分类,通过预设图注意力网络得到各个简历之间的相关系数,深层次挖掘简历中的数据特征,然后基于注意力机制计算各个简历对目标公司的意向程度,进一步利用归一化指数函数计算各个简历的求职者将相应简历投递至目标公司的概率;能够有效捕捉简历之间的关系,再预估求职者将简历投递至目标公司的概率,可以提高简历筛选效率,减少无效面试的次数。
在一种具体的实施例中,所述简历信息处理模块11,可以包括:
简历筛选子模块,用于根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历;
求职者标签确定单元,用于基于预设求职者标签对所述筛选后简历中的内容进行预处理,并根据处理后内容确定与所述预设求职者标签对应的标签,以得到与所述筛选后简历对应的若干数据序列;
关键数据获取单元,用于根据预设门控循环单元对所述若干数据序列中表征求职者工作经历的信息进行处理,以得到各个简历的关键数据。
在另一种具体的实施例中,所述简历筛选子模块,可以包括:
简历标识单元,用于根据所述若干简历中的手机号信息对所述若干简历进行标识,得到标识后简历;
简历筛选单元,用于判断所述标识后简历中是否存在表征工作经历的工作信息,以将存在工作信息的标识后简历从所述若干简历中筛选出来,得到若干个筛选后简历。
在一种具体的实施例中,所述简历分类模块12,可以包括:
简历分类子模块,用于根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历;
相关性计算单元,用于通过预设图注意力网络对单个分类标签对应的所述分类后简历之间的相关性进行计算,得到相关系数。
在另一种具体的实施例中,所述简历分类子模块,可以包括:
简历标签配置单元,用于根据预设标签配置方式,并根据所述若干数据序列对所述若干简历配置标签,得到若干简历标签;
简历分类单元,用于利用预设分类标签对所述若干简历标签进行分类,以得到分类后简历标签,并将所述分类后简历标签对应的简历确定为分类后简历。
在一种具体的实施例中,所述意向程度计算模块13,可以包括:
岗位确定单元,用于确定目标公司的招聘岗位;
目标简历筛选单元,用于从若干个所述分类后简历中筛选出与所述招聘岗位相匹配的若干目标简历;
意向程度计算单元,用于基于注意力机制、与所述若干目标简历对应的所述点乘后向量和预设意向程度计算参数,计算出所述若干目标简历对应的求职者对所述目标公司的意向程度。
在一种具体的实施例中,所述投递概率计算模块14,可以包括:
招聘信息确定单元,用于确定目标公司的当前招聘信息;所述当前招聘信息包括招聘岗位和招聘时间段;
权重系数计算单元,用于根据所述当前招聘信息,并利用预设权重计算公式对所述意向程度进行处理,得到与所述意向程度对应的求职者在所述招聘时间段对所述目标公司的注意力权重系数;
投递概率计算单元,用于利用归一化指数函数、预设概率计算参数和所述注意力权重系数预估所述简历的求职者将相应简历投递至所述目标公司的概率。
进一步的,本申请实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的简历投递概率预估方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的简历投递概率预估方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的简历投递概率预估方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种简历投递概率预估方法,其特征在于,包括:
对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;
基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;
对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;
利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
2.根据权利要求1所述的简历投递概率预估方法,其特征在于,所述对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据,包括:
根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历;
基于预设求职者标签对所述筛选后简历中的内容进行预处理,并根据处理后内容确定与所述预设求职者标签对应的标签,以得到与所述筛选后简历对应的若干数据序列;
根据预设门控循环单元对所述若干数据序列中表征求职者工作经历的信息进行处理,以得到各个简历的关键数据。
3.根据权利要求2所述的简历投递概率预估方法,其特征在于,所述根据若干简历中表征求职者工作经历的工作信息的对若干简历进行筛选,以得到所述工作信息不为空的若干个筛选后简历,包括:
根据所述若干简历中的手机号信息对所述若干简历进行标识,得到标识后简历;
判断所述标识后简历中是否存在表征工作经历的工作信息,以将存在工作信息的标识后简历从所述若干简历中筛选出来,得到若干个筛选后简历。
4.根据权利要求1所述的简历投递概率预估方法,其特征在于,所述基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数,包括:
根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历;
通过预设图注意力网络对单个分类标签对应的所述分类后简历之间的相关性进行计算,得到相关系数。
5.根据权利要求4所述的简历投递概率预估方法,其特征在于,所述根据预设分类标签对所述若干数据序列中表征求职者的专业、学校和年龄进行分析,以确定与所述预设分类标签相匹配的简历,得到分类后简历,包括:
根据预设标签配置方式,并根据所述若干数据序列对所述若干简历配置标签,得到若干简历标签;
利用预设分类标签对所述若干简历标签进行分类,以得到分类后简历标签,并将所述分类后简历标签对应的简历确定为分类后简历。
6.根据权利要求1所述的简历投递概率预估方法,其特征在于,所述基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度,包括:
确定目标公司的招聘岗位;
从若干个所述分类后简历中筛选出与所述招聘岗位相匹配的若干目标简历;
基于注意力机制、与所述若干目标简历对应的所述点乘后向量和预设意向程度计算参数,计算出所述若干目标简历对应的求职者对所述目标公司的意向程度。
7.根据权利要求1至6任一项所述的简历投递概率预估方法,其特征在于,所述利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率,包括:
确定目标公司的当前招聘信息;所述当前招聘信息包括招聘岗位和招聘时间段;
根据所述当前招聘信息,并利用预设权重计算公式对所述意向程度进行处理,得到与所述意向程度对应的求职者在所述招聘时间段对所述目标公司的注意力权重系数;
利用归一化指数函数、预设概率计算参数和所述注意力权重系数预估所述简历的求职者将相应简历投递至所述目标公司的概率。
8.一种简历投递概率预估装置,其特征在于,包括:
简历信息处理模块,用于对若干简历的信息进行预处理,得到若干数据序列,并根据预设门控循环单元对所述若干数据序列进行处理,得到各个简历的关键数据;
简历分类模块,用于基于预设分类标签对所述若干简历进行分类,并根据预设图注意力网络对分类后简历进行处理,得到单个分类标签下各个简历之间的相关系数;
意向程度计算模块,用于对所述相关系数和相应的所述关键数据进行点乘处理,得到点乘后向量,并基于注意力机制、所述点乘后向量和预设意向程度计算参数,计算出各个简历对应的求职者对目标公司的意向程度;
投递概率计算模块,用于利用归一化指数函数,并结合所述意向程度计算所述若干简历的求职者将相应简历投递至所述目标公司的概率。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的简历投递概率预估方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的简历投递概率预估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311252804.6A CN117114202A (zh) | 2023-09-26 | 2023-09-26 | 一种简历投递概率预估方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311252804.6A CN117114202A (zh) | 2023-09-26 | 2023-09-26 | 一种简历投递概率预估方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117114202A true CN117114202A (zh) | 2023-11-24 |
Family
ID=88807675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311252804.6A Pending CN117114202A (zh) | 2023-09-26 | 2023-09-26 | 一种简历投递概率预估方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117114202A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106384230A (zh) * | 2016-10-21 | 2017-02-08 | 北京搜前途科技有限公司 | 简历中工作经历与招聘职位及简历与招聘信息的匹配方法 |
CN111311180A (zh) * | 2020-02-10 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 简历筛选方法及装置 |
CN115481969A (zh) * | 2022-08-26 | 2022-12-16 | 竹间智能科技(上海)有限公司 | 简历筛选方法、装置、电子设备及可读存储介质 |
-
2023
- 2023-09-26 CN CN202311252804.6A patent/CN117114202A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106384230A (zh) * | 2016-10-21 | 2017-02-08 | 北京搜前途科技有限公司 | 简历中工作经历与招聘职位及简历与招聘信息的匹配方法 |
CN111311180A (zh) * | 2020-02-10 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 简历筛选方法及装置 |
CN115481969A (zh) * | 2022-08-26 | 2022-12-16 | 竹间智能科技(上海)有限公司 | 简历筛选方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schumann et al. | We need fairness and explainability in algorithmic hiring | |
McDonald | The point process use‐availability or presence‐only likelihood and comments on analysis | |
CN110377804A (zh) | 培训课程数据的推送方法、装置、系统及存储介质 | |
CN112148986B (zh) | 一种基于众包的top-N服务再推荐方法及系统 | |
CN111738778B (zh) | 用户画像生成方法、装置、计算机设备及存储介质 | |
Yang et al. | A parametric programming solution to the F-policy queue with fuzzy parameters | |
CN113393306A (zh) | 产品推荐方法、装置、电子设备及计算机可读介质 | |
CN117114514B (zh) | 一种基于大数据的人才信息分析管理方法、系统及装置 | |
CN114707644A (zh) | 图神经网络的训练方法及装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN116703682B (zh) | 一种基于深度学习的政务数据平台 | |
CN112381236A (zh) | 联邦迁移学习的数据处理方法、装置、设备及存储介质 | |
CN112418442A (zh) | 联邦迁移学习的数据处理方法、装置、设备及存储介质 | |
CN108830302B (zh) | 一种图像分类方法、训练方法、分类预测方法及相关装置 | |
CN115952438B (zh) | 社交平台用户属性预测方法、系统、移动设备及存储介质 | |
CN115758178B (zh) | 数据处理方法、数据处理模型训练方法、装置及设备 | |
CN117114202A (zh) | 一种简历投递概率预估方法、装置、设备及存储介质 | |
CN115775140A (zh) | 一种城市人才规划与人力资源智能调配系统及方法 | |
Tsai et al. | Simulation optimization in security screening systems subject to budget and waiting time constraints | |
CN113064984B (zh) | 意图识别方法、装置、电子设备及可读存储介质 | |
CN114386734A (zh) | 使用人工智能和机器学习用于技术分析的企业管理系统 | |
CN113190730A (zh) | 一种区块链地址的分类方法及装置 | |
CN112084408A (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 | |
CN113590721B (zh) | 一种区块链地址分类方法和装置 | |
CN113627883B (zh) | 一种云定制招聘会方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |