CN113610503A - 简历信息处理方法、装置、设备及介质 - Google Patents
简历信息处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113610503A CN113610503A CN202110920541.6A CN202110920541A CN113610503A CN 113610503 A CN113610503 A CN 113610503A CN 202110920541 A CN202110920541 A CN 202110920541A CN 113610503 A CN113610503 A CN 113610503A
- Authority
- CN
- China
- Prior art keywords
- sample user
- resume information
- resume
- agent
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Abstract
本申请实施例公开了一种简历信息处理方法、装置、设备及介质。其中,该方法包括:获取样本用户的简历数据包,对该简历数据包进行解析,得到该样本用户的多份简历信息,以及每份简历信息的简历属性;根据该每份简历信息的简历属性,对该样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于该样本用户的有效简历信息;基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签;采用该标注代理标签和该样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。采用本申请,可提高标注代理标签的准确度,以及提高目标代理人识别模型的识别准确度。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种简历信息处理方法、装置、设备及介质。
背景技术
随着社会的发展,企业能够为大众提供多种多样的岗位,如技术类岗位、服务类岗位等等;同时不同种类的岗位对人才的需求也不一致。基于此,现在越来越多的企业采用目标代理人识别模型对求职者的简历进行识别,以筛选出合适的代理人,这样可以提高企业招聘的便捷性。但是,目前主要是采用人工标注的方式获取样本用户的标注代理标签,采用标注代理标签和样本用户的简历信息对代理人识别模型进行训练,以得到目标代理人识别模型。由于用户容易受外界干扰,导致标注代理标签的准确度比较低,进而,导致目标代理人识别模型的识别准确度比较低。
发明内容
本申请实施例提供一种简历信息处理方法、装置、设备及介质,提高标注代理标签的准确度,并提高目标代理人识别模型的识别准确度。
第一方面,本申请实施例提供了一种简历信息处理方法,该方法包括:
获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
可选的,所述每份简历信息的简历属性包括简历信息中的字段,所述根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
检测所述样本用户的多份简历信息的每份简历信息的字段中是否包括关键字段,得到检测结果;
根据所述检测结果从所述样本用户的多份简历信息中筛选出具有所述关键字段的简历信息,作为候选简历信息;获取所述候选简历信息中所述关键字段对应的数据长度;
若所述关键字段对应的数据长度大于数据长度阈值,则将所述候选简历信息作为属于所述样本用户的有效简历信息。
可选的,所述每份简历信息的简历属性包括简历信息的生成时间,所述根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
确定所述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔;从所述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;
将所筛选出的简历信息确定为属于所述样本用户的有效简历信息。
可选的,所述基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息查询所述样本用户所参与的求职测试数据;
基于所述求职测试数据统计所述样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数;
将所述求职测试结果为测试通过的次数与所述样本用户参与求职测试的总次数之间的比值,作为所述样本用户的求职测试通过率;
若所述求职测试通过率大于通过率阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述求职测试通过率小于或等于所述通过率阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息确定所述样本用户的居住地址以及所述样本用户所求职企业的地址;
基于所述样本用户的居住地址以及所述样本用户所求职企业的地址,统计所述样本用户的居住地址与所述样本用户所求职企业之间的距离;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离小于或等于距离阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离大于距离阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型,包括:
采用所述代理人识别模型对所述样本用户的多份简历信息进行预测,得到所述样本用户的预测代理标签;
采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整;
将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
可选的,所述采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整,包括:
采用所述标注代理标签和所述预测代理标签确定所述代理人识别模型的预测误差;
若所述预测误差大于误差阈值,则根据所述预测误差对所述代理人识别模型进行调整。第二方面,本申请实施例提供了一种简历信息处理装置,该装置包括:
获取模块,用于获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
识别模块,用于根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
确定模块,用于基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
训练模块,用于采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
第三方面,本申请实施例提供了一种电子设备,该设备包括:处理器,适于实现一条或一条以上指令;以及,
计算机存储介质,所述计算机存储介质存储有一条或一条以上指令,所述一条或一条以上指令适于由所述处理器加载并执行如下步骤:
第一方面,本申请实施例提供了一种简历信息处理方法,该方法包括:
获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
第四方面,本申请实施例提供了一种计算机可读存储介质,包括:所述计算机存储介质存储有一条或一条以上指令,所述一条或一条以上指令适于由处理器加载并执行如下步骤:
第一方面,本申请实施例提供了一种简历信息处理方法,该方法包括:
获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
本申请中,电子设备可以获取样本用户的简历数据包,对简历数据包进行解析,得到样本用户的多份简历信息,以及每份简历信息的简历属性。然后,根据每份简历信息的简历属性,对样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于样本用户的有效简历信息。通过根据每份简历信息的简历属性,对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。进一步,可以基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签,以样本用户的多份简历信息以及标注代理标签为训练数据,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。通过属于样本用户的有效简历信息确定样本用户的标注代理标签,不需要人工参与,提高获取标注代理标签的准确度以及效率。进一步,可提高目标代理人识别模型的识别准确度,有利于用于采用目标代理人识别模型为企业识别出大量合适的代理人。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种简历信息处理方法的流程示意图;
图2是本申请实施例提供的一种简历信息处理方法的流程示意图;
图3是本申请实施例提供的一种简历信息处理装置的结构示意图;
图4是本申请另一实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,是本申请实施例提供的一种简历信息处理方法的流程示意图,本申请实施例由电子设备来执行,该电子设备可以是指服务器或终端设备,此处上述电子设备具体可以是一台独立的服务器、或由若干台服务器组成的服务器集群、或云计算中心、平板电脑、笔记本电脑、掌上电脑、智能音响、移动互联网设备(MID,mobile internet device)等等。其中,如图1所示,该简历信息处理方法包括以下步骤S101~S104。
S101、获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项。
本申请中,电子设备可以从网络上下载样本用户的简历数据包,或者,从其他电子设备中获取样本用户的简历数据包;该简历数据包中包括样本用户的多份简历信息,该简历数据包可以是对样本用户的多份简历信息进行压缩得到的。因此,电子设备可以对该样本用户的简历数据包解压缩处理,得到该样本用户的多份简历信息,并对该多份简历信息中的每份简历信息进行文本识别,得到每份简历信息的简历属性。该每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项。
可选的,可以从网络中下载简历数据包,作为样本用户的简历数据包;或者,将客户所提供的简历数据包,作为样本用户的简历数据包。进一步,为了后续训练的准确度,可以限定样本用户的男女比例、年龄比例等等。例如,获取候选用户集合,上述样本用户属于候选用户集合,所述候选用户集合包括多个候选用户;统计所述候选用户集合中属于女性的候选用户数量,以及属于男性的候选用户数量;计算属于女性的候选用户数量与属于男性的候选用户数量之间的第一比值;若该第一比值大于第一比值阈值,则重新获取候选用户集合。若该第一比值小于第一比值阈值,且大于第二比值阈值,则将候选用户集合中候选用户作为样本用户。如第一比值阈值为0.55,第二比值阈值为0.5。
再例如,获取候选用户集合,所述候选用户集合包括多个候选用户;统计所述候选用户集合中年龄小于30岁以下的候选用户数量,以及年龄大于30岁的候选用户数量;计算年龄小于30岁以下的候选用户数量与年龄大于30岁的候选用户数量之间的第二比值;若该第二比值大于第三比值阈值,则重新获取候选用户集合。若该第二比值小于第三比值阈值,且大于第四比值阈值,则将候选用户集合中候选用户作为样本用户。如第三比值阈值为0.8,第四比值阈值为0.6。
S102、根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息。
本申请中,电子设备可以根据每份简历信息的简历属性,对该样本用户的多份简历信息进行有效性识别,得到属于该样本用户的有效简历信息;有效性识别是指识别多份简历信息中的每份简历信息是否具有完整性,以及识别多份简历信息中的每份简历信息是否为最新简历信息等等。因此,属于该样本用户的有效简历信息是指多份简历信息中具有完整性、或最新的简历信息。
可选的,上述每份简历信息的简历属性包括简历信息中的字段,上述据上述每份简历信息的简历属性,对上述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于上述样本用户的有效简历信息,包括:检测上述样本用户的多份简历信息的每份简历信息的字段中是否包括关键字段,得到检测结果。根据上述检测结果从上述样本用户的多份简历信息中筛选出具有上述关键字段的简历信息,作为候选简历信息。获取上述候选简历信息中上述关键字段对应的数据长度;若上述关键字段对应的数据长度大于数据长度阈值,则将上述候选简历信息作为属于上述样本用户的有效简历信息。
本申请中,当上述每份简历信息的简历属性包括简历信息中的字段时,电子设备可以检测样本用户的多份简历信息中的每份简历信息的字段中是否包括关键字段,得到检测结果。若该检测结果指示简历信息的字段中不包括关键字段,则将该简历信息作为无效简历信息,从多份简历信息中过滤掉无效简历信息。若该检测结果指示简历信息的字段中包括关键字段,则将该简历信息作为候选简历信息。进一步,可以获取候选简历信息中关键字段对应的数据长度,如果关键字段对应的数据长度小于或等于数据长度阈值,表明关键字段对应的数据为空,或者,关键字段对应的数据不具有完整性,则将该候选简历信息作为属于所述样本用户的无效简历信息。如果关键字段对应的数据长度大于数据长度阈值,表明关键字段对应的数据不为空,且关键字段对应的数据具有完整性,则将所述候选简历信息作为属于该样本用户的有效简历信息。通过检测简历信息中是否包括关键字段,以及检测关键字段的数据长度,来识别出样本用户的多份简历信息中的有效简历信息;不需要对简历信息中的所有字段进行检测,可以提高识别出有效简历信息的效率。另外,通过对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。
需要说明的是,关键字段可以是指样本用户所求职企业的求职要求确定的,例如,求职企业的求职要求员工同意加班,如果简历信息不包括是否愿意加班的问题选项时,确定该简历信息为无效简历信息。如果简历信息包括是否愿意加班的问题选项时,确定该简历信息为候选简历信息;进一步,可以获取候选简历信息中关键字段的数据长度,如果候选简历信息中关键字段的数据长度小于或等于数据长度阈值,确定该候选简历信息为无效简历信息。如果该候选简历信息中的关键字的数据长度大于数据长度阈值,则确定该候选简历信息为有效简历信息。该数据长度阈值可以是根据关键字段的类型确定的,例如,如果该关键字段为性别,则该关键字段对应的数据为男或女,这时该关键字段对应的数据长度阈值为第一值;如果该关键字段为姓名,则该关键字段对应的数据为至少包括两个字,这时该关键字段对应的数据长度阈值为第二值;第二值大于第一值。
例如,对样本用户的简历信息进行完整性检测,将具有完整性的简历信息作为样本用户的有效简历信息。例如,关键字段包括联系方式、居住地、姓名,电子设备可以检测以上关键词对应的数据是否为空,若均不为空,则确定样本用户的简历信息具有完整性;若存在一项或多项为空,则确定样本用户的简历信息不具有完整性。
可选的,上述每份简历信息的简历属性包括简历信息的生成时间,上述据上述每份简历信息的简历属性,对上述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于上述样本用户的有效简历信息,包括:确定上述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔。从上述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;将所筛选出的简历信息确定为属于上述样本用户的有效简历信息。
电子设备可以获取当前时间,确定上述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔,如果时间间隔小于时间间隔阈值,表明该简历信息最近被更新,即该简历信息为最新简历信息。因此,可以从上述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;将所筛选出的简历信息确定为属于上述样本用户的有效简历信息。如果时间间隔大于或等于时间间隔阈值,表明该简历信息最近未被更新,即该简历信息不是最新简历信息。因此,可以从上述样本用户的多份简历信息中过滤掉时间间隔大于或等于时间间隔阈值的简历信息,即将上述样本用户的多份简历信息中时间间隔大于或等于时间间隔阈值的简历信息,作为无效简历信息。
例如,根据样本用户的名字筛选出属于样本用户A的简历信息,样本用户A的简历信息包括简历信息1和简历信息2,分别获取简历信息1和简历信息2的更新时间;简历信息1的更新时间为2021年6月3号;简历信息2的更新时间为2021年6月4号;则确定简历信息2的更新时间晚于简历信息1的更新时间;将简历信息2作为样本用户A的有效简历信息。
S103、基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件。
本申请中,电子设备可以基于属于样本用户的有效简历信息确定该样本用户的标注代理标签;该标注代理标签用于反映样本用户是否满足转化为代理人的条件。代理人是指企业的候选员工,样本用户满足转化为代理人的条件是指:样本用户满足所求职企业的求职条件,即样本用户成为所求职企业的候选员工的概率比较高;样本用户不满足转化为代理人的条件是指:样本用户不满足所求职企业的求职条件,即样本用户成为所求职企业的候选员工的概率比较低。
S104、采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
本申请中,电子设备中可包括代理人识别模型,代理人识别模型可以是指识别准确度比较低的识别模型,即代理人识别模型是指需要训练以提高识别精度的识别模型。因此,电子设备可以采用标注代理标签和样本用户的多份简历信息对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。目标代理识别模型可以是指识别准确度比较高的识别模型,即目标代理识别模型可以被企业用于识别代理人。
例如,电子设备可以从线上获取目标用户的多份简历信息,采用目标代理人识别模型对该目标用户的多份简历信息进行有效性识别,得到该目标用户的有效简历信息。进一步,采用目标代理识别模型对目标用户的有效简历信息进行识别,得到该目标用户的代理概率,该代理概率用于反映该目标用户是否能成为代理人。如该代理概率大于0.5,将该目标用户确定为代理人;若该代理概率小于0.5,则将该目标用户确定为非代理人。
本申请中,电子设备可以获取样本用户的简历数据包,对简历数据包进行解析,得到样本用户的多份简历信息,以及每份简历信息的简历属性。然后,根据每份简历信息的简历属性,对样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于样本用户的有效简历信息。通过根据每份简历信息的简历属性,对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。进一步,可以基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签,以样本用户的多份简历信息以及标注代理标签为训练数据,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。通过属于样本用户的有效简历信息确定样本用户的标注代理标签,不需要人工参与,提高获取标注代理标签的准确度以及效率。进一步,可提高目标代理人识别模型的识别准确度,有利于用于采用目标代理人识别模型为企业识别出大量合适的代理人。
请参见图2,是本申请实施例提供的另一种简历信息处理方法的流程示意图,本申请实施例由电子设备来执行,该简历信息处理方法包括以下步骤S201~S206。
S201、获取样本用户的简历数据包,对上述简历数据包进行解析,得到上述样本用户的多份简历信息,以及每份简历信息的简历属性;上述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项。
S202、根据上述每份简历信息的简历属性,对上述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于上述样本用户的有效简历信息。
S203、基于属于上述样本用户的有效简历信息确定上述样本用户的标注代理标签;上述标注代理标签用于反映上述样本用户是否满足转化为代理人的条件。
可选的,上述S203中基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:根据该样本用户的有效简历信息查询该样本用户所参与的求职测试数据;基于该求职测试数据统计该样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数。将该求职测试结果为测试通过的次数与该样本用户参与求职测试的总次数之间的比值,作为该样本用户的求职测试通过率。若该求职测试通过率大于通过率阈值,则将第一标注代理标签作为该样本用户的标注代理标签;该第一标注代理标签用于反映该样本用户满足转化为代理人的条件;若该求职测试通过率小于或等于该通过率阈值,则将第二标注代理标签作为该样本用户的标注代理标签;该第二标注代理标签用于反映该样本用户未满足转化为代理人的条件。
电子设备可以根据该样本用户的有效简历信息的电话号码或姓名等信息,查询该样本用户所参与的求职测试数据;该求职测试数据包括样本用户所参与的求职测试以及测试结果,测试结果包括测试通过或测试未通过。然后,可以基于该求职测试数据统计该样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数。将该求职测试结果为测试通过的次数与该样本用户参与求职测试的总次数之间的比值,作为该样本用户的求职测试通过率。若该求职测试通过率大于通过率阈值,表明该样本用户通过求职测试的概率比较高,因此,可将第一标注代理标签作为该样本用户的标注代理标签。若该求职测试通过率小于或等于该通过率阈值,表明该样本用户通过求职测试的概率比较低,因此,可将第二标注代理标签作为该样本用户的标注代理标签。
可选的,上述S203中基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签,包括:根据该样本用户的有效简历信息确定该样本用户的居住地址以及该样本用户所求职企业的地址;基于该样本用户的居住地址以及该样本用户所求职企业的地址,统计该样本用户的居住地址与该样本用户所求职企业之间的距离。若该样本用户的居住地址与该样本用户所求职企业之间的距离小于或等于距离阈值,则将第一标注代理标签作为该样本用户的标注代理标签;该第一标注代理标签用于反映该样本用户满足转化为代理人的条件。若该样本用户的居住地址与该样本用户所求职企业之间的距离大于距离阈值,则将第二标注代理标签作为该样本用户的标注代理标签;该第二标注代理标签用于反映该样本用户未满足转化为代理人的条件。
电子设备可以从该样本用户的有效简历信息提取该样本用户的居住地址以及该样本用户所求职企业的地址,基于该样本用户的居住地址以及该样本用户所求职企业的地址,统计该样本用户的居住地址与该样本用户所求职企业之间的距离。若该样本用户的居住地址与该样本用户所求职企业之间的距离小于或等于距离阈值,表明样本用户去所求职企业工作的概率比较高,则将第一标注代理标签作为该样本用户的标注代理标签。若该样本用户的居住地址与该样本用户所求职企业之间的距离大于距离阈值,表明样本用户去所求职企业工作的概率比较低,则将第二标注代理标签作为该样本用户的标注代理标签。
可选的,上述S203可包括:从样本用户的有效简历信息中确定样本用户的学历,以及该样本用户的求职职位;获取与样本用户的求职职位匹配的参考学历,该参考学历为样本用户的求职企业所设置的。若如果样本用户的学历与参考学历匹配,即样本用户的学历高于参考学历,或者,样本用户的学历与参考学历相同,表明样本用户成为代理人的概率比较高,则将第一标注代理标签确定为样本用户的标注代理标签。如果样本用户的学历与参考学历不匹配,即样本用户的学历低于参考学历,或者,样本用户的学历与参考学历不相同,则将第二标注代理标签确定为样本用户的标注代理标签。
可选的,上述S203可包括:从样本用户的有效简历信息中确定样本用户的求职经历,根据求职经历确定样本用户在每个所工作的企业的工作时长以及样本用户换工作的频率;根据工作时长和换工作频率确定该样本用户的稳定性,根据该稳定性确定该样本用户的标注代理标签。如果样本用户的稳定性大于稳定性阈值,则将第一标注代理标签确定为样本用户的标注代理标签。如果样本用户的稳定性小于或等于稳定性阈值,表明样本用户成为代理人的概率比较低,则将第二标注代理标签确定为样本用户的标注代理标签。
可选的,上述S203可包括:根据样本用户的有效简历信息查询该样本用户历史购物信息;根据历史购物信息统计该样本用户的购买求职企业的产品的次数;如果次数大于次数阈值,则将第一标注代理标签确定为样本用户的标注代理标签。如果次数小于或等于次数阈值,表明样本用户成为代理人的概率比较低,则将第二标注代理标签确定为样本用户的标注代理标签。
S204、采用上述代理人识别模型对上述样本用户的多份简历信息进行预测,得到上述样本用户的预测代理标签。
S205、采用上述标注代理标签和上述预测代理标签,对上述代理人识别模型进行调整。
S206、将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
在上述步骤S204~S206中,电子设备可以采用上述代理人识别模型对上述样本用户的多份简历信息进行预测,得到样本用户的预测代理标签;上述标注代理标签和预测代理标签用于反映代理人识别模型的识别准确度。因此,可以根据上述标注代理标签和预测代理标签,对上述代理人识别模型进行调整,将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
可选的,上述采用上述标注代理标签和上述预测代理标签,对上述代理人识别模型进行调整,包括:采用上述标注代理标签和上述预测代理标签确定上述代理人识别模型的预测误差;若上述预测误差大于误差阈值,则根据上述预测误差对上述代理人识别模型进行调整。电子设备可以将标注代理标签转换为标注代理向量,将预测代理标签转换为预测代理向量,获取标注代理向量与预测代理向量之间的距离,根据距离确定上述代理人识别模型的预测误差。即标注代理向量与预测代理向量之间的距离与上述代理人识别模型的预测误差之间具有负相关关系,即标注代理向量与预测代理向量之间的距离越远,表明上述标注代理标签与上述预测代理标签的差异比较大,即上述代理人识别模型的预测误差较大。标注代理向量与预测代理向量之间的距离越近,表明上述标注代理标签与上述预测代理标签的差异比较小,即上述代理人识别模型的预测误差较小。因此,如果上述预测误差大于误差阈值,表明上述代理人识别模型的预测误差较大,可根据上述预测误差对上述代理人识别模型进行调整。如果上述预测误差小于或等于误差阈值,表明上述代理人识别模型的预测误差较小,可将上述代理人识别模型作为目标代理识别模型。
本申请中,电子设备可以获取样本用户的简历数据包,对简历数据包进行解析,得到样本用户的多份简历信息,以及每份简历信息的简历属性。然后,根据每份简历信息的简历属性,对样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于样本用户的有效简历信息。通过根据每份简历信息的简历属性,对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。进一步,采用代理人识别模型对样本用户的多份简历信息进行预测,得到样本用户的预测代理标签,根据预测代理标签和标注代理标签对代理人识别模型进行调整,得到用于识别代理人的目标代理人识别模型。通过属于样本用户的有效简历信息确定样本用户的标注代理标签,不需要人工参与,提高获取标注代理标签的准确度以及效率。进一步,可提高目标代理人识别模型的识别准确度,有利于用于采用目标代理人识别模型为企业识别出大量合适的代理人。
请参见图3,是本申请实施例提供的一种简历信息处理装置的结构示意图,如图3所示,本实施例中简历信息处理装置包括:获取模块301、识别模型302、确定模块303以及训练模块304。
获取模块,用于获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
识别模块,用于根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
确定模块,用于基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
训练模块,用于采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
可选的,所述每份简历信息的简历属性包括简历信息中的字段,所述识别模块据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
检测所述样本用户的多份简历信息的每份简历信息的字段中是否包括关键字段,得到检测结果;
根据所述检测结果从所述样本用户的多份简历信息中筛选出具有所述关键字段的简历信息,作为候选简历信息;获取所述候选简历信息中所述关键字段对应的数据长度;
若所述关键字段对应的数据长度大于数据长度阈值,则将所述候选简历信息作为属于所述样本用户的有效简历信息。
可选的,所述每份简历信息的简历属性包括简历信息的生成时间,所述识别模块据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
确定所述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔;从所述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;
将所筛选出的简历信息确定为属于所述样本用户的有效简历信息。
可选的,所述确定模块基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息查询所述样本用户所参与的求职测试数据;
基于所述求职测试数据统计所述样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数;
将所述求职测试结果为测试通过的次数与所述样本用户参与求职测试的总次数之间的比值,作为所述样本用户的求职测试通过率;
若所述求职测试通过率大于通过率阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述求职测试通过率小于或等于所述通过率阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述确定模块基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息确定所述样本用户的居住地址以及所述样本用户所求职企业的地址;
基于所述样本用户的居住地址以及所述样本用户所求职企业的地址,统计所述样本用户的居住地址与所述样本用户所求职企业之间的距离;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离小于或等于距离阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离大于距离阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述训练模块采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型,包括:
采用所述代理人识别模型对所述样本用户的多份简历信息进行预测,得到所述样本用户的预测代理标签;
采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整;
将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
可选的,所述训练模块采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整,包括:
采用所述标注代理标签和所述预测代理标签确定所述代理人识别模型的预测误差;
若所述预测误差大于误差阈值,则根据所述预测误差对所述代理人识别模型进行调整。
本申请中,电子设备可以获取样本用户的简历数据包,对简历数据包进行解析,得到样本用户的多份简历信息,以及每份简历信息的简历属性。然后,根据每份简历信息的简历属性,对样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于样本用户的有效简历信息。通过根据每份简历信息的简历属性,对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。进一步,可以基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签,以样本用户的多份简历信息以及标注代理标签为训练数据,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。通过属于样本用户的有效简历信息确定样本用户的标注代理标签,不需要人工参与,提高获取标注代理标签的准确度以及效率。进一步,可提高目标代理人识别模型的识别准确度,有利于用于采用目标代理人识别模型为企业识别出大量合适的代理人。
请参见图4,是本申请实施例提供的一种电子设备的结构示意图,如图4所示的本实施例中的电子设备可以包括:一个或多个处理器21;一个或多个输入装置22,一个或多个输出装置23和存储器24。上述处理器21、输入装置22、输出装置23和存储器24通过总线25连接。
所处理器21可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入装置22可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出装置23可以包括显示器(LCD等)、扬声器等,输出装置23可以输出校正处理后的数据表。
该存储器24可以包括只读存储器和随机存取存储器,并向处理器21提供指令和数据。存储器24的一部分还可以包括非易失性随机存取存储器,存储器24用于存储计算机程序,所述计算机程序包括程序指令,处理器21用于执行存储器24存储的程序指令,以用于执行一种简历信息处理方法,即用于执行以下操作:
获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
可选的,所述每份简历信息的简历属性包括简历信息中的字段,所述处理器21用于执行存储器24存储的程序指令,以实现根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
检测所述样本用户的多份简历信息的每份简历信息的字段中是否包括关键字段,得到检测结果;
根据所述检测结果从所述样本用户的多份简历信息中筛选出具有所述关键字段的简历信息,作为候选简历信息;获取所述候选简历信息中所述关键字段对应的数据长度;
若所述关键字段对应的数据长度大于数据长度阈值,则将所述候选简历信息作为属于所述样本用户的有效简历信息。
可选的,所述每份简历信息的简历属性包括简历信息的生成时间,所述处理器21用于执行存储器24存储的程序指令,以实现根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
确定所述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔;从所述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;
将所筛选出的简历信息确定为属于所述样本用户的有效简历信息。
可选的,所述处理器21用于执行存储器24存储的程序指令,以实现基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息查询所述样本用户所参与的求职测试数据;
基于所述求职测试数据统计所述样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数;
将所述求职测试结果为测试通过的次数与所述样本用户参与求职测试的总次数之间的比值,作为所述样本用户的求职测试通过率;
若所述求职测试通过率大于通过率阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述求职测试通过率小于或等于所述通过率阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述处理器21用于执行存储器24存储的程序指令,以实现基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息确定所述样本用户的居住地址以及所述样本用户所求职企业的地址;
基于所述样本用户的居住地址以及所述样本用户所求职企业的地址,统计所述样本用户的居住地址与所述样本用户所求职企业之间的距离;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离小于或等于距离阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离大于距离阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
可选的,所述处理器21用于执行存储器24存储的程序指令,以实现采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型,包括:
采用所述代理人识别模型对所述样本用户的多份简历信息进行预测,得到所述样本用户的预测代理标签;
采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整;
将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
可选的,所述处理器21用于执行存储器24存储的程序指令,以实现采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整,包括:
采用所述标注代理标签和所述预测代理标签确定所述代理人识别模型的预测误差;
若所述预测误差大于误差阈值,则根据所述预测误差对所述代理人识别模型进行调整。
本申请中,电子设备可以获取样本用户的简历数据包,对简历数据包进行解析,得到样本用户的多份简历信息,以及每份简历信息的简历属性。然后,根据每份简历信息的简历属性,对样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于样本用户的有效简历信息。通过根据每份简历信息的简历属性,对每份简历信息的有效性进行识别,有利于过滤掉无效简历信息,避免后续对无效简历信息处理,可以节省资源;并降低无效简历信息对样本用户的标注代理标签的干扰,可以提高标注代理标签的准确度。进一步,可以基于属于该样本用户的有效简历信息确定该样本用户的标注代理标签,以样本用户的多份简历信息以及标注代理标签为训练数据,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。通过属于样本用户的有效简历信息确定样本用户的标注代理标签,不需要人工参与,提高获取标注代理标签的准确度以及效率。进一步,可提高目标代理人识别模型的识别准确度,有利于用于采用目标代理人识别模型为企业识别出大量合适的代理人。
本申请实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现如图1及图2实施例中所示的简历信息处理生成方法。
所述计算机可读存储介质可以是前述任一实施例所述的电子设备的内部存储单元,例如控制设备的硬盘或内存。所述计算机可读存储介质也可以是所述控制设备的外部存储设备,例如所述控制设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,所述计算机可读存储介质还可以既包括所述控制设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述控制设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
作为示例,上述计算机可读存储介质可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的控制设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的控制设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例是示意性的,例如,所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种简历信息处理方法,其特征在于,包括:
获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
2.根据权利要求1所述的方法,其特征在于,所述每份简历信息的简历属性包括简历信息中的字段,所述根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
检测所述样本用户的多份简历信息的每份简历信息的字段中是否包括关键字段,得到检测结果;
根据所述检测结果从所述样本用户的多份简历信息中筛选出具有所述关键字段的简历信息,作为候选简历信息;获取所述候选简历信息中所述关键字段对应的数据长度;
若所述关键字段对应的数据长度大于数据长度阈值,则将所述候选简历信息作为属于所述样本用户的有效简历信息。
3.根据权利要求1所述的方法,其特征在于,所述每份简历信息的简历属性包括简历信息的生成时间,所述根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息中的每份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息,包括:
确定所述样本用户的多份简历信息中的每份简历信息的生成时间与当前时间之间的时间间隔;从所述样本用户的多份简历信息中筛选出时间间隔小于时间间隔阈值的简历信息;
将所筛选出的简历信息确定为属于所述样本用户的有效简历信息。
4.根据权利要求1所述的方法,其特征在于,所述基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息查询所述样本用户所参与的求职测试数据;
基于所述求职测试数据统计所述样本用户参与求职测试的总次数,以及求职测试结果为测试通过的次数;
将所述求职测试结果为测试通过的次数与所述样本用户参与求职测试的总次数之间的比值,作为所述样本用户的求职测试通过率;
若所述求职测试通过率大于通过率阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述求职测试通过率小于或等于所述通过率阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
5.根据权利要求1所述的方法,其特征在于,所述基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签,包括:
根据所述样本用户的有效简历信息确定所述样本用户的居住地址以及所述样本用户所求职企业的地址;
基于所述样本用户的居住地址以及所述样本用户所求职企业的地址,统计所述样本用户的居住地址与所述样本用户所求职企业之间的距离;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离小于或等于距离阈值,则将第一标注代理标签作为所述样本用户的标注代理标签;所述第一标注代理标签用于反映所述样本用户满足转化为代理人的条件;
若所述样本用户的居住地址与所述样本用户所求职企业之间的距离大于距离阈值,则将第二标注代理标签作为所述样本用户的标注代理标签;所述第二标注代理标签用于反映所述样本用户未满足转化为代理人的条件。
6.根据权利要求1所述的方法,其特征在于,所述采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型,包括:
采用所述代理人识别模型对所述样本用户的多份简历信息进行预测,得到所述样本用户的预测代理标签;
采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整;
将调整后的代理人识别模型作为用于识别代理人的目标代理人识别模型。
7.根据权利要求6所述的方法,其特征在于,所述采用所述标注代理标签和所述预测代理标签,对所述代理人识别模型进行调整,包括:
采用所述标注代理标签和所述预测代理标签确定所述代理人识别模型的预测误差;
若所述预测误差大于误差阈值,则根据所述预测误差对所述代理人识别模型进行调整。
8.一种简历信息处理装置,其特征在于,包括:
获取模块,用于获取样本用户的简历数据包,对所述简历数据包进行解析,得到所述样本用户的多份简历信息,以及每份简历信息的简历属性;所述每份简历信息的简历属性包括简历信息的生成时间、简历信息中的字段中的至少一项;
识别模块,用于根据所述每份简历信息的简历属性,对所述样本用户的多份简历信息进行有效性识别,得到属于所述样本用户的有效简历信息;
确定模块,用于基于属于所述样本用户的有效简历信息确定所述样本用户的标注代理标签;所述标注代理标签用于反映所述样本用户是否满足转化为代理人的条件;
训练模块,用于采用所述标注代理标签和所述样本用户的多份简历信息,对代理人识别模型进行训练,得到用于识别代理人的目标代理人识别模型。
9.一种电子设备,其特征在于,包括:
处理器,适于实现一条或一条以上指令;以及,
计算机可读存储介质,所述计算机可读存储介质存储有一条或一条以上指令,所述一条或一条以上指令适于由所述处理器加载并执行如权利要求1-7任一项所述的简历信息处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一条或者一条以上指令,所述一条或一条以上指令适于由处理器加载并执行如权利要求1-7任一项所述的简历信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920541.6A CN113610503A (zh) | 2021-08-11 | 2021-08-11 | 简历信息处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920541.6A CN113610503A (zh) | 2021-08-11 | 2021-08-11 | 简历信息处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113610503A true CN113610503A (zh) | 2021-11-05 |
Family
ID=78340330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110920541.6A Pending CN113610503A (zh) | 2021-08-11 | 2021-08-11 | 简历信息处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610503A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114492310A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 文本标注方法、文本标注装置、电子设备和存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754233A (zh) * | 2019-01-29 | 2019-05-14 | 上海嘉道信息技术有限公司 | 一种智能推荐职位信息的方法和系统 |
CN110516261A (zh) * | 2019-09-03 | 2019-11-29 | 北京字节跳动网络技术有限公司 | 简历评估方法、装置、电子设备及计算机存储介质 |
CN110781682A (zh) * | 2019-10-23 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 命名实体识别模型训练方法、识别方法、装置及电子设备 |
CN111198943A (zh) * | 2018-11-19 | 2020-05-26 | Tcl集团股份有限公司 | 一种简历筛选方法、装置及终端设备 |
CN111198970A (zh) * | 2020-01-02 | 2020-05-26 | 中科鼎富(北京)科技发展有限公司 | 一种匹配简历方法、装置、电子设备及存储介质 |
CN111444326A (zh) * | 2020-03-30 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 一种文本数据处理方法、装置、设备以及存储介质 |
CN111931809A (zh) * | 2020-06-29 | 2020-11-13 | 北京大米科技有限公司 | 数据的处理方法、装置、存储介质及电子设备 |
CN112256877A (zh) * | 2019-12-30 | 2021-01-22 | 北京来也网络科技有限公司 | 结合rpa和ai的简历筛选方法、装置、设备及存储介质 |
CN112347769A (zh) * | 2020-10-30 | 2021-02-09 | 北京百度网讯科技有限公司 | 实体识别模型的生成方法、装置、电子设备及存储介质 |
CN112559726A (zh) * | 2020-12-22 | 2021-03-26 | 深圳市易博天下科技有限公司 | 简历信息的过滤方法、模型训练方法、装置、设备及介质 |
CN112712795A (zh) * | 2020-12-29 | 2021-04-27 | 北京有竹居网络技术有限公司 | 标注数据确定方法、装置、介质及电子设备 |
-
2021
- 2021-08-11 CN CN202110920541.6A patent/CN113610503A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111198943A (zh) * | 2018-11-19 | 2020-05-26 | Tcl集团股份有限公司 | 一种简历筛选方法、装置及终端设备 |
CN109754233A (zh) * | 2019-01-29 | 2019-05-14 | 上海嘉道信息技术有限公司 | 一种智能推荐职位信息的方法和系统 |
CN110516261A (zh) * | 2019-09-03 | 2019-11-29 | 北京字节跳动网络技术有限公司 | 简历评估方法、装置、电子设备及计算机存储介质 |
CN110781682A (zh) * | 2019-10-23 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 命名实体识别模型训练方法、识别方法、装置及电子设备 |
CN112256877A (zh) * | 2019-12-30 | 2021-01-22 | 北京来也网络科技有限公司 | 结合rpa和ai的简历筛选方法、装置、设备及存储介质 |
CN111198970A (zh) * | 2020-01-02 | 2020-05-26 | 中科鼎富(北京)科技发展有限公司 | 一种匹配简历方法、装置、电子设备及存储介质 |
CN111444326A (zh) * | 2020-03-30 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 一种文本数据处理方法、装置、设备以及存储介质 |
CN111931809A (zh) * | 2020-06-29 | 2020-11-13 | 北京大米科技有限公司 | 数据的处理方法、装置、存储介质及电子设备 |
CN112347769A (zh) * | 2020-10-30 | 2021-02-09 | 北京百度网讯科技有限公司 | 实体识别模型的生成方法、装置、电子设备及存储介质 |
CN112559726A (zh) * | 2020-12-22 | 2021-03-26 | 深圳市易博天下科技有限公司 | 简历信息的过滤方法、模型训练方法、装置、设备及介质 |
CN112712795A (zh) * | 2020-12-29 | 2021-04-27 | 北京有竹居网络技术有限公司 | 标注数据确定方法、装置、介质及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114492310A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 文本标注方法、文本标注装置、电子设备和存储介质 |
CN114492310B (zh) * | 2022-02-16 | 2023-06-23 | 平安科技(深圳)有限公司 | 文本标注方法、文本标注装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106992994B (zh) | 一种云服务的自动化监控方法和系统 | |
US10832249B1 (en) | Heuristic money laundering detection engine | |
CN106940679B (zh) | 数据处理方法及装置 | |
CN105122212A (zh) | 自动化跟踪系统中的周期性优化 | |
CN105283851A (zh) | 用于选择跟踪目标的成本分析 | |
CN114422267B (zh) | 流量检测方法、装置、设备及介质 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
JP6920378B2 (ja) | 再修理用基板の検出装置、方法およびコンピュータ読み取り可能な記憶媒体 | |
CN111181757B (zh) | 信息安全风险预测方法、装置以及计算设备、存储介质 | |
CN114817968B (zh) | 无特征数据的路径追溯方法、装置、设备及存储介质 | |
CN110263824A (zh) | 模型的训练方法、装置、计算设备及计算机可读存储介质 | |
CN112583640A (zh) | 一种基于知识图谱的服务故障检测方法及装置 | |
CN111611390B (zh) | 一种数据处理方法及装置 | |
CN113610503A (zh) | 简历信息处理方法、装置、设备及介质 | |
CN112685799B (zh) | 设备指纹生成方法、装置、电子设备和计算机可读介质 | |
CN112328802A (zh) | 数据处理方法、装置和服务器 | |
CN112860662A (zh) | 数据血缘关系建立方法、装置、计算机设备及存储介质 | |
CN111159464A (zh) | 一种音频片段的检测方法及相关设备 | |
CN116541069A (zh) | 关键函数评估方法、装置、电子设备、介质和程序产品 | |
CN110895587A (zh) | 用于确定目标用户的方法和装置 | |
CN112084408B (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN115130545A (zh) | 数据处理方法、电子设备、程序产品及介质 | |
CN114282940A (zh) | 用于意图识别的方法及装置、存储介质及电子设备 | |
CN113362069A (zh) | 风控模型的动态调整方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |