CN113780669A - 一种薪资的预测方法及装置、可读存储介质 - Google Patents
一种薪资的预测方法及装置、可读存储介质 Download PDFInfo
- Publication number
- CN113780669A CN113780669A CN202111082549.6A CN202111082549A CN113780669A CN 113780669 A CN113780669 A CN 113780669A CN 202111082549 A CN202111082549 A CN 202111082549A CN 113780669 A CN113780669 A CN 113780669A
- Authority
- CN
- China
- Prior art keywords
- information
- predicted
- skill level
- acquiring
- salary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种薪资的预测方法及装置、可读存储介质。薪资的预测方法,包括:获取待预测对象的技能水平信息;获取所述待预测对象的工作稳定性信息;获取所述待预测对象的最高学历信息;获取所述待预测对象的工龄信息;将所述技能水平信息、所述工作稳定性信息、所述最高学历信息以及所述工龄信息输入预先训练好的薪资预测模型中,获得所述薪资预测模型输出的薪资预测值。该预测方法用以提高薪资预测的精度。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种薪资的预测方法及装置、可读存储介质。
背景技术
对于企业、招聘单位等来说,通常会收集大量的求职者数据,基于这些求职者数据进行处理,对应的处理结果可以是求职者的预测薪资。
现有的薪资预测方法,通过对简历信息进行挖掘实现薪资的预测。但是,现有技术对简历信息的挖掘不够充分,导致薪资预测的精度较低。
发明内容
本申请实施例的目的在于提供一种薪资的预测方法及装置、可读存储介质,用以提高薪资预测的精度。
第一方面,本申请实施例提供一种薪资的预测方法,包括:获取待预测对象的技能水平信息;获取所述待预测对象的工作稳定性信息;获取所述待预测对象的最高学历信息;获取所述待预测对象的工龄信息;将所述技能水平信息、所述工作稳定性信息、所述最高学历信息以及所述工龄信息输入预先训练好的薪资预测模型中,获得所述薪资预测模型输出的薪资预测值。
在本申请实施例中,与现有技术相比,利用待预测对象的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息实现薪资的预测。一方面,这些信息与求职者的薪资具有强相关性,通过强相关性的信息实现薪资的预测,能够提高薪资预测的精度。另一方面,基于这些信息,通过预先训练好的薪资预测模型实现薪资预测,能够进一步提高薪资预测的精度。
作为一种可能的实现方式,所述获取待预测对象的技能水平信息,包括:获取所述待预测对象的简历;所述简历中包括工作经历项;从所述简历中提取出所述工作经历项对应的工作经历字段;根据所述工作经历字段确定所述技能水平信息。
在本申请实施例中,通过对待预测对象的简历的工作经历字段进行提取,进而根据工作经历字段确定技能水平信息,实现技能水平信息的有效获取。
作为一种可能的实现方式,所述根据所述工作经历字段确定所述技能水平信息,包括:将所述工作经历字段输入预先训练好的技能水平预测模型中,获得所述技能水平预测模型输出的技能水平信息。
在本申请实施例中,基于工作经历字段,通过预先训练好的技能水平预测模型,实现技能水平信息的准确获取。
作为一种可能的实现方式,所述预测方法还包括:获取多个工作经历字段样本;将所述多个工作经历字段样本反馈给预设用户;获取所述预设用户输入的反馈结果;所述反馈结果中包括各个所述工作经历字段样本分别对应的技能水平;根据所述反馈结果和所述多个工作经历字段样本对初始的技能水平预测模型进行训练,获得训练好的技能水平预测模型。
在本申请实施例中,通过预设用户对多个工作经历字段样本对应的技能水平进行标注,再通过标注结果和多个工作经历字段样本对模型进行训练,实现技能水平预测模型的有效训练。
作为一种可能的实现方式,所述获取所述待预测对象的工作稳定性信息,包括:获取所述待预测对象的曾任职的工作份数信息;根据所述工龄信息和所述工作份数信息确定所述工作稳定性信息。
在本申请实施例中,通过待预测对象的曾任职的工作份数信息和工龄信息,实现工作稳定性信息的有效且准确的获取。
作为一种可能的实现方式,所述获取所述待预测对象的最高学历信息,包括:获取所述待预测对象输入的最高学历信息;或者,获取所述待预测对象的简历;所述简历中包括最高学历项;从所述简历中提取出所述最高学历项对应的最高学历信息。
在本申请实施例中,待预测对象可以直接输入最高学历信息;也可以从待预测对象的简历中提取最高学历信息;实现最高学历信息的有效且准确的获取。
作为一种可能的实现方式,所述获取所述待预测对象的工龄信息,包括:获取所述待预测对象输入的工龄信息;或者,获取所述待预测对象的简历;所述简历中包括工龄项;从所述简历中提取出所述工龄项对应的工龄信息。
在本申请实施例中,待预测对象可以直接输入工龄信息;也可以从待预测对象的简历中提取工龄信息;实现工龄信息的有效且准确的获取。
作为一种可能的实现方式,所述预测方法还包括:获取训练数据集;所述训练数据集中包括:多个薪资以及各个所述薪资分别对应的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息;基于所述训练数据集对初始的薪资预测模型进行训练,获得训练好的薪资预测模型。
在本申请实施例中,通过训练数据集对薪资预测模型进行训练,训练好的薪资预测模型可以基于各个信息实现薪资的精确预测。
第二方面,本申请实施例提供一种薪资的预测装置,包括:用于实现第一方面以及第一方面的任意一种可能的实现方式中所述的薪资的预测方法的各个功能模块。
第三方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行如第一方面以及第一方面的任意一种可能的实现方式中所述的薪资的预测方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的薪资的预测方法的流程图;
图2为本申请实施例提供的薪资的预测装置的结构示意图。
图标:200-薪资的预测装置;210-获取模块;220-处理模块。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请实施例提供的薪资的预测方法可以应用于各个需要进行薪资预测的应用场景中,例如:企业在对求职者进行筛选时,可以通过求职者的相关信息先预测薪资,然后结合预测薪资对求职者进行综合评估;再例如:求职者在进行求职时,也可以结合自身的信息先对薪资进行预测,然后将预测的薪资作为期望薪资进行简历的投递等。
基于上述应用场景的介绍,该薪资的预测方法可以应用于各种招聘平台,可以是通用的招聘平台,也可以是某个企业专用的招聘平台。招聘平台可以采用应用程序、小程序、网页等形式。
进而,该薪资的预测方法对应的硬件环境可以包括但不限于:服务器、客户端、浏览器;或者服务器+客户端,以及服务器+浏览器等。
接下来请参照图1,为本申请实施例提供的薪资的预测方法的流程图,该预测方法包括:
步骤110:获取待预测对象的技能水平信息。
步骤120:获取待预测对象的工作稳定性信息。
步骤130:获取待预测对象的最高学历信息。
步骤140:获取待预测对象的工龄信息。
步骤150:将技能水平信息、工作稳定性信息、最高学历信息以及工龄信息输入预先训练好的薪资预测模型中,获得薪资预测模型输出的薪资预测值。
在本申请实施例中,与现有技术相比,利用待预测对象的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息实现薪资的预测。一方面,这些信息与求职者的薪资具有强相关性,通过强相关性的信息实现薪资的预测,能够提高薪资预测的精度。另一方面,基于这些信息,通过预先训练好的薪资预测模型实现薪资预测,能够进一步提高薪资预测的精度。
接下来对该预测方法的详细实施方式进行介绍。
步骤110-步骤140,分别为各个信息的获取步骤,可以理解,这四个步骤,在实际应用中,其执行顺序不限,例如:可以是这四个步骤同时执行,也可以是按照步骤110-步骤140的顺序执行,还可以是按照步骤140-步骤110的顺序执行等。
或者,在一些实施例中,如果步骤110-步骤140中的某个步骤的执行需要依靠其中的特定步骤的执行结果,则该某个步骤的执行顺序在该特定步骤的执行顺序之后。
在步骤110中,获取待预测对象的技能水平信息,这里的待预测对象可以理解为需要进行薪资预测的对象,例如求职者。此处的待预测对象可以是一个,也可以是多个。如果是一个,则获取该一个待预测对象的各项信息,并进行薪资预测即可。如果是多个,则按照与获取一个待预测对象的各项信息,并进行薪资预测的方式分别对多个待预测对象进行对应的处理,实现多个待预测对象的薪资预测即可。
技能水平信息,可以用于表征待预测对象的技能水平。例如:一个程序员,有过C语言编程的工作经历,则可以根据该C语言编程的工作经历确定该程序员在编程方面的技能水平。例如:技能水平较为一般,技能水平较高,技能水平很高等。
技能水平信息可以通过多种不同的实施方式来表示,除了上述举例的一般、较高、很高等,还可以划分具体的等级,例如:C语言编程一级、C语言编程二级、以此类推,编程等级越高,代表其技能水平越高。
在本申请实施例中,技能水平信息可以采用多种实施方式。作为一种可选的实施方式,基于简历的非结构性数据,获取技能水平信息。
对于一份简历来说,其中可以包括结构性数据和非结构性数据,结构性数据可以理解为能够通过定性或者定量的值表示的数据,例如:性别、年龄、工龄等。非结构性数据,可以理解为不能够通过定性或者定量的值表示的数据,例如:工作经历、自我评价等。
在本申请实施例中,技能水平信息可以通过工作经历实现获取。对应的,步骤110包括:获取待预测对象的简历;简历中包括工作经历项;从简历中提取出所述工作经历项对应的工作经历字段;根据工作经历字段确定所述技能水平信息。
在这种实施方式中,通过对待预测对象的简历的工作经历字段进行提取,进而根据工作经历字段确定技能水平信息,实现技能水平信息的有效获取。
其中,待预测对象的简历可以是待预测对象主动上传的简历,也可以是待预测对象在招聘平台上填写的简历。如果是待预测对象主动上传的简历,则简历的格式可以不作限定;如果是待预测对象在招聘平台上填写的简历,则为招聘平台所配置的固定的简历格式。
当然,待预测对象的简历也可以采用其他实施方式获取,在此不作限定。
不管待预测对象的简历采用哪种获取方式,通常来说,简历中均会包括工作经历项,即求职者基本都会在简历中填写工作经历,因此,可以从简历中先查找到工作经历项。
工作经历项的查找方式,可以采用本领域成熟的文本或者字段识别技术实现,在本申请实施例中不作详细介绍。
在查找到工作经历项之后,提取工作经历项对应的具体内容,即提取工作经历项对应的工作经历字段,基于工作经历字段,便可以实现技能水平信息的确定。
其中,工作经历字段通常位于工作经历项字段的预设位置处,例如:下方、右方等,因此,基于工作经历项字段的位置,可以实现工作经历字段的提取。
作为一种可选的实施方式,根据工作经历字段确定技能水平信息包括:将工作经历字段输入预先训练好的技能水平预测模型中,获得技能水平预测模型输出的技能水平信息。
在这种实施方式中,基于工作经历字段,通过预先训练好的技能水平预测模型,实现技能水平信息的准确获取。
作为一种可选的实施方式,技能水平预测模型的训练过程包括:获取多个工作经历字段样本;将多个工作经历字段样本反馈给预设用户;获取预设用户输入的反馈结果;反馈结果中包括各个工作经历字段样本分别对应的技能水平;根据反馈结果和多个工作经历字段样本对初始的技能水平预测模型进行训练,获得训练好的技能水平预测模型。
在这种实施方式中,通过预设用户对多个工作经历字段样本对应的技能水平进行标注,再通过标注结果和多个工作经历字段样本对模型进行训练,实现技能水平预测模型的有效训练。
其中,多个工作经历字段样本,可以是从预设数量的简历中提取出的工作经历字段,预设数量可以尽量多一些,例如:5000份。
预设用户可以是HR(Human Resource,人力资源),即负责企业的招聘工作的用户。将这些工作经历字段反馈给HR之后,HR可以根据工作经历字段对其对应的技能水平进行评测,所评测的技能水平可以作为工作经历字段样本对应的标签数据。进而,基于标签数据与工作经历字段样本,可以实现技能水平预测模型的训练。
在实际应用时,如果工作经历字段样本的数量较大,可以将工作经历字段样本分为两部分,一部分由预设用户确定相应的技能水平,然后基于该部分工作经历字段样本和对应的技能水平先进行技能水平预测模型的训练。此时训练好的技能水平预测模型,还可以用于剩余部分的工作经历字段样本的标注,即,将剩余部分的工作经历字段样本输入到此时训练好的技能水平预测模型中,该模型输出的技能水平信息作为该剩余部分的工作经历字段样本对应的技能水平。
最后,再将两部分的工作经历字段样本,和对应的技能水平合成最终的训练数据集,然后输入到前述训练好的技能水平预测模型中进行训练,获得最终训练好的技能水平预测模型。
通过这种方式,可以减少人工的样本标注量,提高模型训练的效率。
在本申请实施例中,技能水平预测模型可以是神经网络模型,也可以是随机森林模型,或者其他可实施的模型,在此不作限定。作为一种举例,其可以是BERT模型,BERT的全称为Bidirectional Encoder Representation from Transformers,是一个预训练的语言表征模型。
在上述技能水平预测模型的训练过程中,还可以采取一些实施方式来提高模型的精度。例如:限定模型的训练次数,在模型达到对应的训练次数之后,才停止模型的训练,以保证训练好的模型的精度。再例如:对每次训练后的模型进行测试,在测试获得的精度大于预设精度之后,模型才视为训练好等。当然,也可以采取其他模型精度的提高方式,在本申请实施例中不作一一举例。
技能水平信息,除了采用上述的实施方式获取,还可以采用一些更简单的方式获取。作为一种可选的实施方式,步骤110包括:获取预设的技能水平测试题;将所述技能水平测试题反馈给待预测对象;获取待预测对象反馈的技能水平测试题的做题结果;根据做题结果确定待预测对象的技能水平。
在这种实施方式中,预先设计好用于对待预测对象进行测试的技能水平测试题。具体的,可以预先设计与不同的职业、不同的从业经验或者其他工作经历信息匹配的技能水平测试题,先获取待预测对象的工作经历信息,然后根据工作经历信息确定与该待预测对象匹配的技能水平测试题,将其反馈给该待预测对象。
待预测对象在完成技能水平测试题之后,将做题结果上传。技能水平测试题预设有对应的答案,通过将做题结果与答案进行匹配,根据做题结果的正确率确定待预测对象的技能水平。具体的,可以预设不同的正确率分别对应的技能水平,进而,当确定正确率之后,便可以将与之对应的技能水平确定为待预测对象的技能水平。
除了上述两种实施方式实现技能水平的确定,还可以采用更简单的实施方式,例如:直接由待预测对象输入技能水平信息,但是,在待预测对象输入的技能水平信息中,必须包括相应的认证信息,以保证输入的技能水平信息的真实信息。其中,认证信息例如可以是:专业的技能认证机构的认证信息、前工作单位的认证信息等,在本申请实施例中不作限定。
因此,在这种实施方式中,在确定技能水平信息之前,先校验其中是否包括认证信息,若包括,且认证信息真实可靠,例如:专业的技能认证机构的认证信息是可查询到的,则将该技能水平确定为待预测对象的技能水平。
在步骤120中,获取待预测对象的工作稳定性信息。工作稳定性信息,不属于结构化数据,也不属于非结构化数据,但是,其可以根据结构化数据确定。
作为一种可选的实施方式,步骤120包括:获取待预测对象的曾任职的工作份数信息;根据工龄信息和工作份数信息确定工作稳定性信息。
在这种实施方式中,需要结合工龄信息确定工作稳定性。因此,在此处,先对工龄信息的获取方式进行介绍,即先对步骤140的实施方式进行介绍。
工龄信息,可以理解为一种结构化数据,其通常为简历中的直接信息。
因此,作为一种可选的实施方式,步骤140包括:获取待预测对象的简历;简历中包括工龄项;从简历中提取出工龄项对应的工龄信息。
在这种实施方式中,从待预测对象的简历中提取工龄信息。其中,待预测对象的简历的获取方式参照前述实施例中的介绍,在此不再重复介绍。
在简历中,包括工龄项,工龄项的确定方式参照前述实施例中介绍的工作经历项的确定方式,在此不再重复介绍。
工龄信息与工龄项的位置通常是固定的,例如在工龄信息在工龄项下方或者右方等,并且,工龄信息通常为纯数字,因此,基于工龄项的位置,可以很容易的从简历中提取出工龄信息。
作为另一种可选的实施方式,待预测对象也可以直接输入工龄信息。因此,步骤140包括:获取待预测对象输入的工龄信息。具体的,向待预测对象展示工龄信息的输入提示,待预测对象根据输入提示输入工龄信息。
待预测对象输入工龄信息的形式包括但不限于:语音输入、文本输入等。此外,在输入提示中,可以包括具体的工龄信息选项,待预测对象可以从工龄信息选项中选择与之对应的工龄信息。
在本申请实施例中,待预测对象可以直接输入工龄信息;也可以从待预测对象的简历中提取工龄信息;实现工龄信息的有效且准确的获取。
待预测对象的曾任职的工作份数信息,也属于结构化数据,其获取方式可以参照工龄信息的获取方式,即,可以是待预测对象输入,也可以是从简历中提取,在此不再重复介绍。
结合工龄信息,和曾任职的工作份数信息,可以实现工作稳定性信息的确定。作为一种可选的实施方式,工龄信息和曾任职的工作份数信息均通过数字表示,例如:工龄信息为10年,曾任职的工作份数为2份。对应的,工作稳定性信息也通过数字表示,具体的,工作稳定性的代表值为工龄信息和曾任职的工作份数相除所得到的值,以上述举例为例,工作稳定性的代表值可以是:10/2=5。
可以理解,工作稳定性的代表值越大,一定程度上证明工作稳定性越高。
在本申请实施例中,通过待预测对象的曾任职的工作份数信息和工龄信息,实现工作稳定性信息的有效且准确的获取。
当然,工作稳定性也可以采用其他获取方式,例如:获取待预测对象的单份工作最长工作时间,根据该最长工作时间与预设的工作时间的差值(最长工作时间-预设的工作时间,不取绝对值)确定工作稳定性。差值越大,工作稳定性越高,差值越小,工作稳定性低。
其中,预设的工作时间可以根据实际的应用场景进行设置,在本申请实施例中不进行限定。单份工作最长工作时间,可以由用户输入,也可以从用户的简历中的工作经历字段中进行提取,在此不作限定。例如:待预测对象一共从事过3份工作,第一份工作的工作时间为2年,第二份工作的工作时间为1年,第三份工作的工作时间为1.5年,则单份工作最长工作时间为2年。
在步骤130中,获取待预测对象的最高学历信息。结合前述实施例中的介绍,在简历中,可以包括结构化数据和非结构化数据,最高学历信息也属于结构化数据,可以从简历中直接提取该信息。
因此,作为一种可选的实施方式,步骤130包括:获取待预测对象的简历;简历中包括最高学历项;从简历中提取出最高学历项对应的最高学历信息。
其中,待预测对象的简历的获取方式参照前述实施例中的介绍,在此不再重复介绍。以及,最高学历项的确定,也参照前述实施例中其他信息项的确定方式。
最高学历项对应的最高学历信息与最高学历项的位置通常是固定的,例如:最高学历信息在最高学历项的下方或者右方,在确定最高学历项之后,根据最高学历项的位置,便可以提取出最高学历信息。
最高学历信息,例如:本科、硕士、高中等。
作为另一种可选的实施方式,步骤130包括:获取待预测对象输入的最高学历信息。其中,最高学历信息的输入方式可以参照前述实施例中工龄信息的输入方式,在此不再重复介绍。
在本申请实施例中,待预测对象可以直接输入最高学历信息;也可以从待预测对象的简历中提取最高学历信息;实现最高学历信息的有效且准确的获取。
通过步骤110-步骤140,分别实现技能水平信息、工作稳定性信息、最高学历信息以及工龄信息的获取。进而,在步骤150中,将技能水平信息、工作稳定性信息、最高学历信息以及工龄信息输入预先训练好的薪资预测模型中,获得薪资预测模型输出的薪资预测值。
作为一种可选的实施方式,薪资预测模型的训练过程包括:获取训练数据集;训练数据集中包括:多个薪资以及各个薪资分别对应的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息;基于训练数据集对初始的薪资预测模型进行训练,获得训练好的薪资预测模型。
其中,各个薪资与技能水平信息、工作稳定性信息、最高学历信息以及工龄信息之间的对应关系,即训练数据集的获取方式可以有多种实施方式。
作为第一种可选的实施方式,可以先获取多个用户的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息,针对多个用户中已经具有实际的薪资数据的用户,则将实际的薪资数据确定为这些信息对应的薪资;针对多个用户中不具有实际的薪资数据的用户,则可以由HR评测对应的薪资,然后将评测的薪资确定为这些信息对应的薪资。
作为第二种可选的实施方式,先获取多个薪资,然后通过HR或者企业管理者确定这多个薪资分别对应的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息的标准,进而实现薪资与技能水平信息、工作稳定性信息、最高学历信息以及工龄信息的对应关系的确定。
基于训练数据集,对薪资预测模型进行训练,便可以获得训练好的薪资预测模型。
薪资预测模型可以是:随机森林模型,或者神经网络模型等,在本申请实施例中不作限定。如果采用随机森林模型,可以利用留一法对随机森林模型进行训练。
同样的,在薪资预测模型的训练过程中,可以采用一些实施方式提高模型的精度,具体的实施方式可以参照前述实施例中关于技能水平预测模型的介绍,在此不再重复介绍。
在本申请实施例中,通过训练数据集对薪资预测模型进行训练,训练好的薪资预测模型可以基于各个信息实现薪资的精确预测。
采用本申请实施例所提供的薪资的预测方式,经过实际验证,预测薪资与最终的实际信息之间的相对误差在2500左右,薪资预测的精度较高。
基于同一发明构思,请参照图2,本申请实施例中还提供一种薪资的预测装置200,包括:获取模块210和处理模块220。
获取模块210用于:获取待预测对象的技能水平信息;获取所述待预测对象的工作稳定性信息;获取所述待预测对象的最高学历信息;获取所述待预测对象的工龄信息。处理模块220用于将所述技能水平信息、所述工作稳定性信息、所述最高学历信息以及所述工龄信息输入预先训练好的薪资预测模型中,获得所述薪资预测模型输出的薪资预测值。
在本申请实施例中,获取模块210具体用于:获取所述待预测对象的简历;所述简历中包括工作经历项;从所述简历中提取出所述工作经历项对应的工作经历字段;根据所述工作经历字段确定所述技能水平信息。
在本申请实施例中,获取模块210具体还用于:将所述工作经历字段输入预先训练好的技能水平预测模型中,获得所述技能水平预测模型输出的技能水平信息。
在本申请实施例中,获取模块210还用于:获取多个工作经历字段样本;处理模块220还用于:将所述多个工作经历字段样本反馈给预设用户;获取模块210还用于:获取所述预设用户输入的反馈结果;所述反馈结果中包括各个所述工作经历字段样本分别对应的技能水平;处理模块220还用于:根据所述反馈结果和所述多个工作经历字段样本对初始的技能水平预测模型进行训练,获得训练好的技能水平预测模型。
在本申请实施例中,获取模块210具体还用于:获取所述待预测对象的曾任职的工作份数信息;根据所述工龄信息和所述工作份数信息确定所述工作稳定性信息。
在本申请实施例中,获取模块210具体还用于:获取所述待预测对象输入的最高学历信息;或者,获取所述待预测对象的简历;所述简历中包括最高学历项;从所述简历中提取出所述最高学历项对应的最高学历信息。
在本申请实施例中,获取模块210具体还用于:获取所述待预测对象输入的工龄信息;或者,获取所述待预测对象的简历;所述简历中包括工龄项;从所述简历中提取出所述工龄项对应的工龄信息。
在本申请实施例中,获取模块210还用于:获取训练数据集;所述训练数据集中包括:多个薪资以及各个所述薪资分别对应的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息;处理模块220还用于:基于所述训练数据集对初始的薪资预测模型进行训练,获得训练好的薪资预测模型。
薪资的预测装置200与薪资的预测方法对应,各个功能模块与各个步骤一一对应,因此,各个功能模块的实施方式参照前述实施例中各个步骤的实施方式,在此不再重复介绍。
基于同一发明构思,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行前述实施例中所述的薪资的预测方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种薪资的预测方法,其特征在于,包括:
获取待预测对象的技能水平信息;
获取所述待预测对象的工作稳定性信息;
获取所述待预测对象的最高学历信息;
获取所述待预测对象的工龄信息;
将所述技能水平信息、所述工作稳定性信息、所述最高学历信息以及所述工龄信息输入预先训练好的薪资预测模型中,获得所述薪资预测模型输出的薪资预测值。
2.根据权利要求1所述的预测方法,其特征在于,所述获取待预测对象的技能水平信息,包括:
获取所述待预测对象的简历;所述简历中包括工作经历项;
从所述简历中提取出所述工作经历项对应的工作经历字段;
根据所述工作经历字段确定所述技能水平信息。
3.根据权利要求2所述的预测方法,其特征在于,所述根据所述工作经历字段确定所述技能水平信息,包括:
将所述工作经历字段输入预先训练好的技能水平预测模型中,获得所述技能水平预测模型输出的技能水平信息。
4.根据权利要求3所述的预测方法,其特征在于,所述预测方法还包括:
获取多个工作经历字段样本;
将所述多个工作经历字段样本反馈给预设用户;
获取所述预设用户输入的反馈结果;所述反馈结果中包括各个所述工作经历字段样本分别对应的技能水平;
根据所述反馈结果和所述多个工作经历字段样本对初始的技能水平预测模型进行训练,获得训练好的技能水平预测模型。
5.根据权利要求1所述的预测方法,其特征在于,所述获取所述待预测对象的工作稳定性信息,包括:
获取所述待预测对象的曾任职的工作份数信息;
根据所述工龄信息和所述工作份数信息确定所述工作稳定性信息。
6.根据权利要求1所述的预测方法,其特征在于,所述获取所述待预测对象的最高学历信息,包括:
获取所述待预测对象输入的最高学历信息;或者,
获取所述待预测对象的简历;所述简历中包括最高学历项;
从所述简历中提取出所述最高学历项对应的最高学历信息。
7.根据权利要求1所述的预测方法,其特征在于,所述获取所述待预测对象的工龄信息,包括:
获取所述待预测对象输入的工龄信息;或者,
获取所述待预测对象的简历;所述简历中包括工龄项;
从所述简历中提取出所述工龄项对应的工龄信息。
8.根据权利要求1所述的预测方法,其特征在于,所述预测方法还包括:
获取训练数据集;所述训练数据集中包括:多个薪资以及各个所述薪资分别对应的技能水平信息、工作稳定性信息、最高学历信息以及工龄信息;
基于所述训练数据集对初始的薪资预测模型进行训练,获得训练好的薪资预测模型。
9.一种薪资的预测装置,其特征在于,包括:
获取模块,用于:
获取待预测对象的技能水平信息;
获取所述待预测对象的工作稳定性信息;
获取所述待预测对象的最高学历信息;
获取所述待预测对象的工龄信息;
处理模块,用于将所述技能水平信息、所述工作稳定性信息、所述最高学历信息以及所述工龄信息输入预先训练好的薪资预测模型中,获得所述薪资预测模型输出的薪资预测值。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行如权利要求1-8任一项所述的薪资的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111082549.6A CN113780669A (zh) | 2021-09-15 | 2021-09-15 | 一种薪资的预测方法及装置、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111082549.6A CN113780669A (zh) | 2021-09-15 | 2021-09-15 | 一种薪资的预测方法及装置、可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113780669A true CN113780669A (zh) | 2021-12-10 |
Family
ID=78844219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111082549.6A Pending CN113780669A (zh) | 2021-09-15 | 2021-09-15 | 一种薪资的预测方法及装置、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780669A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08279010A (ja) * | 1995-04-05 | 1996-10-22 | Casio Comput Co Ltd | モデル賃金出力方法 |
US20060271421A1 (en) * | 2005-05-03 | 2006-11-30 | Dan Steneker | Computer-aided system and method for visualizing and quantifying candidate preparedness for specific job roles |
US20130097093A1 (en) * | 2011-10-12 | 2013-04-18 | George Kolber | Systems and Methods for Quantifying Job Candidates |
CN105160498A (zh) * | 2015-10-21 | 2015-12-16 | 北京普猎创新网络科技有限公司 | 一种基于大数据的人员价值计算方法 |
CN107578183A (zh) * | 2017-09-18 | 2018-01-12 | 上海量明科技发展有限公司 | 基于能力评估的资源管理方法及装置 |
CN111125343A (zh) * | 2019-12-17 | 2020-05-08 | 领猎网络科技(上海)有限公司 | 适用于人岗匹配推荐系统的文本解析方法及装置 |
CN111738586A (zh) * | 2020-06-17 | 2020-10-02 | 中国银行股份有限公司 | 人才评估方法及装置 |
CN111767390A (zh) * | 2020-06-28 | 2020-10-13 | 北京百度网讯科技有限公司 | 技能词评估方法及装置、电子设备、计算机可读介质 |
-
2021
- 2021-09-15 CN CN202111082549.6A patent/CN113780669A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08279010A (ja) * | 1995-04-05 | 1996-10-22 | Casio Comput Co Ltd | モデル賃金出力方法 |
US20060271421A1 (en) * | 2005-05-03 | 2006-11-30 | Dan Steneker | Computer-aided system and method for visualizing and quantifying candidate preparedness for specific job roles |
US20130097093A1 (en) * | 2011-10-12 | 2013-04-18 | George Kolber | Systems and Methods for Quantifying Job Candidates |
CN105160498A (zh) * | 2015-10-21 | 2015-12-16 | 北京普猎创新网络科技有限公司 | 一种基于大数据的人员价值计算方法 |
CN107578183A (zh) * | 2017-09-18 | 2018-01-12 | 上海量明科技发展有限公司 | 基于能力评估的资源管理方法及装置 |
CN111125343A (zh) * | 2019-12-17 | 2020-05-08 | 领猎网络科技(上海)有限公司 | 适用于人岗匹配推荐系统的文本解析方法及装置 |
CN111738586A (zh) * | 2020-06-17 | 2020-10-02 | 中国银行股份有限公司 | 人才评估方法及装置 |
CN111767390A (zh) * | 2020-06-28 | 2020-10-13 | 北京百度网讯科技有限公司 | 技能词评估方法及装置、电子设备、计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tonidandel et al. | RWA web: A free, comprehensive, web-based, and user-friendly tool for relative weight analyses | |
US8583516B1 (en) | Importing accounting application data into a tax preparation application | |
US20140195219A1 (en) | Translation quality quantifying apparatus and method | |
CN108090043B (zh) | 基于人工智能的纠错举报处理方法、装置及可读介质 | |
CN110569335B (zh) | 基于人工智能的三元组校验方法、装置及存储介质 | |
CN110264274B (zh) | 客群划分方法、模型生成方法、装置、设备及存储介质 | |
CN112988963B (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
CN113076104A (zh) | 页面生成方法、装置、设备及存储介质 | |
CN104993962A (zh) | 获取终端使用状态的方法和系统 | |
CN112148937B (zh) | 动态防疫知识的推送方法及系统 | |
CN111506595B (zh) | 一种数据查询方法、系统及相关设备 | |
CN112667802A (zh) | 业务信息录入方法、装置、服务器和存储介质 | |
CN113127621A (zh) | 对话模块的推送方法、装置、设备及存储介质 | |
CN115563271A (zh) | 人工智能的会计数据分录方法、系统、设备及存储介质 | |
US20130282628A1 (en) | Method and Apparatus for Performing Dynamic Textual Complexity Analysis Using Machine Learning Artificial Intelligence | |
CN111831708A (zh) | 基于缺失数据的样本分析方法、装置、电子设备及介质 | |
CN111104422B (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN112052310A (zh) | 基于大数据的信息获取方法、装置、设备及存储介质 | |
CN113780669A (zh) | 一种薪资的预测方法及装置、可读存储介质 | |
WO2016166598A1 (en) | Requirements determination | |
CN113486169B (zh) | 基于bert模型的同义语句生成方法、装置、设备及存储介质 | |
CN112836033B (zh) | 业务模型的管理方法、装置、设备及存储介质 | |
CN114841165A (zh) | 用户数据分析及展示方法、装置、电子设备及存储介质 | |
CN113780666A (zh) | 一种缺失值的预测方法及装置、可读存储介质 | |
CN114780577A (zh) | Sql语句生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |