CN115659044A - 一种人岗匹配的推荐方法、系统、电子设备、存储介质 - Google Patents
一种人岗匹配的推荐方法、系统、电子设备、存储介质 Download PDFInfo
- Publication number
- CN115659044A CN115659044A CN202211399122.3A CN202211399122A CN115659044A CN 115659044 A CN115659044 A CN 115659044A CN 202211399122 A CN202211399122 A CN 202211399122A CN 115659044 A CN115659044 A CN 115659044A
- Authority
- CN
- China
- Prior art keywords
- data
- post
- model
- matching
- recall
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种人岗匹配的推荐方法、系统、电子设备、存储介质,所述方法首先采集并分析业务数据和日志数据,并对其进行打标签,得到用户画像;将步骤S1得到的用户画像作为第一数据集,构建排序模型和召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集,利用第二数据集训练排序模型;采集待匹配的业务数据和日志数据输入至步骤S2训练好的排序模型和召回模型,得到简历推荐结果。本发明方法通过召回模型分析简历和岗位各自的文本语义信息,使得人岗匹配结果更加准确。
Description
技术领域
本发明属于大数据智能推荐领域,尤其涉及一种人岗匹配的推荐方法、系统、电子设备、存储介质。
背景技术
人岗匹配是人工智能在招聘领域的重要应用。“人岗匹配”为“候选人与岗位匹配”的缩写,在招聘业务中扮演着重要角色,通常这一任务由公司内部经验丰富的招聘同事负责。可是在互联网快速发展的今天,海量的简历使得人工人岗匹配的成本变得高昂。由算法驱动的人岗匹配辅助系统应运而生,这种自动化的人岗匹配程序可以减少招聘同事的简历筛选工作量,从而降低公司人工成本。
然而,目前的人岗匹配仅仅使用关键字进行简历和岗位的筛选,硬性的条件筛选会过滤掉部分匹配的简历或岗位,忽略了应聘者和岗位各自的文本语义信息,如岗位描述、工作描述、项目经历等,而这些信息可以对人岗匹配起到不可忽视的指导作用,忽略掉这些信息可能导致人岗匹配结果不够准确。
发明内容
本发明的目的在于,提供一种人岗匹配的推荐方法及系统,通过用户画像技术,采用召回算法、排序算法,实现个性化的推荐并实现简历和岗位更好的匹配。
为实现上述目的,本发明提供如下技术方案:本发明实施例的第一方面提供了一种人岗匹配的推荐方法,所述方法具体包括以下步骤:
步骤S1:采集并分析业务数据和日志数据,并对其进行打标签,得到用户画像;
步骤S2:将步骤S1得到的用户画像作为第一数据集,构建排序模型和召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集,利用第二数据集训练排序模型;
步骤S3:采集待匹配的业务数据和日志数据输入至步骤S2训练好的排序模型和召回模型,得到简历推荐结果。
进一步地,所述步骤S1中:通过建立用户信息宽表对采集的业务数据和日志数据进行分析;所述业务数据包括简历基本特征数据和岗位基本特征数据,所述简历基本特征数据包括性别、年龄、工作年限、工作经历、当前薪资水平,所述岗位基本特征数据包括岗位名称、工作地点、工作要求、岗位职责、岗位学历要求;所述日志数据包括基本行为数据和用户偏好数据;所述基本行为数据包括岗位点击次数、岗位收藏次数、岗位投递记录;所述用户偏好数据包括期望岗位名、期望岗位类型、期望薪水。
进一步地,所述步骤S2中构建召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集的过程包括:利用召回算法对召回模型进行训练包括第一文本匹配和第二语义匹配;
其中,第一文本匹配包括:将简历字段和标签进行第一文本匹配,生成0或1的特征数据,0表示简历字段和岗位字段匹配不成功,1表示简历和岗位字段匹配成功;
第二文本匹配包括:对进行第一文本匹配后的简历字段和和待匹配岗位关键词进行第二语义匹配,生成0~1区间的特征数据。
进一步地,所述召回模型选用Bert模型。
进一步地,所述第二文本匹配的过程具体包括:
首先将进行第一文本匹配后的简历字段输入至Bert模型,所述Bert模型将简历字段和待匹配岗位关键词转化为简历字段对应的若干个嵌入向量和待匹配岗位关键词向量,计算每个简历字段对应的嵌入向量与待匹配岗位关键词向量的余弦相似度得到向量相关度,自定义设置相关度阈值n,取前n个待匹配岗位作为相关度较高的候选集;第二文本匹配会生成0~1区间的特征数据。
进一步地,所述步骤S2中利用第二数据集训练排序模型的过程包括:
所述排序模型选用逻辑回归模型,利用第二数据集通过排序算法对逻辑回归模型进行训练;调整逻辑回归模型的参数,计算匹配度,自定义设置匹配度阈值m,取前m个待匹配岗位作为匹配度指标高的候选集。
本发明实施例的第二方面提供了一种人岗匹配的推荐系统,用于实现上述的人岗匹配的推荐方法,所述系统包括服务端和客户端;
所述客户端用于采集业务数据和日志数据,并传输至服务端;
所述服务端包括:
数据预处理模块,分析客户端采集的业务数据和日志数据并对其进行打标签,得到用户画像;
召回模块,将用户画像作为第一数据集利用第一数据集训练召回模型,得到特征数据;
排序模块,将召回模块得到的特征数据作为第二数据集,利用第二数据集训练排序模型;
本发明实施例的第三方面提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的人岗匹配的推荐方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的人岗匹配的推荐方法。
本发明的有益效果为:本发明提供了一种人岗匹配的推荐方法,通过用户画像作为第一数据集,利用召回算法训练召回模型,训练召回模型的过程包括第一文本匹配和第二语义匹配,先将简历字段和标签进行第一文本匹配,对进行第一文本匹配后的简历字段和和待匹配岗位关键词进行第二语义匹配,使得简历与待匹配岗位各自的文本语义信息(如岗位描述、工作描述、项目经历等)进行匹配,提高人岗匹配结果的准确率。
附图说明
图1为一种人岗匹配的推荐方法的流程图;
图2为一种人岗匹配的推荐方法的技术方案示意框图;
图3为推荐系统的流程图;
图4为本发明实施例提供的一种电子设备的示意性框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例中提供一种人岗匹配的推荐方法,所述方法包括以下具体实施步骤:
步骤S1:采集并分析业务数据和日志数据,并对其进行打标签,得到用户画像。
具体地,首先,通过建立用户信息宽表对采集的业务数据和日志数据进行分析。所述业务数据包括简历基本特征数据和岗位基本特征数据,所述简历基本特征数据如性别、年龄、工作年限、工作经历、当前薪资水平等,所述岗位基本特征数据如岗位名称、工作地点、工作要求、岗位职责、岗位学历要求等。所述日志数据包括基本行为数据、统计数据和用户偏好数据;所述基本行为数据如点击次数、收藏次数、投递记录等,所述统计数据如不同岗位类型的岗位收藏数、投递数等,所述用户偏好数据如期望岗位名、期望岗位类型、期望薪水等。
然后,在本发明实施例中利用漏斗分析对采集的业务数据和日志数据进行特征提取并打标签,得到用户画像。
步骤S2:将步骤S1得到的用户画像作为第一数据集,构建排序模型和召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集,利用第二数据集训练排序模型。
具体地,所述步骤S2具体包括以下子步骤:
S201,基于步骤S1得到的用户画像作为第一数据集;
S202,构建召回模型,利用步骤S201得到的第一数据集利用召回算法对召回模型进行训练,得到特征数据,将特征数据作为第二数据集。
在本实例中,所述召回模型选用Bert模型。
其中所述召回算法包括两种召回方式:
一是简历字段和标签进行第一文本匹配;所述标签为工作地点、岗位类型和技能要求等。示例性地,以标签为岗位字段进行第一文本匹配为例,所述简历字段和所述岗位字段进行第一文本匹配后会生成0或1的特征数据,其中,0表示为简历字段和岗位字段匹配不成功(即简历字段中没有包含相同的岗位字段),1表示为简历和岗位字段匹配成功。
二是对进行第一文本匹配后的简历字段进行第二语义匹配:
首先将进行第一文本匹配后的简历字段输入至Bert模型,所述Bert模型将简历字段和待匹配岗位关键词转化为简历字段对应的若干个嵌入向量embedding和待匹配岗位关键词向量,所述待匹配岗位关键词包括岗位名称、工作地点、工作要求、岗位职责等,计算每个简历字段对应的嵌入向量embedding与待匹配岗位关键词向量的余弦相似度得到向量相关度,
使用Bert模型将所述简历字段和所述岗位字段转换为嵌入向量a和待匹配岗位关键词向量b,然后使用所述嵌入向量a和所述待匹配岗位关键词向量b计算余弦相似度,公式如下:
自定义设置相关度阈值n,取前n个待匹配岗位作为相关度较高的候选集。特别地,经第二语义匹配后候选集降低到千以内的规模。进行第二文本匹配会生成0~1区间的特征数据。
S203,构建排序模型,利用步骤S202得到的第二数据集通过排序算法对排序模型进行训练。
在本实例中,所述排序模型选用逻辑回归模型。
训练的特征使用所述简历字段和岗位字段在匹配中生成的特征数据即第二数据集,训练的目标变量为日志数据中的简历是否被企业通过,0为简历未通过,1为简历通过。训练完成后得到参数w1、w2、w3…wn和参数b,最终匹配度计算公式为:
其中σ函数为:
在排序模型不断地优化和调整参数得到最优排序模型,即每一个特征都获得了一个最优的权值。将百量级的内容按照匹配度指标的顺序依次排序,自定义设置匹配度阈值m,取前m个待匹配岗位作为匹配度指标高的候选集。
步骤S3:采集待匹配的业务数据和日志数据输入至步骤S2训练好的排序模型和召回模型,得到简历推荐结果。
本发明实施例还提供了一种人岗匹配的推荐系统,用于实现上述的人岗匹配的推荐方法,,所述系统包括服务端和客户端;所述客户端用于采集业务数据和日志数据,并传输至服务端;所述服务端包括:数据预处理模块、召回模块和排序模块。所述数据预处理模块,分析客户端采集的业务数据和日志数据并对其进行打标签,得到用户画像;所述召回模块,将用户画像作为第一数据集利用第一数据集训练召回模型,得到特征数据;所述排序模块,将召回模块得到的特征数据作为第二数据集,利用第二数据集训练排序模型。
参照图2,本发明实施例中提供一种人岗匹配的推荐方法,其具体实施方式为:业务数据存储方式使用Mysql、日志数据存储方式使用Kafka、画像数据存储方式使用ClickHouse、特征数据和缓存数据存储使用Redis。用户画像通过数据分析和挖掘从用户的业务数据和日志数据中提取特征,通过打标签的方式利用简历基本特征数据、基本行为数据和用户偏好数据等来描述用户;基于步骤S1中得到的画像数据作为第一数据集,构建召回模型和排序模型,使用召回算法训练得到召回模型,使用排序算法训练得到排序模型,进行模型测试和优化得到最优的召回模型和排序模型;基于步骤S2中训练得到的召回模型和排序模型,使用的是基于Python的Web应用程序开发框架FastAPI,将召回模型和排序模型部署于服务端上,同时提供推荐服务HTTP接口,便于客户端进行调用,客户端向服务端发送请求,服务端根据请求返回不同的推荐结果。客户端是推荐服务的使用者,通过HTTP方式调用推荐服务接口,并显示推荐结果给用户。同时客户端还负责进行数据采集工作,包括日志数据和业务数据采集。客户端在请求推荐服务的过程中,请求数据会经过服务端中的召回模块和排序模块,然后结合业务策略筛选,最终得到推荐结果返回给客户端,并保存推荐结果到缓存数据库。并且客户端负责数据采集,通过接口方式将日志数据存储到日志数据库,业务数据存储到业务数据库。
参照图3,所述推荐服务的具体过程为:所述客户端接收业务数据和日志数据,并将简历转化为简历结构化数据,所述推荐服务查询缓存是否存在所述简历的岗位推荐数据,若存在所述简历的岗位推荐数据直接返回客户端,否则所述推荐服务会调用召回模块,筛选百量级的候选岗位,然后调用排序模块对召回的候选岗位进行排序,得到推荐结果,所述推荐结果会存储到缓存数据库,方便所述客户端的下次直接查询。
如图4所示,本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。
Claims (9)
1.一种人岗匹配的推荐方法,其特征在于,所述方法具体包括以下步骤:
步骤S1:采集并分析业务数据和日志数据,并对其进行打标签,得到用户画像;
步骤S2:将步骤S1得到的用户画像作为第一数据集,构建排序模型和召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集,利用第二数据集训练排序模型;
步骤S3:采集待匹配的业务数据和日志数据输入至步骤S2训练好的排序模型和召回模型,得到简历推荐结果。
2.根据权利要求1所述的人岗匹配的推荐方法,其特征在于,所述步骤S1中:通过建立用户信息宽表对采集的业务数据和日志数据进行分析;所述业务数据包括简历基本特征数据和岗位基本特征数据,所述简历基本特征数据包括性别、年龄、工作年限、工作经历、当前薪资水平,所述岗位基本特征数据包括岗位名称、工作地点、工作要求、岗位职责、岗位学历要求;所述日志数据包括基本行为数据和用户偏好数据;所述基本行为数据包括岗位点击次数、岗位收藏次数、岗位投递记录;所述用户偏好数据包括期望岗位名、期望岗位类型、期望薪水。
3.根据权利要求1所述的人岗匹配的推荐方法,其特征在于,所述步骤S2中构建召回模型,利用第一数据集训练召回模型,得到特征数据并作为第二数据集的过程包括:利用召回算法对召回模型进行训练,包括第一文本匹配和第二语义匹配;
其中,第一文本匹配包括:将简历字段和标签进行第一文本匹配,生成0或1的特征数据,0表示简历字段和岗位字段匹配不成功,1表示简历和岗位字段匹配成功;
第二文本匹配包括:对进行第一文本匹配后的简历字段和和待匹配岗位关键词进行第二语义匹配,生成0~1区间的特征数据。
4.根据权利要求1或3所述的人岗匹配的推荐方法,其特征在于,所述召回模型选用Bert模型。
5.根据权利要求3所述的人岗匹配的推荐方法,其特征在于,所述第二文本匹配的过程具体包括:
首先将进行第一文本匹配后的简历字段输入至Bert模型,所述Bert模型将简历字段和待匹配岗位关键词转化为简历字段对应的若干个嵌入向量和待匹配岗位关键词向量,计算每个简历字段对应的嵌入向量与待匹配岗位关键词向量的余弦相似度得到向量相关度,自定义设置相关度阈值n,取前n个待匹配岗位作为相关度较高的候选集;第二文本匹配会生成0~1区间的特征数据。
6.根据权利要求1所述的人岗匹配的推荐方法,其特征在于,所述步骤S2中利用第二数据集训练排序模型的过程包括:
所述排序模型选用逻辑回归模型,利用第二数据集通过排序算法对逻辑回归模型进行训练;调整逻辑回归模型的参数,计算匹配度,自定义设置匹配度阈值m,取前m个待匹配岗位作为匹配度指标高的候选集。
7.一种人岗匹配的推荐系统,用于实现权利要求1~6所述的人岗匹配的推荐方法,其特征在于,所述系统包括服务端和客户端;
所述客户端用于采集业务数据和日志数据,并传输至服务端;
所述服务端包括:
数据预处理模块,分析客户端采集的业务数据和日志数据并对其进行打标签,得到用户画像;召回模块,将用户画像作为第一数据集利用第一数据集训练召回模型,得到特征数据;
排序模块,将召回模块得到的特征数据作为第二数据集,利用第二数据集训练排序模型。
8.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-6任一项所述的人岗匹配的推荐方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的人岗匹配的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211399122.3A CN115659044A (zh) | 2022-11-09 | 2022-11-09 | 一种人岗匹配的推荐方法、系统、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211399122.3A CN115659044A (zh) | 2022-11-09 | 2022-11-09 | 一种人岗匹配的推荐方法、系统、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115659044A true CN115659044A (zh) | 2023-01-31 |
Family
ID=85015194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211399122.3A Pending CN115659044A (zh) | 2022-11-09 | 2022-11-09 | 一种人岗匹配的推荐方法、系统、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659044A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452165A (zh) * | 2023-03-22 | 2023-07-18 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
CN116523268A (zh) * | 2023-06-30 | 2023-08-01 | 广东中大管理咨询集团股份有限公司 | 一种基于大数据画像的人岗匹配分析方法及装置 |
CN116452165B (zh) * | 2023-03-22 | 2024-05-24 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
-
2022
- 2022-11-09 CN CN202211399122.3A patent/CN115659044A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452165A (zh) * | 2023-03-22 | 2023-07-18 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
CN116452165B (zh) * | 2023-03-22 | 2024-05-24 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
CN116523268A (zh) * | 2023-06-30 | 2023-08-01 | 广东中大管理咨询集团股份有限公司 | 一种基于大数据画像的人岗匹配分析方法及装置 |
CN116523268B (zh) * | 2023-06-30 | 2023-09-26 | 广东中大管理咨询集团股份有限公司 | 一种基于大数据画像的人岗匹配分析方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111708949B (zh) | 医疗资源的推荐方法及装置、电子设备、存储介质 | |
CN107239564B (zh) | 一种基于监督主题模型的文本标签推荐方法 | |
CN109408821B (zh) | 一种语料生成方法、装置、计算设备及存储介质 | |
US20130185276A1 (en) | System for Search and Customized Information Updating of New Patents and Research, and Evaluation of New Research Projects' and Current Patents' Potential | |
CN115659044A (zh) | 一种人岗匹配的推荐方法、系统、电子设备、存储介质 | |
CN116228319A (zh) | 基于埋点的智能广告投放方法与系统 | |
CN116775879A (zh) | 大语言模型的微调训练方法、合同风险评审方法及系统 | |
CN103425748B (zh) | 一种文档资源建议词的挖掘方法和装置 | |
CN117093699B (zh) | 智能问答方法、装置、设备及介质 | |
CN116452212A (zh) | 一种智能客服商品知识库信息管理方法及系统 | |
CN108875014B (zh) | 基于大数据与人工智能的精准项目推荐方法和机器人系统 | |
Eken et al. | Predicting defects with latent and semantic features from commit logs in an industrial setting | |
CN116010662A (zh) | 一种能源消费-碳排放查询系统的构建方法、装置及介质 | |
CN112800219B (zh) | 客服日志反馈回流数据库的方法及系统 | |
CN114048148A (zh) | 一种众包测试报告推荐方法、装置及电子设备 | |
CN113672804A (zh) | 推荐信息生成方法、系统、计算机设备及存储介质 | |
CN113204697A (zh) | 一种搜索方法、装置、电子设备及存储介质 | |
CN112329883A (zh) | 模型训练系统、方法、设备及存储介质 | |
CN112148860B (zh) | 文本机器人的问题推荐方法及装置 | |
CN116703328B (zh) | 一种项目评审方法及系统 | |
CN111861404B (zh) | 基于智能机器的数据处理方法及装置、电子设备 | |
CN116821765A (zh) | 软件系统的设备可靠性评估及事实依据提取系统及方法 | |
CN113392291A (zh) | 一种基于数据中心的服务推荐方法及系统 | |
CN117371841A (zh) | 测评任务推荐方法、系统及存储介质 | |
CN114186974A (zh) | 一种多模型融合的开发任务关联方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |