CN112199602A - 岗位推荐方法、推荐平台及服务器 - Google Patents

岗位推荐方法、推荐平台及服务器 Download PDF

Info

Publication number
CN112199602A
CN112199602A CN202011394024.1A CN202011394024A CN112199602A CN 112199602 A CN112199602 A CN 112199602A CN 202011394024 A CN202011394024 A CN 202011394024A CN 112199602 A CN112199602 A CN 112199602A
Authority
CN
China
Prior art keywords
candidate
post
determining
intention
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011394024.1A
Other languages
English (en)
Other versions
CN112199602B (zh
Inventor
杨康
王文敏
屈玉涛
何耀彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smart City Research Institute Of China Electronics Technology Group Corp
Original Assignee
Smart City Research Institute Of China Electronics Technology Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smart City Research Institute Of China Electronics Technology Group Corp filed Critical Smart City Research Institute Of China Electronics Technology Group Corp
Priority to CN202011394024.1A priority Critical patent/CN112199602B/zh
Publication of CN112199602A publication Critical patent/CN112199602A/zh
Application granted granted Critical
Publication of CN112199602B publication Critical patent/CN112199602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种岗位推荐方法、推荐平台及服务器,所述方法包括:获取用户的求职意向信息;根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。本申请实施例通过考虑求职意向信息中的非结构化特征,确定每个候选岗位与意向岗位之间的总相似度分值,将符合预设条件的总相似度分值对应的候选岗位推送给用户,从而提升了岗位推荐的精准性,提升了求职者体验,增强用户黏性。

Description

岗位推荐方法、推荐平台及服务器
技术领域
本申请属于招聘系统技术领域,尤其涉及一种岗位推荐方法、推荐平台及服务器。
背景技术
随着网络应用的普及,人们在求职时也越来越多的借助于招聘公司的招聘网站或者第三方招聘网站投递简历、寻找工作。网站能提供的岗位非常丰富,求职者如何快速在丰富的岗位中找到适合自己求职意向的岗位,变成为亟待解决的问题。
现有技术中进行岗位推荐时,通常仅考虑学历、工作类型、岗位类别等结构化特征信息,对于一个求职者会同时推送许多的岗位,但是推荐的岗位往往与求职者的意向匹配度并不高。求职者收到极为丰富的岗位推荐之后,还需要进一步人工筛选。
发明内容
本申请实施例提供了一种岗位推荐方法、推荐平台及服务器,可以精准高效的为求职者推荐岗位。
第一方面,本申请实施例提供了一种岗位推荐方法,包括:
获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;
根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;
根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
第二方面,本申请实施例提供了一种岗位推荐平台,包括:
获取模块,用于获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
初筛模块,用于根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;
相似度确定模块,用于根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;
岗位推荐模块,用于根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项的岗位推荐方法。
第四方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行上述第一方面中任一项所述的岗位推荐方法。
可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例提供了一种岗位推荐方法、推荐平台及服务器,所述方法包括:获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。本申请实施例通过考虑求职意向信息中的非结构化特征,确定每个候选岗位与意向岗位之间的总相似度分值,将符合预设条件的总相似度分值对应的候选岗位推送给用户,从而提升了岗位推荐的精准性,提升了求职者体验,增强用户黏性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的岗位推荐方法的流程示意图;
图2是本申请实施例提供的岗位推荐平台的结构示意图;
图3是本申请实施例提供的服务器的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到所描述条件或事件”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到所描述条件或事件”或“响应于检测到所描述条件或事件”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
下面对本申请实施例提供的技术方案进行详细阐述。
参见图1示出的一种岗位推荐方法的一种流程示意图,该方法可以包括以下步骤:
步骤S101:获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
获取用户的求职意向信息,可以通过获取用户的简历,或者用户在网站填写的个人资料获得。
步骤S102:根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位,所述结构化特征信息包括定量特征和定性特征。其中,定量特征可以包括薪资或者工作经验等,定性特征可以包括工作地点、最高学历或者岗位类别等。
根据所述结构化特征信息确定原始候选岗位集,具体包括4个步骤:
步骤S1021:计算所述结构化特征信息与数据库中招聘岗位的定量特征匹配度。
通过计算求职者求职信息中定量特征与招聘岗位中的定量特征的比值,来确定招聘岗位与求职者的匹配度,所述比值越趋近于1,说明越匹配。
在一个实施例中,通过计算求职者的期望薪资m1、工作经验m2和招聘岗位中的岗位薪资平均值n1、岗位工作经验最小值n2的比值来确定匹配度,根据匹配度确定招聘岗位与求职者的匹配度得分,公式化表达如下:
Figure 409527DEST_PATH_IMAGE001
示例性的,即定义求职简历信息与招聘岗位要求定量特征得分为匹配度得分为Sim1,其计算方式如下:
Figure 325004DEST_PATH_IMAGE002
即所有定量特征相似度的平均值。
步骤S1022:计算所述结构化特征信息与数据库中招聘岗位的定性特征匹配度。
在求职者求职信息和招聘岗位中,定性特征一般包括求职者求职信息中的期望工作地点m3、最高学历m4、期望岗位类别m5和招聘岗位中的工作地点n3、学历要求n4、岗位类别n5。可以通过求职者求职信息和招聘岗位中的定性特征之间是否存在交集来计算匹配度。其公式化表达如下:
Figure 776845DEST_PATH_IMAGE003
即若期望工作地点,最高学历与期望岗位类别与招聘岗位要求的工作地点、学历要求和岗位类别存在交集,则相似度得分Simi为1,否则为0。
对于工作地点:若期望工作地点包含招聘岗位要求中的工作地点,认为该招聘岗位满足求职者地域要求。如期望工作地为嘉兴市,招聘岗位工作地为嘉兴市南湖区,此时候选岗位与求职者简历该项特征相似度值为1,反之若期望工作地为嘉兴市南湖区,实际工作地为嘉兴市,则认为相似度值为0。
对于最高学历:若求职者最高学历大于招聘岗位中的要求学历,认为该招聘岗位满足学历推荐要求。如最高学历为硕士,招聘岗位学历要求为本科,此时招聘岗位与求职者求职信息中该项特征相似度值为1,反之相似度值为0。
对于岗位类别:若期望岗位类别为服务业,实际招聘岗位为餐饮业,由于餐饮业属于服务业,因此认为该招聘岗位满足求职者岗位类别要求,认为招聘岗位与求职者简历该项特征此时相似度值为1。
示例性的,定义求职信息与招聘岗位要求定性特征得分为Sim2,其计算方式如下:
Figure 640896DEST_PATH_IMAGE004
即所有定性特征相似度的平均值。
步骤S1023:根据所述定量特征匹配度和所述定性特征匹配度,确定所述招聘岗位与所述结构化特征信息的匹配度。
定量特征匹配度和定性特征匹配度越接近1,则表明招聘岗位与求职者意向越匹配。
示例性的,计算相似度得分Sim1、Sim2与1的绝对值差DIFF1和DIFF2,公式化表达为:
Figure 173377DEST_PATH_IMAGE005
并指定阈值Thred1、Thred2,比较DIFF1和DIFF2与指定阈值的大小关系,若均小于指定阈值,则认为招聘岗位符合求职者求职意向,招聘岗位为求职者的候选岗位。记所有符合求职者求职意向的候选岗位组成的集合为原始候选岗位集。
步骤S1024:将符合预设匹配度要求的招聘岗位划分至原始候选岗位集。
本申请实施例通过利用结构化特征信息进行初步筛选出符合求职者求职意向的招聘岗位作为候选岗位,并建立原始候选岗位集,从而有利于最终得到匹配度更高的岗位,降低了计算复杂度,提高了匹配的准确度和速度。
对于步骤S103,根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值,具体包括:
确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值,和/或,确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值;根据所述第一相似度分值和/或第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。可以分为三种情况:
第一种:确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值;
根据所述第一相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。
对于步骤S103之前,还可以包括:预先建立词向量模型与预先建立句向量库,所述词向量模型可以包括Word2vec词向量模型。
其中,预先建立词向量模型,包括:
首先,对语料数据进行预处理。收集尽可能多的中文知识库语料,比如百度百科语料、微信公众号文章、维基百科中文语料或者简历库等,利用Jieba开源工具对以上文本数据分词,建立数据库,可以在分词的时候关闭新词发现功能。通过丰富的渠道收集各种语料,从而使得数据库尽可能的包括某个术语全部的表达方式,增强模型的适应能力。预处理还可以包括去停用词,进行大小写转换,简繁体转换。
然后,利用数据进行训练。例如可以采用开源工具Gensim,利用分词后的数据进行训练,示例性的,模型结构为SkipGram + Huffman Softmax,向量维度为256维,窗口大小为10,最小词频为64,迭代次数为10,经过训练之后即可得到词向量模型。
其中,预先建立句向量库,包括:预先计算岗位名称、岗位描述的句向量,并将计算的句向量结果保存在句向量库中,以备进行岗位匹配时调用。由于求职者的意向岗位名称和工作经历无法提前预知,所以无法提前计算,但可以理解的是如果预先计算的岗位名称和岗位描述足够多,足够丰富的话,是有可能包括意向岗位名称和工作经历的。预先计算岗位名称的句向量,包括:
将岗位名称划分为至少两个候选分词;
在预先建立的词向量模型中,查询是否包括所有的候选分词;
若可以查询到,则调用词向量模型中保存的所述候选分词的词向量,如无法查询到,则词向量为0;
根据所有候选分词的词向量,计算岗位名称的句向量。例如可以将每个分词的词向量相加求和,将相加得到的和除以候选分词的个数得到平均值,将平均值作为岗位名称的句向量。
预先计算岗位描述的句向量,与预先计算岗位名称的句向量步骤相同,此处不再赘述。
其中,确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值,具体包括:
第一步:根据所述候选岗位名称和所述意向岗位名称的关联特征,将所述原始候选岗位集分类为至少一个候选岗位子集。
第一候选岗位子集:若意向岗位名称与原始候选岗位集中的候选岗位名称之间的编辑距离小于或等于1,或者意向岗位名称的分词字符串被候选岗位名称的字符串所包含,将该候选岗位添加至第一候选岗位子集N1中。这种情况下,通常求职者的意向岗位指代不够具体,设置条件较为宽松,例如求职者的意向岗位为销售,候选岗位为房产销售,电商销售等,销售被房产销售或电商销售所包含。
当所述候选岗位名称不符合第一候选岗位子集的要求时,将所述意向岗位名称划分为至少两个分词,和/或将所述候选岗位名称划分为至少两个分词,即只要意向岗位名称或者候选岗位名称中的任意一个可以划分为至少两个分词,另一可以是一个整体,不需要划分为分词(或者理解为划分为一个分词),或者另一个也可以划分为至少两个分词。例如求职意向岗位名称为电子厂质检员,首词分词为电子厂,结尾分词为质检员,候选岗位名称为质检员(是一个整体)。例如求职意向岗位名称为房产销售可以包括房产和销售两个分词,房产为首词分词,销售为结尾分词,候选岗位名称为楼盘销售,可以包括楼盘和销售两个分词,楼盘为首词分词,销售为结尾分词。
第二候选岗位子集:当所述意向岗位名称与所述候选岗位名称具有相同的首词分词,且所述意向岗位名称的首词分词不是所述候选岗位名称的结尾分词,将所述候选岗位添加至第二候选岗位子集N2。这种情况下,意向岗位指向比较直接明确,例如意向岗位为JAVA开发工程师,首词分词为JAVA,结尾分词是工程师,候选岗位包括JAVA软件开发工程师,首词分词为JAVA,结尾分词是工程师。通常具有相同首词的候选岗位与意向岗位关联性较强。
第三候选岗位子集:当所述意向岗位名称与所述候选岗位名称之间存在相同的分词,但所述相同的分词不是所述意向岗位名称和所述候选岗位名称的首词分词,将所述候选岗位添加至第三候选岗位子集N3。这种情况下,候选岗位与意向岗位虽然存在相同的分词,但关联性较差。如意向岗位为PYTHON开发工程师,首词分词为PYTHON,结尾分词是工程师,候选岗位为JAVA开发工程师首词分词为JAVA,结尾分词是工程师,候选岗位为WEB开发工程师,首词分词为WEB,结尾分词是工程师等,它们之间存在相同的分词“工程师”,且“工程师”不是首词分词。例如求职意向岗位名称为电子厂质检员,首词分词为电子厂,结尾分词为质检员,候选岗位名称为质检员,它们之间存在相同的分词“质检员”,且“质检员”不是意向岗位名称的首词分词。
第四候选岗位子集:如果候选岗位名称均不满足第一候选岗位子集、第二候选岗位子集或者第三候选岗位子集的筛选条件,即候选岗位名称与意向岗位名称之间不存在任何相同的分词,则添加至第四候选岗位子集N4中。这种情况下,候选岗位名称与意向岗位名称之间无明显的规律可循,可以进一步通过其他手段,例如语义相似度计算确定是否推荐。例如意向岗位为会计,候选岗位为销售、运营、软件开发等。
第二步:基于所述候选岗位子集,确定所述第一相似度分值。
对于第一候选岗位子集N1,由于候选岗位名称包含意向岗位名称,仅从岗位名称角度考虑,该候选岗位符合求职者的意向岗位需求可直接推送,可设定候选岗位的第一相似度分值Simtitle为预设分值,所述预设分值可以设定为比较高的分值,例如满分100分或10分等,具体根据实际情况确定。
当所述候选岗位属于所述第二候选岗位子集、所述第三候选岗位子集或者所述第四候选岗位子集时,根据语义相似度确定所述第一相似度分值。
例如所述候选岗位属于第二候选岗位集N2或者第四候选岗位集N4,根据语义相似度计算确定所述第一相似度分值,包括:确定所述意向岗位名称的句向量Vm,记为第一句向量;
确定所述候选岗位名称的句向量Vn,记为第二句向量;
确定所述第一句向量与所述第二句向量的第一余弦相似度;
将所述第一余弦相似度作为所述第一相似度分值。
公式化表达如下:
Figure 730261DEST_PATH_IMAGE006
在一个实施例中,还可以将所述余弦相似度转换为百分制。
其中,确定所述候选岗位名称的句向量,包括:
在预先建立的句向量库中,查询是否包括候选岗位名称;
若可以查询到,则调用句向量库中保存的候选岗位名称的句向量,如无法查询到,则对所述候选岗位名称划分为至少两个分词,为了区别于意向岗位名称划分的分词,本申请实施例中将称为候选分词;
在预先建立的词向量模型中,查询是否包括所有的候选分词;
若可以查询到,则调用词向量模型中保存的所述候选分词的词向量,如无法查询到,则词向量为0;
根据所有候选分词的词向量,计算候选岗位名称的句向量。例如可以将每个候选分词的词向量相加求和,将相加得到的和除以候选分词的个数得到平均值,将平均值作为候选岗位名称的句向量。
其中,确定意向岗位名称的句向量,与确定所述候选岗位名称的句向量的步骤相同,包括:
在预先建立的句向量库中,查询是否包括意向岗位名称;
若可以查询到,则调用词向句向量库中保存的意向岗位名称的句向量,如无法查询到,则对所述意向岗位名称划分为至少两个分词,为了区别于候选岗位名称划分的分词,本申请实施例中称为意向分词;
在预先建立的词向量模型中,查询是否包括所有意向分词;
若可以查询到,则调用词向量模型中保存的所述意向分词的词向量,如无法查询到,则意向分词的词向量为0;
根据所有意向分词的词向量,计算意向岗位名称的句向量。例如可以将每个意向分词 的词向量相加求和,将相加得到的和除以候选分词的个数得到平均值,将平均值作为意向 岗位名称的句向量。如房产销售分词为房产和销售,假定其对应词向量为V1和V2,那么房产 销售这一句向量可表示为
Figure 466136DEST_PATH_IMAGE007
其中,第二候选岗位集N2中候选岗位名称与意向岗位名称之间存在着相同的分词,因此第二候选岗位集中的岗位名称相似度SimTitle值一般较大,其候选岗位一般也能够得到推荐。
所述候选岗位属于第三候选岗位集N3,需要先去除意向岗位名称与候选岗位名称之间的相同的分词。因为这部分相同的分词对于岗位推荐并无参考作用,相反会因该公共词串的存在提高两个本无推荐价值岗位之间的语义相似度。例如意向岗位为PYTHON开发工程师,候选岗位为JAVA开发工程师,它们之间存在相同的分词“开发”和“工程师”,则需要先去除相同的分词“开发”和“工程师”,PYTHON更新为意向岗位名称,JAVA更新为候选岗位名称。然后再根据更新后的候选岗位名称与意向岗位名称,计算第一相似度分值,具体过程如前所述的当所述候选岗位属于所述第二候选岗位子集、所述第三候选岗位子集或者所述第四候选岗位子集时的计算步骤,同样包括:
确定所述候选岗位名称的句向量,记为第一句向量;
确定所述意向岗位名称的句向量,记为第二句向量;
确定所述第一句向量与所述第二句向量的第一余弦相似度;
将所述第一余弦相似度作为所述第一相似度分值。
具体过程,此处不再赘述。
本申请实施例通过词向量模型和句向量库向量化岗位名称等文本内容,进一步计算第一相似度分值,有利于挑选出与意向岗位匹配度高的候选岗位。其中句向量的计算可以实时计算,也可以预先计算,需要时直接调用结果,从而降低了计算复杂度,提高计算效率。
第二种:确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值,具体包括:
确定所述候选岗位描述的句向量,记为第三句向量;
确定所述工作经历的句向量记为第四句向量;
确定所述第三句向量与所述第四句向量的第二余弦相似度;
将所述第二余弦相似度作为所述第二相似度分值。
Figure 133877DEST_PATH_IMAGE008
具体计算过程与前述计算岗位名称的第一相似度分值相同,此处不再赘述。
然后,根据所述第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。
其中,确定岗位描述、工作经历的句向量,与前述的确定所述候选岗位名称的句向量的步骤相同,此处不再赘述。
本申请实施例通过词向量模型和句向量库向量化岗位描述和工作经历等文本内容,进一步计算第二相似度分值,有利于挑选出与意向岗位匹配度高的候选岗位。其中句向量的计算可以实时计算,也可以预先计算,需要时直接调用结果,从而降低了计算复杂度,提高计算效率。
第三种:确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值;
确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值;
根据所述第一相似度分值和第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。
在本申请实施例中结合根据岗位名称确定的第一相似度分值和根据岗位描述确定的第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值,有利于挑选出与意向岗位匹配度高的候选岗位。
步骤S104:根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
设定第一相似度分值权重为a,第二相似度分值权重为b,依据以上权重进行加权计算,得到最终的求职意向岗位与候选岗位间的相似度SimJob,公式化表达如下:
Figure 520865DEST_PATH_IMAGE009
在实际应用中,如果更加关注岗位名称间的相似度,则在设定权重的过程中a大于b,如果更加关注岗位描述与工作经历的相似度,则在设定权重的过程中b大于a。
在一个实施例中,若SimJob大于指定的阈值,例如大于80分,则确定为待推荐岗位,对待推荐岗位集按照相似度得分排序推荐给所述用户。
本申请实施例通过考虑求职意向信息中的非结构化特征,确定每个候选岗位与所述意向岗位之间的总相似度分值,将符合预设条件的总相似度分值对应的候选岗位推送给用户,从而提升了岗位推荐的精准性,提升了求职者体验,增强用户黏性。同时,本申请实施例无需借助用户行为数据的接入,例如用户浏览过哪些招聘岗位,与哪些HR进行了咨询等,有效避免了冷启动问题。
需要说明的是,本领域技术人员在本发明揭露的技术范围内,可容易想到的其他排序方案也应在本发明的保护范围之内,在此不一一赘述。
参见图2,是本申请实施例提供的一种岗位推荐平台示意图,为了便于说明,仅示出了与本申请实施例相关的部分,包括:
获取模块21,用于获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
初筛模块22,用于根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;
相似度确定模块23,用于根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;
岗位推荐模块24,用于根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
其中,相似度确定模块23,还用于确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值,和/或,确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值;根据所述第一相似度分值和/或第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述移动终端的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述移动终端中模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图3是本申请实施例提供的服务器的示意图。如图3所示,该实施例的服务器3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32。所述处理器30执行所述计算机程序32时实现上述岗位推荐方法的步骤,例如图1所示的步骤101至104。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块21至24的功能。
示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述服务器3中的执行过程。
所述服务器可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是服务器3的示例,并不构成对服务器3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述服务器3的内部存储单元,例如服务器3的硬盘或内存。所述存储器31也可以是所述服务器3的外部存储设备,例如所述服务器3上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述服务器3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的推荐平台/服务器和方法,可以通过其它的方式实现。例如,以上所描述的推荐平台/服务器实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种岗位推荐方法,其特征在于,包括:
获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;
根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;
根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
2.如权利要求1所述的岗位推荐方法,其特征在于,根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值,包括:
确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值,和/或,确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值;
根据所述第一相似度分值和/或第二相似度分值,确定每个所述候选岗位与所述意向岗位之间的总相似度分值。
3.如权利要求2所述的岗位推荐方法,其特征在于,确定每个所述候选岗位的候选岗位名称与所述意向岗位名称的第一相似度分值,包括:
根据所述候选岗位名称和所述意向岗位名称的关联特征,将所述原始候选岗位集分类为至少一个候选岗位子集;
基于所述候选岗位子集,确定所述第一相似度分值。
4.如权利要求3所述的岗位推荐方法,其特征在于,根据所述候选岗位名称和所述意向岗位名称的关联特征,将所述原始候选岗位集分类为至少一个候选岗位子集,包括:
当所述意向岗位名称与所述候选岗位名称之间的编辑距离小于或等于1,将所述候选岗位添加至第一候选岗位子集;
所述意向岗位名称的分词字符串被所述候选岗位名称的字符串所包含,将所述候选岗位添加至第一候选岗位子集;
当所述候选岗位名称不符合第一候选岗位子集的要求时,将所述意向岗位名称划分为至少两个分词,和/或将所述候选岗位名称划分为至少两个分词;
当所述意向岗位名称与所述候选岗位名称具有相同的首词分词,且所述意向岗位名称的首词分词不是所述候选岗位名称的结尾分词,将所述候选岗位添加至第二候选岗位子集;当所述意向岗位名称与所述候选岗位名称之间存在相同的分词,但所述相同的分词不是所述意向岗位名称和所述候选岗位名称的首词分词,将所述候选岗位添加至第三候选岗位子集;当所述意向岗位名称与所述候选岗位名称之间不存在任何相同的分词,将所述候选岗位添加至第四候选岗位子集。
5.如权利要求4所述的岗位推荐方法,其特征在于,基于所述候选岗位子集,确定所述第一相似度分值,包括:
当所述候选岗位属于所述第一候选岗位子集时,所述候选岗位的第一相似度分值为预设分值;
当所述候选岗位属于所述第二候选岗位子集、所述第三候选岗位子集或者所述第四候选岗位子集时,根据语义相似度确定所述第一相似度分值。
6.如权利要求5所述的岗位推荐方法,其特征在于,当所述候选岗位属于所述第二候选岗位子集、所述第三候选岗位子集或者所述第四候选岗位子集时,根据语义相似度确定所述第一相似度分值,包括:
确定所述候选岗位名称的句向量,记为第一句向量,其中,当所述候选岗位属于所述第三候选岗位子集时,去除所述候选岗位名称中的相同的分词后更新为候选岗位名称;
确定所述意向岗位名称的句向量,记为第二句向量,其中,当所述候选岗位属于所述第三候选岗位子集时,去除所述意向岗位名称中的相同的分词后更新为意向岗位名称;
确定所述第一句向量与所述第二句向量的第一余弦相似度;
将所述第一余弦相似度作为所述第一相似度分值。
7.如权利要求2所述的岗位推荐方法,其特征在于,确定每个所述候选岗位的候选岗位描述与所述工作经历的第二相似度分值,包括:
确定所述候选岗位描述的句向量,记为第三句向量;
确定所述工作经历的句向量记为第四句向量;
确定所述第三句向量与所述第四句向量的第二余弦相似度;
将所述第二余弦相似度作为所述第二相似度分值。
8.如权利要求1所述的岗位推荐方法,其特征在于,根据所述结构化特征信息确定原始候选岗位集,包括:
计算所述结构化特征信息与数据库中招聘岗位的定量特征匹配度;
计算所述结构化特征信息与数据库中招聘岗位的定性特征匹配度;
根据所述定量特征匹配度和所述定性特征匹配度,确定所述招聘岗位与所述结构化特征信息的匹配度;
将符合预设匹配度要求的招聘岗位划分至原始候选岗位集。
9.一种岗位推荐平台,其特征在于,包括:
获取模块,用于获取用户的求职意向信息,所述求职意向信息包括结构化特征信息和非结构化特征信息,所述非结构化特征信息包括意向岗位名称和/或工作经历;
初筛模块,用于根据所述结构化特征信息确定原始候选岗位集,所述原始候选岗位集包括至少一个候选岗位;
相似度确定模块,用于根据所述非结构化特征信息,确定每个所述候选岗位与所述求职意向信息中的意向岗位之间的总相似度分值;
岗位推荐模块,用于根据所述总相似度分值从所述候选岗位中确定待推荐岗位,并将所述待推荐岗位推荐给所述用户。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的岗位推荐方法。
CN202011394024.1A 2020-12-03 2020-12-03 岗位推荐方法、推荐平台及服务器 Active CN112199602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011394024.1A CN112199602B (zh) 2020-12-03 2020-12-03 岗位推荐方法、推荐平台及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011394024.1A CN112199602B (zh) 2020-12-03 2020-12-03 岗位推荐方法、推荐平台及服务器

Publications (2)

Publication Number Publication Date
CN112199602A true CN112199602A (zh) 2021-01-08
CN112199602B CN112199602B (zh) 2021-05-11

Family

ID=74033688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011394024.1A Active CN112199602B (zh) 2020-12-03 2020-12-03 岗位推荐方法、推荐平台及服务器

Country Status (1)

Country Link
CN (1) CN112199602B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609264A (zh) * 2021-06-28 2021-11-05 国网北京市电力公司 电力系统节点的数据查询方法、装置
CN113626696A (zh) * 2021-08-06 2021-11-09 湖南慧泽生物医药科技有限公司 临床招募项目推荐平台的项目推荐方法
CN115309998A (zh) * 2022-10-11 2022-11-08 中教智网(北京)信息技术有限公司 一种基于大数据的就业推荐方法及系统
CN117314381A (zh) * 2023-11-29 2023-12-29 山东杰出人才发展集团有限公司 一种基于智能数据分析的人岗匹配系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105159962A (zh) * 2015-08-21 2015-12-16 北京全聘致远科技有限公司 职位推荐方法与装置、简历推荐方法与装置、招聘平台
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
US20180181916A1 (en) * 2013-10-30 2018-06-28 Chegg, Inc. Correlating jobs with personalized learning activities in online education platforms
CN110377702A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种简历信息匹配方法及装置
CN111798214A (zh) * 2020-07-10 2020-10-20 河北冀联人力资源服务集团有限公司 职位技能标签生成系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180181916A1 (en) * 2013-10-30 2018-06-28 Chegg, Inc. Correlating jobs with personalized learning activities in online education platforms
CN105159962A (zh) * 2015-08-21 2015-12-16 北京全聘致远科技有限公司 职位推荐方法与装置、简历推荐方法与装置、招聘平台
CN107590133A (zh) * 2017-10-24 2018-01-16 武汉理工大学 基于语义的招聘职位与求职简历匹配的方法及系统
CN110377702A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种简历信息匹配方法及装置
CN111798214A (zh) * 2020-07-10 2020-10-20 河北冀联人力资源服务集团有限公司 职位技能标签生成系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609264A (zh) * 2021-06-28 2021-11-05 国网北京市电力公司 电力系统节点的数据查询方法、装置
CN113609264B (zh) * 2021-06-28 2022-09-02 国网北京市电力公司 电力系统节点的数据查询方法、装置
CN113626696A (zh) * 2021-08-06 2021-11-09 湖南慧泽生物医药科技有限公司 临床招募项目推荐平台的项目推荐方法
CN115309998A (zh) * 2022-10-11 2022-11-08 中教智网(北京)信息技术有限公司 一种基于大数据的就业推荐方法及系统
CN117314381A (zh) * 2023-11-29 2023-12-29 山东杰出人才发展集团有限公司 一种基于智能数据分析的人岗匹配系统

Also Published As

Publication number Publication date
CN112199602B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
CN112199602B (zh) 岗位推荐方法、推荐平台及服务器
CN111144723B (zh) 人岗匹配推荐方法及系统、存储介质
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN108073568B (zh) 关键词提取方法和装置
CN104750798B (zh) 一种应用程序的推荐方法和装置
CN109189990B (zh) 一种搜索词的生成方法、装置及电子设备
CN111105209A (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
CN109472022B (zh) 基于机器学习的新词识别方法及终端设备
CN110688452B (zh) 一种文本语义相似度评估方法、系统、介质和设备
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN110955766A (zh) 一种自动扩充智能客服标准问题对的方法和系统
CN112084435A (zh) 搜索排序模型训练方法及装置、搜索排序方法及装置
CN112380421A (zh) 简历的搜索方法、装置、电子设备及计算机存储介质
CN116109373A (zh) 金融产品的推荐方法、装置、电子设备和介质
CN115098556A (zh) 用户需求匹配方法、装置、电子设备及存储介质
CN113656575B (zh) 训练数据的生成方法、装置、电子设备及可读介质
CN113688633A (zh) 一种提纲确定方法及装置
CN114742062B (zh) 文本关键词提取处理方法及系统
CN112163415A (zh) 针对反馈内容的用户意图识别方法、装置及电子设备
CN110837732A (zh) 目标人物间亲密度识别方法、装置、电子设备及存储介质
CN108733702B (zh) 用户查询上下位关系提取的方法、装置、电子设备和介质
CN115358817A (zh) 基于社交数据的智能产品推荐方法、装置、设备及介质
CN112579774B (zh) 模型训练方法、模型训练装置及终端设备
CN112183069B (zh) 一种基于历史关键词投放数据的关键词构建方法及系统
CN114065763A (zh) 一种基于事件抽取的舆情分析方法、装置及相关组件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant