CN114090877A - 职位信息推荐方法、装置、电子设备及存储介质 - Google Patents

职位信息推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114090877A
CN114090877A CN202111294996.8A CN202111294996A CN114090877A CN 114090877 A CN114090877 A CN 114090877A CN 202111294996 A CN202111294996 A CN 202111294996A CN 114090877 A CN114090877 A CN 114090877A
Authority
CN
China
Prior art keywords
position information
search
user
candidate
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111294996.8A
Other languages
English (en)
Inventor
王越
谢万鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Taou Science & Technology Development Co ltd
Original Assignee
Beijing Taou Science & Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Taou Science & Technology Development Co ltd filed Critical Beijing Taou Science & Technology Development Co ltd
Priority to CN202111294996.8A priority Critical patent/CN114090877A/zh
Publication of CN114090877A publication Critical patent/CN114090877A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种职位信息推荐方法,涉及信息推荐技术领域。该方法包括:响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。本申请实施例能够判断当前使用搜索功能进行搜索的用户是否具备求职意图,若当前用户具备求职意图,则为用户展示符合其求职意图的推荐职位信息。

Description

职位信息推荐方法、装置、电子设备及存储介质
技术领域
本申请涉及信息推荐技术领域,具体而言,本申请涉及一种职位信息推荐方法、装置、电子设备及存储介质。
背景技术
招聘类APP的一个重要功能是满足用户的求职需求。
通常有明确求职意图的用户,会通过招聘类APP的职位搜索功能搜索感兴趣的职位。但通过职位搜索进行求职存在两个问题:
用户与有价值岗位的连接较为低效。用户往往无法快速提供对其更有价值的搜索词,用户若要和对其更有价值的岗位进行连接,依赖其进行主动的多次查询,这在连接用户和有价值的岗位上是非常低效的。
有价值岗位无法触达部分潜在求职用户。除了主动使用职位搜索功能的用户,还存在大量仅有潜在求职意向的用户,这些用户通过招聘类APP内的行业交流、薪资交流等途径,已有了潜在的求职意向,但未主动使用职位搜索功能,导致其无法快速连接到有价值的岗位。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的职位信息推荐方法、装置、电子设备及存储介质。
第一方面,提供了一种职位信息推荐方法,该方法包括:
响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
在一个可能的实现方式中,所述若根据第二搜索词和用户特征确定用户具备求职意图,包括:
将所述第二搜索词和用户特征输入至预先训练的意图预测模型中,获得所述意图预测模型输出的意图预测结果;
所述意图预测模型是以样本用户的第二搜索词和用户特征作为训练样本,以所述样本用户是否具备求职意图作为训练标签训练而成;
所述意图预测结果用于表征当前所述用户是否具备求职意图。
在一个可能的实现方式中,所述职位信息推荐方法还包括:
若确定所述搜索操作的搜索类型为职位搜索类型,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;和/或
若确定所述第一搜索词包括与职位相关的词汇,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息。
在一个可能的实现方式中,所述展示根据所述第二搜索词和/或用户特征确定的推荐职位信息,包括:
确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键;
在预先构建的键值对集合中搜索目标键,获得与所述目标键对应的职位信息,将所述职位信息作为候选职位信息;
基于所述候选职位信息,确定所述推荐职位信息;
其中,所述键值对集合中的每一个键值对的键为职位关键词信息,值为包括所述职位关键词信息的职位信息。
在一个可能的实现方式中,所述确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键,包括:
将所述第二搜索词中的职位关键词信息作为第一候选键;
将所述用户特征中历史职位信息对应的职位关键词信息作为第二候选键;
获取各预设职位信息与所述第一候选键和/或第二候选键的共现频率;
将所述共现频率大于预设阈值的各预设职位信息中的职位关键词信息作为第三候选键;
将所述第一候选键、第二候选键和第三候选键作为所述目标键。
在一个可能的实现方式中,所述基于所述候选职位信息,确定所述推荐职位信息,包括:
将所述候选职位信息、第二搜索词和用户特征输入至预先训练的过滤模型中,获得所述过滤模型输出的判断结果;
所述过滤模型是以样本用户的用户特征、第二搜索词和预设职位信息作为训练样本,以所述样本用户的用户特征和第二搜索词与所述预设职位信息是否相关作为训练标签训练而成;
所述判断结果用于表征当前输入的候选职位信息是否与所述用户特征和第二搜索词相关;
若所述当前输入的候选职位信息与所述用户特征和第二搜索词相关,将所述当前输入的候选职位信息作为过滤后的候选职位信息;
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设点击率模型,获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值;
根据所述第一概率值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息。
在一个可能的实现方式中,所述获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值,之后还包括:
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设投递率模型,获得所述预设投递率模型输出的,用于表征用户向推荐职位信息投递简历的第二概率值;
将所述第一概率值与所述第二概率值的乘积结果,作为排序值;
根据所述排序值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息。
第二方面,提供了一种职位信息推荐装置,包括:
展示单元,用于响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
第五方面,本发明实施例提供一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行实现如第一方面所提供的方法的步骤。
本发明实施例提供的职位信息推荐方法、装置、电子设备及存储介质,能够判断当前使用搜索功能进行搜索的用户是否具备求职意图,若当前用户具备求职意图,则为用户展示符合其求职意图的推荐职位信息,包括职位搜索及非职位搜索的搜索行为的搜索结果中进行职位推荐,令有价值的岗位更高效的匹配到更多的具有求职意向的用户,更好的满足用户的求职需求。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种职位信息推荐方法的流程示意图;
图2为本申请实施例提供的一种职位候选集的构造逻辑的示意图;
图3为本申请实施例提供的一种职位信息推荐系统的流程示意图;
图4为本申请实施例提供的一种职位信息推荐装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在现有的招聘类APP中,通常有明确求职意图的用户,会通过招聘类APP中的职位搜索功能搜索感兴趣的职位。但通过职位搜索进行求职存在两个问题:
1、用户与有价值岗位的连接较低效。用户往往无法快速提供对其更有价值的搜索词,如现职位是“后端工程师”的用户,在求职时的前几次搜索查询词往往是“后端开发”、“Java后端”等相关查询词。由于搜索功能主要根据搜索词和职位的相关度进行排序,因此“高级中台工程师”、“后台系统架构师”、“基础架构开发”等其他对用户潜在价值职位因和搜索词相关性差,无法在靠前的位置向用户进行展示。用户若要和这些对其更有价值的岗位进行连接,依赖其进行主动的多次查询,这在连接用户和有价值的岗位上是非常低效的。
2、有价值岗位无法触达部分潜在求职用户。除了主动使用职位搜索功能的用户,还存在大量仅有潜在求职意向的用户,这些用户通过站内的行业交流、薪资交流等途径,已有了潜在的求职意向,但未主动使用职位搜索功能,导致无法快速连接到有价值的岗位。如某用户搜索了“公司A福利”时,若识别出该用户拥有潜在求职意图,一个直观的有价值方案是在此时为用户推荐公司A相关的职位。
本申请提供的职位信息推荐方法、装置、电子设备和计算机可读存储介质,旨在解决现有技术中存在的技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决现有技术中存在的技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1是本申请实施例提供的一种职位信息推荐方法的流程图,如图1所示,该方法可以包括:
S101、智能终端的显示页面上显示有一搜索框,所述搜索框用于输入搜索词;
S102、响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
在本申请的实施例中,当前智能终端的显示页面显示有搜索框,用户在搜索框中输入第一搜索词并触发搜索操作后,显示基于第一搜索词进行搜索后的相应页面,若基于第二搜索词和用户特征确定用户具备求职意图,则展示根据第二搜索词和/或者用户特征确定出的推荐职位信息。
其中,用户具备求职意图可以是用户期望找到合适自己的工作。第二搜索词可以是当前用户输入的搜索词,也可以是智能终端或者服务端存储的用户的历史搜索词,还可以是用户在某一时间段内连续进行搜索产生的搜索词序列,例如:用户在10分钟内在搜索框中分别输入了“阿里”、“腾讯”、“字节”和“销售”的搜索词,以这些搜索词构成一个搜索序列[“阿里”,“腾讯”,“字节”,“销售”],并将该搜索序列作为第二搜索词。
用户特征可以是用户的属性特征信息,例如:用户的ID信息、用户的行业方向、公司、年龄、当前的职位信息、历史的职位信息等,也可以是用户的行为特征信息,例如:用户近期的活跃页面和用户点击的动态中包含的关键词等,还可以是用户的统计特征信息,例如:在一定时间段内登录某一应用程序的次数,以及活跃时长等。
既可以是展示根据第二搜索词和用户特征共同确定出的推荐职位信息,也可是根据第二搜索词或者用户特征中的某一类信息确定出的推荐职位信息。
所述推荐职位信息的展示位置,本申请不做具体限定,只要使得用户能够看到该推荐职位信息且不影响用户的整体操作体验即可。
具体的,所述若根据第二搜索词和用户特征确定用户具备求职意图,可以包括:
将所述第二搜索词和用户特征输入至预先训练的意图预测模型中,获得所述意图预测模型输出的意图预测结果;
在本申请的实施例中,所述意图预测模型可以是二分类模型,而该二分类模型可以为逻辑回归分类模型,支持向量机分类模型或深度神经网络分类模型等中的任意一种,并且本发明的实施方式并不限于上述意图预测模型对应的二分类模型形式,采用其他二分类预测模型不影响实现本发明的发明目的。
将用户的第二搜索词也即历史搜索词或是某一时间段内用户连续进行搜索产生的搜索词序列,以及包括用户属性特征、用户行为特征、用户统计特征在内的用户特征信息输入至预先训练好的意图预测模型中。
所述意图预测模型是以样本用户的第二搜索词和用户特征作为训练样本,以所述样本用户是否具备求职意图作为训练标签训练而成;
所述意图预测结果用于表征当前所述用户是否具备求职意图。
在本申请的实施例中,以多个样本用户的第二搜索词信息和用户对应的用户特征信息作为训练样本,训练意图预测模型。
在获取多个样本用户的第二搜索词的信息和用户特征的信息后,还需要获取多个样本用户的某一时间段内的历史操作行为数据,例如:可以获取多个样本用户的至少180天内的历史操作行为数据。若用户的历史操作行为数据中包括:输入的搜索词指向具体职位、搜索操作的搜索类型为职位搜索类型、主动向猎头发送消息等行为,且样本用户的此种历史操作行为多次出现,则定义为此种样本用户为正样本表明该用户具备求职意图即该用户希望找到合适的工作,反之,定义为负样本,表明该用户不具备求职意图即该用户的求职欲望较低。
进一步的,本申请的职位信息推荐方法,还可以包括:
若确定所述搜索操作的搜索类型为职位搜索类型,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
在本申请的实施例中,用户的搜索操作的搜索类型可以有多种,包括综合类的搜索类型和职位搜索类型等,若当前用户的搜索操作类型是职位搜索类型时,则表明当前用户期望找到合适的工作,具备求职意图。若在确定用户具备求职意图时,则展示根据第二搜索词和/或用户特征确定的推荐职位信息。
在上述各实施例的基础上,作为一种可选的实施例,用户还未针对搜索词进行搜索操作时,即用户首次使用该搜索框进行搜索操作,显示界面显示有搜索框。此时用户使用该搜索框进行搜索时会默认为综合类的搜索类型,并显示和当前用户搜索词相关的综合类搜索页面,用户可以选择将当前的综合类搜索页面进行转换,例如:可以将当前的综合类搜索页面转换为职位搜索页面。若当前终端的显示页面为职位搜索页面,而用户使用显示页面上的搜索框进行搜索操作时,此时该搜索操作类型为职位搜索类型,也即默认当前用户具备了求职意图,则展示根据第二搜索词和/或用户特征确定的推荐职位信息。
和/或若确定所述第一搜索词包括与职位相关的词汇,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息。
在本申请的实施例中,若用户输入的第一搜索词包含了于职位相关的词汇,并基于第一搜索词进行了搜索,表明用户期望找到合适的工作,具备求职意图。例如:用户当前输入了“后端研发的薪资”,其包含了“后端研发”这一与职位相关的词汇,同时基于该搜索词触发了搜索操作,则表明用户期望搜索到与该搜索词相关的信息,间接表明用户期望找到和后端研发相关的工作,表明用户具备求职意图。若确定用户具备求职意图后,展示根据第二搜索词和/或用户特征确定的推荐职位信息
具体的,展示根据所述第二搜索词和/或用户特征确定的推荐职位信息,可以包括:
确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键;
在预先构建的键值对集合中搜索目标键,获得与所述目标键对应的职位信息,将所述职位信息作为候选职位信息;
其中,所述键值对集合中的每一个键值对的键为职位关键词信息,值为包括所述职位关键词信息的职位信息。
在本申请的实施例中,如图2所示,需要服务端预先构建一个离线候选集,所述离线候选集可以是多个键值对的集合。其中每一个键值对的键为职位关键词信息,例如:数据开发、产品经理、大数据架构等。以包含职位关键词信息的职位信息为值,例如:以产品经理为键,其对应的值为:高级产品经理、导航算法产品经理或海外产品管理。
不同的键对应的值不同,同一个键可以对应多个职位信息,同时可以对每一个键对应的多个职位信息进行预排序,排序依据可以是职位信息发布的时间、职位信息的发布的数量或是职位信息的简历回复速度。并将上述离线候选集对应的键值对集合存储于相应的存储系统中,例如:pika。
在构建上述离线候选集,并将其存储至相应位置后,需要基于第二搜索词和/或用户特征确定出目标键,并在离线候选集对应的键值对集合中搜索到与目标键对应的职位信息,将搜索到的职位信息作为候选职位信息。
基于所述候选职位信息,确定所述推荐职位信息;
在本申请的实施例中,由于获得候选职位信息的数量过于庞大,不能直接作为推荐职位信息进行展示,需要对其进行处理,才能得到并展示推荐职位信息。
在上述各实施例的基础上,作为一种可选的实施例,本申请预先构建了双塔模型,并在离线阶段,利用双塔模型对底层数据库中的海量职位信息进行处理,得到职位信息的embedding向量,并将海量职位信息的embedding向量存储至ANN检索系统,例如:Faiss,并构建向量邻近索引服务;在在线阶段,利用双塔模型获取用户最新的用户特征对应的embedding向量,并基于用户特征的embedding向量以及海量职位信息的embedding向量结合构建的向量邻近索引服务,获得一定数量的职位信息,并将一定数量的职位信息作为候选职位信息。
在上述实施例的基础上,作为一种可选的实施例,本申请在构建向量邻近索引服务时可以设置可调节的阈值M,例如阈值M为100,则表示在向量邻近索引服务中返回最为邻近的100个职位信息,即基于该方案获得的候选职位信息中包括100个职位信息。
具体的,确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键,可以包括:
将所述第二搜索词中的职位关键词信息作为第一候选键;
在本申请的实施例中,将第二搜索词中的职位关键词信息作为第一候选键,而第二搜索词可以包括:第一搜索词、用户历史搜索操作对应的搜索词、用户在某一时间段内用户连续搜索产生的搜索词组成的搜索序列。例如:用户在10分钟内连续输入的搜索词组成的搜索序列为[“销售”,“销售经理”,“大客户经理”,“线上销售”],将其中[“销售经理”,“大客户经理”,“线上销售”]的职位关键信息作为第一候选键。
将所述用户特征中历史职位信息对应的职位关键词信息作为第二候选键;
在本申请的实施例中,获取用户特征中用户的历史职位信息,用户的历史职位信息可以包括用户当前的职位信息。将用户历史职位信息中的职位关键词信息作为第二候选键,例如:用户的当前职位信息为“技术负责人”,而其职业经历中的职位信息构成的职位序列是[“资深算法工程师”,“推荐算法工程师”],将历史职位信息对应的职位序列[“资深算法工程师”,“推荐算法工程师”,“技术负责人”]中的职位关键词信息作为第二候选键。
获取各预设职位信息与所述第一候选键和/或第二候选键的共现频率;
在本申请的实施例中,服务端的底层数据库中的海量职位信息作为各预设职位信息,并获得各预设职位信息与所述第一候选键和/或第二候选键的共现频率,根据共现频率的高低,可以确定出各预设职位信息与第一候选键和/或第二候选键的相关性的高低。
将所述共现频率大于预设阈值的各预设职位信息中的职位关键词信息作为第三候选键;
在本申请的实施例中,若某一预设职位信息与所述第一候选键和/或第二候选键的共现频率大于预设的阈值,则表明该预设职位信息与第一候选键和/或第二候选键的相关性较高,并将该预设职位信息对应的职位关键词信息作为第三候选键。共现频率可以是用户在以第一职位信息作为搜索词进行搜索后,第二职位信息在搜索后的页面上出现的频率,若该频率超过预设阈值,则可表明第二职位信息与第一职位信息的相关性较高。阈值的具体数值本申请对此不作具体限定,只要能表征共现频率在超过该阈值后,预设职位信息与第一候选键和/或第二候选键的相关性较高
在上述实施例的基础上,作为一种可选的实施例,本申请将与第一候选键和/或第二候选键相关性较高的职位信息中的职位关键词信息作为第三候选键,具体如何判断某一职位信息是否与所述第一候选键和/或第二候选键具有高度相关性,本申请对此不做具体限定,只要能表征该职位信息与所述第一候选键和/或第二候选键具有高度相关性即可,例如:可以获取多个用户的历史职位信息对应的历史职位序列,若历史职位序列中存在两个或以上的职位信息同时出现,则可以确定这两个或以上的职位信息具有高度相关性,则可以互相作为第三候选键。
将所述第一候选键、第二候选键和第三候选键作为所述目标键。
在本申请的实施例中,可以将第一候选键、第二候选键和第三候选作为目标键,并在离线候选集中对应的键值对集合中获得与目标键对应的职位信息,并将该职位信息作为候选职位信息。
具体的,所述基于所述候选职位信息,确定所述推荐职位信息,包括:
将所述候选职位信息、第二搜索词和用户特征输入至预先训练的过滤模型中,获得所述过滤模型输出的判断结果;
在本申请的实施例中,由于候选职位信息的数量过大,同时候选职位信息中难免会包含一些对用户体验不好的职位信息,所以需要对所述候选职位信息进行过滤。本申请预设的过滤模型可以是二分类模型,输入的数据可以是<<用户特征,第二搜索关键词>,候选职位信息特征>的数据组合,所述候选职位信息特征可以包括:候选职位信息的职位名称、职位描述、工作年限要求、学历要求、职位亮点、职位薪资、工作地点、发布时间、信息完整度、发布者信息等;用户特征可以包括:用户的id、行业方向、公司、当前职位、历史职位列表、技能标签、年龄、地域、历史公司列表等,第二搜索词可以包括:第二搜索词的文本、第二搜索词中的关键词和第二搜索词中包含的职位信息或公司信息等。
所述过滤模型是以样本用户的用户特征、第二搜索词和预设职位信息作为训练样本,以所述样本用户的用户特征和第二搜索词与所述预设职位信息是否相关作为训练标签训练而成;在本申请的实施例中,所述过滤模型的训练样本可以是样本用户的用户特征、第二搜索词和预设的职位信息,以样本用户的用户特征和第二搜索词与所述预设职位信息相关为正样本,以样本用户的用户特征和第二搜索词与所述预设职位信息不相关为负样本。经由上述训练样本进行迭代训练,得到所述过滤模型。
所述判断结果用于表征当前输入的候选职位信息是否与所述用户特征和第二搜索词相关;
若所述当前输入的候选职位信息与所述用户特征和第二搜索词相关,将所述当前输入的候选职位信息作为过滤后的候选职位信息;
在本申请的实施例中,通过过滤模型获得各个候选职位信息的判断结果,若判断结果是当前输入的候选职位信息与所述用户特征和第二搜索词相关,将所述当前输入的候选职位信息作为过滤后的候选职位信息。
在上述各实施的基础上,作为一种可选的实施例,本申请在对候选职位信息进行过滤时,可以基于多个规则对其进行过滤,例如:过滤候选职位信息中的职位发布公司与用户当前公司一致的候选职位信息或是过滤候选职位信息中涉嫌虚假(如被举报薪资不实)的候选职位信息等,具体的过滤规则,本申请对此不做具体限定,只要能过滤一些对用户或者对职位发布者体验不好的候选职位信息即可。
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设点击率模型,获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值;
在本申请的实施例中,获得所述过滤后的职位信息后,还需对其进行排序,获得序列为较高的职位信息,并将其作为推荐职位信息进行展示。
本申请预设的点击率模型可以是二分类模型,其输入是<<用户特征,第二搜索关键词>,过滤后的候选职位信息>的数据组合。其中,用户的点击行为可以是用户点击查看了推荐职位信息的详情,定义用户浏览但未点击的记录为负样本,用户浏览了且点击查看了职位详情的记录为正样本。经过上述训练样本进行迭代训练可以得到点击率模型,同时在在线环节,实时获取用户最新的用户特征信息,并且以<<用户特征,第二搜索关键词>,过滤后的候选职位信息>的数据组合,输入至点击率模型中。
在本申请的实施例中,基于点击率模型,本申请可以获得用以表征用户浏览且点击推荐职位信息的概率值。对所述每一个过滤后的候选职位信息均可得到对应的概率值,概率值越大,表明用户越会去浏览并点击推荐职位信息,
根据所述第一概率值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息;
在本申请的实施例中,可以将所得的第一概率值的大小作为排序依据对所述过滤后的推荐职位信息进行排序获得一个推荐职位信息的排序列表,并依据场景需求选取排序列表中前n个职位信息,作为推荐职位信息,并展示在相应的显示页面的适当位置上。
进一步的,所述获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值,之后还可以包括:
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设投递率模型,获得所述预设投递率模型输出的,用于表征用户向推荐职位信息投递简历的第二概率值;
在本申请的实施例中,在获得每一个过滤后的候选职位信息对应的点击率模型的概率值后,还可以将<<用户特征,第二搜索关键词>,过滤后的候选职位信息>的数据组合输入至预设的投递率模型中,获得投递率模型的概率值。其中,所述预设的投递率模型可以是二分类模型,投递行为可以是用户向推荐职位信息投递了简历。训练样本数据可以是用户特征、第二搜索关键词和过滤后的候选职位信息,定义用户点击了推荐职位信息且投递了简历的标签为正样本,用户点击了职位推荐信息但未投递简历的标签为负样本。通过上述训练样本的迭代训练,可以得到训练好的投递率模型,通过将<<用户特征,第二搜索关键词>,过滤后的候选职位信息>的数据组合输入至投递率模型中,可以得到表征用户点击推荐职位信息且投递简历的概率值,对所述每一个过滤后的候选职位信息均可得到对应的概率值,所述概率值越大,表征用户点击推荐职位信息且投递简历的概率越大。
将所述第一概率值与所述第二概率值的乘积结果,作为排序值;
根据所述排序值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息。
在本申请的实施例中,本申请可以将点击率模型的概率值作为过滤后的候选职位信息的排序依据也可以将投递率模型的概率值作为过滤后的候选职位信息的排序依据,还可以将两个模型的概率值的乘积作为过滤后的候选职位信息的排序依据。具体将何种概率值作为过滤后的候选职位信息的排序依据,本申请对比不做具体限定,能够符合当前的场景需求即可。
在本申请的实施例中,本申请可以将点击率模型的概率值作为过滤后的候选职位信息的排序依据也可以将投递率模型的概率值作为过滤后的候选职位信息的排序依据,还可以将两个模型的概率值的乘积作为过滤后的候选职位信息的排序依据。具体将何种概率值作为过滤后的候选职位信息的排序依据,本申请对比不做具体限定,能够符合当前的场景需求即可。
在上述各实施例的基础上,作为一种可选的实施例,如图3所示,本申请还设计了一种职位信息推荐系统,该职位信息推荐系统是使用Golang语言实现的gRPC服务,部署于多台Linux服务器,使用Nginx进行服务管理和负载均衡,该职位信息推荐系统可以包括:意图预测201、候选集召回202、候选集过滤203和模型排序204四个子模块。其中意图预测201包括:通过意图预测模型预测用户是否具有求职意图或是通过一定规则判断用户是否具备求职意图;候选集召回202包括:构建离线候选集,并召回候选职位信息,其中召回的形式可以为构建第一、第二目标键,根据第一、第二目标键,搜索与第一、第二目标键对应的职位信息,也可以是构建第三目标键,搜索与第三目标键对应的职位信息;候选集过滤203包括:通过过滤模型获得过滤后的候选职位信息,也可以通过其它方式过滤候选职位信息;模型排序204包括:通过点击率模型和/或投递率模型获得过滤后的候选职位信息对应的概率值,根据概率值的大小顺序对过滤后的候选职位信息进行排列,并选取前n个职位信息作为推荐职位信息进行展示。
在上述各实施的基础上,作为一种可选的实施例,本申请系统中的意图预测模型、过滤模型、点击率模型和投递率模型均使用深度学习技术。在离线环节使用开源深度学习框架(如Tensorflow)进行模型训练,在在线环节通过提供深度模型的在线推理服务,完成相应的模型预估功能。在上述各实施的基础上,作为一种可选的实施例,本申请的用户特征和职位信息可以存储于独立的外部特征查询服务(feature server),在线环节通过调用featureserver,获得用户特征和职位信息。
本申请实施例提供了一种职位信息推荐装置,如图4所示,该装置可以包括:展示单元301,具体地:展示单元301,用于响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
本发明实施例提供的职位信息推荐装置,具体执行上述方法实施例流程,具体请详见上述职位信息推荐方法实施例的内容,在此不再赘述。本发明实施例提供的职位信息推荐装置,通过在包括职位搜索及非职位搜索的搜索行为的搜索结果中进行职位推荐,令有价值的岗位更高效的匹配到更多的具有求职意向的用户,更好的满足用户的求职需求。
本申请实施例中提供了一种电子设备,该电子设备包括:存储器和处理器;至少一个程序,存储于存储器中,用于被处理器执行时,与现有技术相比可实现:在包括职位搜索及非职位搜索的搜索行为的搜索结果中进行职位推荐,令有价值的岗位更高效的匹配到更多的具有求职意向的用户,更好的满足用户的求职需求。
在一个可选实施例中提供了一种电子设备,如图5所示,图5所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscReadOnly Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,通过在包括职位搜索及非职位搜索的搜索行为的搜索结果中进行职位推荐,令有价值的岗位更高效的匹配到更多的具有求职意向的用户,更好的满足用户的求职需求。
本申请实施例提供了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如前述方法实施例所示的内容。与现有技术相比,通过在包括职位搜索及非职位搜索的搜索行为的搜索结果中进行职位推荐,令有价值的岗位更高效的匹配到更多的具有求职意向的用户,更好的满足用户的求职需求。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种职位信息推荐方法,其特征在于,包括:
响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
2.根据权利要求1所述的职位信息推荐方法,其特征在于,所述若根据第二搜索词和用户特征确定用户具备求职意图,包括:
将所述第二搜索词和用户特征输入至预先训练的意图预测模型中,获得所述意图预测模型输出的意图预测结果;
所述意图预测模型是以样本用户的第二搜索词和用户特征作为训练样本,以所述样本用户是否具备求职意图作为训练标签训练而成;
所述意图预测结果用于表征当前所述用户是否具备求职意图。
3.根据权利要求1所述的职位信息推荐方法,其特征在于,所述方法还包括:
若确定所述搜索操作的搜索类型为职位搜索类型,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;和/或
若确定所述第一搜索词包括与职位相关的词汇,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息。
4.根据权利要求1所述的职位信息推荐方法,其特征在于,所述展示根据所述第二搜索词和/或用户特征确定的推荐职位信息,包括:
确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键;
在预先构建的键值对集合中搜索目标键,获得与所述目标键对应的职位信息,将所述职位信息作为候选职位信息;
基于所述候选职位信息,确定所述推荐职位信息;
其中,所述键值对集合中的每一个键值对的键为职位关键词信息,值为包括所述职位关键词信息的职位信息。
5.根据权利要求4所述的职位信息推荐方法,其特征在于,所述确定所述第二搜索词和/或用户特征中的职位关键词信息,将所述职位关键词信息作为目标键,包括:
将所述第二搜索词中的职位关键词信息作为第一候选键;
将所述用户特征中历史职位信息对应的职位关键词信息作为第二候选键;
获取各预设职位信息与所述第一候选键和/或第二候选键的共现频率;
将所述共现频率大于预设阈值的各预设职位信息中的职位关键词信息作为第三候选键;
将所述第一候选键、第二候选键和第三候选键作为所述目标键。
6.根据权利要求4所述的职位信息推荐方法,其特征在于,所述基于所述候选职位信息,确定所述推荐职位信息,包括:
将所述候选职位信息、第二搜索词和用户特征输入至预先训练的过滤模型中,获得所述过滤模型输出的判断结果;
所述过滤模型是以样本用户的用户特征、第二搜索词和预设职位信息作为训练样本,以所述样本用户的用户特征和第二搜索词与所述预设职位信息是否相关作为训练标签训练而成;
所述判断结果用于表征当前输入的候选职位信息是否与所述用户特征和第二搜索词相关;
若所述当前输入的候选职位信息与所述用户特征和第二搜索词相关,将所述当前输入的候选职位信息作为过滤后的候选职位信息;
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设点击率模型,获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值;
根据所述第一概率值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息。
7.根据权利要求6所述的职位信息推荐方法,其特征在于,所述获得所述预设点击率模型输出的,用于表征用户点击推荐职位信息的第一概率值,之后还包括:
将所述过滤后的候选职位信息、用户特征和第二搜索词输入至预设投递率模型,获得所述预设投递率模型输出的,用于表征用户向推荐职位信息投递简历的第二概率值;
将所述第一概率值与所述第二概率值的乘积结果,作为排序值;
根据所述排序值的从大到小的顺序对所述过滤后的候选职位信息进行排序,选取排序后的所述过滤后的候选职位信息中前预设数目个职位信息,将所述前预设数目个职位信息作为推荐职位信息。
8.一种职位信息推荐装置,其特征在于,包括:
展示单元,用于响应于针对第一搜索词的搜索操作,若根据第二搜索词和用户特征确定用户具备求职意图,则展示根据所述第二搜索词和/或用户特征确定的推荐职位信息;
其中,所述第一搜索词不包括与职位相关的词汇,且所述搜索操作的搜索类型不属于职位搜索类型;
所述第二搜索词为所述第一搜索词或者包括所述第一搜索词在内的历史搜索操作对应的搜索词。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述职位信息推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7中任意一项所述职位信息推荐方法的步骤。
CN202111294996.8A 2021-11-03 2021-11-03 职位信息推荐方法、装置、电子设备及存储介质 Pending CN114090877A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111294996.8A CN114090877A (zh) 2021-11-03 2021-11-03 职位信息推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111294996.8A CN114090877A (zh) 2021-11-03 2021-11-03 职位信息推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114090877A true CN114090877A (zh) 2022-02-25

Family

ID=80298782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111294996.8A Pending CN114090877A (zh) 2021-11-03 2021-11-03 职位信息推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114090877A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481220A (zh) * 2022-09-20 2022-12-16 深圳今日人才信息科技有限公司 基于岗位和简历内容的对比学习人岗智能匹配方法及系统
CN117709917A (zh) * 2024-02-05 2024-03-15 芯知科技(江苏)有限公司 用于招聘平台的数据智能处理方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481220A (zh) * 2022-09-20 2022-12-16 深圳今日人才信息科技有限公司 基于岗位和简历内容的对比学习人岗智能匹配方法及系统
CN117709917A (zh) * 2024-02-05 2024-03-15 芯知科技(江苏)有限公司 用于招聘平台的数据智能处理方法及系统
CN117709917B (zh) * 2024-02-05 2024-06-07 芯知科技(江苏)有限公司 用于招聘平台的数据智能处理方法及系统

Similar Documents

Publication Publication Date Title
US11663254B2 (en) System and engine for seeded clustering of news events
CN109271574A (zh) 一种热词推荐方法及装置
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
JP6346218B2 (ja) オンライン取引プラットフォームのための検索方法、装置およびサーバ
CN112508609B (zh) 人群扩量的预测方法、装置、设备及存储介质
WO2011080899A1 (ja) 情報推薦方法
CN111125086B (zh) 获取数据资源的方法、装置、存储介质及处理器
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
CN108205572A (zh) 一种搜索方法、装置及设备
CN114090877A (zh) 职位信息推荐方法、装置、电子设备及存储介质
CA2956627A1 (en) System and engine for seeded clustering of news events
CN111191111A (zh) 内容推荐方法、装置及存储介质
CN111639255A (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备
CN112818230A (zh) 内容推荐方法、装置、电子设备和存储介质
US20200110769A1 (en) Machine learning (ml) based expansion of a data set
US20220050884A1 (en) Utilizing machine learning models to automatically generate a summary or visualization of data
CN113569132A (zh) 一种信息检索展示方法及系统
WO2019056727A1 (zh) 机构名称检索式的显示方法、装置、设备及存储介质
US11922326B2 (en) Data management suggestions from knowledge graph actions
CN116070028A (zh) 基于页面的内容信息推送方法、装置、设备及存储介质
CN113868481A (zh) 组件获取方法、装置及电子设备和存储介质
KR102041915B1 (ko) 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법
CN111222918A (zh) 关键词挖掘方法、装置、电子设备及存储介质
US11687954B2 (en) Linking physical locations and online channels in a database
CN118172138A (zh) 一种用于电子商务的智能推荐系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination