CN109978498B - 任务信息处理方法及装置 - Google Patents
任务信息处理方法及装置 Download PDFInfo
- Publication number
- CN109978498B CN109978498B CN201910200085.0A CN201910200085A CN109978498B CN 109978498 B CN109978498 B CN 109978498B CN 201910200085 A CN201910200085 A CN 201910200085A CN 109978498 B CN109978498 B CN 109978498B
- Authority
- CN
- China
- Prior art keywords
- user
- information
- keyword
- similarity
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开内容涉及一种任务信息处理方法及装置。根据本公开内容的一个实施方式,该方法包括:获取多个目标用户的用户信息,对应每一目标用户的用户信息包括用户基本信息和用户经验信息;根据任务信息和用户基本信息获得用户基本权重值;根据任务信息和用户经验信息获得用户经验权重值;根据用户基本权重值和用户经验权重值计算出每个目标用户的相似度得分;以及按照每一目标用户的相似度得分的大小进行排序并输出目标用户列表。本公开内容的方法及装置至少具有以下有益技术效果之一:综合考虑用户基本权重值和用户经验权重值,使得输出的目标用户列表与企业需求具有较佳的匹配性。
Description
技术领域
本公开内容涉及互联网技术,具体地,涉及一种任务信息处理方法及装置。
背景技术
随着互联网技术的发展,越来越多的互联网产品给人们的工作和生活带来极大的变化,比如招聘领域。现有的招聘系统在向企业推荐目标用户时,未能综合考虑不同企业对目标用户信息的关注点的不同,导致招聘系统推荐的目标用户无法满足企业的需求。
发明内容
在下文中将给出关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,此概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本公开内容的第一方面,提供了一种任务信息处理方法,包括:
获取多个目标用户的用户信息,对应每一目标用户的用户信息包括用户基本信息和用户经验信息;
根据任务信息和用户基本信息获得用户基本权重值;
根据任务信息和用户经验信息获得用户经验权重值;
根据用户基本权重值和用户经验权重值计算出每个目标用户的相似度得分;以及
按照每一目标用户的相似度得分的大小进行排序并输出目标用户列表。
根据本公开内容的第二方面,提供了一种任务信息处理装置,包括:
获取单元,被配置成获取多个目标用户的用户信息,对应每一目标用户的用户信息包括用户基本信息和用户经验信息;
第一确定单元,被配置成根据任务信息和用户基本信息确定用户基本权重值;
第二确定单元,被配置成根据任务信息和用户经验信息确定用户经验权重值;
计算单元,被配置成根据用户基本权重值和用户经验权重值计算每个目标用户的相似度得分;以及
输出单元,被配置成按照相似度得分的大小进行排序并输出目标用户列表。
根据本公开内容的第三方面,提供一种存储介质,其上存储有实现上述第一方面的任务信息处理方法的程序。
本公开内容的技术方案至少具有以下技术效果之一:综合考虑用户基本权重值和用户经验权重值,使得输出的目标用户列表与企业需求具有较佳的匹配性。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
图1是根据本公开内容的一个实施例的任务信息处理方法的流程示意图;以及
图2是根据本公开内容的一个实施例的任务信息处理装置的结构框图。
具体实施方式
在下文中将结合附图对本公开内容的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开内容,在附图中仅仅示出了与根据本公开内容的方案密切相关的装置结构,而省略了与本公开内容关系不大的其他细节。
应理解的是,本公开内容并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施例可以相互组合、不同实施例之间的特征替换或借用、在一个实施例中省略一个或多个特征。
目标用户的用户信息包括多种类型的信息,例如用户基本信息和用户经验信息,其中在一示例中,用户基本信息具体可包括姓名、出生年月、学校以及学历等信息,用户经验信息具体可包括项目信息、工作年限以及工作经历等信息。在选择与企业相匹配的目标用户的过程中,若忽略不同类型信息对匹配结果的影响,极易导致匹配结果无法满足企业的需求。
根据本公开内容的一个实施例,将目标用户的用户信息按照信息类型的不同进行划分,分别计算不同类型信息与任务信息的匹配程度,即权重值,根据得到的多个权重值确定目标用户与任务信息的相似度得分,并根据相似度得分输出目标用户列表。上述过程输出的目标用户列表与企业需求具有较佳的匹配性。
具体地,图1是根据本公开内容的一个实施例的任务信息处理方法100的流程示意图。
在步骤S101处,获取多个目标用户的用户信息。
其中,对应每一目标用户的用户信息包括用户基本信息和用户经验信息。用户基本信息具体可包括姓名、出生年月、学校以及学历等信息,用户经验信息具体可包括项目信息、工作年限以及工作经历等信息。
在步骤S102处,根据任务信息和用户基本信息获得用户基本权重值。
任务信息中包括企业发布的满足企业需求的基本信息,根据用户基本信息与任务信息中的基本信息,确定用户基本信息是否满足任务信息的要求,以此确定用户基本权重值。
在步骤S103处,根据任务信息和用户经验信息获得用户经验权重值。
任务信息中包括企业发布的满足企业需求的经验信息,根据用户经验信息与任务信息中的经验信息,确定用户经验信息是否满足任务信息的要求,以此确定用户经验权重值。
在步骤S104处,根据用户基本权重值和用户经验权重值计算出每个目标用户的相似度得分。
在步骤S105处,按照每一目标用户的相似度得分的大小进行排序并输出目标用户列表。
其中,任务信息处理方法的执行主体为服务器均由服务器执行,服务器通过中文/英文分词算法对用户信息和任务信息进行任务关键词提取。任务信息若有多国语言可自动换算成中文或者英文。本实施例采用人工智能的方法进行用户与企业的匹配媒合。
优选地,目标用户列表仅包括部分目标用户,其中目标用户不被包括的部分名单具有小于被包括的部分目标用户的相似度得分。
相似度得分作为判断目标用户与任务信息匹配程度的标准,该相似度得分综合考虑用户基本权重值和用户经验权重值,使得输出的目标用户列表与企业需求具有较佳的匹配性。
例如,根据任务信息和用户基本信息获得用户基本权重值,包括:
计算出用户基本信息匹配于任务信息的第一相似度,根据第一相似度获得用户基本权重值。具体可以包括:
采用分词算法提取用户文本信息的第一关键词以及企业发布任务的第二关键词;其中,用户文本信息具体指包含有用户基本信息和用户经验信息的文本。第一关键词包括至少一个用户基本信息关键词和至少一个用户经验信息关键词。
根据第二关键词和至少一个用户基本信息关键词确定至少一个第一相似度,根据至少一个第一相似度获得用户基本权重值。其中,采用分词算法提取用户文本信息的第一关键词,例如可以包括:
采集用户信息样本,用户信息样本中包括用户基本信息和用户经验信息,用户基本信息包括用户基本信息包括姓名、出生年月、学校以及学历等信息,用户经验信息包括项目信息、工作年限以及工作经历等信息;
统计用户信息样本中的关键词字段,将关键词字段按照类型不同分为用户基本信息关键词和用户经验信息关键词;
基于关键词字段生成分类词典;
针对用户文本信息,采用最大匹配算法查找与分类词典中的用户基本信息关键词相匹配的第一目标关键词,并且采用最大匹配算法查找与分类词典中的用户经验信息关键词相匹配的第二目标关键词;
提取相邻两个第一目标关键词之间的内容,作为用户基本信息关键词;
提取相邻两个第二目标关键词之间的内容,作为用户经验信息关键词。
其中,采用分词算法提取企业发布任务的第二关键词,例如可以包括:
统计任务信息样本中的关键词字段;
基于关键词字段生成关键词数据库;
将企业发布任务进行分词处理,得到至少一个词语;
采用TF/IDF算法计算至少一个词语的频率值;
选取频率值大于第一设定阈值的词语作为候选关键词,其中,第一设定阈值为经验值,例如第一设定阈值的取值为5-7;
将候选关键词与关键词数据库中的关键词字段进行匹配计算,得到匹配值;
将匹配值大于第二设定阈值的候选关键词作为第二关键词。例如,第二设定阈值为经验值,如设置为80%。其中,根据第二关键词和至少一个用户基本信息关键词获得至少一个第一相似度,根据至少一个第一相似度获得用户基本权重值,例如可以包括:
计算第二关键词与每个用户基本信息关键词的第一相似度,若第一相似度为100%,则将该用户基本信息关键词对应的子权重确定为a/N,否则,该用户基本信息关键词对应的子权重确定为0,其中,N为用户基本信息关键词的个数,a为用户基本信息的占比,例如,a等于70%;其中,第一相似度的计算方法可采用任何现有的相似度计算方法,如余弦相似度,此处不作限定;
将所有子权重累加得到用户基本权重值。
例如,根据任务信息和用户经验信息获得用户经验权重值,包括:
计算出用户经验信息匹配于任务信息的第二相似度,根据第二相似度获得用户经验权重值。具体可以包括:
根据第二关键词和至少一个用户经验信息关键词获得至少一个第二相似度,根据至少一个第二相似度获得用户经验权重值。例如可以包括:
计算第二关键词与每个用户经验信息关键词的第二相似度,若第二相似度为100%,则将该用户经验信息关键词对应的子权重确定为b/M,否则,该用户经验信息关键词对应的子权重确定为0,其中,M为用户经验信息关键词的个数,b为用户经验信息的占比,且a+b=100%,例如b等于30%;其中,第一相似度的计算方法可采用任何现有的相似度计算方法,如余弦相似度;
将所有子权重累加得到用户经验权重值。
例如,根据用户基本权重值和用户经验权重值计算出每个目标用户的相似度得分,可以包括:
将对应的用户基本权重值和对应的用户经验权重值累加得到每个目标用户的相似度得分。
例如,按照相似度得分的大小输出目标用户列表,可以包括:
选取相似度得分大于第三设定阈值的目标用户,生成目标用户列表。例如,第三设定阈值为经验值,如设置为75%。
例如,任务信息处理方法,还包括:
根据目标用户的相似度得分和存储的任务信息评分,计算出任务信息的综合得分;根据任务信息的综合得分输出第一任务信息列表。
本实施例中,服务器中存储有任务信息评分,将任务信息评分与目标用户的相似度得分进行累加,作为任务信息的综合得分;将综合得分大于第四设定阈值的任务信息输出。此处第四设定阈值为经验值,如设置为80%。
例如,任务信息处理方法,还包括:
根据存储的名单对任务信息进行筛选,得到第二任务信息列表;输出第二任务信息列表。
本实施例中,服务器中还存储有用户信息对应的企业黑名单,根据该企业黑名单对任务信息进行筛选,删除企业黑名单中企业对应的任务信息,将筛选后的任务信息输出。
例如,任务信息处理方法,还包括:
当服务器收到目标用户列表中的目标用户筛选名单,服务器提供目标用户筛选名单的联系方式并通知目标用户筛选名单的用户。
企业在收到服务器提供的用户信息后,可以进一步对用户信息进行筛选,并返回给服务器;同时服务器获取用户的联系方式,服务器再通知用户。可选地,还可以根据企业的需求进行线上测试等。本实施例能够保证用户与企业的双向媒合并减少用户与企业发生不匹配的几率。
本公开内容的第二方面,还提供一种任务信息处理装置。图2是根据本公开内容提供的一个实施例中的任务信息处理装置200的结构框图。如图2中所示,任务信息处理装置200包括:获取单元201、第一确定单元202、第二确定单元203、计算单元204和输出单元205。
获取单元201,用于获取目标用户的用户信息。
其中,对应每一目标用户的用户信息包括用户基本信息和用户经验信息。用户基本信息具体可包括姓名、出生年月、学校以及学历等信息,用户经验信息具体可包括项目信息、工作年限以及工作经历等信息。
第一确定单元202,用于根据任务信息和用户基本信息获得用户基本权重值。
任务信息中包括企业发布的满足企业需求的基本信息,根据用户基本信息与任务信息中的基本信息,确定用户基本信息是否满足任务信息的要求,以此确定用户基本权重值。
第二确定单元203,用于根据任务信息和用户经验信息获得用户经验权重值。
任务信息中包括企业发布的满足企业需求的经验信息,根据用户经验信息与任务信息中的经验信息,确定用户经验信息是否满足任务信息的要求,以此确定用户经验权重值。
计算单元204,用于根据用户基本权重值和用户经验权重值计算出每个目标用户的相似度得分。
输出单元205,用于按照每一目标用户的相似度得分的大小进行排序并输出目标用户列表。
其中,获取步骤、获得步骤与排序并输出步骤皆由服务器执行,通过中文/英文分词算法对任务信息进行任务关键词提取。任务信息若有多国语言可自动换算成中文或者英文。本实施例采用人工智能的方法进行用户与企业的匹配媒合。
优选地,目标用户列表仅包括部分目标用户,其中目标用户不被包括的部分名单具有小于被包括的部分目标用户的相似度得分。
相似度得分作为判断目标用户与任务信息匹配程度的标准,该相似度得分综合考虑用户基本权重值和用户经验权重值,使得输出的目标用户列表与企业需求具有较佳的匹配性。
例如,第一确定单元202还用于:
计算出用户基本信息匹配于任务信息的第一相似度,根据第一相似度获得用户基本权重值。
采用分词算法提取用户文本信息的第一关键词以及企业发布任务的第二关键词;其中,用户文本信息具体指包含有用户基本信息和用户经验信息的文本。第一关键词包括至少一个用户基本信息关键词和至少一个用户经验信息关键词。
根据第二关键词和至少一个用户基本信息关键词确定至少一个第一相似度,根据至少一个第一相似度获得用户基本权重值。
其中,采用分词算法提取用户文本信息的第一关键词,例如可以包括:
采集用户信息样本,用户信息样本中包括用户基本信息和用户经验信息,用户基本信息包括用户基本信息包括姓名、出生年月、学校以及学历等信息,用户经验信息包括项目信息、工作年限以及工作经历等信息;
统计用户信息样本中的关键词字段,将关键词字段按照类型不同分为用户基本信息关键词和用户经验信息关键词;
基于关键词字段生成分类词典;
针对用户文本信息,采用最大匹配算法查找与分类词典中的用户基本信息关键词相匹配的第一目标关键词,并且采用最大匹配算法查找与分类词典中的用户经验信息关键词相匹配的第二目标关键词;
提取相邻两个第一目标关键词之间的内容,作为用户基本信息关键词;
提取相邻两个第二目标关键词之间的内容,作为用户经验信息关键词。
其中,采用分词算法提取企业发布任务的第二关键词,例如可以包括:
统计任务信息样本中的关键词字段;
基于关键词字段生成关键词数据库;
将企业发布任务进行分词处理,得到至少一个词语;
采用TF/IDF算法计算至少一个词语的频率值;
选取频率值大于第一设定阈值的词语作为候选关键词,其中,第一设定阈值为经验值,例如第一设定阈值的取值为5-7。;
将候选关键词与关键词数据库中的关键词字段进行匹配计算,得到匹配值;
将匹配值大于第二设定阈值的候选关键词作为第二关键词。例如,第二设定阈值为经验值,如设置为80%。
其中,根据第二关键词和至少一个用户基本信息关键词获得至少一个第一相似度,根据至少一个第一相似度获得用户基本权重值,例如可以包括:
计算第二关键词与每个用户基本信息关键词的第一相似度,若第一相似度为100%,则将该用户基本信息关键词对应的子权重确定为a/N,否则,该用户基本信息关键词对应的子权重确定为0,其中,N为用户基本信息关键词的个数,a为用户基本信息的占比,例如,a等于70%;其中,第一相似度的计算方法可采用任何现有的相似度计算方法,如余弦相似度,此处不作限定;
将所有子权重累加得到用户基本权重值。
例如,第二确定单元203还用于:
计算出用户经验信息匹配于任务信息的第二相似度,根据第二相似度获得用户经验权重值。
根据第二关键词和至少一个用户经验信息关键词获得至少一个第二相似度,根据至少一个第二相似度获得用户经验权重值。例如可以包括:
计算第二关键词与每个用户经验信息关键词的第二相似度,若第二相似度为100%,则将该用户经验信息关键词对应的子权重确定为b/M,否则,该用户经验信息关键词对应的子权重确定为0,其中,M为用户经验信息关键词的个数,b为用户经验信息的占比,且a+b=100%,例如b等于30%;其中,第一相似度的计算方法可采用任何现有的相似度计算方法,如余弦相似度;
将所有子权重累加得到用户经验权重值。
例如,计算单元204,还用于:
将对应的用户基本权重值和对应的用户经验权重值累加得到每个目标用户的相似度得分。
例如,输出单元205,还用于:
选取相似度得分大于第三设定阈值的目标用户,生成目标用户列表。例如,第三设定阈值为经验值,如设置为75%。
例如,任务信息处理装置,还包括第一任务信息输出单元,用于:
根据目标用户的相似度得分和存储的任务信息评分,计算出任务信息的综合得分;根据任务信息的综合得分输出第一任务信息列表。
本实施例中,服务器中存储有任务信息评分,将任务信息评分与目标用户的相似度得分进行累加,作为任务信息的综合得分;将综合得分大于第四设定阈值的任务信息输出。此处第四设定阈值为经验值,如设置为80%。
例如,任务信息处理装置还包括第二任务信息输出单元,用于:
根据存储的名单对任务信息进行筛选,得到第二任务信息列表;输出第二任务信息列表。
本实施例中,服务器中还存储有用户信息对应的企业黑名单,根据该企业黑名单对任务信息进行筛选,删除企业黑名单中企业对应的任务信息,将筛选后的任务信息输出。
例如,任务信息处理装置还包括通知单元,用于:
当服务器收到目标用户列表中的目标用户筛选名单,服务器提供目标用户筛选名单的联系方式并通知目标用户筛选名单的用户。
企业在收到服务器提供的用户信息后,可以进一步对用户信息进行筛选,并返回给服务器;同时服务器获取用户的联系方式,服务器再通知用户。可选地,还可以根据企业的需求进行线上测试等。本实施例能够保证用户与企业的双向媒合并减少用户与企业发生不匹配的几率。
本公开内容第三个方面,提供一种存储介质,其上存储有用于实现上述第一方面的任务信息处理方法的程序
示例性的,计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)或者半导体介质(例如,固态硬盘SolidState Disk(SSD))等)。
在本公开内容所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,在可行的情况下,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
另外,在本公开内容各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上,虽然描述了本公开内容的多个实施例,但本公开内容的范围并不局限于这些实施例,任何熟悉本技术领域的技术人员在不偏离本公开内容的情况下,可轻易想到变化或替换,这些变化或替换所对应的方案都应涵盖在本公开内容的保护范围之内。因此,本公开内容的保护范围应以权利要求为准。
Claims (7)
1.一种任务信息处理方法,包括:
获取多个目标用户的用户信息,对应每一目标用户的所述用户信息包括用户基本信息和用户经验信息;
计算出所述用户基本信息匹配于任务信息的第一相似度,根据所述第一相似度获得用户基本权重值,计算出所述用户经验信息匹配于所述任务信息的第二相似度,根据所述第二相似度获得用户经验权重值,包括:
采集用户样本信息;
统计所述用户样本信息中的关键词字段,所述关键词字段包括用户基本信息关键词字段和用户经验信息关键词字段;
基于所述关键词字段生成分类词典;
在所述用户信息中查找与所述分类词典中的用户基本信息关键词字段相匹配的第一目标关键词和与所述分类词典中的用户经验信息关键词字段相匹配的第二目标关键词;
提取所述用户信息中的相邻两个第一目标关键词之间的内容,作为用户基本信息关键词;
提取所述用户信息中的相邻两个第二目标关键词之间的内容,作为用户经验信息关键词;
采用分词算法提取所述任务信息的第二关键词;
计算每个用户基本信息关键词与所述第二关键词的第一相似度,若所述第一相似度为100%,则该用户基本信息关键词的子权重为a/N,其中,a为用户基本信息的占比,N为用户基本信息关键词的个数,若所述第一相似度不为100%,则该用户基本信息关键词的子权重为0;
累加所有所述用户基本信息关键词对应的子权重,得到用户基本权重值;
计算每个用户经验信息关键词与所述第二关键词的第二相似度,若所述第二相似度为100%,则该用户经验信息关键词的子权重为b/M,其中,b为用户经验信息的占比,a+b=100%,M为所述用户经验信息关键词的个数,若所述第二相似度不为100%,则该用户经验信息关键词的子权重为0;
累加所有所述用户经验信息关键词对应的子权重,得到用户经验权重值;
根据所述用户基本权重值和所述用户经验权重值计算出每个所述目标用户的相似度得分;以及
按照每一所述目标用户的相似度得分的大小进行排序并输出目标用户列表。
2.根据权利要求1所述的任务信息处理方法,其中,根据所述用户基本权重值和所述用户经验权重值计算出每个所述目标用户的相似度得分,包括:
将对应的所述用户基本权重值和对应的所述用户经验权重值累加得到每个所述目标用户的相似度得分。
3.根据权利要求1所述的任务信息处理方法,其中,所述方法还包括:
根据所述目标用户的相似度得分和存储的任务信息评分,计算出所述任务信息的综合得分;以及
根据所述任务信息的综合得分输出第一任务信息列表;和/或
所述方法还包括:
根据存储的名单对所述任务信息进行筛选,得到第二任务信息列表;以及
输出第二任务信息列表。
4.根据权利要求1所述的任务信息处理方法,其中,当收到所述目标用户列表中的目标用户筛选名单,提供所述目标用户筛选名单的联系方式并通知所述目标用户筛选名单的用户。
5.根据权利要求1-4中任一项所述的任务信息处理方法,其中,所述目标用户列表仅包括部分所述目标用户,其中所述目标用户不被包括的部分名单具有小于被包括的部分所述目标用户的相似度得分。
6.一种任务信息处理装置,包括:
获取单元,被配置成用于获取多个目标用户的用户信息,对应每一目标用户的所述用户信息包括用户基本信息和用户经验信息;
第一计算单元,被配置成用于计算出所述用户基本信息匹配于任务信息的第一相似度,根据所述第一相似度获得用户基本权重值,计算出所述用户经验信息匹配于所述任务信息的第二相似度,根据所述第二相似度获得用户经验权重值;
第一计算单元,还被配置成用于
采集用户样本信息;
统计所述用户样本信息中的关键词字段,所述关键词字段包括用户基本信息关键词字段和用户经验信息关键词字段;
基于所述关键词字段生成分类词典;
在所述用户信息中查找与所述分类词典中的用户基本信息关键词字段相匹配的第一目标关键词和与所述分类词典中的用户经验信息关键词字段相匹配的第二目标关键词;
提取所述用户信息中的相邻两个第一目标关键词之间的内容,作为用户基本信息关键词;
提取所述用户信息中的相邻两个第二目标关键词之间的内容,作为用户经验信息关键词;
采用分词算法提取所述任务信息的第二关键词;
计算每个用户基本信息关键词与所述第二关键词的第一相似度,若所述第一相似度为100%,则该用户基本信息关键词的子权重为a/N,其中,a为用户基本信息的占比,N为所述用户基本信息关键词的个数,若所述第一相似度不为100%,则该用户基本信息关键词的子权重为0;
累加所有所述用户基本信息关键词对应的子权重,得到用户基本权重值;
计算每个用户经验信息关键词与所述第二关键词的第二相似度,若所述第二相似度为100%,则该用户经验信息关键词的子权重为b/M,其中,b为用户经验信息的占比,a+b=100%,M为所述用户经验信息关键词的个数,若所述第二相似度不为100%,则该用户经验信息关键词的子权重为0;
累加所有所述用户经验信息关键词对应的子权重,得到用户经验权重值;
第二计算单元,被配置成用于根据所述用户基本权重值和所述用户经验权重值计算每个所述目标用户的相似度得分;以及
输出单元,被配置成用于按照相似度得分的大小进行排序并输出目标用户列表。
7.一种存储介质,其上存储有用于实现权利要求1-5中任一项所述的任务信息处理方法的程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910200085.0A CN109978498B (zh) | 2019-03-15 | 2019-03-15 | 任务信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910200085.0A CN109978498B (zh) | 2019-03-15 | 2019-03-15 | 任务信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109978498A CN109978498A (zh) | 2019-07-05 |
CN109978498B true CN109978498B (zh) | 2020-06-09 |
Family
ID=67079104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910200085.0A Active CN109978498B (zh) | 2019-03-15 | 2019-03-15 | 任务信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109978498B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112734280B (zh) * | 2021-01-20 | 2024-02-02 | 树根互联股份有限公司 | 生产订单配送方法、装置及电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010085051A (ko) * | 2001-07-26 | 2001-09-07 | - | 인터넷 구인구직 시스템상의 이력서 검색 방법 및 장치 |
US20100153290A1 (en) * | 2008-12-12 | 2010-06-17 | Paul Duggan | Methods of matching job profiles and candidate profiles |
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
CN103544312B (zh) * | 2013-11-04 | 2017-06-16 | 成都数之联科技有限公司 | 基于社交网络的招聘信息匹配方法 |
CN105183788B (zh) * | 2015-08-20 | 2019-01-25 | 及时标讯网络信息技术(北京)有限公司 | 一种基于关键词字典树检索的中文ac自动机工作方法 |
CN105117863A (zh) * | 2015-09-28 | 2015-12-02 | 北京橙鑫数据科技有限公司 | 简历职位匹配方法及装置 |
CN106408249A (zh) * | 2016-08-31 | 2017-02-15 | 五八同城信息技术有限公司 | 简历与职位匹配方法及装置 |
CN106447285B (zh) * | 2016-09-12 | 2020-06-12 | 北京大学 | 基于多维度领域关键知识的招聘信息匹配方法 |
CN108764825A (zh) * | 2018-05-15 | 2018-11-06 | 中国平安人寿保险股份有限公司 | 职位信息匹配方法、装置、计算机设备及存储介质 |
-
2019
- 2019-03-15 CN CN201910200085.0A patent/CN109978498B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109978498A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | An effective statistical approach to blog post opinion retrieval | |
KR101737887B1 (ko) | 크로스 미디어 분석에 기반한 소셜 미디어 텍스트의 주제 카테고리 자동 분류 방법 및 그 장치 | |
KR101681109B1 (ko) | 대표 색인어와 유사도를 이용한 문서 자동 분류 방법 | |
Pereira et al. | Using web information for author name disambiguation | |
Ramnial et al. | Authorship attribution using stylometry and machine learning techniques | |
CN102982153B (zh) | 一种信息检索方法及其装置 | |
CN106446070B (zh) | 一种基于专利群的信息处理装置及方法 | |
Malik et al. | Accurate information extraction for quantitative financial events | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
Almishari et al. | Stylometric linkability of tweets | |
Brenner et al. | Social event detection and retrieval in collaborative photo collections | |
Schulz et al. | Small-scale incident detection based on microposts | |
Nizamani et al. | CEAI: CCM-based email authorship identification model | |
Giorgi et al. | Discovering black lives matter events in the United States: Shared task 3, CASE 2021 | |
KR101753768B1 (ko) | 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템 | |
CN109978498B (zh) | 任务信息处理方法及装置 | |
JPWO2015030112A1 (ja) | データ分別システム、データ分別方法、データ分別のためのプログラム、及び、このプログラムの記録媒体 | |
Guadie et al. | Amharic text summarization for news items posted on social media | |
Lin et al. | Automatic content analysis of legislative documents by text mining techniques | |
CN107577667B (zh) | 一种实体词处理方法和装置 | |
Iyer et al. | Identifying policy agenda sub-topics in political tweets based on community detection | |
Atikah et al. | Topic Modelling Using VSM-LDA For Document Summarization | |
Ramadan | Indexing techniques for real-time entity resolution | |
Dey et al. | NTCIR-12 MOBILECLICK: Sense-based Ranking and Summarization of English Queries. | |
Makkonen et al. | Detecting events by clustering videos from large media databases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |