CN115860706B - 面向定制化需求的人员排序方法及装置 - Google Patents

面向定制化需求的人员排序方法及装置 Download PDF

Info

Publication number
CN115860706B
CN115860706B CN202310168750.9A CN202310168750A CN115860706B CN 115860706 B CN115860706 B CN 115860706B CN 202310168750 A CN202310168750 A CN 202310168750A CN 115860706 B CN115860706 B CN 115860706B
Authority
CN
China
Prior art keywords
keyword
resume text
resume
text
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310168750.9A
Other languages
English (en)
Other versions
CN115860706A (zh
Inventor
马涛
李小伟
刘金红
郭茂华
夏钧波
胡文敏
牛钊
李歆昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202310168750.9A priority Critical patent/CN115860706B/zh
Publication of CN115860706A publication Critical patent/CN115860706A/zh
Application granted granted Critical
Publication of CN115860706B publication Critical patent/CN115860706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了面向定制化需求的人员排序方法及装置。所述方法包括输入定制化需求和简历文本集合,提取定制化需求的关键词集合,遍历所述简历文本集合,计算每条简历文本与关键词集合的匹配性得分,将所述简历文本集合中简历文本,按所述匹配性得分从高到低顺序,得到人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型,所述方法既考虑了简历文本与关键词匹配的单词的相关性,又考虑了简历文本的主题对定制需求的内聚度大小,能够全面的反映定制化需求与简历文本的匹配度,为面向定制需求的人员排序提供了一种可用的方法。

Description

面向定制化需求的人员排序方法及装置
技术领域
本发明涉及电子信息及数据处理技术领域,尤其涉及一种面向定制化需求的人员排序方法及装置。
背景技术
数据分析人员根据特定的任务需求会关注位于特定地区、就职过特定单位、参与过特定工程项目、具备特定技能的人员,在获得一定范围内人员的简历后,如何向数据人员按与任务需求匹配性大小推送相关的人员,成为一个亟待解决的问题。目前主要是靠关键词检索匹配分析,通过一个或者数个关键词匹配到相关的简历人员,这种关键词检索匹配的方法很难从人员所从事的全部信息进行匹配,只考虑了需求关键词与简历文本的相关性,没有充分考虑到简历文本的内聚性。因此,需要一种既考虑定制化需求与简历文本相关性,又要考虑简历文本内聚性的智能算法去实现定制化需求的人员挖掘。
发明内容
鉴于上述现有定制化需求下人员挖掘存在的问题,本发明的目的在于提供一种面向定制化需求的人员排序方法及装置,实现智能化简历人员挖掘。
为了解决上述技术问题,本发明实施例第一方面公开了一种面向定制化需求的人员排序方法,方法包括:
S1,获取定制化需求、简历文本集合;所述简历文本集合包括至少一条简历文本;
S2,对所述定制化需求进行处理,得到关键词集合;所述关键词集合包含至少一个关键词;
S3,对所述关键词集合进行处理,得到所有关键词的权重系数;所述权重系数满足约束条件,所述 n表征所述关键词集合包含关键词的个数,所述 j为所述关键词集合的关键词对应的序号,所述 P j 表征所述关键词集合第 j个关键词的权重系数;
S4,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分;
S5,按照所述匹配性得分从高到低顺序,将所述简历文本集合中简历文本进行排序,得到人员排序信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述定制化需求为定制词集合,或,定制文本段;所述定制词集合包含至少一个定制词。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取所述定制化需求的关键词集合包括:
如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;
如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。所述关键词提取算法无监督的算法,可以为基于统计特征的关键词提取(TF-IDF)、基于词图模型的关键词提取(TextRank)、基于主题模型的关键词提取。
作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述关键词集合进行处理,得到所有关键词的权重系数,包括:
依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
作为一种可选的实施方式,在本发明实施例第一方面中,所述计算每条简历文本与所述关键词集合的匹配性得分,包括:
遍历所述关键词集合,对其中任一所述关键词 k i ,计算该关键词 k i 与所述简历文本的匹配分 S_v i ;所述 i表征顺序;
根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分R m ;所述 m表征所述简历文本集合中第 m条简历文本。
所述预设的匹配模型为:
式中,R m 表示所述简历文本集合中第 m条简历文本与所述关键词集合匹配性得分, n表示所述关键词集合中关键词总数, P i 表示第 i个关键词的权重系数, S_v i 表示第 i个关键词 k i 的与第 m条简历文本的匹配分。
作为一种可选的实施方式,在本发明实施例第一方面中,所述计算所述关键词与所述简历文本的匹配分 S_v i ,包括:
预处理所述简历文本,得到简历文本的相关词集合;所述相关词集合包含至少一个相关词;
遍历所述相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词 w j 与所述关键词 k i 的相关系数;所述词向量相关模型为:
式中,表示所述该关键词 k i 的词向量,表示所述相关词集合中第 j个单词 w j 的词向量,表示的协方差,表示的方差,表示的方差;
将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前 y个相关词,得到最优相关词集合,所述 y为大于0的自然数;
利用预设的关键词与简历文本匹配模型,计算所述关键词 k i 与所述简历文本的第一匹配分 S_k i ;所述关键词与简历文本匹配模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述该关键词 k i 与所述最优相关词集合中相关词 u f 的相关系数。
利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分 S_c i ;所述简历文本内聚模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词 u h u f 的相关系数,所述 hf表征顺序;
将第一匹配分 S_k i 与第二匹配分 S_c i 相乘,得到所述关键词 k i 与所述简历文本的匹配分 S_v i ,计算公式如下:
式中, S_k i 表示所述关键词 k i 与所述简历文本的第一匹配分, S_c i 表示所述简历文本的第二匹配分。
作为一种可选的实施方式,在本发明实施例第一方面中,所述预处理所述简历文本,得到简历文本相关词集合,包括:
去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;
加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
本发明实施例第二方面公开了一种面向定制化需求的人员排序装置,所述装置包括:
获取模块,用于获取定制化需求、简历文本集合;所述简历文本集合包括至少一条简历文本;所述定制化需求为定制词集合,或,定制文本段;
关键词处理模块,用于提取定制化需求的关键词集合,计算关键词的权重系数;
简历文本预处理模块,用于对简历文本进行预处理,得到简历文本相关词集合;所述相关词集合包含至少一个相关词;
匹配性得分计算模块,用于计算关键词集合和简历文本的匹配性得分;
人员排序模块,用于将所述简历文本集合中简历文本,按匹配性得分从高到低顺序,得到人员排序信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述关键词处理模块提取定制化需求的关键词集合,计算关键词的权重系数,包括:
如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;
如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。
依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
作为一种可选的实施方式,在本发明实施例第二方面中,所述简历文本预处理模块,用于对简历文本进行预处理,得到简历文本相关词集合,包括:
去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;
加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
作为一种可选的实施方式,在本发明实施例第二方面中,所述匹配性得分计算模块,用于计算关键词集合和简历文本的匹配性得分,包括:
遍历所述关键词集合,对其中任一所述关键词 k i ,计算该关键词 k i 与所述简历文本的匹配分 S_v i ;所述 i表征顺序;
判断是否完成所述关键词集合中所有关键词的与所述简历文本的匹配分的计算,得到第一判断结果;
如果第一判断结果为否,触发执行遍历所述关键词集合,对其中任一所述关键词 k i ,计算该关键词 k i 与所述简历文本的匹配分 S_v i
如果第一判断结果为是,则根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分R m ;所述 m表征所述简历文本集合中第 m条简历文本;
所述预设的匹配模型为:
式中,R m 表示所述简历文本集合中第 m条简历文本与所述关键词集合匹配性得分, n表示所述关键词集合中关键词总数, P i 表示第 i个关键词的权重系数, S_v i 表示第 i个关键词的与第 m条简历文本的匹配分。
作为一种可选的实施方式,在本发明实施例第二方面中,所述计算所述关键词 k i 与所述简历文本的匹配分 S_v i ,包括:
遍历从所述简历文本预处理模块得到的相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词 w j 与所述关键词 k i 的相关系数
所述词向量相关模型为:
式中,表示所述该关键词 k i 的词向量,表示所述相关词集合中第 j个单词 w j 的词向量,表示的协方差,表示的方差,表示的方差;
将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前 y个相关词,得到最优相关词集合;所述 y为大于0的自然数;
利用预设的关键词与简历文本匹配模型,计算所述关键词 k i 与所述简历文本的第一匹配分 S_k i ;所述关键词与简历文本匹配模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述该关键词 k i 与所述最优相关词集合中相关词 u f 的相关系数;
利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分 S_c i
所述简历文本内聚模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词 u h u f 的相关系数,所述 hf表征顺序;
将第一匹配分 S_k i 与第二匹配分 S_c i 相乘,得到所述关键词 k i 与所述简历文本的匹配分 S_v i ;所述匹配分 S_v i 为:
式中, S_k i 表示所述关键词 k i 与所述简历文本的第一匹配分, S_c i 表示所述简历文本的第二匹配分。
本发明的有益效果:
本发明所述的一种面向定制化需求的人员排序方法及装置,输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本,按所述匹配性得分从高到低顺序,得到人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型,所述方法中不仅反映了简历文本与关键词匹配的单词的相关性,还反映了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略简历文本内聚度的问题,为面向定制需求的人员排序提供了一种可用的方法,可用于数据人员根据定制化需求进行精准的重要目标人物挖掘。
附图说明
图1是本发明实施例公开的一种面向定制化需求的人员排序方法流程示意图;
图2是本发明实施例公开的一种面向定制化需求的人员排序装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种面向定制化需求的人员排序方法及装置,本发明涉及电子信息及数据处理技术领域,尤其涉及一种面向定制化需求的人员排序方法及装置。所述方法包括输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本,按所述匹配性得分从高到低顺序,得到人员排序信息。以下分别进行详细说明。
实施例一
图1是本发明实施例公开的一种面向定制化需求的人员排序方法流程示意图。其中,图1所描述的面向定制化需求的人员排序方法应用于数据人员进行特定人员发现的挖掘系统中,如用于面向定制化需求任务进行简历人员相关性排序的的本地服务器或云端服务器等,本发明实施例不做限定。如图1所示,该面向定制化需求的人员排序方法可以包括以下操作:
S1.获取定制化需求、简历文本集合。
本发明实施例中,上述简历文本集合包括至少一条简历文本;
可选的,本发明实施例中,上述定制化需求可以为定制词集合,也可以为定制文本段,所述定制词集合包含至少一个定制词。
可选的,所述简历文本集合获取方式包括:通过存储介质导入、通过网络导入、通过服务器导入。
可见,多种的简历文本集合获取方式利于用户的简历文本集合的导入,提升了用户体验感。
可选的,所述简历文本集合中简历文本为txt文本文件。
可选的,原始简历文件可以从地方公司HR或互联网招聘网站上获取,原始简历文件所述可以为pdf、doc和docx等格式的电子简历文件,使用工具软件,如doctotext、pdftotext等,将原始简历文件进行简历文本的提取,并保存成对应的txt文本文件,得到txt格式的所述简历文本。
可见,原始简历文件来源非常广泛,可以为多种格式,通过常见的工具软件转换为txt格式的简历文本,为数据人员获取简历提供了广泛的途径。
S2.对定制化需求进行处理,得到关键词集合。
可选的,如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;如果所述定制化需求为所述定制文本段,利用现有的关键词提取算法,如TextRank算法,提取能代表所述定制文本段的定制文本段关键词集合,确定所述定制文本段关键词集合为关键词集合。
可见,本发明实施例所描述的面向定制化需求的人员排序方法中所述定制化需求可以是一组定制词,也可以是一段描述文本,可适应不同的定制需求。
S3.对关键词集合进行处理,得到所有关键词的权重系数。
所述权重系数满足约束条件,所述 n表征所述关键词集合包含关键词的个数,所述 j为所述关键词集合的关键词对应的序号,所述 P j 表征所述关键词集合第 j个关键词的权重系数;
可选的,本发明实施例中,依据所述关键词集合中每个关键词权重大小,确定所述关键词的权重系数;需求大小相同,则每个关键词的权重系数 P j都同为1/ n,所述 n为关键词的个数。
或,依据关键词提取算法得到的关键词节点权重大小,确定所述关键词的权重系数。例如,在关键词提取算法中,第 j个关键词的节点权重大小为 s j 进行相应比例的权重系数赋值,第 j个关键词权重系数 P j 计算方法如下:
式中, P j 表示第 j个关键词权重系数, s j 表示关键词提取算法中第 j个关键词的节点权重, n表示关键词集合包含关键词的个数。
可见,将定制化需求提炼为关键词集合,使需求更精准;赋予每个关键词不同的权重系数,使核心需求可以获得更高的匹配性得分。
S4.遍历简历文本集合,计算每条简历文本与关键词集合的匹配性得分。
S5.按照匹配性得分从高到低顺序,将简历文本集合中简历文本进行排序,得到人员排序信息。
可见,实施本发明实施例所描述的面向定制化需求的人员排序方法通过对定制化需求与简历文本的匹配性计算,得到定制化需求与简历文本的匹配性得分,根据匹配性得分的高低得到简历文本所对应的人员与定制需求的关联度大小,为面向定制需求的人员排序提供了一种可用的方法。
在一个可选的实施例中,上述步骤S4中计算每条简历文本与所述关键词集合的匹配性得分,包括:
遍历所述关键词集合,对其中任一关键词 k i 计算所述关键词 k i 与所述简历文本的匹配分 S_v i ,所述 k i 表征第 i个关键词,所述 i表征顺序;
所述匹配性得分等于所述关键词集合中所有关键词组所述匹配分与所述权重系数乘积的总和,计算方法如下:
式中,R m 表示所述简历文本集合中第 m条简历文本对应人物的匹配性得分, n表示所述关键词集合中关键词总数, P i 表示第 i个关键词的相关系数, S_v i 表示第 i个关键词的与第 m条简历文本的匹配分。
可选的,上述计算所述关键词 k i 与所述简历文本的匹配分 S_v i ,包括:
预处理所述简历文本,得到简历文本的相关词集合,所述相关词集合包含至少一个相关词;
遍历所述相关词集合,计算所述相关词集合中任一相关词与所述该关键词的相关系数,记作,计算公式如下:
式中,表示所述该关键词 k i 的词向量,表示所述相关词集合中第 j个单词的词向量,表示的协方差,表示的方差,表示的方差;
将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前 y个相关词,得到最优相关词集合,所述 y为大于0的自然数;
计算所述该关键词 k i 与所述简历文本的第一匹配分 S_k i ,公式如下:
式中, y表示所述最优相关词集合中相关词的个数,表示所述该关键词 k i 与所述最优相关词集合中相关词 u f 的相关系数。
计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分 S_c i ,计算公式如下:
式中, y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词 u h u f ,所述 hf表征顺序;
将第一匹配分 S_k i 与第二匹配分 S_c i 相乘,得到所述关键词 k i 与所述简历文本的匹配分 S_v i ;所述匹配分 S_v i 为:
式中, S_k i 表示所述关键词 k i 与所述简历文本的第一匹配分, S_c i 表示所述简历文本的第二匹配分。
可选的,上述预处理所述简历文本,得到简历文本的相关词集合,包括:
去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;
加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
可见,实施本发明实施例所描述的一种面向定制化需求的人员排序方法能够输入定制化需求,提取定制化需求的关键词集合,获取简历文本集合,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,将所述简历文本集合中简历文本所对应的人员按所述匹配性得分从高到低排序,得到并输出人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型,所述方法中不仅反映了简历文本与关键词匹配的单词的相似性,也反映了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略了简历文本内聚度的问题,为面向定制需求的人员排序提供了一种可用的方法。
实施例二
图2是本发明实施例公开的一种面向定制化需求的人员排序装置结构示意图。其中,图2所描述的面向定制化需求的人员排序装置应用于数据人员进行特定人员发现的挖掘系统中,如用于面向定制化需求任务进行简历人员相关性排序的本地服务器或云端服务器等,本发明实施例不做限定。如图2所示,该面向定制化需求的人员排序装置可以包括:
获取模块201,用于获取定制化需求、简历文本集合。
关键词处理模块202,用于提取定制化需求的关键词集合,计算关键词的权重系数;
简历文本预处理模块203,用于对简历文本进行预处理,得到简历文本相关词集合;
匹配性得分计算模块204,用于计算关键词集合和简历文本的匹配性得分;
人员排序模块205,用于将所述简历文本集合中简历文本,按匹配性得分从高到低顺序,得到人员排序信息。
可见,实施图2所描述的面向定制化需求的人员排序装置,能够通过对定制需求和简历文本集合进行匹配性计算,得到简历文本所对应人员与定制化需求的匹配度,进而得到人员排序信息,提高了数据人员根据定制化需求进行精准的重要目标人物挖掘的效率和准确率。
可选的,上述关键词处理模块202提取定制化需求的关键词集合,计算关键词的权重系数,具体方式为:
如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;
如果所述定制化需求为定制文本段,利用关键词提取算法,得到代表所述定制文本段的定制文本段关键词集合,将所述定制文本段关键词集合确定为关键词集合。
依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
可选的,上述简历文本预处理模块203对简历文本进行预处理,得到简历文本相关词集合,具体方式为:
去除所述简历文本中干扰字符,得到清洗后的简历文本;所述干扰字符包括但不限于制表符、特殊字符;
加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合。
可选的,上述匹配性得分计算模块204计算关键词集合和简历文本的匹配性得分,具体方式为:
遍历所述关键词集合,对其中任一所述关键词 S_v i ,计算该关键词 k i 与所述简历文本的匹配分 S_v i ;所述 i表征顺序;
判断是否完成所述关键词集合中所有关键词的与所述简历文本的匹配分的计算,得到第一判断结果;
如果第一判断结果为否,触发执行遍历所述关键词集合,对其中任一所述关键词 k i ,计算该关键词 k i 与所述简历文本的匹配分 S_v i
如果第一判断结果为是,则根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分R m ;所述 m表征所述简历文本集合中第 m条简历文本;
所述预设的匹配模型为:
式中,R m 表示所述简历文本集合中第 m条简历文本与所述关键词集合匹配性得分, n表示所述关键词集合中关键词总数, P i 表示第 i个关键词的权重系数, S_v i 表示第 i个关键词的与第 m条简历文本的匹配分。
可选的,上述匹配性得分计算模块204计算所述关键词 k i 与所述简历文本的匹配分 S_v i ,包括:
遍历从所述简历文本预处理模块得到的相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词 w j 与所述关键词 k i 的相关系数
所述词向量相关模型为:
式中,表示所述该关键词 k i 的词向量,表示所述相关词集合中第 j个单词 w j 的词向量,表示的协方差,表示的方差,表示的方差;
将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前 y个相关词,得到最优相关词集合;所述 y为大于0的自然数;
利用预设的关键词与简历文本匹配模型,计算所述关键词 k i 与所述简历文本的第一匹配分 S_k i ;所述关键词与简历文本匹配模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述该关键词 k i 与所述最优相关词集合中相关词 u f 的相关系数;
利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分 S_c i
所述简历文本内聚模型为:
式中, y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词 u h u f 的相关系数,所述 hf表征顺序;
将第一匹配分 S_k i 与第二匹配分 S_c i 相乘,得到所述关键词 k i 与所述简历文本的匹配分 S_v i ;所述匹配分 S_v i 为:
式中, S_k i 表示所述关键词 k i 与所述简历文本的第一匹配分, S_c i 表示所述简历文本的第二匹配分。
可见,利用匹配性得分计算模块不仅计算了简历文本与关键词匹配的单词的相关性,还计算了简历文本的主题对定制需求的内聚度大小,解决了目前关键词匹配的方法只关注了局部的信息,忽略简历文本内聚度的问题。
最后应说明的是:本发明实施例公开的一种面向定制化需求的人员排序方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (5)

1.一种面向定制化需求的人员排序方法,其特征在于,所述方法包括:
S1,获取定制化需求、简历文本集合;所述简历文本集合包括至少一条简历文本;
S2,对所述定制化需求进行处理,得到关键词集合;所述关键词集合包含至少一个关键词;
S3,对所述关键词集合进行处理,得到所有关键词的权重系数;所述所有关键词的权重系数之和为1;
S4,遍历所述简历文本集合,计算每条简历文本与所述关键词集合的匹配性得分,包括:
遍历所述关键词集合,对其中任一所述关键词k i ,计算该关键词k i 与所述简历文本的匹配分S_v i ,所述i表征顺序,具体包括:
去除所述简历文本中干扰字符,得到清洗后的简历文本;
加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合;所述相关词集合包含至少一个相关词;
遍历所述相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词与所述关键词k i 的相关系数
所述词向量相关模型为:
式中,表示所述该关键词k i 的词向量,表示所述相关词集合中第j个单词w j 的词向量,表示的协方差,表示的方差,表示的方差;
将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合;所述y为大于0的自然数;
利用预设的关键词与简历文本匹配模型,计算所述关键词k i 与所述简历文本的第一匹配分;所述关键词与简历文本匹配模型为:
式中,y表示所述最优相关词集合中相关词的个数,表示所述该关键词k i 与所述最优相关词集合中相关词u f 的相关系数;
利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分S_c i
所述简历文本内聚模型为:
式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词u h 和u f 的相关系数,所述hf表征顺序;
将第一匹配分S_k i 与第二匹配分S_c i 相乘,得到所述关键词k i 与所述简历文本的匹配分S_v i ;所述匹配分S_v i 为:
式中,S_k i 表示所述关键词k i 与所述简历文本的第一匹配分,S_c i 表示所述简历文本的第二匹配分;
根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分R m ;所述m表征所述简历文本集合中第m条简历文本;
所述预设的匹配模型为:
式中,R m 表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分,n表示所述关键词集合中关键词总数,P i 表示第i个关键词的权重系数,S_v i 表示第i个关键词的与第m条简历文本的匹配分;
S5,按照所述匹配性得分从高到低顺序,将所述简历文本集合中简历文本进行排序,得到人员排序信息。
2.根据权利要求1所述的面向定制化需求的人员排序方法,其特征在于,所述定制化需求为定制词集合,或,定制文本段;
所述定制词集合包含至少一个定制词。
3.根据权利要求2所述的面向定制化需求的人员排序方法,其特征在于,所述对所述定制化需求进行处理,得到关键词集合,包括:
如果所述定制化需求为定制词集合,确定所述定制词集合为关键词集合;
如果所述定制化需求为定制文本段,利用关键词提取算法,得到关键词集合。
4.根据权利要求1所述的面向定制化需求的人员排序方法,其特征在于,所述对所述关键词集合进行处理,得到所有关键词的权重系数,包括:
依据定制化需求的任务需要,计算所述关键词集合中每个关键词权重大小,得到所有关键词的权重系数,或,依据从关键词提取算法中得到的关键词节点权重大小,确定所有关键词的权重系数。
5.一种面向定制化需求的人员排序装置,其特征在于,包括:
获取模块,用于获取定制化需求、简历文本集合;
关键词处理模块,用于提取定制化需求的关键词集合,计算关键词的权重系数;
简历文本预处理模块,用于对简历文本进行预处理,得到简历文本相关词集合,包括:
所述简历文本预处理模块去除所述简历文本中干扰字符,得到清洗后的简历文本;
所述简历文本预处理模块加载停用词表,对所述清洗后的简历文本进行分词、去停用词,得到简历文本相关词集合;
匹配性得分计算模块,用于计算关键词集合和简历文本的匹配性得分,包括:
所述简历文本预处理模块遍历所述关键词集合,对其中任一所述关键词k i ,计算该关键词k i 与所述简历文本的匹配分S_v i ,所述i表征顺序,具体包括:
所述简历文本预处理模块遍历所述相关词集合,利用预设的词向量相关模型,计算所述相关词集合中任一相关词w j 与所述关键词k i 的相关系数
所述词向量相关模型为:
式中,表示所述该关键词k i 的词向量,表示所述相关词集合中第j个单词w j 的词向量,表示的协方差,表示的方差,表示的方差;
所述简历文本预处理模块将所述相关词集合中所有相关词所对应的降序排列,取相关系数最大的前y个相关词,得到最优相关词集合;所述y为大于0的自然数;
所述简历文本预处理模块利用预设的关键词与简历文本匹配模型,计算所述关键词k i 与所述简历文本的第一匹配分S_k i ;所述关键词与简历文本匹配模型为:
式中,y表示所述最优相关词集合中相关词的个数,表示所述该关键词k i 与所述最优相关词集合中相关词u f 的相关系数;
所述简历文本预处理模块利用预设的简历文本内聚模型,计算所述最优相关词集合中任意两个相关词的相关性,得到所述简历文本的第二匹配分S_c i
所述简历文本内聚模型为:
式中,y表示所述最优相关词集合中相关词的个数,表示所述最优相关词集合中任意两个相关词u h 和u f 的相关系数,所述hf表征顺序;
所述简历文本预处理模块将第一匹配分S_k i 与第二匹配分S_c i 相乘,得到所述关键词k i 与所述简历文本的匹配分S_v i ;所述匹配分S_v i 为:
式中,S_k i 表示所述关键词k i 与所述简历文本的第一匹配分,S_c i 表示所述简历文本的第二匹配分;
所述简历文本预处理模块根据预设的匹配模型,计算简历文本与所述关键词集合的匹配性得分R m ;所述m表征所述简历文本集合中第m条简历文本;
所述预设的匹配模型为:
式中,R m 表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分,n表示所述关键词集合中关键词总数,P i 表示第i个关键词的权重系数,S_v i 表示第i个关键词的与第m条简历文本的匹配分;
人员排序模块,用于将所述简历文本集合中简历文本,按匹配性得分从高到低顺序,得到人员排序信息。
CN202310168750.9A 2023-02-27 2023-02-27 面向定制化需求的人员排序方法及装置 Active CN115860706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310168750.9A CN115860706B (zh) 2023-02-27 2023-02-27 面向定制化需求的人员排序方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310168750.9A CN115860706B (zh) 2023-02-27 2023-02-27 面向定制化需求的人员排序方法及装置

Publications (2)

Publication Number Publication Date
CN115860706A CN115860706A (zh) 2023-03-28
CN115860706B true CN115860706B (zh) 2023-05-05

Family

ID=85659069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310168750.9A Active CN115860706B (zh) 2023-02-27 2023-02-27 面向定制化需求的人员排序方法及装置

Country Status (1)

Country Link
CN (1) CN115860706B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058566A (ja) * 2001-08-20 2003-02-28 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850550B (zh) * 2014-02-13 2019-09-17 腾讯科技(深圳)有限公司 一种提示消息的排序方法和装置
CN112732870B (zh) * 2020-12-31 2024-03-05 平安科技(深圳)有限公司 基于词向量的搜索方法、装置、设备及存储介质
CN113011155B (zh) * 2021-03-16 2023-09-05 北京百度网讯科技有限公司 用于文本匹配的方法、装置、设备和存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058566A (ja) * 2001-08-20 2003-02-28 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体

Also Published As

Publication number Publication date
CN115860706A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN110968684B (zh) 一种信息处理方法、装置、设备及存储介质
CN107193803B (zh) 一种基于语义的特定任务文本关键词提取方法
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN107451126B (zh) 一种近义词筛选方法及系统
CN110232149B (zh) 一种热点事件检测方法和系统
CN103605665B (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN108959431A (zh) 标签自动生成方法、系统、计算机可读存储介质及设备
CN110543595B (zh) 一种站内搜索系统及方法
CN103838833A (zh) 基于相关词语语义分析的全文检索系统
CN111767725A (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN112559684A (zh) 一种关键词提取及信息检索方法
CN109086355B (zh) 基于新闻主题词的热点关联关系分析方法及系统
CN101751455A (zh) 采用人工智能技术自动产生标题的方法
CN107102976A (zh) 基于微博的娱乐新闻自动构建技术与系统
CN105608075A (zh) 一种相关知识点的获取方法及系统
CN111191413B (zh) 一种基于图排序模型的事件核心内容自动标记方法、装置及系统
CN112989208A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN107423348A (zh) 一种基于关键词的精确检索方法
CN111881264B (zh) 一种开放领域问答任务中长文本检索的方法和电子设备
CN112860898A (zh) 一种短文本框聚类方法、系统、设备及存储介质
CN112800226A (zh) 用于获取文本分类模型的方法、用于文本分类的方法、装置及设备
Sharma et al. Resume Classification using Elite Bag-of-Words Approach
CN112417845B (zh) 一种文本评价方法、装置、电子设备及存储介质
CN113934910A (zh) 一种自动优化、更新的主题库构建方法,及热点事件实时更新方法
Mohemad et al. Performance analysis in text clustering using k-means and k-medoids algorithms for Malay crime documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant