CN109918483B - 匹配招聘职位与求职简历的装置和方法 - Google Patents
匹配招聘职位与求职简历的装置和方法 Download PDFInfo
- Publication number
- CN109918483B CN109918483B CN201910199606.5A CN201910199606A CN109918483B CN 109918483 B CN109918483 B CN 109918483B CN 201910199606 A CN201910199606 A CN 201910199606A CN 109918483 B CN109918483 B CN 109918483B
- Authority
- CN
- China
- Prior art keywords
- skill
- label
- tree
- tag
- job
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000007115 recruitment Effects 0.000 title claims abstract description 264
- 238000000034 method Methods 0.000 title claims abstract description 136
- 239000013598 vector Substances 0.000 claims description 75
- 230000011218 segmentation Effects 0.000 claims description 50
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 claims description 24
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims 4
- 238000003058 natural language processing Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种匹配招聘职位与求职简历的装置和方法,能提高招聘职位与求职简历匹配的精确度。装置包括:第一生成单元,被配置成对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;以及第一匹配单元,被配置成计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种匹配招聘职位与求职简历的装置和方法。
背景技术
招聘网站,以其快速的职位搜索与推荐技术和人才搜索与推荐技术,以及丰富的职位资源和人才资源,在一定程度上解决了招聘方“招聘人才难”的问题和求职者“求职难”的问题。
招聘方在招聘网站上发布招聘职位信息,求职者在招聘网站上发布个人简历信息,使得招聘网站拥有海量的招聘职位和求职简历信息。目前,市场上的招聘网站绝大多数采用基于相同关键词匹配的方式对职位和简历进行匹配,向招聘方推荐与其发布的招聘职位信息中具有相同关键词的求职简历,向求职者推荐与其发布的求职简历信息中具有相同关键词的招聘职位;但是,由于语言表达的多样性,招聘方在发布的招聘职位中用词和求职者发布的求职简历中用词可能不一致,因此,按照词语的字面来匹配,往往不能达到精确的匹配效果,往往出现推荐内容不符合招聘方要求或不符合求职者要求的情况。
发明内容
有鉴于此,本发明的目的在于提供一种匹配招聘职位与求职简历的装置和方法,以提高招聘职位与求职简历匹配的精确度,便于招聘网站根据招聘职位与求职简历匹配的结果进行职位、简历推荐。
第一方面,本发明实施例提供了一种匹配招聘职位与求职简历的装置,包括:
第一生成单元,被配置成对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;以及
第一匹配单元,被配置成计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成。
第二方面,本发明实施例还提供了一种匹配招聘职位与求职简历的装置,包括:
第三生成单元,被配置成对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;以及
第二匹配单元,被配置成计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成。
第三方面,本发明实施例还提供了一种匹配招聘职位与求职简历的方法,包括:
对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;
计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成。
第四方面,本发明实施例还提供了一种匹配招聘职位与求职简历的方法,包括:
对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;
计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成。
该装置和方法至少能实现如下效果之一:在对招聘职位和求职简历进行匹配时,计算招聘职位对应的技能标签树和求职简历对应的技能标签树之间的第一匹配度,根据该第一匹配度对多个求职简历或者多个招聘职位进行排序,通过使用技能标签树之间的第一匹配度来量化招聘职位和求职简历的匹配程度,而不再通过关键词的形式是否相同来进行匹配,便于对招聘职位和求职简历进行准确匹配,解决语言表达的多样性导致现有的基于关键词的招聘职位与求职简历匹配准确率低的问题。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
图1是根据本公开内容的一个实施方式的匹配招聘职位与求职简历的装置的示例性框图;
图2是图1中第一匹配单元11一实施例的示例性框图;
图3是根据本公开内容的一个实施方式的匹配招聘职位与求职简历的装置的示例性框图;
图4是图3中第二匹配单元31一实施例的示例性框图;
图5是根据本公开内容的一个实施方式的匹配招聘职位与求职简历的方法的示例性流程图;
图6是根据本公开内容的另一个实施方式的匹配招聘职位与求职简历的方法的部分示例性流程图;
图7是根据本公开内容的一个实施方式的匹配招聘职位与求职简历的方法的示例性流程图;
图8是根据本公开内容的另一个实施方式的匹配招聘职位与求职简历的方法的部分示例性流程图。
具体实施方式
在下文中将结合附图对本公开内容的示例性实施方式进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中可以做出很多特定于实施方式的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施方式的不同而有所改变。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开内容的方案密切相关的装置结构,而省略了与本公开关系不大的其他细节。
应理解的是,本公开内容并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施方式可以相互组合、不同实施方式之间的特征替换或借用、在一个实施方式中省略一个或多个特征。
现有技术中在对招聘职位和求职简历进行匹配时,若招聘职位A的关键词包括A1和A2,求职简历B的关键词包括A1、A2和B1,因求职简历B的关键词中包含了招聘职位A的全部关键词,则将求职简历B作为与招聘职位A匹配的求职简历推荐给招聘职位A。这个过程匹配的依据是招聘职位的关键词和求职简历的关键词的形式一致,这就使得当求职简历C的关键词包括A2和与A1形式不同实质相同的关键词A3时,现有技术不会把求职简历C作为与招聘职位A匹配的求职简历推荐给招聘职位A,从而出现招聘职位和求职简历推荐不准确的问题。
为了解决现有技术出现的招聘职位和求职简历推荐不准确的问题,本发明公开一种招聘职位与求职简历匹配的方案,当需要对招聘职位P匹配n1(n1为正整数)个求职简历时可以通过执行下述步骤实现:
(1)从各大招聘网站中抓取招聘职位P所属的某一领域公开的招聘职位和求职简历作为样本,从抓取到的招聘职位样本的职位信息和求职简历样本的简历信息中提取结构化数据,对该结构化数据进行切词以得到切词结果,对该切词结果进行技能标签识别以得到技能标签,根据该技能标签生成技能标签图谱;
(2)对抓取到的求职简历样本进行聚类以得到至少一个求职简历类,对于该至少一个求职简历类中的每一个求职简历类中的每一个求职简历样本,将该求职简历样本对应的技能标签对应于该技能标签图谱生成第二技能标签树,将该求职简历类中各个求职简历样本对应的第二技能标签树形成的集合作为一个技能标签树类;
(3)从招聘职位P对应的职位信息中提取结构化数据以得到第一结构化数据,对该第一结构化数据进行切词以得到第一切词结果,对该第一切词结果进行技能标签识别以得到第一技能标签,将该第一技能标签对应于该技能标签图谱生成第一技能标签树,计算步骤(2)得到的每一个技能标签树类中任一个第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度,对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果;
(4)判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等(n1和n2为正整数,且n2=n1+1):若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的求职简历作为与该待处理的招聘职位匹配的求职简历;或者若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树作为第三技能标签树,计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历,其中,该第四技能标签树的数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
经过上述4个步骤即可对招聘职位P匹配n1个求职简历,得到匹配的求职简历之后,可以将匹配的求职简历推荐给发布该招聘职位P的招聘方。
而当需要对求职简历Q匹配n1个招聘职位时可以通过执行下述步骤实现:
(a)从各大招聘网站中抓取求职简历Q所属的某一领域公开的招聘职位和求职简历作为样本,从抓取到的招聘职位样本的职位信息和求职简历样本的简历信息中提取结构化数据,对该结构化数据进行切词以得到切词结果,对该切词结果进行技能标签识别以得到技能标签,根据该技能标签生成技能标签图谱;
(b)对抓取到的招聘职位样本进行聚类以得到至少一个招聘职位类,对于该至少一个招聘职位类中的每一个招聘职位类中的每一个招聘职位样本,将该招聘职位样本对应的技能标签对应于该技能标签图谱生成第六技能标签树,将该招聘职位类中各个招聘职位样本对应的第六技能标签树形成的集合作为一个技能标签树类;
(c)从求职简历P对应的职位信息中提取结构化数据以得到第二结构化数据,对该第二结构化数据进行切词以得到第二切词结果,对该第二切词结果进行技能标签识别以得到第二技能标签,将该第二技能标签对应于该技能标签图谱生成第五技能标签树,计算步骤(b)得到的每一个技能标签树类中任一个第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度,对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果;
(d)判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等:若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的招聘职位作为与该待处理的求职简历匹配的招聘职位;或者若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第六技能标签树作为第七技能标签树,计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位,其中,该第八技能标签树的数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
经过上述4个步骤即可对求职简历Q匹配n1个招聘职位,得到匹配的招聘职位之后,可以将匹配的招聘职位推荐给发布该求职简历Q的求职者。
下面,对本发明匹配招聘职位与求职简历的装置和方法进行详细说明。
参看图1,本发明公开一种匹配招聘职位与求职简历的装置,包括:
第一生成单元10,被配置成对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;以及
第一匹配单元11,被配置成计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成。
本实施例中,可以理解的是,技能标签为与技能有关的标签,比如Java开发、数据库、MySQL等。技能标签图谱包括根据多个技能标签生成的有向图,具体过程同前述步骤(1),此处不再赘述。需要说明的是,该有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系(从节点B1指向节点B2,表示节点B1是节点B2的上位概念),每一个节点对应一个权重,节点越下位,对应的权重越大。第一技能标签树的生成过程为:将第一技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第一技能标签进行标记。后续在对第一技能标签树进行运算时,只使用标记过的技能标签。多个第二技能标签树经由对应的求职简历的技能标签生成的过程同第一技能标签树,此处不再赘述。第一匹配度用于标识招聘职位与求职简历之间的匹配程度,对于多个第二技能标签树中的每一个第二技能标签树,该第二技能标签树相对于该第一技能标签树的第一匹配度越大,说明该待处理的招聘职位与该第二技能标签树对应的求职简历越匹配。
本发明实施例提供的匹配招聘职位与求职简历的装置,在对招聘职位进行求职简历匹配时,计算招聘职位对应的技能标签树和每一个求职简历对应的技能标签树之间的第一匹配度,根据该第一匹配度对多个求职简历进行排序,通过使用技能标签树之间的第一匹配度来量化招聘职位和求职简历的匹配程度,而不再通过关键词的形式是否相同来进行匹配,便于对招聘职位和求职简历进行准确匹配,解决语言表达的多样性导致现有的基于关键词的招聘职位与求职简历匹配准确率低的问题。
在前述装置实施例的基础上,其中,所述第一生成单元,可以被配置成从该职位信息中提取结构化数据以得到第一结构化数据,对该第一结构化数据进行切词以得到第一切词结果,对该第一切词结果进行技能标签识别以得到该第一技能标签。
本实施例中,需要说明的是,第一结构化数据是对该职位信息的各个部分进行分块得到的块数据。具体地,第一结构化数据可以包括职位名称、工作地点、招聘人数、薪资、学历要求、专业要求、年龄要求、岗位职责、职位要求、福利待遇、公司简介。技能标签识别可以使用自然语言处理技术NLP,此处不再赘述。本实施例中,所述多个求职简历中的每一个求职简历的技能标签的生成过程与该第一技能标签的生成过程一致,此处不再赘述。
在前述装置实施例的基础上,其中,所述第一匹配单元,可以被配置成对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度。
本实施例中,需要说明的是,从该技能标签树类中选取第二技能标签树时可以随机选取,在从该技能标签树类中选取一个第二技能标签树后,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度,能够减少第一匹配度计算的运算量,便于提高匹配效率。
需要说明的是,对所述第二技能标签树进行聚类可以通过对所述多个求职简历进行聚类实现,具体地,可以将所述多个求职简历的聚类结果中每一个聚类下的求职简历对应的第二技能标签树作为一个技能标签树类。对求职简历进行聚类时可以使用对应的技能标签对应的权重生成的向量来标识求职简历,并根据该向量来计算求职简历之间的距离。其中,该向量的生成过程可以为:为一个求职简历生成一个元素数量为V的向量,V为所有的求职简历对应的技能标签形成的集合W中元素的数量,该向量中每一个元素对应集合W中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该求职简历对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
在前述装置实施例的基础上,其中,所述第一匹配单元,可以被配置成对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历。
本实施例中,可以理解的是,根据该排序结果从所述多个求职简历中确定出的与该待处理的招聘职位匹配的求职简历对应的第一匹配度排在靠前的位置,以此保证确定出的求职简历为与该待处理的招聘职位匹配的求职简历。
图2是图1中第一匹配单元11一实施例的示例性框图,在前述装置实施例的基础上,其中,所述第一匹配单元11,可以包括:
第一判断子单元20,被配置成判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等,其中,n1为针对该第一匹配度的排序的批次取值范围,n1和n2为正整数,且n2=n1+1,使第一匹配度的第n2个取值在批次取值范围外;
第一匹配子单元21,被配置成若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的求职简历作为与该待处理的招聘职位匹配的求职简历;或者
若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树作为第三技能标签树,计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历,其中,该第四技能标签树的数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
本实施例中,可以理解的是,若该第一个匹配度的第n1个取值与该第n2个取值相等,则需要对该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树(即第三技能标签树)进行再次排序,根据再次排序的结果从该第三技能标签树中选取数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量的第三技能标签树作为第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历。再次排序的过程可以为:计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的匹配度从该第三技能标签树中选取第三技能标签树作为第四技能标签树。具体地,该第四技能标签树的选取方法可以为从该第三技能标签树中选取对应的求职简历的非技能标签形成的非技能标签集合与该待处理的招聘职位的非技能标签形成的非技能标签集合之间的匹配度最大的前n3个第三技能标签树作为该第四技能标签树,其中,n3为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
需要说明的是,非技能标签为与技能无关的标签,比如招聘职位的职位信息中的工作地点、招聘人数、薪资、学历要求、专业要求、年龄要求等,求职简历的简历信息中的工作地点、薪资要求、学历、专业、年龄、性别等。该待处理的招聘职位的非技能标签可以通过对该第一切词结果进行非技能标签识别得到,具体在实现时,可以使用自然语言处理技术NLP识别出标签和技能标签,然后将标签中除技能标签外的其它标签作为非技能标签。求职简历的非技能标签的生成过程可以包括:从求职简历的简历信息中提取结构化数据,对提取到的结构化数据进行切词以得到切词结果,对得到的切词结果进行非技能标签识别,其中,非技能标签识别的过程与对该第一切词结果进行非技能标签识别一致,此处不再赘述。
本实施例中,先根据技能标签树之间的第一匹配度大小对所有待选的第二技能标签树进行排序,然后根据排序结果决定是否进行下一轮的排序,通过二轮排序策略来确定出与该待处理的招聘职位匹配的求职简历,能够得到较为准确的结果。
在前述装置实施例的基础上,其中,该待处理的招聘职位的非技能标签形成的非技能标签集合x1与该第三技能标签树对应的求职简历中求职简历的非技能标签形成的非技能标签集合y1之间的第二匹配度S′x1,y1的计算公式可以为其中,Mx1,y1为非技能标签集合y1中属于预设的第一非技能标签类别的非技能标签形成的集合与非技能标签集合x1中属于该第一非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,L为非技能标签集合x1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合y1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Lx1,y1,l为对非技能标签集合x1中所属的非技能标签类别为L中第l个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合y1中所属的非技能标签类别为该交集中第l个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
本实施例中,需要说明的是,第一非技能标签类别可以为能够根据包含的非技能标签的取值确定出招聘信息与求职简历在该非技能标签上是否匹配的非技能标签类别。比如非技能标签类别包括年龄标签类别(包括年龄标签)、薪资标签类别(包括薪资标签)、工作地点标签类别(包括工作地点标签)、学历标签类别(包括学历标签标签)和专业标签类别(包括专业标签标签),根据年龄标签的取值可以确定出招聘信息与求职简历在年龄标签上是否匹配,根据薪资标签的取值可以确定出招聘信息与求职简历在薪资标签上是否匹配,根据工作地点标签的取值可以确定出招聘信息与求职简历在工作地点标签上是否匹配,根据学历标签的取值可以确定出招聘信息与求职简历在学历标签上是否匹配,而由于各个学校对于某一学院下的专业的命名可能不同,使得单根据专业名称是否一致很难确定求职简历的简历信息中的专业是否满足招聘职位的职位信息中的专业要求,因而专业标签类别不能作为第一非技能标签类别,年龄标签类别、薪资标签类别、工作地点标签类别和学历标签类别可以作为第一非技能标签类别。
可以理解的是,非技能标签对应的词向量可以通过将非技能标签输入Word2vec模型生成,此处不再赘述。
在前述装置实施例的基础上,其中,该第一技能标签树t1与第二技能标签树t2之间的第一匹配度可以为对该第一技能标签树t1与第二技能标签树t2中相同技能标签对应的权重求和的结果。
本实施例中,技能标签对应的权重的大小能够标识其优先级的高低,权重越大,对应的技能标签的优先级越高。根据权重计算技能标签树之间的匹配度充分利用了技能标签之间的优先级,因而能够较为准确地确定出技能标签树之间的第一匹配度。
在前述装置实施例的基础上,其中,所述装置还可以包括:
第二生成单元,被配置成在所述第一匹配单元工作之前,生成所述第二技能标签树,具体可以被配置成:
从招聘职位样本对应的职位信息中和求职简历样本对应的简历信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个求职简历样本,从该求职简历样本对应的简历信息中提取技能标签,将该求职简历样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个求职简历样本对应的技能标签树作为所述第二技能标签树。
本实施例中,提取技能标签的过程与前述实施例中第一技能标签的提取过程一致,生成技能标签树的过程与前述实施例中第一技能标签树的生成过程一致,此处不再赘述。
参看图3,本发明公开一种匹配招聘职位与求职简历的装置,包括:
第三生成单元30,被配置成对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;以及
第二匹配单元31,被配置成计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成。
本实施例中,可以理解的是,技能标签图谱包括根据多个技能标签生成的有向图,具体过程同前述步骤(a),此处不再赘述。需要说明的是,该有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大。第二技能标签树的生成过程为:将第二技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第二技能标签进行标记。后续在对第二技能标签树进行运算时,只使用标记过的技能标签。多个第六技能标签树经由对应的招聘职位的技能标签生成的过程同第五技能标签树,此处不再赘述。第一匹配度用于标识求职简历与招聘职位之间的匹配程度,对于多个第六技能标签树中的每一个第六技能标签树,该第六技能标签树相对于该第五技能标签树的第一匹配度越大,说明该待处理的求职简历与该第六技能标签树对应的招聘职位越匹配。
本发明实施例提供的匹配招聘职位与求职简历的装置,在对求职简历进行招聘职位匹配时,计算求职简历对应的技能标签树和每一个招聘职位对应的技能标签树之间的第一匹配度,根据该第一匹配度对多个招聘职位进行排序,通过使用技能标签树之间的第一匹配度来量化求职简历和招聘职位的匹配程度,而不再通过关键词的形式是否相同来进行匹配,便于对求职简历和招聘职位进行准确匹配,解决语言表达的多样性导致现有的基于关键词的招聘职位与求职简历匹配准确率低的问题。
在前述装置实施例的基础上,其中,所述第三生成单元,可以被配置成从该简历信息中提取结构化数据以得到第二结构化数据,对该第二结构化数据进行切词以得到第二切词结果,对该第二切词结果进行技能标签识别以得到该第二技能标签。
本实施例中,需要说明的是,第二结构化数据是对该简历信息的各个部分进行分块得到的块数据。具体地,第二结构化数据可以包括姓名、籍贯、年龄、性别、学历、专业、期望薪资、个人简述、工作经历、职业技能、性格描述。技能标签识别可以使用自然语言处理技术NLP,此处不再赘述。本实施例中,所述多个招聘职位中的每一个招聘职位的技能标签的生成过程与该第二技能标签的生成过程一致,此处不再赘述。
在前述装置实施例的基础上,其中,所述第二匹配单元,可以被配置成对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度。
本实施例中,需要说明的是,从该技能标签树类中选取第六技能标签树时可以随机选取,在从该技能标签树类中选取一个第六技能标签树后,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度,能够减少第一匹配度计算的运算量,提高匹配效率。
需要说明的是,对所述第六技能标签树进行聚类可以通过对所述多个招聘职位进行聚类实现,具体地,可以将所述多个招聘职位的聚类结果中每一个聚类下的招聘职位对应的第六技能标签树作为一个技能标签树类。对招聘职位进行聚类时可以使用对应的技能标签对应的权重生成的向量来标识招聘职位,并根据该向量来计算招聘职位之间的距离。其中,该向量的生成过程可以为:为一个招聘职位生成一个元素数量为X的向量,X为所有的招聘职位对应的技能标签形成的集合Y中元素的数量,该向量中每一个元素对应集合Y中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该招聘职位对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
在前述装置实施例的基础上,其中,所述第二匹配单元,可以被配置成对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位。
本实施例中,可以理解的是,根据该排序结果从所述多个招聘职位中确定出的与该待处理的求职简历匹配的招聘职位对应的第一匹配度排在靠前的位置,以此保证确定出的招聘职位为与该待处理的求职简历匹配的招聘职位。
图4是图3中第二匹配单元31一实施例的示例性框图,在前述装置实施例的基础上,其中,所述第二匹配单元31,可以包括:
第二判断子单元40,被配置成判断该排序结果中第一个匹配度的第m1个取值是否与该排序结果中第m2个取值相等,其中,m1为针对该第一匹配度的排序的批次取值范围,m1和m2为正整数,且m2=m1+1,使第一匹配度的第m2个取值在批次取值范围外;
第二匹配子单元41,被配置成若该第一个匹配度的第m1个取值与该第m2个取值不相等,则将该排序结果中第一个匹配度的前m1个取值对应的招聘职位作为与该待处理的求职简历匹配的招聘职位;或者
若该第一个匹配度的第m1个取值与该第m2个取值相等,则将该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树作为第七技能标签树,计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位,其中,该第八技能标签树的数量为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量。
本实施例中,可以理解的是,若该第一个匹配度的第m1个取值与该第m2个取值相等,则需要对该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树(即第七技能标签树)进行再次排序,根据再次排序的结果从该第七技能标签树中选取数量为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量的第七技能标签树作为第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位。再次排序的过程可以为:计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的匹配度从该第七技能标签树中选取第七技能标签树作为第八技能标签树。具体地,该第八技能标签树的选取方法可以为从该第七技能标签树中选取对应的招聘职位的非技能标签形成的非技能标签集合与该待处理的求职简历的非技能标签形成的非技能标签集合之间的匹配度最大的前m3个第七技能标签树作为该第八技能标签树,其中,m3为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量。
需要说明的是,该待处理的求职简历的非技能标签可以通过对该第二切词结果进行非技能标签识别得到,具体在实现时,可以使用自然语言处理技术NLP识别出标签和技能标签,然后将标签中除技能标签外的其它标签作为非技能标签。招聘职位的非技能标签的生成过程可以包括:从招聘职位的职位信息中提取结构化数据,对提取到的结构化数据进行切词以得到切词结果,对得到的切词结果进行非技能标签识别,其中,非技能标签识别的过程与对该第二切词结果进行非技能标签识别一致,此处不再赘述。
本实施例中,先根据技能标签树之间的第一匹配度大小对所有待选的技能标签树进行排序,然后根据排序结果决定是否进行下一轮的排序,通过二轮排序策略来确定出与该待处理的求职简历匹配的招聘职位,能够得到较为准确的结果。
在前述装置实施例的基础上,其中,该待处理的求职简历的非技能标签形成的非技能标签集合y2与该第七技能标签树对应的招聘职位中招聘职位的非技能标签形成的非技能标签集合x2之间的第二匹配度S″y2,x2的计算公式可以为其中,My2,x2为非技能标签集合x2中属于预设的第二非技能标签类别的非技能标签形成的集合与非技能标签集合y2中属于该第二非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,K为非技能标签集合y2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合x2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Ly2,x2,k为对非技能标签集合y2中所属的非技能标签类别为K中第k个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合x2中所属的非技能标签类别为该交集中第k个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
本实施例中,需要说明的是,第二非技能标签类别可以为能够根据包含的非技能标签的取值确定出招聘信息与求职简历在该非技能标签上是否匹配的非技能标签类别。可以理解的是,非技能标签对应的词向量可以通过将非技能标签输入Word2vec模型生成,此处不再赘述。
在前述装置实施例的基础上,其中,该第五技能标签树t3与第六技能标签树t4之间的第一匹配度可以为对该第五技能标签树t3与第六技能标签树t4中相同技能标签对应的权重求和的结果。
本实施例中,技能标签对应的权重的大小能够标识其优先级的高低,权重越大,对应的技能标签的优先级越高。根据权重计算技能标签树之间的匹配度充分利用了技能标签之间的优先级,因而能够较为准确地确定出技能标签树之间的第一匹配度。
在前述装置实施例的基础上,其中,还可以包括:
第四生成单元,被配置成在所述第二匹配单元工作之前,生成所述第六技能标签树,其中,所述第四生成单元,具体可以被配置成:
从求职简历样本对应的简历信息和招聘职位样本对应的职位信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个招聘职位样本,从该招聘职位样本对应的职位信息中提取技能标签,将该招聘职位样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个招聘职位样本对应的技能标签树作为所述第六技能标签树。
本实施例中,提取技能标签的过程与前述实施例中第二技能标签的提取过程一致,生成技能标签树的过程与前述实施例中第五技能标签树的生成过程一致,此处不再赘述。
参看图5,本发明公开一种匹配招聘职位与求职简历的方法,包括:
S50、对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;
S51、计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成。
本实施例中,可以理解的是,技能标签为与技能有关的标签。技能标签图谱包括根据多个技能标签生成的有向图,该有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大。第一技能标签树的生成过程为:将第一技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第一技能标签进行标记。后续在对第一技能标签树进行运算时,只使用标记过的技能标签。多个第二技能标签树经由对应的求职简历的技能标签生成的过程同第一技能标签树,此处不再赘述。第一匹配度用于标识招聘职位与求职简历之间的匹配程度,对于多个第二技能标签树中的每一个第二技能标签树,该第二技能标签树相对于该第一技能标签树的第一匹配度越大,说明该待处理的招聘职位与该第二技能标签树对应的求职简历越匹配。
本发明实施例提供的匹配招聘职位与求职简历的方法,在对招聘职位进行求职简历匹配时,计算招聘职位对应的技能标签树和每一个求职简历对应的技能标签树之间的第一匹配度,根据该第一匹配度对多个求职简历进行排序,通过使用技能标签树之间的第一匹配度来量化招聘职位和求职简历的匹配程度,而不再通过关键词的形式是否相同来进行匹配,便于对招聘职位和求职简历进行准确匹配,解决语言表达的多样性导致现有的基于关键词的招聘职位与求职简历匹配准确率低的问题。
在前述方法实施例的基础上,其中,所述用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,可以包括:
从该职位信息中提取结构化数据以得到第一结构化数据,对该第一结构化数据进行切词以得到第一切词结果,对该第一切词结果进行技能标签识别以得到该第一技能标签。
本实施例中,需要说明的是,第一结构化数据是对该职位信息的各个部分进行分块得到的块数据。技能标签识别可以使用自然语言处理技术NLP。本实施例中,所述多个求职简历中的每一个求职简历的技能标签的生成过程与该第一技能标签的生成过程一致,此处不再赘述。
在前述方法实施例的基础上,其中,所述计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,可以包括:
对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度。
本实施例中,需要说明的是,从该技能标签树类中选取第二技能标签树时可以随机选取,在从该技能标签树类中选取一个第二技能标签树后,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度,能够减少第一匹配度计算的运算量,便于提高匹配效率。
需要说明的是,对所述第二技能标签树进行聚类可以通过对所述多个求职简历进行聚类实现,具体地,可以将所述多个求职简历的聚类结果中每一个聚类下的求职简历对应的第二技能标签树作为一个技能标签树类。对求职简历进行聚类时可以使用对应的技能标签对应的权重生成的向量来标识求职简历,并根据该向量来计算求职简历之间的距离。其中,该向量的生成过程可以为:为一个求职简历生成一个元素数量为V的向量,V为所有的求职简历对应的技能标签形成的集合W中元素的数量,该向量中每一个元素对应集合W中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该求职简历对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
在前述方法实施例的基础上,其中,所述用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,可以包括:
对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历。
本实施例中,可以理解的是,根据该排序结果从所述多个求职简历中确定出的与该待处理的招聘职位匹配的求职简历对应的第一匹配度排在靠前的位置,以此保证确定出的求职简历为与该待处理的招聘职位匹配的求职简历。
图6是根据本公开内容的另一个实施方式的匹配招聘职位与求职简历的方法的部分示例性流程图,参看图6,在前述方法实施例的基础上,其中,所述根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历,可以包括:
S60、判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等,其中,n1为针对该第一匹配度的排序的批次取值范围,n1和n2为正整数,且n2=n1+1,使第一匹配度的第n2个取值在批次取值范围外;
S61、若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的求职简历作为与该待处理的招聘职位匹配的求职简历;或者
若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树作为第三技能标签树,计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历,其中,该第四技能标签树的数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
本实施例中,可以理解的是,若该第一个匹配度的第n1个取值与该第n2个取值相等,则需要对该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树(即第三技能标签树)进行再次排序,根据再次排序的结果从该第三技能标签树中选取数量为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量的第三技能标签树作为第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历。再次排序的过程可以为:计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的匹配度从该第三技能标签树中选取第三技能标签树作为第四技能标签树。具体地,该第四技能标签树的选取方法可以为从该第三技能标签树中选取对应的求职简历的非技能标签形成的非技能标签集合与该待处理的招聘职位的非技能标签形成的非技能标签集合之间的匹配度最大的前n3个第三技能标签树作为该第四技能标签树,其中,n3为该前n1个第一匹配度中取值为第n1个取值的第一匹配度的数量。
需要说明的是,非技能标签为与技能无关的标签,比如招聘职位的职位信息中的工作地点、招聘人数、薪资、学历要求、专业要求、年龄要求等,求职简历的简历信息中的工作地点、薪资要求、学历、专业、年龄、性别等。该待处理的招聘职位的非技能标签可以通过对该第一切词结果进行非技能标签识别得到,具体在实现时,可以使用自然语言处理技术NLP识别出标签和技能标签,然后将标签中除技能标签外的其它标签作为非技能标签。求职简历的非技能标签的生成过程可以包括:从求职简历的简历信息中提取结构化数据,对提取到的结构化数据进行切词以得到切词结果,对得到的切词结果进行非技能标签识别,其中,非技能标签识别的过程与对该第一切词结果进行非技能标签识别一致,此处不再赘述。
本实施例中,先根据技能标签树之间的第一匹配度大小对所有待选的第二技能标签树进行排序,然后根据排序结果决定是否进行下一轮的排序,通过二轮排序策略来确定出与该待处理的招聘职位匹配的求职简历,能够得到较为准确的结果。
在前述方法实施例的基础上,其中,该待处理的招聘职位的非技能标签形成的非技能标签集合x1与该第三技能标签树对应的求职简历中求职简历的非技能标签形成的非技能标签集合y1之间的第二匹配度S′x1,y1的计算公式可以为其中,Mx1,y1为非技能标签集合y1中属于预设的第一非技能标签类别的非技能标签形成的集合与非技能标签集合x1中属于该第一非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,L为非技能标签集合x1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合y1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Lx1,y1,l为对非技能标签集合x1中所属的非技能标签类别为L中第l个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合y1中所属的非技能标签类别为该交集中第l个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
本实施例中,需要说明的是,第一非技能标签类别可以为能够根据包含的非技能标签的取值确定出招聘信息与求职简历在该非技能标签上是否匹配的非技能标签类别。
可以理解的是,非技能标签对应的词向量可以通过将非技能标签输入Word2vec模型生成,此处不再赘述。
在前述方法实施例的基础上,其中,该第一技能标签树t1与第二技能标签树t2之间的第一匹配度可以为对该第一技能标签树t1与第二技能标签树t2中相同技能标签对应的权重求和的结果。
本实施例中,技能标签对应的权重的大小能够标识其优先级的高低,权重越大,对应的技能标签的优先级越高。根据权重计算技能标签树之间的匹配度充分利用了技能标签之间的优先级,因而能够较为准确地确定出技能标签树之间的第一匹配度。
在前述方法实施例的基础上,其中,在所述计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度之前,还可以包括:
生成所述第二技能标签树,其中,所述生成所述第二技能标签树,可以包括:
从招聘职位样本对应的职位信息中和求职简历样本对应的简历信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个求职简历样本,从该求职简历样本对应的简历信息中提取技能标签,将该求职简历样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个求职简历样本对应的技能标签树作为所述第二技能标签树。
本实施例中,提取技能标签的过程与前述实施例中第一技能标签的提取过程一致,生成技能标签树的过程与前述实施例中第一技能标签树的生成过程一致,此处不再赘述。
参看图7,本发明公开一种匹配招聘职位与求职简历的方法,其中,包括:
S70、对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;
S71、计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成。
本实施例中,可以理解的是,技能标签图谱包括根据多个技能标签生成的有向图,具体过程同前述步骤(a),此处不再赘述。需要说明的是,该有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大。第二技能标签树的生成过程为:将第二技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第二技能标签进行标记。后续在对第二技能标签树进行运算时,只使用标记过的技能标签。多个第六技能标签树经由对应的招聘职位的技能标签生成的过程同第五技能标签树,此处不再赘述。第一匹配度用于标识求职简历与招聘职位之间的匹配程度,对于多个第六技能标签树中的每一个第六技能标签树,该第六技能标签树相对于该第五技能标签树的第一匹配度越大,说明该待处理的求职简历与该第六技能标签树对应的招聘职位越匹配。
本发明实施例提供的匹配招聘职位与求职简历的方法,在对求职简历进行招聘职位匹配时,计算求职简历对应的技能标签树和每一个招聘职位对应的技能标签树之间的第一匹配度,根据该第一匹配度对多个招聘职位进行排序,通过使用技能标签树之间的第一匹配度来量化求职简历和招聘职位的匹配程度,而不再通过关键词的形式是否相同来进行匹配,便于对求职简历和招聘职位进行准确匹配,解决语言表达的多样性导致现有的基于关键词的招聘职位与求职简历匹配准确率低的问题。
在前述方法实施例的基础上,其中,所述用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,可以包括:
从该简历信息中提取结构化数据以得到第二结构化数据,对该第二结构化数据进行切词以得到第二切词结果,对该第二切词结果进行技能标签识别以得到该第二技能标签。
本实施例中,需要说明的是,第二结构化数据是对该简历信息的各个部分进行分块得到的块数据。技能标签识别可以使用自然语言处理技术NLP,此处不再赘述。本实施例中,所述多个招聘职位中的每一个招聘职位的技能标签的生成过程与该第二技能标签的生成过程一致,此处不再赘述。
在前述方法实施例的基础上,其中,所述计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,可以包括:
对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度。
本实施例中,需要说明的是,从该技能标签树类中选取第六技能标签树时可以随机选取,在从该技能标签树类中选取一个第六技能标签树后,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度,能够减少第一匹配度计算的运算量,提高匹配效率。
需要说明的是,对所述第六技能标签树进行聚类可以通过对所述多个招聘职位进行聚类实现,具体地,可以将所述多个招聘职位的聚类结果中每一个聚类下的招聘职位对应的第六技能标签树作为一个技能标签树类。对招聘职位进行聚类时可以使用对应的技能标签对应的权重生成的向量来标识招聘职位,并根据该向量来计算招聘职位之间的距离。其中,该向量的生成过程可以为:为一个招聘职位生成一个元素数量为X的向量,X为所有的招聘职位对应的技能标签形成的集合Y中元素的数量,该向量中每一个元素对应集合Y中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该招聘职位对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
在前述方法实施例的基础上,其中,所述用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,可以包括:
对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位。
本实施例中,可以理解的是,根据该排序结果从所述多个招聘职位中确定出的与该待处理的求职简历匹配的招聘职位对应的第一匹配度排在靠前的位置,以此保证确定出的招聘职位为与该待处理的求职简历匹配的招聘职位。
图8是根据本公开内容的另一个实施方式的匹配招聘职位与求职简历的方法的部分示例性流程图,参看图8,在前述方法实施例的基础上,其中,所述根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位,可以包括:
S80、判断该排序结果中第一个匹配度的第m1个取值是否与该排序结果中第m2个取值相等,其中,m1为针对该第一匹配度的排序的批次取值范围,m1和m2为正整数,且m2=m1+1,使第一匹配度的第m2个取值在批次取值范围外;
S81、若该第一个匹配度的第m1个取值与该第m2个取值不相等,则将该排序结果中第一个匹配度的前m1个取值对应的招聘职位作为与该待处理的求职简历匹配的招聘职位;或者
若该第一个匹配度的第m1个取值与该第m2个取值相等,则将该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树作为第七技能标签树,计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位,其中,该第八技能标签树的数量为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量。
本实施例中,可以理解的是,若该第一个匹配度的第m1个取值与该第m2个取值相等,则需要对该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树(即第七技能标签树)进行再次排序,根据再次排序的结果从该第七技能标签树中选取数量为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量的第七技能标签树作为第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位。再次排序的过程可以为:计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的匹配度从该第七技能标签树中选取第七技能标签树作为第八技能标签树。具体地,该第八技能标签树的选取方法可以为从该第七技能标签树中选取对应的招聘职位的非技能标签形成的非技能标签集合与该待处理的求职简历的非技能标签形成的非技能标签集合之间的匹配度最大的前m3个第七技能标签树作为该第八技能标签树,其中,m3为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量。
需要说明的是,该待处理的求职简历的非技能标签可以通过对该第二切词结果进行非技能标签识别得到,具体在实现时,可以使用自然语言处理技术NLP识别出标签和技能标签,然后将标签中除技能标签外的其它标签作为非技能标签。招聘职位的非技能标签的生成过程可以包括:从招聘职位的职位信息中提取结构化数据,对提取到的结构化数据进行切词以得到切词结果,对得到的切词结果进行非技能标签识别,其中,非技能标签识别的过程与对该第二切词结果进行非技能标签识别一致,此处不再赘述。
本实施例中,先根据技能标签树之间的第一匹配度大小对所有待选的技能标签树进行排序,然后根据排序结果决定是否进行下一轮的排序,通过二轮排序策略来确定出与该待处理的求职简历匹配的招聘职位,能够得到较为准确的结果。
在前述方法实施例的基础上,其中,该待处理的求职简历的非技能标签形成的非技能标签集合y2与该第七技能标签树对应的招聘职位中招聘职位的非技能标签形成的非技能标签集合x2之间的第二匹配度S″y2,x2的计算公式为其中,My2,x2为非技能标签集合x2中属于预设的第二非技能标签类别的非技能标签形成的集合与非技能标签集合y2中属于该第二非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,K为非技能标签集合y2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合x2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Ly2,x2,k为对非技能标签集合y2中所属的非技能标签类别为K中第k个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合x2中所属的非技能标签类别为该交集中第k个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
本实施例中,需要说明的是,第二非技能标签类别可以为能够根据包含的非技能标签的取值确定出招聘信息与求职简历在该非技能标签上是否匹配的非技能标签类别。可以理解的是,非技能标签对应的词向量可以通过将非技能标签输入Word2vec模型生成,此处不再赘述。
在前述方法实施例的基础上,其中,该第五技能标签树t3与第六技能标签树t4之间的第一匹配度可以为对该第五技能标签树t3与第六技能标签树t4中相同技能标签对应的权重求和的结果。
本实施例中,技能标签对应的权重的大小能够标识其优先级的高低,权重越大,对应的技能标签的优先级越高。根据权重计算技能标签树之间的匹配度充分利用了技能标签之间的优先级,因而能够较为准确地确定出技能标签树之间的第一匹配度。
在前述方法实施例的基础上,其中,在所述计算该第二技能标签树与预设的第二技能标签树集合中每一个技能标签树之间的匹配度之前,还可以包括:
生成所述第六技能标签树,其中,所述生成所述第六技能标签树,具体可以包括:
从求职简历样本对应的简历信息和招聘职位样本对应的职位信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个招聘职位样本,从该招聘职位样本对应的职位信息中提取技能标签,将该招聘职位样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个招聘职位样本对应的技能标签树作为所述第六技能标签树。
本实施例中,提取技能标签的过程与前述实施例中第二技能标签的提取过程一致,生成技能标签树的过程与前述实施例中第五技能标签树的生成过程一致,此处不再赘述。
上文已经参考附图描述了本公开的优选实施例,当然,本公开并不限于上面的示例。在所附的权利要求的范围内,本领域的技术人员可以进行各种改变和修改,并且应当明白,这些改变和修改自然落入本公开的技术范围内。
Claims (40)
1.一种匹配招聘职位与求职简历的装置,其特征在于,包括:
第一生成单元,被配置成对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;以及
第一匹配单元,被配置成计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成;
其中,所述有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大;
所述第一技能标签树的生成过程为:将第一技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第一技能标签进行标记;后续在对第一技能标签树进行运算时,只使用标记过的技能标签;
所述第一匹配单元的被配置包括对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度;
聚类时可以使用对应的技能标签对应的权重生成的向量来标识求职简历,并根据该向量来计算求职简历之间的距离; 其中,该向量的生成过程可以为:为一个求职简历生成一个元素数量为V的向量,V为所有的求职简历对应的技能标签形成的集合W中元素的数量,该向量中每一个元素对应集合W中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该求职简历对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
2.根据权利要求1所述的装置,其特征在于,所述第一生成单元的被配置包括从该职位信息中提取结构化数据以得到第一结构化数据,对该第一结构化数据进行切词以得到第一切词结果,对该第一切词结果进行技能标签识别以得到该第一技能标签。
3.根据权利要求2所述的装置,其特征在于,所述第一匹配单元的被配置包括对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度。
4.根据权利要求3所述的装置,其特征在于,所述第一匹配单元的被配置还包括对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历。
5.根据权利要求4所述的装置,其特征在于,所述第一匹配单元,包括:
第一判断子单元,被配置成判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等,其中,n1为针对该第一匹配度的排序的批次取值范围,n1和n2为正整数,且n2=n1+1,使第一匹配度的第n2个取值在批次取值范围外;
第一匹配子单元,被配置成若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的求职简历作为与该待处理的招聘职位匹配的求职简历;或者
若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树作为第三技能标签树,计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历,其中,该第四技能标签树的数量为该前n1个第一匹配度中取值符合第n1个取值的第一匹配度的数量。
6.根据权利要求5所述的装置,其特征在于,所述第一匹配子单元的被配置包括从该第三技能标签树中选取对应的求职简历的非技能标签形成的非技能标签集合与该待处理的招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度最大的前n3个技能标签树作为该第四技能标签树,其中,n3为该前n1个第一匹配度中取值符合第n1个取值的第一匹配度的数量。
7.根据权利要求5所述的装置,其特征在于,该待处理的招聘职位的非技能标签形成的非技能标签集合x1与该第三技能标签树对应的求职简历中求职简历的非技能标签形成的非技能标签集合y1之间的第二匹配度S′x1,y1的计算公式可以为其中,Mx1,y1为非技能标签集合y1中属于预设的第一非技能标签类别的非技能标签形成的集合与非技能标签集合x1中属于该第一非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,L为非技能标签集合x1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合y1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Lx1,y1,l为对非技能标签集合x1中所属的非技能标签类别为L中第l个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合y1中所属的非技能标签类别为该交集中第l个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
8.根据权利要求1所述的装置,其特征在于,该第一技能标签树t1与第二技能标签树t2之间的第一匹配度为对该第一技能标签树t1与第二技能标签树t2中相同技能标签对应的权重求和的结果。
9.根据权利要求1所述的装置,其特征在于,还包括:
第二生成单元,被配置成在所述第一匹配单元工作之前,生成所述第二技能标签树。
10.根据权利要求9所述的装置,其特征在于,所述第二生成单元的被配置包括:
从招聘职位样本对应的职位信息中和求职简历样本对应的简历信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个求职简历样本,从该求职简历样本对应的简历信息中提取技能标签,将该求职简历样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个求职简历样本对应的技能标签树作为所述第二技能标签树。
11.一种匹配招聘职位与求职简历的装置,其特征在于,包括:
第三生成单元,被配置成对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;以及
第二匹配单元,被配置成计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成;
其中,所述有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大;
所述第二技能标签树的生成过程为:将第二技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第二技能标签进行标记;后续在对第二技能标签树进行运算时,只使用标记过的技能标签;
所述第二匹配单元的被配置包括对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度;
聚类时可以使用对应的技能标签对应的权重生成的向量来标识招聘职位,并根据该向量来计算招聘职位之间的距离;其中,该向量的生成过程可以为:为一个招聘职位生成一个元素数量为X的向量,X为所有的招聘职位对应的技能标签形成的集合Y中元素的数量,该向量中每一个元素对应集合Y中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该招聘职位对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
12.根据权利要求11所述的装置,其特征在于,所述第三生成单元的被配置包括从该简历信息中提取结构化数据以得到第二结构化数据,对该第二结构化数据进行切词以得到第二切词结果,对该第二切词结果进行技能标签识别以得到该第二技能标签。
13.根据权利要求12所述的装置,其特征在于,所述第二匹配单元的被配置包括对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度。
14.根据权利要求13所述的装置,其特征在于,所述第二匹配单元的被配置包括对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位。
15.根据权利要求14所述的装置,其特征在于,所述第二匹配单元,包括:
第二判断子单元,被配置成判断该排序结果中第一个匹配度的第m1个取值是否与该排序结果中第m2个取值相等,其中,m1为针对该第一匹配度的排序的批次取值范围,m1和m2为正整数,且m2=m1+1,使第一匹配度的第m2个取值在批次取值范围外;
第二匹配子单元,被配置成若该第一个匹配度的第m1个取值与该第m2个取值不相等,则将该排序结果中第一个匹配度的前m1个取值对应的招聘职位作为与该待处理的求职简历匹配的招聘职位;或者
若该第一个匹配度的第m1个取值与该第m2个取值相等,则将该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树作为第七技能标签树,计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位,其中,该第八技能标签树的数量为该前m1个第一匹配度中取值符合第m1个取值的第一匹配度的数量。
16.根据权利要求15所述的装置,其特征在于,所述第二匹配子单元的被配置包括从该第七技能标签树中选取对应的招聘职位的非技能标签形成的非技能标签集合与该待处理的求职简历的非技能标签形成的非技能标签集合之间的第二匹配度最大的前m3个技能标签树作为该第八技能标签树,其中,m3为该前m1个第一匹配度中取值为第m1个取值的第一匹配度的数量。
17.根据权利要求15所述的装置,其特征在于,该待处理的求职简历的非技能标签形成的非技能标签集合y2与该第七技能标签树对应的招聘职位中招聘职位的非技能标签形成的非技能标签集合x2之间的第二匹配度S″y2,x2的计算公式为其中,My2,x2为非技能标签集合x2中属于预设的第二非技能标签类别的非技能标签形成的集合与非技能标签集合y2中属于该第二非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,K为非技能标签集合y2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合x2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Ly2,x2,k为对非技能标签集合y2中所属的非技能标签类别为K中第k个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合x2中所属的非技能标签类别为该交集中第k个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
18.根据权利要求11所述的装置,其特征在于,该第五技能标签树t3与第六技能标签树t4之间的第一匹配度为对该第五技能标签树t3与第六技能标签树t4中相同技能标签对应的权重求和的结果。
19.根据权利要求11所述的装置,其特征在于,还包括:
第四生成单元,被配置成在所述第二匹配单元工作之前,生成所述第六技能标签树。
20.根据权利要求19所述的装置,其特征在于,所述第四生成单元的被配置包括:
从求职简历样本对应的简历信息和招聘职位样本对应的职位信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个招聘职位样本,从该招聘职位样本对应的职位信息中提取技能标签,将该招聘职位样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个招聘职位样本对应的技能标签树作为所述第六技能标签树。
21.一种匹配招聘职位与求职简历的方法,其特征在于,包括:
对于待处理的招聘职位,用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,并且该第一技能标签对应于技能标签图谱生成第一技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第一技能标签对应于至少一个的所述多个技能标签;
计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,其中,每一个所述第二技能标签树根据一个对应的求职简历的技能标签由该技能标签图谱生成;
其中,所述有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大;
所述第一技能标签树的生成过程为:将第一技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第一技能标签进行标记;后续在对第一技能标签树进行运算时,只使用标记过的技能标签;
所述计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,包括:
对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度;
聚类时可以使用对应的技能标签对应的权重生成的向量来标识求职简历,并根据该向量来计算求职简历之间的距离;其中,该向量的生成过程可以为:为一个求职简历生成一个元素数量为V的向量,V为所有的求职简历对应的技能标签形成的集合W中元素的数量,该向量中每一个元素对应集合W中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该求职简历对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
22.根据权利要求21所述的方法,其特征在于,所述用于从该待处理的招聘职位对应的职位信息中提取得到第一技能标签,包括:
从该职位信息中提取结构化数据以得到第一结构化数据,对该第一结构化数据进行切词以得到第一切词结果,对该第一切词结果进行技能标签识别以得到该第一技能标签。
23.根据权利要求22所述的方法,其特征在于,所述计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度,包括:
对所述第二技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第二技能标签树,计算该第二技能标签树相对于该第一技能标签树的第一匹配度作为该技能标签树类中各个第二技能标签树相对于该第一技能标签树的第一匹配度。
24.根据权利要求23所述的方法,其特征在于,所述用于根据该第一匹配度排序对应所述第二技能标签树的多个求职简历,包括:
对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历。
25.根据权利要求24所述的方法,其特征在于,所述根据该排序结果从所述多个求职简历中确定出与该待处理的招聘职位匹配的求职简历,包括:
判断该排序结果中第一个匹配度的第n1个取值是否与该排序结果中第n2个取值相等,其中,n1为针对该第一匹配度的排序的批次取值范围,n1和n2为正整数,且n2=n1+1,使第一匹配度的第n2个取值在批次取值范围外;
若该第一个匹配度的第n1个取值与该第n2个取值不相等,则将该排序结果中第一个匹配度的前n1个取值对应的求职简历作为与该待处理的招聘职位匹配的求职简历;或者
若该第一个匹配度的第n1个取值与该第n2个取值相等,则将该第一匹配度中取值为第n1个取值的第一匹配度对应的第二技能标签树作为第三技能标签树,计算该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中每一个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,将该排序结果的前n1个第一匹配度中取值与第n1个取值不相等的第一匹配度对应的第二技能标签树与该第四技能标签树的并集作为与该待处理的招聘职位匹配的求职简历,其中,该第四技能标签树的数量为该前n1个第一匹配度中取值符合第n1个取值的第一匹配度的数量。
26.根据权利要求25所述的方法,其特征在于,所述根据该待处理的招聘职位的非技能标签形成的非技能标签集合与该第三技能标签树对应的求职简历中各个求职简历的非技能标签形成的非技能标签集合之间的第二匹配度从该第三技能标签树中选取第四技能标签树,包括:
从该第三技能标签树中选取对应的求职简历的非技能标签形成的非技能标签集合与该待处理的招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度最大的前n3个技能标签树作为该第四技能标签树,其中,n3为该前n1个第一匹配度中取值符合第n1个取值的第一匹配度的数量。
27.根据权利要求25所述的方法,其特征在于,该待处理的招聘职位的非技能标签形成的非技能标签集合x1与该第三技能标签树对应的求职简历中求职简历的非技能标签形成的非技能标签集合y1之间的第二匹配度S′x1,y1的计算公式可以为其中,Mx1,y1为非技能标签集合y1中属于预设的第一非技能标签类别的非技能标签形成的集合与非技能标签集合x1中属于该第一非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,L为非技能标签集合x1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合y1中不属于该第一非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Lx1,y1,l为对非技能标签集合x1中所属的非技能标签类别为L中第l个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合y1中所属的非技能标签类别为该交集中第l个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
28.根据权利要求21所述的方法,其特征在于,该第一技能标签树t1与第二技能标签树t2之间的第一匹配度为对该第一技能标签树t1与第二技能标签树t2中相同技能标签对应的权重求和的结果。
29.根据权利要求21所述的方法,其特征在于,在所述计算任一的多个第二技能标签树相对于该第一技能标签树的第一匹配度之前,还包括:
生成所述第二技能标签树。
30.根据权利要求29所述的方法,其特征在于,所述生成所述第二技能标签树,包括:
从招聘职位样本对应的职位信息中和求职简历样本对应的简历信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个求职简历样本,从该求职简历样本对应的简历信息中提取技能标签,将该求职简历样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个求职简历样本对应的技能标签树作为所述第二技能标签树。
31.一种匹配招聘职位与求职简历的方法,其特征在于,包括:
对于待处理的求职简历,用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,并且该第二技能标签对应于技能标签图谱生成第五技能标签树,其中,该技能标签图谱包括多个技能标签生成的有向图,其中至少一个的该第二技能标签对应于至少一个的所述多个技能标签;
计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,其中,每一个所述第六技能标签树根据一个对应的招聘职位的技能标签由该技能标签图谱生成;
其中,所述有向图中每一个节点表示一个技能标签,节点之间的方向表示了节点之间的上下位关系,每一个节点对应一个权重,节点越下位,对应的权重越大;
所述第二技能标签树的生成过程为:将第二技能标签对应到技能标签图谱以得到连通图,该连通图为技能标签图的子图;对该连通图中的第二技能标签进行标记;后续在对第二技能标签树进行运算时,只使用标记过的技能标签;
所述计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,包括:
对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度;
聚类时可以使用对应的技能标签对应的权重生成的向量来标识招聘职位,并根据该向量来计算招聘职位之间的距离;其中,该向量的生成过程可以为:为一个招聘职位生成一个元素数量为X的向量,X为所有的招聘职位对应的技能标签形成的集合Y中元素的数量,该向量中每一个元素对应集合Y中一个技能标签;对该向量中的元素进行赋值,过程为:对于该向量中的每一个元素,判断该招聘职位对应的技能标签中是否包含该元素对应的技能标签,若包括,为该元素赋值该技能标签图谱中该技能标签的权重。
32.根据权利要求31所述的方法,其特征在于,所述用于从该待处理的求职简历对应的简历信息中提取得到第二技能标签,包括:
从该简历信息中提取结构化数据以得到第二结构化数据,对该第二结构化数据进行切词以得到第二切词结果,对该第二切词结果进行技能标签识别以得到该第二技能标签。
33.根据权利要求32所述的方法,其特征在于,所述计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度,包括:
对所述第六技能标签树进行聚类以得到至少一个技能标签树类,对于该至少一个技能标签树类中的每一个技能标签树类,从该技能标签树类中选取一个第六技能标签树,计算该第六技能标签树相对于该第五技能标签树的第一匹配度作为该技能标签树类中各个第六技能标签树相对于该第五技能标签树的第一匹配度。
34.根据权利要求33所述的方法,其特征在于,所述用于根据该第一匹配度排序对应所述第六技能标签树的多个招聘职位,包括:
对该第一匹配度按照取值从大到小的顺序进行排序以得到排序结果,根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位。
35.根据权利要求34所述的方法,其特征在于,所述根据该排序结果从所述多个招聘职位中确定出与该待处理的求职简历匹配的招聘职位,包括:
判断该排序结果中第一个匹配度的第m1个取值是否与该排序结果中第m2个取值相等,其中,m1为针对该第一匹配度的排序的批次取值范围,m1和m2为正整数,且m2=m1+1,使第一匹配度的第m2个取值在批次取值范围外;
若该第一个匹配度的第m1个取值与该第m2个取值不相等,则将该排序结果中第一个匹配度的前m1个取值对应的招聘职位作为与该待处理的求职简历匹配的招聘职位;或者
若该第一个匹配度的第m1个取值与该第m2个取值相等,则将该第一匹配度中取值为第m1个取值的第一匹配度对应的第六技能标签树作为第七技能标签树,计算该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中每一个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度,根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,将该排序结果的前m1个第一匹配度中取值与第m1个取值不相等的第一匹配度对应的第六技能标签树与该第八技能标签树的并集作为与该待处理的求职简历匹配的招聘职位,其中,该第八技能标签树的数量为该前m1个第一匹配度中取值符合第m1个取值的第一匹配度的数量。
36.根据权利要求35所述的方法,其特征在于,所述根据该待处理的求职简历的非技能标签形成的非技能标签集合与该第七技能标签树对应的招聘职位中各个招聘职位的非技能标签形成的非技能标签集合之间的第二匹配度从该第七技能标签树中选取第八技能标签树,包括:
从该第七技能标签树中选取对应的招聘职位的非技能标签形成的非技能标签集合与该待处理的求职简历的非技能标签形成的非技能标签集合之间的第二匹配度最大的前m3个技能标签树作为该第八技能标签树,其中,m3为该前m1个第一匹配度中取值符合第m1个取值的第一匹配度的数量。
37.根据权利要求35所述的方法,其特征在于,该待处理的求职简历的非技能标签形成的非技能标签集合y2与该第七技能标签树对应的招聘职位中招聘职位的非技能标签形成的非技能标签集合x2之间的第二匹配度S″y2,x2的计算公式为其中,My2,x2为非技能标签集合x2中属于预设的第二非技能标签类别的非技能标签形成的集合与非技能标签集合y2中属于该第二非技能标签类别的非技能标签形成的集合中一致的非技能标签的数量,α为预设的参数,K为非技能标签集合y2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合与非技能标签集合x2中不属于该第二非技能标签类别的非技能标签所属的非技能标签类别形成的集合的交集中非技能标签类别的数量,Ly2,x2,k为对非技能标签集合y2中所属的非技能标签类别为K中第k个非技能标签类别的每一个非技能标签对应的词向量,与非技能标签集合x2中所属的非技能标签类别为该交集中第k个非技能标签类别的每一个非技能标签对应的词向量之间的距离求和的结果。
38.根据权利要求31所述的方法,其特征在于,该第五技能标签树t3与第六技能标签树t4之间的第一匹配度为对该第五技能标签树t3与第六技能标签树t4中相同技能标签对应的权重求和的结果。
39.根据权利要求31所述的方法,其特征在于,在所述计算任一的多个第六技能标签树相对于该第五技能标签树的第一匹配度之前,还包括:
生成所述第六技能标签树。
40.根据权利要求39所述的方法,其特征在于,所述生成所述第六技能标签树,包括:
从求职简历样本对应的简历信息和招聘职位样本对应的职位信息中提取出技能标签,根据提取出的技能标签生成该技能标签图谱;
对于每一个招聘职位样本,从该招聘职位样本对应的职位信息中提取技能标签,将该招聘职位样本对应的技能标签对应于该技能标签图谱生成技能标签树,将各个招聘职位样本对应的技能标签树作为所述第六技能标签树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910199606.5A CN109918483B (zh) | 2019-03-15 | 2019-03-15 | 匹配招聘职位与求职简历的装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910199606.5A CN109918483B (zh) | 2019-03-15 | 2019-03-15 | 匹配招聘职位与求职简历的装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109918483A CN109918483A (zh) | 2019-06-21 |
CN109918483B true CN109918483B (zh) | 2021-07-16 |
Family
ID=66965143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910199606.5A Active CN109918483B (zh) | 2019-03-15 | 2019-03-15 | 匹配招聘职位与求职简历的装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918483B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627135B (zh) * | 2020-05-08 | 2023-09-29 | 百度在线网络技术(北京)有限公司 | 一种招聘岗位描述文本的生成方法、装置、设备及介质 |
CN111798214B (zh) * | 2020-07-10 | 2022-11-29 | 河北冀联人力资源服务集团有限公司 | 职位技能标签生成系统及方法 |
CN117314381A (zh) * | 2023-11-29 | 2023-12-29 | 山东杰出人才发展集团有限公司 | 一种基于智能数据分析的人岗匹配系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574788A (zh) * | 2016-02-05 | 2016-05-11 | 北京普猎创新网络科技有限公司 | 一种基于胜任力标签的培训提供方法 |
CN106446089A (zh) * | 2016-09-12 | 2017-02-22 | 北京大学 | 一种多维度领域关键知识的提取和存储方法 |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10462255B2 (en) * | 2016-01-26 | 2019-10-29 | Microsoft Technology Licensing, Llc | Bridging skills gap |
-
2019
- 2019-03-15 CN CN201910199606.5A patent/CN109918483B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574788A (zh) * | 2016-02-05 | 2016-05-11 | 北京普猎创新网络科技有限公司 | 一种基于胜任力标签的培训提供方法 |
CN106446089A (zh) * | 2016-09-12 | 2017-02-22 | 北京大学 | 一种多维度领域关键知识的提取和存储方法 |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
Non-Patent Citations (1)
Title |
---|
《一文详解达观数据知识图谱技术与应用》;陈运文;《https://zhuanlan.zhihu.com/p/44935289》;20180919;第1-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109918483A (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109871446B (zh) | 意图识别中的拒识方法、电子装置及存储介质 | |
CN110222160B (zh) | 智能语义文档推荐方法、装置及计算机可读存储介质 | |
CN110147551B (zh) | 多类别实体识别模型训练、实体识别方法、服务器及终端 | |
CN111125343B (zh) | 适用于人岗匹配推荐系统的文本解析方法及装置 | |
CN109918483B (zh) | 匹配招聘职位与求职简历的装置和方法 | |
CN106557485B (zh) | 一种选取文本分类训练集的方法及装置 | |
CN111105209B (zh) | 适用于人岗匹配推荐系统的职位简历匹配方法及装置 | |
US10049148B1 (en) | Enhanced text clustering based on topic clusters | |
CN109446885B (zh) | 一种基于文本的元器件识别方法、系统、装置和存储介质 | |
CN111444344B (zh) | 实体分类方法、装置、计算机设备和存储介质 | |
CN111104526A (zh) | 一种基于关键词语义的金融标签提取方法及系统 | |
US20130036076A1 (en) | Method for keyword extraction | |
CN107194617B (zh) | 一种app软件工程师软技能分类系统及方法 | |
CN102968419B (zh) | 交互式互联网实体名称的消歧方法 | |
CN107958014B (zh) | 搜索引擎 | |
CN112364352B (zh) | 可解释性的软件漏洞检测与推荐方法及系统 | |
CN116401464B (zh) | 一种职业用户画像的构建方法、装置、设备及存储介质 | |
CN109472310A (zh) | 确定两份简历为相同人才的识别方法及装置 | |
CN111159332A (zh) | 一种基于bert的文本多意图识别方法 | |
CN111930933A (zh) | 一种基于人工智能的检务案件处理方法及装置 | |
Thushara et al. | A model for auto-tagging of research papers based on keyphrase extraction methods | |
US20130052619A1 (en) | Method for building information on emotion lexicon and apparatus for the same | |
CN115221302A (zh) | 基于文本分析的人力资源推荐方法 | |
CN110781297A (zh) | 基于层次判别树的多标签科研论文的分类方法 | |
US8001122B2 (en) | Relating similar terms for information retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |