CN115221302A - 基于文本分析的人力资源推荐方法 - Google Patents

基于文本分析的人力资源推荐方法 Download PDF

Info

Publication number
CN115221302A
CN115221302A CN202210855850.4A CN202210855850A CN115221302A CN 115221302 A CN115221302 A CN 115221302A CN 202210855850 A CN202210855850 A CN 202210855850A CN 115221302 A CN115221302 A CN 115221302A
Authority
CN
China
Prior art keywords
job
hunting
condition
vector
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210855850.4A
Other languages
English (en)
Inventor
王冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE
Original Assignee
SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE filed Critical SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE
Priority to CN202210855850.4A priority Critical patent/CN115221302A/zh
Publication of CN115221302A publication Critical patent/CN115221302A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于文本分析的人力资源推荐方法,包括:获取用人企业需求人才的岗位描述文本信息,基于获取的岗位描述文本信息确定任职条件,并提取任职条件下的需求关键词;以及,从该待业人员的简历文本信息中提取多个求职关键词;为该待业人员各求职条件配置对应的求职关键词;确定任职条件与求职条件之间的匹配程度;确定该待业人员的求职条件与当前岗位的综合匹配程度;将各待业人员求职条件的综合匹配程度进行排序,以基于综合匹配程度靠前的待业人员向用人企业进行推荐。本申请的方案将求职条件与任职条件进行匹配,通过模型输出综合匹配程度靠前的待业人员,实现智能化向企业推送与岗位适配的人才,提高企业的招聘效率。

Description

基于文本分析的人力资源推荐方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于文本分析的人力资源推荐方法。
背景技术
随着社会的进步,招聘和求职的需求量不断增大,并且招聘岗位的细分程度也越来越精细化。而传统的一些收集信息的渠道,如专人登记等,己不能满足当前诸多企业对人才信息收集需要。而现在各种招聘网站层出不穷,网络化的社交方式也提供了良好的人力资源平台,由于网络招聘平台信息的丰富性以及操作的便利性,越来越多的求职者通过网络招聘平台查询合适的招聘职位信息进行求职。
目前的网络招聘平台求职的方法是:招聘企业在招聘平台上发布招聘信息,招聘信息被存储在网络招聘平台的招聘职位数据库中,求职者在求职时通过网络招聘平台在职位数据库中检索查找合适的招聘职位,然后投递简历,以等待招聘企业的回复。
然而,求职者在现有的招聘平台上求职时,由于求职简历与招聘职位不能实现智能精确匹配。由此企业通常需要大量的时间来找到合适空缺岗位的人才,长期的岗位空缺,给企业带来极大的不便。
发明内容
本发明实施例提供一种基于文本分析的人力资源推荐方法,根据企业的任职条件对待业者的简历信息进行匹配,从而精确向企业推荐合适的应聘人员,提高企业的招聘效率,同时提高求职者的求职成功率。
本发明实施例提出基于文本分析的人力资源推荐方法,包括:
数据采集步骤:获取用人企业需求人才的岗位描述文本信息,并获取数个待业人员的简历文本信息;
关键词提取步骤:对所述岗位描述文本信息确定任职条件,并提取所述任职条件下的需求关键词;
以及,对任一待业人员的所述简历文本信息进行分类,以获得求职条件,并从该待业人员的所述简历文本信息中提取多个求职关键词;
任职匹配步骤:为该待业人员各求职条件配置对应的求职关键词;
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度;
根据预先配置的当前岗位下各任职条件的权重确定该待业人员的求职条件与当前岗位的综合匹配程度;
人才推荐步骤:将各待业人员求职条件的综合匹配程度进行排序,以基于综合匹配程度靠前的待业人员向用人企业进行推荐。
可选的,为该待业人员各求职条件配置对应的求职关键词包括采用如下方法构建各求职条件下的求职关键词的词向量:
为各求职条件配置多个求职关键词,形成求职序列S={s1,…,si…,sn},n为求职关键词的数量;
为任一求职条件的各求职关键词si配置标识向量ai
基于任一求职条件的各求职关键词向量si以及标识向量ai,拼接形成第一向量Zi=[si;ai]作为双向LSTM模型的输入;
拼接双向LSTM模型的前向LSTM模型
Figure BDA0003754528370000021
以及后向LSTM模型
Figure BDA0003754528370000022
的输出,以基于双向LSTM模型输出求职序列的求职关键词si的词向量qi
可选的,基于与求职条件对应的任职条件,配置求职关键词si如下属性向量:
用于描述求职关键词si与求职条件最近距离的第一属性向量at1
用于描述求职关键词si与求职条件最远距离的第二属性向量at2
用于描述求职关键词si与对应任职条件最近距离的第三属性向量at3
用于描述求职关键词si与对应任职条件最远距离的第四属性向量at4
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度包括:
对于求职关键词si,拼接第一属性向量at1、第二属性向量at2、第三属性向量at3、第四属性向量at4以及词向量qi,以构建语义向量Fi=[at1;at2;at3;at4;qi],并将语义向量输入CNN模型;
对于求职关键词si,使用第一卷积过滤向量Cj生成第一目标值ui,满足:
Figure BDA0003754528370000031
其中,第一卷积过滤向量Cs用于描述词语si在简历文本信息中的文本关系,T表示转秩运算,z表示窗口规模;
基于目标值ui,利用最大池化模型,从{ui|i∈[1,n]},生成第二目标值u*,满足:
u*=max_pooling(u1,…,un)
基于CNN模型,生成求职序列S的全局语义向量uj
Figure BDA0003754528370000032
其中,fj为第一卷积过滤向量Cj的数量。
可选的,将构建的语义向量Fi输入CNN模型之后还包括:
对于求职序列S中的求职关键词si,定义用于描述求职关键词si自身文本属性的第二卷积过滤向量Ck
对于求职关键词si,使用第二卷积过滤向量Ck生成第三目标值u′i,满足:
Figure BDA0003754528370000033
基于目标值u′i,利用最大池化模型,从{u′i|i∈[sbe,sed]},1≤sbe≤sed≤n,,生成第四目标值u′*,满足:
Figure BDA0003754528370000041
基于CNN模型,生成求职关键词si的局部语义向量uk
Figure BDA0003754528370000042
其中,fk为第二卷积过滤向量Ck的数量。
可选的,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
基于预先构建的关键词库查询求职关键词si的概念集合,
Figure BDA0003754528370000043
Figure BDA0003754528370000044
以及查询任职条件中任职关键词pi的概念集合
Figure BDA0003754528370000045
Figure BDA0003754528370000046
计算求职关键词si与任职条件P中任职关键词pi之间的语义相似度:
Figure BDA0003754528370000047
其中,sim(si,P)表示求职关键词si与任职条件P中任职关键词pi之间的语义相似度。
可选的,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
通过依存关系分析模型,确定求职序列S的依存关系结构树;
基于求职关键词si与任职条件P中任职关键词pi之间的语义相似度sim(si,P),计算求职序列S到任职条件P的注意力值,满足:
Figure BDA0003754528370000048
其中,li表示求职关键词si到任职条件P的依存距离,m表示依存距离窗口尺寸;
对于求职序列S,第i个求职关键词si对任职条件P的注意力值atti,满足:
Figure BDA0003754528370000051
基于注意力值atti生成注意力向量:
Figure BDA0003754528370000052
其中,uATT表示注意力值atti的注意力向量。
可选的,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
拼接所述全局语义向量uj、注意力向量uATT以及局部语义向量uk
将拼接后的向量输入到带有SoftMax激活函数的前馈神经网络模型,生成匹配程度预测向量v;
v=SoftMax{MT[uj;uATT;uk]+b}
M表示权重矩阵,b表示偏差向量。
可选的,采用如下目标函数执行训练:
Figure BDA0003754528370000053
其中,
Figure BDA0003754528370000054
表示求职条件对应的求职序列Sx与任职条件Py之间的匹配关系;
使用随机梯度下降算法和反向传播算法,训练目标函数,在网络模型收敛时,训练结束。
本申请实施例还提出一种基于文本分析的人力资源推荐装置,包括:处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。
本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。
本申请的方法通过对岗位描述文本信息确定任职条件,并提取任职条件下的需求关键词,同时,对任一待业人员的简历文本信息进行分类,以获得求职条件,并从该待业人员的简历文本信息中提取多个求职关键词,从而将求职条件与任职条件进行匹配,通过模型输出综合匹配程度靠前的待业人员。实现智能化向企业推送与岗位适配的人才,提高企业的招聘效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本实施例的人力资源推荐方法的基本流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例提出一种基于文本分析的人力资源推荐方法,如图1所示,包括:
数据采集步骤S101:获取用人企业需求人才的岗位描述文本信息,并获取数个待业人员的简历文本信息。具体的可以根据企业对某招聘岗位的岗位描述中来获取对应的文本信息,待业人员的简历信息可以通过大数据进行粗筛选,确定出数个与本岗位可能适配的待业人员的简历信息,并提取出建立文本信息。
关键词提取步骤S102:对所述岗位描述文本信息确定任职条件,并提取所述任职条件下的需求关键词。具体的例如描述文本信息中包括学历要求,工作经验要求,年龄要求等等,可以作为任职条件。对应的可以提取任职条件下的需求关键词,例如本科,30岁以下,相关领域工作经验2年等等。
以及,对任一待业人员的所述简历文本信息进行分类,以获得求职条件,并从该待业人员的所述简历文本信息中提取多个求职关键词。本示例中重点针对待业人员的所述简历文本信息提取的多个求职关键词进行分析。大多数情况下,企业的岗位描述文本信息的需求较为明确,而求职人员的简历信息会因为个人的经历有巨大的差异,因此在后续分析中,本申请重点基于求职人员的简历信息所提取的关键词进行匹配,以达到精准推荐的目的。
任职匹配步骤S103:为该待业人员各求职条件配置对应的求职关键词。具体的,例如可以根据待业人员的工作经历,来提取并分配各求职条件下的关键词。本示例中求职条件的类别数量可以与企业任职条件的类别数量相同,以便于后期进行匹配。
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度。具体可以采用机器学习的方式实现,最后输出匹配程度,具体的匹配程度可以采用归一化的方式。
根据预先配置的当前岗位下各任职条件的权重确定该待业人员的求职条件与当前岗位的综合匹配程度。具体的,例如可以为“学历”、年龄、工作经验等任职条件分别配置企业期望的权重值,以根据不同岗位的需求来实现精准推荐。
人才推荐步骤S104:将各待业人员求职条件的综合匹配程度进行排序,以基于综合匹配程度靠前的待业人员向用人企业进行推荐。
在一些实施例中,为该待业人员各求职条件配置对应的求职关键词包括采用如下方法构建各求职条件下的求职关键词的词向量:
为各求职条件配置多个求职关键词,形成求职序列S={s1,…,si…,sn},n为求职关键词的数量。具体的可以根据求职条件的不同设置对应的求职序列,也可以根据简历文本信息中的个人经历配置多个求职条件,从而提高推荐的准确度。
为任一求职条件的各求职关键词si配置标识向量ai,标识向量可以用于表示求职关键词与求职条件之间的关联程度。
基于任一求职条件的各求职关键词向量si以及标识向量ai,拼接形成第一向量Zi=[si;ai]作为双向LSTM模型的输入。
拼接双向LSTM模型的前向LSTM模型
Figure BDA0003754528370000081
以及后向LSTM模型
Figure BDA0003754528370000082
的输出
Figure BDA0003754528370000083
以基于双向LSTM模型输出求职序列的求职关键词si的词向量
Figure BDA0003754528370000084
在一些实施例中,基于与求职条件对应的任职条件,配置求职关键词si如下属性向量:
用于描述求职关键词si与求职条件最近距离的第一属性向量at1
用于描述求职关键词si与求职条件最远距离的第二属性向量at2
用于描述求职关键词si与对应任职条件最近距离的第三属性向量at3
用于描述求职关键词si与对应任职条件最远距离的第四属性向量at4
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度包括:
对于求职关键词si,拼接第一属性向量at1、第二属性向量at2、第三属性向量at3、第四属性向量at4以及词向量qi,以构建语义向量Fi=[at1;at2;at3;at4;qi],并将语义向量输入CNN模型,从而生成全局性的语义向量。
具体的,对于求职关键词si,使用第一卷积过滤向量Cj生成第一目标值ui,满足:
Figure BDA0003754528370000091
其中,第一卷积过滤向量Cs用于描述词语si在简历文本信息中的文本关系,T表示转秩运算,z表示窗口规模。
基于目标值ui,利用最大池化模型,从{ui|i∈[1,n]},生成第二目标值u*,满足:
u*=max_pooling(u1,…,un)
基于CNN模型,生成求职序列S的全局语义向量uj
Figure BDA0003754528370000092
其中,fj为第一卷积过滤向量Cj的数量。
在一些实施例中,将构建的语义向量Fi输入CNN模型之后还包括:
对于求职序列S中的求职关键词si,定义用于描述求职关键词si自身文本属性的第二卷积过滤向量Ck
对于求职关键词si,使用第二卷积过滤向量Ck生成第三目标值u′i,满足:
Figure BDA0003754528370000093
基于目标值u′i,利用最大池化模型,从{u′i|i∈[sbe,sed]},1≤sbe≤sed≤n,,其中sbe和sed分别表示求职关键词的起止位置,生成第四目标值u′*,满足:
Figure BDA0003754528370000094
基于CNN模型,生成求职关键词si的局部语义向量uk
Figure BDA0003754528370000095
其中,fk为第二卷积过滤向量Ck的数量。
在一些实施例中,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
基于预先构建的关键词库查询求职关键词si的概念集合,
Figure BDA0003754528370000096
Figure BDA0003754528370000097
以及查询任职条件中任职关键词pi的概念集合
Figure BDA0003754528370000098
Figure BDA0003754528370000099
计算求职关键词si与任职条件P中任职关键词pi之间的语义相似度:
Figure BDA0003754528370000101
其中,sim(si,P)表示求职关键词si与任职条件P中任职关键词pi之间的语义相似度。
在一些实施例中,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
通过预先构建的依存关系分析模型,确定求职序列S的依存关系结构树;
基于求职关键词si与任职条件P中任职关键词pi之间的语义相似度sim(si,P),计算求职序列S到任职条件P的注意力值,满足:
Figure BDA0003754528370000102
其中,li表示求职关键词si到任职条件P的依存距离,m表示依存距离窗口尺寸;
对于求职序列S,第i个求职关键词si对任职条件P的注意力值atti,满足:
Figure BDA0003754528370000103
基于注意力值atti生成注意力向量:
Figure BDA0003754528370000104
其中,uATT表示注意力值atti的注意力向量。
在一些实施例中,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
拼接所述全局语义向量uj、注意力向量uATT以及局部语义向量uk
将拼接后的向量输入到带有SoftMax激活函数的前馈神经网络模型中,生成匹配程度预测向量v;
v=SoftMax{MT[uj;uATT;uk]+b}
M表示权重矩阵,b表示偏差向量,匹配程度预测向量
Figure BDA0003754528370000111
的维度|V|等于求职关键词的数量。
在一些实施例中,采用如下目标函数执行训练:
Figure BDA0003754528370000112
其中,
Figure BDA0003754528370000113
表示求职条件对应的求职序列Sx与任职条件Py之间的匹配关系。
使用随机梯度下降算法和反向传播算法,训练目标函数,在网络模型收敛时,训练结束。通过这样的方式能够结合多层级的关键词信息,实现更精确的条件匹配提高人才推荐的效率。
本申请的方法通过对岗位描述文本信息确定任职条件,并提取任职条件下的需求关键词,同时,对任一待业人员的简历文本信息进行分类,以获得求职条件,并从该待业人员的简历文本信息中提取多个求职关键词,从而将求职条件与任职条件进行匹配,通过模型输出综合匹配程度靠前的待业人员。本申请的方法尤其适用于对具有多段不同工作经历的待业人员的筛选,实现智能化向企业推送与岗位适配的人才,提高企业的招聘效率。
本申请实施例还提出一种基于文本分析的人力资源推荐装置,包括:处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。
本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。
本申请的方法通过对岗位描述文本信息确定任职条件,并提取任职条件下的需求关键词,同时,对任一待业人员的简历文本信息进行分类,以获得求职条件,并从该待业人员的简历文本信息中提取多个求职关键词,从而将求职条件与任职条件进行匹配,通过模型输出综合匹配程度靠前的待业人员。实现智能化向企业推送与岗位适配的人才,提高企业的招聘效率。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本公开的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (10)

1.基于文本分析的人力资源推荐方法,其特征在于,包括:
数据采集步骤:获取用人企业需求人才的岗位描述文本信息,并获取数个待业人员的简历文本信息;
关键词提取步骤:对所述岗位描述文本信息确定任职条件,并提取所述任职条件下的需求关键词;
以及,对任一待业人员的所述简历文本信息进行分类,以获得求职条件,并从该待业人员的所述简历文本信息中提取多个求职关键词;
任职匹配步骤:为该待业人员各求职条件配置对应的求职关键词;
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度;
根据预先配置的当前岗位下各任职条件的权重确定该待业人员的求职条件与当前岗位的综合匹配程度;
人才推荐步骤:将各待业人员求职条件的综合匹配程度进行排序,以基于综合匹配程度靠前的待业人员向用人企业进行推荐。
2.如权利要求1所述的基于文本分析的人力资源推荐方法,其特征在于,为该待业人员各求职条件配置对应的求职关键词包括采用如下方法构建各求职条件下的求职关键词的词向量:
为各求职条件配置多个求职关键词,形成求职序列S={s1,…,si…,sn},n为求职关键词的数量;
为任一求职条件的各求职关键词si配置标识向量ai
基于任一求职条件的各求职关键词向量si以及标识向量ai,拼接形成第一向量Zi=[si;ai]作为双向LSTM模型的输入;
拼接双向LSTM模型的前向LSTM模型
Figure FDA0003754528360000011
以及后向LSTM模型
Figure FDA0003754528360000012
的输出,以基于双向LSTM模型输出求职序列的求职关键词si的词向量qi
3.如权利要求2所述的基于文本分析的人力资源推荐方法,其特征在于,基于与求职条件对应的任职条件,配置求职关键词si如下属性向量:
用于描述求职关键词si与求职条件最近距离的第一属性向量at1
用于描述求职关键词si与求职条件最远距离的第二属性向量at2
用于描述求职关键词si与对应任职条件最近距离的第三属性向量at3
用于描述求职关键词si与对应任职条件最远距离的第四属性向量at4
基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度包括:
对于求职关键词si,拼接第一属性向量at1、第二属性向量at2、第三属性向量at3、第四属性向量at4以及词向量qi,以构建语义向量Fi=[at1;at2;at3;at4;qi],并将语义向量输入CNN模型;
对于求职关键词si,使用第一卷积过滤向量Cj生成第一目标值ui,满足:
Figure FDA0003754528360000021
其中,第一卷积过滤向量Cs用于描述词语si在简历文本信息中的文本关系,T表示转秩运算,z表示窗口规模;
基于目标值ui,利用最大池化模型,从{ui|i∈[1,n]},生成第二目标值u*,满足:
u*=max_pooling(u1,…,un)
基于CNN模型,生成求职序列S的全局语义向量uj
Figure FDA0003754528360000022
其中,fj为第一卷积过滤向量Cj的数量。
4.如权利要求3所述的基于文本分析的人力资源推荐方法,其特征在于,将构建的语义向量Fi输入CNN模型之后还包括:
对于求职序列S中的求职关键词si,定义用于描述求职关键词si自身文本属性的第二卷积过滤向量Ck
对于求职关键词si,使用第二卷积过滤向量Ck生成第三目标值ui′,满足:
Figure FDA0003754528360000023
基于目标值ui′,利用最大池化模型,从{ui′|i∈[sbe,sed]},1≤sbe≤sed≤n,,生成第四目标值u′*,满足:
Figure FDA0003754528360000024
基于CNN模型,生成求职关键词si的局部语义向量uk
Figure FDA0003754528360000031
其中,fk为第二卷积过滤向量Ck的数量。
5.如权利要求4所述的基于文本分析的人力资源推荐方法,其特征在于,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
基于预先构建的关键词库查询求职关键词si的概念集合,
Figure FDA0003754528360000032
Figure FDA0003754528360000033
以及查询任职条件中任职关键词pi的概念集合
Figure FDA0003754528360000034
Figure FDA0003754528360000035
计算求职关键词si与任职条件P中任职关键词pi之间的语义相似度:
Figure FDA0003754528360000036
其中,sim(si,P)表示求职关键词si与任职条件P中任职关键词pi之间的语义相似度。
6.如权利要求5所述的基于文本分析的人力资源推荐方法,其特征在于,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
通过依存关系分析模型,确定求职序列S的依存关系结构树;
基于求职关键词si与任职条件P中任职关键词pi之间的语义相似度sim(si,P),计算求职序列S到任职条件P的注意力值,满足:
Figure FDA0003754528360000037
其中,li表示求职关键词si到任职条件P的依存距离,m表示依存距离窗口尺寸;
对于求职序列S,第i个求职关键词si对任职条件P的注意力值atti,满足:
Figure FDA0003754528360000038
基于注意力值atti生成注意力向量:
Figure FDA0003754528360000041
其中,uATT表示注意力值atti的注意力向量。
7.如权利要求6所述的基于文本分析的人力资源推荐方法,其特征在于,基于所述任职条件与配置后的求职条件,确定任职条件与求职条件之间的匹配程度还包括:
拼接所述全局语义向量uj、注意力向量uATT以及局部语义向量uk
将拼接后的向量输入到带有SoftMax激活函数的前馈神经网络模型,生成匹配程度预测向量v;
v=SoftMax{MT[uj;uATT;uk]+b}
M表示权重矩阵,b表示偏差向量。
8.如权利要求7所述的基于文本分析的人力资源推荐方法,其特征在于,采用如下目标函数执行训练:
Figure FDA0003754528360000042
其中,
Figure FDA0003754528360000043
表示求职条件对应的求职序列Sx与任职条件Py之间的匹配关系;
使用随机梯度下降算法和反向传播算法,训练目标函数,在网络模型收敛时,训练结束。
9.一种基于文本分析的人力资源推荐装置,其特征在于,包括:处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的基于文本分析的人力资源推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的基于文本分析的人力资源推荐方法的步骤。
CN202210855850.4A 2022-07-20 2022-07-20 基于文本分析的人力资源推荐方法 Withdrawn CN115221302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210855850.4A CN115221302A (zh) 2022-07-20 2022-07-20 基于文本分析的人力资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210855850.4A CN115221302A (zh) 2022-07-20 2022-07-20 基于文本分析的人力资源推荐方法

Publications (1)

Publication Number Publication Date
CN115221302A true CN115221302A (zh) 2022-10-21

Family

ID=83614287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210855850.4A Withdrawn CN115221302A (zh) 2022-07-20 2022-07-20 基于文本分析的人力资源推荐方法

Country Status (1)

Country Link
CN (1) CN115221302A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115907706A (zh) * 2022-12-12 2023-04-04 深圳今日人才信息科技有限公司 一种定向招聘智能匹配推荐和自动化审核系统
CN117635089A (zh) * 2023-11-27 2024-03-01 上海梧桐范式数字科技有限公司 基于深度学习的人才推荐方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115907706A (zh) * 2022-12-12 2023-04-04 深圳今日人才信息科技有限公司 一种定向招聘智能匹配推荐和自动化审核系统
CN117635089A (zh) * 2023-11-27 2024-03-01 上海梧桐范式数字科技有限公司 基于深度学习的人才推荐方法及系统
CN117635089B (zh) * 2023-11-27 2024-05-07 上海梧桐范式数字科技有限公司 基于深度学习的人才推荐方法及系统

Similar Documents

Publication Publication Date Title
CN108153876B (zh) 智能问答方法及系统
CN109885672B (zh) 一种面向在线教育的问答式智能检索系统及方法
US9990609B2 (en) Evaluating service providers using a social network
US20190347281A1 (en) Apparatus and method for semantic search
CN115221302A (zh) 基于文本分析的人力资源推荐方法
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及系统
CN112015868B (zh) 基于知识图谱补全的问答方法
CN112016295B (zh) 症状数据处理方法、装置、计算机设备及存储介质
US20090281975A1 (en) Recommending similar content identified with a neural network
CN111078971A (zh) 简历文件的筛选方法、装置、终端及存储介质
US11481560B2 (en) Information processing device, information processing method, and program
CN112966091B (zh) 一种融合实体信息与热度的知识图谱推荐系统
CN111143539B (zh) 基于知识图谱的教学领域问答方法
CN111737485A (zh) 基于知识图谱、深度学习的人岗匹配方法、人岗匹配系统
CN117114514B (zh) 一种基于大数据的人才信息分析管理方法、系统及装置
CN113343125A (zh) 一种面向学术精准推荐的异质科研信息集成方法及系统
JP2022020543A (ja) 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体
CN111144831B (zh) 一种适用于人员招聘的人选精准甄别系统及其甄别方法
CN113516094A (zh) 一种用于为文档匹配评议专家的系统以及方法
CN116089595A (zh) 基于科技成果的数据处理推送方法、装置及介质
Lamba et al. An integrated system for occupational category classification based on resume and job matching
Zhao et al. Reviewer recommendations using document vector embeddings and a publisher database: Implementation and evaluation
CN112330387B (zh) 一种应用于看房软件的虚拟经纪人
CN114756617A (zh) 一种工程档案结构化数据提取方法、系统、设备和存介质
Saeed et al. Convolutional neural network based career recommender system for Pakistani engineering students

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20221021