CN116739541B - 一种基于ai技术的智能人才匹配方法及系统 - Google Patents
一种基于ai技术的智能人才匹配方法及系统 Download PDFInfo
- Publication number
- CN116739541B CN116739541B CN202311020398.0A CN202311020398A CN116739541B CN 116739541 B CN116739541 B CN 116739541B CN 202311020398 A CN202311020398 A CN 202311020398A CN 116739541 B CN116739541 B CN 116739541B
- Authority
- CN
- China
- Prior art keywords
- post
- word
- talent
- matching
- posts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000005516 engineering process Methods 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 90
- 238000005457 optimization Methods 0.000 claims abstract description 29
- 230000007774 longterm Effects 0.000 claims abstract description 27
- 239000013604 expression vector Substances 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 22
- 230000008859 change Effects 0.000 claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims abstract description 12
- 230000009467 reduction Effects 0.000 claims abstract description 6
- 230000014509 gene expression Effects 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 230000001174 ascending effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000000586 desensitisation Methods 0.000 claims description 4
- 230000036962 time dependent Effects 0.000 claims 1
- 230000002860 competitive effect Effects 0.000 abstract description 19
- 230000002457 bidirectional effect Effects 0.000 abstract description 9
- 238000013523 data management Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 26
- 230000008901 benefit Effects 0.000 description 12
- 230000007115 recruitment Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 241001048891 Jatropha curcas Species 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063112—Skill-based matching of a person or a group to a task
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数字数据管理技术领域,提出了一种基于AI技术的智能人才匹配方法及系统,包括:获取人才和岗位相关数据;根据词语表达向量以及词语权重获取数据向量;根据人才与岗位之间契合关系的变化获取长期契合度;根据契合度矩阵的降维结果获取重复词语,根据重复词语的竞争特征值获取匹配竞优特征向量;根据影响因素的熵权值以及专家评分获取需求影响指数,根据需求影响指数以及需求差异获取主观优化权重;根据主观优化权重获取需求竞优向量,根据竞优特征向量与需求竞优向量的相似程度实现双向匹配。本发明考虑时间维度上人才及岗位数据特征的稳定程度,利用同类岗位之间竞争力消除专家评价法中的主观影响,提高人才与岗位之间的匹配精度。
Description
技术领域
本发明涉及数字数据管理技术领域,具体涉及一种基于AI技术的智能人才匹配方法及系统。
背景技术
随着各行业的有序发展,越来越多的岗位需要专业人员才能胜任,但是由于招聘要求的模糊化描述,企业的价值主张等因素经常导致人才流失,人才匹配逐渐成为招聘岗位和求职者之间有效匹配的主流方法之一。通常情况下,人才匹配是指提取人才特征,并与人才特征库中已录入人才的特征信息匹配的流程。
人才匹配的关键点在于从人才相关信息中提取有效、全面的人才特征,将人才特征与人才特征库中的已有特征进行匹配。传统人才匹配的方法是利用专家评价法通过求职者的个人简历、工作经历等数据评估人才满足需求的可能性,虽然专家评价法进行人才匹配时的匹配速率较快,但是存在专家意见不能反映客观现实的问题;AI技术可以更好的深度挖掘人才相关信息中的隐藏特征以及深层特征,因此能够利用AI技术实现智能人才匹配,利用AI技术对人才特征进行提取,例如机器学习、深度学习、自然语言处理等AI技术可以更好的深度挖掘人才相关信息中的隐藏特征以及深层特征,将得到的人才特征与人才库中的人才特征进行匹配,在考虑客观现实的同时提高匹配速度。
发明内容
本发明提供一种基于AI技术的智能人才匹配方法及系统,以解决双向匹配过程中忽略人才自身特征和岗位需求信息随着时间变化而出现匹配误差的问题,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种基于AI技术的智能人才匹配方法,该方法包括以下步骤:
获取人才和岗位的相关数据,所述相关数据包括人才的个人简历、人才的岗位浏览记录、岗位的职位描述、岗位的需求描述;
利用语言模型获取每组词语表达对应的词语表达向量;根据词语表达向量以及词语权重获取数据向量;利用聚类算法获取岗位分类结果;根据人才特征与每类岗位需求之间契合关系随时间的变化规律获取长期契合度;根据每个时刻人才与所有类岗位的长期契合度构建契合度矩阵,根据契合度矩阵的降维结果获取重复词语,根据重复词语所在数据向量获取重复词语的竞争特征值,将每个时刻所有重复词语的竞争特征值组成的向量作为每个时刻人才的匹配竞优特征向量;
利用专家评价法获取岗位影响因素的专家评分矩阵;根据影响因素的熵权值以及专家评分获取影响因素的需求影响指数,根据需求影响指数以及同类岗位之间的需求差异获取主观优化权重;根据主观优化权重获取岗位的需求竞优向量;
根据数据库中人才的匹配竞优特征向量与岗位的需求竞优向量之间的相似程度获取岗位的匹配人才名单,根据匹配人才名单实现人才与岗位的智能匹配。
优选的,所述利用语言模型获取每组词语表达对应的词语表达向量的方法为:
对于任意一个文本数据,利用数据脱敏技术获取每个文本数据中每句话对应的一组词语表达,利用语言模型获取每组词语表达对应的词语表达向量。
优选的,所述根据词语表达向量以及词语权重获取数据向量的方法为:
对于任意一个词语,利用信息加权算法获取所有词语表达里每个词语的词语权重,将每个词语的词语权重与每个词语对应向量的乘积作为每个词语的词语元素;
对于任意一个词语表达向量,分别获取每个词语表达向量中每个词语的词语元素,将所有词语的词语元素组成的向量作为每个词语表达向量对应的数据向量。
优选的,所述根据人才特征与每类岗位需求之间契合关系随时间的变化规律获取长期契合度的方法为:
对于任意一个人才,将当前时刻与前一次数据采集时刻人才数据向量之间的度量距离作为当前时刻人才的个人变化量,将数据采集初始时刻到当前时刻之间所有时刻个人变化量按照时间升序的顺序组成的序列作为当前时刻的个人变化序列,将个人变化序列的赫斯特指数作为第一组成因子;
根据人才岗位浏览记录与匹配岗位之间的需求相似度获取人才与岗位的匹配稳定度,将从数据采集初始时刻到当前时刻之间人才在同一类岗位上匹配稳定度的累加作为第二组成因子;
当前时刻每个人才与每类岗位的长期契合度由第一组成因子、第二组成因子两部分组成,其中,所述长期契合度与第一组成因子成正比关系,所述长期契合度与第二组成因子成正比关系。
优选的,所述根据人才岗位浏览记录与匹配岗位之间的需求相似度获取人才与岗位的匹配稳定度的方法为:
对于任意一个人才,将当前时刻每个人才岗位浏览记录中每个岗位的数据向量与匹配岗位的数据向量之间的相似度度量作为分子,将当前时刻每个人才的数据向量与匹配岗位的数据向量之间的度量距离与调参因子的累加和作为分母,将分子与分母的比值在当前时刻每个人才岗位浏览记录中所有岗位上的累加作为第一计算因子;
当前时刻每个人才与匹配岗位的匹配稳定度由第一计算因子、匹配岗位的同类岗位数量两部分组成,其中,所述匹配稳定度与第一计算因子成正比关系,所述匹配稳定度与匹配岗位的同类岗位数量成反比关系。
优选的,所述根据契合度矩阵的降维结果获取重复词语的方法为:
将当前时刻每个人才与每类岗位的长期契合度构成的矩阵作为当前时刻每个人才的契合度矩阵;
利用主成分分析PCA算法获取契合度矩阵的所有主成分,将每个主成分方向上的岗位类别作为优势岗位类别,分别获取每个优势岗位类别内所有岗位的词语表达向量中与当前时刻每个人才的词语表达中的重复词语。
优选的,所述根据重复词语所在数据向量获取重复词语的竞争特征值的方法为:
对于任意一个重复词语,分别获取包含每个重复词语的词语表达对应的人才数据向量和岗位数据向量,分别获取人才数据向量、岗位数据向量中与所述词语表达对应的词语元素;
将岗位数据向量对应岗位所在优势岗位类别对应主成分的方差贡献率作为第一乘积因子,将人才数据向量中词语元素与岗位数据向量中词语元素的和作为第二乘积因子;
将第一乘积因子与第二乘积因子在每个主成分方向上优势岗位类别中所有岗位上的累加和作为重复词语的竞争特征值。
优选的,所述根据影响因素的熵权值以及专家评分获取影响因素的需求影响指数的方法为:
对于任意一个影响因素,将预设参数与每个岗位上所述影响因素熵权值的差值作为分子,将每个岗位上所述影响因素专家评分最大值与专家评分最小值的差值作为分母,将分子与分母的比值在当前时刻上的累加作为第一累加因子;
每个影响因素的需求影响指数由第一累加因子、数据采集初始时刻到当前时刻之间的时刻数量两部分组成,其中,所述需求影响指数与第一累加因子成正比关系,所述需求影响指数与数据采集初始时刻到当前时刻之间的时刻数量成反比关系。
优选的,所述根据需求影响指数以及同类岗位之间的需求差异获取主观优化权重的方法为:
对于任意一个影响因素,将每个岗位上所述影响因素的需求影响指数与每个岗位所在聚类簇内岗位上所述影响因素的需求影响指数的差值作为分子,将每个岗位与每个岗位所在聚类簇内岗位需求之间的度量距离作为分母,将分子与分母的比值在每个岗位所在聚类簇内岗位上的累加作为第二累加因子;
每个影响因素的主观优化权重由第二累加因子、每个岗位所在聚类簇内岗位数量两部分组成,其中,所述主观优化权重与第二累加因子成正比关系,所述主观优化权重与每个岗位所在聚类簇内岗位数量成反比关系。
第二方面,本发明实施例还提供了一种基于AI技术的智能人才匹配系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
本发明的有益效果是:本发明通过分析不同时刻人才数据向量、岗位数据向量中词语表达元素的信息重要程度构建长期契合度。长期契合度考虑时间维度上人才以及岗位数据信息的稳定程度,其有益效果在于能够消除后续双向匹配过程中忽略人才自身特征和岗位需求信息随着时间变化导致的匹配误差。其次基于专家评分矩阵和影响因素对岗位需求的影响程度构建主观优化权重,主观优化权重考虑连续时间内评价岗位的竞争优势时影响因素评分的变化,其有益效果在于能够通过分析同一影响因素在同类岗位之间竞争力的影响程度消除专家评价法中的主观影响,提高人才岗位之间的匹配精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种基于AI技术的智能人才匹配方法的流程示意图;
图2为本发明一个实施例所提供的当前时刻人才契合度矩阵的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例提供的一种基于AI技术的智能人才匹配方法的流程图,该方法包括以下步骤:
步骤S001,获取人才和岗位的相关数据,并对所获相关数据进行预处理。
本发明的目的在于实现人才的智能匹配,因此首先采集人才和岗位的相关数据,从相关数据中提取人才的个人特征和岗位的需求特征,通过人才和岗位的契合程度实现双向匹配。所述相关数据包括人才的个人简历、岗位浏览记录、岗位的职位描述、技能需求。
本发明利用爬虫技术从招聘平台获取相关数据,由于人才的个人简历、岗位的技能需求等相关数据会随着时间发生变化,因此本发明中获取N个不同时间点的相关数据,相邻两次数据获取的时间间隔为2天,N的大小取经验值30。为了避免数据爬取过程中出现数据缺失的现象,对所获历史数据进行数据清洗,数据清洗为公知技术,具体过程不再赘述。
至此,得到人才和岗位相关数据的预处理结果。
步骤S002,基于词语表达向量得到数据向量,基于人才特征和岗位需求之间契合程度的变化得到长期契合度,基于长期契合度得到人才的匹配竞优特征向量。
在智能人才的匹配过程中,不仅要考虑岗位匹配的所需人才,还要考虑人才的期望与所匹配岗位之间是否近似,例如人才的期望薪资、期望工作场地、期望工作内容等与岗位所提供的实际薪资、实际工作内容等越相似,人才与岗位之间的双向匹配程度越高。为了实现人才和岗位之间的双向匹配,本发明考虑从人才的个人简历中挖掘每个人才自身的竞争优势,从岗位的职位描述、技能需求等相关数据中提取岗位的竞争优势,根据人才竞争优势和岗位竞争优势评估数据库中的人才和匹配系统重岗位之间的匹配程度。
分别对每个岗位的职位描述、每个人才的个人简历内的工作经历进行脱敏处理,以工作经历为例,工作经历中的每句话能够表示为一组词语的组合,数据脱敏为公知技术,具体过程不再赘述。例如,在百度公司实习半年这句话能够表示为(百度,公司,实习,半年)的表示形式。其次利用Word2Vec模型学习个人简历中工作经历中词语的嵌入,将词语映射到低维空间得到工作经历中词语的低维稠密向量表示,将个人简历文本作为Word2Vec模型的输入,Word2Vec模型输出是每个单词对应的固定长度的向量, 将人才i的t时刻工作经历的词语表达向量记为,然后利用TF-IDF算法计算个人简历文本中词语的权重,Word2Vec模型以及TF-IDF算法为公知技术,具体过程不再赘述。
根据词语权重和词语表达获取每个人每个工作简历的数据向量,计算t时刻人才i的工作经历的数据向量:
式中,是数据向量/>中的第k个词语元素,/>分别是词语表达向量/>中的第k个元素,/>是第k个元素对应的词语权重,n是数据向量/>中词语元素的数量。
在实际匹配过程中,人才的求职意向、工作经历、个人能力都会随着时间的变化而发生改变,相应的,岗位的需求也会发生不同程度的变化,例如由初期要求具有3年的工作经验变成具有1年以上的工作经验。当人才和岗位的数据信息发生变化时,两者之间进行双向匹配的过程中应当考虑时间因素导致的变化量。
首先利用k-shape聚类算法获取每个时刻岗位职位描述的词语表达的聚类结果,将词语表达对应词语向量之间余弦相似度的倒数作为聚类过程中的度量距离,k-shape算法为公知技术,具体过程不再赘述,将同一聚类簇内的岗位作为同一类型的岗位。
基于上述分析,此处构建长期契合度V,用于表征人才的自身特征优势与岗位需求之间契合程度的变化,计算t时刻人才i与第c类岗位的长期契合度:
式中,是t时刻人才i的个人变化量,/>、/>分别是t时刻、t-1时刻人才i的数据向量,/>是数据向量/>、/>之间的值均差VMD,值均差为公知技术,具体过程不再赘述。/>的值越大,t时刻人才i的个人数据信息变化越大。
是t时刻人才i与岗位y的匹配稳定度,/>是t时刻人才i岗位浏览记录里的岗位数量,/>、/>分别是t时刻岗位b、岗位y的数据向量,/>是向量/>、/>之间的余弦相似度,/>的目的是反映聚类簇内岗位b、岗位y之间的需求相似度,是t时刻人才i与岗位y的数据向量/>、/>之间的DTW距离,/>是调参因子,/>的作用是防止分母为0,/>的大小取经验值0.001。/>的值越大,t时刻人才i与岗位y的匹配结果越稳定。
是人才i与第c类岗位的长期契合度,/>是t时刻个人变化序列的赫斯特指数,K是岗位y所在聚类簇内岗位数量,/>是相关数据采集初始时刻,/>是/>时刻人才i与岗位y的匹配稳定度,所述个人变化序列为/>时刻到t时刻之间所有时间点的个人变化量根据时间升序组成的序列,赫斯特指数为公知技术,具体过程不再赘述。
长期契合度反映了人才的自身特征优势与岗位需求之间契合程度的变化。t时刻人才i的个人数据信息变化越大,、/>内词语元素的差异越大,/>的值越大;t时刻人才i与岗位y的匹配结果越稳定,t时刻人才i的数据向量与c类别内岗位的数据向量差异越大,/>的值越大,t时刻人才i的岗位浏览记录与岗位y的需求越相似,人才i与岗位y的匹配程度越高,/>的值越大,第一计算因子/>的值越大,的值越大;人才的特征优势长期变化越符合岗位y的需求,第一组成因子/>的值越大,随着时间变化人才i与岗位y的匹配结果越稳定,第二组成因子/>的值越大,/>的值越大,人才i的选择倾向于c类别内岗位的需求匹配程度越稳定。长期契合度考虑时间维度上人才以及岗位数据信息的稳定程度,其有益效果在于能够消除后续双向匹配过程中忽略人才自身特征和岗位需求信息随着时间变化导致的匹配误差。
进一步的,获取每个时刻人才i与每类岗位的长期契合度,利用t个时刻的长期契合度构成人才i的契合度矩阵,如图2所示。
如果人才与某个类别岗位的长期契合度在多个时刻都维持在一个较高的水平或者在多个类别的岗位之间存在较大的长期契合度,说明人才i在这些类别的岗位上具有较强的个人竞争优势。因此利用主成分分析PCA算法获取契合度矩阵的降维结果,将每个主成分方向上的岗位类别作为优势岗位类别,获取每个优势岗位类别内所有岗位的词语表达向量中与t时刻人才i的词语表达中的重复词语,将与t时刻人才i的词语表达中重复词语的总数量记为S,主成分分析PCA算法为公知技术,具体过程不再赘述。
其次基于重复词语计算t时刻第k个重复词语的竞争特征值:
式中,p是第p个主成分,是主成分p上优势类别中所包含岗位的数量,/>是降维过程中获取的主成分p的方差贡献率,/>、/>分别是t时刻人才i、岗位y的数据向量中的第k个词语元素。
由此,能够通过t时刻人才i契合度矩阵的主成分分析结果,准确表达每个主成分方向上重复词语的词语元素与竞争特征值之间的相关性,其中第p个主成分方向上的信息量越大,第一乘积因子的值越大,第二乘积因子/>的值越大,/>的值越大。
进一步的,分别获取t时刻S个重复词语元素的竞争特征值,将所有竞争特征值归一化结果组成长度为S的向量作为t时刻人才i的匹配竞优特征向量。
至此,得到每个人才的匹配竞优特征向量。
步骤S003,基于专家评分矩阵和影响因素对岗位需求的影响程度得到主观优化权重,基于主观优化权重得到岗位的需求竞优向量。
得到每个人才的匹配竞优特征向量后,进一步需要根据岗位所提供的人才待遇、技能需求、职位描述等信息获取每个岗位相较于同类型其他岗位的竞争优势。
通常情况下,每个招聘单位的招聘专家会对岗位匹配的影响因素有个初步评分,例如岗位需要的人员数量、岗位需要的技能熟练程度、岗位需求的工作时长、岗位所能提供的工作内容,岗位的发展前景等因素都是人才匹配过程中会考虑的,将t时刻岗位y的影响因素的数量记为q。根据专家评价法获取t时刻岗位影响因素的专家评分矩阵G,其中专家评分矩阵G中第行第j列的元素为/>,/>的含义是t时刻专家/>对影响因素j的评分。专家评价法为公知技术,具体过程不再赘述。
招聘专家在评价过程中往往带有较强的主观因素,没有考虑到岗位需求人才自身的竞争优势,因此需要对岗位的每个因素的评分进行自适应的修正,消除主观评价对双向匹配的影响。利用熵权法获取t时刻每种影响因素在类别c内的熵权值,将t时刻影响因素j的熵权值记为,熵权值/>越大,说明影响因素j对c类内岗位的区分能力越强,需求人才在匹配时也会更多考虑影响因素j,熵权法为公知技术,具体过程不再赘述。
基于上述分析,此处构建主观优化权重W,用于表征专家评价岗位需求过程中忽略现实情况的严重程度,计算t时刻岗位y第j个因素的主观优化权重:
式中,是t时刻岗位y的第j个影响因素的需求影响指数,/>是岗位y相关数据采集的初始时刻,/>是/>时刻影响因素j的熵权值,/>、/>分别是/>时刻专家评分中的最大值、最小值。/>的值越大,第j个影响因素对t时刻岗位y的人才需求影响越大。
是t时刻岗位y第j个因素的主观优化权重,c是t时刻岗位y的同类岗位中的第c个岗位,K是t时刻岗位y的同类岗位的总数量,/>是t时刻岗位c的第j个影响因素的需求影响指数,/>是聚类过程中岗位y、c之间的度量距离,/>的大小等于t时刻岗位y、c数据向量之间余弦相似度的倒数,计算/>的目的在于反映同类岗位之间的需求差异。
主观优化权重反映了专家评价岗位需求过程中忽略现实情况的严重程度。影响因素j对同一类岗位的区分能力越强,的值越大,对c类岗位影响越大,/>时刻影响因素j的评分范围越小,说明影响因素较小评分差异对岗位y的需求产生较大影响的可能性越大,的值越小,第一累加因子/>的值越大,/>的值越大;影响因素j需求影响指数之间的差异占岗位y、c之间度量距离的比例越大,第二累加因子/>的值越大,即/>的值越大,影响因素j在同类岗位匹配人才竞争中越重要,越应该进行修正,消除主观影响。主观优化权重考虑连续多次评价岗位y的竞争优势时影响因素评分的变化,其有益效果在于能够通过分析同一影响因素在同类岗位之间竞争力的影响程度消除专家评价法中的主观影响,提高人才岗位之间的匹配精度。
进一步的,获取岗位y每个影响因素的主观优化权重,利用主观优化权重和专家评分获取岗位y的每个影响因素的竞优特征值,计算t时刻影响因素j的竞优特征值:
式中,是t时刻岗位y第j个因素的主观优化权重,/>是t时刻岗位y的评分矩阵中第j个影响因素的专家评分。
进一步的,分别获取t时刻岗位y每个影响因素的竞优特征值,将所有竞争特征值组成长度为q的向量作为t时刻岗位y的需求竞优向量。
至此,得到匹配系统中每个岗位的需求竞优向量。
步骤S004,根据数据库中人才的匹配竞优特征向量与岗位的需求竞优向量之间的相似程度得到岗位的匹配人才名单,系统根据匹配人才名单实现智能人才匹配。
根据上述步骤,获取所有人才的匹配竞优特征向量,将所有人才的匹配竞优特征向量与数据库中的人才一一配准,根据人才自身优势和岗位的实际需求进行智能化匹配。根据岗位的聚类结果,匹配系统对岗位进行分类管理,避免不同类型岗位对人才匹配速率的影响。
对于匹配系统中的岗位y,获取岗位的需求竞优向量,分别岗位y开始招聘时刻计算数据库中M个人才的匹配竞优特征向量T与/>的DTW距离,将M个余弦相似度按照升序的顺序排序,DTW距离为公知技术,具体过程不再赘述。其次根据岗位y的人员需求数量m,将排序结果中前m个匹配人才作为岗位y的匹配人才名单,人才匹配模块将匹配人才名单发送至信息传递模块,信息传递模块将匹配人才名单对应的匹配人才的个人简历发送至岗位y的招聘单位。招聘单位根据接收的人才简历与人才进行沟通,完成后续的面试、签约等流程,实现智能人才匹配。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于AI技术的智能人才匹配方法,其特征在于,该方法包括以下步骤:
获取人才和岗位的相关数据,所述相关数据包括人才的个人简历、人才的岗位浏览记录、岗位的职位描述、岗位的需求描述;
利用语言模型获取每组词语表达对应的词语表达向量;根据词语表达向量以及词语权重获取数据向量;利用聚类算法获取岗位分类结果;根据人才特征与每类岗位需求之间契合关系随时间的变化规律获取长期契合度;根据每个时刻人才与所有类岗位的长期契合度构建契合度矩阵,根据契合度矩阵的降维结果获取重复词语,根据重复词语所在数据向量获取重复词语的竞争特征值,将每个时刻所有重复词语的竞争特征值组成的向量作为每个时刻人才的匹配竞优特征向量;
利用专家评价法获取岗位影响因素的专家评分矩阵;根据影响因素的熵权值以及专家评分获取影响因素的需求影响指数,根据需求影响指数以及同类岗位之间的需求差异获取主观优化权重;根据主观优化权重获取岗位的需求竞优向量;
根据数据库中人才的匹配竞优特征向量与岗位的需求竞优向量之间的相似程度获取岗位的匹配人才名单,根据匹配人才名单实现人才与岗位的智能匹配;
所述根据契合度矩阵的降维结果获取重复词语的方法为:
将当前时刻每个人才与每类岗位的长期契合度构成的矩阵作为当前时刻每个人才的契合度矩阵;
利用主成分分析PCA算法获取契合度矩阵的所有主成分,将每个主成分方向上的岗位类别作为优势岗位类别,分别获取每个优势岗位类别内所有岗位的词语表达向量中与当前时刻每个人才的词语表达中的重复词语;
所述根据重复词语所在数据向量获取重复词语的竞争特征值的方法为:
对于任意一个重复词语,分别获取包含每个重复词语的词语表达对应的人才数据向量和岗位数据向量,分别获取人才数据向量、岗位数据向量中与所述词语表达对应的词语元素;
将岗位数据向量对应岗位所在优势岗位类别对应主成分的方差贡献率作为第一乘积因子,将人才数据向量中词语元素与岗位数据向量中词语元素的和作为第二乘积因子;
将第一乘积因子与第二乘积因子在每个主成分方向上优势岗位类别中所有岗位上的累加和作为重复词语的竞争特征值;
获取岗位y每个影响因素的主观优化权重,利用主观优化权重和专家评分获取岗位y的每个影响因素的竞优特征值;获取t时刻岗位y每个影响因素的竞优特征值,将所有竞优特征值组成长度为q的向量作为t时刻岗位y的需求竞优向量。
2.根据权利要求1所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述利用语言模型获取每组词语表达对应的词语表达向量的方法为:
对于任意一个文本数据,利用数据脱敏技术获取每个文本数据中每句话对应的一组词语表达,利用语言模型获取每组词语表达对应的词语表达向量。
3.根据权利要求1所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述根据词语表达向量以及词语权重获取数据向量的方法为:
对于任意一个词语,利用信息加权算法获取所有词语表达里每个词语的词语权重,将每个词语的词语权重与每个词语对应向量的乘积作为每个词语的词语元素;
对于任意一个词语表达向量,分别获取每个词语表达向量中每个词语的词语元素,将所有词语的词语元素组成的向量作为每个词语表达向量对应的数据向量。
4.根据权利要求1所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述根据人才特征与每类岗位需求之间契合关系随时间的变化规律获取长期契合度的方法为:
对于任意一个人才,将当前时刻与前一次数据采集时刻人才数据向量之间的度量距离作为当前时刻人才的个人变化量,将数据采集初始时刻到当前时刻之间所有时刻个人变化量按照时间升序的顺序组成的序列作为当前时刻的个人变化序列,将个人变化序列的赫斯特指数作为第一组成因子;
根据人才岗位浏览记录与匹配岗位之间的需求相似度获取人才与岗位的匹配稳定度,将从数据采集初始时刻到当前时刻之间人才在同一类岗位上匹配稳定度的累加作为第二组成因子;
当前时刻每个人才与每类岗位的长期契合度由第一组成因子、第二组成因子两部分组成,其中,所述长期契合度与第一组成因子、第二组成因子成正比关系。
5.根据权利要求4所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述根据人才岗位浏览记录与匹配岗位之间的需求相似度获取人才与岗位的匹配稳定度的方法为:
对于任意一个人才,将当前时刻每个人才岗位浏览记录中每个岗位的数据向量与匹配岗位的数据向量之间的相似度度量作为分子,将当前时刻每个人才的数据向量与匹配岗位的数据向量之间的度量距离与调参因子的累加和作为分母,将分子与分母的比值在当前时刻每个人才岗位浏览记录中所有岗位上的累加作为第一计算因子;
当前时刻每个人才与匹配岗位的匹配稳定度由第一计算因子、匹配岗位的同类岗位数量两部分组成,其中,所述匹配稳定度与第一计算因子成正比关系,所述匹配稳定度与匹配岗位的同类岗位数量成反比关系。
6.根据权利要求1所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述根据影响因素的熵权值以及专家评分获取影响因素的需求影响指数的方法为:
对于任意一个影响因素,将预设参数与每个岗位上所述影响因素熵权值的差值作为分子,将每个岗位上所述影响因素专家评分最大值与专家评分最小值的差值作为分母,将分子与分母的比值在当前时刻上的累加作为第一累加因子;
每个影响因素的需求影响指数由第一累加因子、数据采集初始时刻到当前时刻之间的时刻数量两部分组成,其中,所述需求影响指数与第一累加因子成正比关系,所述需求影响指数与数据采集初始时刻到当前时刻之间的时刻数量成反比关系。
7.根据权利要求1所述的一种基于AI技术的智能人才匹配方法,其特征在于,所述根据需求影响指数以及同类岗位之间的需求差异获取主观优化权重的方法为:
对于任意一个影响因素,将每个岗位上所述影响因素的需求影响指数与每个岗位所在聚类簇内岗位上所述影响因素的需求影响指数的差值作为分子,将每个岗位与每个岗位所在聚类簇内岗位需求之间的度量距离作为分母,将分子与分母的比值在每个岗位所在聚类簇内岗位上的累加作为第二累加因子;
每个影响因素的主观优化权重由第二累加因子、每个岗位所在聚类簇内岗位数量两部分组成,其中,所述主观优化权重与第二累加因子成正比关系,所述主观优化权重与每个岗位所在聚类簇内岗位数量成反比关系。
8.一种基于AI技术的智能人才匹配系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311020398.0A CN116739541B (zh) | 2023-08-15 | 2023-08-15 | 一种基于ai技术的智能人才匹配方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311020398.0A CN116739541B (zh) | 2023-08-15 | 2023-08-15 | 一种基于ai技术的智能人才匹配方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116739541A CN116739541A (zh) | 2023-09-12 |
CN116739541B true CN116739541B (zh) | 2023-10-27 |
Family
ID=87911795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311020398.0A Active CN116739541B (zh) | 2023-08-15 | 2023-08-15 | 一种基于ai技术的智能人才匹配方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739541B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117196550B (zh) * | 2023-09-22 | 2024-05-28 | 蔓悦科技(宁波)有限公司 | 一种人才与企业供需匹配的方法及系统 |
CN117390297B (zh) * | 2023-12-13 | 2024-02-27 | 天津和光同德科技股份有限公司 | 一种大规模人才智库信息优化匹配方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2723254A1 (en) * | 2008-05-01 | 2009-11-05 | Myperfectgig, Inc. | Systems and methods for modeling workforce talent supply and for automatically processing candidate resumes and job specifications expressed in natural language |
US10657684B1 (en) * | 2018-12-19 | 2020-05-19 | EffectiveTalent Office LLC | Matched array alignment system and method |
CN111311180A (zh) * | 2020-02-10 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 简历筛选方法及装置 |
CN112819286A (zh) * | 2021-01-07 | 2021-05-18 | 连云港中教常青科技发展有限公司 | 一种精英人才和岗位高嵌合度分类匹配系统和方法 |
CN114529266A (zh) * | 2022-02-23 | 2022-05-24 | 福建国科信息科技有限公司 | 基于ai大数据平台及其人岗匹配算法 |
CN115563305A (zh) * | 2022-09-28 | 2023-01-03 | 北京中科梧桐网络科技有限公司 | 一种多源城市数据的人才数据竞争力匹配方法 |
CN116028722A (zh) * | 2023-03-31 | 2023-04-28 | 广州南方学院 | 一种基于词向量的岗位推荐方法、装置及计算机设备 |
CN116362699A (zh) * | 2023-03-15 | 2023-06-30 | 国信蓝桥教育科技股份有限公司 | 一种岗位匹配报告生成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7437309B2 (en) * | 2001-02-22 | 2008-10-14 | Corporate Fables, Inc. | Talent management system and methods for reviewing and qualifying a workforce utilizing categorized and free-form text data |
-
2023
- 2023-08-15 CN CN202311020398.0A patent/CN116739541B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2723254A1 (en) * | 2008-05-01 | 2009-11-05 | Myperfectgig, Inc. | Systems and methods for modeling workforce talent supply and for automatically processing candidate resumes and job specifications expressed in natural language |
US10657684B1 (en) * | 2018-12-19 | 2020-05-19 | EffectiveTalent Office LLC | Matched array alignment system and method |
CN111311180A (zh) * | 2020-02-10 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 简历筛选方法及装置 |
CN112819286A (zh) * | 2021-01-07 | 2021-05-18 | 连云港中教常青科技发展有限公司 | 一种精英人才和岗位高嵌合度分类匹配系统和方法 |
CN114529266A (zh) * | 2022-02-23 | 2022-05-24 | 福建国科信息科技有限公司 | 基于ai大数据平台及其人岗匹配算法 |
CN115563305A (zh) * | 2022-09-28 | 2023-01-03 | 北京中科梧桐网络科技有限公司 | 一种多源城市数据的人才数据竞争力匹配方法 |
CN116362699A (zh) * | 2023-03-15 | 2023-06-30 | 国信蓝桥教育科技股份有限公司 | 一种岗位匹配报告生成方法 |
CN116028722A (zh) * | 2023-03-31 | 2023-04-28 | 广州南方学院 | 一种基于词向量的岗位推荐方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116739541A (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116739541B (zh) | 一种基于ai技术的智能人才匹配方法及系统 | |
CN108399163B (zh) | 结合词聚合与词组合语义特征的文本相似性度量方法 | |
CN111538908B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN106447285B (zh) | 基于多维度领域关键知识的招聘信息匹配方法 | |
CN111966917B (zh) | 一种基于预训练语言模型的事件检测与摘要方法 | |
CN106021364B (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
CN105279495B (zh) | 一种基于深度学习和文本总结的视频描述方法 | |
CN110188272B (zh) | 一种基于用户背景的社区问答网站标签推荐方法 | |
CN108073568A (zh) | 关键词提取方法和装置 | |
CN109697285A (zh) | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 | |
WO2020233344A1 (zh) | 一种搜索方法、装置及存储介质 | |
CN110263343B (zh) | 基于短语向量的关键词抽取方法及系统 | |
CN107895303B (zh) | 一种基于ocean模型的个性化推荐的方法 | |
CN111401040A (zh) | 一种适用于word文本的关键词提取方法 | |
CN116644184B (zh) | 基于数据聚类的人力资源信息管理系统 | |
CN111680225A (zh) | 基于机器学习的微信金融消息分析方法及系统 | |
CN112100212A (zh) | 一种基于机器学习和规则匹配的案件情节抽取方法 | |
CN117150232B (zh) | 一种大模型非时序训练数据质量评价方法 | |
CN107515928A (zh) | 一种判断资产价格走势的方法、装置、服务器、存储介质 | |
CN111507528A (zh) | 一种基于cnn-lstm的股票长期趋势预测方法 | |
Hitchcock et al. | Clustering functional data | |
CN110674293A (zh) | 一种基于语义迁移的文本分类方法 | |
CN111444414A (zh) | 一种用于建模ad-hoc检索任务中多样相关特征的信息检索模型 | |
CN114997331A (zh) | 基于度量学习的小样本关系分类方法及系统 | |
CN113987536A (zh) | 数据表中字段安全等级确定方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |