CN116452047A - 一种候选人胜任能力测评方法及装置 - Google Patents

一种候选人胜任能力测评方法及装置 Download PDF

Info

Publication number
CN116452047A
CN116452047A CN202310392858.6A CN202310392858A CN116452047A CN 116452047 A CN116452047 A CN 116452047A CN 202310392858 A CN202310392858 A CN 202310392858A CN 116452047 A CN116452047 A CN 116452047A
Authority
CN
China
Prior art keywords
corpus
candidate
answer
interview
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310392858.6A
Other languages
English (en)
Inventor
张竞尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Caili Network Co ltd
Original Assignee
Shanghai Caili Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Caili Network Co ltd filed Critical Shanghai Caili Network Co ltd
Priority to CN202310392858.6A priority Critical patent/CN116452047A/zh
Publication of CN116452047A publication Critical patent/CN116452047A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06398Performance of employee with respect to a job function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种候选人胜任能力测评方法及装置。本申请能够获取候选人对应的访谈语料信息;对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。本发明不仅使得评价结果具有较高的信度与效度;而且利用自然语言处理相关技术对候选人回答进行理解,降低人力和时间成本的同时,提高测评效率以及技术方案的可解释性与可靠性,从而提高人才测评准确性,使得机器的结果与人工结果有较高的一致性。

Description

一种候选人胜任能力测评方法及装置
技术领域
本申请涉及信息处理技术领域,具体涉及一种候选人胜任能力测评方法及装置。
背景技术
素质能力(又称胜任能力)是企业里区分绩效的关键行为。在企业里常使用行为事件访谈(Behavioral event interview,BEI)这一工具通过解码访谈故事中员工展现处的关键行为来评价员工素质能力水平,这种结构化的访谈可以被应用于面试、岗位评价、最佳实践萃取等多个场景。行为事件访谈在实操中通常参照STAR结构开展,即一个完整故事需包含以下部分:情景、任务、行动、结果等,访谈者需就这几个部分收集被访谈者的回答。访谈过程中,访谈者要迅速从被访谈者的回答中判断出该陈述属于哪部分,并通过好的提问引导被访谈交代更多细节,使得被访谈人讲出的故事结构完整,有因有果,利于关键行为的抽取。
然而,这样一次访谈通常将花费访谈人和被访谈人大量时间才能获取足够支持决策的信息。另外,这一过程中难免会掺杂访谈者的主观判断甚至偏见:如针对局势的分析过程,A访谈者可能判断这是在描述背景,而B访谈者却判断这是被访谈的分析行为;又或者A访谈者认为被访谈者正在交代情景是一个压力情景,而B访谈者却认为这根本称不上是一个挑战。结构化访谈的实施人需受过专业训练的、且积累丰富的实战经验,否则很可能导致访谈偏离目的,缺乏翔实细节,或访谈结果混杂大量主观臆断甚至假话。除了培训,为了达成多位参与访谈者之间判断的一致性,需要经历多轮校准和相互校验。目前实施这样的行为事件访谈来判断候选人的能力背后堆积着高昂的人力和时间成本。
发明内容
鉴于上述问题,提出了本说明书以便提供一种克服上述问题或者至少部分地解决上述问题的一种候选人胜任能力测评方法及装置。
第一方面,本申请实施例提供了一种候选人胜任能力测评方法,包括:获取候选人对应的访谈语料信息;对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
在一些实施例中,对访谈语料信息进行特征分割,得到分割后的回答语料特征集之前,还包括:基于停用词,对访谈语料信息进行去除停用词处理,得到去除停用词后的访谈语料信息;基于重复词,对去除停用词后的访谈语料信息进行去重处理,得到去重处理后的访谈语料信息;将去重处理后的访谈语料信息作为预处理后的访谈语料信息。
在一些实施例中,对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,包括:基于句子边界检测模型,检测出访谈语料信息对应的分割边界;根据访谈语料信息对应的分割边界对访谈语料信息进行特征分割,得到分割后的回答语料特征集合。
在一些实施例中,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量,包括:基于已训练完成的自编码语言模型,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量。
在一些实施例中,基于已训练完成的自编码语言模型,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量,包括:获取候选人语料数据集;利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:利用候选人语料数据集对自编码语言模型进行训练的过程中包括若干个训练任务,若干个训练任务包括但不限于完形填空训练任务、预测候选人回答场景任务。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:对自编码语言模型进行完形填空训练任务时,基于自编码语言模型,对候选人语料数据集中的语料样本进行词粒度的随机掩码;设置动词掩码参数,动词掩码参数用于提高动词的掩码概率,得到被掩码的词向量;基于被掩码的词向量的上下文,对被掩码的词向量进行预测,得到被掩码的词向量的预测语义特征;根据被掩码的词向量的预测语义特征对自编码语言模型调参。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:对自编码语言模型进行预测候选人回答场景任务时,获取语料样本的语义特征;对语料样本的语义特征进行回答场景类型识别,得到语料样本对应的回答场景预测类别;基于语料样本对应的回答场景标注类型,根据语料样本对应的回答场景预测类别对自编码语言模型调参,得到已训练完成的自编码语言模型。
在一些实施例中,对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评,包括:在已训练完成的自编码语言模型后拼接一层前馈神经网络,前馈神经网络用于提取语义特征表示向量对应的语言特征;在前馈神经网络后拼接一层分类层,分类层用于对语言特征进行行为事件结构化类型分类,得到分类结果,分类结果包括语义特征表示向量所属的行为事件结构化类型以及胜任能力分档概率。
第二方面,本申请实施例提供了一种候选人胜任能力测评装置,包括:语料获取模块,用于基于行为事件访谈题目,获取候选人对应的访谈语料信息;特征分割模块,用于对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;特征表示模块,用于对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;测评模块,用于对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
第三方面,本申请实施例提供了一种电子设备,包括存储器存储有多条指令;处理器从存储器中加载指令,以执行本申请实施例所提供的任一种候选人胜任能力测评方法中的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请实施例所提供的任一种候选人胜任能力测评方法中的步骤。
本申请实施例可以获取候选人对应的访谈语料信息;然后对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;再对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;接着对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
本发明不仅利用行为事件访谈来设计整个人才测评方案,具备可靠的理论支撑,进一步使得评价结果具有较高的信度与效度;而且利用自然语言处理相关技术对候选人回答进行理解,降低人力和时间成本的同时,提高测评效率以及技术方案的可解释性与可靠性,从而提高人才测评准确性,使得机器的结果与人工结果有较高的一致性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的候选人胜任能力测评方法的场景示意图;
图2是本申请实施例提供的候选人胜任能力测评方法的流程示意图;
图3是本申请实施例提供的候选人胜任能力测评装置的结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种候选人胜任能力测评方法及装置。
其中,该候选人胜任能力测评装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Personal Computer,PC)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
在一些实施例中,该候选人胜任能力测评装置还可以集成在多个电子设备中,比如,候选人胜任能力测评装置可以集成在多个服务器中,由多个服务器来实现本申请的候选人胜任能力测评方法。
在一些实施例中,服务器也可以以终端的形式来实现。
例如,参考图1,该电子设备可以包括存储终端11、服务器12等,存储终端11可以存储候选人对应的访谈语料信息以及候选人语料数据集等,存储终端11、服务器12之间相互通信连接,在此不再赘述。
其中,服务器12可以包括处理器和存储器等。服务器12可以先获取候选人对应的访谈语料信息;然后对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;再对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;接着对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评等。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本申请实施例中,提供了一种涉及信息处理的候选人胜任能力测评方法,如图2所示,应用于服务器中,该候选人胜任能力测评方法的具体流程可以如下:
200、获取候选人对应的访谈语料信息。
在本申请实施例中,可以根据行为事件访谈设计访问问题,得到行为事件访谈问题,通过设计不同行为事件访谈问题能够考察候选人的某项行为事件能力(比如学习能力等),通过问题引导候选人通过一个已经发生在自己身上的具体事件来展现自己具备这项能力。通过对具体事件中一系列的具体行为解析,可以得到该候选人在该能力维度下的证明,从而获得可靠可信可解释的测评结果。
候选人对应的访谈语料信息为候选人基于行为事件访谈问题做出的回答信息,该回答信息可以包括文本内容,还可以包括语音内容等。
210、对访谈语料信息进行特征分割,得到分割后的回答语料特征集合。
在本申请实施例中,回答语料特征集合包括若干个回答语料特征。
在一些实施例中,对访谈语料信息进行特征分割,得到分割后的回答语料特征集之前,还包括:基于停用词,对访谈语料信息进行去除停用词处理,得到去除停用词后的访谈语料信息;基于重复词,对去除停用词后的访谈语料信息进行去重处理,得到去重处理后的访谈语料信息;将去重处理后的访谈语料信息作为预处理后的访谈语料信息。
在本申请实施例中,可以对获取到的候选人对应的访谈语料信息进行预处理,得到预处理后的访谈语料信息。当候选人对应的访谈语料信息存在语音信息时,还可以先对语音信息进行去噪处理,得到去噪处理后的访谈语料信息。本申请实施例通过对访谈语料信息进行预处理,将候选人的回答进行预处理从而能够去掉停用词以及重复无意义的话(口语词:嗯、啊之类的字词)。这样可以使得语料更干净,去除无用的干扰项,在后续任务中可以更好的去关注重要的语义信息,提高识别的准确性。
本申请实施例通过对访谈语料信息进行预处理,一个方面提高了后续数据处理的效率,另一个方面还提高了测评预测的准确性。
在一些实施例中,对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,包括:基于句子边界检测模型,检测出访谈语料信息对应的分割边界;根据访谈语料信息对应的分割边界对访谈语料信息进行特征分割,得到分割后的回答语料特征集合。
在本申请实施例中,可以通过句子边界检测模型对访谈语料信息进行检测并拆分成若干个句子。比如,当句子边界检测模型检测到标点符号时,可以在访谈语料信息的该标点符号位置处进行分割,从而得到若干个分割句子,每个分割句子对应一个回答语料特征,若干个回答语料特征构成了回答语料特征集合。
220、对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量。
本申请实施例中,可以采用自然语言处理技术(Natural Language Processing,NLP)将回答语料特征转化为语义特征表示向量。比如,本申请实施例可以采用one-hot编码、word转为向量(word2vec)、词嵌入(word embedding)等方式将回答语料特征转化为语义特征表示向量。
在一些实施例中,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量,包括:基于已训练完成的自编码语言模型,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量。
在本申请实施例中,可以通过已训练完成的自编码语言模型,对回答语料特征进行编码表示,从而得到回答语料特征对应的语义特征表示向量。
在本申请实施例中,自编码语言模型可以包括BERT模型中的网络结构等,在本申请其他实施例中,自编码语言模型还可以包括其他网络结构。BERT模型是一个预训练的语言表征模型,采用深层的双向Transformer组件来构建整个模型,从而生成能融合左右上下文信息的深层双向语言表征。
在一些实施例中,基于已训练完成的自编码语言模型,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量,包括:获取候选人语料数据集;利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:利用候选人语料数据集对自编码语言模型进行训练的过程中包括若干个训练任务,若干个训练任务包括但不限于完形填空训练任务、预测候选人回答场景任务。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:对自编码语言模型进行完形填空训练任务时,基于自编码语言模型,对候选人语料数据集中的语料样本进行词粒度的随机掩码;设置动词掩码参数,动词掩码参数用于提高动词的掩码概率,得到被掩码的词向量;基于被掩码的词向量的上下文,对被掩码的词向量进行预测,得到被掩码的词向量的预测语义特征;根据被掩码的词向量的预测语义特征对自编码语言模型调参。
在本申请实施例中,可以利用大量候选人语料样本进行自编码语言模型训练,可以包括若干个训练任务。比如,若干个训练任务可以包括完形填空训练任务等。进行完形填空训练任务时,通过掩码对自编码语言模型训练,将输入的文本进行词粒度的随机掩码,任何词都有可能被掩码,适当设置动词掩码参数以提高动词掩码的概率,然后通过输入文本的上下文来预测掩码词到底是什么,只有该模型真实理解上下文,才能准确预测出当前掩码词到底是什么。这样可以大幅度降低语言模型的困惑度,从而让模型真正的具备理解人类自然语言的能力。
本申请实施例之所以要提高动词的掩码概率,是因为行为事件访谈问题以及测评依据是基于行为的,行为一般是动词,所以为了更好地理解行为,本申请要提高动词的掩码概率,让模型更加注意行为式的动作短语,从而提高模型预测准确性。
在一些实施例中,利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:对自编码语言模型进行预测候选人回答场景任务时,获取语料样本的语义特征;对语料样本的语义特征进行回答场景类型识别,得到语料样本对应的回答场景预测类别;基于语料样本对应的回答场景标注类型,根据语料样本对应的回答场景预测类别对自编码语言模型调参,得到已训练完成的自编码语言模型。
在本申请实施例中,若干个训练任务还可以包括进行预测候选人回答场景任务等。进行预测候选人回答场景任务,即预测候选人回答的场景(学习、生活或工作等),这是一个分类任务,能够让模型更好的关注候选人讲述的事件场景以及更好的关注行为,只有真正能区分不同的事件场景以及候选人做了什么,才能更好的对候选人的能力做出准确的评价。本申请通过进行预测候选人回答场景训练任务,能够提高模型测评的准确性。
230、对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
在一些实施例中,对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评,包括:在已训练完成的自编码语言模型后拼接一层前馈神经网络,前馈神经网络用于提取语义特征表示向量对应的语言特征;在前馈神经网络后拼接一层分类层,分类层用于对语言特征进行行为事件结构化类型分类,得到分类结果,分类结果包括语义特征表示向量所属的行为事件结构化类型以及胜任能力分档概率。
在本申请实施例中,行为事件结构化类型包括但不限于情景类型、任务类型、行动类型、结果类型等。
本申请实施例中,可以将训练好的自编码语言模型作为编码器,并在其后拼接一层前馈神经网络,提取候选人的语言特征,在前馈神经网络层后拼接分类层,分类层可以包括激活函数,本申请实施例通过分类层能够计算出候选人的回答处于什么胜任能力分档的概率最高。
在本申请实施例中,可以利用大量特定能力维度的候选人语料,基于交叉熵损失函数训练模型。一共训练若干轮,每轮根据现有神经网络模型参数以及输入数据,进行前馈神经网络的前向计算,计算完成后,得到损失函数的结果,随后链式求导进行反向计算,根据预设学习率进行参数更新,在下一轮的训练中,重复上述过程,在迭代的过程中会发现损失函数值越来越小,说明神经网络模型越来越能理解候选人的语义信息,并根据BEI理论对候选人的表现进行准确的评判。训练结束后,模型的参数已经更新完毕,得到训练完成的模型,即可用它来进行预测后续候选人的胜任能力分档。
本申请实施例可以得到候选人的胜任能力分档,然后结合该分档,以及候选人答题语言信息,进行打分,将分档映射到一定数值区间内(比如0-100分等),然后输出测评结果。该测评结果即可被认为是在BEI理论指导下该候选人的能力分数。通过这种方式,本申请实施例可以把所有候选人的能力映射到一个连续值空间,彼此之间可以进行比较,从而进行择优劣汰。
本申请实施例首先基于互联网上的大量语料训练句子边界检测模型,实现基于语义对长文本按照句子进行分割;然后对于拆分后的全部句子集合,采用自编码语言模型对文本进行编码表示,得到语义特征表示向量;接着可以采用激活函数对得到的语义特征表示进行分类,得到每一个子句所属的类别,输出整段文本的结构信息。本申请实施例可以收集一定的访谈日志,使用模型进行预测,得到结构化的预测结果。在其他实施例中,还可以聘请人力资源领域专业顾问对结构化的预测结果进行纠错标注,并将标注结果应用于模型迭代,直到模型的输出结果与顾问的输出结果一致,得到最终的模型。
现有的技术一般只基于关键词来判断候选人的能力,流程如下:a根据设计好的题目对候选人提问,获取候选人回答;b根据该题目预设了一些关键词;c预设评鉴逻辑,例如若获选人回答命中越多的关键词,则会获得越高的评价;d统计a中获取的候选人回答命中多少b中预设的关键词,按照c中的评鉴逻辑进行打分,输出结果。现有技术存在的问题和缺点是完全违背了管理心理学中对于行为面试中抽取行为进行判分的基本逻辑,这样评价出来的结果是没有效度的,而且从纯技术角度分析,这种类似方案并没有真正去理解人类的自然语言,只是在做单纯的统计并根据统计结果进行强行赋予结果。
然而,本申请实施例可以获取候选人对应的访谈语料信息;然后对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;再对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;接着对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
本发明不仅利用行为事件访谈来设计整个人才测评方案,具备可靠的理论支撑,进一步使得评价结果具有较高的信度与效度;而且利用自然语言处理相关技术对候选人回答进行理解,降低人力和时间成本的同时,提高测评效率以及技术方案的可解释性与可靠性,从而提高人才测评准确性,使得机器的结果与人工结果有较高的一致性。本申请针对现有技术中人力访谈受公司管理者个人因素的影响,访谈结论不稳定的问题,能给出稳定的访谈分析日志;针对现有技术中人力访谈耗费时间、访谈效率低的问题,本申请通过人工智能技术解决效率问题,有效降低成本;本申请不仅可以为企业建立人才画像,挖掘素质能力特质,为人才招聘和培养做指引。而且评价体系具有理论依据,有较强的可解释性。
本申请具备可靠的理论支撑,从而使得评价结果具有较高的信度与效度,更贴近人工的评鉴结果。而且以候选人回答为模型输入,使机器深度理解候选人的回答,将非结构化的访谈记录整理成结构化的情景、任务、行动、结果等,因此使得模型的判断更具有解释性和可行性,同时极大降低企业访谈分析成本。
为了更好地实施以上方法,本申请实施例还提供一种候选人胜任能力测评装置,该候选人胜任能力测评装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
比如,在本实施例中,将以候选人胜任能力测评装置具体集成在电子设备中为例,对本申请实施例的方法进行详细说明。
例如,如图3所示,该候选人胜任能力测评装置可以包括:语料获取模块310、特征分割模块320、特征表示模块330和测评模块340。其中,语料获取模块310,配置于基于行为事件访谈题目,获取候选人对应的访谈语料信息;特征分割模块320,配置于对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;特征表示模块330,配置于对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;测评模块340,配置于对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评。
在一些实施例中,该候选人胜任能力测评装置还包括预处理模块,预处理模块配置于:基于停用词,对访谈语料信息进行去除停用词处理,得到去除停用词后的访谈语料信息;基于重复词,对去除停用词后的访谈语料信息进行去重处理,得到去重处理后的访谈语料信息;将去重处理后的访谈语料信息作为预处理后的访谈语料信息。
在一些实施例中,特征分割模块320包括边界检测模块,边界检测模块配置于:基于句子边界检测模型,检测出访谈语料信息对应的分割边界;根据访谈语料信息对应的分割边界对访谈语料信息进行特征分割,得到分割后的回答语料特征集合。
在一些实施例中,特征表示模块330包括特征表示子模块,特征表示子模块配置于:基于已训练完成的自编码语言模型,对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量。
在一些实施例中,特征表示子模块包括模型训练模块,模型训练模块配置于:获取候选人语料数据集;利用候选人语料数据集对自编码语言模型进行训练,得到已训练完成的自编码语言模型。
在一些实施例中,模型训练模块包括模型训练子模块,模型训练子模块配置于:利用候选人语料数据集对自编码语言模型进行训练的过程中包括若干个训练任务,若干个训练任务包括但不限于完形填空训练任务、预测候选人回答场景任务。
在一些实施例中,模型训练子模块包括第一训练模块,第一训练模块配置于:对自编码语言模型进行完形填空训练任务时,基于自编码语言模型,对候选人语料数据集中的语料样本进行词粒度的随机掩码;设置动词掩码参数,动词掩码参数用于提高动词的掩码概率,得到被掩码的词向量;基于被掩码的词向量的上下文,对被掩码的词向量进行预测,得到被掩码的词向量的预测语义特征;根据被掩码的词向量的预测语义特征对自编码语言模型调参。
在一些实施例中,模型训练子模块包括第二训练模块,第二训练模块配置于:对自编码语言模型进行预测候选人回答场景任务时,获取语料样本的语义特征;对语料样本的语义特征进行回答场景类型识别,得到语料样本对应的回答场景预测类别;基于语料样本对应的回答场景标注类型,根据语料样本对应的回答场景预测类别对自编码语言模型调参,得到已训练完成的自编码语言模型。
在一些实施例中,测评模块340包括分类模块,分类模块配置于:在已训练完成的自编码语言模型后拼接一层前馈神经网络,前馈神经网络用于提取语义特征表示向量对应的语言特征;在前馈神经网络后拼接一层分类层,分类层用于对语言特征进行行为事件结构化类型分类,得到分类结果,分类结果包括语义特征表示向量所属的行为事件结构化类型以及胜任能力分档概率。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的候选人胜任能力测评装置具备可靠的理论支撑,从而使得评价结果具有较高的信度与效度,更贴近人工的评鉴结果。而且以候选人回答为模型输入,使机器深度理解候选人的回答,将非结构化的访谈记录整理成结构化的情景、任务、行动、结果等,因此使得模型的判断更具有解释性和可行性,同时极大降低企业访谈分析成本。
本申请实施例还提供一种电子设备,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑,等等;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,等等。
在一些实施例中,该候选人胜任能力测评装置还可以集成在多个电子设备中,比如,候选人胜任能力测评装置可以集成在多个服务器中,由多个服务器来实现本申请的候选人胜任能力测评方法。
在本实施例中,将以本实施例的电子设备是服务器为例进行详细描述,比如,如图4所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403、输入模块404以及通信模块405等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。在一些实施例中,处理器401可包括一个或多个处理核心;在一些实施例中,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,在一些实施例中,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入模块404,该输入模块404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
该服务器还可包括通信模块405,在一些实施例中通信模块405可以包括无线模块,服务器可以通过该通信模块405的无线模块进行短距离无线传输,从而为用户提供了无线的宽带互联网访问。比如,该通信模块405可以用于帮助用户收发电子邮件、浏览网页和访问流式媒体等。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现候选人胜任能力测评装置中的各种功能。
在一些实施例中,还提出一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现上述任一种候选人胜任能力测评方法中的步骤。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本申请实施例可以获取候选人对应的访谈语料信息;然后对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;再对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;接着对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评等。
本申请实施例具备可靠的理论支撑,从而使得评价结果具有较高的信度与效度,更贴近人工的评鉴结果。而且以候选人回答为模型输入,使机器深度理解候选人的回答,将非结构化的访谈记录整理成结构化的情景、任务、行动、结果等,因此使得模型的判断更具有解释性和可行性,同时极大降低企业访谈分析成本。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种候选人胜任能力测评方法中的步骤。例如,该指令可以执行如下步骤:获取候选人对应的访谈语料信息;然后对访谈语料信息进行特征分割,得到分割后的回答语料特征集合,回答语料特征集合包括若干个回答语料特征;再对回答语料特征进行编码表示,得到回答语料特征对应的语义特征表示向量;接着对语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对候选人的胜任能力进行测评等。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中提供的候选人胜任能力测评的方面的各种可选实现方式中提供的方法。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种候选人胜任能力测评方法中的步骤,因此,可以实现本申请实施例所提供的任一种候选人胜任能力测评方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种候选人胜任能力测评方法、装置、服务器和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种候选人胜任能力测评方法,其特征在于,包括:
获取候选人对应的访谈语料信息;
对所述访谈语料信息进行特征分割,得到分割后的回答语料特征集合,所述回答语料特征集合包括若干个回答语料特征;
对所述回答语料特征进行编码表示,得到所述回答语料特征对应的语义特征表示向量;
对所述语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对所述候选人的胜任能力进行测评。
2.如权利要求1所述的候选人胜任能力测评方法,其特征在于,所述对所述访谈语料信息进行特征分割,得到分割后的回答语料特征集之前,还包括:
基于停用词,对所述访谈语料信息进行去除停用词处理,得到去除停用词后的访谈语料信息;
基于重复词,对所述去除停用词后的访谈语料信息进行去重处理,得到去重处理后的访谈语料信息;
将所述去重处理后的访谈语料信息作为预处理后的访谈语料信息。
3.如权利要求1所述的候选人胜任能力测评方法,其特征在于,所述对所述访谈语料信息进行特征分割,得到分割后的回答语料特征集合,包括:
基于句子边界检测模型,检测出所述访谈语料信息对应的分割边界;
根据所述访谈语料信息对应的分割边界对所述访谈语料信息进行特征分割,得到分割后的回答语料特征集合。
4.如权利要求1或3所述的候选人胜任能力测评方法,其特征在于,所述对所述回答语料特征进行编码表示,得到所述回答语料特征对应的语义特征表示向量,包括:
基于已训练完成的自编码语言模型,对所述回答语料特征进行编码表示,得到所述回答语料特征对应的语义特征表示向量。
5.如权利要求4所述的候选人胜任能力测评方法,其特征在于,所述基于已训练完成的自编码语言模型,对所述回答语料特征进行编码表示,得到所述回答语料特征对应的语义特征表示向量,包括:
获取候选人语料数据集;
利用所述候选人语料数据集对所述自编码语言模型进行训练,得到已训练完成的自编码语言模型。
6.如权利要求5所述的候选人胜任能力测评方法,其特征在于,所述利用所述候选人语料数据集对所述自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:
利用所述候选人语料数据集对所述自编码语言模型进行训练的过程中包括若干个训练任务,所述若干个训练任务包括但不限于完形填空训练任务、预测候选人回答场景任务。
7.如权利要求6所述的候选人胜任能力测评方法,其特征在于,所述利用所述候选人语料数据集对所述自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:
对所述自编码语言模型进行完形填空训练任务时,基于所述自编码语言模型,对所述候选人语料数据集中的语料样本进行词粒度的随机掩码;
设置动词掩码参数,动词掩码参数用于提高动词的掩码概率,得到被掩码的词向量;
基于所述被掩码的词向量的上下文,对所述被掩码的词向量进行预测,得到所述被掩码的词向量的预测语义特征;
根据所述被掩码的词向量的预测语义特征对所述自编码语言模型调参。
8.如权利要求7所述的候选人胜任能力测评方法,其特征在于,所述利用所述候选人语料数据集对所述自编码语言模型进行训练,得到已训练完成的自编码语言模型,包括:
对所述自编码语言模型进行预测候选人回答场景任务时,获取所述语料样本的语义特征;
对所述语料样本的语义特征进行回答场景类型识别,得到所述语料样本对应的回答场景预测类别;
基于所述语料样本对应的回答场景标注类型,根据所述语料样本对应的回答场景预测类别对所述自编码语言模型调参,得到已训练完成的自编码语言模型。
9.如权利要求8所述的候选人胜任能力测评方法,其特征在于,所述对所述语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对所述候选人的胜任能力进行测评,包括:
在所述已训练完成的自编码语言模型后拼接一层前馈神经网络,所述前馈神经网络用于提取所述语义特征表示向量对应的语言特征;
在所述前馈神经网络后拼接一层分类层,所述分类层用于对所述语言特征进行行为事件结构化类型分类,得到分类结果,所述分类结果包括所述语义特征表示向量所属的行为事件结构化类型以及胜任能力分档概率。
10.一种候选人胜任能力测评装置,其特征在于,包括:
语料获取模块,用于基于行为事件访谈题目,获取候选人对应的访谈语料信息;
特征分割模块,用于对所述访谈语料信息进行特征分割,得到分割后的回答语料特征集合,所述回答语料特征集合包括若干个回答语料特征;
特征表示模块,用于对所述回答语料特征进行编码表示,得到所述回答语料特征对应的语义特征表示向量;
测评模块,用于对所述语义特征表示向量进行行为事件结构化类型分类,得到分类结果,以完成对所述候选人的胜任能力进行测评。
CN202310392858.6A 2023-04-12 2023-04-12 一种候选人胜任能力测评方法及装置 Pending CN116452047A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310392858.6A CN116452047A (zh) 2023-04-12 2023-04-12 一种候选人胜任能力测评方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310392858.6A CN116452047A (zh) 2023-04-12 2023-04-12 一种候选人胜任能力测评方法及装置

Publications (1)

Publication Number Publication Date
CN116452047A true CN116452047A (zh) 2023-07-18

Family

ID=87126761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310392858.6A Pending CN116452047A (zh) 2023-04-12 2023-04-12 一种候选人胜任能力测评方法及装置

Country Status (1)

Country Link
CN (1) CN116452047A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110196894A (zh) * 2019-05-30 2019-09-03 北京百度网讯科技有限公司 语言模型的训练方法和预测方法
CN110717023A (zh) * 2019-09-18 2020-01-21 平安科技(深圳)有限公司 面试回答文本的分类方法及装置、电子设备、存储介质
CN112784049A (zh) * 2021-01-28 2021-05-11 电子科技大学 一种面向文本数据的在线社交平台多元知识获取方法
CN115617960A (zh) * 2021-07-13 2023-01-17 上海近屿智能科技有限公司 一种岗位推荐方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110196894A (zh) * 2019-05-30 2019-09-03 北京百度网讯科技有限公司 语言模型的训练方法和预测方法
CN110717023A (zh) * 2019-09-18 2020-01-21 平安科技(深圳)有限公司 面试回答文本的分类方法及装置、电子设备、存储介质
CN112784049A (zh) * 2021-01-28 2021-05-11 电子科技大学 一种面向文本数据的在线社交平台多元知识获取方法
CN115617960A (zh) * 2021-07-13 2023-01-17 上海近屿智能科技有限公司 一种岗位推荐方法及装置

Similar Documents

Publication Publication Date Title
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN108255805B (zh) 舆情分析方法及装置、存储介质、电子设备
Umer et al. CNN-based automatic prioritization of bug reports
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN111401077A (zh) 语言模型的处理方法、装置和计算机设备
CN110705255B (zh) 检测语句之间的关联关系的方法和装置
CN112100377B (zh) 文本分类方法、装置、计算机设备和存储介质
CN111382573A (zh) 用于答案质量评估的方法、装置、设备和存储介质
CN112036705A (zh) 一种质检结果数据获取方法、装置及设备
CN111858878B (zh) 从自然语言文本中自动提取答案的方法、系统及存储介质
CN111026840A (zh) 文本处理方法、装置、服务器和存储介质
CN112632252A (zh) 对话应答方法、装置、计算机设备和存储介质
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
CN117112744A (zh) 大语言模型的评估方法、装置及电子设备
CN117194628A (zh) 基于压缩技术提示词优化方法、装置、设备及存储介质
CN116071032A (zh) 基于深度学习的人力资源面试识别方法、装置及存储介质
CN115827865A (zh) 一种融合多特征图注意力机制的不良文本分类方法及系统
CN111753540B (zh) 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统
CN116452047A (zh) 一种候选人胜任能力测评方法及装置
CN114610576A (zh) 一种日志生成监控方法和装置
CN113761874A (zh) 事件事实性预测方法、装置、电子设备与存储介质
CN115066690A (zh) 搜索归一化-激活层架构
CN114942980B (zh) 一种确定文本匹配方法及装置
CN116227598B (zh) 一种基于双阶段注意力机制的事件预测方法、设备及介质
CN116304058B (zh) 企业负面信息的识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination