CN109978339A - Ai面试模型训练方法、装置、计算机设备及存储介质 - Google Patents

Ai面试模型训练方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109978339A
CN109978339A CN201910148243.2A CN201910148243A CN109978339A CN 109978339 A CN109978339 A CN 109978339A CN 201910148243 A CN201910148243 A CN 201910148243A CN 109978339 A CN109978339 A CN 109978339A
Authority
CN
China
Prior art keywords
interview question
candidate
interview
data
score value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910148243.2A
Other languages
English (en)
Inventor
孙静远
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910148243.2A priority Critical patent/CN109978339A/zh
Publication of CN109978339A publication Critical patent/CN109978339A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及智能决策领域,具体通过关键词匹配对候选人的回答评分以作为样本数据的标注数据,实现对智能面试模型的训练。具体公开了一种AI面试模型训练方法、装置、计算机设备及存储介质,该方法包括:至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;根据所述样本数据和标注数据训练所述AI面试评价模型。

Description

AI面试模型训练方法、装置、计算机设备及存储介质
技术领域
本申请涉及智能面试技术领域,尤其涉及一种AI面试模型训练方法、装置、计算机设备及存储介质。
背景技术
将人工智能(ArtificialIntelligence,AI)技术应用于面试已经成为很多人的研究方向;但是人工智能面试模型尤其是深度学习面试模型的训练需要优质而标准的数据作为样本,才能逐步训练出高水平的人工智能面试模型。目前主要是通过人工收集数据,主要采取对存量员工的模拟考试以及对传统笔试和面试答案进行整理并标注;一方面需要耗费大量人力,另一方面训练出的模型精度较低,难以达到应用要求。
发明内容
本申请实施例提供一种AI面试模型训练方法、装置、计算机设备及存储介质,不需要耗费大量人力对答案进行整理并标注,AI面试评价模型可以较早的投入应用。
第一方面,本申请提供了一种AI面试模型训练方法,所述方法包括:
至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;
根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;
将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;
基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;
根据所述样本数据和标注数据训练所述AI面试评价模型。
第二方面,本申请提供了一种能力评价装置,所述装置包括:
样本获取模块,用于至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;
关键词获取模块,用于根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;
匹配模块,用于将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;
计算模块,用于基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;
训练模块,用于根据所述样本数据和标注数据训练所述AI面试评价模型。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现上述的AI面试模型训练方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现上述的AI面试模型训练方法。
本申请公开了一种AI面试模型训练方法、装置、设备及存储介质,通过基于对候选人提问问题和采集候选人的问答以获取样本数据,然后基于关键词对候选者的回答文本进行匹配,以及基于预设的评分计算规则根据匹配数据计算候选人对面试问题的能力评价分值,以将该评价分值作为样本数据的标注数据。从而不需要耗费大量人力对答案进行整理并标注,AI面试评价模型可以较早的投入应用。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例的AI面试模型训练方法的流程示意图;
图2为本申请一实施例的获取样本数据的子流程示意图;
图3为本申请另一实施例的AI面试模型训练方法的流程示意图;
图4为本申请再一实施例的AI面试模型训练方法的流程示意图;
图5为本申请又一实施例的AI面试模型训练方法的流程示意图;
图6为本申请又一实施例的AI面试模型训练方法的流程示意图;
图7为本申请一实施例提供的一种能力评价装置的结构示意图;
图8为本申请另一实施例提供的一种能力评价装置的结构示意图;
图9为本申请一实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
本申请的实施例提供了一种AI面试模型训练方法、装置、设备及存储介质。其中,该AI面试模型训练方法可以应用于保存有AI面试模型训练的终端或服务器中,该AI面试模型训练方法可以基于面试问答获取样本数据,并通过规则引擎对候选人的回答评分以作为样本数据的标注数据,从而根据样本数据和标注数据训练AI面试模型。
其中,终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;服务器可以为独立的服务器,也可以为服务器集群。
例如,将AI面试模型保存在面试终端,如主机中,面试终端连接了输出装置和输入装置;面试终端通过输出装置提问问题,并通过输出装置获取候选人输入的回答,面试终端对候选人的回答进行评分,并根据候选人的回答以及评分结果对AI面试模型进行训练。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的一种AI面试模型训练方法的流程示意图。本实施例以应用于终端的AI面试模型训练方法为例进行介绍。
如图1所示,AI面试模型训练方法包括以下步骤:
步骤S110、至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据。
在一些实施例中,终端预先存储了多个面试问题,并且各面试问题对应于不同的标识,如问题ID。终端按照预设规则抽取面试问题对候选人提问,并获取候选人对所述面试问题的回答文本;然后将回答文本与对应面试问题的标识相关联。
在一些实施例中,如图2所示,步骤S110至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据,具体包括以下步骤:
步骤S111、获取面试官的问题文本,匹配与所述问题文本相似的面试问题,并获取所述面试问题的标识。
示例性的,面试官通过口头的方式提问候选人,终端获取面试官的语音信号并将语音信号转换为问题文本;然后终端通过相似问引擎在预先存储了多个面试问题中匹配出与该问题文本最相近的面试问题,同时也可查询出该面试问题对应的标识。
具体的,可通过计算问题文本与预先存储了多个面试问题之间的文本相似度匹配出与该问题文本最相近的面试问题。首先对问题文本和要比较的面试问题进行词嵌入操作(Word Embedding)将自然语言表示的文本转换为计算机能够理解的向量或矩阵形式,然后计算两者的余弦相似度(cosine similarity);若余弦相似度小于预设的值或者为最小,则这个面试问题为匹配出的与所述问题文本相似的面试问题。
在一些实施例中,如图2所示,步骤S110至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据,具体还包括以下步骤:
步骤S112、获取所述候选人对所述面试问题的非文本格式的回答,将所述非文本格式的回答处理为回答文本。
在一些场景下,候选人通过输入文本回答面试问题,终端可以直接获取候选人通过输入装置输入的文本作为回答文本。在另一些场景下,候选人的回答为语音、书写文本、选择结果这些终端无法直接存储的非文本格式的回答。则先将候选人的语义回答转为回答文本、将候选人书写的内容通过文字识别等技术转为回答文本或者将候选人在做选择题时选中的选项转为回答文本。
步骤S120、根据所述面试问题的标识获取所述面试问题对应的规则关键词集合。
对于各面试问题,某些关键词可以作为回答评分的标准。
在一些可行的实施例中,所述面试问题对应的规则关键词集合包括多个规则关键词组,各所述规则关键词组分别包括至少一个关键词。具体的,结合专家经验,模拟真人评价标准,对面试问题设计规则关键词组,各规则关键词组中的关键词用分隔符分隔,存放于数据库的一个字段中。
示例性的,将一组含义相近的关键字作为一个规则关键词组。
在一些实施例中,对于面试问题对应的规则关键词集合,可以对规则关键词组、关键词进行增加、修改、移动、删除等操作。
步骤S130、将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据。
匹配数据可以体现回答文本中关键词的信息。
在一些可行的实施例中,如图3所示,步骤S130将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据,具体包括以下步骤:
步骤S131、根据所述回答文本,统计各所述规则关键词组中关键词的命中信息。
示例性的,查找规则关键词集合中的关键词是否在回答文本中有出现,若某关键词在回答文本中有出现,则该关键词被命中;而且,还可以统计各关键词在回答文本中出现的次数,若某关键词在回答文本中出现多次,则出现的次数为该关键词被命中的次数。将各关键词组中所有关键词的命中记录汇总起来,即为这个关键词组的命中信息。
步骤S140、基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
对于某面试问题,可以将回答文本中关键词的信息作为计算候选人对所述面试问题的评分的依据。
在一些可行的实施例中,步骤S140基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据,具体包括以下步骤:
步骤S141、根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
对于某面试问题,可以将关键词被回答文本命中的信息作为计算候选人对所述面试问题的评分的依据。
在一些实施例中,步骤S131根据所述回答文本,统计各所述规则关键词组中关键词的命中信息具体包括以下步骤:
查找各所述规则关键词组中是否有所述关键词被所述回答文本命中。
则步骤S141根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据具体包括以下步骤:
统计有所述关键词被所述回答文本命中的规则关键词组的数目以得到能力评价分值作为所述样本数据的标注数据。
例如,第一个、第三个、第四个规则关键词组中有关键词在回答文本中出现,则候选人对该面试问题的能力评价分值为3分,该分数作为标注数据与该样本数据相关联。
在一些实施例中,步骤S131根据所述回答文本,统计各所述规则关键词组中关键词的命中信息具体包括以下步骤:
查找规则关键词集合中各所述关键词被所述回答文本命中的命中次数。
则步骤S141根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据具体包括以下步骤:
统计各所述关键词的命中次数之和以得到能力评价分值作为所述样本数据的标注数据。
例如,规则关键词集合中的第二个、第五个、第八个关键词分别被所述回答文本命中的命中3次、2次、5次,则候选人对该面试问题的能力评价分值为3+2+5=10分,该分数作为标注数据与该样本数据相关联。
在另一些可行的实施例中,各所述规则关键词组分别对应于相同或不同的词组分值。例如,第一个、第二个、第三个、第四个、第五个规则关键词组对应的词组分值分别为5分、4分、4分、3分、2分。
在本实施例中,如图4所示,步骤S140中根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据,具体包括以下步骤:
步骤S142、根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
在一些实施例中,步骤S131根据所述回答文本,统计各所述规则关键词组中关键词的命中信息具体包括以下步骤:
查找各所述规则关键词组中的关键词被所述回答文本命中的命中次数。
则步骤S142根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据具体包括以下步骤:
根据各规则关键词组对应的命中次数对各所述规则关键词组对应的词组分值计算加权算数平均值以得到能力评价分值作为所述样本数据的标注数据。
示例性的,第一个则关键词组中有两个词共被回答文本命中2次,第二个则关键词组中有一个词共被回答文本命中1次,第四个则关键词组中有一个词共被回答文本命中2次,则根据2次、1次、2次对5分、4分、3分计算加权算数平均值,具体如下式:
则与该样本数据相关联的标注数据为4分。
在另一些实施例中,步骤S131根据所述回答文本,统计各所述规则关键词组中关键词的命中信息具体包括以下步骤:
查找有关键词被所述回答文本命中的规则关键词组。
则步骤S142根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据具体包括以下步骤:
根据所述有关键词被所述回答文本命中的规则关键词组对应的词组分值计算能力评价分值作为所述样本数据的标注数据。
示例性的,选取有关键词被所述回答文本命中的规则关键词组对应的最大或最小的词组分值为能力评价分值。
例如,第二个、第三个、第四个、第五个规则关键词组中有关键词被回答文本命中,则选取被命中的规则关键词组最大的词组分值,即4分为能力评价分值,或者选取被命中的规则关键词组最小的词组分值,即2分为能力评价分值作为所述样本数据的标注数据。
步骤S150、根据所述样本数据和标注数据训练所述AI面试评价模型。
其中,样本数据至少包括面试问题的标识,以及候选人对所述面试问题的回答文本;标注数据包括候选人对所述面试问题的能力评价分值。
AI面试评价模型具体地可以根据GoogLeNet模型等深度学习模型进行搭建,用随机值初始化所有过滤器和参数/权重;然后将样本数据和相应的标注数据输入AI面试评价模型,采用方向传播训练,使用GoogLeNet模型等的卷积层和池化层从输入的样本数据中提取特征,使用完全连接层用来做分类器,该分类器的输出包括预测的候选人对所述面试问题的能力评价分值。
使用预测的能力评价分值与标注数据的能力评价分值定义损失函数(loss),在模型训练中尽量缩小损失函数(loss),来保证模型的准确度,以完成AI面试评价模型的训练。
在一些实施例中,如图5所示,在步骤S140根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据之后,还包括以下步骤:
步骤S101、输出所述候选人对所述面试问题的能力评价分值,以作为所述AI面试评价模型在冷启动阶段的评价结果。
在AI面试评价模型应用的前期,由于没有足够的训练样本对其中的深度学习模型进行训练,因此基于深度学习模型对候选人进行评分的能力较弱。冷启动就是为了在训练样本有限的情况下先将AI面试评价模型的评分功能实现出来,并能够有入口收集足够的优质训练数据;然后根据这些优质而标准的训练数据作为深度学习模型训练的养料,逐步训练出高水平的AI面试评价模型。
在AI面试评价模型的冷启动阶段,可以应用基于关键词匹配和预设的评分计算规则计算的能力评价分值作为AI面试评价模型的评价结果。当AI面试评价模型训练的较好后,就可以直接由AI面试评价模型根据档次面试的面试问题的标识,以及候选人对所述面试问题的回答文本评估候选人对所述面试问题的能力评价分值。
在一些实施例中,如图5所示,在输出所述候选人对所述面试问题的能力评价分值之后,还包括以下步骤:
步骤S102、计算并输出所述候选人对至少另一面试问题的能力评价分值。
具体的,在对候选人对某一问题的回答进行评分后,进行下一次提问。示例性的,由对话管理引擎根据问题的标识获取下一问题,并通过前端系统输出;从而可以实现自动连续提问。
例如,先获取下一个面试问题的标识,然后获取候选人对所述下一个面试问题的回答文本;之后根据所述面试问题的标识获取所述下一个面试问题对应的规则关键词集合,以及将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据,再基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述下一个面试问题的能力评价分值。同样的,可以获取候选人在议程面试中对多个面试问题的能力评价分值。
步骤S103、根据所述候选人对所有面试问题对应的能力评价分值计算并输出所述候选人的综合评分。
示例性的,可以将候选人对所有面试问题对应的能力评价分值相加得到候选人的综合评分。
在一些可行的实施例中,如图6所示,步骤S110至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据,具体包括以下步骤:
步骤S113、获取公司标识和/或职位标识,以及面试问题的标识和候选人对所述面试问题的回答文本作为样本数据。
在一些实施例中,AI面试模型保存在服务器,不同的公司均可在在服务器开通账号,并设置与自己公司或相应岗位关联的面试问题,以及与面试问题对应的规则关键词集合。在另一些实施例中,AI面试模型保存在某个公司的终端上,该公司可以设置与不同岗位关联的面试问题,以及与面试问题对应的规则关键词集合。
从而可以根据获取的公司标识和/或职位标识读取与所述公司标识和/或职位标识关联的规则关键词集合。
步骤S120根据所述面试问题的标识获取所述面试问题对应的规则关键词集合,具体包括以下步骤:
步骤S121、根据所述公司标识和/或职位标识,以及所述面试问题的标识获取与所述公司标识和/或职位标识关联且与所述面试问题对应的规则关键词集合。
从而使得规则关键词集合可以与不同的公司、职位的个性化的素质、能力要求相匹配,步骤S140计算出的能力评价分值与公司和/或职位的需求更匹配。
在一些实施例中,AI面试模型训练方法可以应用于终端或服务器中,因此需要将训练好的模型保存在终端或服务器中。其中,该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;服务器可以为独立的服务器,也可以为服务器集群。
如果是应用于终端中,为了保证该终端的正常运行以及快速预测能力评价分值,还需要对训练得到的AI面试评价模型中的GoogLeNet模型等深度学习模型进行压缩处理,将压缩处理后的模型保存在终端。
其中,该压缩处理具体包括对深度学习模型进行剪枝处理、量化处理和哈夫曼编码处理等,以减小深度学习模型的大小,进而方便保存在容量较小的终端中。
上述实施例提供的AI面试模型训练方法,AI面试评价模型的训练样本是通过如下步骤获取的:通过基于对候选人提问问题和采集候选人的问答以获取样本数据,然后基于关键词对候选者的回答文本进行匹配,以及基于预设的评分计算规则根据所述匹配数据计算候选人对面试问题的能力评价分值作为该样本数据的标注数据。从而不需要耗费大量人力对答案进行整理并标注,AI面试评价模型可以较早的投入应用;弥补了GoogLeNet模型等深度学习模型的弱势期,在项目后期也可以对深度学习模型进行有效的补充,增强训练效果,提高准确率。
请参阅图7,图7是本申请一实施例提供的一种能力评价装置的结构示意图,该能力评价装置可以配置于服务器或终端中,用于执行前述的AI面试模型训练方法。
如图7所示,该能力评价装置包括:
样本获取模块110,用于至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据。
示例性的,样本获取模块110包括问题匹配单元,问题匹配单元用于获取面试官的问题文本,匹配与所述问题文本相似的面试问题,并获取所述面试问题的标识。
示例性的,样本获取模块110包括回答处理单元,回答处理单元用于获取所述候选人对所述面试问题的非文本格式的回答,将所述非文本格式的回答处理为回答文本。
关键词获取模块120,用于根据所述面试问题的标识获取所述面试问题对应的规则关键词集合。
匹配模块130,用于将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据。
示例性的,匹配模块130包括统计单元,统计单元用于根据所述回答文本,统计各所述规则关键词组中关键词的命中信息。
评分计算模块140,用于基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
示例性的,评分计算模块140包括第一计算单元,第一计算单元用于根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
在另一实施例中,评分计算模块140包括第二计算单元,第二计算单元用于根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
训练模块150,用于根据所述样本数据和标注数据训练所述AI面试评价模型。
在一些可行的实施例中,如图8所示,该能力评价装置还包括:
输出模块101,用于输出所述候选人对所述面试问题的能力评价分值,以作为所述AI面试评价模型在冷启动阶段的评价结果。
在一些实施例中,能力评价装置还包括:
对话管理模块102,用于在候选人对某一问题的回答进行评分后,进行下一次提问。以使上述各模块计算并输出所述候选人对至少另一面试问题的能力评价分值。
在一些实施例中,能力评价装置还包括:
综合评分计算模块103,用于根据所述候选人对所有面试问题对应的能力评价分值计算并输出所述候选人的综合评分。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
示例性的,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本申请实施例提供的一种计算机设备的结构示意图。该计算机设备可以是服务器或终端。
参阅图9,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种AI面试模型训练方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种AI面试模型训练方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;根据所述样本数据和标注数据训练所述AI面试评价模型。
在一些实施例中,所述处理器在实现所述根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据之后,还用于实现:
输出所述候选人对所述面试问题的能力评价分值,以作为所述AI面试评价模型在冷启动阶段的评价结果。
在一些实施例中,所述处理器在实现所述输出所述候选人对所述面试问题的能力评价分值之后,还用于实现:
计算并输出所述候选人对至少另一面试问题的能力评价分值;根据所述候选人对所有面试问题对应的能力评价分值计算并输出所述候选人的综合评分。
在一些实施例中,所述处理器在实现至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据时,用于实现:
获取面试官的问题文本,匹配与所述问题文本相似的面试问题,并获取所述面试问题的标识;获取所述候选人对所述面试问题的非文本格式的回答,将所述非文本格式的回答处理为回答文本。
在一些实施例中,所述处理器在实现所述至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据时,用于实现:
获取公司标识和/或职位标识,以及面试问题的标识和候选人对所述面试问题的回答文本作为样本数据。
在一些实施例中,所述处理器在实现所述根据所述面试问题的标识获取所述面试问题对应的规则关键词集合时,用于实现:
根据所述公司标识和/或职位标识,以及所述面试问题的标识获取所述面试问题对应的规则关键词集合。
在一些实施例中,所述面试问题对应的规则关键词集合包括多个规则关键词组,各所述规则关键词组分别包括至少一个关键词。
在一些实施例中,所述处理器在实现将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据时,用于实现:
根据所述回答文本,统计各所述规则关键词组中关键词的命中信息。
所述处理器在实现基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据时,用于实现:
根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
在一些实施例中,各所述规则关键词组分别对应于相同或不同的词组分值。
所述处理器在实现根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据时,用于实现:
根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法,如:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项AI面试模型训练方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种AI面试模型训练方法,其特征在于,包括:
至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;
根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;
将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;
基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;
根据所述样本数据和标注数据训练所述AI面试评价模型。
2.如权利要求1所述的AI面试模型训练方法,其特征在于,在所述根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据之后,还包括:
输出所述候选人对所述面试问题的能力评价分值,以作为所述AI面试评价模型在冷启动阶段的评价结果。
3.如权利要求2所述的AI面试模型训练方法,其特征在于,在所述输出所述候选人对所述面试问题的能力评价分值之后,还包括:
计算并输出所述候选人对至少另一面试问题的能力评价分值;
根据所述候选人对所有面试问题对应的能力评价分值计算并输出所述候选人的综合评分。
4.如权利要求1所述的AI面试模型训练方法,其特征在于,所述至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据,具体包括:
获取面试官的问题文本,匹配与所述问题文本相似的面试问题,并获取所述面试问题的标识;
获取所述候选人对所述面试问题的非文本格式的回答,将所述非文本格式的回答处理为回答文本。
5.如权利要求1所述的AI面试模型训练方法,其特征在于,所述至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据,具体包括:
获取公司标识和/或职位标识,以及面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;
所述根据所述面试问题的标识获取所述面试问题对应的规则关键词集合,具体包括:
根据所述公司标识和/或职位标识,以及所述面试问题的标识获取与所述公司标识和/或职位标识关联且与所述面试问题对应的规则关键词集合。
6.如权利要求1-5中任一项所述的AI面试模型训练方法,其特征在于,所述面试问题对应的规则关键词集合包括多个规则关键词组,各所述规则关键词组分别包括至少一个关键词;
所述将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据,具体包括:
根据所述回答文本,统计各所述规则关键词组中关键词的命中信息;
所述基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据,具体包括:
根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
7.如权利要求6所述的AI面试模型训练方法,其特征在于,各所述规则关键词组分别对应于相同或不同的词组分值;
所述根据所述命中信息计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据,具体包括:
根据所述命中信息和各所述规则关键词组对应的词组分值计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据。
8.一种能力评价装置,其特征在于,所述能力评价装置包括:
样本获取模块,用于至少获取面试问题的标识和候选人对所述面试问题的回答文本作为样本数据;
关键词获取模块,用于根据所述面试问题的标识获取所述面试问题对应的规则关键词集合;
匹配模块,用于将所述回答文本与所述规则关键词集合进行匹配处理,以获取所述回答文本的匹配数据;
评分计算模块,用于基于预设的评分计算规则,根据所述匹配数据计算所述候选人对所述面试问题的能力评价分值作为所述样本数据的标注数据;
训练模块,用于根据所述样本数据和标注数据训练所述AI面试评价模型。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1-7中任一项所述的AI面试模型训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:若所述计算机程序被处理器执行,实现如权利要求1-7中任一项所述的AI面试模型训练方法。
CN201910148243.2A 2019-02-27 2019-02-27 Ai面试模型训练方法、装置、计算机设备及存储介质 Pending CN109978339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910148243.2A CN109978339A (zh) 2019-02-27 2019-02-27 Ai面试模型训练方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910148243.2A CN109978339A (zh) 2019-02-27 2019-02-27 Ai面试模型训练方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109978339A true CN109978339A (zh) 2019-07-05

Family

ID=67077510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910148243.2A Pending CN109978339A (zh) 2019-02-27 2019-02-27 Ai面试模型训练方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109978339A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472880A (zh) * 2019-08-20 2019-11-19 李峰 评价合作问题解决能力的方法、装置及存储介质
CN110502745A (zh) * 2019-07-18 2019-11-26 平安科技(深圳)有限公司 文本信息评价方法、装置、计算机设备和存储介质
CN110717023A (zh) * 2019-09-18 2020-01-21 平安科技(深圳)有限公司 面试回答文本的分类方法及装置、电子设备、存储介质
CN111027305A (zh) * 2019-10-29 2020-04-17 平安科技(深圳)有限公司 基于文本匹配的智能面试方法、装置和计算机设备
CN111694936A (zh) * 2020-04-26 2020-09-22 平安科技(深圳)有限公司 用于ai智能面试的识别的方法、装置、计算机设备及存储介质
CN112434073A (zh) * 2019-08-24 2021-03-02 北京地平线机器人技术研发有限公司 一种样本选择模型的确定方法及装置
CN113806500A (zh) * 2021-02-09 2021-12-17 京东科技控股股份有限公司 信息处理方法、装置和计算机设备
CN114418366A (zh) * 2022-01-06 2022-04-29 北京博瑞彤芸科技股份有限公司 一种智能云面试的数据处理方法和装置
CN115774996A (zh) * 2022-12-05 2023-03-10 英仕互联(北京)信息技术有限公司 智能面试的追问题目生成方法、装置和电子设备
CN115936530A (zh) * 2022-12-29 2023-04-07 北京三星九千认证中心有限公司 基于关键词的履职能力评估方法及设备
CN117252260A (zh) * 2023-09-06 2023-12-19 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273861A (zh) * 2017-06-20 2017-10-20 广东小天才科技有限公司 一种主观题阅卷评分方法、装置及终端设备
CN108304437A (zh) * 2017-09-25 2018-07-20 腾讯科技(深圳)有限公司 一种自动问答方法、装置及存储介质
CN109146296A (zh) * 2018-08-28 2019-01-04 南京葡萄诚信息科技有限公司 一种人工智能评估人才方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273861A (zh) * 2017-06-20 2017-10-20 广东小天才科技有限公司 一种主观题阅卷评分方法、装置及终端设备
CN108304437A (zh) * 2017-09-25 2018-07-20 腾讯科技(深圳)有限公司 一种自动问答方法、装置及存储介质
CN109146296A (zh) * 2018-08-28 2019-01-04 南京葡萄诚信息科技有限公司 一种人工智能评估人才方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502745A (zh) * 2019-07-18 2019-11-26 平安科技(深圳)有限公司 文本信息评价方法、装置、计算机设备和存储介质
CN110472880A (zh) * 2019-08-20 2019-11-19 李峰 评价合作问题解决能力的方法、装置及存储介质
CN112434073B (zh) * 2019-08-24 2024-03-19 北京地平线机器人技术研发有限公司 一种样本选择模型的确定方法及装置
CN112434073A (zh) * 2019-08-24 2021-03-02 北京地平线机器人技术研发有限公司 一种样本选择模型的确定方法及装置
CN110717023A (zh) * 2019-09-18 2020-01-21 平安科技(深圳)有限公司 面试回答文本的分类方法及装置、电子设备、存储介质
CN110717023B (zh) * 2019-09-18 2023-11-07 平安科技(深圳)有限公司 面试回答文本的分类方法及装置、电子设备、存储介质
CN111027305A (zh) * 2019-10-29 2020-04-17 平安科技(深圳)有限公司 基于文本匹配的智能面试方法、装置和计算机设备
WO2021082488A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 基于文本匹配的智能面试方法、装置和计算机设备
CN111027305B (zh) * 2019-10-29 2023-12-19 平安科技(深圳)有限公司 基于文本匹配的智能面试方法、装置和计算机设备
CN111694936B (zh) * 2020-04-26 2023-06-06 平安科技(深圳)有限公司 用于ai智能面试的识别的方法、装置、计算机设备及存储介质
CN111694936A (zh) * 2020-04-26 2020-09-22 平安科技(深圳)有限公司 用于ai智能面试的识别的方法、装置、计算机设备及存储介质
CN113806500A (zh) * 2021-02-09 2021-12-17 京东科技控股股份有限公司 信息处理方法、装置和计算机设备
CN113806500B (zh) * 2021-02-09 2024-05-28 京东科技控股股份有限公司 信息处理方法、装置和计算机设备
CN114418366B (zh) * 2022-01-06 2022-08-26 北京博瑞彤芸科技股份有限公司 一种智能云面试的数据处理方法和装置
CN114418366A (zh) * 2022-01-06 2022-04-29 北京博瑞彤芸科技股份有限公司 一种智能云面试的数据处理方法和装置
CN115774996A (zh) * 2022-12-05 2023-03-10 英仕互联(北京)信息技术有限公司 智能面试的追问题目生成方法、装置和电子设备
CN115936530A (zh) * 2022-12-29 2023-04-07 北京三星九千认证中心有限公司 基于关键词的履职能力评估方法及设备
CN117252260A (zh) * 2023-09-06 2023-12-19 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质
CN117252260B (zh) * 2023-09-06 2024-06-11 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质

Similar Documents

Publication Publication Date Title
CN109978339A (zh) Ai面试模型训练方法、装置、计算机设备及存储介质
Shi et al. Calliope: Automatic visual data story generation from a spreadsheet
CN110163478B (zh) 一种合同条款的风险审查方法及装置
Penczynski Using machine learning for communication classification
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN110442873A (zh) 一种基于cbow模型的热点工单获取方法及装置
Urolagin Text mining of tweet for sentiment classification and association with stock prices
Qian et al. A formative study on designing accurate and natural figure captioning systems
Fu et al. Quda: natural language queries for visual data analytics
CN110389932B (zh) 电力文件自动分类方法及装置
CN110019556A (zh) 一种话题新闻获取方法、装置及其设备
Nakagawa et al. Investment strategy via lead lag effect using economic causal chain and ssestm model
CN117557331A (zh) 一种产品推荐方法、装置、计算机设备及存储介质
CN109993499A (zh) 面试综合评价方法、装置、计算机设备及存储介质
Ren Emotion analysis of cross-media writing text in the context of big data
Wheeler et al. Latent Dirichlet Allocation of constructed responses
Moreira Valle et al. RegBR: A novel Brazilian government framework to classify and analyze industry-specific regulations
Bansal et al. Cryptocurrency price prediction using Twitter and news articles analysis
JP2024518458A (ja) テキスト内の自動トピック検出のシステム及び方法
Bhoir et al. Resume Parser using hybrid approach to enhance the efficiency of Automated Recruitment Processes
Francis et al. SmarTxT: A Natural Language Processing Approach for Efficient Vehicle Defect Investigation
Liu et al. What is the current development status of wearable device in industrial 4.0? Using technology acceptance model to explore the willingness and pattern of usage of the consumers
Saleiro et al. Learning word embeddings from the portuguese twitter stream: A study of some practical aspects
Dwivedi et al. A statistical-semantic PSO model for customer reviews-based question answering systems
Soria et al. Comparative approach of sentiment analysis algorithms to classify social media information gathering in the Spanish language

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination