CN110827796A

CN110827796A - 基于语音的面试者判定方法、装置、终端及存储介质

Info

Publication number: CN110827796A
Application number: CN201910900813.9A
Authority: CN
Inventors: 黄竹梅; 王志鹏; 孙汀娟; 周雅君; 李恒
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2020-02-21
Anticipated expiration: 2039-09-23
Also published as: CN110827796B; WO2021057146A1

Abstract

本发明提供一种基于语音的面试者判定方法，包括：获取面试者的多个问题的回答语音；对每个问题的回答语音进行切片，得到多个语音片段；根据多个语音片段计算每个问题的音量特征、语速特征、持续时长、间断时长；根据每个问题的音量特征确定面试者的情绪稳定度；使用预先构建的自信度判定模型对语速特征、间断时长及持续时长进行判定，确定面试者的自信度；使用预先构建的自信度判定模型对语速特征及间断时长进行判定，确定面试者的反应速度；根据情绪稳定度、反应速度和自信度输出面试者的面试结果。本发明还提供一种基于语音的面试者判定装置、终端及存储介质。本发明通过能够客观且全面的评价面试者，评价结果更为精确和准确。

Description

基于语音的面试者判定方法、装置、终端及存储介质

技术领域

本发明涉及语音识别技术领域，具体涉及一种基于语音的面试者判定方法、装置、终端及存储介质。

背景技术

招聘是每个企业必不可少的一个环节，招聘效率不管是对企业的下一步发展战略还是企业成本都是至关重要的。然而由于应聘量较大，需要处理的简历多，带来了较大的工作量。

现有技术中，主要是通过面试官与面试者的面对面交流来判断面试者是否符合招聘需求，虽然也有通过人机交互的方式，获取面试者的语音，通过语音来进行面试。然而，这种人机交互的方式，也仅仅是分析语音的内容来判断面试者回答的问题是否正确，没有对面试者的语音进行深入分析，比如，分析面试者的情绪稳定性、反应速度以及自信度等特质。而这些特质对于岗位的匹配度也至关重要。

因此，如何在面试中通过分析语音特征快速且全面的评定面试者，是一个亟待解决的技术问题。

发明内容

鉴于以上内容，有必要提出一种基于语音的面试者判定方法、装置、终端及存储介质，通过对面试过程人机交互的语音进行深入分析与挖掘，确定出面试者的多个特征，通过这些特征客观且全面的评价面试者，评价结果更为精确和准确。

本发明的第一方面提供一种基于语音的面试者判定方法，所述方法包括：

获取面试者的多个问题的回答语音；

对每个问题的回答语音进行切片，得到多个语音片段；

根据所述多个语音片段计算每个问题的音量特征、语速特征、持续时长、间断时长；

根据所述每个问题的音量特征确定所述面试者的情绪稳定度；

使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度；

使用预先构建的自信度判定模型对所述语速特征及间断时长进行判定，确定所述面试者的反应速度；

根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。

在一个可选的实施例中，在所述获取面试者的多个问题的回答语音之前，所述方法还包括：

构建自信度判定模型和反应速度判定模型；

其中，所述自信度判定模型和反应速度判定模型的构建过程包括：

获取多个样本语音；

提取所述多个样本语音中的多个特征；

根据所述多个特征的分布情况，从所述多个特征中筛选出自信度区分度大的第一显著特征和筛选出反应速度区分度大的第二显著特征，其中，所述第一显著特征包括：语速特征、持续时长、间断时长，所述第二显著特征包括：语速特征、间断时长；

确定所述多个第一显著特征对应的多个自信度档次以及每个所述自信度档次对应的特征范围，及确定所述多个第二显著特征对应的多个反应速度档次以及每个所述反应速度档次对应的特征范围；

分别判断不同自信度档次的特征范围和不同反应速度档次的特征范围是否符合极值一致性；

若不同自信度档次的特征范围符合极值一致性，基于所述多个第一显著特征、多个自信度档次以及每个所述自信度档次对应的特征范围，构建自信度判定模型；

若不同反应速度档次的特征范围符合极值一致性，基于所述多个第二显著特征、多个反应速度档次以及每个所述反应速度档次对应的特征范围，构建反应速度判定模型。

在一个可选的实施例中，所述根据所述每个问题的音量特征确定所述面试者的情绪稳定度包括：

获取所述问题的音量特征中的最大音量特征及最小音量特征；

计算所有问题的平均音量特征；

计算所述最大音量特征和所述最小音量特征之间的音量特征幅度值；

根据所述每个问题的音量特征与所述所有问题的平均音量特征的差值的绝对值占所述音量特征幅度值的占比，确定出每个问题的音量波动幅度；

根据所有问题的音量波动幅度的平均值，确定面试者的情绪稳定度。

在一个可选的实施例中，所述使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度包括：

使用预先构建的自信度判定模型对所述每个问题的语速特征、间断时长及持续时长进行判定，确定出每个问题的自信度档次；

将所有问题得到的自信度档次转换为数值；

对所有问题自信度档次数据取平均值；

平均值向上取整得到面试者的自信度判定结果。

在一个可选的实施例中，所述使用预先构建的自信度判定模型对所述每个问题的语速特征、间断时长及持续时长进行判定，确定出每个问题的自信度档次包括：

使用预先构建的自信度判定模型分别识别所述语速特征、间断时长及持续时长属于的自信度档次对应的特征范围；

将属于的特征范围对应的自信度档次确定为所述语速特征的第一自信度档次、所述间断时长的第二自信度档次及所述持续时长的第三自信度档次；

判断所述第一自信度档次、第二自信度档次及第三自信度档次是否为多个；

若所述第一自信度档次、第二自信度档次及第三自信度档次为多个且均相同时，将多个相同的档次确定为候选自信度档次；

将多个所述候选自信度档次按自信度档次从高到低排序，获得自信度档次排序队列；

基于大数定理确定所述自信度档次排序队列的目标候选自信度档次为所述问题的自信度档次。

在一个可选的实施例中，若所述第一自信度档次、第二自信度档次及第三自信度档次为多个且不均相同时，所述方法还包括：

判断第一自信度档次、第二自信度档次及第三自信度档次的多个档次中是否有相同的档次；

若有相同的档次，则将相同的档次确定为候选自信度档次。

在一个可选的实施例中，若所述第一自信度档次、第二自信度档次及第三自信度档次为一个且不均相同时，所述方法还包括：

确定所述问题的自信度档次为空档次。

本发明的第二方面提供一种基于语音的面试者判定装置，所述装置包括：

获取模块，用于获取面试者的多个问题的回答语音；

切片模块，用于对每个问题的回答语音进行切片，得到多个语音片段；

计算模块，用于根据所述多个语音片段计算每个问题的音量特征、语速特征、持续时长、间断时长；

第一确定模块，用于根据所述每个问题的音量特征确定所述面试者的情绪稳定度；

第二确定模块，用于使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度；

第三确定模块，用于使用预先构建的自信度判定模型对所述语速特征及间断时长进行判定，确定所述面试者的反应速度；

输出模块，用于根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。

本发明的第三方面提供一种终端，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现所述基于语音的面试者判定方法。

本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述基于语音的面试者判定方法。

综上所述，本发明所述的基于语音的面试者判定方法、装置、终端及存储介质，通过获取面试者的每个问题的回答语音，对每个问题的回答语音进行切片，得到多个语音片段，提取每个所述语音片段的音量特征、语速特征、持续时长、间断时长，基于音量特征确定出面试者的情绪稳定度，再采用预先构建的自信度判定模型和反应速度判定模型对所述语速特征、持续时长、间断时长进行判断，确定出面试者的自信度和反应速度，根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。本发明通过对面试过程人机交互的语音进行深入分析与挖掘，确定出面试者的多个特征，例如情绪稳定度、反应速度和自信度，通过这些特征能够客观且全面的评价面试者，评价结果更为精确和准确，提高了面试的判定效率和质量。

附图说明

下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明实施例一提供的基于语音的面试者判定方法的流程图。

图2是本发明实施例二提供的基于语音的面试者判定装置的结构图。

图3是本发明实施例三提供的终端的结构示意图。

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

实施例一

在本实施例中，所述基于语音的面试者判定方法可以应用于终端中，对于需要进行基于语音的面试者判定的终端，可以直接在终端上集成本发明的方法所提供的基于语音的面试者判定的功能，或者以软件开发工具包(Software Development Kit，SKD)的形式运行在终端中。

如图1所示，所述基于语音的面试者判定方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，获取面试者的多个问题的回答语音。

预先根据招聘岗位的需求设置多个问题，通过人机交互的方式，获取面试过程中面试者与机器的针对每个问题的语音，再将机器发出的提问语音和面试者的回答语音分离开来，最后筛选出面试者的回答语音。

作为一种可选的实施例，在所述获取面试者的多个问题的回答语音之前，所述方法还包括：

构建自信度判定模型和反应速度判定模型。

获取多个样本语音；

提取所述多个样本语音中的多个特征；

通过大量的实验：对多个面试者回答的每个问题的样本语音进行自信度、情绪稳定度、反应速度的标注，再将四个相关特征及对应的标注结果作为学习的对象建立学习的模型，发现：从每个相关特征在不同程度的自信度/情绪稳定度/反应速度上的数据分布来看，不同自信度/情绪稳定度/反应速度的人数据差异分布明显且有规律，由此可以通过面试者的四个相关特征：音量特征、语速特征、持续时长和间断时长对面试者的自信度、情绪稳定度、反应速度进行量化评定。

再通过观察发现四个不同的音量特征、语速特征、持续时长、间断时长在不同自信度和不同反应速度的分布情况，从中确定出了不同自信度区分度比较大的特征类型和不同反应速度区分度比较大的特征类型。根据样本语音的四个相关特征和自信度档次，生成每个相关特征在不同自信度档次的第一箱型图和每个相关特征在不同反应速度档次的第二箱型图，并从第一箱型图中确定了在不同档次自信度区分度比较大的几种第一显著特征：语速特征、持续时长、间断时长，及从第二箱型图中确定了在不同档次反应速度区分度比较大的几种第二显著特征：语速特征、间断时长。最后基于语速特征、持续时长、间断时长这三种第一显著特征构建出了自信度判定模型。基于语速特征、间断时长这两种第二显著特征构建出了反应速度判定模型。

其中，所述第一箱型图是由第一显著特征的特征值在不同自信度档次分布生成的，所述第二箱型图是由第二显著特征的特征值在不同反应速度档次分布生成的。

本发明实施例中，在对所述显著特征进行训练时，需要根据所述显著特征对应的在不同自信度/反应速度档次的箱型图中最大值以及最小值来确定所述显著特征对应的在不同自信度/反应速度档次的特征值范围。在确定了所述显著特征对应的在不同自信度/反应速度档次的特征值范围后，需要判断所述特征值范围是否符合极值一致性，比如一个显著特征对应的在五个自信度/反应速度档次的特征比值范围为[a1,b1]，[a2,b2]，[a3,b3]，[a4,b4]，[a5,b5]，若自信度/反应速度档次在这个显著特征上是单调递增的，即，自信度/反应速度档次越高，该显著特征对应的特征比值的最大值与最小值越大，若特征比值范围满足a1<＝a2<＝a3<＝a4<＝a5，b1<＝b2<＝b3<＝b4<＝b5。这时候可以确定不同自信度/反应速度档次的特征比值范围符合极值一致性。根据所述多个第二特征中的显著特征、多个自信度/反应速度档次以及每个所述自信度/反应速度档次对应的特征值范围，生成自信度/反应速度判定模型。

可选的，若不同自信度/反应速度档次的特征比值范围不符合极值一致性时，需要变更特征值范围，比如上面例子中的显著特征对应的在五个自信度/反应速度档次的特征值范围为[a1,b1]，[a2,b2]，[a3,b3]，[a4,b4]，[a5,b5]，自信度/反应速度档次在这个显著特征上是单调递增的，若某个特征比值范围不满足a1<＝a2<＝a3<＝a4<＝a5，b1<＝b2<＝b3<＝b4<＝b5，需要将该特征值范围变更为下一档次的特征值范围，比如：a1>a2<＝a3<＝a4<＝a5，这时需要将a1的值变更为a2的值，使得a1<＝a2<＝a3<＝a4<＝a5成立。

应当理解的是，还可以预先划分更多的档次或更少的档次，本发明对此不做具体的限定。

S12，对每个问题的回答语音进行切片，得到多个语音片段。

面试者对每个问题进行回答之后，将面试者针对每个问题的回答语音进行切分成多个语音片段。

示例性的，将面试者的每个问题的回答语音切分为28个语音片段。

S13，根据所述多个语音片段计算每个问题的音量特征、语速特征、持续时长、间断时长。

所述音量特征是指面试者在回答问题时的声音的大小。

所述语速特征是指面试者在回答问题时的快慢，单位时间内语音内容的多少。

所述持续时长是指面试者在回答问题时连续说话的时间长短。

所述间断时长是指面试者在回答问题时未说话的时间长短。

每个语音片段都有四个相关特征：音量特征、语速特征、持续时长、间断时长，将同一个问题的所有语音片段的相关特征进行平均之后，即可得到每个问题每个相关特征的均值。具体而言，将每个问题的所述多个语音片段的音量特征进行平均得到每个问题的音量特征均值；将每个问题的所述多个语音片段的语速特征进行平均得到每个问题的语速特征均值；将每个问题的所述多个语音片段的持续时长进行平均得到每个问题的持续时长均值；将每个问题的所述多个语音片段的间断时长进行平均得到每个问题的间断时长均值。即，根据所述多个语音片段得到的音量特征、语速特征、持续时长和间断时长均是指均值。

S14，根据所述每个问题的音量特征确定所述面试者的情绪稳定度。

通常而言，声音的大小能够反应出人的情绪稳定性，声音波动的越大，表明人的情绪越激动；声音波动的越小，表明人的情绪越平稳。因而，可以通过面试者的音量特征的分布情况来确定面试者的情绪稳定度。

优选的，所述根据所述每个问题的音量特征确定所述面试者的情绪稳定度包括：

计算所有问题的平均音量特征；

预先设置了不同的音量特征幅度值与情绪稳定度之间的对应关系，一旦确定了面试者的音量特征幅度值，即可根据对应关系匹配出面试者的情绪稳定度。

示例性的，假设所有问题的音量特征中最大音量特征为max，最小音量特征为min，且所有问题的平均音量特征为avg，每个问题的音量特征为ai，则每个问题的音量波动幅度为|ai-avg|/(max-min)，再计算所有问题的音量波动幅度的平均值即可得到所有问题的平均音量波动幅度。如果平均音量波动幅度小于20％，则确定面试者的情绪稳定度为第一稳定度，表明所述面试者的情绪稳定度为“高”；如果平均音量波动幅度介于20％-30％，则确定面试者的情绪稳定度为第二稳定度，表明所述面试者的情绪稳定度为“中”，如果平均音量波动幅度大于30％，则确定面试者的情绪稳定度为第三稳定度，表明所述面试者的情绪稳定度为“低”。

S15，使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度。

越自信的人，说话越快，间断时长越短，且持续时长越长；越不自信的，说话越慢，间断时长越长，持续时长越短。

优选的，所述使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度包括：

将所有问题得到的自信度档次转换为数值；

对所有问题自信度档次数据取平均值；

平均值向上取整得到面试者的自信度判定结果。

示例性的，假设使用预先构建的自信度判定模型对所述每个问题的语速特征、间断时长及持续时长进行判定，确定出5个问题的自信度档次分别为：问题1-自信度档次A，问题2-自信度档次B，问题3-自信度档次B，问题4-自信度档次B，问题5-自信度档次A，根据问题的序号对5个问题对应的自信度档次进行排序得到ABBBA，最后确定出ABBBA中的中心位置为B，则目标自信度档次为B，作为所述面试者面试过程的自信度的最终判定结果。

为了避免出现偶数个问题没法确定面试者的自信度判定结果，可以将所有问题的得分进行数值转换，数值转换的结果平均后向上(大)取整得到个人的档次。比如：题1-自信度档次A-5分，问题2-自信度档次B-4分，问题3-自信度档次B-4分，问题4-自信度档次B-4分，问题5-自信度档次A-5分，平均值为4.4，向上(大)取整后得分为5分，则面试者的自信度判定结果为档次A。

在该可选的实施例中，任何一个特征箱型图(语速特征箱型图、间断时长箱型图、持续时长箱型图)中的每个自信度档次都确定了一个特征范围(范围为不同档次的最大值和最小值)，只有当某一个问题的所有特征(语速特征、间断时长、持续时长)都被确定为同一档次时，则所述问题的自信度被确定为此档次。示例性的，假设一通语音的语速特征为3.4，间隔时长为1.3，持续时长为5.6，语速特征箱型图中B档次的语速特征范围为[3.2,4]，间隔时长箱型图中B档次的间隔时长范围为[0.8,1.5]，持续时长箱型图中B档次的间隔时长范围为[5.3,5.7]，由于语速特征、间隔时长和持续时长均满足B档次的范围，因此该问题的自信度档次初次判定为B档次。

示例性的，假如第一自信度档次为A档次和B档次、第二自信度档次为A档次和B档次，第三自信度档次为A档次和B档次，即所述第一自信度档次、第二自信度档次和第三自信度档次均有多个且多个第一自信度档次、第二自信度档次和第三自信度档次均相同，则所述候选自信度档次有多个：A档次和B档次，自信度档次排序队列为AB，基于大数定理确定目标候选自信度为B档次，作为所述问题的自信度档次。

又如，第一自信度档次为A档次、B档次和C档次、第二自信度档次为A档次、B档次和C档次，第三自信度档次为A档次、B档次和C档次，即所述第一自信度档次、第二自信度档次和第三自信度档次均有多个且多个第一自信度档次、第二自信度档次和第三自信度档次均相同，则所述候选自信度档次有多个：A档次、B档次和C档次，自信度档次排序队列为ABC，基于大数定理确定目标候选自信度为B档次，作为所述问题的自信度档次。

应当理解的是，由于每个档次的特征范围都符合极值一致性，因而不会出现ABD或者BCE这种中间断档的情况。

若有相同的档次，则将相同的档次确定为候选自信度档次。

示例性的，假设第一自信度档次为A档次、B档次和D档次、第二自信度档次为A档次、B档次和E档次，第三自信度档次为A档次、B档次和C档次，即所述第一自信度档次、第二自信度档次和第三自信度档次为多个且多个第一自信度档次、第二自信度档次和第三自信度档次不均相同，但第一自信度、第二自信度和第三自信度有相同的档次A和B，则将相同的A档次和B档次均作为候选自信度档次，最后基于大数定理确定出所述问题的自信度档次为B档次。

确定所述问题的自信度档次为空档次。

其中，所述空档次是指遍历完所有的档次都不符合时的档次。

假设针对某一个问题，使用预先构建的自信度判定模型判断该问题的语速特征对应的自信度档次为A档次，而使用预先构建的自信度判定模型判断该问题的间断时长对应的自信度档次为B档次，使用预先构建的自信度判定模型判断该问题的持续时长对应的自信度档次为A档次，由于该问题的语速特征、间断时长及持续时长不均属于同一个自信度档次，则确定该问题的自信度档次不属于A档次且不属于B档次，即不存在第一，第二与第三自信度同时相同的情况，则确定该问题的自信度档次为空档次。

为了便于对出现空档次的问题也进行计算，同时根据大数定理，空档次的问题极大可能属于最一般的情况，即C档，因此可以预先设定空档次为C档次。

S16，使用预先构建的自信度判定模型对所述语速特征及间断时长进行判定，确定所述面试者的反应速度。

反应速度越快的人群，整体语速特征越大，间断时长越短；反应速度越慢的人群，整体语速特征越小，间断时长越长。

关于所述使用预先构建的自信度判定模型对所述语速特征及间断时长进行判定来确定所述面试者的反应速度的过程，同所述使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定来确定所述面试者的自信度的过程，具体可参见S15及其相关描述，本发明在此不再详细阐述。

在一个可选的实施例中，所述S15与所述S16并行执行。

在该可选的实施例中，可以同时开启两个线程同步执行，其中一个线程用于使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，另一个线程用于使用预先构建的反应速度判定模型对所述语速特征及间断时长进行判定。由于两个线程并行执行，因此，可以提高面试者的自信度和反应速度的判定效率，缩短判定时间，提高面试筛选的效率。

S17，根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。

在面试过程中，通过面试者对问题的回答语音分析出面试者的情绪稳定度、反应速度和自信度之后，可以根据面试岗位的侧重点，筛选出符合面试要求的面试者。

例如，对于客服岗位，需要情绪稳定且反应速度快的人员，以应对随时变化的市场，则筛选面试者时，重点关注情绪稳定度和反应速度。

再如，对于营销岗位，需要自信度高的人员，以给客户带来积极肯定的印象，促进双方的合作，则筛选面试者时，重点关注自信度。

综上，本发明所述的基于语音的面试者判定方法，通过获取面试者的每个问题的回答语音，对每个问题的回答语音进行切片，得到多个语音片段，提取每个所述语音片段的音量特征、语速特征、持续时长、间断时长，基于音量特征确定出面试者的情绪稳定度，再采用预先构建的自信度判定模型和反应速度判定模型对所述语速特征、持续时长、间断时长进行判断，确定出面试者的自信度和反应速度，根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。本发明通过对面试过程人机交互的语音进行深入分析与挖掘，确定出面试者的多个特征，例如情绪稳定度、反应速度和自信度，通过这些特征能够客观且全面的评价面试者，评价结果更为精确和准确，提高了面试的判定效率和质量。

实施例二

在一些实施例中，所述基于语音的面试者判定装置20可以包括多个由程序代码段所组成的功能模块。所述基于语音的面试者判定装置20中的各个程序段的程序代码可以存储于终端的存储器中，并由所述至少一个处理器所执行，以执行(详见图1描述)基于语音的面试者判定的功能。

本实施例中，所述基于语音的面试者判定装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：获取模块201、构建模块202、切片模块203、计算模块204、第一确定模块205、第二确定模块206、第三确定模块207及输出模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

获取模块201，用于获取面试者的多个问题的回答语音。

作为一种可选的实施例，在所述获取面试者的多个问题的回答语音之前，所述装置还包括：

构建模块202，用于构建自信度判定模型和反应速度判定模型。

获取多个样本语音；

提取所述多个样本语音中的多个特征；

切片模块203，用于对每个问题的回答语音进行切片，得到多个语音片段。

计算模块204，用于根据所述多个语音片段计算每个问题的音量特征、语速特征、持续时长、间断时长。

所述音量特征是指面试者在回答问题时的声音的大小。

所述间断时长是指面试者在回答问题时未说话的时间长短。

第一确定模块205，用于根据所述每个问题的音量特征确定所述面试者的情绪稳定度。

优选的，所述第一确定模块205根据所述每个问题的音量特征确定所述面试者的情绪稳定度包括：

计算所有问题的平均音量特征；

第二确定模块206，用于使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度。

优选的，所述第二确定模块206使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度包括：

将所有问题得到的自信度档次转换为数值；

对所有问题自信度档次数据取平均值；

平均值向上取整得到面试者的自信度判定结果。

在一个可选的实施例中，若所述第一自信度档次、第二自信度档次及第三自信度档次为多个且不均相同时，所述装置还包括：

判断模块，用于判断第一自信度档次、第二自信度档次及第三自信度档次的多个档次中是否有相同的档次；

所述判断模块，还用于若有相同的档次，则将相同的档次确定为候选自信度档次。

在一个可选的实施例中，若所述第一自信度档次、第二自信度档次及第三自信度档次为一个且不均相同时，所述第三确定模块207，还用于确定所述问题的自信度档次为空档次。

所述第三确定模块207，还用于使用预先构建的自信度判定模型对所述语速特征及间断时长进行判定，确定所述面试者的反应速度。

在一个可选的实施例中，所述第二确定模块206与所述第三确定模块207并行执行。

输出模块208，用于根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。

综上，本发明所述的基于语音的面试者判定装置，通过获取面试者的每个问题的回答语音，对每个问题的回答语音进行切片，得到多个语音片段，提取每个所述语音片段的音量特征、语速特征、持续时长、间断时长，基于音量特征确定出面试者的情绪稳定度，再采用预先构建的自信度判定模型和反应速度判定模型对所述语速特征、持续时长、间断时长进行判断，确定出面试者的自信度和反应速度，根据所述情绪稳定度、反应速度和自信度输出面试者的面试结果。本发明通过对面试过程人机交互的语音进行深入分析与挖掘，确定出面试者的多个特征，例如情绪稳定度、反应速度和自信度，通过这些特征能够客观且全面的评价面试者，评价结果更为精确和准确，提高了面试的判定效率和质量。

实施例三

参阅图3所示，为本发明实施例三提供的终端的结构示意图。在本发明较佳实施例中，所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的终端的结构并不构成本发明实施例的限定，既可以是总线型结构，也可以是星形结构，所述终端3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述终端3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述终端3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31用于存储程序代码和各种数据，例如安装在所述终端3中的装置，并在终端3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory，ROM)、可编程只读存储器(ProgrammableRead-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

在一些实施例中，所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述终端3的控制核心(Control Unit)，利用各种接口和线路连接整个终端3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行终端3的各种功能和处理数据。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述终端3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。

在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述终端3的操作装置以及安装的各类应用程序、程序代码等，例如，上述的各个模块。

所述存储器31中存储有程序代码，且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器31中的程序代码，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能。

在本发明的一个实施例中，所述存储器31存储多个指令，所述多个指令被所述至少一个处理器32所执行以实现本发明所述的方法中的全部或者部分步骤。

具体地，所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于语音的面试者判定方法，其特征在于，所述方法包括：

获取面试者的多个问题的回答语音；

对每个问题的回答语音进行切片，得到多个语音片段；

2.如权利要求1所述的方法，其特征在于，在所述获取面试者的多个问题的回答语音之前，所述方法还包括：

构建自信度判定模型和反应速度判定模型；

获取多个样本语音；

提取所述多个样本语音中的多个特征；

3.如权利要求1所述的方法，其特征在于，所述根据所述每个问题的音量特征确定所述面试者的情绪稳定度包括：

计算所有问题的平均音量特征；

4.如权利要求1至3中任意一项所述的方法，其特征在于，所述使用预先构建的自信度判定模型对所述语速特征、间断时长及持续时长进行判定，确定所述面试者的自信度包括：

将所有问题得到的自信度档次转换为数值；

对所有问题自信度档次数据取平均值；

平均值向上取整得到面试者的自信度判定结果。

5.如权利要求4所述的方法，其特征在于，所述使用预先构建的自信度判定模型对所述每个问题的语速特征、间断时长及持续时长进行判定，确定出每个问题的自信度档次包括：

6.如权利要求5所述的方法，其特征在于，若所述第一自信度档次、第二自信度档次及第三自信度档次为多个且不均相同时，所述方法还包括：

若有相同的档次，则将相同的档次确定为候选自信度档次。

7.如权利要求5所述的方法，其特征在于，若所述第一自信度档次、第二自信度档次及第三自信度档次为一个且不均相同时，所述方法还包括：

确定所述问题的自信度档次为空档次。

8.一种基于语音的面试者判定装置，其特征在于，所述装置包括：

获取模块，用于获取面试者的多个问题的回答语音；

9.一种终端，其特征在于，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于语音的面试者判定方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于语音的面试者判定方法。