WO2020140376A1

WO2020140376A1 - 基于声纹识别的酒驾检测方法、装置、设备及存储介质

Info

Publication number: WO2020140376A1
Application number: PCT/CN2019/089161
Authority: WO
Inventors: 黄夕桐; 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-01-04
Filing date: 2019-05-30
Publication date: 2020-07-09
Also published as: CN109599121A

Abstract

本申请属于人工智能领域，公开了一种基于声纹识别的酒驾检测方法、装置、设备及存储介质，该方法包括：获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；根据所述标准特征值构建第一置信区间；若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。本申请提供的酒驾识别方法可以通过检测驾驶人员的说话声音来判断驾驶人员是否属于酒驾，提高了酒驾识别的效率。

Description

基于声纹识别的酒驾检测方法、装置、设备及存储介质

本申请以2019年1月4日提交的申请号为201910007825.9，名称为“基于声纹识别的酒驾检测方法、装置、设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请属于人工智能领域，更具体地说，是涉及一种基于声纹识别的酒驾检测方法、装置、设备及存储介质。

背景技术

酒后驾车是指在饮酒后8小时之内，或者醉酒后24小时之内驾驶车辆。统计表明，驾驶员酒后驾车后，发生事故的可能性是平时的15倍，30％的道路交通事故是由酒后开车、醉酒驾车引起的。

目前，对酒驾主要的检测方法为运用吹气式检测仪来检测，通过测试驾驶人员吹出的口气中酒精的含量来判断驾驶人员的行为是否属于酒驾行为：当车辆驾驶人员血液中的酒精含量大于或者等于20mg/100ml，小于80mg/100ml时，驾驶人员的驾驶行为属于饮酒驾车；当车辆驾驶人员血液中的酒精含量大于或者等于80mg/100ml，驾驶人员的驾驶行为属于醉酒驾车。然而，发明人意识到，酒后驾车的驾驶人员经常拖延或者不配合进行吹气检测，导致交通执法人员在检测一台汽车的酒驾情况的时间过长，可能会造成其它汽车存在酒驾行为而无法兼顾，检测效率较低。

发明内容

本申请实施例提供一种基于声纹识别的酒驾检测方法、装置、设备及存储介质，以解决目前酒驾检测的效率较低的问题。

一种基于声纹识别的酒驾检测方法，包括：

获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

根据所述标准特征值构建第一置信区间；

若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。

一种基于声纹识别的酒驾检测装置，包括：

测试特征值获取模块，用于获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

标准特征值获取模块，用于获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

第一置信区间构建模块，用于根据所述标准特征值构建第一置信区间；

酒驾样本判定模块，用于若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现上述基于声纹识别的酒驾检测方法。

一个或多个存储有计算机可读指令的计算机非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行时实现上述基于声纹识别的酒驾检测方法。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中基于声纹识别的酒驾检测方法的一应用环境示意图；

图2是本申请一实施例中基于声纹识别的酒驾检测方法的一流程图；

图3是本申请一实施例中基于声纹识别的酒驾检测方法的另一流程图；

图4是本申请一实施例中基于声纹识别的酒驾检测方法的另一流程图；

图5是本申请一实施例中基于声纹识别的酒驾检测方法的另一流程图；

图6是本申请一实施例中基于声纹识别的酒驾检测方法的另一流程图；

图7是本申请一实施例中基于声纹识别的酒驾检测装置的一原理框图；

图8是本申请一实施例中基于声纹识别的酒驾检测装置的另一原理框图；

图9是本申请一实施例中基于声纹识别的酒驾检测装置中测试特征值获取模块的一原理框图；

图10是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的基于声纹识别的酒驾检测方法，可应用在如图1的应用环境中，其中，客户端通过网络与服务端进行通信，服务端通过客户端获取测试声音样本，对测试声音样本进行预设特征值分析，得到测试特征值；然后服务端获取标准特征值，根据标准特征值构建第一置信区间，若测试特征值不属于第一置信区间，则判定测试声音样本为酒驾样本，并将判定结果输出至客户端。其中，客户端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种基于声纹识别的酒驾检测方法，以该方法应用在图1中的服务端为例进行说明，包括如下步骤：

S10：获取测试声音样本，对测试声音样本进行预设特征值分析，得到测试特征值。

其中，测试声音样本是指现场获取的驾驶人员的声音样本，可以通过客户端获取后发送至服务端。可选地，客户端包括测试声音样本的获取模块，测试声音样本的获取模块例如为录音装置。现场获取时，交警执法人员可以与驾驶人员进行对话，当驾驶人员说话时，交警执法人员开启客户端的声音获取模块获取驾驶人员说话的声音作为测试声音样本。进一步地，客户端还可以采用声纹识别技术，对录入的声音进行识别，根据识别的结果自动选取驾驶人员的声音作为测试声音样本，减少环境噪声或其它人员的声音对酒驾检测的影响。

其中，预设特征值是指可以反映声音样本对应的行为是否为酒驾的特征值，可以理解，人喝酒后，人的咽喉受到酒精的刺激，会发生一定程度的变化。而咽喉这些变化可以对测试声音样本进行声纹识别，通过检测预设特征值来体现。可选地，预设特征值可以为频率微扰值、振幅微扰值或规范化噪声能量值中的至少一项，也可以为其它可以反映咽喉变化的声学指标，本实施例不做具体限定。

具体地，服务端通过客户端获取驾驶人员的声音作为测试声音样本，然后服务端通过连接声纹识别设备对测试声音样本进行预设特征值分析，将得到的测试声音样本的预设特征值作为测试特征值。例如，服务端将通过客户端获取的测试声音样本发送至与服务端连接的声纹识别设备进行预设特征值分析，从而得到测试特征值。可选地，声纹识别设备可以是电声门图仪(electroglottography)，电声门图仪可以对声带振动基频、闭合率、频率微扰值、振幅微扰值、规范化噪声能量值，以及声带的外展程度和喉位的高低变化等特征值进行相应的检测。在预设特征值分析时，服务端将测试声音样本输入电声门图仪中，可得到预设特征值相应的值作为测试特征值。可选地，也可以将声纹识别设备集成于客户端，客户端在获取到测试声音样本后用声纹识别设备进行预设特征值分析，得到测试特征值，再将分析得到的测试特征值发送至服务端。

S20：获取标准特征值，标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数。

其中，标准声音样本是指已达到酒驾标准的人员的声音样本。可选地，可以获取通过吹气检测或抽血检查等方法确认达到酒驾标准的人员的录音，将这些录音作为标准声音样本。也可以邀请不同程度饮酒的人员进行录音来获取标准声音样本，从而可以对酒驾和醉驾的标准声音样本作进一步的细分。标准声音样本为N个，可以理解，N的值越大，即标准声音样本越多，基于声纹识别的酒驾检测方法的准确度越高。可选地，可以预先收集大量的标准声音样本存储于服务端的数据库中，作为预设的标准声音样本。

具体地，服务端通过获取N个达到酒驾标准的人员的声音样本作为标准声音样本，然后对这N个标准声音样本进行预设特征值分析，将分析得到的特征值作为标准特征值。

S30：根据标准特征值构建第一置信区间。

其中，置信区间(Confidence interval，简称CI)，是对产生样本的总体的参数分布中的某一个未知参数值，以区间形式给出的估计，相对于点估计用一个样本统计量来估计参数值，置信区间还蕴含了估计的精确度的信息。可以理解，通过构建置信区间可以提高判断测试声音样本是否属于酒驾样本的准确性。

具体地，服务端可以首先获取N个预设的标准声音样本的标准特征值的方差，再根据得到的方差构建第一置信区间，从而可以根据第一置信区间来判断测试声音样本是否属于酒驾样本。

可以理解，服务端在获取到测试声音样本后再获取标准特征值，根据标准特征值构建第一置信区间来判断测试声音样本是否属于酒驾样本，当标准声音样本发生变化时，例如标准声音样本增多时，服务端可以根据变化后的标准声音样本得到一个新的第一置信区间，再根据新的第一置信区间判断测试声音样本是否属于酒驾样本，方便基于声纹识别的酒驾检测方法的更新和升级。

在一个具体的实施例中，服务端也可以先获取N个标准声音样本的标准特征值的平均值，然后根据得到的平均值设定预设酒驾阈值，若测试特征值大于或者等于预设酒驾阈值，则判定测试声音样本为酒驾样本；若测试特征值小于预设酒驾阈值，则判定测试声音样本为非酒驾样本。例如，若根据标准特征值的频率微扰值的平均值将频率微扰值的预设酒驾阈值为A，测试特征值对应的频率微扰值大于A，则判定测试声音样本为酒驾样本。可选地，预设酒驾阈值可以根据标准特征值的平均值加减一个经验值得到。

S40：若测试特征值不属于第一置信区间，则判定测试声音样本为酒驾样本。

具体地，若测试特征值不属于第一置信区间，则服务端判定测试声音样本为酒驾样本，相应的驾驶人员为酒驾状态，服务端将判断的结果发送至客户端；若测试特征值属于第一置信区间，则服务端判定测试声音样本为非酒驾样本，相应的驾驶人员为非酒驾状态，服务端将判断的结果发送至客户端。

应理解，由于预设特征值可以包括多个检测内容，因此可以根据多个检测内容分别构建不同的第一置信区间。可选地，服务端可以设定当每一测试特征值都属于每一检测内容相应的第一置信区间时，判定测试声音样本为酒驾样本；也可以设定当预设部分的测试特征值属于相应的第一置信区间时，判定测试声音样本为酒驾样本，其它部分测试特征值则作为参考数据。

在图2对应的实施例中，通过获取测试声音样本，对测试声音样本进行预设特征值分析，得到测试特征值；然后获取标准特征值，根据标准特征值构建第一置信区间，若测试特征值不属于第一置信区间，则判定测试声音样本为酒驾样本。通过获取驾驶人员的声音，与标准声音样本得到的第一置信区间进行比较，从而判断驾驶人员是否属于酒驾，可以避免进行吹气检测时驾驶人员拖延或者不配合导致的检测时间过长的情况，提高酒驾识别的效率。

在一实施例中，如图3所示，预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个，在步骤S20之前，即在获取标准特征值的步骤之前，本实施例提供的基于声纹识别的酒驾检测方法还包括以下步骤：

S51：获取标准声音样本。

其中，服务端获取标准声音样本的方法与步骤S20的方法相同，这里不再赘述。

S52：对每一标准声音样本进行声纹识别，得到每一标准声音样本的预设特征值。

其中，声纹识别是指将标准声音样本发送至声纹识别设备进行预设特征值分析，预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个。可选地，声纹识别设备为电声门图仪，也可以是其它声纹识别设备，这里不做具体限定。

频率微扰(jitter)值是描述声波相邻周期之间基本频率变化的物理量，主要反映粗糙声程度，也反映嘶哑声程度。声音信号中的jitter值与声门区的功能状态是一致的，即正常情况下，嗓音周期间的频率相同的声波较多，不同频率的声波很少，此时频率微扰值很小；而当人饮酒后，人的咽喉受到酒精的刺激，声门区的功能状态会发生变化，使声音粗糙，jitter值增大。

振幅微扰(shimmer)值描述相邻周期之间声波幅度的变化，主要反映嘶哑声程度。当人饮酒后，人的咽喉受到酒精的刺激，声门区的功能状态会发生变化，使声音嘶哑，shimmer值增大。可以理解，Jitter值和shimmer值都反映声带振动的稳定性，其值越大说明在发声过程中声学信号出现的微小变化越大。

规范化噪声能量(NNE)值是计算发声时由于声门非完全关闭引起的声门噪声的能量，主要反映气息声程度，也反映嘶哑声程度和声门的关闭程度，当人饮酒后，人的咽喉受到酒精的刺激，声门区的功能状态会发生变化，使声音中的气息声增多，从而NNE值增大。

具体地，服务端对N个标准声音样本中每一个标准声音样本进行声纹识别，对jitter值、shimmer值或NNE值中至少一个预设特征值进行分析，得到每一标准声音样本的jitter值、shimmer值或NNE值中至少一个预设特征值。

S53：将每一标准声音样本的预设特征值作为对应的标准声音样本的标准特征值。

具体地，服务端将获取的每一标准声音样本的每一jitter值、shimmer值或NNE值中至少一个预设特征值保存在服务端的数据库中，作为对应的标准声音样本的标准特征值。可以理解，标准特征值包括jitter值、shimmer值和NNE值中的三个值时，更能体现酒驾人员的声音特征，基于声纹识别的酒驾检测方法的准确率更高。

在图3对应的实施例中，通过获取标准声音样本，然后对每一标准声音样本进行声纹识别，得到每一标准声音样本的预设特征值，最后将每一标准声音样本的预设特征值作为对应的标准声音样本的标准特征值。通过对标准声音样本的频率微扰值、振幅微扰值或规范化噪声能量值中至少一个预设特征值进行分析，为判断测试声音样本是否属于酒驾样本提供了数据支持和判断的依据。另外，由于频率微扰值、振幅微扰值或规范化噪声能量值可以很好地反映酒驾人员的声音特征，因此可以提高判断驾驶人员是否为酒驾人员的准确度。

在一实施例中，如图4所示，在步骤S10中，即获取测试声音样本，对测试声音样本进行预设特征值分析，得到测试特征值，具体可以包括以下步骤：

S11：基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本。

可以理解，为了得到更好的声纹识别效果，在获取测试声音样本时，可以对发声时间、发音音素或环境条件中至少一个条件进行相应的规定。可选地，预设发音音素可以为元音；元音，例如是a，u、o等，又称母音，是音素的一种，与辅音相对；元音是在发音过程中由气流通过口腔而不受阻碍发出的音，不同的元音是由口腔不同的形状造成的，可以理解，通过元音可以更好地反映声音的特征。可选地，预设发声时间可以为3～5秒，使声音可以被完整的录入，声音的预设特征值能得到完整的体现。可选地，预设环境条件可以是将环境噪声控制在45dB SPL以下。由于现场测试通常会受到现场噪声的影响，预设环境条件的实现可以是将驾驶人员带至适当的环境(例如交警的车内或交警办公室)，也可以在预设发音音素和/或预设发声时间判定为酒驾的基础上，再在预设环境条件下作进一步的确认。

具体地，服务端在预设发音音素、预设发声时间和预设环境条件中至少一个条件下获取测试声音样本。可以理解，满足的条件越多，酒驾识别的准确性越高。

S12：对测试声音样本进行声纹识别，得到测试声音样本的预设特征值。

其中，声纹识别是指将测试声音样本发送至声纹识别设备进行预设特征值分析，预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个。可选地，声纹识别设备为电声门图仪，也可以是其它声纹识别设备，这里不做具体限定。

具体地，服务端对获取的测试声音样本进行jitter值、shimmer值或NNE值中至少一个预设特征值的分析，得到测试声音样本的jitter值、shimmer值或NNE值中至少一个预设特征值。

S13：将测试声音样本的预设特征值作为测试特征值。

具体地，服务端将得到的测试声音样本的jitter值、shimmer值或NNE值中至少一个预设特征值作为测试特征值，并保存在服务端的数据库中。可选地，标准特征值与测试特征值包含的jitter值、shimmer值和NNE值对应。例如，若标准特征值包括jitter值和shimmer值，则测试特征值也包括jitter值和shimmer值。

在图4对应的实施例中，通过基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本，然后对测试声音样本进行声纹识别，得到测试声音样本的预设特征值；最后将测试声音样本的预设特征值作为测试特征值。通过对测试声音样本时进行发音音素、发声时间或环境条件进行规范，可以使获取的测试声音样本更能反映体现预设特征值，从而提高判断测试声音样本是否属于酒驾样本的准确性。

在一实施例中，如图5所示，在步骤S30中，即根据标准特征值构建第一置信区间，具体可以包括以下步骤：

S31：获取N个标准特征值的方差。

具体地，若N个标准特征值表示为(x ₁,x ₂,x ₃···x _N)，服务端可以用以下公式计算N个标准声音样本对应的标准特征值的方差：

其中，x是指标准特征值，μ是(x ₁,x ₂,x ₃···x _N)的平均值。

S32：根据N个标准特征值的方差构建第一置信区间。

具体地，服务端可以根据客户端的输入选取一个显著性水平，再根据选取的显著性水平构建第一置信区间。其中，显著性水平是估计总体参数落在某一区间内，可能犯错误的概率，即通过该显著性水平构建置信区间时可能犯错误的概率。例如，若构建的第一置信区间为B，若测试特征值没有落在B这个第一置信区间内，则服务端将测试声音样本判定为非酒驾样本，但实际上测试声音样本为酒驾样本，则为犯错误。可选地，显著性水平可以取0.05，0.01，以显著性水平取0.05为例，相应地，置信范围为95％，则第一置信区间构建为：

即以

为误差范围构建第一置信区间。

具体地，服务端将测试声音样本的测试特征值与构建的第一置信区间进行比较，若测试特征值落入构建的第一置信区间内，则判定测试声音样本为非酒驾样本，并将非酒驾的判定结果发送至客户端；若测试特征值落在构建的第一置信区间外，则判定测试声音样本为酒驾样本，并将酒驾的判定结果发送至客户端。

在图5对应的实施例中，通过获取N个标准特征值的方差，再根据N个标准特征值的方差构建第一置信区间，可以为判断测试声音样本为酒驾样本提供判断的依据。另外，通过构建置信区间来实现酒驾样本的识别，可以提高酒驾识别的准确度。

在一实施例中，如图6所示，在步骤S40之后，即在若测试特征值不属于第一置信区间，则判定测试声音样本为酒驾样本的步骤之后，本实施例提供的基于声纹识别的酒驾检测方法还包括以下步骤：

S61：若测试特征值与N个标准特征值的数据差异性小于预设显著性水平，则将相应的酒驾样本保存至数据库中作为新的标准声音样本。

其中，测试特征值与标准特征值的数据差异性可以用显著性水平来衡量，本实施例中，预设显著性水平可以根据实际需要进行设定，可以取0.05或0.01。可以理解，当预设显著性水平不同时，构建的置信区间也不一样。由于需要确保服务端将测试声音样本判定为酒驾样本时犯错误的概率更低，可以将预设显著性水平取为0.01，即服务端将酒驾样本保存在数据库中作为新的标准声音样本时预设显著性水平取为0.01，而在服务端判断测试声音样本为酒驾样本的显著性水平取为0.05。

具体地，若测试特征值与N个标准特征值的数据差异性小于预设显著性水平，则服务端可以将相应的酒驾样本(测试声音样本)存入服务端的数据库中作为新的标准声音样本。可以理解，数据库中的标准声音样本的数量越多，基于声纹识别的酒驾检测方法越准确。

S62：将新的标准声音样本并入N个标准声音样本中，得到更新后的标准声音样本。

具体地，服务端将新的标准声音样本并入原来N个标准声音样本中，得到更新后的标准声音样本。可以理解，新的标准声音样本可以为多个，即同一时刻有n个酒驾样本转为新的标准声音样本。例如若新的标准声音样本个数为n个，则增加后服务端的数据库中有N+n个标准声音样本。可选地，服务端也可以根据预设时间间隔对标准声音样本进行更新，预设时间间隔例如是一天、一周或一个月等，具体不做限定。

S63：获取更新后的标准声音样本的方差，根据更新后的标准声音样本的方差构建第二置信区间。

具体地，服务端可以根据步骤S31的方法获取更新后的标准声音样本的方差，再根据更新后的标准声音样本的方差重新构建置信区间，得到第二置信区间。当需要判断新的测试声音样本是否属于酒驾样本时，用新构建的第二置信区间进行判断，判断新的测试声音样本相应的测试特征值是否属于第二置信区间，若该测试特征值不属于第二置信区间，则服务端判定新的测试声音样本为酒驾样本。可以理解，通过不断扩充服务端数据库的标准声音样本，可以使基于声纹识别的酒驾检测方法更加准确。

在图6对应的实施例中，若测试特征值与N个标准特征值的数据差异性小于预设显著性水平，则将相应的酒驾样本保存至数据库中作为新的标准声音样本；然后将新的标准声音样本并入N个标准声音样本中，得到更新后的标准声音样本，再获取更新后的标准声音样本的方差，根据更新后的标准声音样本的方差构建第二置信区间。通过将小于预设显著性水平的酒驾样本并入标准声音样本中，可以扩充标准声音样本的数量；而根据扩充后的标准声音样本得到的置信区间去判断测试声音样本是否属于酒驾样本，可以不断提高酒驾识别的准确性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种基于声纹识别的酒驾检测装置，该基于声纹识别的酒驾检测装置与上述实施例中基于声纹识别的酒驾检测方法一一对应。如图7所示，该基于声纹识别的酒驾检测装置包括测试特征值获取模块10、标准特征值获取模块20、第一置信区间构建模块30和酒驾样本判定模块40。各功能模块详细说明如下：

测试特征值获取模块10，用于获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

标准特征值获取模块20，用于获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

第一置信区间构建模块30，用于根据所述标准特征值构建第一置信区间；

酒驾样本判定模块40，用于若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。

进一步地，预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个，如图8所示，本实施例提供的基于声纹识别的酒驾检测装置还包括预设特征值分析模块50，预设特征值分析模块50包括标准样本获取单元51、第一声纹识别单元52、标准特征值确定单元53。

标准样本获取单元51，用于获取标准声音样本；

第一声纹识别单元52，用于对每一标准声音样本进行声纹识别，得到每一标准声音样本的预设特征值；

标准特征值确定单元53，用于将每一标准声音样本的预设特征值作为对应的标准声音样本的标准特征值。

进一步地，如图9所示，测试特征值获取模块10还包括测试样本获取单元11、第二声纹识别单元12和测试特征值确定单元13。

测试样本获取单元11，用于基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本；

第二声纹识别单元12，用于对测试声音样本进行声纹识别，得到测试声音样本的预设特征值；

测试特征值确定单元13，用于将测试声音样本的预设特征值作为测试特征值。

进一步地，第一置信区间构建模块30还用于：

获取N个标准特征值的方差；

根据N个标准特征值的方差构建第一置信区间。

进一步地，本实施例提供的基于声纹识别的酒驾检测装置还包括第二置信区间构建模块，其中，第二置信区间构建模块具体用于：

若测试特征值与N个标准特征值的数据差异性小于预设显著性水平，则将相应的酒驾样本保存至数据库中作为新的标准声音样本；

将新的标准声音样本并入N个标准声音样本中，得到更新后的标准声音样本；

获取更新后的标准声音样本的方差，根据更新后的标准声音样本的方差构建第二置信区间。

关于基于声纹识别的酒驾检测装置的具体限定可以参见上文中对于基于声纹识别的酒驾检测方法的限定，在此不再赘述。上述基于声纹识别的酒驾检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储测试声音样本、标准声音样本、测试特征值、标准特征值和酒驾样本等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于声纹识别的酒驾检测方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：

获取测试声音样本，对测试声音样本进行预设特征值分析，得到测试特征值；

获取标准特征值，标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

根据标准特征值构建第一置信区间；

若测试特征值不属于第一置信区间，则判定测试声音样本为酒驾样本。

在一个实施例中，一个或多个存储有计算机可读指令的计算机非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器实现如下步骤：

根据标准特征值构建第一置信区间；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种基于声纹识别的酒驾检测方法，其特征在于，包括：

获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

根据所述标准特征值构建第一置信区间；

若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。
如权利要求1所述的基于声纹识别的酒驾检测方法，其特征在于，所述预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个；

在所述获取标准特征值的步骤之前，所述基于声纹识别的酒驾检测方法还包括：

获取所述标准声音样本；

对每一所述标准声音样本进行声纹识别，得到每一所述标准声音样本的所述预设特征值；

将每一所述标准声音样本的所述预设特征值作为对应的所述标准声音样本的标准特征值。
如权利要求2所述的基于声纹识别的酒驾检测方法，其特征在于，所述获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值，包括：

基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本；

对所述测试声音样本进行声纹识别，得到所述测试声音样本的所述预设特征值；

将所述测试声音样本的所述预设特征值作为测试特征值。
如权利要求3所述的基于声纹识别的酒驾检测方法，其特征在于，所述根据所述标准特征值构建第一置信区间，包括：

获取N个所述标准特征值的方差；

根据所述N个标准特征值的方差构建第一置信区间。
如权利要求4所述的基于声纹识别的酒驾检测方法，其特征在于，在所述若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本的步骤之后，所述基于声纹识别的酒驾检测方法还包括：

若所述测试特征值与N个所述标准特征值的数据差异性小于预设显著性水平，则将相应的所述酒驾样本保存至数据库中作为新的标准声音样本；

将所述新的标准声音样本并入N个所述标准声音样本中，得到更新后的标准声音样本；

获取更新后的标准声音样本的方差，根据所述更新后的标准声音样本的方差构建第二置信区间。
一种基于声纹识别的酒驾检测装置，其特征在于，包括：

测试特征值获取模块，用于获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

标准特征值获取模块，用于获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

第一置信区间构建模块，用于根据所述标准特征值构建第一置信区间；

酒驾样本判定模块，用于若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。
如权利要求6所述的基于声纹识别的酒驾检测装置，其特征在于，所述预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个；

所述基于声纹识别的酒驾检测装置还包括预设特征值分析模块，所述预设特征值分析模块包括标准样本获取单元、第一声纹识别单元、标准特征值确定单元；

所述标准样本获取单元，用于获取所述标准声音样本；

所述第一声纹识别单元，用于对每一所述标准声音样本进行声纹识别，得到每一所述标准声音样本的所述预设特征值；

所述标准特征值确定单元，用于将每一所述标准声音样本的所述预设特征值作为对应的所述标准声音样本的标准特征值。
如权利要求7所述的基于声纹识别的酒驾检测装置，其特征在于，所述测试特征值获取模块包括测试样本获取单元、第二声纹识别单元和测试特征值确定单元；

所述测试样本获取单元，用于基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本；

所述第二声纹识别单元，用于对所述测试声音样本进行声纹识别，得到所述测试声音样本的所述预设特征值；

所述测试特征值确定单元，用于将所述测试声音样本的所述预设特征值作为测试特征值。
如权利要求8所述的基于声纹识别的酒驾检测装置，其特征在于，所述第一置信区间构建模块还用于：

获取N个所述标准特征值的方差；

根据所述N个标准特征值的方差构建第一置信区间。
如权利要求9所述的基于声纹识别的酒驾检测装置，其特征在于，还包括第二置信区间构建模块，所述第二置信区间构建模块用于：

若所述测试特征值与N个所述标准特征值的数据差异性小于预设显著性水平，则将相应的所述酒驾样本保存至数据库中作为新的标准声音样本；

将所述新的标准声音样本并入N个所述标准声音样本中，得到更新后的标准声音样本；

获取更新后的标准声音样本的方差，根据所述更新后的标准声音样本的方差构建第二置信区间。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

根据所述标准特征值构建第一置信区间；

若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。
如权利要求11所述的计算机设备，其特征在于，所述预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个；

在所述获取标准特征值的步骤之前，所述处理器执行所述计算机可读指令时还实现如下步骤：

获取所述标准声音样本；

对每一所述标准声音样本进行声纹识别，得到每一所述标准声音样本的所述预设特征值；

将每一所述标准声音样本的所述预设特征值作为对应的所述标准声音样本的标准特征值。
如权利要求12所述的计算机设备，其特征在于，所述获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值，包括：

基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本；

对所述测试声音样本进行声纹识别，得到所述测试声音样本的所述预设特征值；

将所述测试声音样本的所述预设特征值作为测试特征值。
如权利要求13所述的计算机设备，其特征在于，所述根据所述标准特征值构建第一置信区间，包括：

获取N个所述标准特征值的方差；

根据所述N个标准特征值的方差构建第一置信区间。
如权利要求14所述的计算机设备，其特征在于，在所述若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本的步骤之后，所述处理器执行所述计算机可读指令时还实现如下步骤：

若所述测试特征值与N个所述标准特征值的数据差异性小于预设显著性水平，则将相应的所述酒驾样本保存至数据库中作为新的标准声音样本；

将所述新的标准声音样本并入N个所述标准声音样本中，得到更新后的标准声音样本；

获取更新后的标准声音样本的方差，根据所述更新后的标准声音样本的方差构建第二置信区间。
一个或多个存储有计算机可读指令的计算机非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值；

获取标准特征值，所述标准特征值是对N个预设的标准声音样本进行预设特征值分析后得到的，其中，N为正整数；

根据所述标准特征值构建第一置信区间；

若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本。
如权利要求16所述的计算机非易失性可读存储介质，其特征在于，所述预设特征值为频率微扰值、振幅微扰值和规范化噪声能量值中的至少一个；

在所述获取标准特征值的步骤之前，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

获取所述标准声音样本；

对每一所述标准声音样本进行声纹识别，得到每一所述标准声音样本的所述预设特征值；

将每一所述标准声音样本的所述预设特征值作为对应的所述标准声音样本的标准特征值。
如权利要求17所述的计算机非易失性可读存储介质，其特征在于，所述获取测试声音样本，对所述测试声音样本进行预设特征值分析，得到测试特征值，包括：

基于预设发音音素、预设发声时间或预设环境条件中至少一个条件下获取测试声音样本；

对所述测试声音样本进行声纹识别，得到所述测试声音样本的所述预设特征值；

将所述测试声音样本的所述预设特征值作为测试特征值。
如权利要求18所述的计算机非易失性可读存储介质，其特征在于，所述根据所述标准特征值构建第一置信区间，包括：

获取N个所述标准特征值的方差；

根据所述N个标准特征值的方差构建第一置信区间。
如权利要求19所述的计算机非易失性可读存储介质，其特征在于，在所述若所述测试特征值不属于所述第一置信区间，则判定所述测试声音样本为酒驾样本的步骤之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

若所述测试特征值与N个所述标准特征值的数据差异性小于预设显著性水平，则将相应的所述酒驾样本保存至数据库中作为新的标准声音样本；

将所述新的标准声音样本并入N个所述标准声音样本中，得到更新后的标准声音样本；

获取更新后的标准声音样本的方差，根据所述更新后的标准声音样本的方差构建第二置信区间。