CN106782568A

CN106782568A - 一种频率极值和均值结合的声纹过滤方法

Info

Publication number: CN106782568A
Application number: CN201611029653.8A
Authority: CN
Inventors: 胡平
Original assignee: HEFEI XINGFU INFORMATION TECHNOLOGY Co Ltd
Current assignee: HEFEI XINGFU INFORMATION TECHNOLOGY Co Ltd
Priority date: 2016-11-22
Filing date: 2016-11-22
Publication date: 2017-05-31

Abstract

本发明的目的是提供一种通过提取目标用户声谱图中非空的最高频率、最低频率和均值，来进行声纹识别前的初步筛选，降低声纹模型的计算量，提高声纹识别效率。

Description

一种频率极值和均值结合的声纹过滤方法

技术领域

本发明属于声波通讯领域，是一种通过采集声谱图的频率极值和均值结合对声纹数据进行初步过滤的方法。

背景技术

声纹的识别作为一项可靠的技术在人们日常生活中发挥越来越重要的作用。例如可以通过声纹识别犯罪分子，声纹也可以用来考勤，门禁出入管理等。

但是都有一个共同的问题，声纹数据采集量大，比对模型运算量大，反应速度慢，影响实际使用中用户体验。特别是应用于广大民用设备上的时候，方便快捷是使用过程中必须要考虑的问题。

目前解决的主要技术包括：

1、利用一个人鼻音、带深呼吸音、沙哑音、笑声等辅助判断；

2、利用受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等辅助判断；

3、利用个人特点如韵律、节奏、速度、语调、音量等特征。

发明内容

本发明的目的是提供一种通过声谱图的最高频率、最低频率以及频率均值对声纹数据进行初步过滤的方法。简单易用，初步过滤快速。所述方法包括：

1、首先将目标样本（说话人）的语音生成一个声谱图，记录说话人声音；

2、将这段语音按照一定时间段（如0.1秒）进行分割，分为很多帧；

2、分析每一帧声谱图中最高频率E1和最低频率E2和平均频率E3，并记录保存；

4、对测试样本中的所有语音进行步骤1-3的操作，得到每一帧的最高频率E1`和最低频率E2`和平均频率E3`：

5、计算测试样本和目标样本E1、E2、E3之间的偏差，小于设定的阈值为合格样本，不合格的样本将直接剔除。这样减少声纹比对模型的运算量，提高识别效率。

本发明提供了一种声纹识别的过滤方法，其创新点包括：

1、提取目标样本声谱图的极值和均值数据进行初步过滤；

2、分析每一帧声谱图中非空最高频率、最低频率和频率均值作为对比数据。

附图说明

图1 是本发明目标用户数据提取示意图；

图2 是本发明声谱图比对流程示意图；

图3 是本发明目标用户数据提取流程图。

具体实施方式

结合附图给出本发明的一个具体实施例。

首先，我们警察通过声纹识别的场景。

罪犯张三（目标用户）说了一段话，我们通过录音设备记录下来，首先形成频谱图，然后按照一定时间段（如0.1秒）进行分割，分为很多帧。通过FFT变换形成声谱图。

我们对每一帧的非空频率（即这个频率段有声强数据），提取其最大频率、最小频率，并对所有非空频率进行平均得到频率均值。假设得到的数据为：

0-0.1秒这一帧 {最高频率，最低频率，均值}为{3500，1200 ，3000}

0.1-0.2秒这一帧 {最高频率，最低频率，均值}为{1500，200 ，1000}

…

2.9-3.0秒这一帧 {最高频率，最低频率，均值}为{4500，2200 ，3000}

将这些数据记录下来，以备后面的对比运算。

现在有一批犯罪嫌疑人（测试用户）的声音数据，我们对其进行FFT变换分别提取每一个人的最高频率，最低频率，均值。

假设李四的数据为：

0-0.1秒这一帧 {最高频率，最低频率，均值}为{9500，3200 ，6000}

0.1-0.2秒这一帧 {最高频率，最低频率，均值}为{7500，1200 ，3000}

…

2.9-3.0秒这一帧 {最高频率，最低频率，均值}为{14500，2200 ，9000}

王五的数据为：

0-0.1秒这一帧 {最高频率，最低频率，均值}为{3700，1100 ，2800}

0.1-0.2秒这一帧 {最高频率，最低频率，均值}为{1600，300 ，1000}

…

2.9-3.0秒这一帧 {最高频率，最低频率，均值}为{4800，2000 ，4000}

计算犯罪嫌疑人的数据和罪犯数据的方差，(E1`-E1)²⁺(E2`-E2)²⁺(E3`-E3)²。当其值小于设定值（如10000）为合格数据，可以通过初步筛选。反之，直接排除，不参加后面的声纹模型识别。

Claims

1.本发明的目的是提供一种提高声纹识别效率的方法，其特征在于：通过提取目标用户声谱图中极值和均值，来进行声纹识别前的初步筛选，降低声纹模型的计算量，提高声纹识别效率。

2.根据权利要求1所述的一种提高声纹识别效率的方法，其特征在于：分析每一帧声谱图中非空最高频率、最低频率和频率均值作为对比数据。