CN103680518A

CN103680518A - 基于虚拟仪器技术的语音性别识别方法及系统

Info

Publication number: CN103680518A
Application number: CN201310716830.XA
Authority: CN
Inventors: 杨宇
Original assignee: Shanghai Dianji University
Current assignee: Shanghai Dianji University
Priority date: 2013-12-20
Filing date: 2013-12-20
Publication date: 2014-03-26

Abstract

本发明公开了一种基于虚拟仪器技术的语音性别识别系统及方法，该方法包括如下步骤：通过PC自带声卡对语音信号进行采集，并将采集的语音信号进行模数转换；将模数转换后的语音信号实施录音，并进行存储；分析录制的语音信号的频谱特性，提取出该语音信号的基频参数；将得出的基频参数与性别语音基频特性值比对，得出性别判别结构，本发明通过虚拟仪器技术结合PC计算机的声卡，实现了对人类说话的语音信号进行性别识别的目的。

Description

基于虚拟仪器技术的语音性别识别方法及系统

技术领域

本发明涉及信号采集处理领域，特别是涉及一种基于虚拟仪器技术的语音性别识别方法及系统。

背景技术

计算机自动语音识别就是让计算机能听懂人说话。语音识别的研究历史与计算机的发展历史一样长。计算机的发展已经经历了好几代，今天已经进入到了普通家庭。目前的语音识别系统一般都是通过在智能设备上，通过嵌入式技术、DSP技术、FPGA技术等实现。

但目前大多都采用微处理器架构的系统方法来实现语音识别，但微处理器架构的系统资源毕竟有限，不如PC。在目前越来越多的检测系统中，基于PC的虚拟仪器技术越来越体现其在测控领域里的优势，借助PC强大的资源，通过定制来实现系统功能是未来的趋势，因此，实有必要提出一种技术手段，以实现基于虚拟仪器技术的语音性别识别。

发明内容

为克服上述现有技术存在的不足，本发明之目的在于提供一种基于虚拟仪器技术的语音性别识别方法及系统，通过虚拟仪器技术结合PC计算机的声卡，实现了一种可以对人类说话的语音信号进行性别识别的方法。

为达上述及其它目的，本发明提出一种基于虚拟仪器技术的语音性别识别系统，至少包括：

语音信号采集模块，通过PC自带的声卡对语音信号进行采集，并将采集的语音信号进行模数转换后传送至语音信号存储模块；

语音信号存储模块，将该语音信号采集模块传输的语音信号进行录制并存储；

语音信号处理分析模块，分析录制的语音信号的频谱特性，提取该语音信号的基频参数；

性别特征比对模块，利用性别识别理论，将该语音信号处理分析模块获得的基频参数与性别语音基频特性值进行比对，得出性别判别结果。

进一步地，该语音信号处理分析模块将该语音信号存储模块存储的语音文件还原为波形数据，并提取语音波形数据的有效频段内信号，分析滤波后信号的频谱特性，通过对特性幅频参数排序去最大值得出该语音信号的基频参数。

进一步地，该语音信号存储模块将语音信号存储为.wav文件。

进一步地，若该性别特征比对模块比对出该基频参数大于该性别语音基频特性值，则判定该语音信号来源为女性，若比对出该基频参数小于该性别语音基频特性值，则判定该语音信号来源为男性。

进一步地，该性别特征比对模块将比对结果通过对话框即时显示或通过Excel文件保存。

为达到上述目的，本发明还提供一种基于虚拟仪器技术的语音性别识别方法，包括如下步骤：

步骤一，通过PC自带声卡对语音信号进行采集，并将采集的语音信号进行模数转换；

步骤二，将模数转换后的语音信号实施录音，并进行存储；

步骤三，分析录制的语音信号的频谱特性，提取出该语音信号的基频参数；

步骤四，将得出的基频参数与性别语音基频特性值比对，得出性别判别结构。

进一步地，步骤三还包括如下步骤：

将步骤二存储的语音文件还原为波形数据，并提取语音波形数据的有效频段内信号；

分析滤波后信号的频谱特性；

通过对特性幅频参数排序去最大值得出该语音信号的基频参数。

进一步地，在步骤二中，将该语音信号存储为.wav文件。

进一步地，于步骤四中，若比对出该基频参数大于该性别语音基频特性值，则判定该语音信号来源为女性，若比对出该基频参数小于该性别语音基频特性值，则判定该语音信号来源为男性。

进一步地，在步骤四之后，还包括将比对结果通过对话框即时显示或通过Excel文件保存的步骤。

与现有技术相比，本发明一种基于虚拟仪器技术的语音性别识别系统及方法通过利用PC自带的声卡实现语音信号的采集，并将其信号进行模数转换以“.wav”的形式输出存储，通过分析录制信号的频谱特性，提取特征参数，并利用性别识别理论实现对获得的参数比对性别特性，得出评判结果，实现了对人类说话的语音信号进行性别识别的目的。

附图说明

图1为本发明一种基于虚拟仪器技术的语音性别识别系统的系统架构图；

图2为本发明一种基于虚拟仪器技术的语音性别识别系统之较佳实施例的工作示意图；

图3为本发明较佳实施例中语音信号采集模块的工作框图；

图4为本发明一种基于虚拟仪器技术的语音性别识别方法的步骤流程图。

具体实施方式

以下通过特定的具体实例并结合附图说明本发明的实施方式，本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用，本说明书中的各项细节亦可基于不同观点与应用，在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种基于虚拟仪器技术的语音性别识别系统的系统架构图。如图1所示，本发明一种基于虚拟仪器技术的语音性别识别系统，至少包括：语音信号采集模块101、语音信号存储模块102、语音信号处理分析模块103以及性别特征比对模块104。

语音信号采集模块101，通过PC自带的声卡实现语音信号的采集，并将采集的语音信号进行模数转换传送至语音信号存储模块102；语音信号存储模块102将语音信号采集模块101传输的语音信号，实施录音，并以“.wav”的形式输出存储；语音信号处理分析模块103，分析录制的语音信号的频谱特性，提取特征参数，具体地说，语音信号处理分析模块103将语音信号存储模块102存储的语音文件（.wav文件）还原为波形数据，并提取语音波形数据的有效频段内信号，然后分析滤波后信号的频谱特性，通过对特性幅频参数排序去最大值得出信号基频参数；性别特征比对模块104通过性别识别理论对语音信号处理分析模块103得出的语音信号的基频参数比对性别特性，得出性别判别结果。

图2为本发明一种基于虚拟仪器技术的语音性别识别系统之较佳实施例的工作示意图。以下将通过一具体实施例来说明本发明之语音性别识别系统。在本发明较佳实施例中，该语音性别识别系统以LabVIEW软件开发平台为基础设计，由麦克风采集声音信号，通过PC系统的声卡（语音信号采集模块）对麦克风输入信号做调理工作，并送入PC的存储模块（语音信号存储模块102），由PC中LabVIEW开发的数据处理模块分析信号频谱特性（语音信号处理分析模块103，再由特征比对模块按性别识别理论实现输入语音信号的性别判定。

在本发明较佳实施例中，语音信号采集模块，基于LabVIEW的平台，通过Windows内置的声卡对语音信号进行采样。语音信号的采集主要是由配置声音输入（SI Config）VI、启动声音输入（SI Start）VI、读取声音输入（SI Read）VI、停止声音输入（SI Stop）VI以及声音输入清零（SI Clear）VI等程序实现功能（见图3）。先通过SI Config.vi来配置麦克风输入参数，SI Start.vi提示麦克风采集输入数据，如果由数据输入SI Read.vi从麦克风数据缓存中读出数据到语音信号存储模块，采集结束由SI Stop.vi提示麦克风，最后通过SI Clear.vi关闭采集通道，释放采集硬件设备麦克风。

上述语音信号存储模块，是将采集的语音信号转化为有效的文件，并提供该文件的操作与管理功能。在本发明较佳实施例中，为了提高采集效率，先将采集的音频信号保存，待采集任务完成后，再对保存的数据文件分析处理。语音信号的存储主要是通过“Snd write wave file.vi”函数可以将采集的波形数据保存为*.wav文件。

语音信号处理分析模块将保存为*.wav的语音文件提取分析。对于性别的识别主要是通过男、女性声音的基频存在较大差异，本发明也是基于这个理论对语音信号进行频谱分析。首先使用路径设置打开需分析的保存文件，通过“Sndread wave file.vi”函数将*.wav文件还原为波形数据，接着“Butterworth.vi”滤波函数提取语音波形数据的有效频段内信号，之后“Amplitude and PhaseSpectrum.vi”函数分析滤波后信号的频谱特性，最后通过对特性幅频参数排序去最大值得出信号基频参数。

性别特征比对模块将语音信号处理分析模块中得出的基频参数与性别语音基频特性值比对，判断语音信号的来源人的性别。人类声道发声的基音频率普遍在50Hz～500Hz，而根据男女声道结构的不同，男女发生的基音频率以200Hz分界，男性声音低沉，低于200Hz；女性声音高亢，高于200Hz。本模块将分析模块得出的基频参数与200Hz频率比较，大于200Hz频率判定为女性，小于200Hz频率判定为男性。同时性别特征比对模块还将比对结果通过两种途径表现出来：一是使用对话框即时显示判定结果；二是将判定结果通过Excel文件保存下来。

图4为本发明一种基于虚拟仪器技术的语音性别识别方法的步骤流程图。如图4所示，本发明一种基于虚拟仪器技术的语音性别识别方法，包括如下步骤：

步骤401，对语音信号进行采集，并将采集的语音信号进行模数转换，在本发明较佳实施例中，通过PC自带的声卡实现语音信号的采集。

步骤402，将模数转换后的语音信号实施录音，并进行存储。在本发明中，将模数转换后的语音信号以“.wav”的形式输出存储。

步骤403，分析录制的语音信号的频谱特性，提取特征参数。具体地说，首先将存储的语音文件（.wav文件）还原为波形数据，并提取语音波形数据的有效频段内信号，然后分析滤波后信号的频谱特性，最后通过对特性幅频参数排序去最大值得出信号基频参数。

步骤404，通过性别识别理论对步骤403得出的语音信号的基频参数比对性别特性，得出性别判别结果，即将得出的基频参数与性别语音基频特性值比对，判断语音信号的来源人的性别。人类声道发声的基音频率普遍在50Hz～500Hz，而根据男女声道结构的不同，男女发生的基音频率以200Hz分界，男性声音低沉，低于200Hz；女性声音高亢，高于200Hz。将得出的基频参数与200Hz频率比较大于200Hz频率判定为女性，小于200Hz频率判定为男性。

较佳的，在步骤404之后，可将比对结果通过两种途径表现出来：一是使用对话框即时显示判定结果；二是将判定结果通过Excel文件保存下来。

综上所述，本发明一种基于虚拟仪器技术的语音性别识别系统及方法通过利用PC自带的声卡实现语音信号的采集，并将其信号进行模数转换以“.wav”的形式输出存储，通过分析录制信号的频谱特性，提取特征参数，并利用性别识别理论实现对获得的参数比对性别特性，得出评判结果，实现了对人类说话的语音信号进行性别识别的目的，通过本发明可以在基于虚拟仪器的监控系统中加入一种安全管理手段，在一些需要性别区分的场合应用，通过实验测试，本发明的性别判断准确性较高，并且可以通过采用性能更高的语音信号采集设备提高本发明方法的准确性。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下，对上述实施例进行修饰与改变。因此，本发明的权利保护范围，应如权利要求书所列。

Claims

1.一种基于虚拟仪器技术的语音性别识别系统，至少包括：

2.如权利要求1所述的一种基于虚拟仪器技术的语音性别识别系统，其特征在于：该语音信号处理分析模块将该语音信号存储模块存储的语音文件还原为波形数据，并提取语音波形数据的有效频段内信号，分析滤波后信号的频谱特性，通过对特性幅频参数排序去最大值得出该语音信号的基频参数。

3.如权利要求2所述的一种基于虚拟仪器技术的语音性别识别系统，其特征在于：该语音信号存储模块将语音信号存储为.wav文件。

4.如权利要求3所述的一种基于虚拟仪器技术的语音性别识别系统，其特征在于：若该性别特征比对模块比对出该基频参数大于该性别语音基频特性值，则判定该语音信号来源为女性，若比对出该基频参数小于该性别语音基频特性值，则判定该语音信号来源为男性。

5.如权利要求4所述的一种基于虚拟仪器技术的语音性别识别系统，其特征在于：该性别特征比对模块将比对结果通过对话框即时显示或通过Excel文件保存。

6.一种基于虚拟仪器技术的语音性别识别方法，包括如下步骤：

步骤二，将模数转换后的语音信号实施录音，并进行存储；

7.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法，其特征在于，步骤三还包括如下步骤：

分析滤波后信号的频谱特性；

8.如权利要求7所述的一种基于虚拟仪器技术的语音性别识别方法，其特征在于：在步骤二中，将该语音信号存储为.wav文件。

9.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法，其特征在于：于步骤四中，若比对出该基频参数大于该性别语音基频特性值，则判定该语音信号来源为女性，若比对出该基频参数小于该性别语音基频特性值，则判定该语音信号来源为男性。

10.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法，其特征在于：在步骤四之后，还包括将比对结果通过对话框即时显示或通过Excel文件保存的步骤。