CN103680518A - 基于虚拟仪器技术的语音性别识别方法及系统 - Google Patents
基于虚拟仪器技术的语音性别识别方法及系统 Download PDFInfo
- Publication number
- CN103680518A CN103680518A CN201310716830.XA CN201310716830A CN103680518A CN 103680518 A CN103680518 A CN 103680518A CN 201310716830 A CN201310716830 A CN 201310716830A CN 103680518 A CN103680518 A CN 103680518A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- voice
- sex
- virtual instrument
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种基于虚拟仪器技术的语音性别识别系统及方法,该方法包括如下步骤:通过PC自带声卡对语音信号进行采集,并将采集的语音信号进行模数转换;将模数转换后的语音信号实施录音,并进行存储;分析录制的语音信号的频谱特性,提取出该语音信号的基频参数;将得出的基频参数与性别语音基频特性值比对,得出性别判别结构,本发明通过虚拟仪器技术结合PC计算机的声卡,实现了对人类说话的语音信号进行性别识别的目的。
Description
技术领域
本发明涉及信号采集处理领域,特别是涉及一种基于虚拟仪器技术的语音性别识别方法及系统。
背景技术
计算机自动语音识别就是让计算机能听懂人说话。语音识别的研究历史与计算机的发展历史一样长。计算机的发展已经经历了好几代,今天已经进入到了普通家庭。目前的语音识别系统一般都是通过在智能设备上,通过嵌入式技术、DSP技术、FPGA技术等实现。
但目前大多都采用微处理器架构的系统方法来实现语音识别,但微处理器架构的系统资源毕竟有限,不如PC。在目前越来越多的检测系统中,基于PC的虚拟仪器技术越来越体现其在测控领域里的优势,借助PC强大的资源,通过定制来实现系统功能是未来的趋势,因此,实有必要提出一种技术手段,以实现基于虚拟仪器技术的语音性别识别。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于虚拟仪器技术的语音性别识别方法及系统,通过虚拟仪器技术结合PC计算机的声卡,实现了一种可以对人类说话的语音信号进行性别识别的方法。
为达上述及其它目的,本发明提出一种基于虚拟仪器技术的语音性别识别系统,至少包括:
语音信号采集模块,通过PC自带的声卡对语音信号进行采集,并将采集的语音信号进行模数转换后传送至语音信号存储模块;
语音信号存储模块,将该语音信号采集模块传输的语音信号进行录制并存储;
语音信号处理分析模块,分析录制的语音信号的频谱特性,提取该语音信号的基频参数;
性别特征比对模块,利用性别识别理论,将该语音信号处理分析模块获得的基频参数与性别语音基频特性值进行比对,得出性别判别结果。
进一步地,该语音信号处理分析模块将该语音信号存储模块存储的语音文件还原为波形数据,并提取语音波形数据的有效频段内信号,分析滤波后信号的频谱特性,通过对特性幅频参数排序去最大值得出该语音信号的基频参数。
进一步地,该语音信号存储模块将语音信号存储为.wav文件。
进一步地,若该性别特征比对模块比对出该基频参数大于该性别语音基频特性值,则判定该语音信号来源为女性,若比对出该基频参数小于该性别语音基频特性值,则判定该语音信号来源为男性。
进一步地,该性别特征比对模块将比对结果通过对话框即时显示或通过Excel文件保存。
为达到上述目的,本发明还提供一种基于虚拟仪器技术的语音性别识别方法,包括如下步骤:
步骤一,通过PC自带声卡对语音信号进行采集,并将采集的语音信号进行模数转换;
步骤二,将模数转换后的语音信号实施录音,并进行存储;
步骤三,分析录制的语音信号的频谱特性,提取出该语音信号的基频参数;
步骤四,将得出的基频参数与性别语音基频特性值比对,得出性别判别结构。
进一步地,步骤三还包括如下步骤:
将步骤二存储的语音文件还原为波形数据,并提取语音波形数据的有效频段内信号;
分析滤波后信号的频谱特性;
通过对特性幅频参数排序去最大值得出该语音信号的基频参数。
进一步地,在步骤二中,将该语音信号存储为.wav文件。
进一步地,于步骤四中,若比对出该基频参数大于该性别语音基频特性值,则判定该语音信号来源为女性,若比对出该基频参数小于该性别语音基频特性值,则判定该语音信号来源为男性。
进一步地,在步骤四之后,还包括将比对结果通过对话框即时显示或通过Excel文件保存的步骤。
与现有技术相比,本发明一种基于虚拟仪器技术的语音性别识别系统及方法通过利用PC自带的声卡实现语音信号的采集,并将其信号进行模数转换以“.wav”的形式输出存储,通过分析录制信号的频谱特性,提取特征参数,并利用性别识别理论实现对获得的参数比对性别特性,得出评判结果,实现了对人类说话的语音信号进行性别识别的目的。
附图说明
图1为本发明一种基于虚拟仪器技术的语音性别识别系统的系统架构图;
图2为本发明一种基于虚拟仪器技术的语音性别识别系统之较佳实施例的工作示意图;
图3为本发明较佳实施例中语音信号采集模块的工作框图;
图4为本发明一种基于虚拟仪器技术的语音性别识别方法的步骤流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基于虚拟仪器技术的语音性别识别系统的系统架构图。如图1所示,本发明一种基于虚拟仪器技术的语音性别识别系统,至少包括:语音信号采集模块101、语音信号存储模块102、语音信号处理分析模块103以及性别特征比对模块104。
语音信号采集模块101,通过PC自带的声卡实现语音信号的采集,并将采集的语音信号进行模数转换传送至语音信号存储模块102;语音信号存储模块102将语音信号采集模块101传输的语音信号,实施录音,并以“.wav”的形式输出存储;语音信号处理分析模块103,分析录制的语音信号的频谱特性,提取特征参数,具体地说,语音信号处理分析模块103将语音信号存储模块102存储的语音文件(.wav文件)还原为波形数据,并提取语音波形数据的有效频段内信号,然后分析滤波后信号的频谱特性,通过对特性幅频参数排序去最大值得出信号基频参数;性别特征比对模块104通过性别识别理论对语音信号处理分析模块103得出的语音信号的基频参数比对性别特性,得出性别判别结果。
图2为本发明一种基于虚拟仪器技术的语音性别识别系统之较佳实施例的工作示意图。以下将通过一具体实施例来说明本发明之语音性别识别系统。在本发明较佳实施例中,该语音性别识别系统以LabVIEW软件开发平台为基础设计,由麦克风采集声音信号,通过PC系统的声卡(语音信号采集模块)对麦克风输入信号做调理工作,并送入PC的存储模块(语音信号存储模块102),由PC中LabVIEW开发的数据处理模块分析信号频谱特性(语音信号处理分析模块103,再由特征比对模块按性别识别理论实现输入语音信号的性别判定。
在本发明较佳实施例中,语音信号采集模块,基于LabVIEW的平台,通过Windows内置的声卡对语音信号进行采样。语音信号的采集主要是由配置声音输入(SI Config)VI、启动声音输入(SI Start)VI、读取声音输入(SI Read)VI、停止声音输入(SI Stop)VI以及声音输入清零(SI Clear)VI等程序实现功能(见图3)。先通过SI Config.vi来配置麦克风输入参数,SI Start.vi提示麦克风采集输入数据,如果由数据输入SI Read.vi从麦克风数据缓存中读出数据到语音信号存储模块,采集结束由SI Stop.vi提示麦克风,最后通过SI Clear.vi关闭采集通道,释放采集硬件设备麦克风。
上述语音信号存储模块,是将采集的语音信号转化为有效的文件,并提供该文件的操作与管理功能。在本发明较佳实施例中,为了提高采集效率,先将采集的音频信号保存,待采集任务完成后,再对保存的数据文件分析处理。语音信号的存储主要是通过“Snd write wave file.vi”函数可以将采集的波形数据保存为*.wav文件。
语音信号处理分析模块将保存为*.wav的语音文件提取分析。对于性别的识别主要是通过男、女性声音的基频存在较大差异,本发明也是基于这个理论对语音信号进行频谱分析。首先使用路径设置打开需分析的保存文件,通过“Sndread wave file.vi”函数将*.wav文件还原为波形数据,接着“Butterworth.vi”滤波函数提取语音波形数据的有效频段内信号,之后“Amplitude and PhaseSpectrum.vi”函数分析滤波后信号的频谱特性,最后通过对特性幅频参数排序去最大值得出信号基频参数。
性别特征比对模块将语音信号处理分析模块中得出的基频参数与性别语音基频特性值比对,判断语音信号的来源人的性别。人类声道发声的基音频率普遍在50Hz~500Hz,而根据男女声道结构的不同,男女发生的基音频率以200Hz分界,男性声音低沉,低于200Hz;女性声音高亢,高于200Hz。本模块将分析模块得出的基频参数与200Hz频率比较,大于200Hz频率判定为女性,小于200Hz频率判定为男性。同时性别特征比对模块还将比对结果通过两种途径表现出来:一是使用对话框即时显示判定结果;二是将判定结果通过Excel文件保存下来。
图4为本发明一种基于虚拟仪器技术的语音性别识别方法的步骤流程图。如图4所示,本发明一种基于虚拟仪器技术的语音性别识别方法,包括如下步骤:
步骤401,对语音信号进行采集,并将采集的语音信号进行模数转换,在本发明较佳实施例中,通过PC自带的声卡实现语音信号的采集。
步骤402,将模数转换后的语音信号实施录音,并进行存储。在本发明中,将模数转换后的语音信号以“.wav”的形式输出存储。
步骤403,分析录制的语音信号的频谱特性,提取特征参数。具体地说,首先将存储的语音文件(.wav文件)还原为波形数据,并提取语音波形数据的有效频段内信号,然后分析滤波后信号的频谱特性,最后通过对特性幅频参数排序去最大值得出信号基频参数。
步骤404,通过性别识别理论对步骤403得出的语音信号的基频参数比对性别特性,得出性别判别结果,即将得出的基频参数与性别语音基频特性值比对,判断语音信号的来源人的性别。人类声道发声的基音频率普遍在50Hz~500Hz,而根据男女声道结构的不同,男女发生的基音频率以200Hz分界,男性声音低沉,低于200Hz;女性声音高亢,高于200Hz。将得出的基频参数与200Hz频率比较大于200Hz频率判定为女性,小于200Hz频率判定为男性。
较佳的,在步骤404之后,可将比对结果通过两种途径表现出来:一是使用对话框即时显示判定结果;二是将判定结果通过Excel文件保存下来。
综上所述,本发明一种基于虚拟仪器技术的语音性别识别系统及方法通过利用PC自带的声卡实现语音信号的采集,并将其信号进行模数转换以“.wav”的形式输出存储,通过分析录制信号的频谱特性,提取特征参数,并利用性别识别理论实现对获得的参数比对性别特性,得出评判结果,实现了对人类说话的语音信号进行性别识别的目的,通过本发明可以在基于虚拟仪器的监控系统中加入一种安全管理手段,在一些需要性别区分的场合应用,通过实验测试,本发明的性别判断准确性较高,并且可以通过采用性能更高的语音信号采集设备提高本发明方法的准确性。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (10)
1.一种基于虚拟仪器技术的语音性别识别系统,至少包括:
语音信号采集模块,通过PC自带的声卡对语音信号进行采集,并将采集的语音信号进行模数转换后传送至语音信号存储模块;
语音信号存储模块,将该语音信号采集模块传输的语音信号进行录制并存储;
语音信号处理分析模块,分析录制的语音信号的频谱特性,提取该语音信号的基频参数;
性别特征比对模块,利用性别识别理论,将该语音信号处理分析模块获得的基频参数与性别语音基频特性值进行比对,得出性别判别结果。
2.如权利要求1所述的一种基于虚拟仪器技术的语音性别识别系统,其特征在于:该语音信号处理分析模块将该语音信号存储模块存储的语音文件还原为波形数据,并提取语音波形数据的有效频段内信号,分析滤波后信号的频谱特性,通过对特性幅频参数排序去最大值得出该语音信号的基频参数。
3.如权利要求2所述的一种基于虚拟仪器技术的语音性别识别系统,其特征在于:该语音信号存储模块将语音信号存储为.wav文件。
4.如权利要求3所述的一种基于虚拟仪器技术的语音性别识别系统,其特征在于:若该性别特征比对模块比对出该基频参数大于该性别语音基频特性值,则判定该语音信号来源为女性,若比对出该基频参数小于该性别语音基频特性值,则判定该语音信号来源为男性。
5.如权利要求4所述的一种基于虚拟仪器技术的语音性别识别系统,其特征在于:该性别特征比对模块将比对结果通过对话框即时显示或通过Excel文件保存。
6.一种基于虚拟仪器技术的语音性别识别方法,包括如下步骤:
步骤一,通过PC自带声卡对语音信号进行采集,并将采集的语音信号进行模数转换;
步骤二,将模数转换后的语音信号实施录音,并进行存储;
步骤三,分析录制的语音信号的频谱特性,提取出该语音信号的基频参数;
步骤四,将得出的基频参数与性别语音基频特性值比对,得出性别判别结构。
7.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法,其特征在于,步骤三还包括如下步骤:
将步骤二存储的语音文件还原为波形数据,并提取语音波形数据的有效频段内信号;
分析滤波后信号的频谱特性;
通过对特性幅频参数排序去最大值得出该语音信号的基频参数。
8.如权利要求7所述的一种基于虚拟仪器技术的语音性别识别方法,其特征在于:在步骤二中,将该语音信号存储为.wav文件。
9.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法,其特征在于:于步骤四中,若比对出该基频参数大于该性别语音基频特性值,则判定该语音信号来源为女性,若比对出该基频参数小于该性别语音基频特性值,则判定该语音信号来源为男性。
10.如权利要求6所述的一种基于虚拟仪器技术的语音性别识别方法,其特征在于:在步骤四之后,还包括将比对结果通过对话框即时显示或通过Excel文件保存的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310716830.XA CN103680518A (zh) | 2013-12-20 | 2013-12-20 | 基于虚拟仪器技术的语音性别识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310716830.XA CN103680518A (zh) | 2013-12-20 | 2013-12-20 | 基于虚拟仪器技术的语音性别识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103680518A true CN103680518A (zh) | 2014-03-26 |
Family
ID=50317871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310716830.XA Pending CN103680518A (zh) | 2013-12-20 | 2013-12-20 | 基于虚拟仪器技术的语音性别识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103680518A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683686A (zh) * | 2016-11-18 | 2017-05-17 | 祝洋 | 一种考生性别统计设备及其统计方法 |
WO2017088364A1 (zh) * | 2015-11-26 | 2017-06-01 | 乐视控股(北京)有限公司 | 动态选择语音模型的语音识别方法及装置 |
CN107644632A (zh) * | 2017-08-17 | 2018-01-30 | 北京英夫美迪科技股份有限公司 | 音频缩混及波形生成方法和设备 |
CN108694954A (zh) * | 2018-06-13 | 2018-10-23 | 广州势必可赢网络科技有限公司 | 一种性别年龄识别方法、装置、设备及可读存储介质 |
CN109616099A (zh) * | 2018-12-13 | 2019-04-12 | 南京工程学院 | 一种基于基音频率及平滑处理的男女语音性别识别方法 |
CN113299298A (zh) * | 2021-05-06 | 2021-08-24 | 成都数联云算科技有限公司 | 残差单元及网络及目标识别方法及系统及装置及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5889223A (en) * | 1997-03-24 | 1999-03-30 | Yamaha Corporation | Karaoke apparatus converting gender of singing voice to match octave of song |
CN1283843A (zh) * | 1999-08-10 | 2001-02-14 | 国际商业机器公司 | 会话数据开采 |
CN1342968A (zh) * | 2000-09-13 | 2002-04-03 | 中国科学院自动化研究所 | 用于语音识别的高精度高分辨率基频提取方法 |
CN101178897A (zh) * | 2007-12-05 | 2008-05-14 | 浙江大学 | 利用基频包络剔除情感语音的说话人识别方法 |
CN101415257A (zh) * | 2007-10-16 | 2009-04-22 | 康佳集团股份有限公司 | 一种人机对话聊天方法 |
CN201993743U (zh) * | 2010-12-07 | 2011-09-28 | 高警卫 | 一种语音控制系统 |
CN103167174A (zh) * | 2013-02-25 | 2013-06-19 | 广东欧珀移动通信有限公司 | 一种移动终端问候语的输出方法、装置及移动终端 |
-
2013
- 2013-12-20 CN CN201310716830.XA patent/CN103680518A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5889223A (en) * | 1997-03-24 | 1999-03-30 | Yamaha Corporation | Karaoke apparatus converting gender of singing voice to match octave of song |
CN1283843A (zh) * | 1999-08-10 | 2001-02-14 | 国际商业机器公司 | 会话数据开采 |
CN1342968A (zh) * | 2000-09-13 | 2002-04-03 | 中国科学院自动化研究所 | 用于语音识别的高精度高分辨率基频提取方法 |
CN101415257A (zh) * | 2007-10-16 | 2009-04-22 | 康佳集团股份有限公司 | 一种人机对话聊天方法 |
CN101178897A (zh) * | 2007-12-05 | 2008-05-14 | 浙江大学 | 利用基频包络剔除情感语音的说话人识别方法 |
CN201993743U (zh) * | 2010-12-07 | 2011-09-28 | 高警卫 | 一种语音控制系统 |
CN103167174A (zh) * | 2013-02-25 | 2013-06-19 | 广东欧珀移动通信有限公司 | 一种移动终端问候语的输出方法、装置及移动终端 |
Non-Patent Citations (1)
Title |
---|
赵力: "《语音信号处理》", 31 May 2009 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017088364A1 (zh) * | 2015-11-26 | 2017-06-01 | 乐视控股(北京)有限公司 | 动态选择语音模型的语音识别方法及装置 |
CN106683686A (zh) * | 2016-11-18 | 2017-05-17 | 祝洋 | 一种考生性别统计设备及其统计方法 |
CN107644632A (zh) * | 2017-08-17 | 2018-01-30 | 北京英夫美迪科技股份有限公司 | 音频缩混及波形生成方法和设备 |
CN108694954A (zh) * | 2018-06-13 | 2018-10-23 | 广州势必可赢网络科技有限公司 | 一种性别年龄识别方法、装置、设备及可读存储介质 |
CN109616099A (zh) * | 2018-12-13 | 2019-04-12 | 南京工程学院 | 一种基于基音频率及平滑处理的男女语音性别识别方法 |
CN113299298A (zh) * | 2021-05-06 | 2021-08-24 | 成都数联云算科技有限公司 | 残差单元及网络及目标识别方法及系统及装置及介质 |
CN113299298B (zh) * | 2021-05-06 | 2022-09-13 | 成都数联云算科技有限公司 | 残差单元及网络及目标识别方法及系统及装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103680518A (zh) | 基于虚拟仪器技术的语音性别识别方法及系统 | |
CN103959376B (zh) | 低功率语音检测 | |
CN105989836B (zh) | 一种语音采集方法、装置及终端设备 | |
CN108701469B (zh) | 咳嗽声音识别方法、设备和存储介质 | |
CN107945793A (zh) | 一种语音激活检测方法及装置 | |
Pillos et al. | A Real-Time Environmental Sound Recognition System for the Android OS. | |
CN107274911A (zh) | 一种基于声音特征的相似度分析方法 | |
CN113707173B (zh) | 基于音频切分的语音分离方法、装置、设备及存储介质 | |
CN104332162B (zh) | 一种音频信号车辆识别系统 | |
CN106548786A (zh) | 一种音频数据的检测方法及系统 | |
WO2018095167A1 (zh) | 声纹识别方法和声纹识别系统 | |
CN112820275A (zh) | 一种基于声音信号分析哺乳仔猪异常的自动监测方法 | |
CN104364845B (zh) | 处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统 | |
Patil et al. | Energy Separation-Based Instantaneous Frequency Estimation for Cochlear Cepstral Feature for Replay Spoof Detection. | |
CN102934989A (zh) | 基于神经网络的心音识别装置及方法 | |
CN110689885A (zh) | 机器合成语音识别方法、装置、存储介质及电子设备 | |
CN114255783A (zh) | 声音分类模型的构建方法、声音分类方法和系统 | |
CN113723521A (zh) | 一种电机异响识别方法和识别系统 | |
JP2020510862A (ja) | 周期的表示を用いる音識別 | |
CN106504756B (zh) | 嵌入式语音识别系统及方法 | |
CN112382302A (zh) | 婴儿哭声识别方法及终端设备 | |
CN111370000A (zh) | 声纹识别算法评估方法、系统、移动终端及存储介质 | |
CN106653040A (zh) | 一种人声音频信号采样处理方法 | |
TWI520131B (zh) | Speech Recognition System Based on Joint Time - Frequency Domain and Its Method | |
CN113343887A (zh) | 基于边缘计算与机器学习的多传感器混合故障信号盲分离方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140326 |
|
RJ01 | Rejection of invention patent application after publication |