CN202650529U

CN202650529U - 简易语音性别检测装置

Info

Publication number: CN202650529U
Application number: CN 201220299814
Authority: CN
Inventors: 潘欣裕; 诸立骏
Original assignee: Suzhou University of Science and Technology
Current assignee: Suzhou University of Science and Technology
Priority date: 2012-06-26
Filing date: 2012-06-26
Publication date: 2013-01-02
Anticipated expiration: 2022-06-26

Abstract

本实用新型公开了一种简易语音性别检测装置，它包括将声音信号转变成电波形的语音采集模块、输入端与所述语音采集模块相连接并用于滤除所述电波形中的高次谐波的低通滤波模块、输入端与所述低通滤波模块的输出端相连接并用于将频率信号转换成电压信号的频率电压转换模块、输入端与所述频率电压转换模块的输出端相连接并用于将模拟信号转换为数字信号的模数转换模块、输入端与所述数模转换模块的输出端相连接并用于判断所述数字信号大小的控制器模块、输入端与所述控制器模块的输出端相连接的显示模块。本实用新型使得基于人语音的性别区分变得简单而快捷，避免了大数据量的训练，且不需要计算机装置。本装置既可以作为复杂身份验证装置的补充，也可以制成一个简易的手持设备，使用方便，具有一定的市场前景。

Description

简易语音性别检测装置

技术领域

本实用新型涉及一种简易语音性别检测装置。

背景技术

语音信号是人们日常生活中最为普通和常用的通讯方式，现代信号处理技术的发展使得语音智能识别技术越发成熟。自从IBM公司推出商业语音识别软件Via Voice后，语音的计算机识别逐步进入人们的日常生活，车站的语音购票，手机的自动语音拨号等应用已被大家所熟悉。同时利用语音进行身份验证的技术也逐步受到关注，但是正确率不高，在一些重要场合的应用仍有很多限制。识别说话人的性别是身份验证中较为基本的一项任务，传统方法需要采集大量的男女声数据作为样本库，并建立复杂的HMM识别模型，用样本库进行训练，从而建立起男女声的识别模板。这样做使得数据量较大，而且也不一定能满足语音的普遍性，识别性能与样本库相关度较大；识别的正确率与训练语音的说话内容有较大的联系，基于特定文本的识别效果比非特定文本的识别效果好很多；同时语音信号将随着录音设备的不同而产生差异，即使是同一个人在一台设备上录制一段语音，同样的话语在另一台设备上的录制数据也会存在不同，若录音话筒材质不同影响则更大。基于模型分类的语音性别区分设备都存在此类问题。

发明内容

为了解决上述问题，本实用新型的目的在于提供一种简易语音性别检测装置，通过语音信号整形后的频率，主要依托男女基音频率的不同，来判断说话人的性别。

为了达到以上目的，本实用新型采用的技术方案是：简易语音性别检测装置，它包括将声音信号转变成电波形的语音采集模块、输入端与语音采集模块相连接并用于滤除电波形中的高次谐波的低通滤波模块、输入端与低通滤波模块的输出端相连接并用于将频率信号转换成电压信号的频率电压转换模块、输入端与频率电压转换模块的输出端相连接并用于将模拟信号转换为数字信号的模数转换模块、输入端与数模转换模块的输出端相连接并用于判断数字信号大小的控制器模块、输入端与控制器模块的输出端相连接的显示模块。

进一步地，低通滤波模块为二阶滤波电路，它包括放大器、电阻和电容。

更进一步地，低通滤波模块的通带为10～500Hz，阻带下限为600Hz，过渡带衰减在20dB以上，带内波动在3dB以内。

依照不同的分类规则汉语可以有几种发音方式，其中以声带的振动与否将语音分为清音和浊音，发浊音时人的声带将产生振动，声波呈现准周期的特性，发清音时声带基本不振动，声波呈现类似白噪声的特性，规律不明显。声带振动的频率称为基音频率，而人的基音频率一般处在50～400Hz之间。通过大量的先验认识可知，一般成年男性的基音频率在50～200Hz，成年女性的基频分布于200～400Hz，儿童的基频与女性基频相似。一般而言，语音信号经过低通整形以后，语音基频段的能量会较好的保存下来。利用上述的简易语音性别检测装置的检测方法，它包括以下步骤：（1）根据环境噪声，设定浊音的门限能量；设定男女声的分界频率；（2）采集声音信号，判断该声音信号的能量值是否大于门限能量，若大于门限能量，则进入下一步，如小于等于门限能量，则重新采集声音信号并判断；（3）若声音信号的能量值大于门限能量，则打开频率电压转换模块的信号通道，控制器模块记录一组模数转换的电压值，并求取平均值；（4）检测该平均值是否大于分界频率，是则为女声，否则为男声，并控制LCD做出结果显示；随后返回初始状态，进行下一组数据的采集处理。

本实用新型使得基于人语音的性别区分变得简单而快捷，避免了大数据量的训练，且不需要计算机装置。本装置既可以作为复杂身份验证装置的补充，也可以制成一个简易的手持设备，使用方便，具有一定的市场前景。

附图说明

图1为本实用新型装置电路结构示意图。

图2为本实用新型装置的检测方法流程图。

具体实施方式

下面结合附图对本实用新型的较佳实施例进行详细阐述，以使本实用新型的优点和特征能更易于被本领域技术人员理解，从而对本实用新型的保护范围做出更为清楚明确的界定。

从附图1的结构示意图可以看出，本实用新型提供了简易语音性别检测装置，它包括将声音信号转变成电波形的语音采集模块、输入端与语音采集模块相连接并用于滤除电波形中的高次谐波的低通滤波模块、输入端与低通滤波模块的输出端相连接并用于将频率信号转换成电压信号的频率电压转换模块、输入端与频率电压转换模块的输出端相连接并用于将模拟信号转换为数字信号的模数转换模块、输入端与数模转换模块的输出端相连接并用于判断数字信号大小的控制器模块、输入端与控制器模块的输出端相连接的显示模块。

在本实施例中，本装置由麦克风语音采集电路、500Hz低通滤波电路、基于LM331的F/V转换电路、A/D转换电路、MCU核心处理器和LCD显示器组成。本装置可以在室内外任何非强噪声环境下使用。麦克风语音采集电路由柱体话筒配合相应的电阻和电容构成，可以将声音信号转变成电波形；500Hz低通滤波器，由常用放大器OP07和电阻、电容构成二阶滤波电路，过渡带小于100Hz，衰减20dB以上，主要将语音中的高次谐波滤除，也可以起到一定的整形作用；F/V转换电路主要由LM331芯片构成，可以实现频率和电压的转化；AD转换可以采用MCU自带的AD转换器，也可采用外置的高速AD芯片，转换时间小于2us，10bit量化位数，完全满足装置要求；MCU采用PIC16F877单片机，该装置编程方便，具有30余个通用IO，足够装置的输入输出分配，操控LCD，按键输入，AD输入都很方便，同时片上集成UART总线，方便与计算机通信，便于扩展；采用常规的1602LCD显示器作为装置的输出，显示结果。

说话人的语音信号通过采集电路由声压变成电压信号，再通过低通滤波电路，将高次谐波滤除，滤波器的精度要求不是特别高，通带10～500Hz，阻带下限600Hz，过渡带衰减20dB以上，带内波动3dB以内。滤波后的信号相当于完成了一部分的整形工作，便于后续的F/V转换。要了解信号中的频率成分可以采用数字采样和频谱分析的方式，但是成本较高，数据处理复杂。而通过F/V转化，原本的频率信号变成了电压信号，只需要一般的AD转化就能够通过电压变化而直接获得原信号中的频率成分，更方便快捷。通过电压值的大小判定语音信号的基频，与预先设定的分界频率比较，大于分界频率的声音判定为女声，否则为男声。最后通过LCD显示结果。

图2为本实用新型装置的检测方法流程图。由于人发音的停顿，语音信号会有空隙；而且基音频率仅包含在浊音中，清音中没有。所以在对语音信号进行分析时必须对无声信号、清音信号及浊音信号有明确的区分。一般而言，无声或是清音信号的能量比较小，而浊音的能量远大于此二者，故利用语音的能量大小可以很容易的定位到浊语音。另外由于语音信号具有非平稳非线性的特征，所以必须通过短时分析的方法才能获得较好的结果。常规的语音分析装置将语音分成20～40ms一组进行处理（PIC16F877的片上AD采集速度远大于语音分帧时长，完全满足要求）。一般的浊音都能维持200ms以上，故为了避免数据处理和判断的误差，本装置将对200ms内取得的语音基频做平均处理后再进行性别判断，以抵制各类因素所造成的错误。

一种利用上述的简易语音性别检测装置的检测方法，它包括以下步骤：

（1）根据环境噪声，设定浊语音的门限能量E，即大于此门限的信号为浊音；根据先验信息，设定男女声的分界频率F，大于此频率的为女声，否则为男声。

（2）装置运行后，采集声音信号，首先检测语音短时能量，判断该声音信号的能量值是否大于门限能量，若大于门限能量E，则进入下一步，如小于等于门限能量，则重新采集声音信号并判断，知道检测到浊音信号；

（3）若声音信号的能量值大于门限能量E，则打开F/V信号通道，MCU记录一组AD转换的电压值，滤除突变信号，取电压平均值，并通过换算得到对应语音的基频。

（4）检测该平均值是否大于所述的分界频率F，是则为女声，否则为男声，并控制LCD做出结果显示；随后返回初始状态，进行下一组数据的采集处理。

上述实施例只为说明本实用新型的技术构思及特点，其目的在于让熟悉此项技术的人士能够了解本实用新型的内容并据以实施，并不能以此限制本实用新型的保护范围。凡根据本实用新型精神实质所作的等效变化或修饰，都应涵盖在本实用新型的保护范围之内。

Claims

1. 一种简易语音性别检测装置，其特征在于：它包括将声音信号转变成电波形的语音采集模块、输入端与所述语音采集模块相连接并用于滤除所述电波形中的高次谐波的低通滤波模块、输入端与所述低通滤波模块的输出端相连接并用于将频率信号转换成电压信号的频率电压转换模块、输入端与所述频率电压转换模块的输出端相连接并用于将模拟信号转换为数字信号的模数转换模块、输入端与所述数模转换模块的输出端相连接并用于判断所述数字信号大小的控制器模块、输入端与所述控制器模块的输出端相连接的显示模块。

2. 根据权利要求1所述的简易语音性别检测装置，其特征在于：所述的低通滤波模块为二阶滤波电路，它包括放大器、电阻和电容。

3. 根据权利要求1或2所述的简易语音性别检测装置，其特征在于：所述的低通滤波模块的通带为10～500Hz，阻带下限为600Hz，过渡带衰减在20dB以上，带内波动在3dB以内。