CN111292748B

CN111292748B - 一种可适应多种频率的语音录入系统

Info

Publication number: CN111292748B
Application number: CN202010082691.XA
Authority: CN
Inventors: 蒲瑶; 沈彬彬; 赵茂祥
Original assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Current assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date: 2020-02-07
Filing date: 2020-02-07
Publication date: 2023-07-28
Anticipated expiration: 2040-02-07
Also published as: CN111292748A

Abstract

本发明涉及语音录入系统领域，且公开了一种可适应多种频率的语音录入系统，包括语音采集单元、语音预处理单元、单片机以及存储单元，所述语音采集单元与语音处理单元串口连接，所述语音预处理单元与单片机串口连接，所单片机还与存储单元串口连接。该可适应多种频率的语音录入系统，通过FIR数字滤波器的使用以及设计步骤，在处理多频率语音信号时，滤除了高频噪声和多频杂音，达到了抗混叠的目的，保障后期语音识别的高准确性，并且经过滤波后的信号基本上保持原样，并在滤波后的信号出现了时延，基本将原输入的有用连续信号恢复，使得后信号的延时得到有效的降低，提高了语音录入的效率。

Description

一种可适应多种频率的语音录入系统

技术领域

本发明涉及语音录入系统领域，具体为一种可适应多种频率的语音录入系统。

背景技术

语音识别技术，也称为自动语音识别(Automatic Speech Recognition)，其目的是将人类的语音中的词汇内容转换为计算机可读的输入，语音识别技术涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等领域，作为人机交互的关键技术，语音识别技术在呼叫中心、电信增值、企业信息化系统、智能机器人、智能外呼、智能车载等应用系统中有了广泛的应用。

其中语音录入系统试整个语音识别技术中最为重要的一环，它是语音识别技术的主要依据支撑，然而，现有的语音录入系统在录入多频率语音时，常规滤波器很难精确的滤除了多频杂音和高频噪声，导致录音混叠，影响后期识别的准确率，且由于多频语音的情况，在语音识别单元中提取的语音信号参数准确率不高，同样影响后期语音识别的准确性。

发明内容

针对上述背景技术的不足，本发明提供了一种可适应多种频率的语音录入系统，具备保障后期语音识别的准确性高的优点，解决了背景技术提出的问题。

本发明提供如下技术方案：一种可适应多种频率的语音录入系统，包括语音采集单元、语音预处理单元、单片机以及存储单元，所述语音采集单元与语音处理单元串口连接，所述语音预处理单元与单片机串口连接，所单片机还与存储单元串口连接；

其中，所述语音采集单元中设置语音采集模块，语音采集模块外连接语音输入终端，包括麦克风；

所述语音预处理单元包括音频输入模块、语音放大模块、抗混叠滤波模块、语音识别模块、特征提取模块；。

优选的，所述特征提取模块基于matlab程序来提取基音频率的语音信号，语音特征提取的步骤如下：

a、输入序列，求语音信号的相关序列，并在求取过程中限定最大值的范围，同时添加一个极小数，防止被零整除；

b、求第一周期的极大值点；

c、根据存储单元中的模板库信息，对比语音特点，筛选出最大值点；

d、根据该最大值点的位置得到语音频率。

优选的，所述抗混叠滤波器为FIR数字滤波器，其设计步骤如下：

S1、建立一个目标信号，并储存到存储单元中，在设计一个滤波器之前，先根据工程实际的需要确定滤波器的技术指标，即指标的形式一般在频域中给出幅度和相位响应；

S2、在确定了技术指标后，建立一个目标的数字滤波器模型之后，利用数字滤波器的设计方法，设计出一个实际滤波器模型来逼近给定的目标信号；

S3、得到以差分或系统函数或冲激响应滤波器，从而分析其频率特性和相位特性，以验证设计结果是否满足指标要求，或者利用单片机仿真实现设计的滤波器，再分析滤波结果来判断；

S4、用窗函数设计法，根据过渡带带宽及阻带最小衰减，选择窗型，并估计窗口长度N，理想抗混叠滤波器的幅度谱值通带内为1，阻带内为0，缺少过渡带带宽及阻带最小衰减限制。

优选的，所述语音识别采用HMM模型，语音预处理单元还设有人工神经元网络模块。

本发明具备以下有益效果：

该可适应多种频率的语音录入系统，通过FIR数字滤波器的使用以及设计步骤，在处理多频率语音信号时，滤除了高频噪声和多频杂音，达到了抗混叠的目的，保障后期语音识别的高准确性，并且经过滤波后的信号基本上保持原样，并在滤波后的信号出现了时延，基本将原输入的有用连续信号恢复，使得后信号的延时得到有效的降低，提高了语音录入的效率；通过语音预处理单元的预处理，利用特征提取模块基于matlab程序来提取基音频率的语音信号，从而获取准确的参数，以便后续利用该参数进行高效的处理，同时通过基音周期的提取方法，准确可靠的估计并提取语音信号，使得语音信号的识别准确率和效率更高。

附图说明

图1为本发明语音录入系统框图示意图；

图2为本发明语音预处理单元系统图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，一种可适应多种频率的语音录入系统，包括语音采集单元、语音预处理单元、单片机以及存储单元，语音采集单元与语音处理单元串口连接，语音预处理单元与单片机串口连接，所单片机还与存储单元串口连接；

语音采集单元中设置语音采集模块，语音采集模块用于多频率语音的采集，语音采集模块外连接语音输入终端，包括麦克风，通过麦克风进行初步录音，将语音转换成电信号，再由语音采集模块采集录入的语音信号；

语音预处理单元包括音频输入模块、语音放大模块、抗混叠滤波模块、语音识别模块、特征提取模块；

语音采集模块采集的语音数据传输到音频输入模块，由语音输入模块传输到语音预处理单元进行预处理，通过语音放大模块对语音电信号进行放大处理，由语音放大模块放大语音电信号，确保后面语音处理的精确性，然后通过A/D转换模块将语音电信号转换为语音数字信号，语音数字信号通过抗混叠滤波模块，由抗混叠滤波模块除去语音数字信号中，个体发音差异、录音设备和环境引起的噪音，从而消除语音数字信号出现叠音的现象，处理后的语音数字信号传输至语音识别模块和特征提取模块进一步处理，由语音识别模块进行识别处理，再由特征提取模块提取需要的语音信号，并将处理后的语音信号通过存储单元中的进行存储，其处理均由单片机进行控制，其中，存储单元设有内存和flash闪存芯片，以便于存储选择。

特征提取模块提取的语音信号特征参数能有效的代替语音特征，具有良好的区分性，且各阶参数均具有良好的特征性，使得特征参数计算方便高效，即在语音信号处理阶段，使得每个词条都能得到一个模型，并保存为模板库，存储到存储单元，在识别提取阶段，语音信号喜欢经过相同的通道得到语音信号参数，通过与参数模板进行匹配，并将匹配分数最高的模板作为匹配结果，以提高准确率。

其中，特征提取模块基于matlab程序来提取基音频率的语音信号，语音特征提取的步骤如下：

b、求第一周期的极大值点；

d、根据该最大值点的位置得到语音频率，从而获取准确的参数，以便后续利用该参数进行高效的处理，同时通过基音周期的提取方法，准确可靠的估计并提取语音信号，使得语音信号的识别准确率和效率更高。

其中，抗混叠滤波器为FIR数字滤波器，其设计步骤如下：

通过FIR数字滤波器的使用，混有高频噪声信号在通过该系统后，滤除了高频噪声和多频杂音，达到了抗混叠的目的，并且保障了经过滤波后的信号基本上保持原样，并在滤波后的信号出现了时延，但是由于FIR数字滤波器设计使用基本将原输入的有用连续信号恢复。

其中，语音识别采用HMM模型，语音预处理单元还设有人工神经元网络模块，由工神经元网络模块模仿人类神经元活动原理，具有自学、联想、对比、推力和概况的功能，配合HMM模型，已补充HMM模型语音识别时所不具备的能力，从而进一步提高了语音识别的准确率，保障了语音录入系统录入语音的准确率。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种可适应多种频率的语音录入系统，其特征在于：包括语音采集单元、语音预处理单元、单片机以及存储单元，所述语音采集单元与语音处理单元串口连接，所述语音预处理单元与单片机串口连接，所述单片机还与存储单元串口连接；

其中，所述语音采集单元中设置语音采集模块，语音采集模块外连接语音输入终端，语音输入终端包括麦克风；

所述语音预处理单元包括音频输入模块、语音放大模块、抗混叠滤波模块、语音识别模块、特征提取模块；

所述特征提取模块基于matlab程序来提取基音频率的语音信号，语音特征提取的步骤如下：

b、求第一周期的极大值点；

d、根据该最大值点的位置得到语音频率；

所述抗混叠滤波模块为FIR数字滤波器，其设计步骤如下：

S1、建立一个目标信号，并储存到存储单元中，在设计一个滤波器之前，先根据工程实际的需要确定滤波器的技术指标，即指标的形式在频域中给出幅度和相位响应；

S3、得到以差分或系统函数或冲激响应描述的滤波器，从而分析其频率特性和相位特性，以验证设计结果是否满足指标要求，或者利用单片机仿真实现设计的滤波器，再分析滤波结果来判断；

S4、用窗函数设计法，根据过渡带带宽及阻带最小衰减，选择窗型，并估计窗口长度N，理想抗混叠滤波器的幅度谱值通带内为1，阻带内为0，缺少过渡带带宽及阻带最小衰减限制；

所述语音识别模块采用HMM模型，语音预处理单元还设有人工神经元网络模块。