发明内容
本发明的主要目的在于提出一种语音识别系统,旨在降低成本,提高语音识别准确率。
为实现上述目的,本发明提出一种语音识别系统,该系统包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;
所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本发明的进一步的技术方案是,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;
所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
本发明的进一步的技术方案是,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
本发明的进一步的技术方案是,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
本发明的进一步的技术方案是,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
本发明的进一步的技术方案是,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
本发明的进一步的技术方案是,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
本发明的进一步的技术方案是,所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
本发明的进一步的技术方案是,所述模数转换器采用IC85L40转换器。
本发明的有益效果是:本发明语音识别系统通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
具体实施方式
应当理解,此处所描述的具体实施例仅仅是本发明一部分实施例,并不用于限定本发明。基于本发明中的实施例,未经创造性设计而所衍生的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1是本发明语音识别系统较佳实施例的结构示意图。
如图1所示,本实施例提出的语音识别系统包括服务云端、主控制器、模数转换器ADC、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。
本实施例中,所述模数转换器可以采用IC85L40转换器。
可以理解的是,本实施例中,所述声音定位模块利用三个麦克风同时拾音,利用声达时间差(TDOA)的定位技术,先行进行声达时间差估计,并从中最先拾到声音信号的麦克风到最后获取麦克风阵列中阵之间的声延迟(TDOA);再利用获取的声达时间差,确定声音来源的方向。
所述声源增强模块采用三个呈等边形布置的麦克风形成三个拾音波束,各自对应120°范围。当通过唤醒确定声源角度(算法内部自动确定声源方向的一个拾音波束进行拾音)或指定一个拾音波束进行拾音时,阵列算法会增强波束范围内的声音,削弱波束外的声音,以增强录音信噪比。如指定波束1进行拾音,由于每个波束的范围为120°,所以60°~180°范围内录音得到增强,波束1范围外的声音会被减弱。
所述回声消除模块,回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω进行参数辨识,根据扬声器PA信号与产生的多路回声的相关性为基础,建立远端信号模型,模拟回声路径,通过自适应算法调整,使其冲击响应和真实回声路径相逼近。然后将麦克风接收到的信号减去估计值,即可实现回声消除功能。
所述噪音抑制模块的核心是语音增强,语音增强的主要目标是从受噪声干扰的语音信号中提取尽可能纯净的原始语音,通过带噪语音进行处理,消除背景噪声改善语音质量,提高语音清晰度和可懂度,从而提高语音处理系统性能。噪音抑制技术原理是将实时采样的数字信号进行频谱分析,这样我们就能分析背景噪声响应的强度和频谱分布,然后根据这个模型就能设计一个滤波器,当有人讲话的时候,同时做信号分析,根据分析,出讲话者的频谱,那么根据这些背景噪音和讲话者的频谱,这个滤波器根据两个信号的对比实时的改变,让讲话者声音频谱通过,对背景噪声的频谱进行抑制,降低其能量。
本实施例中,所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号。
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本实施例通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4个通道ADCMIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
进一步的,如图2及图3所示,本实施例提出的语音识别系统还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路。
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地。
如图2及图4所示,所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
更进一步的,如图2、图5及图6所示,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
如图2、图5及图7所示,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
如图2、图8、及图9所示,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接。可以理解的是,所述模数转换器的引脚26与所述电容C13的一端连接,所述电容C13的另外一端接地,构成BIAS2滤波电路。
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
如图2及图10所示,,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
进一步的,如图11所示,本实施例提出的语音识别系统还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
进一步的,请再次参照图2,本实施例中所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
下面再次结合图1至图11对本发明语音识别系统的工作原理做进一步的详细阐述。
本发明语音识别系统提出的语音识别系统中系统模块分为:供电电源滤波模块,模拟转数字信号IC 85L40模块,麦克风降列模块,主控单元供电模块,主控单元CPU,WIFI通讯模块,模拟输出L声道模块,7个部分组成。
供电电源滤波模块的功能是给模拟转数字信号IC 85L40模块提供稳定可靠的电源;模拟转数字信号IC 85L40模块功能是处理来自麦克风阵列模块的数据,并转发给主控单元CPU;麦克风阵列模块是把声音转换为电信号;主控单元CPU功能是处理模拟转数字信号IC 85L40模块传输出过来的数据并控制模拟转数字信号IC 85L40模块,还为模拟输出L声道模块提供音频信号;主控单元供电模块功能是给主控单元CPU提供稳定可靠的电压;WIFI通讯模块功能是接收和发射主控单元CPU的信息;模拟输出L声道模块是为主控单元CPU处理声音和传输给麦克风U4作为消噪回路的音源。
首先供电电源滤波模块供电给主控单元及滤波器,电源通过滤波后供给主控单元,使主控单元开机和摸拟转数字信号IC开始工作,主控单元开始与模拟转数字信号IC85L40通讯连接,机器开始工作。
当麦克风U1,麦克风U2,麦克风U3,麦克风U4(虚拟麦克风),收到声音信号转换为电信号,电信号放大处理后转换为模拟信号输入到模拟转数字IC 85L40,模数IC 85L40经过内部转换及放大调节再输出数字信号,把数字信号发送到主控单元CPU。
主控单元CPU收到麦克风信号,通过软件算法,消回音,去混音,放大,提取声音,通过WIFI送至云端,经过云端意译返回信息到本机,实现语音识别功能。
工作原理如下:
1,供电部分原理
VIO18_PMU电压为1.8V,从PMU输过来,经过电容C3,C4滤波后,得到电压VDDA_1.8V,供给模数转换IC85L40内部数字模块的GPIO口工作使用,作为GPIO口工作电压。VCC_AF为一个3.3V电压模拟电压,从PMU输过来,经过电容C9,C10滤波后,得到VDDB_3.3V电压,VDDB_3.3V输入到模数转换IC85L40内,作为模数转换IC85L40内部模拟内核供电使用。2,模数转换IC85L40工作原理要求
模数转换IC85L40第5,7,18接收到1.8V供电,上电后,输出一个VREF基准电压,经C7与地滤波。第25脚接到3.3V供电,并输出MICREF基准电压,经C8与地滤波。此时模数转换IC85L40开始工作,并检查模数转换IC85L40第14脚CSB电平高低,匹配IIC地址,检测17脚平电高低,确认工作模式,以上两个脚都为外部硬件预设参数。数转换IC85L40第14脚CSB脚默认接到GND,为低电平,第17脚经过电阻R1 10K接到VDDA_1.8V,为接高电平。模数转换IC85L40经过上面供电和检测后,开始工作。模数转换IC85L40第15脚为SCL,外接对地3PF滤波电容,第16脚为SDA外接3PF滤波电容,两脚为IIC功能脚,工作后通过IIC与主控单元CPU通讯,读取寄存器。模数转换IC85L40接到收麦克风信号后,经内部调节,由模拟信号转换为数字TDM信号,TDM信号从模数转换IC85L40第9脚输出,第11脚为BCK,第12脚为LRCK,配起来一起用,通过IIS的TDM输出到主控单元CPU,主控单元CPU接收到TDM信号后进行后台解析传输。
3,麦克风工作原理
模数转换IC85L40正常工作之后,从24,26脚输出一个模拟电压,此电压可以根据不同的麦克风配匹不同的电平,输出电压从1.5~3.3V内可调。两个电压分别经过电容C13,C14滤波后,得到模拟电压BIAS1,BIAS2。BIAS1,给麦克风U1和麦克风U2供电,BIAS2给麦克风U3供电。
麦克风U1,麦克风U1在收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C17滤波后,输入麦克风U1第4脚,麦克风U1开始工作。当麦克风U1接收到声波信号,经过麦克风U1内部处理放大后输出模拟正信号MIC1P_C,MIC1P_C输出到麦克风U1的第1脚,再经过C18去高频滤波,通过C15耦合,送到模数转换IC 85L40的第21脚模拟信号正MIC1P输入,送到IC内部。模拟信号负MIC1N经过耦合电容C16耦合到R10上0欧姆电阻,到GND形成回路。
麦克风U2,麦克风U2接收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C32滤波后,输入麦克风U2第4脚,麦克风U2开始工作。当麦克风U2接收到声波信号,经过麦克风U2内部处理放大后输出模拟信号正MIC2P_C,MIC2P_C输出到麦克风U2的第1脚上,再经过C22去高频滤波,通过C19耦合送到模数转换IC 85L40第23脚模拟信号正MIC2P输入,送到IC内部模拟信号负MIC1N经过耦合电容C20耦合到R11上0欧姆电阻,到GND形成回路。麦克风U3,麦克风U3接收到模数转换IC85L40供过来的BIAS2麦克风供电电源,经过C33滤波后,输入麦克风U3第4脚,麦克风U3开始工作。当麦克风U3接收到声波信号,经过麦克风U3内部处理放大后输出模拟信号正MIC3P_C,MIC3P_C输出到麦克风U3的第1脚上,再经过C26去高频滤波,通过C23耦合,送到模数转换IC 85L40第27脚模拟信号正MIC3P输入,送到CPU内部,模拟信号负MIC3N经过耦合电容C24耦合到R12上0欧姆电阻,到GND形成回路。第四路为接收本机播放的音频,是一个虚拟麦,它接收的是本机输出的左声道或右声道或左右声音的模拟音频信号。模拟信号从主控单元CPU输出,通过扬声器PA过来,经过电阻R14,R13分压后得到模拟信号正MIC4P_C,再通过C28滤波,输出到耦合电容C29,经过C29后得到模拟信号正MIC4P,MIC4P送到模数转换IC 85L40第1脚模拟信号正MIC2P输入,送到主控单元CPU内部,模拟信号负MIC4N经过耦合电容C30耦合到R16上0欧姆电阻,到GND形成回路。以上四路信号通过模数转换IC 85L40转换成数字信号(TDM信号),送到主控单元CPU,主控单元收到到信号后,放大,通过软件算法,把第四路信号与麦克风U1、U2、U3信号对比,通过对比,把麦克风U1、U2、U3信号中与第四路信号一样的声音信号去除,混音去除,把剩下的声音放大显示出来,并把显示出来的语句语意修正,通过WIFI模块,送到云端,根据云端语译做出判断,输出正确的信息,返回到本机上,并显示出结果。
综上所述,本发明语音识别系统采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。