CN108447483B - 语音识别系统 - Google Patents

语音识别系统 Download PDF

Info

Publication number
CN108447483B
CN108447483B CN201810479603.2A CN201810479603A CN108447483B CN 108447483 B CN108447483 B CN 108447483B CN 201810479603 A CN201810479603 A CN 201810479603A CN 108447483 B CN108447483 B CN 108447483B
Authority
CN
China
Prior art keywords
capacitor
analog
pin
digital converter
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810479603.2A
Other languages
English (en)
Other versions
CN108447483A (zh
Inventor
张治宇
钟景维
石庆
马保军
郑科
张龙
程文辉
韦振剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emdoor Digital Technology Co ltd
Original Assignee
Emdoor Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Emdoor Digital Technology Co ltd filed Critical Emdoor Digital Technology Co ltd
Priority to CN201810479603.2A priority Critical patent/CN108447483B/zh
Publication of CN108447483A publication Critical patent/CN108447483A/zh
Application granted granted Critical
Publication of CN108447483B publication Critical patent/CN108447483B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

本发明涉及一种语音识别系统,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。本发明采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。

Description

语音识别系统
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别系统。
背景技术
语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术已在工业、家电、通信、汽车电子、医疗、家庭服务、消费类电子等各个领域上应用。曾经语音识别听写机在一些领域的应用,被美国新闻界评为计算机发展十件大事之一。
随着语音识别产品逐渐增加,许多语音识别和人机交互产品进入人们的生活需求,对语音识别技术质量要求越来越高。
现有多数方案采用双麦克风拾音或者6个麦克风阵列做语音识别。对于双麦克风,只能单纯软件上做算法降噪,同时并不能识别是本机中播放的音频,还是环境中噪音;对于语音识别误判或直接语意是不能识别的,或者译错语意,特别是当播放声音较大时,或说话者距离机器较远时特别明显。而采用6个麦克风阵列的产品,占比空间大,产品外观要做很大,软件算法需要处理6个麦克风的数据,耗CPU资源较大,对CPU性能要求很高,整体设计方案成本过高,普通消费类产品难以实现。
发明内容
本发明的主要目的在于提出一种语音识别系统,旨在降低成本,提高语音识别准确率。
为实现上述目的,本发明提出一种语音识别系统,该系统包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;
所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本发明的进一步的技术方案是,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;
所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
本发明的进一步的技术方案是,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
本发明的进一步的技术方案是,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
本发明的进一步的技术方案是,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
本发明的进一步的技术方案是,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
本发明的进一步的技术方案是,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
本发明的进一步的技术方案是,所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
本发明的进一步的技术方案是,所述模数转换器采用IC85L40转换器。
本发明的有益效果是:本发明语音识别系统通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
附图说明
图1是本发明语音识别系统较佳实施例的结构示意图;
图2是本发明语音识别系统较佳实施例中模数转换器的电路结构示意图;
图3是本发明语音识别系统较佳实施例中第一供电电源滤波电路示意图;
图4是本发明语音识别系统较佳实施例中第二供电电源滤波电路示意图;
图5是本发明语音识别系统较佳实施例中BIAS1滤波电路示意图;
图6是本发明语音识别系统较佳实施例中第一通道ADC MIC语音识别电路示意图;
图7是本发明语音识别系统较佳实施例中第二通道ADC MIC语音识别电路示意图;
图8是本发明语音识别系统较佳实施例中BIAS2滤波电路示意图;
图9是本发明语音识别系统较佳实施例中第三通道ADC MIC语音识别电路示意图;
图10是本发明语音识别系统较佳实施例中第四通道ADC MIC语音识别电路示意图;
图11是本发明语音识别系统较佳实施例中基准电压滤波电路示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅是本发明一部分实施例,并不用于限定本发明。基于本发明中的实施例,未经创造性设计而所衍生的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1是本发明语音识别系统较佳实施例的结构示意图。
如图1所示,本实施例提出的语音识别系统包括服务云端、主控制器、模数转换器ADC、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。
本实施例中,所述模数转换器可以采用IC85L40转换器。
可以理解的是,本实施例中,所述声音定位模块利用三个麦克风同时拾音,利用声达时间差(TDOA)的定位技术,先行进行声达时间差估计,并从中最先拾到声音信号的麦克风到最后获取麦克风阵列中阵之间的声延迟(TDOA);再利用获取的声达时间差,确定声音来源的方向。
所述声源增强模块采用三个呈等边形布置的麦克风形成三个拾音波束,各自对应120°范围。当通过唤醒确定声源角度(算法内部自动确定声源方向的一个拾音波束进行拾音)或指定一个拾音波束进行拾音时,阵列算法会增强波束范围内的声音,削弱波束外的声音,以增强录音信噪比。如指定波束1进行拾音,由于每个波束的范围为120°,所以60°~180°范围内录音得到增强,波束1范围外的声音会被减弱。
所述回声消除模块,回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω进行参数辨识,根据扬声器PA信号与产生的多路回声的相关性为基础,建立远端信号模型,模拟回声路径,通过自适应算法调整,使其冲击响应和真实回声路径相逼近。然后将麦克风接收到的信号减去估计值,即可实现回声消除功能。
所述噪音抑制模块的核心是语音增强,语音增强的主要目标是从受噪声干扰的语音信号中提取尽可能纯净的原始语音,通过带噪语音进行处理,消除背景噪声改善语音质量,提高语音清晰度和可懂度,从而提高语音处理系统性能。噪音抑制技术原理是将实时采样的数字信号进行频谱分析,这样我们就能分析背景噪声响应的强度和频谱分布,然后根据这个模型就能设计一个滤波器,当有人讲话的时候,同时做信号分析,根据分析,出讲话者的频谱,那么根据这些背景噪音和讲话者的频谱,这个滤波器根据两个信号的对比实时的改变,让讲话者声音频谱通过,对背景噪声的频谱进行抑制,降低其能量。
本实施例中,所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号。
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本实施例通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4个通道ADCMIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
进一步的,如图2及图3所示,本实施例提出的语音识别系统还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路。
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地。
如图2及图4所示,所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
更进一步的,如图2、图5及图6所示,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
如图2、图5及图7所示,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
如图2、图8、及图9所示,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接。可以理解的是,所述模数转换器的引脚26与所述电容C13的一端连接,所述电容C13的另外一端接地,构成BIAS2滤波电路。
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
如图2及图10所示,,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
进一步的,如图11所示,本实施例提出的语音识别系统还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
进一步的,请再次参照图2,本实施例中所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
下面再次结合图1至图11对本发明语音识别系统的工作原理做进一步的详细阐述。
本发明语音识别系统提出的语音识别系统中系统模块分为:供电电源滤波模块,模拟转数字信号IC 85L40模块,麦克风降列模块,主控单元供电模块,主控单元CPU,WIFI通讯模块,模拟输出L声道模块,7个部分组成。
供电电源滤波模块的功能是给模拟转数字信号IC 85L40模块提供稳定可靠的电源;模拟转数字信号IC 85L40模块功能是处理来自麦克风阵列模块的数据,并转发给主控单元CPU;麦克风阵列模块是把声音转换为电信号;主控单元CPU功能是处理模拟转数字信号IC 85L40模块传输出过来的数据并控制模拟转数字信号IC 85L40模块,还为模拟输出L声道模块提供音频信号;主控单元供电模块功能是给主控单元CPU提供稳定可靠的电压;WIFI通讯模块功能是接收和发射主控单元CPU的信息;模拟输出L声道模块是为主控单元CPU处理声音和传输给麦克风U4作为消噪回路的音源。
首先供电电源滤波模块供电给主控单元及滤波器,电源通过滤波后供给主控单元,使主控单元开机和摸拟转数字信号IC开始工作,主控单元开始与模拟转数字信号IC85L40通讯连接,机器开始工作。
当麦克风U1,麦克风U2,麦克风U3,麦克风U4(虚拟麦克风),收到声音信号转换为电信号,电信号放大处理后转换为模拟信号输入到模拟转数字IC 85L40,模数IC 85L40经过内部转换及放大调节再输出数字信号,把数字信号发送到主控单元CPU。
主控单元CPU收到麦克风信号,通过软件算法,消回音,去混音,放大,提取声音,通过WIFI送至云端,经过云端意译返回信息到本机,实现语音识别功能。
工作原理如下:
1,供电部分原理
VIO18_PMU电压为1.8V,从PMU输过来,经过电容C3,C4滤波后,得到电压VDDA_1.8V,供给模数转换IC85L40内部数字模块的GPIO口工作使用,作为GPIO口工作电压。VCC_AF为一个3.3V电压模拟电压,从PMU输过来,经过电容C9,C10滤波后,得到VDDB_3.3V电压,VDDB_3.3V输入到模数转换IC85L40内,作为模数转换IC85L40内部模拟内核供电使用。2,模数转换IC85L40工作原理要求
模数转换IC85L40第5,7,18接收到1.8V供电,上电后,输出一个VREF基准电压,经C7与地滤波。第25脚接到3.3V供电,并输出MICREF基准电压,经C8与地滤波。此时模数转换IC85L40开始工作,并检查模数转换IC85L40第14脚CSB电平高低,匹配IIC地址,检测17脚平电高低,确认工作模式,以上两个脚都为外部硬件预设参数。数转换IC85L40第14脚CSB脚默认接到GND,为低电平,第17脚经过电阻R1 10K接到VDDA_1.8V,为接高电平。模数转换IC85L40经过上面供电和检测后,开始工作。模数转换IC85L40第15脚为SCL,外接对地3PF滤波电容,第16脚为SDA外接3PF滤波电容,两脚为IIC功能脚,工作后通过IIC与主控单元CPU通讯,读取寄存器。模数转换IC85L40接到收麦克风信号后,经内部调节,由模拟信号转换为数字TDM信号,TDM信号从模数转换IC85L40第9脚输出,第11脚为BCK,第12脚为LRCK,配起来一起用,通过IIS的TDM输出到主控单元CPU,主控单元CPU接收到TDM信号后进行后台解析传输。
3,麦克风工作原理
模数转换IC85L40正常工作之后,从24,26脚输出一个模拟电压,此电压可以根据不同的麦克风配匹不同的电平,输出电压从1.5~3.3V内可调。两个电压分别经过电容C13,C14滤波后,得到模拟电压BIAS1,BIAS2。BIAS1,给麦克风U1和麦克风U2供电,BIAS2给麦克风U3供电。
麦克风U1,麦克风U1在收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C17滤波后,输入麦克风U1第4脚,麦克风U1开始工作。当麦克风U1接收到声波信号,经过麦克风U1内部处理放大后输出模拟正信号MIC1P_C,MIC1P_C输出到麦克风U1的第1脚,再经过C18去高频滤波,通过C15耦合,送到模数转换IC 85L40的第21脚模拟信号正MIC1P输入,送到IC内部。模拟信号负MIC1N经过耦合电容C16耦合到R10上0欧姆电阻,到GND形成回路。
麦克风U2,麦克风U2接收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C32滤波后,输入麦克风U2第4脚,麦克风U2开始工作。当麦克风U2接收到声波信号,经过麦克风U2内部处理放大后输出模拟信号正MIC2P_C,MIC2P_C输出到麦克风U2的第1脚上,再经过C22去高频滤波,通过C19耦合送到模数转换IC 85L40第23脚模拟信号正MIC2P输入,送到IC内部模拟信号负MIC1N经过耦合电容C20耦合到R11上0欧姆电阻,到GND形成回路。麦克风U3,麦克风U3接收到模数转换IC85L40供过来的BIAS2麦克风供电电源,经过C33滤波后,输入麦克风U3第4脚,麦克风U3开始工作。当麦克风U3接收到声波信号,经过麦克风U3内部处理放大后输出模拟信号正MIC3P_C,MIC3P_C输出到麦克风U3的第1脚上,再经过C26去高频滤波,通过C23耦合,送到模数转换IC 85L40第27脚模拟信号正MIC3P输入,送到CPU内部,模拟信号负MIC3N经过耦合电容C24耦合到R12上0欧姆电阻,到GND形成回路。第四路为接收本机播放的音频,是一个虚拟麦,它接收的是本机输出的左声道或右声道或左右声音的模拟音频信号。模拟信号从主控单元CPU输出,通过扬声器PA过来,经过电阻R14,R13分压后得到模拟信号正MIC4P_C,再通过C28滤波,输出到耦合电容C29,经过C29后得到模拟信号正MIC4P,MIC4P送到模数转换IC 85L40第1脚模拟信号正MIC2P输入,送到主控单元CPU内部,模拟信号负MIC4N经过耦合电容C30耦合到R16上0欧姆电阻,到GND形成回路。以上四路信号通过模数转换IC 85L40转换成数字信号(TDM信号),送到主控单元CPU,主控单元收到到信号后,放大,通过软件算法,把第四路信号与麦克风U1、U2、U3信号对比,通过对比,把麦克风U1、U2、U3信号中与第四路信号一样的声音信号去除,混音去除,把剩下的声音放大显示出来,并把显示出来的语句语意修正,通过WIFI模块,送到云端,根据云端语译做出判断,输出正确的信息,返回到本机上,并显示出结果。
综上所述,本发明语音识别系统采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种语音识别系统,其特征在于,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;
所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
2.根据权利要求1所述的语音识别系统,其特征在于,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;
所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
3.根据权利要求2所述的语音识别系统,其特征在于,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
4.根据权利要求2所述的语音识别系统,其特征在于,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
5.根据权利要求2所述的语音识别系统,其特征在于,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
6.根据权利要求2所述的语音识别系统,其特征在于,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
7.根据权利要求2所述的语音识别系统,其特征在于,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
8.根据权利要求2-7任意一项所述的语音识别系统,其特征在于,所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
9.根据权利要求1所述的语音识别系统,其特征在于,所述模数转换器采用IC85L40转换器。
CN201810479603.2A 2018-05-18 2018-05-18 语音识别系统 Active CN108447483B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810479603.2A CN108447483B (zh) 2018-05-18 2018-05-18 语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810479603.2A CN108447483B (zh) 2018-05-18 2018-05-18 语音识别系统

Publications (2)

Publication Number Publication Date
CN108447483A CN108447483A (zh) 2018-08-24
CN108447483B true CN108447483B (zh) 2023-11-21

Family

ID=63204698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810479603.2A Active CN108447483B (zh) 2018-05-18 2018-05-18 语音识别系统

Country Status (1)

Country Link
CN (1) CN108447483B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109178250A (zh) * 2018-08-28 2019-01-11 上海海事大学 一种具有语音识别的智能救生圈
CN109508171A (zh) * 2018-12-19 2019-03-22 上海龙旗科技股份有限公司 一种基于四通道的语音处理方法及设备
CN109461449B (zh) * 2018-12-29 2021-12-14 思必驰科技股份有限公司 用于智能设备的语音唤醒方法及系统
CN109473111B (zh) * 2018-12-29 2024-03-08 思必驰科技股份有限公司 一种语音赋能装置及方法
CN113038339B (zh) * 2019-12-09 2022-03-25 北京君正集成电路股份有限公司 一种消除回音提高音频质量的系统
CN111179938A (zh) * 2019-12-26 2020-05-19 安徽仁昊智能科技有限公司 一种基于人工智能的语音识别垃圾分类系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
CN101040564A (zh) * 2004-10-19 2007-09-19 索尼株式会社 音频信号处理装置及音频信号处理方法
CN102969002A (zh) * 2012-11-28 2013-03-13 厦门大学 一种可抑制移动噪声的麦克风阵列语音增强装置
CN105073073A (zh) * 2013-01-25 2015-11-18 胡海 用于声音可视化及声源定位的设备与方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
CN106782584A (zh) * 2016-12-28 2017-05-31 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN208538474U (zh) * 2018-05-18 2019-02-22 深圳市亿道数码技术有限公司 语音识别系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101040564A (zh) * 2004-10-19 2007-09-19 索尼株式会社 音频信号处理装置及音频信号处理方法
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
CN102969002A (zh) * 2012-11-28 2013-03-13 厦门大学 一种可抑制移动噪声的麦克风阵列语音增强装置
CN105073073A (zh) * 2013-01-25 2015-11-18 胡海 用于声音可视化及声源定位的设备与方法
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106782584A (zh) * 2016-12-28 2017-05-31 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN208538474U (zh) * 2018-05-18 2019-02-22 深圳市亿道数码技术有限公司 语音识别系统

Also Published As

Publication number Publication date
CN108447483A (zh) 2018-08-24

Similar Documents

Publication Publication Date Title
CN108447483B (zh) 语音识别系统
CN106782591B (zh) 一种在背景噪音下提高语音识别率的装置及其方法
CN106782584B (zh) 音频信号处理设备、方法和电子设备
CN206349145U (zh) 音频信号处理设备
CN103152546B (zh) 基于模式识别和延迟前馈控制的视频会议回声抑制方法
CN101996630B (zh) 基于二进时频单元的自动声音识别
US20060206320A1 (en) Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
CN109195042B (zh) 低功耗的高效降噪耳机及降噪系统
CN205249484U (zh) 一种麦克风线性阵列增强指向性拾音器
CN110349582B (zh) 显示装置与远场语音处理电路
CN1288222A (zh) 具有麦克风阵列的语音控制系统
CN108549051A (zh) 一种基于麦克风阵列的近场声源实时定位系统
CN113630708B (zh) 耳机麦克风异常检测的方法、装置、耳机套件及存储介质
US10972844B1 (en) Earphone and set of earphones
TW201924360A (zh) 用於遠場語音的拾音裝置
CN108200492A (zh) 语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备
CN207764800U (zh) 翻译设备及翻译系统
CN111276150B (zh) 一种基于麦克风阵列的智能语音转文字及同声翻译系统
CN208538474U (zh) 语音识别系统
CN214226506U (zh) 声音处理电路、电声器件和声音处理系统
CN109729448A (zh) 脖戴式语音交互耳机的语音控制优化方法和装置
CN112581970A (zh) 用于音频信号生成的系统和方法
CN115866474A (zh) 无线耳机的透传降噪控制方法、系统及无线耳机
CN103152686B (zh) 一种可定制功能模式的数字助听器及其实现方法
WO2021004067A1 (zh) 一种显示装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 Meisheng Huigu Science Park, No. 83 Dabao Road, 33 District, Shanghe Street, Baoan District, Shenzhen City, Guangdong Province, 5 4th Floors of Meigu, 5 2nd Floors-2 of Meigu, 6 2nd Floors-2 of Meigu and 6 4th Floors of Meigu

Applicant after: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

Address before: 518000 Guangdong city of Shenzhen province Baoan District Xin'an Street Dabao Road No. 49-1 campoloy building 6 floor

Applicant before: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 901, building 1, No. 9, Jinxiu Middle Road, Laokeng community, Longtian street, Pingshan District, Shenzhen City, Guangdong Province

Applicant after: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

Address before: 518000 4th floor, building 5, building 2-2, building 6, building 2-2, building 6, building 4, Meisheng Huigu Science Park, 83 Dabao Road, Shanghe community, Xin'an street, Bao'an District, Shenzhen City, Guangdong Province

Applicant before: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant