CN108986833A - 基于麦克风阵列的拾音方法、系统、电子设备及存储介质 - Google Patents

基于麦克风阵列的拾音方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN108986833A
CN108986833A CN201810954185.8A CN201810954185A CN108986833A CN 108986833 A CN108986833 A CN 108986833A CN 201810954185 A CN201810954185 A CN 201810954185A CN 108986833 A CN108986833 A CN 108986833A
Authority
CN
China
Prior art keywords
voice
signal
microphone array
voice signal
enhanced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810954185.8A
Other languages
English (en)
Inventor
朱正辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Baolun Electronics Co Ltd
Original Assignee
Guangzhou Baolun Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baolun Electronics Co Ltd filed Critical Guangzhou Baolun Electronics Co Ltd
Priority to CN201810954185.8A priority Critical patent/CN108986833A/zh
Publication of CN108986833A publication Critical patent/CN108986833A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

本发明公开了一种基于麦克风阵列的拾音方法,其包括:使用麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测;利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向;对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;对所述增强过的语音信号进行语音唤醒检测;将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。本发明还公开了基于麦克风阵列的拾音系统、电子设备及计算机可读存储介质。本发明通过语音激活检测和语音唤醒,配合语音增强,能够更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音。

Description

基于麦克风阵列的拾音方法、系统、电子设备及存储介质
技术领域
本发明涉及拾音技术领域,尤其涉及一种基于麦克风阵列的拾音方法、系统、电子设备及存储介质。
背景技术
现有的语音识别技术通过一个或多个麦克风实现,对近距离或远场环境下的语音信号进行拾取,在高噪声的环境中,现有的语音识别技术则是通过复杂的算法,通过降噪以及语音增强等方式实现对需求语音的输出,这种方式存在以下缺陷:成本高,而且大量的计算占用了系统CPU的过多资源,造成系统运行速度慢,同时也增加了能量损耗。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种基于麦克风阵列的拾音方法,其通过语音激活检测和语音唤醒,配合语音增强,能够更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音。
本发明的目的之二在于提供一种基于麦克风阵列的拾音系统,其通过语音激活检测和语音唤醒,配合语音增强,能够更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音。
本发明的目的之三在于提供一种实现上述基于麦克风阵列的拾音方法的电子设备。
本发明的目的之四在于提供一种存储上述基于麦克风阵列的拾音方法的计算机可读存储介质。
本发明的目的之一采用如下技术方案实现:
一种基于麦克风阵列的拾音方法,包括以下步骤:
语音激活检测步骤:使用麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测,判断是否出现语音激活信号,如果是,执行定位步骤,如果否,重复执行语音激活检测步骤;
定位步骤:利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向;
语音增强步骤:对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测步骤:对所述增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒信号,如果是,执行输出步骤,否则,重复执行激活检测步骤;
输出步骤:将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
进一步地,所述定位步骤,包括:
依据所述麦克风阵列中的至少两个麦克风接收到的信号时间差获取所述发声声源所在的位置作为声源定位方向。
进一步地,通过拾音指示灯对声源定位方向进行指示。
进一步地,所述输出步骤,包括:
对所述拾音指示灯所指声源定位方向的语音信号进行增强,并将该增强后的语音信号作为最终所拾取到的语音输出。
进一步地,所述语音增强步骤,包括:
对所述声源定位方向的语音信号进行噪声抑制,获取一增强过的语音信号。
进一步地,所述语音激活检测步骤,包括:
从所述麦克风阵列捕获的多路语音信号中选取一路语音信号;
检测所述一路语音信号中说话者的语音起始点及语音结束点;
依据所述语音起始点至所述语音结束点之间的信号判断是否出现语音激活信号,如果是,执行定位步骤,否则,从所述麦克风阵列捕获的多路语音信号中选取另一路语音信号,继续检测语音起始点及语音结束点。
进一步地,所述语音唤醒检测步骤,包括:
将所述增强过的语音信号送入一语音唤醒模型,检测所述增强过的语音信号中是否包含设定的唤醒词,如果没有,转至语音激活检测步骤,如果有,执行输出步骤。
本发明的目的之二采用如下技术方案实现:
一种基于麦克风阵列的拾音系统,包括:
麦克风阵列,包括多个麦克风单元,多个麦克风单元用于拾取并输出多路语音信号;
语音激活单元,用于依据所述多路语音信号中的至少一路语音信号进行语音激活检测,输出语音激活结果信号或语音未激活结果信号;
声源定位单元,用于在语音激活单元输出语音激活结果信号时,依据所述多路语音信号进行声源定位确定声源定位方向;
第一语音增强单元,用于对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测单元,用于对所述增强过的语音信号进行语音唤醒检测,并输出语音唤醒结果信号或语音未唤醒结果信号;
第二语音增强单元,用于在语音唤醒检测单元输出语音唤醒结果信号时,将所述麦克风阵列拾取到的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
本发明的目的之三采用如下技术方案实现:
一种电子设备,包括:一个或多个处理器;存储系统,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明目的之一的基于麦克风阵列的拾音方法。
本发明的目的之四采用如下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明目的之一的基于麦克风阵列的拾音方法。
相比现有技术,本发明的有益效果在于:
本发明针对当前语音识别技术在不同场景和不同需求下日益广泛的应用,通过语音激活检测和语音唤醒,配合语音增强,能够更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音,为远距离的语音控制提供了优秀的解决方案;同时本发明利用语音唤醒和语音检测也能够降低麦克风阵列数据处理的计算量,既降低了能源的消耗,又能节约成本。
附图说明
图1为本发明实施例一的基于麦克风阵列的拾音方法的流程图;
图2为本发明实施例二的基于麦克风阵列的拾音系统的结构示意图;
图3为本发明实施例三的电子设备的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
本发明实施例一公开了一种基于麦克风阵列的拾音方法,能够更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音,为远距离的语音控制提供了优秀的解决方案。该方法可以由硬件或/和软件来执行,请参照图1所示,其包括以下步骤:
110、语音激活检测。
使用麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测,判断是否出现语音激活信号,如果是,执行120步骤,如果否,选取其他路的语音信号重复执行110步骤。
使用麦克风阵列拾取并输出的多路语音信号并不是最终要输出的语音,其是用来进行语音激活检测以及语音增强和语音唤醒的基础信号。
语音激活检测的方法具体包括:
从所述麦克风阵列捕获的多路语音信号中选取一路语音信号,称为目标语音信号;检测所述目标语音信号中说话者的语音起始点及语音结束点;依据所述语音起始点至所述语音结束点之间的信号判断是否出现语音激活信号,如果是,执行120步骤,否则,从所述麦克风阵列捕获的多路语音信号中选取除目标语音信号外的另一路语音信号,继续检测语音起始点及语音结束点,直至出现语音激活信号。
120、定位步骤。
利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向。具体是依据所述麦克风阵列中的至少两个麦克风接收到的信号时间差获取所述发声声源所在的位置作为声源定位方向。
本发明的基于麦克风阵列的拾音系统,所述麦克风阵列为多颗麦克风单元组成的平面环形结构,多个拾音指示灯沿所述平面环形结构的环绕方向设置,优选一颗麦克风单元对应一个拾音指示灯,所述拾音指示灯用于指示所述声源定位方向,某个拾音指示灯被点亮,则说明其对应声源方向。
130、语音增强步骤。
对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号,为了与110步骤的语音信号进行区分,这里将增强过的语音信号定义为第一增强语音信号,也就是说第一增强语音信号为对所述声源定位方向对应的一路语音信号进行语音增强后得到的,语音增强的方法主要是进行噪声抑制。
140、语音唤醒检测步骤。
对所述增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒信号,如果是,执行150步骤,否则,选取其他路的语音信号重复执行110步骤直至出现语音唤醒信号。
语音唤醒检测的方法是:将第一增强语音信号送入一语音唤醒模型,检测所述增强过的语音信号中是否包含设定的唤醒词,如果包含,则说明检测到语音唤醒信号;
150、输出步骤。
将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
其具体是对所述拾音指示灯所指方向的语音信号进行增强,增强的方式也可以是噪声抑制,获取增强后的信号称为第二增强语音信号以示与110步骤的语音信号和130步骤的第一增强语音信号进行区别,最终的语音输出即为该第二增强语音信号。
事实上,如果140步骤成立时,第二增强语音信号可以是第一增强语音信号,或者是对该第一增强语音信息进行二次增强得到。
实施例二
实施例二公开了一种对应上述实施例的基于麦克风阵列的拾音系统,请参照图2所示,其包括:
麦克风阵列210,包括多个麦克风单元,多个麦克风单元用于拾取并输出多路语音信号;
语音激活单元220,用于依据所述多路语音信号中的至少一路语音信号进行语音激活检测,输出语音激活结果信号或语音未激活结果信号;
声源定位单元230,用于在语音激活单元输出语音激活结果信号时,依据所述多路语音信号进行声源定位确定声源定位方向;
第一语音增强单元240,用于对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测单元250,用于对所述增强过的语音信号进行语音唤醒检测,并输出语音唤醒结果信号或语音未唤醒结果信号;
第二语音增强单元260,用于在语音唤醒检测单元输出语音唤醒结果信号时,将所述麦克风阵列拾取到的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
实施例三
图3为本发明实施例三提供的一种电子设备的结构示意图,如图3所示,该电子设备包括处理器310、存储器320、输入系统330和输出系统340;计算机设备中处理器310的数量可以是一个或多个,图3中以一个处理器310为例;电子设备中的处理器310、存储器320、输入系统330和输出系统340可以通过总线或其他方式连接,图3中以通过总线连接为例。
存储器320作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于麦克风阵列的拾音方法对应的程序指令/模块(例如,基于麦克风阵列的拾音系统中的语音激活单元220、声源定位单元230、第一语音增强单元240、语音唤醒检测单元250和第二语音增强单元260)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的基于麦克风阵列的拾音方法。
存储器320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器320可进一步包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统330可以是作为语音信号采集的麦克风阵列210。输出系统340可包括显示屏等显示设备。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于麦克风阵列的拾音方法,该方法包括:
语音激活检测步骤:使用麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测,判断是否出现语音激活信号,如果是,执行定位步骤,如果否,重复执行语音激活检测步骤;
定位步骤:利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向;
语音增强步骤:对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测步骤:对所述增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒信号,如果是,执行输出步骤,否则,重复执行激活检测步骤;
输出步骤:将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于麦克风阵列的拾音方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述基于麦克风阵列的拾音系统的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims (10)

1.一种基于麦克风阵列的拾音方法,其特征在于,包括以下步骤:
语音激活检测步骤:使用麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测,判断是否出现语音激活信号,如果是,执行定位步骤,如果否,重复执行语音激活检测步骤;
定位步骤:利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向;
语音增强步骤:对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测步骤:对所述增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒信号,如果是,执行输出步骤,否则,重复执行激活检测步骤;
输出步骤:将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
2.如权利要求1所述的基于麦克风阵列的拾音方法,其特征在于,所述定位步骤,包括:
依据所述麦克风阵列中的至少两个麦克风接收到的信号时间差获取所述发声声源所在的位置作为声源定位方向。
3.如权利要求2所述的基于麦克风阵列的拾音方法,其特征在于,通过拾音指示灯对声源定位方向进行指示。
4.如权利要求3所述的基于麦克风阵列的拾音方法,其特征在于,所述输出步骤,包括:
对所述拾音指示灯所指声源定位方向的语音信号进行增强,并将该增强后的语音信号作为最终所拾取到的语音输出。
5.如权利要求1所述的基于麦克风阵列的拾音方法,其特征在于,所述语音增强步骤,包括:
对所述声源定位方向的语音信号进行噪声抑制,获取一增强过的语音信号。
6.如权利要求1所述的基于麦克风阵列的拾音方法,其特征在于,所述语音激活检测步骤,包括:
从所述麦克风阵列捕获的多路语音信号中选取一路语音信号;
检测所述一路语音信号中说话者的语音起始点及语音结束点;
依据所述语音起始点至所述语音结束点之间的信号判断是否出现语音激活信号,如果是,执行定位步骤,否则,从所述麦克风阵列捕获的多路语音信号中选取另一路语音信号,继续检测语音起始点及语音结束点。
7.如权利要求1所述的基于麦克风阵列的拾音方法,其特征在于,所述语音唤醒检测步骤,包括:
将所述增强过的语音信号送入一语音唤醒模型,检测所述增强过的语音信号中是否包含设定的唤醒词,如果没有,转至语音激活检测步骤,如果有,执行输出步骤。
8.一种基于麦克风阵列的拾音系统,其特征在于,包括:
麦克风阵列,包括多个麦克风单元,多个麦克风单元用于拾取并输出多路语音信号;
语音激活单元,用于依据所述多路语音信号中的至少一路语音信号进行语音激活检测,输出语音激活结果信号或语音未激活结果信号;
声源定位单元,用于在语音激活单元输出语音激活结果信号时,依据所述多路语音信号进行声源定位确定声源定位方向;
第一语音增强单元,用于对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
语音唤醒检测单元,用于对所述增强过的语音信号进行语音唤醒检测,并输出语音唤醒结果信号或语音未唤醒结果信号;
第二语音增强单元,用于在语音唤醒检测单元输出语音唤醒结果信号时,将所述麦克风阵列拾取到的多路语音信号处理为一路增强后的语音信号,作为最终所拾取到的语音输出。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储系统,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于麦克风阵列的拾音方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的基于麦克风阵列的拾音方法。
CN201810954185.8A 2018-08-21 2018-08-21 基于麦克风阵列的拾音方法、系统、电子设备及存储介质 Pending CN108986833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810954185.8A CN108986833A (zh) 2018-08-21 2018-08-21 基于麦克风阵列的拾音方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810954185.8A CN108986833A (zh) 2018-08-21 2018-08-21 基于麦克风阵列的拾音方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN108986833A true CN108986833A (zh) 2018-12-11

Family

ID=64553930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810954185.8A Pending CN108986833A (zh) 2018-08-21 2018-08-21 基于麦克风阵列的拾音方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN108986833A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109524004A (zh) * 2018-12-29 2019-03-26 苏州思必驰信息科技有限公司 一种实现多路音频和数据的并行传输的方法、外接式的语音交互装置和系统
CN109767766A (zh) * 2019-01-23 2019-05-17 海信集团有限公司 一种语音识别方法及装置
CN110956951A (zh) * 2019-12-23 2020-04-03 苏州思必驰信息科技有限公司 一种语音增强采集配件、方法、系统、设备及存储介质
CN110970049A (zh) * 2019-12-06 2020-04-07 广州国音智能科技有限公司 多人声识别方法、装置、设备及可读存储介质
CN111323753A (zh) * 2018-12-13 2020-06-23 蔚来汽车有限公司 定位汽车内语音源的方法
CN111402873A (zh) * 2020-02-25 2020-07-10 北京声智科技有限公司 语音信号处理方法、装置、设备及存储介质
CN111681675A (zh) * 2020-06-03 2020-09-18 西安Tcl软件开发有限公司 数据动态传输方法、装置、设备和存储介质
CN112185406A (zh) * 2020-09-18 2021-01-05 北京大米科技有限公司 声音处理方法、装置、电子设备和可读存储介质
CN112634911A (zh) * 2020-12-21 2021-04-09 苏州思必驰信息科技有限公司 人机对话方法、电子设备及计算机可读存储介质
CN113782019A (zh) * 2019-03-11 2021-12-10 百度国际科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
WO2021253235A1 (zh) * 2020-06-16 2021-12-23 华为技术有限公司 语音活动检测方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
CN103400578A (zh) * 2013-08-22 2013-11-20 厦门大学 谱减与动态时间规整算法联合处理的抗噪声声纹识别装置
CN105976810A (zh) * 2016-04-28 2016-09-28 Tcl集团股份有限公司 一种检测语音有效话语段端点的方法和装置
US20160322045A1 (en) * 2013-12-18 2016-11-03 Cirrus Logic International Semiconductor Ltd. Voice command triggered speech enhancement
CN106328156A (zh) * 2016-08-22 2017-01-11 华南理工大学 一种音视频信息融合的麦克风阵列语音增强系统及方法
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
CN107193914A (zh) * 2017-05-15 2017-09-22 广东艾檬电子科技有限公司 一种语音输入方法及移动终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
CN103400578A (zh) * 2013-08-22 2013-11-20 厦门大学 谱减与动态时间规整算法联合处理的抗噪声声纹识别装置
US20160322045A1 (en) * 2013-12-18 2016-11-03 Cirrus Logic International Semiconductor Ltd. Voice command triggered speech enhancement
CN105976810A (zh) * 2016-04-28 2016-09-28 Tcl集团股份有限公司 一种检测语音有效话语段端点的方法和装置
CN106328156A (zh) * 2016-08-22 2017-01-11 华南理工大学 一种音视频信息融合的麦克风阵列语音增强系统及方法
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
CN107193914A (zh) * 2017-05-15 2017-09-22 广东艾檬电子科技有限公司 一种语音输入方法及移动终端

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111323753A (zh) * 2018-12-13 2020-06-23 蔚来汽车有限公司 定位汽车内语音源的方法
CN109524004B (zh) * 2018-12-29 2022-03-08 思必驰科技股份有限公司 一种实现多路音频和数据的并行传输的方法、外接式的语音交互装置和系统
CN109524004A (zh) * 2018-12-29 2019-03-26 苏州思必驰信息科技有限公司 一种实现多路音频和数据的并行传输的方法、外接式的语音交互装置和系统
CN109767766A (zh) * 2019-01-23 2019-05-17 海信集团有限公司 一种语音识别方法及装置
CN113782019A (zh) * 2019-03-11 2021-12-10 百度国际科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
CN110970049A (zh) * 2019-12-06 2020-04-07 广州国音智能科技有限公司 多人声识别方法、装置、设备及可读存储介质
CN110956951A (zh) * 2019-12-23 2020-04-03 苏州思必驰信息科技有限公司 一种语音增强采集配件、方法、系统、设备及存储介质
CN111402873A (zh) * 2020-02-25 2020-07-10 北京声智科技有限公司 语音信号处理方法、装置、设备及存储介质
CN111402873B (zh) * 2020-02-25 2023-10-20 北京声智科技有限公司 语音信号处理方法、装置、设备及存储介质
CN111681675A (zh) * 2020-06-03 2020-09-18 西安Tcl软件开发有限公司 数据动态传输方法、装置、设备和存储介质
WO2021253235A1 (zh) * 2020-06-16 2021-12-23 华为技术有限公司 语音活动检测方法和装置
CN112185406A (zh) * 2020-09-18 2021-01-05 北京大米科技有限公司 声音处理方法、装置、电子设备和可读存储介质
CN112634911A (zh) * 2020-12-21 2021-04-09 苏州思必驰信息科技有限公司 人机对话方法、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108986833A (zh) 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
CN107591151B (zh) 远场语音唤醒方法、装置和终端设备
WO2020083110A1 (zh) 一种语音识别、及语音识别模型训练方法及装置
CN111091828B (zh) 语音唤醒方法、设备及系统
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
CN105190746B (zh) 用于检测目标关键词的方法和设备
CN110780741B (zh) 模型训练方法、应用运行方法、装置、介质及电子设备
TW201828719A (zh) 一種基於麥克風陣列的拾音方法及系統
CN105139858B (zh) 一种信息处理方法及电子设备
WO2016160123A1 (en) Controlling electronic device based on direction of speech
US20140337030A1 (en) Adaptive audio frame processing for keyword detection
CN103971681A (zh) 一种语音识别方法及系统
CN107464565A (zh) 一种远场语音唤醒方法及设备
CN106782519A (zh) 一种机器人
CN110364156A (zh) 语音交互方法、系统、终端及可读存储介质
CN111192590B (zh) 语音唤醒方法、装置、设备及存储介质
CN111599371A (zh) 语音增加方法、系统、装置及存储介质
CN113053368A (zh) 语音增强方法、电子设备和存储介质
JP2018524620A (ja) 音声の発生位置を特定するための方法及び端末デバイス
CN111323783A (zh) 场景识别方法、装置、存储介质及电子设备
CN110517677B (zh) 语音处理系统、方法、设备、语音识别系统及存储介质
CN110473542B (zh) 语音指令执行功能的唤醒方法、装置及电子设备
CN110992953A (zh) 一种语音数据处理方法、装置、系统及存储介质
CN110248401B (zh) WiFi的扫描控制方法、装置、存储介质及移动终端
CN106302974A (zh) 一种信息处理的方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211

RJ01 Rejection of invention patent application after publication