CN108182948A - 可提高语音识别率的语音采集处理方法及装置 - Google Patents

可提高语音识别率的语音采集处理方法及装置 Download PDF

Info

Publication number
CN108182948A
CN108182948A CN201711160902.1A CN201711160902A CN108182948A CN 108182948 A CN108182948 A CN 108182948A CN 201711160902 A CN201711160902 A CN 201711160902A CN 108182948 A CN108182948 A CN 108182948A
Authority
CN
China
Prior art keywords
voice
voice acquisition
speech information
current speech
intensity value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711160902.1A
Other languages
English (en)
Other versions
CN108182948B (zh
Inventor
平颖洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201711160902.1A priority Critical patent/CN108182948B/zh
Publication of CN108182948A publication Critical patent/CN108182948A/zh
Application granted granted Critical
Publication of CN108182948B publication Critical patent/CN108182948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Abstract

本发明是关于一种可提高语音识别率的语音采集处理方法及装置,其中,方法包括:通过多个语音采集装置采集当前语音信息;实时分析多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;根据分析结果从多个语音采集装置中选择出强度值最高的目标语音采集装置;将目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。通过该技术方案,在用户移动过程中实时确定目标语音采集装置,对目标语音采集装置的强度值进行增强,对其他目标语音采集装置的强度值进行减弱,从而使得在对语音信息进行语音识别时,减少其他目标语音采集装置的噪声干扰,提高语音识别的准确率。

Description

可提高语音识别率的语音采集处理方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种可提高语音识别率的语音采集处理方法及装置。
背景技术
相关技术中,空间中放置分散在各处的多个麦克风。如果一个人在空间中来回走,那么这个人的语音会被这些麦克风采集到,不同距离的麦克风采集到的语音强弱不同,这个时候,系统要识别这个人的语音,有两种方式:一种为只识别一个麦克风的语音,缺点为这个麦克无法采集到全部有效的语音。另一种为识别每个麦克风的语音,缺点为干扰比较多,不能确定以哪个麦克风的结果为准。
发明内容
本发明实施例提供一种可提高语音识别率的语音采集处理方法及装置,用以实现动态确定语音采集装置,以在进行语音识别时提高语音识别的准确率。
根据本发明实施例的第一方面,提供一种可提高语音识别率的语音采集处理方法,包括:
通过多个语音采集装置采集当前语音信息;
实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置;
将所述目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
在该实施例中,在通过多个语音采集装置采集语音的过程中,实时分析每个语音采集装置采集的当前语音信息的强度值,进而确定出强度值最高的目标语音采集装置,从而增强该目标语音采集装置采集的当前语音信息的强度值,而减弱其他语音采集装置采集的当前语音信息的强度值。由于是实时分析并确定目标语音采集装置,因此,目标语音采集装置的选择是动态的,这样,可以在用户移动的过程中不断变换目标语音采集装置,对目标语音采集装置的强度值进行增强,对其他目标语音采集装置的强度值进行减弱,从而使得在对语音信息进行语音识别时,减少其他目标语音采集装置的噪声干扰,提高语音识别的准确率。
在一个实施例中,所述实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值,包括:
实时计算每个语音采集装置所采集的当前语音信息的强度值与所述多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
在该实施例中,可以实时分析每个语音采集装置所采集的当前语音信息的强度值,计算每个语音采集装置所采集的当前语音信息的强度值与多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。具体的算法可以是,计算每个语音采集装置所采集的当前语音信息的短时能量与其他所有语音采集装置所采集的当前语音信息的短时能量总和之间的差距值,进而根据该差距值确定目标语音采集装置。
在一个实施例中,所述根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置,包括:
从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置;
将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。
在该实施例中,差距值最大且差距值大于零,则说明该语音采集装置采集的当前语音信息的强度值最大,因此,确定其为目标语音采集装置,进而增强其强度值,从而使得在进行语音识别时,将该语音采集装置采集的当前语音信息作为主要识别依据。
在一个实施例中,所述将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理,包括:
计算所述其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
将所述差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
在该实施例中,为避免除目标语音采集装置外的其他语音采集装置对语音识别造成干扰,可以减小其采集的当前语音信息的强度值,具体减弱算法可以是计算其他语音采集装置中每个语音采集装置采集的第二当前语音信息的第二强度值减去预设强度阈值,进而得到对应的新的强度值。
在一个实施例中,所述预设强度阈值包括以下任一项:
所述多个语音采集装置对应的当前语音信息的强度值的算数和均值,所述多个语音采集装置对应的当前语音信息的强度值的能量均值。
根据本发明实施例的第二方面,提供一种可提高语音识别率的语音采集处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
通过多个语音采集装置采集当前语音信息;
实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置;
将所述目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
在一个实施例中,所述实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值,包括:
实时计算每个语音采集装置所采集的当前语音信息的强度值与所述多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
在一个实施例中,所述根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置,包括:
从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置;
将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。
在一个实施例中,所述将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理,包括:
计算所述其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
将所述差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
在一个实施例中,所述预设强度阈值包括以下任一项:
所述多个语音采集装置对应的当前语音信息的强度值的算数和均值,所述多个语音采集装置对应的当前语音信息的强度值的能量均值。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种可提高语音识别率的语音采集处理方法的流程图。
图2是根据一示例性实施例示出的另一种可提高语音识别率的语音采集处理方法的流程图。
图3是根据一示例性实施例示出的一种可提高语音识别率的语音采集处理方法中步骤S104的流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种可提高语音识别率的语音采集处理方法的流程图。该可提高语音识别率的语音采集处理方法可以应用于语音识别设备中或具有语音识别功能的终端设备等,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音识别功能的设备。如图1所示,该方法包括步骤S101-S104:
在步骤S101中,通过多个语音采集装置采集当前语音信息;
在步骤S102中,实时分析多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
在步骤S103中,根据分析结果从多个语音采集装置中选择出强度值最高的目标语音采集装置;
在步骤S104中,将目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
在该实施例中,在通过多个语音采集装置采集语音的过程中,实时分析每个语音采集装置采集的当前语音信息的强度值,进而确定出强度值最高的目标语音采集装置,从而增强该目标语音采集装置采集的当前语音信息的强度值,而减弱其他语音采集装置采集的当前语音信息的强度值。由于是实时分析并确定目标语音采集装置,因此,目标语音采集装置的选择是动态的,这样,可以在用户移动的过程中不断变换目标语音采集装置,对目标语音采集装置的强度值进行增强,对其他语音采集装置的强度值进行减弱,从而使得在对语音信息进行语音识别时,减少其他语音采集装置带来的噪声干扰,提高语音识别的准确率。
图2是根据一示例性实施例示出的另一种可提高语音识别率的语音采集处理方法的流程图。
如图2所示,在一个实施例中,上述步骤S102包括步骤S201:
在步骤S201中,实时计算每个语音采集装置所采集的当前语音信息的强度值与多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
在该实施例中,可以实时分析每个语音采集装置所采集的当前语音信息的强度值,计算每个语音采集装置所采集的当前语音信息的强度值与多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。具体的算法可以是,计算每个语音采集装置所采集的当前语音信息的短时能量与其他所有语音采集装置所采集的当前语音信息的短时能量总和之间的差距值,进而根据该差距值确定目标语音采集装置。
在一个实施例中,上述步骤S103包括步骤S202-S203:
在步骤S202中,从多个语音采集装置中选取出差距值大于零且差距值最大的语音采集装置;
在步骤S203中,将差距值大于零且差距值最大的语音采集装置确定为目标语音采集装置。
在该实施例中,差距值最大且差距值大于零,则说明该语音采集装置采集的当前语音信息的强度值最大,即可看作该语音采集装置采集的当前语音信息的短时能量最大,因此,确定其为目标语音采集装置,进而增强其强度值,从而使得在进行语音识别时,将该语音采集装置采集的当前语音信息作为主要识别依据。
例如,通过4个语音采集装置采集当前语音信息,其中,第一个语音采集装置采集的当前语音信息的短时能量为E1,其他三个语音采集装置采集的当前语音信息的短时能量分别为E2,E3和E4,其中,短时能量的计算公式为:其中,xn(m)表示第n帧语音信号,则计算第一语音采集装置与其他三个语音采集装置对应的短时能量总和的差距值,即E1-(E2+E3+E4),其他三个语音采集装置的计算方法同上,最后将差距值最大且差距值大于零的语音采集装置确定为目标语音采集装置。
图3是根据一示例性实施例示出的一种可提高语音识别率的语音采集处理方法中步骤S104的流程图。
如图3所示,在一个实施例中,上述步骤S104包括步骤S301-S302:
在步骤S301中,计算其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
在步骤S302中,将差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
在该实施例中,为避免除目标语音采集装置外的其他语音采集装置对语音识别造成干扰,可以减小其采集的当前语音信息的强度值,具体减弱算法可以是计算其他语音采集装置中每个语音采集装置采集的第二当前语音信息的第二强度值减去预设强度阈值,进而得到对应的新的强度值。
另外,如果不采用其他语音采集装置采集的当前语音信息,还可以直接将其他语音采集装置采集的当前语音信息的强度值设置为0,从而使得每一时刻只通过一个目标语音采集装置采集用户的语音信息,避免语音识别时存在噪声干扰。
在一个实施例中,预设强度阈值包括以下任一项:
多个语音采集装置对应的当前语音信息的强度值的算数和均值,多个语音采集装置对应的当前语音信息的强度值的能量均值。
根据本发明实施例的第二方面,提供一种可提高语音识别率的语音采集处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
通过多个语音采集装置采集当前语音信息;
实时分析多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
根据分析结果从多个语音采集装置中选择出强度值最高的目标语音采集装置;
将目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
在一个实施例中,实时分析多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值,包括:
实时计算每个语音采集装置所采集的当前语音信息的强度值与多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
在一个实施例中,根据分析结果从多个语音采集装置中选择出强度值最高的目标语音采集装置,包括:
从多个语音采集装置中选取出差距值大于零且差距值最大的语音采集装置;
将差距值大于零且差距值最大的语音采集装置确定为目标语音采集装置。
在一个实施例中,将多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理,包括:
计算其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
将差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
在一个实施例中,预设强度阈值包括以下任一项:
多个语音采集装置对应的当前语音信息的强度值的算数和均值,多个语音采集装置对应的当前语音信息的强度值的能量均值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种可提高语音识别率的语音采集处理方法,其特征在于,包括:
通过多个语音采集装置采集当前语音信息;
实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置;
将所述目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
2.根据权利要求1所述的方法,其特征在于,所述实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值,包括:
实时计算每个语音采集装置所采集的当前语音信息的强度值与所述多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
3.根据权利要求2所述的方法,其特征在于,所述根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置,包括:
从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置;
将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。
4.根据权利要求1所述的方法,其特征在于,所述将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理,包括:
计算所述其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
将所述差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
5.根据权利要求4所述的方法,其特征在于,所述预设强度阈值包括以下任一项:
所述多个语音采集装置对应的当前语音信息的强度值的算数和均值,所述多个语音采集装置对应的当前语音信息的强度值的能量均值。
6.一种可提高语音识别率的语音采集处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
通过多个语音采集装置采集当前语音信息;
实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值;
根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置;
将所述目标语音采集装置采集的第一当前语音信息的第一强度值进行增强处理,将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理。
7.根据权利要求6所述的装置,其特征在于,所述实时分析所述多个语音采集装置中每个语音采集装置所采集的当前语音信息的强度值,包括:
实时计算每个语音采集装置所采集的当前语音信息的强度值与所述多个语音采集装置中其他所有语音采集装置所采集的当前语音信息的强度值总和之间的差距值。
8.根据权利要求7所述的装置,其特征在于,所述根据分析结果从所述多个语音采集装置中选择出强度值最高的目标语音采集装置,包括:
从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置;
将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。
9.根据权利要求6所述的装置,其特征在于,所述将所述多个语音采集装置中其他语音采集装置采集的第二当前语音信息的第二强度值进行减弱处理,包括:
计算所述其他语音采集装置中每个语音采集装置采集的第二当前语音信息对应的第二强度值与预设强度阈值之间的差值;
将所述差值确定为对应的语音采集装置采集的第二当前语音信息的新强度值。
10.根据权利要求9所述的装置,其特征在于,所述预设强度阈值包括以下任一项:
所述多个语音采集装置对应的当前语音信息的强度值的算数和均值,所述多个语音采集装置对应的当前语音信息的强度值的能量均值。
CN201711160902.1A 2017-11-20 2017-11-20 可提高语音识别率的语音采集处理方法及装置 Active CN108182948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711160902.1A CN108182948B (zh) 2017-11-20 2017-11-20 可提高语音识别率的语音采集处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711160902.1A CN108182948B (zh) 2017-11-20 2017-11-20 可提高语音识别率的语音采集处理方法及装置

Publications (2)

Publication Number Publication Date
CN108182948A true CN108182948A (zh) 2018-06-19
CN108182948B CN108182948B (zh) 2021-08-20

Family

ID=62545078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711160902.1A Active CN108182948B (zh) 2017-11-20 2017-11-20 可提高语音识别率的语音采集处理方法及装置

Country Status (1)

Country Link
CN (1) CN108182948B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130797B2 (en) * 2001-08-22 2006-10-31 Mitel Networks Corporation Robust talker localization in reverberant environment
CN103247294A (zh) * 2012-02-03 2013-08-14 索尼公司 信号处理设备、方法、系统和通信终端
CN104702787A (zh) * 2015-03-12 2015-06-10 深圳市欧珀通信软件有限公司 一种应用于移动终端的声音采集方法和移动终端
US9269352B2 (en) * 2013-05-13 2016-02-23 GM Global Technology Operations LLC Speech recognition with a plurality of microphones
CN105389099A (zh) * 2014-08-29 2016-03-09 三星电子株式会社 用于语音记录和回放的方法和设备
CN205726362U (zh) * 2016-04-19 2016-11-23 哈尔滨理工大学 一种双麦克风语音降噪系统
US20170078791A1 (en) * 2011-02-10 2017-03-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
US20170278515A1 (en) * 2014-06-30 2017-09-28 Samsung Electronics Co., Ltd. Operating method for microphones and electronic device supporting the same
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN107316651A (zh) * 2017-07-04 2017-11-03 北京中瑞智科技有限公司 基于麦克风的音频处理方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130797B2 (en) * 2001-08-22 2006-10-31 Mitel Networks Corporation Robust talker localization in reverberant environment
US20170078791A1 (en) * 2011-02-10 2017-03-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
CN103247294A (zh) * 2012-02-03 2013-08-14 索尼公司 信号处理设备、方法、系统和通信终端
US9269352B2 (en) * 2013-05-13 2016-02-23 GM Global Technology Operations LLC Speech recognition with a plurality of microphones
US20170278515A1 (en) * 2014-06-30 2017-09-28 Samsung Electronics Co., Ltd. Operating method for microphones and electronic device supporting the same
CN105389099A (zh) * 2014-08-29 2016-03-09 三星电子株式会社 用于语音记录和回放的方法和设备
CN104702787A (zh) * 2015-03-12 2015-06-10 深圳市欧珀通信软件有限公司 一种应用于移动终端的声音采集方法和移动终端
CN205726362U (zh) * 2016-04-19 2016-11-23 哈尔滨理工大学 一种双麦克风语音降噪系统
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN107316651A (zh) * 2017-07-04 2017-11-03 北京中瑞智科技有限公司 基于麦克风的音频处理方法和装置
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CLIMENT NADEU,等: "Channel selection measures for multi-microphone speech recognition", 《SPEECH COMMUNICATION》 *
王亚楠,等: "语音识别的无线控制家电装置", 《产业与科技论坛》 *

Also Published As

Publication number Publication date
CN108182948B (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN110082723B (zh) 一种声源定位方法、装置、设备及存储介质
US9595259B2 (en) Sound source-separating device and sound source-separating method
US20190166435A1 (en) Separating and recombining audio for intelligibility and comfort
Tian et al. Spoofing detection from a feature representation perspective
EP2828856B1 (en) Audio classification using harmonicity estimation
WO2013157254A1 (en) Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
CN108766454A (zh) 一种语音噪声抑制方法及装置
CN107305774A (zh) 语音检测方法和装置
Shahnaz et al. Pitch estimation based on a harmonic sinusoidal autocorrelation model and a time-domain matching scheme
CN105161093A (zh) 一种判断说话人数目的方法及系统
JP2022547525A (ja) 音声信号を生成するためのシステム及び方法
CN106157967A (zh) 脉冲噪声抑制
CN108877787A (zh) 语音识别方法、装置、服务器及存储介质
CN112786057B (zh) 一种声纹识别方法、装置、电子设备及存储介质
CN108877779A (zh) 用于检测语音尾点的方法和装置
CN112992190B (zh) 音频信号的处理方法、装置、电子设备和存储介质
KR102062454B1 (ko) 음악 장르 분류 장치 및 방법
RU2611973C2 (ru) Ослабление шума в сигнале
JP7000773B2 (ja) 音声処理プログラム、音声処理方法および音声処理装置
JP2015082093A (ja) 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム
CN108182948A (zh) 可提高语音识别率的语音采集处理方法及装置
CN106340310B (zh) 语音检测方法及装置
CN115223584B (zh) 音频数据处理方法、装置、设备及存储介质
CN116884427A (zh) 基于端到端深度学习语音复刻模型的嵌入向量处理方法
CN108062959B (zh) 一种声音降噪方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096

Applicant after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 12 / F, Guanjie building, building 1, No. 16, Taiyanggong Middle Road, Chaoyang District, Beijing

Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant