CN107316651B - 基于麦克风的音频处理方法和装置 - Google Patents

基于麦克风的音频处理方法和装置 Download PDF

Info

Publication number
CN107316651B
CN107316651B CN201710539306.8A CN201710539306A CN107316651B CN 107316651 B CN107316651 B CN 107316651B CN 201710539306 A CN201710539306 A CN 201710539306A CN 107316651 B CN107316651 B CN 107316651B
Authority
CN
China
Prior art keywords
audio
microphone
determining
energy
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710539306.8A
Other languages
English (en)
Other versions
CN107316651A (zh
Inventor
黄大伟
李虹辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruizhi Technology Co Ltd
Original Assignee
Beijing Ruizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=60180103&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN107316651(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Beijing Ruizhi Technology Co Ltd filed Critical Beijing Ruizhi Technology Co Ltd
Priority to CN201710539306.8A priority Critical patent/CN107316651B/zh
Publication of CN107316651A publication Critical patent/CN107316651A/zh
Application granted granted Critical
Publication of CN107316651B publication Critical patent/CN107316651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Abstract

本发明提供一种基于麦克风的音频处理方法和装置,其中,该方法包括:获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频。在多个麦克风同时分别采集音频时,对多个麦克风在同一时间内所采集的音频分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,可以对待进行音频处理的音频进行播放、语音识别等处理。

Description

基于麦克风的音频处理方法和装置
技术领域
本发明涉及麦克风技术领域,尤其涉及一种基于麦克风的音频处理方法和装置。
背景技术
在各类会议以及影视节目中,常常会需要使用到麦克风,麦克风可以收集声音。进而在各类会议以及影视节目中,可以将通过麦克风采集到的声音,进行播放或者进行语音识别等等处理。
现有技术中,每一个用户可以单独持有一个麦克风,每一个麦克风采集各自的音频,进而将一个麦克风采集的音频单独生成一路音频。从而可以区分出音频是来自哪一个麦克风,以及哪一个用户的。
然而现有技术中,由于麦克风都会同时开着进行收音,当麦克风与其他麦克风距离比较近的时候,当前麦克风需要采集的声音也会进入到其他麦克风中,会造成串音现象,即发音人A对着麦克风1说话时,发音人B的麦克风2也能收到发声人A的声音。从而会造成一个用户在说话,但是多个麦克风都会采集到音频,造成后续接收到的多个麦克风所采集的音频,进而播放出的音频是具有多路声音的,并且不便于对具有多路声音的音频进行语音识别等。
发明内容
本发明提供一种基于麦克风的音频处理方法和装置,用以解决现有技术中串音的时候,多个麦克风都会采集到音频,播放出的音频是具有多路声音的,并且不便于对具有多路声音的音频进行语音识别的问题。
本发明的一方面是提供一种基于麦克风的音频处理方法,包括:
获取每一个麦克风在同一时间内所采集的音频;
根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;
确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
进一步地,每一个麦克风的灵敏度相同,所述音频变化量为音频能量变化量,所述预设范围为最大的音频能量变化量;
所述根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量,包括:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的差值,得到每一个麦克风所采集的音频的所述音频能量变化量。
进一步地,每一个麦克风的灵敏度不同,所述音频变化量为音频能量比例量,所述预设范围为最大的音频能量比例量;
所述根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量,包括:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的比例值,得到每一个麦克风所采集的音频的所述音频能量比例量。
进一步地,所述确定音频变化量属于预设范围的音频,为待进行音频处理的音频,包括:
确定音频变化量属于预设范围的音频的个数是否唯一;
若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频;
若唯一,则确定音频变化量属于预设范围的音频,为所述待进行音频处理的音频。
进一步地,所述确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频,包括:
确定优先级最高的麦克风的个数是否唯一;
若不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为所述待进行音频处理的音频;
若唯一,确定优先级最高的麦克风所采集的音频,为所述待进行音频处理的音频。
进一步地,在所述确定音频变化量属于预设范围的音频,为待进行音频处理的音频之后,还包括:
对所述待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息;
或者,
只播放所述待进行音频处理的音频。
本发明的另一方面是提供一种基于麦克风的音频处理装置,包括:
获取模块,用于获取每一个麦克风在同一时间内所采集的音频;
分析模块,用于根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;
确定模块,用于确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
进一步地,每一个麦克风的灵敏度相同,所述音频变化量为音频能量变化量,所述预设范围为最大的音频能量变化量;
所述分析模块,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的差值,得到每一个麦克风所采集的音频的所述音频能量变化量。
进一步地,每一个麦克风的灵敏度不同,所述音频变化量为音频能量比例量,所述预设范围为最大的音频能量比例量;
所述分析模块,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的比例值,得到每一个麦克风所采集的音频的所述音频能量比例量。
进一步地,所述确定模块,包括:
判断子模块,用于确定音频变化量属于预设范围的音频的个数是否唯一;
第一确定子模块,用于若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频;
第二确定子模块,用于若唯一,则确定音频变化量属于预设范围的音频,为所述待进行音频处理的音频。
进一步地,所述第一确定子模块,具体用于:
若音频变化量属于预设范围的音频的个数不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风的个数是否唯一;
若优先级最高的麦克风的个数不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为所述待进行音频处理的音频;
若优先级最高的麦克风的个数唯一,确定优先级最高的麦克风所采集的音频,为所述待进行音频处理的音频。
进一步地,所述装置,还包括:
处理模块,用于在所述确定模块确定音频变化量属于预设范围的音频,为待进行音频处理的音频之后,对所述待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息,或者,只播放所述待进行音频处理的音频。
本发明的技术效果是:通过获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频。在多个麦克风同时分别采集音频的时候,可以对多个麦克风在同一时间内所采集的音频进行分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,去确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,然后可以对待进行音频处理的音频进行播放、语音识别等处理。并且,本实施例提供的方法也不需要调低麦克风的灵敏度,因为调低麦克风的灵敏度虽然可以在一定程度上减少串音,但是会使麦克风的收音距离变短,使得收音效果变差,从而本实施例提供的方法不会影响麦克风的收音效果,不影响语音采集质量。
附图说明
图1为本发明实施例一提供的基于麦克风的音频处理方法的流程图;
图2为本发明实施例二提供的基于麦克风的音频处理方法的流程图;
图3为本发明实施例三提供的基于麦克风的音频处理装置的结构示意图
图4为本发明实施例四提供的基于麦克风的音频处理装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的基于麦克风的音频处理方法的流程图,如图1所示,本实施例的方法,包括:
步骤101、获取每一个麦克风在同一时间内所采集的音频。
在本实施例中,具体的,执行主体可以为处理器、控制器或者其他可以执行本实施例方法的装置或设备等等。
在各类会议中,针对参与会议的每一个用户会分别提供一个麦克风,每一个麦克风分别采集音频。或者,在影视节目中,针对参与节目录制的每一个用户会分别提供一个麦克风,每一个麦克风分别采集音频。或者,在庭审现场中,针对参与庭审的每一个用户会分别提供一个麦克风,每一个麦克风分别采集音频。在以上各场景中,每一个麦克风需要单独采集音频。
然后可以去获取到每一个麦克风在同一时间内所采集的音频。
举例来说,在一个会议中,有5个需要发言的用户,用户A使用麦克风1,用户B使用麦克风2,用户C使用麦克风3,用户D使用麦克风4,用户E使用麦克风5;进而麦克风1、2、3、4、5实时的分别采集音频,可以获取到麦克风1、2、3、4、5实时的分别采集的音频。
步骤102、根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量。
在本实施例中,具体的,针对每一个麦克风,对一个麦克风所采集的音频进行计算,得到该麦克风所采集的音频的音频变化量。例如,音频变化量可以为音频能量变化量、音频能量比例量、音频音量变化量等等。
步骤103、确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
在本实施例中,具体的,对各麦克风所采集的音频的音频变化量进行分析,确定出音频变化量属于预设范围的音频,然后将该音频作为待进行音频处理的音频。例如,音频变化量为音频能量变化量时,则确定出音频能量变化量最大的音频;音频变化量为音频能量比例量时,则确定出音频能量比例量最大的音频。
本实施例通过获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频。在多个麦克风同时分别采集音频的时候,可以对多个麦克风在同一时间内所采集的音频进行分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,去确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,然后可以对待进行音频处理的音频进行播放、语音识别等处理。并且,本实施例提供的方法也不需要调低麦克风的灵敏度,因为调低麦克风的灵敏度虽然可以在一定程度上减少串音,但是会使麦克风的收音距离变短,使得收音效果变差,从而本实施例提供的方法不会影响麦克风的收音效果,不影响语音采集质量。
图2为本发明实施例二提供的基于麦克风的音频处理方法的流程图,如图2所示,本实施例的方法,包括:
步骤201、获取每一个麦克风在同一时间内所采集的音频。
在本实施例中,具体的,可以参见图1的步骤101,不再赘述。
步骤202、根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量。
步骤202包括了以下几种实现方式。
第一种实现方式:每一个麦克风的灵敏度相同,音频变化量为音频能量变化量;确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;确定每一个麦克风的第二音频能量与第一音频能量的差值,得到每一个麦克风所采集的音频的音频能量变化量。
第二种实现方式:每一个麦克风的灵敏度不同,音频变化量为音频能量比例量;确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;确定每一个麦克风的第二音频能量与第一音频能量的比例值,得到每一个麦克风所采集的音频的音频能量比例量。
在本实施例中,具体的,针对每一个麦克风,对一个麦克风所采集的音频进行计算,得到该麦克风所采集的音频的音频变化量。
在一种实现方式中,麦克风的规格、型号相同,从而每一个麦克风的灵敏度相同,或者,将麦克风的灵敏度调成相同的数值,从而每一个麦克风的灵敏度相同。针对每一个麦克风,首先确定出麦克风还没有采集音频时的第一音频能量,这个时候,因为麦克风还没有采集到音频,直接根据麦克风开着的时候所采集的声音去计算第一音频能量;然后,在麦克风拾音过程中,实时计算麦克风所采集的音频的第二音频能量。其中,计算音频能量的时候,采用计算声波的平均能流密度的方式计算出音频能量,具体来说是用单位时间流经某处单位面积介质的能量的平均值的多少,来表示这个地方声音的能量。然后,针对每一个麦克风,可以将第二音频能量减去第一音频能量,得到第二音频能量与第一音频能量的差值,将该差值作为麦克风所采集的音频的音频能量变化量。
在另一种实现方式中,麦克风的规格、型号不同,从而每一个麦克风的灵敏度不同。针对每一个麦克风,首先确定出麦克风还没有采集音频时的第一音频能量,这个时候,因为麦克风还没有采集到音频,直接根据麦克风开着的时候所采集的声音去计算第一音频能量;然后,在麦克风拾音过程中,实时计算麦克风所采集的音频的第二音频能量。其中,计算音频能量的时候,采用计算声波的平均能流密度的方式计算出音频能量,具体来说是用单位时间流经某处单位面积介质的能量的平均值的多少,来表示这个地方声音的能量。然后,针对每一个麦克风,可以将第二音频能量除以第一音频能量,得到第二音频能量与第一音频能量的比例值,将该比例值作为麦克风所采集的音频的音频能量比例量。
步骤203、确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
其中,在音频变化量为音频能量变化量时,预设范围为最大的音频能量变化量;在音频变化量为音频能量比例量时,预设范围为最大的音频能量比例量。
步骤203包括:
步骤2031、确定音频变化量属于预设范围的音频的个数是否唯一;
步骤2032、若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为待进行音频处理的音频;
其中,步骤2032中,确定优先级最高的麦克风所采集的音频为待进行音频处理的音频,包括:确定优先级最高的麦克风的个数是否唯一;若不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为待进行音频处理的音频;若唯一,确定优先级最高的麦克风所采集的音频,为待进行音频处理的音频。
步骤2033、若唯一,则确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
在本实施例中,具体的,在一种实现方式中,在音频变化量为音频能量变化量时,预设范围为最大的音频能量变化量;因为在发生串音的时候,正对着麦克风说话的发音人,其对应的麦克风里的声音能量必定变化最大,而其它麦克风声音能量变化则较小;从而,可以选择出音频能量变化量最大的音频,确定该音频为有效的音频数据,即为待进行音频处理的音频。在这种实现方式中,具体来说,首先判断音频能量变化量最大的音频的个数是否只有一个;如果音频能量变化量最大的音频的个数是一个,则直接将该音频作为待进行音频处理的音频;如果音频能量变化量最大的音频的个数有多个,因为已经为每一个麦克风分配了优先级,那么可以查询下音频能量变化量最大的各音频分别一一对应的麦克风的优先级,然后判断优先级最高的麦克风的个数是否唯一;若优先级最高的麦克风的个数是一个,那么就可以直接将优先级最高的麦克风所采集的音频,作为待进行音频处理的音频;如果优先级最高的麦克风的个数有多个,因为已经为具有相同优先级的麦克风进行排序,那么需要查询优先级最高的各麦克风的排序,然后将排序第一的麦克风所采集的音频作为待进行音频处理的音频。
在另一种实现方式中,在音频变化量为音频能量比例量时,预设范围为最大的音频能量比例量。从而,可以选择出音频能量比例量最大的音频,确定该音频为有效的音频数据,即为待进行音频处理的音频。在这种实现方式中,具体来说,首先判断音频能量比例量最大的音频的个数是否只有一个;如果音频能量比例量最大的音频的个数是一个,则直接将该音频作为待进行音频处理的音频;如果音频能量比例量最大的音频的个数有多个,因为已经为每一个麦克风分配了优先级,那么可以查询下音频能量比例量最大的各音频分别一一对应的麦克风的优先级,然后判断优先级最高的麦克风的个数是否唯一;若优先级最高的麦克风的个数是一个,那么就可以直接将优先级最高的麦克风所采集的音频,作为待进行音频处理的音频;如果优先级最高的麦克风的个数有多个,因为已经为具有相同优先级的麦克风进行排序,那么需要查询优先级最高的各麦克风的排序,然后将排序第一的麦克风所采集的音频作为待进行音频处理的音频。
举例来说,麦克风1实时的采集到音频a,麦克风2实时的采集到音频b,麦克风3实时的采集到音频c,麦克风4实时的采集到音频d,麦克风5实时的采集到音频e;然后计算出了音频a的音频能量变化量、音频b的音频能量变化量、音频c的音频能量变化量、音频d的音频能量变化量、音频e的音频能量变化量。然后如果确定各音频能量变化量中最大的音频能量变化量,是音频a的音频能量变化量,那么可以确定麦克风1实时的采集到音频a,为待进行音频处理的音频。如果确定各音频能量变化量中最大的音频能量变化量,是音频a的音频能量变化量、音频b的音频能量变化量、音频c的音频能量变化量,因为它们3个的变化量相同、且大于其他的音频能量变化量;因为已经为每一个麦克风分配了优先级,例如,第一优先级包括了麦克风1和麦克风2,第一优先级表征为当前麦克风为被分配给领导的麦克风,第二优先级包括了麦克风3和麦克风4,第二优先级表征为当前麦克风为被分配给主持人的麦克风,第三优先级包括了麦克风5,第三优先级表征为当前麦克风为被分配给其他参与会议人员的麦克风;则可以优先级最高的麦克风有麦克风1和麦克风2;然后,已经为第一优先级包括了麦克风1和麦克风2进行排序,麦克风2的次序大于麦克风1的次序,那么就可以将麦克风2采集的音频b作为待进行音频处理的音频。
步骤204、对待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息;或者,只播放待进行音频处理的音频。
在本实施例中,具体的,确定出了待进行音频处理的音频之后,就可以认为该音频为正在发言的人所发出的声音,然后屏蔽到不与该待进行音频处理的音频对应的麦克风所采集到的音频,只播放该待进行音频处理的音频。
或者,确定出了待进行音频处理的音频之后,就可以认为该音频为正在发言的人所发出的声音,然后对该待进行音频处理的音频进行语音识别处理,得到语音信息,然后保存或播放该语音信息;或,进行语音识别处理之后得到文字信息,在大屏幕上显示文字信息;或进行语音识别处理之后得到语音信息和文字信息,然后保存语音信息和文字信息,或显示语音信息和文字信息。
本实施例通过获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频;其中,音频变化量为音频能量变化量或音频能量比例量。在多个麦克风同时分别采集音频的时候,可以对多个麦克风在同一时间内所采集的音频进行分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,去确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,然后可以对待进行音频处理的音频进行播放、语音识别等处理。并且,本实施例提供的方法也不需要调低麦克风的灵敏度,因为调低麦克风的灵敏度虽然可以在一定程度上减少串音,但是会使麦克风的收音距离变短,使得收音效果变差,从而本实施例提供的方法不会影响麦克风的收音效果,不影响语音采集质量。并且可以对待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息。
图3为本发明实施例三提供的基于麦克风的音频处理装置的结构示意图,如图3所示,本实施例的装置,包括:
获取模块31,用于获取每一个麦克风在同一时间内所采集的音频;
分析模块32,用于根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;
确定模块33,用于确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
本实施例提供的基于麦克风的音频处理装置可执行本发明实施例一提供的基于麦克风的音频处理方法,其实现原理相类似,此处不再赘述。
本实施例通过获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频。在多个麦克风同时分别采集音频的时候,可以对多个麦克风在同一时间内所采集的音频进行分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,去确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,然后可以对待进行音频处理的音频进行播放、语音识别等处理。并且,本实施例提供的方法也不需要调低麦克风的灵敏度,因为调低麦克风的灵敏度虽然可以在一定程度上减少串音,但是会使麦克风的收音距离变短,使得收音效果变差,从而本实施例提供的方法不会影响麦克风的收音效果,不影响语音采集质量。
图4为本发明实施例四提供的基于麦克风的音频处理装置的结构示意图,在实施例三的基础上,如图4所示,本实施例的装置,每一个麦克风的灵敏度相同,音频变化量为音频能量变化量,预设范围为最大的音频能量变化量;分析模块32,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的第二音频能量与第一音频能量的差值,得到每一个麦克风所采集的音频的音频能量变化量。
或者,每一个麦克风的灵敏度不同,音频变化量为音频能量比例量,预设范围为最大的音频能量比例量;分析模块32,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的第二音频能量与第一音频能量的比例值,得到每一个麦克风所采集的音频的音频能量比例量。
确定模块33,包括:
判断子模块331,用于确定音频变化量属于预设范围的音频的个数是否唯一;
第一确定子模块332,用于若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为待进行音频处理的音频;
第二确定子模块333,用于若唯一,则确定音频变化量属于预设范围的音频,为待进行音频处理的音频。
其中,第一确定子模块332,具体用于:
若音频变化量属于预设范围的音频的个数不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风的个数是否唯一;
若优先级最高的麦克风的个数不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为待进行音频处理的音频;
若优先级最高的麦克风的个数唯一,确定优先级最高的麦克风所采集的音频,为待进行音频处理的音频。
本实施例提供的装置,还包括:
处理模块41,用于在确定模块33确定音频变化量属于预设范围的音频,为待进行音频处理的音频之后,对待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息,或者,只播放待进行音频处理的音频。
本实施例提供的基于麦克风的音频处理装置可执行本发明实施例二提供的基于麦克风的音频处理方法,其实现原理相类似,此处不再赘述。
本实施例通过获取每一个麦克风在同一时间内所采集的音频;根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;确定音频变化量属于预设范围的音频,为待进行音频处理的音频;其中,音频变化量为音频能量变化量或音频能量比例量。在多个麦克风同时分别采集音频的时候,可以对多个麦克风在同一时间内所采集的音频进行分析,确定出后续需要进行处理的音频,进而提取出一路音频;从而在多个麦克风同时开着进行收音的时候,麦克风发生串音时,对多个麦克风所采集的音频进行分析,去确定出哪一个是当前需要收音的麦克风所采集的音频,该音频为待进行音频处理的音频,然后可以对待进行音频处理的音频进行播放、语音识别等处理。并且,本实施例提供的方法也不需要调低麦克风的灵敏度,因为调低麦克风的灵敏度虽然可以在一定程度上减少串音,但是会使麦克风的收音距离变短,使得收音效果变差,从而本实施例提供的方法不会影响麦克风的收音效果,不影响语音采集质量。并且可以对待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于麦克风的音频处理方法,其特征在于,包括:
获取每一个麦克风在同一时间内所采集的音频;
根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;
确定音频变化量属于预设范围的音频,为待进行音频处理的音频;
其中,每一个麦克风的灵敏度相同,所述音频变化量为音频能量变化量,所述预设范围为音频能量变化量最大;或者,每一个麦克风的灵敏度不同,所述音频变化量为音频能量比例量,所述预设范围为音频能量比例量最大。
2.根据权利要求1所述的方法,其特征在于,在每一个麦克风的灵敏度相同、所述音频变化量为音频能量变化量、所述预设范围为音频能量变化量最大时;
所述根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量,包括:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的差值,得到每一个麦克风所采集的音频的所述音频能量变化量。
3.根据权利要求1所述的方法,其特征在于,在每一个麦克风的灵敏度不同、所述音频变化量为音频能量比例量、所述预设范围为音频能量比例量最大时;
所述根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量,包括:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的比例值,得到每一个麦克风所采集的音频的所述音频能量比例量。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述确定音频变化量属于预设范围的音频,为待进行音频处理的音频,包括:
确定音频变化量属于预设范围的音频的个数是否唯一;
若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频;
若唯一,则确定音频变化量属于预设范围的音频,为所述待进行音频处理的音频。
5.根据权利要求4所述的方法,其特征在于,所述确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频,包括:
确定优先级最高的麦克风的个数是否唯一;
若不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为所述待进行音频处理的音频;
若唯一,确定优先级最高的麦克风所采集的音频,为所述待进行音频处理的音频。
6.根据权利要求1-3任一项所述的方法,其特征在于,在所述确定音频变化量属于预设范围的音频,为待进行音频处理的音频之后,还包括:
对所述待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息;
或者,
只播放所述待进行音频处理的音频。
7.一种基于麦克风的音频处理装置,其特征在于,包括:
获取模块,用于获取每一个麦克风在同一时间内所采集的音频;
分析模块,用于根据每一个麦克风在同一时间内所采集的音频,分别确定每一个麦克风所采集的音频的音频变化量;
确定模块,用于确定音频变化量属于预设范围的音频,为待进行音频处理的音频;
其中,每一个麦克风的灵敏度相同,所述音频变化量为音频能量变化量,所述预设范围为音频能量变化量最大;或者,每一个麦克风的灵敏度不同,所述音频变化量为音频能量比例量,所述预设范围为音频能量比例量最大。
8.根据权利要求7所述的装置,其特征在于,在每一个麦克风的灵敏度相同、所述音频变化量为音频能量变化量、所述预设范围为音频能量变化量最大时,所述分析模块,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的差值,得到每一个麦克风所采集的音频的所述音频能量变化量;
或者,在每一个麦克风的灵敏度不同、所述音频变化量为音频能量比例量、所述预设范围为音频能量比例量最大时;所述分析模块,具体用于:
确定每一个麦克风未采集音频时的第一音频能量,并在拾音过程中实时计算每一个麦克风所采集的音频的第二音频能量;
确定每一个麦克风的所述第二音频能量与所述第一音频能量的比例值,得到每一个麦克风所采集的音频的所述音频能量比例量。
9.根据权利要求7或8所述的装置,其特征在于,所述确定模块,包括:
判断子模块,用于确定音频变化量属于预设范围的音频的个数是否唯一;
第一确定子模块,用于若不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风所采集的音频为所述待进行音频处理的音频;
第二确定子模块,用于若唯一,则确定音频变化量属于预设范围的音频,为所述待进行音频处理的音频;
其中,所述第一确定子模块,具体用于:
若音频变化量属于预设范围的音频的个数不唯一,则根据音频变化量属于预设范围的各音频分别一一对应的麦克风的优先级,确定优先级最高的麦克风的个数是否唯一;
若优先级最高的麦克风的个数不唯一,则根据优先级最高的各麦克风的排序,确定排序第一的麦克风所采集的音频为所述待进行音频处理的音频;
若优先级最高的麦克风的个数唯一,确定优先级最高的麦克风所采集的音频,为所述待进行音频处理的音频。
10.根据权利要求7或8所述的装置,其特征在于,所述装置,还包括:
处理模块,用于在所述确定模块确定音频变化量属于预设范围的音频,为待进行音频处理的音频之后,对所述待进行音频处理的音频进行语音识别处理,得到语音信息和/或文字信息,或者,只播放所述待进行音频处理的音频。
CN201710539306.8A 2017-07-04 2017-07-04 基于麦克风的音频处理方法和装置 Active CN107316651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710539306.8A CN107316651B (zh) 2017-07-04 2017-07-04 基于麦克风的音频处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710539306.8A CN107316651B (zh) 2017-07-04 2017-07-04 基于麦克风的音频处理方法和装置

Publications (2)

Publication Number Publication Date
CN107316651A CN107316651A (zh) 2017-11-03
CN107316651B true CN107316651B (zh) 2020-03-31

Family

ID=60180103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710539306.8A Active CN107316651B (zh) 2017-07-04 2017-07-04 基于麦克风的音频处理方法和装置

Country Status (1)

Country Link
CN (1) CN107316651B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818793A (zh) * 2017-11-07 2018-03-20 北京云知声信息技术有限公司 一种可减少无用语音识别的语音采集处理方法及装置
CN108182948B (zh) * 2017-11-20 2021-08-20 云知声智能科技股份有限公司 可提高语音识别率的语音采集处理方法及装置
CN109994121A (zh) * 2017-12-29 2019-07-09 阿里巴巴集团控股有限公司 消除音频串扰的系统、方法和计算机存储介质
CN109994122B (zh) * 2017-12-29 2023-10-31 阿里巴巴集团控股有限公司 语音数据的处理方法、装置、设备、介质和系统
CN110718237B (zh) 2018-07-12 2023-08-18 阿里巴巴集团控股有限公司 串音数据检测方法和电子设备
CN110718238B (zh) * 2018-07-12 2023-08-18 阿里巴巴集团控股有限公司 串音数据检测方法、客户端和电子设备
CN109639443A (zh) * 2018-11-19 2019-04-16 安徽咪鼠科技有限公司 一种智能麦克风会议系统
CN111128169A (zh) * 2019-12-30 2020-05-08 云知声智能科技股份有限公司 语音唤醒方法及装置
CN112151036B (zh) * 2020-09-16 2021-07-30 科大讯飞(苏州)科技有限公司 基于多拾音场景的防串音方法、装置以及设备
CN112581941A (zh) * 2020-11-17 2021-03-30 北京百度网讯科技有限公司 音频识别方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1120965A (zh) * 1994-05-13 1996-04-24 松下电器产业株式会社 游戏装置,声音选择装置,声音识别装置和声音反应装置
JP2005227511A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 対象音検出方法、音信号処理装置、音声認識装置及びプログラム
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
CN106409309A (zh) * 2016-10-21 2017-02-15 深圳市音络科技有限公司 一种音质增强的方法和麦克风
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5706782B2 (ja) * 2010-08-17 2015-04-22 本田技研工業株式会社 音源分離装置及び音源分離方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1120965A (zh) * 1994-05-13 1996-04-24 松下电器产业株式会社 游戏装置,声音选择装置,声音识别装置和声音反应装置
JP2005227511A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 対象音検出方法、音信号処理装置、音声認識装置及びプログラム
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
CN106409309A (zh) * 2016-10-21 2017-02-15 深圳市音络科技有限公司 一种音质增强的方法和麦克风
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统

Also Published As

Publication number Publication date
CN107316651A (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
CN107316651B (zh) 基于麦克风的音频处理方法和装置
CN103957359B (zh) 摄像装置及其对焦方法
CN107910014B (zh) 回声消除的测试方法、装置及测试设备
JP2018156044A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN110970057A (zh) 一种声音处理方法、装置与设备
US20140241702A1 (en) Dynamic audio perspective change during video playback
CN104916288B (zh) 一种音频中人声突出处理的方法及装置
US9165182B2 (en) Method and apparatus for using face detection information to improve speaker segmentation
CN113676592B (zh) 录音方法、装置、电子设备及计算机可读介质
CN107820037A (zh) 音频信号、图像处理的方法、装置和系统
CN110223677A (zh) 空间音频信号滤波
JP2010112995A (ja) 通話音声処理装置、通話音声処理方法およびプログラム
JP2003270034A (ja) 音情報解析方法、装置、プログラム、および記録媒体
CN112165591B (zh) 一种音频数据的处理方法、装置及电子设备
CN111199751B (zh) 一种麦克风的屏蔽方法、装置和电子设备
CN113225646A (zh) 音视频监控方法、装置、电子设备及存储介质
CN104469250B (zh) 一种信息处理方法及电子设备
CN115410593A (zh) 音频信道的选择方法、装置、设备及存储介质
CN112735455A (zh) 声音信息的处理方法和装置
CN110197663B (zh) 一种控制方法、装置及电子设备
CN113542466A (zh) 音频处理方法、电子设备及存储介质
KR101892268B1 (ko) 영상 회의 시 단말기를 제어하기 위한 방법, 장치 및 기록 매체
CN112653979A (zh) 自适应去混响方法和装置
CN112584225A (zh) 视频录制处理方法、视频播放控制方法及电子设备
CN113470673A (zh) 数据处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
IP01 Partial invalidation of patent right

Commission number: 4W111275

Conclusion of examination: The patent shall continue to be valid on the basis of claims 1-7 submitted by the patentee on December 31, 2020

Decision date of declaring invalidation: 20210507

Decision number of declaring invalidation: 49612

Denomination of invention: Microphone based audio processing method and device

Granted publication date: 20200331

Patentee: BEIJING ZHONGRUIZHI TECHNOLOGY CO.,LTD.

IP01 Partial invalidation of patent right