CN110716181A - 声音信号采集方法以及分离式麦克风阵列 - Google Patents

声音信号采集方法以及分离式麦克风阵列 Download PDF

Info

Publication number
CN110716181A
CN110716181A CN201810760110.6A CN201810760110A CN110716181A CN 110716181 A CN110716181 A CN 110716181A CN 201810760110 A CN201810760110 A CN 201810760110A CN 110716181 A CN110716181 A CN 110716181A
Authority
CN
China
Prior art keywords
sound
microphone
recording
sound source
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810760110.6A
Other languages
English (en)
Inventor
冯兆伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Macro Cloud Intelligent Technology Co Ltd
Original Assignee
Suzhou Macro Cloud Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Macro Cloud Intelligent Technology Co Ltd filed Critical Suzhou Macro Cloud Intelligent Technology Co Ltd
Priority to CN201810760110.6A priority Critical patent/CN110716181A/zh
Publication of CN110716181A publication Critical patent/CN110716181A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/28Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves by co-ordinating position lines of different shape, e.g. hyperbolic, circular, elliptical or radial
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种声音信号采集方法以及分离式麦克风阵列,该分离式麦克风阵列包括唤醒型麦克风、录音型麦克风以及控制器,控制器根据唤醒型麦克风接收到的声音信号生成声音处理信号,然后使用唤醒型麦克风获取声源位置,再然后根据声源位置确定进行声音信号采集的录音型麦克风,最后使用确定的录音型麦克风进行声音信号的采集。本发明的声音信号采集方法以及分离式麦克风阵列的两种麦克风具有不同的指向性曲线与增益,分工明确,能降低对麦克风硬件的要求,同时麦克风不需要在唤醒和录音两个工作状态中切换麦克风参数,避免了高难度的调整与切换给硬件带来的高要求。

Description

声音信号采集方法以及分离式麦克风阵列
技术领域
本发明涉及麦克风声音采集、语音降噪以及音频传输领域,特别涉及一种声音信号采集方法以及分离式麦克风阵列。
背景技术
当今语音识别,会议拾音系统已有大规模普及,尤其是在智能家居领域,语音识别功能日渐增多;
现阶段大部分方案使用固定的麦克风阵列,包括线性和环形等麦克风阵列排列方式,通过阵列上面的麦克风获取语音唤醒触发,获得声音的来源方向(称为声源定位),然后把声源定位获得的角度方位值作为主拾音麦克风的依据,使用全部麦克风同时录音作为波速成型的原始输入,获得固定角度的增强和对其他角度的环境音抑制,最终输出特别增强过唤醒源方位的语音信号,供电话会议或者语音识别。
现有技术中的麦克风阵列中的麦克风,需要在唤醒和录音的两个工作状态中切换麦克风参数,高难度的调整与切换使得对麦克风硬件要求较高,而且需要在设计之初就把麦克风设计成全能型的麦克风,要求既可以拾取远场的语音唤醒的同时,也要兼顾正常录音时的采样精度,同时因为兼顾远场和精度,需要进一步提升录音的分辨率和采样率,这样的设计对声音拾取、自动增益算法和硬件的配合提出非常高的要求。
故需要提供一种声音信号采集方法以及分离式麦克风阵列来解决上述技术问题。
发明内容
本发明提供一种声音信号采集方法以及分离式麦克风阵列,以解决现有技术中的麦克风降噪阵列对麦克风硬件信噪比要求高,其需要在唤醒和录音的两个工作状态中切换麦克风参数,对声音拾取、自动增益算法和硬件的配合的要求非常高的问题。
为解决上述技术问题,本发明提供一种分离式麦克风阵列,用于对设定空间内的声音信号进行采集,其包括:
至少三个唤醒型麦克风;
至少一个录音型麦克风组,一个所述录音型麦克风组包括多个录音型麦克风;
控制器,与所述唤醒型麦克风以及所述录音型麦克风连接,包括:
处理信号生成模块,用于当至少一个唤醒型麦克风接收到声音信号时,生成声音处理信号;
声源位置获取模块,用于根据所述声音处理信号以及声源定位方法,使用至少三个所述唤醒型麦克风获取所述声音信号对应的声源位置;以及
录音型麦克风确定模块,用于根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;以及
采集模块,用于使用确定的录音型麦克风进行所述声音信号的采集操作。
在本发明所述的分离式麦克风阵列中,所述录音型麦克风为窄角度指向性麦克风,所述录音型麦克风确定模块包括第一录音型麦克风确定部,所述第一录音型麦克风确定部用于将声音采集区域包括所述声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的第一录音型麦克风。
在本发明所述的分离式麦克风阵列中,所述录音型麦克风确定模块还包括第二录音型麦克风确定部,所述第二录音型麦克风确定部用于将其他录音型麦克风确定为进行环境音采集的第二录音型麦克风,以便使用所述环境音对所述声音信号进行降噪操作。
在本发明所述的分离式麦克风阵列中,所有的所述录音型麦克风的声音采集区域包含所述设定空间内的所有区域,不同的所述录音型麦克风的声音采集区域不重合或部分重合。
在本发明所述的分离式麦克风阵列中,所述唤醒型麦克风为高增益的全向麦克风,处理信号生成模块包括匹配音获取单元和处理信号生成单元,所述声源位置获取模块包括音量值获取单元和算法识别单元;
所述匹配音获取单元用于获得至少一个唤醒型麦克风的匹配状态,所述处理信号生成单元用于根据匹配状态生成声音处理信号;
所述音量值获取单元用于根据声音处理信号获取每个唤醒型麦克风的音量值;
所述算法识别单元用于根据音量值确定所述唤醒型麦克风与声源位置的距离值,以及根据各个距离值,使用三边定位算法获得声源位置。
在本发明所述的分离式麦克风阵列中,所述声源位置获取模块还用于根据所述声音处理信号以及声源定位方法,使用n个唤醒型麦克风获取
Figure BDA0001727679810000031
个声源预选位置,以及根据
Figure BDA0001727679810000032
个所述声源预选位置,确定所述声音信号对应的声源位置。
在本发明所述的分离式麦克风阵列中,所述算法识别单元包括第一计算部,所述第一计算部用于将任意三个唤醒型麦克风的距离值作为一个声源预选位置对应的输入参数,以获取
Figure BDA0001727679810000033
个声源预选位置对应的输入参数,并根据声源预选位置对应的输入参数输入到三边定位算法中,以获取对应的声源预选位置。
在本发明所述的分离式麦克风阵列中,所述算法识别单元还包括第二计算部,所述第二计算部用于根据
Figure BDA0001727679810000034
个所述声源预选位置,计算并获取任意两个所述声源预选位置的距离值,将所有的距离值进行比较,以距离最远的两个所述声源预选位置的连线的中点作为所述声音信号对应的声源位置。
在本发明所述的分离式麦克风阵列中,在所述设定空间内相对的两侧分别设置有一个所述录音型麦克风组,所述录音型麦克风确定模块包括:
录音型麦克风组确定单元,所述录音型麦克风组确定单元用于根据所述声音信号对应的声源位置,计算并获取声源位置分别与两个所述录音型麦克风组之间的距离,并将距离更小的一个录音型麦克风组作为进行声音信号采集的录音型麦克风组;
录音型麦克风确定单元,所述录音型麦克风确定单元用于将确定作为进行声音信号采集的录音型麦克风组中的声音采集区域包括所述声音信号对应的声源位置的一个录音型麦克风确定为进行声音信号采集的录音型麦克风。
本发明还提供一种声音信号采集方法,其通过分离式麦克风阵列对设定空间内的声音信号进行采集;
其中所述分离式麦克风阵列包括设置在所述设定空间内的至少三个唤醒型麦克风、设置在所述设定空间内的至少一个录音型麦克风组、以及与所述唤醒型麦克风和所述录音型麦克风连接的控制器;
一个所述录音型麦克风组包括多个录音型麦克风;
所述控制器包括处理信号生成模块、声源位置获取模块、录音型麦克风确定模块以及采集模块;
所述声音信号采集方法包括:
当至少一个唤醒型麦克风接收到声音信号时,所述处理信号生成模块生成声音处理信号;
声源位置获取模块根据所述声音处理信号以及声源定位方法,使用至少三个所述唤醒型麦克风获取所述声音信号对应的声源位置;
录音型麦克风确定模块根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;
采集模块使用确定的录音型麦克风进行所述声音信号的采集操作。
本发明相较于现有技术,其有益效果为:本发明的声音信号采集方法以及分离式麦克风阵列通过使用分离式的唤醒型麦克风和录音型麦克风进行声音信号的采集,两种麦克风具有不同的指向性曲线与增益,分工明确,从而能降低对麦克风硬件的要求,对麦克风的选型由之前的全能型,变成某个特点的加强型;
同时由于多个唤醒型麦克风分开安装,声源定位的方位信息更加准确,有效增加降噪参数的准确性;
另外,由于使用了两种不同用途的麦克风,从而使得麦克风不需要在唤醒和录音两个工作状态中切换麦克风参数,避免了高难度的调整与切换给硬件带来的高要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例中所需要使用的附图作简单的介绍,下面描述中的附图仅为本发明的部分实施例相应的附图。
图1为本发明的声音信号采集方法的第一优选实施例的流程图。
图2为本发明的声音信号采集方法的第二优选实施例的步骤流程图。
图3为本发明的分离式麦克风阵列的第一优选实施例的结构示意图。
图4为本发明的分离式麦克风阵列的第二优选实施例的结构示意图
图5为本发明的声音信号采集方法以及分离式麦克风阵列的第一具体实施例的结构示意图。
图6为本发明的声音信号采集方法以及分离式麦克风阵列的第一具体实施例的框架结构示意图。
图7为本发明的声音信号采集方法以及分离式麦克风阵列的第二具体实施例的框架结构示意图。
图8为本发明的声音信号采集方法以及分离式麦克风阵列的三边定位算法的示意图。
图9为本发明的声音信号采集方法以及分离式麦克风阵列的三边定位算法的解法推导示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明的原理是以实施在一适当的运算环境中来举例说明,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中的麦克风阵列方案对麦克风硬件信噪比要求高,需要在唤醒和录音的两个工作状态中切换麦克风参数,而且需要在设计之初就把麦克风设计成全能的麦克风,可以拾取远场的语音唤醒的同时,也要兼顾正常录音时的采样精度,这样的设计对声音拾取、自动增益算法和硬件的配合提出非常高的要求,而且因为兼顾远场和精度,需要进一步提升录音的分辨率和采样率。
如下为本发明提供的一种能解决以上技术问题的声音信号采集方法以及分离式麦克风阵列的第一优选实施例。
本发明的声音信号采集方法以及分离式麦克风阵列可应用于会议室、具有语音控制系统的住宅或教室等等需要对声音信号进行采集的设定空间内,可在设定空间内设置多个唤醒型麦克风和录音型麦克风,通过唤醒型麦克风对声音信号进行定位,然后再由对应的录音型麦克风针对性的进行声音采集。因此本发明的声音信号采集方法以及分离式麦克风阵列能避免麦克风高难度的调整与切换给硬件带来的高要求,能解决现有技术中的麦克风阵列方案对麦克风硬件信噪比要求高的问题。
在图中,结构相似的单元是以相同标号表示。
请参照图1,其中图1为本发明的声音信号采集方法的第一优选实施例的流程图,本优选实施例的声音信号采集方法可使用上述分离式麦克风阵列进行实施,以便该分离式麦克风阵列进行声音信号的采集;
这里的分离式麦克风阵列包括唤醒型麦克风、录音型麦克风以及控制器。
其中,至少有三个唤醒型麦克风分别位于设定空间的任意位置,用于拾取声音信号。
至少一个录音型麦克风组位于设定空间的任意位置用于采集声音信号,一个录音型麦克风组包括多个录音型麦克风。
控制器与唤醒型麦克风以及录音型麦克风连接,用于根据唤醒型麦克风的唤醒匹配状态,选择性的控制录音型麦克风进行声音信号的采集操作。
本实施例的声音信号采集方法包括:
步骤S101,当至少一个唤醒型麦克风接收到声音信号时,控制器生成声音处理信号;
步骤S102,控制器根据声音处理信号以及声源定位方法,使用至少三个唤醒型麦克风获取声音信号对应的声源位置;
步骤S103,控制器根据声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;
步骤S104,控制器使用确定的录音型麦克风进行声音信号的采集操作。
其中,在步骤S101中,声音信号可由人发出,也可由物发出,由人发出可用于采集人声以进行输出播放,或形成语音命令对相应的设备进行控制等等,由物发出可用于采集机器设备发出的声音以监测工作状态等;
当分离式麦克风阵列开启时,唤醒麦克风可始终处于开启状态,时刻对声音信号进行拾取,也可在唤醒录音型麦克风后转为休眠待机状态;
控制器可设计成根据唤醒麦克风拾取到的任意声音信号生成声音处理信号,也可以设计成根据唤醒麦克风拾取到的特定声音信号才生成声音处理信号。
在步骤S102中,声源定位方法可为但不限于利用三边定位算法;
使用至少三个唤醒型麦克风获取声音信号对应的声源位置,是由控制器根据至少三个唤醒型麦克风拾取到的声音信号对应的音量值,量化为距离值之后,再根据距离值和三边定位算法来获取声源位置;
其中,在利用三边定位算法的基础上,当仅有一个或两个唤醒型麦克风获取到声音信号,即具有非零的音量值时,则控制器无法计算获取到声源位置,需要唤醒型麦克风继续拾取声音信号;
在步骤S103中,录音型麦克风组包括的多个录音型麦克风分别具有设定的采集区域,控制器将声音信号对应的声源位置以及各录音型麦克风的采集区域进行比对,可将但不限于将采集区域包括声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的录音型麦克风。
在步骤S104中,控制器可使用确定的一个或多个录音型麦克风进行声音信号的采集操作;
其中,一个或多个录音型麦克风可采集同一声音信号,然后可对该声音信号再进行包括但不限于加强、混合等声音处理操作;
或多个录音型麦克风分别一一采集不同的声音信号,然后可对多种声音信号再进行包括但不限于混合、去除以及加强等声音处理操作。
根据上述步骤方法即可完成对声音信号的采集操作。
请参照图2,其中图2为本发明的声音信号采集方法的第二优选实施例的步骤流程图,本优选实施例的声音信号采集方法可使用上述分离式麦克风阵列进行实施,以便该分离式麦克风阵列进行声音信号的采集;
本实施例中的分离式麦克风阵列包括:唤醒型麦克风、录音型麦克风组以及控制器。
其中,多个唤醒型麦克风分别分开安装至设定空间内的任意位置,如将四个唤醒型麦克风分别安装至房屋内顶部的四角,用于拾取声音信号;
至少一个录音型麦克风组安装至设定空间内的任意位置,一个录音型麦克风组包括多个录音型麦克风,录音型麦克风用于采集声音信号;
控制器与唤醒型麦克风以及录音型麦克风连接;
本实施例的声音信号采集方法包括:
步骤S201,当至少一个唤醒型麦克风接收到声音信号时,控制器获取声音信号并对比声音信号与预设匹配音是否一致;
步骤S202,控制器生成声音处理信号;
步骤S203,控制器根据声音处理信号获取每个唤醒型麦克风的音量值
步骤S204,控制器将任意三个唤醒型麦克风的距离值作为一个声源预选位置对应的输入参数,以获取
Figure BDA0001727679810000091
个声源预选位置对应的输入参数,并根据声源预选位置对应的输入参数输入到三边定位算法中,以获取对应的声源预选位置;
步骤S205,控制器根据
Figure BDA0001727679810000092
个声源预选位置,计算并获取任意两个声源预选位置的距离值,并将所有的距离值进行比较,以距离最远的两个声源预选位置的连线的中点作为声音信号对应的声源位置;
步骤S206,控制器根据声音信号对应的声源位置,计算并获取声源位置分别与两个录音型麦克风组之间的距离,并将距离更小的一个录音型麦克风组作为进行声音信号采集的录音型麦克风组;
步骤S207,控制器将声音采集区域包括声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的第一录音型麦克风;
步骤S208,控制器将其他录音型麦克风确定为进行环境音采集的第二录音型麦克风;
步骤S209,控制器使用确定的第一录音型麦克风和第二录音型麦克风分别进行声音信号和环境音的采集操作。
下面将对各步骤进行更详细的说明。
具体的,在步骤S201以及步骤S202中,当至少一个唤醒型麦克风接收到声音信号时,控制器获取声音信号并将声音信号与预设匹配音对比,若一致,则控制器生成声音处理信号,若不一致,控制器重新获取声音信号;
其中,这里的预设匹配音可以设置为但不限于“录音”“嗨”“hello”等不同的字眼中的一种,声音信号与预设匹配音是否一致在于,声音信号转化成的文字信息是否与预设匹配音对应的文字信息是否一致,声音信号的发声时间范围是否落在预设匹配音对应的发声时间范围内,以及声音信号前后是否有其他的声音内容;
例如预设匹配音为“录音”时,其发声时间范围为1~3秒,那当用户说“录音”时太快,或当用户两个字发声时间间隔过长,使得产生的声音信号的发声范围不在1~3秒内时,则会判定声音信号与预设匹配音不一致;
进一步的,当预设匹配音为多个文字时,还可根据声音信号的相邻文字之间的发声间隔是否落在预设匹配音的相邻文字的发声间隔范围内来判定两者是否一致;
当声音信号的前后有其他的声音内容时,会判定声音信号与预设匹配音不一致,使得当说一句连续较长的话中包含了与预设匹配音一致的声音内容时,不会发生误判。
当控制器通过唤醒型麦克风获取到的声音信号与预设匹配音不一致时,返回至步骤S201对继续对声音信号进行拾取,而不会跳至步骤S202,控制器不会生成声音处理信号。
在步骤S203、步骤S204以及步骤S205中,控制器根据声音处理信号获取每个唤醒型麦克风的音量值,控制器根据音量值量化唤醒型麦克风与声源位置的距离值且根据各个距离值使用三边定位算法获得声源位置;
其中控制器利用三边定位算法获得声源位置的算法可为但不限于:
控制器将任意三个唤醒型麦克风的距离值作为一个声源预选位置对应的输入参数,以获取
Figure BDA0001727679810000101
个声源预选位置对应的输入参数,并根据声源预选位置对应的输入参数输入到三边定位算法中,以获取对应的声源预选位置;
控制器根据
Figure BDA0001727679810000102
个声源预选位置,计算并获取任意两个声源预选位置的距离值,并将所有的距离值进行比较,以距离最远的两个声源预选位置的连线的中点作为声音信号对应的声源位置;
另外,利用三边定位算法获得声源位置还可根据应用于不同环境而有对应不同的具体算法;
例如,当n个唤醒型麦克风安装到住宅房内以用作智能家居的语音命令采集时,由于住宅房内的环境一般较安静,同时声源位置的定位偏差,对于语音命令的采集影响较小,因此控制器利用三边定位的具体算法可为:将根据n个唤醒型麦克风的音量值量化出的n个距离值通过
Figure BDA0001727679810000111
的组合形式获取
Figure BDA0001727679810000112
个声源预选位置,然后取
Figure BDA0001727679810000113
个声源预选位置中最靠近音量值最大的唤醒型麦克风的一个声源预选位置作为声源位置;
在步骤S206、步骤S207以及步骤S208中,控制器根据声音信号对应的声源位置,计算并获取声源位置分别与两个录音型麦克风组之间的距离,并将距离更小的一个录音型麦克风组作为进行声音信号采集的录音型麦克风组;
控制器将声音采集区域包括声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的第一录音型麦克风;
控制器将其他录音型麦克风确定为进行环境音采集的第二录音型麦克风;
在步骤S209中,使用确定的第一录音型麦克风和第二录音型麦克风分别进行声音信号和环境音的采集操作,采集完成后可由对应的声音优化部件进行声音信号的处理操作。
这样即完成了本优选实施例的声音信号采集方法对声音信号进行采集的过程。
请参照图3,其中图3为本发明的分离式麦克风阵列的第一优选实施例的结构示意图,本实施例的分离式麦克风阵列可使用上述的声音信号采集方法的第一优选实施例进行实施;
在本实施例中的分离式麦克风阵列包括唤醒型麦克风41、录音型麦克风组以及控制器43。
其中,至少三个唤醒型麦克风41分别位于设定空间内的任意位置,用于拾取声音信号;
至少一个录音型麦克风组设置在设定空间内的任意位置,一个录音型麦克风组包括多个录音型麦克风42,录音型麦克风42用于采集声音信号;
控制器43与唤醒型麦克风41以及录音型麦克风42连接,用于根据唤醒型麦克风41的唤醒匹配状态,选择性的控制录音型麦克风42进行声音信号的采集操作。
其中,当至少一个唤醒型麦克风41接收到声音信号时,控制器43生成声音处理信号;
然后,控制器43根据声音处理信号以及声源定位方法,使用至少三个唤醒型麦克风41获取声音信号对应的声源位置,需要说明的是,在只有一个或两个唤醒型麦克风41拾取到音量值的情况下,控制器43无法计算获取到声源位置,故需要唤醒型麦克风41继续拾取声音信号;
再然后,控制器43根据声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风42;
最后,控制器43使用确定的录音型麦克风42进行声音信号的采集操作。
其中,控制器43对声音信号的采集方法的详细描述可参照上述声音信号采集方法的第一优选实施例。
这样即完成了本优选实施例的分离式麦克风阵列对声音信号进行采集的过程。
请参照图4,其中图4为本发明的分离式麦克风阵列的第二优选实施例的结构示意图,本实施例的分离式麦克风阵列可使用上述的声音信号采集方法的第二优选实施例进行实施;
本发明提供的分离式麦克风阵列的第二优选实施例为:一种分离式麦克风阵列,用于对设定空间内的声音信号进行采集,其包括唤醒型麦克风51、录音型麦克风组、以及控制器53。
其中,多个唤醒型麦克风51分别分开安装至设定空间的任意位置,如将四个唤醒型麦克风51分别安装至室内的四角;
至少一个录音型麦克风组安装在设定空间的任意位置,一个录音型麦克风组包括多个录音型麦克风52,录音型麦克风52可时刻保持录音状态,不需要在唤醒状态和录音状态之间切换;
控制器53与唤醒型麦克风51以及录音型麦克风52连接,可选择无线或有线的方式进行通信连接;
其中,控制器53包括:
处理信号生成模块531,用于当至少一个唤醒型麦克风51接收到声音信号时,生成声音处理信号;
声源位置获取模块532,用于根据声音处理信号以及声源定位方法,使用至少三个唤醒型麦克风51获取声音信号对应的声源位置;以及
录音型麦克风确定模块533,用于根据声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风52;以及
采集模块534,用于使用确定的录音型麦克风52进行声音信号的采集操作。
需要说明的是,采集模块534使用确定的录音型麦克风52采集到的声音信号可用作发向另一控制模块的指令,如应用在智能家居中,当用户发出“开灯”语音时,采集模块534可将“开灯”的声音信号发送至灯具的控制模块上以进行开灯操作,或者,采集模块534使用确定的录音型麦克风52采集到的声音信号也可发向音响设备以进行输出播放。
具体的,安装时,将多个唤醒型麦克风51、录音型麦克风组以及控制器分别固定安装到设定空间的设定位置;
这里的设定空间可为不同的多种应用环境,可为但不限于住宅房内、教室或会议室等应用环境,当将唤醒型麦克风51安装到不同的应用环境时,可选择不同的数量以及不同的安装位置;
例如当四个唤醒型麦克风51安装到住宅房内以用作智能家居的语音命令采集时,可将四个唤醒型麦克风51分别安装到室内的四角,使得用户在室内的任何位置发出声音信号时,唤醒型麦克风51均能较好的拾取到声音信号;
或当四个唤醒型麦克风51安装到教室时,其中三个唤醒型麦克风51可安装至靠近讲台的一侧,另一个唤醒型麦克风51安装至讲台对向的一侧,靠近讲台的三个唤醒型麦克风51能较稳定的获取声音信号,从而保证用户位于停顿频率最高的讲台及讲台附近的位置发言时,声源位置能被稳定的定位;
或当应用至多人会议室时,对应设定空间内的多人发言说话的情况,唤醒型麦克风51的安装数量可大于四个,并均布在会议室周侧,使得任何位置的人员说话时,多个唤醒型麦克风51可先计算出多个声源预选位置,进而计算出更精确的声源位置,计算方法可参照第一优选实施例,然后由录音型麦克风组中对应的录音型麦克风52进行录音,以保证多人会议更好的进行。
然后,使用电脑或手机等终端,通过网络配置,把现场测量的唤醒型麦克风51和录音型麦克风52的实际位置对应的坐标输入到控制器53上,同时使用指南针和建筑测量的方式,以mm为单位,可通过但不限于以正北方向为X正向,正东方向为Y正向来建立坐标系;
其中,唤醒型麦克风51可通过蓝牙与控制器53无线连接,将声音信号压缩后,通过蓝牙发射给控制器53,省去复杂的布线工作;
本优选实施例中的唤醒型麦克风51为数字麦克风,采集到的音频数据比较大,系统采用16bit,16KHz,单声道的格式,通过固定码率的编码器,获得压缩后的音频数据,最终通过蓝牙无线发送的方式发射给处理信号生成模块531。
使用时,处理信号生成模块531通过对应的蓝牙模块接收到压缩过的音频数据,通过解码器,获得声音信号,处理信号生成模块531将声音信号与预设匹配音对比判断是否匹配,匹配一致即判断能被唤醒;
若能被唤醒,则声源位置获取模块532获得此声音信号在各个唤醒型麦克风51上的音量值,并通过这个音量值,量化出声音信号相对各个唤醒型麦克风51的距离值且根据各个距离值,使用三边定位算法获得声源位置,再然后录音型麦克风确定模块533根据获得的声源位置,确定进行声音信号采集的录音型麦克风52,最后,采集模块534使用确定的录音型麦克风52进行声音信号的采集操作。
其中,处理信号生成模块531包括匹配音获取单元5312和处理信号生成单元5311,匹配音获取单元5312用于获得至少一个唤醒型麦克风51的匹配状态,处理信号生成单元5311用于根据匹配状态生成声音处理信号;匹配音获取单元5312可通过先设置一个预设匹配音,使得当匹配音获取单元5312通过唤醒型麦克风51获取到与预设匹配音一致的声音信号时,处理信号生成单元5311才会生成声音处理信号;
这里的预设匹配音可以设置为但不限于“录音”“嗨”“hello”等不同的字眼中的一种,声音信号与预设匹配音是否一致在于,声音信号转化成的文字信息是否与预设匹配音对应的文字信息是否一致,声音信号的发声时间范围是否落在预设匹配音对应的发声时间范围内,以及声音信号前后是否有其他的声音内容;
例如预设匹配音为“录音”时,其发声时间范围为1~3秒,那当用户说“录音”时太快,或当用户两个字发声时间间隔过长,使得产生的声音信号的发声范围不在1~3秒内时,则会判定声音信号与预设匹配音不一致;
进一步的,当预设匹配音为多个文字时,还可根据声音信号的相邻文字之间的发声间隔是否落在预设匹配音的相邻文字的发声间隔范围内来判定两者是否一致;
当声音信号的前后有其他的声音内容时,会判定声音信号与预设匹配音不一致,使得当说一句连续较长的话中包含了与预设匹配音一致的声音内容时,不会发生误判。
当匹配音获取单元通过唤醒型麦克风51获取到的声音信号与预设匹配音不一致时,处理信号生成单元不会生成声音处理信号,声源位置获取模块532、录音型麦克风确定模块533以及采集模块534均不会进行相应的工作,即采集模块534不会通过录音型麦克风52对声音信号进行采集操作。
声源位置获取模块532包括音量值获取单元5321和算法识别单元5322,音量值获取单元5321用于根据声音处理信号获取每个唤醒型麦克风51的音量值,算法识别单元5322用于根据音量值确定唤醒型麦克风51与声源位置的距离值且根据各个距离值,使用三边定位算法获得声源位置;
其中,音量值获取单元5321根据声音处理信号获取到每个唤醒型麦克风51的声音信号,并将声音信号转化为音量值对应的参数,算法识别单元5322根据音量值对应的参数确定唤醒型麦克风51与声源位置的距离值;
请参照图8,其中图8为本发明的声音信号采集方法以及分离式麦克风阵列的三边定位算法的示意图。
当算法识别单元5322获取到三个唤醒型麦克风51与声源位置对应的距离值时,利用三边定位算法计算的原理为:假设三个唤醒型麦克风51的位置分别为(x1,y1),(x2,y2),(x3,y3),检测到三个唤醒型麦克风51与声源位置对应的距离值分别为d1,d2,d3,需要计算的声源位置为(x0,y0);
以d1,d2,d3为半径作三个圆,根据毕达哥拉斯定理,得出交点即为声源位置的计算公式:
(x1-x0)2+(y1-y0)2=d12
(x2-x0)2+(y2-y0)2=d22
(x3-x0)2+(y3-y0)2=d32
根据计算公式即可求出声源位置(x0,y0)。
请参照图9,其中图9为本发明的声音信号采集方法以及分离式麦克风阵列的三边定位算法的解法推导示意图。
解法推导原理具体为:
设未知点位置为(x,y),令其中的第一个球形P1的球心坐标为(0,0),P2处于相同纵坐标,球心坐标为(d,0),P3球心坐标为(i,j),三个球形半径分别为r1,r2,r3,z为三球形相交点与水平面高度。则有:
r12=x2+y2+z2
r22=(x-d)2+y2+z2
r32=(x-i)2+(y-j)2+z2
当z=0时,即为三个圆在水平面上相交为一点,首先解出x:
x=(r12-r22+d2)/2d
将公式二变形,将公式一的z2代入公式二,再代入公式三得到y的计算公式:
y=(r12-r32-x2+(x-i)2+j2)/2j
进一步的,当假设分离式麦克风阵列包括n个唤醒型麦克风51时,由于任意三个唤醒型麦克风51的距离值即可计算出一个声源位置,故可使用n个唤醒型麦克风51获取
Figure BDA0001727679810000171
个声源预选位置,然后可再根据
Figure BDA0001727679810000172
个声源预选位置,确定声音信号对应的声源位置;
如n等于4时,假设有A、B、C、D四个唤醒型麦克风51,C3 4可形成ABC、ABD、ACD以及BCD四种组合方式,通过三边定位算法,每种组合方式均可对应计算到一个声源预选位置;
具体的,算法识别单元5322包括第一计算部5323和第二计算部5324;
第一计算部5323用于将任意三个唤醒型麦克风51的距离值作为一个声源预选位置对应的输入参数,以获取
Figure BDA0001727679810000173
个声源预选位置对应的输入参数,并根据声源预选位置对应的输入参数输入到三边定位算法中,以获取对应的声源预选位置;
第二计算部5324用于根据
Figure BDA0001727679810000174
个声源预选位置,计算并获取任意两个声源预选位置的距离值,并将所有的距离值进行比较,以距离最远的两个声源预选位置的连线的中点作为声音信号对应的声源位置;
Figure BDA0001727679810000181
个声源预选位置与声音信号对应的声源位置相比是具有偏差的,其中,唤醒型麦克风51是分布在声音信号周边的任意位置,故具有偏差的
Figure BDA0001727679810000182
个声源预选位置也必然是分布在声音信号对应的声源位置周边的任意位置,距离最远的两个声源预选位置的偏差方向必然是不相同的,取最远的两个声源预选位置的连线的中点作为声音信号对应的声源位置,必然能消除一部分偏差,从而得到更精确的声源位置。
另外,使用三边定位算法获得声源位置可根据应用于不同环境而有对应不同的具体算法;
例如,当四个唤醒型麦克风51安装到住宅房内以用作智能家居的语音命令采集时,由于住宅房内的环境一般较安静,同时声源位置的定位偏差,对于语音命令的采集影响较小,因此算法识别单元利用三边定位的具体算法可为:将根据四个唤醒型麦克风51的音量值量化出的四个距离值通过C4 3的组合形式获取四个声源预选位置,然后取四个声源预选位置中最靠近音量值最大的唤醒型麦克风51的一个声源预选位置作为声源位置;
当四个唤醒型麦克风51安装到教室时,由于声源位置主要位于讲台处以及讲台附近,靠近讲台的三个唤醒型麦克风51基本能稳定的获取声音信号进行定位,因此算法识别单元利用三边定位的具体算法可为:去除四个唤醒型麦克风51中音量值最小的一个参数,取音量值较大的三个参数作为进行三边定位的参数,其中位于讲台对向一侧的一个唤醒型麦克风51用于当用户位于远离讲台的位置时也可较好的对声音信号进行定位;
当四个唤醒型麦克风51安装到多人会议室时,由于较大空间内的不同位置均可能有对应的人员进行发言,因此算法识别单元利用三边定位的具体算法可为:将根据四个唤醒型麦克风51的音量值量化出的四个距离值通过C4 3的组合形式获取四个声源预选位置,对四个声源预选位置也可有对应不同的算法以获取更精确的声源位置;
如计算四个声源预选位置中任意两个声源预选位置的距离值,并将所有的距离值进行比较,以距离最远的两个声源预选位置的连线的中点作为声音信号对应的声源位置;或者取四个声源预选位置形成的四边形的对角线交点作为声音信号对应的声源位置;其原理都在于通过抵消多个声源预选位置的定位偏差从而获得更精确的声源位置。
录音型麦克风确定模块533包括录音型麦克风组确定单元5331和录音型麦克风确定单元5332,录音型麦克风确定单元5332包括第一录音型麦克风确定部5333和第二录音型麦克风确定部5334;
录音型麦克风组确定单元5331用于根据声音信号对应的声源位置,计算并获取声源位置分别与两个录音型麦克风组之间的距离,并将距离更小的一个录音型麦克风组作为进行声音信号采集的录音型麦克风组,距离越近采集的声音信号更精确;
确定好录音型麦克风组后,其他的录音型麦克风组则不进行录音采集工作;
对确定好的录音型麦克风组,第一录音型麦克风确定部5333用于将声音采集区域包括声音信号对应的声源位置的录音型麦克风52确定为进行声音信号采集的第一录音型麦克风;
对确定好的录音型麦克风组,第二录音型麦克风确定部5334用于将其他录音型麦克风52确定为进行环境音采集的第二录音型麦克风,以便使用环境音对声音信号进行降噪操作。
其中,在本优选实施中,唤醒型麦克风51为高增益的全向麦克风,全向麦克风能很好的拾取远场的声音信号,使得在设定空间内任意位置发出的声音信号都能很好的被唤醒型麦克风51拾取到,录音型麦克风52为窄角度指向性麦克风,使得录音型麦克风52能对确定的声源位置的声音信号进行高精度的采集。
另外,所有的录音型麦克风52的声音采集区域包含设定空间内的所有区域,不同的录音型麦克风52的声音采集区域不重合或部分重合;
当将所有相邻的两个录音型麦克风52的声音采集区域设置为部分重合时,使得对位于重合区域的声音信号均有两个录音型麦克风52进行录音采集,进而能通过两组录音型麦克风52采集的声音信号进行增强处理,获得精度更高的录音效果;
当将录音型麦克风52的声音采集区域设置为不重合时,录音型麦克风52进行录音采集的采集区域更小更精确,使得采集的环境音和声音信号能更清楚的被区分,从而达到更好的降噪效果。
本优选实施例的分离式麦克风阵列的工作原理为:当设定空间内发出有声音信号时,唤醒型麦克风51拾取声音信号,匹配音获取单元5312获得至少一个唤醒型麦克风51拾取的声音信号并进行判断匹配状态;
当匹配音获取单元5312通过唤醒型麦克风51获取到与预设匹配音一致的声音信号时,由处理信号生成单元5311生成声音处理信号;
声源位置获取模块532根据声音处理信号开启工作,由音量值获取单元5321获取到每个唤醒型麦克风51的声音信号,并将声音信号转化为音量值对应的参数,算法识别单元5322根据音量值对应的参数确定唤醒型麦克风51与声源位置的距离值且根据各个距离值使用三边定位算法获得声源位置;
获得声源位置后,录音型麦克风确定模块533开始工作,录音型麦克风组确定单元5331根据声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风组,第一录音型麦克风确定部5333将确定好的录音型麦克风组中,声音采集区域包括声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的第一录音型麦克风,第二录音型麦克风确定部5334将确定好的录音型麦克风组中的其他录音型麦克风确定为进行环境音采集的第二录音型麦克风;
最后采集模块534使用确定的第一录音型麦克风和第二录音型麦克风分别进行声音信号和环境音的采集操作。
这样即完成了本优选实施例的分离式麦克风阵列对声音信号进行采集的过程。
下面通过第一具体实施例和第二具体实施例来说明本发明的声音信号采集方法以及分离式麦克风阵列的工作原理。请参照图5和图6,其中图5为本发明的声音信号采集方法以及分离式麦克风阵列的第一具体实施例的结构示意图,图6为本发明的声音信号采集方法以及分离式麦克风阵列的第一具体实施例的框架结构示意图,第一具体实施例和第二具体实施例均可根据本发明中第二优选实施例的分离式麦克风阵列进行实施。
其中,第一具体实施例的分离式麦克风阵列安装在住宅房内以用作智能家居的语音命令采集系统,其包括:
唤醒型麦克风62,四个唤醒型麦克风62分别位于住宅房内的四角;
录音型麦克风组,位于设定空间的一侧,包括多个录音型麦克风63,其中,在图5中,序号63表示的是录音型麦克风对应的声音采集区域,录音型麦克风63的硬件设置在控制器64内;
控制器64,与唤醒型麦克风62以及录音型麦克风63连接,可选择无线或有线的方式进行通信连接;
其中,控制器64包括:
处理信号生成模块641,用于当至少一个唤醒型麦克风62接收到声音信号时,生成声音处理信号;
声源位置61获取模块642,用于根据声音处理信号以及声源定位方法,使用四个唤醒型麦克风62获取声音信号对应的声源位置61;以及
录音型麦克风确定模块643,用于根据声音信号对应的声源位置61,确定进行声音信号采集的录音型麦克风63;以及
采集模块644,用于使用确定的录音型麦克风63进行声音信号的采集操作。
在本具体实施例中,采集模块644使用确定的录音型麦克风63采集到的声音信号会发送至住宅房内的智能家居的控制模块上,控制模块根据接收的声音信号,寻找对应匹配的命令,若匹配上对应的命令,则控制模块根据匹配的命令控制对应的家居设备执行对应的操作,例如用户发出“开灯”语音时,采集模块644可将“开灯”的声音信号发送至灯具的控制模块上以进行开灯操作。若匹配不上,则有语音播放设备播放对应的语音提示以告知用户匹配失败。
首先,在应用之前,确定哪些家居设备是与控制模块连接并由控制模块控制的,然后需要先给智能家居的控制模块设置与各家居设备一一对应的语音命令,同时给处理信号生成模块641上的匹配音获取单元设置用于唤醒分离式麦克风阵列的预设匹配音,预设匹配音可为“嗨”“hello”等不同的字眼中的一种;
然后,当用户位于住宅房内时,可先说出与预设匹配音一致的话语,从而唤醒分离式麦克风阵列,当匹配音获取单元通过唤醒型麦克风62获取到与预设匹配音一致的声音信号时,控制器可将声音信号发送给智能家居的控制模块,由控制模块控制语音播放设备播放对应的响应语音,如“您好,请问需要什么帮助”等回应语音,以告知用户分离式麦克风阵列已被唤醒;
唤醒的同时,处理信号生成单元生成声音处理信号,音量值获取单元根据声音处理信号获取每个唤醒型麦克风的音量值;
算法识别单元根据音量值量化四个唤醒型麦克风与声源位置61的距离值,同时利用三边定位算法,以及四个唤醒型麦克风的音量值量化出的4个距离值通过C4 3的组合形式获取C4 3个声源预选位置,然后取C4 3个声源预选位置中最靠近音量值最大的唤醒型麦克风的一个声源预选位置作为声源位置61;
获得声源位置61后,录音型麦克风确定模块643将声音采集区域包括声音信号对应的声源位置61的录音型麦克风确定为进行声音信号采集的录音型麦克风;
唤醒后,用户再继续说出与各家居设备一一对应的语音命令时,分离式麦克风阵列会通过确定的录音型麦克风采集用户的语音信息,并发送至智能家居的控制模块上以进行控制对应的家居设备的开闭等操作。
另外,对于住宅房面积较大的情况也可设置更多个的环形型麦克风和多个录音型麦克风组,此情况下,唤醒分离式麦克风阵列的同时,录音型麦克风确定模块643会先确定离声源位置61最近的录音型麦克风组,再确定声音采集区域包括声音信号对应的声源位置61的录音型麦克风,其中,由于住宅环境相对较为安静,因此,将其他的录音型麦克风确定为进行环境音采集的录音型麦克风这一程序可通过选择性的开启,开启后能使得分离式麦克风阵列适用于住宅房内的聚会等较嘈杂的场合。
这样即完成了,本具体实施例中的住宅房内的分离式麦克风阵列利用声音信号采集方法进行声音采集的过程。
请参照图7,其中图7为本发明的声音信号采集方法以及分离式麦克风阵列的第二具体实施例的框架结构示意图。
第二具体实施例的分离式麦克风阵列安装在教室内以用作辅助教学。
将四个唤醒型麦克风72安装到教室时,其中三个唤醒型麦克风72安装至靠近讲台76的一侧,另一个唤醒型麦克风72安装至讲台76对向的一侧,靠近讲台76的三个唤醒型麦克风72能较稳定的获取声音信号,从而保证用户位于停顿频率最高的讲台76及讲台76附近的位置发言时,声源位置71能被稳定的定位;
在本具体实施例中,采集模块使用确定的录音型麦克风73采集到的声音信号会发送至教室内的音响设备上,以进行语音输出教学,其中图7中的序号73标示的为录音型麦克风73的采集区域,音型麦克风的硬件设置在控制器74内。
首先,在运用之前将音响设备通过控制模块与该分离式麦克风阵列的控制器74电性连接,以使得控制器74能向控制模块发送采集到的声音信号,同时给处理信号生成模块上的匹配音获取单元设置预设匹配音,预设匹配音可为“嗨”“喂”“定位”等不同的字眼中的一种,预设匹配音可用于唤醒分离式麦克风阵列,以及用于在分离式麦克风被唤醒后控制唤醒型麦克风72再次进行声源定位;
当在教室内应用该分离式麦克风阵列进行教学时,可先说出与预设匹配音一致的话语,从而唤醒分离式麦克风阵列,当匹配音获取单元通过唤醒型麦克风72获取到与预设匹配音一致的声音信号时,控制器74可将声音信号发送给控制模块,由控制模块控制音响设备发出如“定位成功”等回应语音,以告知用户分离式麦克风阵列已被唤醒;
唤醒的同时,处理信号生成单元生成声音处理信号,音量值获取单元根据声音处理信号获取每个唤醒型麦克风72的音量值;
算法识别单元根据音量值量化四个唤醒型麦克风72与声源位置71的距离值,同时去除四个唤醒型麦克风72中音量值最小的一个参数,取音量值较大的三个参数作为进行三边定位的参数,从而计算出声源位置71,其中一般情况下,教师都是位于讲台76及讲台76附近区域进行讲课,因此一般是由靠近讲台76一侧的三个唤醒型麦克风72拾取到音量值较大的三个参数进行声源定位;
其中位于讲台76对向一侧的一个唤醒型麦克风72用于当用户位于远离讲台76的位置时也能较好的进行声源定位;
获得声源位置71后,录音型麦克风确定模块将声音采集区域包括声音信号对应的声源位置71的录音型麦克风73确定为进行声音信号采集的第一录音型麦克风,即图7中采集区域包括声源位置71的录音型麦克风,将其他录音型麦克风73确定为进行环境音75采集的第二录音型麦克风,以便使用环境音75对声音信号进行降噪操作,保证教师语音输出的稳定性与清晰度;
唤醒后,当教师再继续说出其他语音时,分离式麦克风阵列会通过确定的第一录音型麦克风采集教师的语音信息,通过确定的第二录音型麦克风采集教室内的环境音,如学生发出的杂音,并发送至控制模块上以通过音响设备进行语音输出教学;
其中,降噪程序可设置在分离式麦克风阵列的控制器74上,也可设置到音响设备的控制模块上;
另外,当教师走动位置后,由于声源位置71的移动导致第一录音型麦克风采集不到教师的声音信号时,可通过说出“嗨”“定位”等与预设匹配音一致的话语使得分离式麦克风阵列重新进行声源定位。
当第一录音型麦克风在设定时间内采集不到声音信号时,该分离式麦克风阵列则转为休眠状态,需要使用时,可通过再次唤醒以继续进行声音采集。
这样即完成了,本具体实施例中的教室内的分离式麦克风阵列利用声音信号采集方法进行声音采集的过程。
本发明的声音信号采集方法以及分离式麦克风阵列通过使用分离式的唤醒型麦克风和录音型麦克风进行声音信号的采集,两种麦克风具有不同的指向性曲线与增益,分工明确,从而能降低对麦克风硬件的要求,对麦克风的选型由之前的全能型,变成某个特点的加强型;
同时由于多个唤醒型麦克风分开安装,声源定位的方位信息更加准确,有效增加降噪参数的准确性;
另外,由于使用了两种不同用途的麦克风,从而使得麦克风不需要在唤醒和录音两个工作状态中切换麦克风参数,避免了高难度的调整与切换给硬件带来的高要求。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (10)

1.一种声音信号采集方法,其特征在于,通过分离式麦克风阵列对设定空间内的声音信号进行采集,其中所述分离式麦克风阵列包括设置在所述设定空间内的至少三个唤醒型麦克风、设置在所述设定空间内的至少一个录音型麦克风组、以及与所述唤醒型麦克风和所述录音型麦克风连接的控制器,一个所述录音型麦克风组包括多个录音型麦克风;
所述声音信号采集方法包括:
当至少一个唤醒型麦克风接收到声音信号时,所述控制器生成声音处理信号;
根据所述声音处理信号以及声源定位方法,所述控制器使用至少三个所述唤醒型麦克风获取所述声音信号对应的声源位置;
根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;以及
使用确定的录音型麦克风进行所述声音信号的采集操作。
2.根据权利要求1所述的声音信号采集方法,其特征在于,所述录音型麦克风为窄角度指向性麦克风,所述根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风的步骤为:
将声音采集区域包括所述声音信号对应的声源位置的录音型麦克风确定为进行声音信号采集的第一录音型麦克风。
3.根据权利要求2所述的声音信号采集方法,其特征在于,所述根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风的步骤还包括:
将其他录音型麦克风确定为进行环境音采集的第二录音型麦克风,以便使用所述环境音对所述声音信号进行降噪操作。
4.根据权利要求1所述的声音信号采集方法,其特征在于,所有的所述录音型麦克风的声音采集区域包含所述设定空间内的所有区域,不同的所述录音型麦克风的声音采集区域不重合或部分重合。
5.根据权利要求1所述的声音信号采集方法,其特征在于,所述唤醒型麦克风为高增益的全向麦克风,所述根据所述声音处理信号以及声源定位方法,所述控制器使用至少三个所述唤醒型麦克风获取所述声音信号对应的声源位置的步骤包括:
所述控制器获得至少一个所述唤醒型麦克风的匹配状态以及至少三个所述唤醒型麦克风音量值;
根据所述唤醒型麦克风的音量值,确定所述唤醒型麦克风与声源位置的距离值;
通过各个距离值,使用三边定位算法获得声源位置。
6.根据权利要求1所述的声音信号采集方法,其特征在于,所述分离式麦克风阵列包括分别设置在所述设定空间内的n个唤醒型麦克风,n大于3,使用n个唤醒型麦克风的声音信号采集方法包括:
当至少一个唤醒型麦克风接收到声音信号时,所述控制器生成声音处理信号;
根据所述声音处理信号以及声源定位方法,所述控制器使用n个唤醒型麦克风获取
Figure FDA0001727679800000021
个声源预选位置;
根据个所述声源预选位置,确定所述声音信号对应的声源位置;
根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;以及
使用确定的录音型麦克风进行所述声音信号的采集操作。
7.根据权利要求6所述的声音信号采集方法,其特征在于,所述根据所述声音处理信号以及声源定位方法,所述控制器使用n个唤醒型麦克风获取
Figure FDA0001727679800000023
个声源预选位置的步骤包括:
所述控制器获得至少一个唤醒型麦克风的匹配状态与n个唤醒型麦克风的音量值;
根据所述唤醒型麦克风的音量值,确定所述唤醒型麦克风与声源位置的距离值;
将任意三个唤醒型麦克风的距离值,作为一个声源预选位置对应的输入参数,以获取个声源预选位置对应的输入参数;
将声源预选位置对应的输入参数输入到三边定位算法中,以获取对应的声源预选位置。
8.根据权利要求6所述的声音信号采集方法,其特征在于,所述根据所述个声源预选位置,确定所述声音信号对应的声源位置的步骤包括:
根据个所述声源预选位置,计算并获取任意两个所述声源预选位置的距离值;
将所有的距离值进行比较,以距离最远的两个所述声源预选位置的连线的中点作为所述声音信号对应的声源位置。
9.根据权利要求1所述的声音信号采集方法,其特征在于,在所述设定空间内相对的两侧分别设置有一个所述录音型麦克风组,所述根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风的步骤为:
根据所述声音信号对应的声源位置,计算并获取声源位置分别与两个所述录音型麦克风组之间的距离;
根据声源位置与两个所述录音型麦克风组之间的距离,将距离更小的一个录音型麦克风组作为进行声音信号采集的录音型麦克风组;
将确定作为进行声音信号采集的录音型麦克风组中的声音采集区域包括所述声音信号对应的声源位置的一个录音型麦克风确定为进行声音信号采集的录音型麦克风。
10.一种分离式麦克风阵列,用于对设定空间内的声音信号进行采集,其特征在于,包括:
至少三个唤醒型麦克风;
至少一个录音型麦克风组,一个所述录音型麦克风组包括多个录音型麦克风;
控制器,与所述唤醒型麦克风以及所述录音型麦克风连接,包括:
处理信号生成模块,用于当至少一个唤醒型麦克风接收到声音信号时,生成声音处理信号;
声源位置获取模块,用于根据所述声音处理信号以及声源定位方法,使用至少三个所述唤醒型麦克风获取所述声音信号对应的声源位置;以及
录音型麦克风确定模块,用于根据所述声音信号对应的声源位置,确定进行声音信号采集的录音型麦克风;以及
采集模块,用于使用确定的录音型麦克风进行所述声音信号的采集操作。
CN201810760110.6A 2018-07-11 2018-07-11 声音信号采集方法以及分离式麦克风阵列 Pending CN110716181A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810760110.6A CN110716181A (zh) 2018-07-11 2018-07-11 声音信号采集方法以及分离式麦克风阵列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810760110.6A CN110716181A (zh) 2018-07-11 2018-07-11 声音信号采集方法以及分离式麦克风阵列

Publications (1)

Publication Number Publication Date
CN110716181A true CN110716181A (zh) 2020-01-21

Family

ID=69208246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810760110.6A Pending CN110716181A (zh) 2018-07-11 2018-07-11 声音信号采集方法以及分离式麦克风阵列

Country Status (1)

Country Link
CN (1) CN110716181A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815958A (zh) * 2020-06-18 2020-10-23 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN113014844A (zh) * 2021-02-08 2021-06-22 Oppo广东移动通信有限公司 一种音频处理方法、装置、存储介质及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815958A (zh) * 2020-06-18 2020-10-23 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN111815958B (zh) * 2020-06-18 2022-11-29 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN113014844A (zh) * 2021-02-08 2021-06-22 Oppo广东移动通信有限公司 一种音频处理方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US10354649B2 (en) Altering audio to improve automatic speech recognition
CN107464564B (zh) 语音交互方法、装置及设备
CN108447479B (zh) 嘈杂工况环境的机器人语音控制系统
KR101972545B1 (ko) 음성 명령을 통한 위치 기반 음성 인식 시스템
KR100215946B1 (ko) 게임장치,음성선택장치,음성인식장치및음성응답장치
US20180090138A1 (en) System and method for localization and acoustic voice interface
US10075801B2 (en) Information processing system and storage medium
CN106797512A (zh) 多源噪声抑制
CN111629301B (zh) 用于控制多个扬声器播放音频的方法、装置和电子设备
JP6759445B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
JP2019159306A (ja) ファーフィールド音声制御デバイス及びファーフィールド音声制御システム
JP2005529421A (ja) 可動ユニット及び可動ユニットを制御する方法
WO2021244056A1 (zh) 一种数据处理方法、装置和可读介质
US6959095B2 (en) Method and apparatus for providing multiple output channels in a microphone
US20220335937A1 (en) Acoustic zoning with distributed microphones
CN110716181A (zh) 声音信号采集方法以及分离式麦克风阵列
JP5206151B2 (ja) 音声入力ロボット、遠隔会議支援システム、遠隔会議支援方法
CN208367199U (zh) 分离式麦克风阵列
CN110517702B (zh) 信号生成的方法、基于人工智能的语音识别方法及装置
KR102115222B1 (ko) 사운드를 제어하는 전자 장치 및 그 동작 방법
JPWO2020021861A1 (ja) 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム
CN110415718B (zh) 信号生成的方法、基于人工智能的语音识别方法及装置
KR102168812B1 (ko) 사운드를 제어하는 전자 장치 및 그 동작 방법
JP2021197658A (ja) 収音装置、収音システム及び収音方法
JP2005227511A (ja) 対象音検出方法、音信号処理装置、音声認識装置及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination