CN106842131B

CN106842131B - 麦克风阵列声源定位方法及装置

Info

Publication number: CN106842131B
Application number: CN201710163580.XA
Authority: CN
Inventors: 王玉波; 李乐宇
Original assignee: Zhejiang Uniview Technologies Co Ltd
Current assignee: Zhejiang Uniview Technologies Co Ltd
Priority date: 2017-03-17
Filing date: 2017-03-17
Publication date: 2019-10-18
Anticipated expiration: 2037-03-17
Also published as: CN106842131A

Abstract

本申请提供一种麦克风阵列声源定位方法及装置，方法包括：根据四个麦克风接收到的语音信号判断四个麦克风是否正常；若是，则从四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度；利用该声源角度对视频设备的镜头执行声源跟踪控制。本申请通过麦克风的冗余设计，可以从四个麦克风中任意选择一组三麦克风阵列确定出声源角度，即使四个麦克风中有一个麦克风不正常，利用剩余三个麦克风仍然可以确定出声源角度，仍能够保证声源定位系统的正常运行，从而增加了声源定位系统的寿命。

Description

麦克风阵列声源定位方法及装置

技术领域

本申请涉及声源定位技术领域，尤其涉及一种麦克风阵列声源定位方法及装置。

背景技术

随着麦克风的使用，基于麦克风阵列的声源定位系统越来越多的应用在视频设备领域。通常在声源平面定位中，使用三麦克风阵列对声源进行360度定位，然而在实际应用中，如果三麦克风阵列中有一个麦克风出现故障时，整个声源定位系统将无法实现声源定位。

发明内容

有鉴于此，本申请提供一种麦克风阵列声源定位方法及装置，以解决现有定位方式在有一个麦克风出现故障时，整个声源定位系统无法实现定位的问题。

根据本申请实施例的第一方面，提供一种麦克风阵列声源定位方法，所述麦克风阵列包括四个麦克风，所述四个麦克风组成的四边形为矩形，所述视频设备的镜头位于所述矩形的中心，所述方法包括：

根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常；

若是，则从所述四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度；

利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。

根据本申请实施例的第二方面，提供一种麦克风阵列声源定位装置，所述麦克风阵列包括四个麦克风，所述四个麦克风组成的四边形为矩形，所述视频设备的镜头位于所述矩形的中心，所述装置包括：

判断模块，用于根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常；

第一声源定位模块，用于当判断结果为是时，从所述四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度；

跟踪控制模块，用于利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。

应用本申请实施例，在进行声源定位之前，可以先根据该四个麦克风接收到的语音信号判断该四个麦克风是否正常，若是，则从该四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，最后利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。基于上述实现方式，本申请通过麦克风的冗余设计，在根据接收到的语音信号初步判断麦克风均正常，无硬件故障之后，可以从四个麦克风中任意选择一组三麦克风阵列确定声源角度，即使四个麦克风中有一个麦克风不正常，利用剩余三个麦克风仍然可以确定出声源角度，仍能够保证声源定位系统的正常运行，从而增加了声源定位系统的寿命。

附图说明

图1A为本申请根据一示例性实施例示出的一种麦克风阵列声源定位方法的实施例流程示意图；

图1B至图1E为本申请根据图1A所示实施例示出的四组三麦克风阵列坐标系示意图；

图1F为本申请根据图1B所示的三麦克风阵列坐标系的转换示意图；

图1G为本申请根据图1A所示实施例示出的双曲线的渐近线与横轴正半轴夹角示意图；

图1H为声源在图1B所示的三麦克风阵列坐标系中的角度示意图；

图2为本申请根据一示例性实施例示出的一种视频设备的硬件结构示意图；

图3为本申请根据一示例性实施例示出的一种麦克风阵列声源定位装置的实施例结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

图1A为本申请根据一示例性实施例示出的一种麦克风阵列声源定位方法的实施例流程示意图；图1B至图1E为本申请根据图1A所示实施例示出的四组三麦克风阵列坐标系示意图；图1F为本申请根据图1B所示的三麦克风阵列坐标系的转换示意图；图1G为本申请根据图1A所示实施例示出的双曲线的渐近线与横轴正半轴夹角示意图；图1H为声源在图1B所示的三麦克风阵列坐标系中的角度示意图，该麦克风阵列声源定位方法可以应用于视频设备上，该视频设备可以是IPC(IP Camera，网络摄像机)，也可以是DVR(Digital VideoRecorder，数字视频录像机)，在本申请实施例中，该麦克风阵列可以包括四个麦克风(Mic)，该四个麦克风组成的四边形为矩形，且视频设备的镜头位于该矩形的中心。如图1A所示，该麦克风阵列声源定位方法包括如下步骤：

步骤101：根据四个麦克风接收到的语音信号判断该四个麦克风是否正常，若有两个以上麦克风不正常，则执行步骤102，若该四个麦克风均正常，则执行步骤103。

在一实施例中，可以通过各个麦克风接收到的语音信号的幅值的相互比较来判断每个麦克风是否正常，先获取各个麦克风接收到的语音信号的幅值，并将各个幅值进行比较，若各个幅值之间的差值小于第一预设阈值，则确定四个麦克风均正常；若有幅值比其它两个以上幅值大第二预设阈值或者小第三预设阈值，则确定该幅值对应的麦克风不正常。

其中，对于同一个语音信号，经过麦克风接收之后得到的幅值应该相差很小，因此可以通过判断各个幅值的差值是否小于第一预设阈值来确定麦克风是否正常，该第一预设阈值可以根据实践经验设置。而如果有幅值与其它两个幅值或者三个幅值的差值均大于第二预设阈值，则该幅值对应的麦克风不正常，第二预设阈值也可以根据实践经验设置。

在另一实施例中，可以通过对各个麦克风接收到的语音信号的波形的检测结果来判断每个麦克风是否正常，即是否存在硬件上的故障，针对每个麦克风，获取该麦克风接收到的语音信号的波形，并对波形进行检测，若波形检测结果为异常，则确定该麦克风不正常；否则，确定该麦克风正常。本领域技术人员可以理解的是，波形检测可以通过相关技术实现，本申请在此不再详述。

此外，还可以通过比较各个麦克风接收到的语音信号的波形差异来判断是否正常，如果某个麦克风对应的波形与其它麦克风对应的波形相差较大，则确定该某个麦克风不正常。

步骤102：向终端设备发送告警信号，以提示对不正常的麦克风进行维修。

在一实施例中，若确定四个麦克风中有两个以上麦克风不正常，则确定无法继续完成声源定位功能，从而可以向终端设备发送告警信号，以提示维修人员对不正常的麦克风进行维修，其中，告警信号中可以携带不正常麦克风的标识，该标识可以是数字或者字符，也可以是数字与字符的组合，本申请在此不进行限制，只要可以唯一区分每个麦克风即可。

步骤103：从该四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度。

在一实施例中，由于该四个麦克风组成的四边形可以为矩形，因此无论选择哪三个麦克风作为三麦克风阵列，均可以组成一个直角三角形，且视频设备的镜头均位于直角三角形的斜边中点。因此，可以先以矩形的中心为原点建立坐标系，该坐标系的横轴平行于矩形水平方向的边、纵轴平行于矩形垂直方向的边，然后获取该组三麦克风阵列中位于矩形对角的两个麦克风接收到语音信号的时间差，并将该时间差与声音传播速度的乘积确定为声源距该两个麦克风的距离差，并以该两个麦克风的位置为焦点以及该两个麦克风的距离差为实轴长建立双曲线，最终根据双曲线的渐近线的斜率以及语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定相对视频设备的镜头的声源角度。

其中，针对获取两个麦克风接收到语音信号的时间差的过程可以通过相关技术实现，例如，时延估计法，本申请在此不再详述。

如图1B至图1E所示，图1B为由Mic1、Mic2和Mic3组成的三麦克风阵列坐标系，图1C为由Mic1、Mic2和Mic4组成的三麦克风阵列坐标系，图1D为由Mic1、Mic3和Mic4组成的三麦克风阵列坐标系，图1E为由Mic2、Mic3和Mic4组成的三麦克风阵列坐标系，且由该四组三麦克风阵列得到的声源角度均是在同一坐标系下相对视频设备的镜头的角度。

下面以图1B所示的Mic1、Mic2和Mic3三麦克风阵列为例确定声源角度进行示例性说明：

步骤一、为了描述方便先将Mic1与Mic2组成的斜边作为坐标系的横轴，也即将上述建立的坐标系顺时针旋转β度，β为Mic1和Mic2连线与Mic2和Mic3连线的夹角，β值可以由Mic1、Mic2以及Mic3的位置得到，从而可以得到图1F所示的三麦克风阵列转换坐标系图；

步骤二、由时延估计法得到的语音信号到达Mic1与Mic2的时间差为△t，从而可以得到声源距Mic1与Mic2的距离差△L＝v*△t，其中v为声音在空气中传播的速度；

步骤三、由到两点的距离为定长的点集中在以该两点为焦点的双曲线上可知，△L可以作为双曲线的实轴长，Mic1与Mic2可以作为双曲线的焦点，双曲线方程如下：

其中，实轴长2a＝△L，焦距2c为Mic1与Mic2之间的距离L，该L可以根据Mic1与Mic2的位置得到，从而由△L与L可以得到双曲线方程中的b；

步骤四、根据渐近线的斜率可以定位出4个角度(与横轴正半轴的夹角)，如图1G所示的ɑ1、ɑ2、ɑ3、ɑ4，由于渐近线是无限接近双曲线的，且声源到原点的距离远远大于麦克风到原点的距离，因此可以将声源与横轴正半轴的夹角(声源角度)近似为渐近线与横轴正半轴的夹角。从而，根据渐近线的斜率可以得到的声源角度ɑ为ɑ1、ɑ2、ɑ3、ɑ4中的一个角度。又由于上述步骤一中，将建立的坐标系顺时针旋转了β度，因此，需要将得到的4个角度再逆时针旋转β度，即ɑ1-β、ɑ2-β、ɑ3-β、ɑ4-β，以恢复至建立的坐标系中，从而在建立的坐标系中，声源角度ɑ-β为ɑ1-β、ɑ2-β、ɑ3-β、ɑ4-β中的一个角度，如图1H所示。

步骤五、由于Mic1与Mic3的连线被横轴垂直平分，Mic2与Mic3的连线被纵轴垂直平分，因此根据语音信号到达Mic1、Mic2和Mic3的先后顺序可以确定声源位于上述建立的坐标系中的哪一象限，以确定一个最终的声源角度。

例如，根据Mic1与Mic3，如果语音信号先到Mic1，则声源位于坐标系的第一或第二象限，再根据Mic2与Mic3，如果语音信号先到Mic3，则声源位于坐标系的第二或第三象限，从而可以确定声源位于坐标系的第二象限，即声源角度大小在90度～180度之间，从由渐近线与横轴正半轴的4个夹角中选择一个90度～180度之间的角度作为最终的声源角度。

需要说明的是，为了确保声源角度的准确性，可以从四个麦克风中选择至少两组三麦克风阵列，分别根据每组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，并得到至少两个声源角度，若至少两个声源角度均一致，则再利用至少两个声源角度对视频设备的镜头执行声源跟踪控制，从而实现声源角度的准确性验证，进而增强了声源定位系统的准确性。

其中，由上述图1B至图1E所示的三麦克风阵列，由于Mic1与Mic2、Mic3与Mic4的连线均是直角三角形的斜边，在定位声源角度时，图1B和图1C均是以Mic1与Mic2之间的距离作为双曲线的焦距，图1D和图1E均是以Mic3与Mic4之间的距离作为双曲线的焦距，而焦距决定渐近线的斜率大小，并最终会影响到声源角度大小，若选择图1B和图1C中的两组三麦克风阵列得到的两个声源角度互相比较验证，或者图1D和图1E中的两组三麦克风阵列得到的两个声源角度互相比较验证，均无法起到验证的要求，因此，至少两组三麦风阵列可以从图1B与图1C中选择一个，从图1D与图1E中选择一个。

此外，对于判断两个声源角度是否一致，本领域技术人员可以理解的是，由于在计算过程中可能会存在四舍五入的情况(例如，由渐近线的斜率转换角度)，因此上述得到的至少两个声源角度的大小不可能完全一致，但只要该至少两个声源角度的差值很小，例如，差值在0.5以下，即可认为一致，从而表示声源定位结果不存在偏差。

对于如何利用至少两个声源角度对视频设备的镜头执行声源跟踪控制，视频设备可以利用该至少两个声源角度的均值对本设备的镜头执行声源跟踪控制，以捕捉声源位置处的视频图像。

需要进一步说明的是，若该至少两个声源角度不一致，即两个声源角度的差值很大，例如，差值在1以上，表示有麦克风的表面可能有覆盖物，或者有麦克风的外壳生锈，从而导致获取到的语音信号的时间差存在误差，从而最终得到的声源角度存在偏差，则可以向终端设备发送告警信号，以使维修人员对定位系统中麦克风的问题进一步定位。

本领域技术人员可以理解的是，也可以利用图1B-图1E所示的四组三麦克风阵列得到四个声源角度进行比较，验证是否一致。

步骤104：利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。

由上述实施例可知，在进行声源定位之前，可以先根据该四个麦克风接收到的语音信号判断该四个麦克风是否正常，若是，则从该四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，最后利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。基于上述实现方式，本申请通过麦克风的冗余设计，在根据接收到的语音信号初步判断麦克风均正常，无硬件故障之后，从四个麦克风中可以任意选择一组三麦克风阵列确定声源角度，即使四个麦克风中有一个麦克风不正常，利用剩余三个麦克风仍然可以确定出声源角度，仍能够保证声源定位系统的正常运行，从而增加了声源定位系统的寿命。

与前述麦克风阵列声源定位方法的实施例相对应，本申请还提供了麦克风阵列声源定位装置的实施例。

本申请麦克风阵列声源定位装置的实施例可以应用在视频设备上。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图2所示，为本申请根据一示例性实施例示出的一种视频设备的硬件结构示意图，除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的设备通常根据该设备的实际功能，还可以包括其他硬件，对此不再赘述。

图3为本申请根据一示例性实施例示出的一种麦克风阵列声源定位装置的实施例结构示意图，该麦克风阵列声源定位装置可以应用于视频设备，该麦克风阵列可以包括四个麦克风，该四个麦克风组成的四边形为矩形，视频设备的镜头位于所述矩形的中心。如图3所示，该麦克风阵列声源定位装置可包括：判断模块310、第一声源定位模块320、跟踪控制模块330。

其中，判断模块310，用于根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常；

第一声源定位模块320，用于当判断结果为是时，从所述四个麦克风中选择任意一组三麦克风阵列，并根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度；

跟踪控制模块330，用于利用确定出的声源角度对视频设备的镜头执行声源跟踪控制。

在一可选的实现方式中，所述装置还包括(图3中未示出)：

第二声源定位模块，用于在所述判断模块310根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常之后，若所述四个麦克风均正常，则从所述四个麦克风中选择至少两组三麦克风阵列，分别根据每组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，并得到至少两个声源角度；

验证模块，用于若所述至少两个声源角度均一致，则利用所述至少两个声源角度对视频设备的镜头执行声源跟踪控制。

在一可选的实现方式中，所述判断模块310，具体用于获取各个麦克风接收到的语音信号的幅值；将各个幅值进行比较；若各个幅值之间的差值小于第一预设阈值，则确定所述四个麦克风均正常；若有幅值与其它两个以上幅值的差值均大于第二预设阈值，则确定该幅值对应的麦克风不正常；或者，针对每个麦克风，获取该麦克风接收到的语音信号的波形，并对所述波形进行检测；若所述波形检测结果为异常，则确定该麦克风不正常；否则，确定该麦克风正常。

在一可选的实现方式中，所述装置还可包括(图3中未示出)：

告警模块，用于若所述四个麦克风中有两个以上麦克风不正常，则向终端设备发送告警信号，以提示对不正常的麦克风进行维修。

在一可选的实现方式中，所述第一声源定位模块320，具体用于建立坐标系，所述坐标系的原点与所述矩形的中心重合，横轴平行于所述矩形水平方向的边，纵轴平行于所述矩形垂直方向的边；获取该组三麦克风阵列中位于所述矩形对角的两个麦克风接收到语音信号的时间差，并将所述时间差与声音传播速度的乘积确定为声源距该两个麦克风的距离差；以该两个麦克风的位置为焦点以及该两个麦克风的距离差为实轴长建立双曲线；根据所述双曲线的渐近线的斜率以及所述语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定相对所述视频设备的镜头的声源角度。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种麦克风阵列声源定位方法，其特征在于，所述麦克风阵列包括四个麦克风，所述四个麦克风组成的四边形为矩形，且视频设备的镜头位于所述矩形的中心，所述方法包括：

利用确定出的声源角度对视频设备的镜头执行声源跟踪控制；

其中，根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，包括：

获取该组三麦克风阵列中位于所述矩形对角的两个麦克风接收到语音信号的时间差，并依据所述时间差确定声源距该两个麦克风的距离差；

根据该两个麦克风的位置以及声源距该两个麦克风的距离差建立双曲线；

根据所述双曲线以及所述语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定声源角度。

2.根据权利要求1所述的方法，其特征在于，在根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常之后，所述方法还包括：

若所述四个麦克风均正常，则从所述四个麦克风中选择至少两组三麦克风阵列，分别根据每组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，并得到至少两个声源角度；

若所述至少两个声源角度均一致，则利用所述至少两个声源角度对视频设备的镜头执行声源跟踪控制。

3.根据权利要求1所述的方法，其特征在于，所述根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常，包括：

获取各个麦克风接收到的语音信号的幅值；将各个幅值进行比较；若各个幅值之间的差值小于第一预设阈值，则确定所述四个麦克风均正常；若有幅值与其它两个以上幅值的差值均大于第二预设阈值，则确定该幅值对应的麦克风不正常；或者，

针对每个麦克风，获取该麦克风接收到的语音信号的波形，并对所述波形进行检测；若所述波形检测结果为异常，则确定该麦克风不正常；否则，确定该麦克风正常。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述四个麦克风中有两个以上麦克风不正常，则向终端设备发送告警信号，以提示对不正常的麦克风进行维修。

5.根据权利要求1所述的方法，其特征在于，所述根据该组三麦克风阵列中的每个麦克风的位置和接收到语音信号的时间差确定声源角度，包括：

建立坐标系，所述坐标系的原点与所述矩形的中心重合，横轴平行于所述矩形水平方向的边，纵轴平行于所述矩形垂直方向的边；

获取该组三麦克风阵列中位于所述矩形对角的两个麦克风接收到语音信号的时间差，并将所述时间差与声音传播速度的乘积确定为声源距该两个麦克风的距离差；

以该两个麦克风的位置为焦点以及该两个麦克风的距离差为实轴长建立双曲线；

根据所述双曲线的渐近线的斜率以及所述语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定相对所述视频设备的镜头的声源角度。

6.一种麦克风阵列声源定位装置，其特征在于，所述麦克风阵列包括四个麦克风，所述四个麦克风组成的四边形为矩形，视频设备的镜头位于所述矩形的中心，所述装置包括：

跟踪控制模块，用于利用确定出的声源角度对视频设备的镜头执行声源跟踪控制；

其中，所述第一声源定位模块，具体用于在根据该组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度过程中，获取该组三麦克风阵列中位于所述矩形对角的两个麦克风接收到语音信号的时间差，并依据所述时间差确定声源距该两个麦克风的距离差；根据该两个麦克风的位置以及声源距该两个麦克风的距离差建立双曲线；根据所述双曲线以及所述语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定声源角度。

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二声源定位模块，用于在所述判断模块根据所述四个麦克风接收到的语音信号判断所述四个麦克风是否正常之后，若所述四个麦克风均正常，则从所述四个麦克风中选择至少两组三麦克风阵列，分别根据每组三麦克风阵列中每个麦克风的位置和接收到语音信号的时间差确定声源角度，并得到至少两个声源角度；

8.根据权利要求6所述的装置，其特征在于，

所述判断模块，具体用于获取各个麦克风接收到的语音信号的幅值；将各个幅值进行比较；若各个幅值之间的差值小于第一预设阈值，则确定所述四个麦克风均正常；若有幅值与其它两个以上幅值的差值均大于第二预设阈值，则确定该幅值对应的麦克风不正常；或者，针对每个麦克风，获取该麦克风接收到的语音信号的波形，并对所述波形进行检测；若所述波形检测结果为异常，则确定该麦克风不正常；否则，确定该麦克风正常。

9.根据权利要求6所述的装置，其特征在于，所述装置还包括：

10.根据权利要求6所述的装置，其特征在于，

所述第一声源定位模块，具体用于建立坐标系，所述坐标系的原点与所述矩形的中心重合，横轴平行于所述矩形水平方向的边，纵轴平行于所述矩形垂直方向的边；获取该组三麦克风阵列中位于所述矩形对角的两个麦克风接收到语音信号的时间差，并将所述时间差与声音传播速度的乘积确定为声源距该两个麦克风的距离差；以该两个麦克风的位置为焦点以及该两个麦克风的距离差为实轴长建立双曲线；根据所述双曲线的渐近线的斜率以及所述语音信号到达该组三麦克风阵列中每个麦克风的先后顺序确定相对所述视频设备的镜头的声源角度。