WO2011088796A1

WO2011088796A1 - 拾音控制方法和装置

Info

Publication number: WO2011088796A1
Application number: PCT/CN2011/070452
Authority: WO
Inventors: 苏红宏
Original assignee: 华为终端有限公司
Priority date: 2010-01-22
Filing date: 2011-01-21
Publication date: 2011-07-28
Also published as: CN102137318A; CN102137318B

Description

拾音控制方法和装置本申请要求于 2010年 1月 22日提交中国专利局、申请号为 201010103244.4，发明名称为"拾音控制方法和装置 "的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及多媒体技术领域，具体涉及拾音控制方法与装置。

背景技术

在使用视讯会议时往往需要对拾取声音的区域进行控制，例如，将某个声音拉近（放大），再如，避开噪声源等；以达到更好的视讯会议效果。目前，主要有两种拾音控制方法。

方法一、基于控制麦克风在圓筒遮挡物中的位置的拾音控制方法。

麦克风位于圓筒遮挡物中，在调整光学镜头角度（zoom ) 时，麦克风在圓筒遮挡物中的位置也会随之发生变化，从而实现了拾音控制。

方法二、基于左右声道输出的拾音控制方法。

对于两个全向 MIC (麦克），通过控制各自放大器的增益，实现对 MIC的 zoom控制。这样，利用左右声道输出实现了广角 /拉近。

在实现本发明的过程中，发明人发现：方法一仅实现了 zoom调整，不能进行水平和垂直方向的调整，不能产生拾音的远近位置感的变化，且 zoom调整的精度较低；另外，方法二必须通过双声道输出实现拾音控制，不能适用于单声道的拾音环境中，且不能进行拾音的接口化控制。综上可以看出，现有技术无法对拾音设备进行拾音区域接口化的控制，导致拾音设备的控制复杂且控制方式单一。

发明内容

本发明实施方式提供的拾音控制方法和装置，以实现了拾音过程中的接口控制。

本发明实施方式提供的拾音控制方法，包括：接收控制信号，并根据所述控制信号确定目标拾音区域的拾音区域调节参数，所述拾音区域调节参数用于调节所述拾音设备，使所述拾音设备调节到目标拾音区域；

根据所述拾音区域调节参数对所述拾音设备中的至少一个麦克风进行拾音控制，使所述拾音设备输出的音频信号对应的拾音区域与所述目标拾音区域相付。

另一方面，还提供一种拾音控制装置，该装置包括：

接收模块，用于接收控制信号，并根据所述控制信号确定目标拾音区域的拾音区域调节参数，所述拾音区域调节参数用于调节所述拾音设备，使所述拾音设备调节到目标拾音区域；

拾音控制模块，用于根据所述拾音区域调节参数对所述拾音设备中的至少一个麦克风进行拾音控制，使所述拾音设备输出的音频信号对应的拾音区域与所述目标拾音区域相符。

通过上述技术方案的描述可知，本发明实施例通过接收针对拾音设备的拾音区域控制信号、以及由该拾音区域控制信号确定目标拾音区域的拾音区域调节参数来实现对拾音设备中的麦克风的拾音控制，本发明的实施例能够使得对拾音设备拾音区域的控制更加方便。

附图说明为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1是本发明实施例一的拾音控制方法流程图；

图 2是本发明实施例二的基于权重的拾音控制方法的原理示意图；图 3Α是本发明实施例三的拾音控制方法流程图；

图 3Β是本发明实施例三的麦克风分布示意图；

图 4是本发明实施例四的音源与麦克风位置示意图；

图 5Α是本发明实施例五的设置有麦克风的云台示意图；图 5B是本发明实施例五的麦克风拾音角度的示意图；

图 5C是本发明实施例五的在极坐标系中画出的波束图；

图 6A是本发明实施例六的音源与麦克风位置示意图；

图 6B是本发明实施例六的波束图；图 7是本发明实施例三中 P = ⁰²时的波束图；图 8是本发明实施例三中 = °-⁷时的波束图；

图 9是本发明实施例的麦克风和摄像头共用云台的示意图；

图 10是本发明拾音控制装置实施例一的组成示意图；

图 1 1是本发明拾音控制装置实施例二的组成示意图；

图 12是本发明拾音控制装置实施例三的组成示意图；

图 13是本发明拾音控制装置实施例四的组成示意图；

图 14是本发明拾音控制装置实施例五的组成示意图；

图 15是本发明拾音控制装置实施例五中控制单元的组成示意图；

图 16是本发明拾音控制装置实施例六的组成示意图；

图 17是本发明一个实现方案的框图。

具体实施方式实施例一、拾音控制方法的实施例。该方法的流程如附图 1所示。

图 1 中， S300、接收对拾音设备进行拾音区域控制的控制信号，通过所述控制信号使得拾音设备的拾音区域调节到目标拾音区域。

可选的，这里拾音设备可以包含有一个或多个麦克风。这里的麦克风可以为全向性麦克风或指向性麦克风，多个麦克风可以构成麦克风阵列。

可选的，麦克风阵列中的所有麦克风，可以位于同一平面上，例如，所有麦克风组成一个平面多边形，该多边形可以是边长相等的正多边形，而且，在多边形的中心位置可以设置一个麦克风。可选的，本实施例中的拾音设备还可以针对背景音拾取设置一个专用麦克风，背景音专用麦克风可以与拾音设备中的其他麦克风位于同一平面，也可以与拾音设备中的其他麦克风位于不同的平可选的，拾音设备中的所有麦克风也可以位于不同平面上，一个具体的例子为：所有麦克风以多棱推的形状分布，所述多棱锥的顶点为麦克风的位置，这里的多棱推可以为：三棱锥、四棱锥、五棱锥或更多边的棱锥等等。可选的，棱锥的底部可以是正多边形，且棱推的顶点可以位于垂直于正多边形且穿过正多边形的中心的直线上。

可选的，上述接收的至少一个麦克风的进行拾音区域控制的控制信号可通过网络接口接收，此时控制信号可以是基于远端控制协议的控制信号。网络接口可以是基于分组交换的 IP 网络接口，也可以是基于电路交换的 ISDN或 E1 网络接口等。网络接入的接入方式可以包括有线（如以太网、 xDSL、 xPON )接入方式和无线（如 WiFi、 GSM, WiMAX )接入方式。

可选的，上述接收的进行拾音区域控制的控制信号也可以是通过本地控制接口接收，如接收的控制信号是遥控器发出的、通过本地控制接口传输的控制信号。本地控制接口可以是有线接口（如 RS232等），也可以是无线接口（如红外接口、蓝牙接口等）。

可选的， S300中的控制信号包含的内容可以有多种不同的情况，例如，该控制信号包含有启动拾音控制的信息；控制信号除了包含有启动拾音控制的信息之外，还可以包含有拾音控制时长、或拾音控制的调整步长信息、或目标拾音区域信息或拾音控制次数等参数的任意一个或多个。

可选的，控制信号可以包含有终止进行拾音控制的信息或继续进行拾音控制的信息或者激活预存的目标拾音区域的信息。上述拾音控制时长可以通过定时器实现，即定时器超时前，执行后续的 S310和 /或 S320; 当定时器超时，则停止 S310和 /或 S320的执行。可选的，利用上述拾音控制的调整步长信息可以产生目标拾音区域的拾音区域调节参数，但是，该目标拾音区域有可能不是最终的目标拾音区域，而可能是一个完整的拾音控制过程中的临时的目标拾音区域。可选的，上述拾音控制次数可以通过计数器实现，即在计数器达到预定计数值前，正常执行后续的 S310和 /或 S320; 当计数器达到预定计数值时，停止后续的 S310和 /或 S320的执行。控制信号具体包含的内容在后续实施例中有详细的举例说明。另外，控制信号采用的协议、以及具体的格式可以根据实际需要来设置，本实施例不限制控制信号采用的具体协议以及具体格式。

S310、根据所述控制信号确定目标拾音区域的拾音区域调节参数。即将接收到的控制信号转换为目标拾音区域的拾音区域调节参数。

当该控制信号包含有启动拾音控制的信息时，可以基于拾音控制的调整步长信息确定出目标拾音区域，例如，根据拾音设备麦克风的当前位置和调整步长信息确定目标拾音区域。此时，可以根据调整步长信息来进行拾音区域调节参数的转换处理操作。这里的拾音控制的调整步长信息可以是控制信号中携带的信息，也可以是本地预先设置的信息。

可选的，当控制信号中包含有启动拾音控制的信息和拾音控制时长时，可以根据调整步长信息在拾音控制时长内持续的进行拾音区域调节参数的转换处理操作，直到达到拾音控制时长，或者直到接收到包含有停止拾音控制信息的控制信号，从而可以持续的产生多个拾音区域调节参数。这里的拾音控制的调整步长信息可以是控制信号中携带的信息，也可以是本地预先设置的信息。

可选的，当控制信号中包含有启动拾音控制的信息和拾音控制次数如 n ( n 为大于 0的整数）时，可以根据调整步长信息进行 n次拾音区域调节参数的转换处理操作，从而可以产生 n个拾音区域调节参数。在拾音区域调节参数的转换处理操作还没有达到 n次但接收到包含有停止拾音控制信息的控制信号，则可以不再进行后续的转换处理操作。这里的拾音控制的调整步长信息可以是控制信号中携带的信息，也可以是本地预先设置的信息。

可选的，当控制信号中包含有目标拾音区域信息时，可以根据该控制信号中的目标拾音区域信息得到拾音区域调节参数。

可选的，当控制信号中包含有启动拾音控制的信息，但不包含拾音控制时长、目标拾音区域信息和拾音控制次数等信息时，可以根据调整步长信息持续的进行拾音区域调节参数的转换处理操作，直到接收到包含有停止拾音控制信息的控制信号。另外，也可以根据调整步长信息只进行一次拾音区域调节参数的转换处理操作，而不是持续的进行拾音区域调节参数的转换处理操作。这里的拾音控制的调整步长信息可以是控制信号中携带的信息，也可以是本地预先设置的信息。

拾音区域调节参数可以根据调节拾音设备拾音区域方式的不同而有多种不同的形式。

( 1 ) 当控制信号包括对拾音设备所拾取的信号进行信号变换的指令时，从信号变换的指令中提取对所述拾音设备的至少一个麦克风所拾取的信号进行信号变换的参数；

其中，对拾音设备的至少一个麦克风的信号进行信号变换的参数包括：所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

( 2 ) 当控制信号包括对所述拾音设备进行位置移动控制的指令时，从位置移动控制的指令中提取对拾音设备至少一个麦克风进行平移和 /或转动的位置移动参数；

( 3 ) 当控制信号包括对拾音设备进行是否拾音的指令时，从是否拾音的指令确定目标拾音区域的拾音区域调节参数包括：根据控制信号确定目标拾音区域，并根据声源定位算法确定声源的位置；判断所述声源的位置是否位于所述目标拾音区域内，如果是，则所述拾音区域调节参数为拾音确认参数，否则为非拾音确认参数。

下面对拾音区域调节参数包含的内容进行举例说明。

例 1、采用信号合成的方法调节拾音设备拾音区域：对多个麦克风拾取的音频信号的相位和幅度进行处理，产生合成信号，拾音区域调节参数可以包括各麦克风对应的幅度调整参数的权重值和对于各麦克风拾取的音频信号的对应的相位调整参数的延迟参数。此时拾音设备中应设置有多个麦克风。

例 2、采用机械调节方法调节拾音设备拾音区域方：即此时拾音设备所包括的麦克风分别具有相应的物理遮挡结构，该物理遮挡结构用来对该麦克风的拾音角度进行调节，即通过调节麦克风的物理位置（方位）和 /或调节麦克风拾音的物理遮挡，使得麦克风拾取的音频信号的区域发生改变。此时拾音设备中可以设置有一个或多个麦克风。

例 3、采用信号合成和机械调节结合调节拾音设备拾音区域：拾音方位和拾音角度（范围）部分由上述信号合成方法调整，部分采用上述机械调节方法调整。如拾音方位通过机械方式的云台调整，拾音角度通过信号合成的波束形成方法进行调整。

例 2、通过声源定位方法调节拾音设备拾音区域：利用声源定位算法确定声源是否位于设置的拾音区域内，如果声源位于设置的拾音区域内，则控制麦克风拾音并输出音频信号，如果声源位于拾音区域之外，则控制麦克风不进行音频信号的拾音或即使拾取该音频信号，但不对上述的音频信号进行输出。声源定位可以采用 TDOA ( Time Difference of Arrivals , 到达时延）技术，该技术采用多个位置不同的麦克风，求出声音到达不同位置麦克风的时延，在利用这些时延求得声音到达不同位置麦克风的距离差，最后用几何关系或搜索确定声源位置，这种方法是应用广泛声源定位技术中的一种，具体实现不再赘述，可以理解，本领域的普通技术人员通过 TDOA技术的教导与启发，还可以想到其他的声源定位算法，对此，本发明的实施例不进行限制。

上述列举 4个调节拾音设备拾音区域方式的例子可以单独应用，也可以组合应用，相应的，上述列举 4个拾音区域调节参数包括参数信息的例子可以单独应用，也可以组合应用。

由于拾音区域调节参数包含参数信息的不同，将控制信号转换为目标拾音区域的拾音区域调节参数的具体实现过程也会有所不同，具体的转换过程在下述实施例中有详细的例子记载，在此不再详细说明。无论转换处理是如何具体实现的，转换后的拾音区域调节参数应该是目标拾音区域对应的拾音区域调节参数，即转换原则为：转换后的拾音区域调节参数应该使拾音设备的拾音区域与控制信号对应的目标拾音区域基本相符。

S320、根据所述拾音区域调节参数对所述拾音设备中的至少一个麦克风进行拾音控制，从而使拾音设备输出的音频信号对应的拾音区域与目标拾音区域相符。

即进行拾音控制后，拾音设备针对目标拾音区域进行拾音。

针对步骤 310后面的三种情况，根据拾音区域调节参数对拾音设备至少一个麦克风进行拾音控制包括：

( 1 )根据信号变换的参数对拾音设备至少一个麦克风拾取的音频信号进行相应的变换得到变换后的信号，将此变换后的信号与拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于目标拾音区域的音频信号；

具体的，根据幅度调整参数和 /或相位调整参数对拾音设备的至少一个麦克风拾取的音频信号的幅度和 /或相位进行相应的变换得到变换后的信号，将此变换后的信号与拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减 'J、不属于目标拾音区域的音频信号。

( 2 )利用平移和 /或转动的位置移动参数对拾音设备中的至少一个麦克风进行平移和 /或转动控制，将拾音设备的至少一个麦克风进行平移和 /或转动控制之后所获取的音频信号与拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于目标拾音区域的音频信号；

( 3 ) 当获取到拾音确认参数时，控制拾音设备的至少一个麦克风进行音频信号拾取，否则，控制拾音设备的至少一个麦克风不进行音频信号的拾取。

可选的，还可以对拾音设备中各个麦克风所拾取的音频信号的合成信号的增益进行调整，所述增益随所述拾音设备的拾音角度的减小而增大。

S320的拾音控制的第一个具体的例子为：根据目标拾音区域的拾音区域调节参数中的权重值和延迟参数对拾音设备中的各麦克风拾取并输出的音频信号的相位和幅度进行调整，以滤除不属于目标拾音区域的音频信号。

需要说明的是，上述的利用幅度调整参数以及相位调整参数对麦克风进行的调整，可以针对拾音设备的单一的麦克风进行，也可以针对拾音设备的多个麦克风进行。其中，针对拾音设备的单一的麦克风进行控制，通过权重值调整该麦克风的拾取的音频信号的幅度，通过延迟参数调整该麦克风所拾取的音频信号的相位，将调整之后的该麦克风采集到的音频信号与其他麦克风采集的信号进行合成得到最终拾音设备输出的音频信号；当上述控制信号是针对拾音设备的多个麦克风进行拾音控制时，通过待调整的麦克风的对应的权重值对所述待调整麦克风拾取的音频信号的幅度进行调整，通过待调整的麦克风对应的延迟参数对所述待调整麦克风拾取的音频信号的相位进行调整，将上述调整后的各麦克风的音频信号进行合成得到最终拾音设备输出的音频信号。

需要说明的是，对麦克风进行音频信号进行幅度和 /或相位调整后，需要对拾音设备中各个麦克风拾取的信号进行合成，对各麦克风进行信号合成技术已经是现有技术，在此不再进行赞述。

S320的拾音控制的第二个具体的例子为：根据目标拾音区域的拾音区域调节参数中的麦克风拾音角度对应的移动位置参数调整麦克风遮挡物和麦克风的相对位置，如移动遮挡物的位置，再如移动麦克风的位置，还有，移动遮挡物和麦克风的位置。

S320的拾音控制的第三个具体的例子为：根据目标拾音区域的拾音区域调节参数中的麦克风所在云台的位置调节参数对麦克风所在云台进行水平和 /或俯仰位置的调整。

S320的拾音控制的第四个具体的例子为：根据目标拾音区域的拾音区域调节参数中的是否拾音的参数判断各麦克风对应的是否拾音的参数为拾音还是非拾音，如果一个麦克风对应的参数为拾音，则控制该麦克风拾取音频信号并输出，即能够获得该麦克风拾取的音频信号；如果一个麦克风对应的参数为非拾音，则可以控制该麦克风不拾取音频信号，或者不接受该麦克风拾取的音频信号。

S320中列举的上述四个具体例子都可以单独应用，也可以任意组合应用。需要特别说明的是，上述实施例一中 S310和 S320的执行流程可以为：产生一个拾音区域调节参数，执行一次拾音控制，然后，再产生一个拾音区域调节参数，再执行一次拾音控制。 S310和 S320的执行流程也可以为：在产生多个拾音区域调节参数后再根据拾音区域调节参数的产生顺序依次执行拾音控制，在这种执行流程中，如果接收到停止拾音控制的控制信号，即便是还存在有一个或多个已经产生但还没有应用的拾音区域调节参数，也不再执行 S320。

可选的，在执行了 S320之后，可以包括：对各麦克风合成之后的音频信号的增益进行调整。所述增益随着所述拾音设备的拾音角度的减小而增大。对音频信号的增益进行调整可以采用现有的增益调整实现方式，本实施例不限制增益调整的具体实现过程。另外，可选的，在执行了 S320之后，还可以包括：向控制终端返回拾音设备在拾音控制后的当前拾音区域信息，该当前拾音区域信息可以以波束图的形式表示，也可以以方位角度和拾音角度数值等形式表示。一个具体的例子为：在持续产生多个拾音区域调节参数的应用场景中，每根据一个拾音区域调节参数进行拾音控制后，都向控制终端返回对应的波束图。这里的控制终端可以为通过网络接口与拾音设备连接的网络设备，也可以为通过本地接口与拾音设备连接的网络设备。这里的控制终端可以为发送 P/T/Z ( Pan/Tilt/Zoom, 即全方位 (包括：上下、左右）移动及前后控制）控制信号的网络设备。

从上述实施例一的描述可知，实施例一的拾音控制方法可以通过 PTZ控制信号、以及对 PTZ控制信号的转换处理来实现对拾音设备中的麦克风的拾音控制，由于 PTZ控制信号可以通过网络接口以及本地控制接口传输，因此，实施例一可以实现拾音的远端控制，适合应用于视讯会议等应用场景中。通过采用权重值、麦克风和遮挡物的相对位置、云台的水平和垂直位置的调整、以及是否拾音等多种方式对麦克风进行拾音控制，不但可以实现水平方向、垂直方向以及角度的拾音控制，使拾音设备的拾音控制方式更加灵活，而且可以对麦克风的拾音进行细致精确的控制。另外，实施例一的拾音控制方法可以很好的适用于多声道或单声道的拾音设备中。下面以几个具体的实现过程为例对本发明的拾音控制方法进行举例说明。由于下述每个实施例均有描述的侧重点，因此，下述各实施例可以选择性的组合应用。对于很多组合应用的具体实现过程不再详细说明。

实施例二、基于信号合成的方式进行拾音控制方法。采用固定波束形成法生成并输出音频信号的拾音控制方法的原理如附图 4所示。

在图 2中，拾音设备设置有 m个麦克风， m个麦克风输出 m路音频信号，图 2中省略示出了第 3路至第 m _ 1路音频信号。拾音设备输出的音频信号 Y(t)

式（1 )

其中， '为第 i路麦克风拾取的音频信号，或者说是拾音设备的第 i路输入信号， Y为拾音设备输出的音频信号， ^w '是针对第 i路音频信号分配的权重值， m是拾音设备中的麦克风数量， ^τ '是针对第 i路麦克风设置的延迟调整参数。

针对图 2的拾音控制过程可以为：接收 PTZ控制信号，将 PTZ控制信号转换为上述权重值^ '和延迟参数 ^τ'，然后，根据转换后的权重值 ^w'和延迟参数 ^τ '利用式（ 1 )对产生合成信号，从而获得与目标拾音区域相符的音频信号输出。上述接收到的 ΡΤΖ控制信号可以包含有水平方向的调节信息、俯仰方向的调节信息和拾音角度调节信息等。将 ΡΤΖ控制信号转换为权重值^ '和延迟参数 ^τ '的具体实现过程在下述实施例中有详细的举例说明。实施例三、以麦克风（即拾音设备）进行 zoom的参数调节来说明基于权重值的采用预设置的调节步长的拾音控制方法。在对拾音设备的麦克风进行的拾音控制为对麦克风进行 Z ( zoom )调节的情况下，该方法的流程如附图 3A所示。

图 3A中， S500、接收到启动 Zoom调节指令，

通过网络接口或者本地控制接口接收到包含有进行 ZOOM调节的 PTZ控制信号。此时的 PTZ控制信号称为启动 ZOOM调节指令。可选的，在接收到启动 ZOOM调节指令后，可以针对 ZOOM调节指令启动定时器，该定时器的定时时长可以从启动 ZOOM调节指令中获取，也可以从本地预先存储的信息中获取，如采用缺省的定时时长。

S510、根据拾音设备麦克风的当前拾音角度 Z和预设置的 ZOOM调节步长 ΔΖ计算出麦克风需要调整到的拾音角度。麦克风需要调整到的拾音角度即目标拾音区域对应的拾音角度。麦克风需要调整到的拾音角度为 ² 且 = Ζ ± ΔΖ。

S520、基于计算出拾音设备中各麦克风的权重值 ^w'，例如，利用和其他参数计算出拾音设备中各麦克风的权重值 ^w'，这里的其他参数可以为阵列麦克风几何参数、门限以及其他一些约束条件（具体参见实施例）等。

S530、使用 ^w '对拾音设备的各麦克风输出的音频信号进行处理，使拾音设备输出与上述 S510中记载的目标拾音区域相符的音频信号。

S540、将拾音设备麦克风的当前拾音角度 Z调整为 ² 。

S550、判断是否通过网络接口或本地控制接口接收到包含有停止拾音控制信息的 PTZ控制信号，包含有停止拾音控制信息的 PTZ控制信号可以称为停止 ZOOM调节指令，如果接收到停止 ZOOM调节指令，则到 S560，否则，到 S510，继续针对麦克风进行拾音角度的调节。

可选的，如果在 S500中启动了定时器，则在 S550中还应该判断定时器是否超时，无论是接收到停止 ZOOM调节指令还是定时器超时，则均应到 S560。

可选的，在 S530或者 S540或者 S550或者 S560之后还可以包括：向控制终端返回进行 ZOOM调节后的波束图信息，这样，控制终端可以获知跟随 ZOOM 调节变化的波束图，从而控制终端可以根据返回的波束图判断出是否实现了其需要的拾音控制，在判断出实现了其需要的拾音控制后，控制终端可以发送停止 ZOOM调节指令。当然，上述波束图信息也可以替换为 ZOOM数值等形式。

S560、终止针对麦克风的 ZOOM调节。

在实施例三中，拾音设备可以设置有一个或多个麦克风。作为举例，在拾音设备中设置有 5个麦克风的情况下，这 5个麦克风的分布可以如附图 3B所示。图 3B中的麦克风 1、麦克风 3、麦克风 4和麦克风 5的分布呈正方形，麦克风 2 位于正方形的中心， 5个麦克风的外侧设置有遮挡物套筒。套筒可以沿 5个麦克风所在平面的法线方向移动。虽然图 3B中示出了套筒，但是图 3A示出的流程并没有调整麦克风和套筒的相对位置，如果需要调整麦克风和套筒的相对位置，则上述图 3A中的 S520和 S530可以替换为调整麦克风和套筒的相对位置，例如，套筒沿麦克风所在平面的法线方向移动，由于套筒对麦克风拾音区域的遮挡范围发生了改变，因此，麦克风的拾音角度也会随之发生变化。使麦克风移动也是同样的。

上述实施例三是以 Z调节为例进行说明的， P (水平，即左右）调节和 T (俯仰，也即上下垂直）调节的具体实现过程与上述 Z调节的具体实现过程基本相同，另外上述实施例是以调节是以对权重的调节进行说明的，对延迟、云台等的调节也是类似的过程，在实施例三中不再详细说明。实施例四、以麦克风为例对 P ( Pan )、 T ( Tilt )参数进行控制，其中， Pan 是对麦克风的上下位置调整， Tilt是对麦克风的左右位置调整。本实施例将结合附图 3B所示的麦克风分布情况重点描述根据 PTZ控制信号确定目标拾音区域的拾音区域调节参数的具体实现过程。

设定接收到的 PTZ控制信号是针对麦克风的 P和 T分别进行拾音控制的 PTZ控制信号。

为简化分析，分别对水平和垂直方向进行计算，在针对拾音设备的 P进行拾音控制时，简化为一线性麦克风阵列，采用平面波模型，如附图 4所示，目标音源与中心麦克风即麦克风 2 的连线与麦克风阵列法线方向的夹角为 Θ，如果法线方向为原音源的初始位置，则 Θ为麦克风需要进行拾音控制的 P偏转角度。设定麦克风 i ( i=l， 2， 3 )接收到的声波（即音频信号）用复指数形式表示为：

-l 戈 ( ) 其中， ω为声波的角速度， λ为声波的波长， c为声波传递速度， d为阵元间距（麦克风之间的距离），振幅等效为 1。 t为时间。

( \ 2πά . ( \ cod . ( \

a x ) = sml ) =—— sml )

在设定 L ^{λ c} 的情况下，上述式（2 )可以变化为：

X.(t) ^ e^Jia"-^{i-^l)a] 式（3 ) 此时，拾音设备输出的音频信号即合成信号为:

= w_xe ^& e^Jat + w₂e'^{j{a+6}T2 }}e^Jat + w,e'^i(2a^、e^{j t} 式（ 4 ) 为了使合成信号沿 Θ角方向最大（合成信号的振幅最大），需要使 e— 在 i取不同数值时均相等，同时，为了避免针对麦克风进行垂直方向的拾音控制时影响麦克风 2，需要将延时参数^设置为 0，因此可得：

ωτ_χ = 2kn + a

r₂ = 0

2a + ωτ₃ = 2ηπ + α 式 ( 5 )

其中， k和 n为任意整数。

如果设定 k=n=0，则可以得到各拾音设备延迟参数的一组设计：

( 6 )

类似的，当调整拾音设备的俯仰（T )拾音角度为 η后，可以获得:

式（7 )

其中， d可以根据实际的约束情况进行设计，例如根据实际的空间尺寸限制条件设计 d， d的取值可以为 0.2m。本例中只需要通过延迟控制就可以调节拾音方向， ^w'可以根据实际情况进行设计，例如， ^w'的取值可以为 l/m，其中， m为麦克风的数量，在 5个麦克风的情况下， ^w'可以为 1/5。从上述实施例四的描述可知，在接收到与 0和"相应的水平旋转和俯仰调节的 PTZ控制信号后，根据上述实施例四记载的方法获得 ΡΤΖ控制信号转换后的各麦克风对应的延迟参数 ^〜以及权重值 ^w' (i的取值为 1至 5)，之后，利用

^〜和对各麦克风拾取的音频信号进行处理，即可获得与期望的拾音区域 (目标拾音区域）基本相符的音频信号。实施例五、利用机械的旋转控制机构进行俯仰和 /或水平旋转、以及权重值的方式来实现拾音控制的方法。在本实施例中，以云台为机械的旋转控制机构为例对拾音控制方法进行说明。

图 5Α示出的云台上设置有 5个麦克风，云台可以通过步进电机的控制进行水平和垂直方向的移动，进而改变了麦克风的拾音方位。

实施例五中麦克风的拾音角度也可以进行调整，例如，通过控制麦克风拾取音频信号的延迟参数和权重值对麦克风的拾音角度进行调整；再例如，通过控制麦克风拾取的音频信号的增益对麦克风的拾音角度进行调整。下面主要对麦克风拾音角度（ZOOM) 的调整进行详细说明。

针对麦克风的 ZOOM的水平方向的拾音控制如下：

由于云台可以转动，因此，麦克风方位角的调整可以通过云台实现，因此对于阵列麦克风，可以视为 Θ为 0，因此，麦克风的相位延迟参数 ' ^=G，对于与法线成任意角度 δ的声波，其合成信号为：

-j

Y(t) =∑_Wie^J0}te

we^iat + w₂e-^Ja{s)e^JO}t + w₃e-^j{2a{s))e^j0}t

式（8 )

合成信号的振幅平方为:

|7( |² = iw_xe^ia(s) +w₂+ w₃e-^{Ms) Ms)}e^Ja}t

- \w_x cosa oJJ + w₂ + w₃ cos- a{ + sma{d))-\- w₃ sm- a{

式（9) 为简化设计，可以令 w.

Wi 则有 Y(t)

式（10) 进行 ZOOM调节时，如附图 5B所示，相当于拾音设备调整的拾音角度为 2 φ ,当声源位于拾音角度 Φ方位时（边界，即图 7B中的两条用实线表示的射线），合成信号的振幅衰减到法线方向 ( = 0 )振幅的 P ( <ρ<1 )倍，即：

-hw₂=px {lw_x + w₂ ). ¾(2w₁/(^)+ w₂)> 0 (1)

+ w₂ =-p {lw_x +w₂), ¾(2w₁/(^)+ v₂)<0 (2) 式（11 ) 使用式（11 ) 的（1 )可得:

-当 2 + Η > 0

式（12)

设定和^大于 ο，则由式（11 ) 中的（1 )可得

Λ )<Ρ 当 (2^ +w₂)>0 式（ 13 ) π

为了使得 δ在 ο~ 2范围内取值时，可以单调变化，需要使 αδ

结合式（13 )可得到的取值范围约束为:

2nd

arccos(yC>)< sin )<π

λ ^, 式（14)

设定 ^的最大值为 ^ 最小值为 ">，则有：

> arccos( )

2π 式（15 )

由于在窄带情况下，是已知的，因此，可以确定出阵列麦克风的参数 λ

d<

^2sin^- 。为了便于阵列麦克风的工程制作可以获取较大的的取值范围， λ λ d d< 而且， d可以选择较大值，例如 in ，当然， d也可以选择满足 ^2sin 条件的其他值。

如果对 ^W '进一步施加约束，则可以求出 ^W'。施加约束的一个具体的例子为：设置条件∑^=^。

通过如上描述可知，拾音设备中的麦克风的相关参数的一组设计可以表示为如下形式：

式（16 )

式（17 ) 当 Ssin ax时，有 λ

d

² sin

C{\-p

arccos(7)xsin(^_I

Φ ^arcsi

式（18)

下面是拾音设备中的麦克风的相关参数的一个具体的设计例子: 设定

则拾音设备中的麦克风的相关参数为：

= τ₂ = τ₃ = 0

d ¾ 0.0577w = 5.11cm

w_l ¾ 0.136

w₂ ¾ 0.728

w₃ ¾ 0.136

^_mm> 0.093215^, 可取 _m=0.b 式（19)

拾音设备输出的合成信号为：

2nd

\Y(t)\ = 2w cod—— ύη(δ) \ + w₂ = 0.272cos(3.63sin^)+ 0.728

式（20) π

+ δ

如果以为极角，以为极径，则在极坐标系中画出的波束图可以如附图 5C所示。

从图 5C示出的波束图可以看出，在 180度到 360度（相当于拾音设备的背面）也可以拾取到音频信号，在实际应用中可以通过遮挡拾音设备的背面或者假设拾音设备的背面没有音源来避免从背面拾取到的音频信号的影响。如果针对麦克风的 ZOOM 的垂直方向的拾音控制采用与针对麦克风的 ZOOM 的水平方向的拾音控制类似的方式进行设计，则拾音设备中的麦克风的

在实施例五中，由于 P和 T是通过云台进行调整的，而 ZOOM是通过权重值进行调整的，因此，在接收到 PTZ控制信号后，应将 PTZ控制信号转换为 PT 调节指令和 Z调节指令，使用 PT调节指令来控制云台的移动，使用 Z调节指令来控制麦克风的 ZOOM。 PT调节指令如水平向左调节预定步长、水平向右调节预定步长、俯仰向下调节预定步长、以及俯仰向上调节预定步长等。上述 PT调节指令和 Z调节指令都属于目标拾音区域的拾音区域调节参数。

对于更多麦克风（m=2k+l个）组成的拾音设备，可以容易的建立更为一般的方程来求解：

设有 m=2k+l个麦克风，编号 i分别为 -k， ...0,...k, 其中第 0个为中间麦克风，麦克风之间间距为 d

式（ 22 )

对于上式可以根据情况增加各种约束求解，下面给出一种求解方法:

令 ,·可以得到： Υ(

( 23 )

- 面 3麦克风的求解，可解得:

式（24 )

类似的可求得一个保守的取值范围

λ

d <

2^sin^_m 式（25 ) 实施例六、基于多个麦克风进行信号合成的控制方式。

在实施例六中，拾音设备包括的多个麦克风不在同一平面上，多个麦克风的分布形状呈棱推形。一个具体的分布例子为：图 5Β示出的 5个麦克风中的麦克风 2与其他四个麦克风不处于同一平面，此时，可以形成一个以麦克风 1、 3、 4和 5为底面，以麦克风 2为顶点的四棱推。在将麦克风 2突出于其他麦克风所在的平面之前，麦克风 1、 2和 3与音源的位置关系如附图 6Α所示。

图 6Α中，麦克风 1、 2和 3构成一个等边三角形，为音源与水平线之间的夹角，而不是音源与法线之间的夹角，相应的，调节的拾音水平（P )方向偏

( _π \

- - Θ

转角度为人

下面结合附图 6Α对水平方向的拾音控制进行说明。

拾音设备的合成信号可以表示为：

,ί 2 d ( π ) ( 2 d ( 2π ) -j\ ωτ_χΛ cos θ -j\ ωτ₃-\ cos 0

= w_xe ^{{ λ J)}e^jat +w₂e-^Jca^e^jcot +w₃e ^{[ λ J)}e^jM 式（₂₆) 为了使合成信号沿 Θ角方向最大，即为了使合成信号沿 Θ角方向的振幅最大，需要使合成信号的相位相同，式（26) 的其中一组解为：

式 (27) 为了使 '^≥Q，可以给所有延迟器增加一个统一的延迟量，或给某些延迟 9<L

2π

(即某个延迟参数）增加一个周期，不影响输出的合成信号。

与水平方向的拾音控制类似的，在调整俯仰（Τ)的拾音角度为 η后，可得

式（28) 根据 ZOOM调节来确定权重参数 ^w的过程为：

对于与方向成 ^-^)角的声波，拾音设备的合成信号可以表示为

Y(t) =∑w_ixX_i(t)xe

ί=1

2πά r Λ .2 d ( 2π .2 d ( 2π

-)- '-δ —— 0 -j cos ο j cos θ

'e^J e

式（29) 根据式（29)可知，对于给定的拾音方位 ^和拾音角度范围 ² 设定当声源位于拾音角度 ^方位时（ ^δ = ^θ±Φ ), 合成信号的振幅衰减到法线方向（ δ = θ )振幅的 Ρ ( 0< <1 )倍，即：

\Υ(θ士 )|

a(_Wl +w₂ +w₃ ). (5) 式（ 30 ) 利用式（30) 中的（5) 即可求解 ^w'，求解结果不是唯一的，可以通过增加一些约束条件再求解，该约束条件如∑^w' ^{= c}等。

2ώ-— --— -1

在 ^w'^>0的情况下，设定 ^Ψ_ ^Ρ_α— ， C = l，则可得：

+ w₂ + w₃e =— (^wi + j^-A ―卜

+ w₂ + w₃e

\we^J + w₂ +w₃e^J

」 + w₂ - 0.9477w₃ f + (- 0.3192w₃ f = + w₂ + w₃ )

_A/(-0.0553w₁ +w₂ -0.9939w₃)² +(0.998472w₁ -0.11067w₃)² =— ( w_l +w₂ + w₃)

ΗΊ + w₂ + w₃ = 1

W! =0.4112

w₂ =0.3286

由此可获得 ^w的一组解为： U¾^=Q'^26Q3。此时对应的波束图如附图 6B所示。

从图 6B示出的波束图可以看出，在目标拾音区域以外的一些方向（如图 6B 中的 330度附近）有较大的增益，在实际应用中，可以假设或布置这些区域没有音源来避免影响目标拾音区域。另外，也可以增加拾音设备中的麦克风数量，从而有效消除旁瓣的影响，增加麦克风数量如将图中的正三角形变换为正方形或五边形等等。需要说明的是，本发明实施例中的 PTZ控制，是为了更好地说明本发明采用的一种拾音区域控制实施例的描述方式，还会有其他的控制方式存在，对此，本发明不做限制。实施例七、基于声音定位来进行拾音控制，根据声音定位的结果是否在目标拾音区域内，发出拾音指令或者不拾音指令。

首先，通过声源定位算法确定声源方位，然后，判断声源方位是否落在麦克风的拾音区域内，如果落在麦克风的拾音区域内，则控制麦克风进行拾音，否则，控制麦克风不进行拾音或者不接收该麦克风拾取的音频信号。也就是说，选取拾音区域包含声源方位的麦克风，针对拾音区域包含有声源方位的麦克风拾取的音频信号进行处理。

下面针对上述实施例进行如下几点说明：

说明 1、上述各实施例中可以采用多种方法形成波束，例如，采用自适应波束形成法等。上述各实施例可以适用于窄带信号的拾音控制，也可以适用于宽带信号的拾音控制。对于宽带信号而言，可以采用子带波束形成法，且针对各子带可以采用自拾音波束形成法等多种方式形成波束。

说明 2、上述各实施例多是以 5个麦克风为例进行描述的，在实际应用中可以采用更多数量的麦克风，以达到更佳的拾音控制效果。

说明 3、当麦克风的拾音区域较小时，有较高的信噪比，即大量噪声在拾音区域之外，因此，还可以对麦克风对应的音频信号进行同步的增益控制，以体现出近大远小的感觉。在实际设计中，也可以直接使∑^W' ^{= C}随着拾音区域 ² 的减小而增加，例如，令 Φ ，其中的为比例常数。

另外，也可以通过声音呈现的位置控制，使得呈现出来的音源位置随拾音区域 ^的减小而变近，使得声音输出体现出声音拉近的感觉，例如，可以将目标拾音区域信息或者转换后的位置信息传递给音频设备的输出端，由输出端配合实现拾音控制，例如，采用阵列扬声器使得重现的音源位置改变。说明 3、在上述各实施例中，指定拾音区域（即目标拾音区域）外的声音作为背景音是可以被拾取的，通过调整的取值可以改变目标拾音区域的音频信号与背景音的比重。在希望背景音更加突出的情况下，可以取较大的值，在希望突出目标拾音区域内的声音，而对背景音进行更多滤除的情况下，可以取较小的值。一个具体的例子为：在实施例三中，如果 ^ ⁰·² , 则对应的波束图如附图 7所示；如果 ^二⁰'⁷，则对应的波束图如附图 8所示。

说明 4、在上述实施例中，拾音设备可以设置有专门用于拾取背景音的麦克风，如专门用于拾取背景音的全向麦克风。可以为专门用于拾取背景音的麦克风设置衰减系数，在根据衰减系数对拾取的背景音进行衰减后，再将衰减后的背景音与其他麦克风对应的合成信号叠加输出。

说明 5、在上述实施例中，如果需要使用云台，则该云台可以为麦克风专用的云台，也可以为麦克风和摄像头共用的云台。当麦克风和摄像头共用云台时，可以实现摄像和拾音的同步控制。麦克风和摄像头共用云台的情况可以如附图 9 所示。在图 9 中的云台上连接有一个摄像头和五个麦克风，五个麦克风即图 9 中标注的编号 1至 5。当云台水平或俯仰移动时，摄像头的摄像区域和麦克风的拾音区域均同时发生变化。在通过网络接口或者本地控制接口接收到 ΡΤΖ控制信号后，可以将 ΡΤΖ控制信号转换为 ΡΤ调节指令和 ZOOM调节指令，使用 PT 调节指令控制云台的移动，使用 ZOOM调节指令对摄像头和麦克风进行摄像控制和拾音控制。另外，图 9中还可以使用麦克风的遮挡物，这样， ZOOM调节指令可以用于调节遮挡物和麦克风的相对位置。

说明 6、在上述实施例中，为 PTZ控制信号设计 FMCC ( Fast Microphone Control Criteria，远端摄像机控制命令）协议， FMCC命令可以通过 H.224通道承载，也可以直接承载在 TCP/UDP等报文中。 FMCC命令的一个具体的例子如下各表所示：

表 1

FMCC 8 7 6 5 4 3 2 1 第一字节 Command 第二字节 Device

第三字节 Option 第 N字节表 1中的 FMCC命令包括 N个字节，每个字节包括 8bit，即表的每一行对应 1个字节，第一字节（command )为命令字，第二字节（device ) 为设备 ID，第二字节的取值可以为 0 ~ 255。当一个设备中设置有多个被控拾音设备，如多个被控麦克风时，可以通过设备 ID来区分被控拾音设备，当一个设备中只设置有一个被控拾音设备时，第二字节可以不定义。除第一字节和第二字节之外的其余字节为参数，不同命令字对应的参数也会有所不同，即不同命令的参数可以不同。表 1中的命令字的定义如表 2所示：

表 2

表 2中定义了 6种 FMCC命令，分别是启动 PTZ调整的 FMCC命令、继续 PTZ调整的 FMCC命令、停止 PTZ调整的 FMCC命令、存储 PTZ位置的 FMCC 命令、激活预存位置的 FMCC命令和发送数字波束图的 FMCC命令。

启动拾音设备 PTZ调整的 FMCC命令用于触发拾音设备进行拾音控制，即拾音设备接收到启动麦克风 PTZ调整的 FMCC命令后开始进行拾音控制。启麦克风 PTZ调整的 FMCC命令的一个具体的例子如表 3所示。

表 3

表 3中的 FMCC命令包括四个字节。第一字节用于表示该 FMCC命令为启动麦克风 PTZ调整的 FMCC命令。第二字节为设备 ID。第三字节和第四字节如下表 4所示。

表 4

字段含义长度值

( 比

特）

R/L Pan调整 2 不进行 Pan调整： 0x0

水平向左调节： 0x2 水平向右调节： 0x3

U/D Tilt调整 2 不进行 Tilt调整： 0x0

俯仰向下调节： 0x2 俯仰向上调节： 0x3

I/O Zoom调整 2 不进行 Zoom调整：

0x0

拾音区域变窄： 0x2 拾音区域变宽： 0x3

BP 传递波束图 2 不传递波束图： 0x00 带内传递波束图：

0x2

带外传递波束图：

0x3

Time 超时时间，超过 4 数值 0x0 ~ Oxf

out 超时时间后，设备停以 50毫秒为单位，

止连续调节，除非在比如 0x2表示 100毫秒，超时前收到继续调整 0x8表示 400ms

命令或启动调整命令

Reser 保留字段 4

ved 表 4中， R/L表示对麦克风的水平方向的拾音控制， U/D表示对麦克风的垂直方向的拾音控制， I/O表示对麦克风的 ZOOM的拾音控制， BP表示是否反馈波束图以及在反馈波束图时指示以何种方式反馈波束图， Time out表示超时时间，即拾音控制的定时时长， Reserved为保留内容。

当被控设备接收到的启动 PTZ调整的 FMCC命令指示需要回传波束图、且需要带外传递波束图（BP=0x03 )时，被控设备可以另外建立媒体通道，并利用该另外建立的媒体通道来传送波束图，被控设备也可以采用在已有图像上叠加波束图的方式通过已有的媒体通道传送波束图。之后，被控设备在接收到停止 PTZ调整的 FMCC命令后，关闭上述另外建立的媒体通道或者终止叠加波束图的操作。传送波束图的一个具体的例子为：在电视会议应用中，通过协商打开一个逻辑通道，以传送波束图，波束图可以采用 H.264等视频或图片编码协议压缩传送。传送波束图的另一个具体的例子为：在电视会议应用中，在摄像机捕获的活动图像或胶片内容图像上叠加波束图一起传送。

当被控设备接收到的启动 PTZ调整的 FMCC命令指示需要回传波束图、且需要带内传递波束图（ BP=0x02 )时，被控设备需要通过发送数字波束图的 FMCC 命令回传波束图信息，回传的波束图信息可以为波束图的坐标信息。

继续 PTZ调整的 FMCC命令用于促使拾音设备继续进行拾音控制，继续麦克风 PTZ调整的 FMCC命令的一个具体的例子如表 5所示。 Continue

action

第一字节 0xf2

第二字节 Device

第三字节 Time Reser

out ved 表 5中的 FMCC命令包括三个字节。第一字节用于表示该 FMCC命令为继续 PTZ调整的 FMCC命令。第二字节为设备 ID。第三字节的高 4比特 Time out 用于重新设置拾音控制的定时时长，即拾音设备根据继续麦克风 PTZ 调整的 FMCC命令中的 Time out的取值重新设置定时器，并继续进行 PTZ调节， Time out的取值可以与表 4中的 Time out的取值相同。第三字节的低 4比特 Reserved 为保留内容。

停止 PTZ调整的 FMCC命令用于控制拾音设备不再进行拾音控制，即拾音设备接收到停止 PTZ调整的 FMCC命令后停止拾音控制操作。停止 PTZ调整的 FMCC命令的一个具体的例子如表 6所示。

表 6

表 6中的 FMCC命令包括两个字节。第一字节用于表示该 FMCC命令为停止 PTZ调整的 FMCC命令。第二字节为设备 ID。停止 PTZ调整的 FMCC命令可以没有参数。

存储 PTZ位置的 FMCC命令用于触发拾音设备保存当前的 PTZ位置信息，即拾音设备接收到存储 PTZ位置的 FMCC命令后获取各拾音设备当前的 PTZ位置信息并存储，拾音设备当前的 PTZ位置信息可以对应有编号，在存储麦克风当前的 PTZ信息时，可以将对应的编号一起存储，以便于后续的索引。存储 PTZ 位置的 FMCC命令的一个具体的例子如表 7所示。

表 7

表 7中的 FMCC命令包括三个字节。第一字节用于表示该 FMCC命令为存储 PTZ位置的 FMCC命令。第二字节为设备 ID。第三字节的高 4比特的 Preset number表示位置编号， Preset number的取值范围可以为 0 ~ 15，拾音设备存储的内容可以是 Preset number的取值和该 Preset number对应的麦克风 PTZ位置信息。第三字节的低 4比特 Reserved为保留内容。

激活预存位置的 FMCC命令用于触发拾音设备根据预存的信息进行拾音控制，即拾音设备接收到激活预存位置的 FMCC命令后，获取预存的拾音设备 PTZ 位置信息，并根据预存的麦克风 PTZ位置信息进行拾音控制。激活预存的麦克风位置的 FMCC命令的一个具体的例子如表 8所示。

表 8

表 8中的 FMCC命令包括三个字节。第一字节用于表示该 FMCC命令为激活预存位置的 FMCC命令。第二字节为设备 ID。第三字节的高 4比特的 Preset number表示激活的麦克风 PTZ位置信息对应的位置编号，同样的， Preset number 的取值范围可以为 0 ~ 15。第三字节的低 4比特 Reserved为保留内容。设置拾音区域阀值用于设置拾音区域边缘相对于中心位置幅度衰减比例，可以达到调节目标拾音区域的音频信号与背景音的比重的效果，一个具体例子

^口表 9所示。

表 9

表 9中的 FMCC命令包括三个字节。第一字节用于表示该 FMCC命令为设置拾音区域阀值的 FMCC命令。第二字节为设备 ID。第三字节的高 4比特的 Threshold表示设置拾音区域边缘相对于中心位置幅度衰减比例，取值范围可以为 1 ~ 9，分别对应 0.1 ~ 0.9。第三字节的低 4比特 Reserved为保留内容。发送数字波束图的 FMCC命令用于拾音设备向控制终端反馈波束图，例如，被控设备在接收到启动麦克风 PTZ调整的 FMCC命令后，如果该 FMCC命令中的 BP表示带内传递波束图，则被控设备根据拾音设备当前的拾音区域生成波束图，并利用发送数字波束图的 FMCC命令发送波束图。发送数字波束图的 FMCC 命令的一个具体的例子如表 10所示。

表 10

节

第五字 Zoom区域（ 0 ~ 180，以 2度为单位）， Oxff表示无效矛 ^字波束图点数 n (0-65535 )

节当 n=0时，后面的参数忽略。

第七字

节

第八字波束图精度

节 1 Obit精度： 0x01

12bit精度： 0x02

16bit精度： 0x03

第九字波束图数据压缩方式

不压缩： 0x00

Zip: 0x01

Arj: 0x02

.... 以极坐标形式逐点描述的波束图（当波束图数据进行压第 N字缩时，这里将携带按照指定格式压缩的数据，此时需要根据

-i±- y 压缩数据的格式定义进行数据长度的确定和数据的解压）

Γ_ι,θ_ι,...η,θ_ί,...Γ_η,θ_η

^ 为第 i点的极坐标，每一个值的精度由波束图精度参数指定，取值范围为 0~360度，以浮点数表示，可以根据需要只传送部分角度区间， ^以无符号整数表示，取值在传送前线性变化到与精度对应的区间（比如采用 10位精度，则变化到 0~ 1023 )。表 10中的 FMCC命令包括 N个字节。第一字节用于表示该 FMCC命令为发送数字波束图的 FMCC命令。第二字节为设备 ID。第三字节用于表示拾音设备当前水平方向的数值，第四字节用于表示拾音设备当前垂直方向的数值。第五字节用于表示拾音设备当前的 ZOOM。第六字节和第七字节用于表示波束图的点数。第八字节用于表示波束图的精度。第九字节用于表示波束图的压缩方式。后续字节如表 10中的描述。

被控设备在执行带内回传波束图时，既可以只传送 P/T/Z角度信息，也可以只传送波束图，还可以二者同时传送。另外，被控设备也可以将波束图转换为直角坐标的描述方式来传送。这里的波束图可以采用极坐标方式逐点描述。被控设备可以根据需要利用该 FMCC命令传送稀疏的或致密的波束图，这里的稀疏或致密由 n的取值确定。接收波束图的接收端可以将接收到的波束图进行插值平滑处理。

也可以通过在已有的摄像机控制协议（如 H.281 协议）的命令中增加字段的方式实现针对拾音设备的 PTZ控制信号的传输以及波束图的传输。

当摄像机和拾音设备同时进行 PTZ调整时，摄像机可以跟随拾音设备进行 PTZ调整，不用在单独传送摄像机控制命令；也可以被控端设置拾音设备跟随摄像机进行 PTZ调整，这样就可以使用已有的摄像机控制协议同时调整拾音设备的 PTZ位置，也可以在摄像机控制协议的命令中指明拾音设备跟随摄像机进行调节（需要对摄像机控制协议进行扩展以便设置拾音设备跟随摄像机调整），或者也可以通过单独的协商指明拾音设备跟随摄像机进行调节；控制终端也可以同时发送针对摄像机的控制命令和针对拾音设备的控制命令实现二者的同步调整。

通过本地控制接口传输的 PTZ控制信号的命令与上述描述基本相似，这里不再对通过本地控制接口传输的 PTZ控制信号的命令格式进行详细说明。本发明提供一种拾音控制装置，包括：

接收模块，用于接收控制信号，并根据控制信号确定目标拾音区域的拾音区域调节参数，拾音区域调节参数用于调节拾音设备，使拾音设备调节到目标拾音区域；

拾音控制模块，用于根据拾音区域调节参数对拾音设备中的至少一个麦克风进行拾音控制，使拾音设备输出的音频信号对应的拾音区域与目标拾音区域相符。

所述装置还包括：

拾音控制停止模块，用于接收到包含有针对拾音设备停止拾音控制的控制信号后，停止对拾音设备的拾音控制。所述接收模块包括：

信号变换指令接收单元，用于接收包括对拾音设备所拾取的信号进行信号变换的指令的控制信号；

信号变换参数确定模块，用于从信号变换的指令中提取对所述拾音设备的至少一个麦克风所拾取的信号进行信号变换的参数；

所述拾音控制模块包括：

参数变换单元，用于根据信号变换的参数对所述拾音设备至少一个麦克风拾取的音频信号进行相应的变换得到变换后的信号；

合成单元，用于将此变换后的信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

进一步的，进行信号变换的参数为：拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述信号变换参数确定模块，具体用于确定拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述参数变换单元，具体用于根据所述幅度调整参数和 /或相位调整参数对所述拾音设备的至少一个麦克风拾取的音频信号的幅度和 /或相位进行相应的变换得到变换后的信号；所述合成单元，具体用于将所述变换后的信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

可选的，所述接收模块包括：

位置移动控制指令接收单元，用于接收包括对所述拾音设备进行位置移动控制的指令的控制信号；

位置移动参数确定模块，用于从所述位置移动控制的指令中提取对所述拾音设备至少一个麦克风进行平移和 /或转动的位置移动参数；

所述拾音控制模块包括：

平移和转动控制单元，用于利用所述的平移和 /或转动的位置移动参数对所述拾音设备中的至少一个麦克风进行平移和 /或转动控制；

合成单元，用于将所述拾音设备的至少一个麦克风进行平移和 /或转动控制之后所获取的音频信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。可选的，所述接收模块包括：

是否拾音指令接收单元，用于接收包括对拾音设备进行是否拾音的指令的控制信号；

拾音确认参数确定模块，用于根据控制信号确定目标拾音区域，并根据声源定位算法确定声源的位置；判断声源的位置是否位于所述目标拾音区域内，如果是，则所述拾音区域调节参数为拾音确认参数，否则为非拾音确认参数；所述拾音控制模块，具体用于当获取到拾音确认参数时，控制拾音设备的至少一个麦克风进行音频信号拾取，否则，控制所述拾音设备的至少一个麦克风不进行音频信号的拾取。

本发明还提供一种拾音控制装置的实施例，参看图 10，该拾音控制装置包括：

接收模块 1201，用于接收针对拾音设备进行拾音区域调节的控制信号，通过所述控制信号使得拾音设备的拾音区域调节到目标拾音区域；

参数确定模块 1202，用于根据所述控制信号确定目标拾音区域的拾音区域调节参数；

拾音区域调节模块 1203，用于根据所述拾音区域调节参数对所述拾音设备的至少一个麦克风进行拾音控制，使所述拾音设备输出的音频信号对应的拾音区域与所述目标拾音区域相符。

可选的，参看图 11，所述装置还包括如下模块：

拾音控制停止模块 1204，用于接收到包含有停止拾音控制信息的控制信号后，停止拾音控制信号的接收。

通过本发明的实施例拾音控制设备能够接收拾音停止控制消息，方便了用户的操作控制。

可选的，参看图 12，所述参数确定模块 1202具体包括：信号变换参数确定模块 1205，用于确定对所述拾音设备的至少一个麦克风所拾取的信号进行信号变换的参数；

所述的拾音区域调节模块 1203包括：

参数变换单元 12031，用于对待进行音频信号调整的麦克风拾取的音频信号进行相应的变换得到变化之后的信号；

合成单元 12032，用于对所述拾音设备中的经过参数变换后的麦克风的信号进行合成，得到所述拾音设备输出的音频信号。

采用本发明的实施例能够获取到相应的音频信号变换参数，对拾音设备的所拾取的音频信号进行变换，有效的解决了现有技术中无法通过外界的控制信号实现拾音设备的控制的问题。

可选的，参看图 13，所述进行信号变换的参数为：所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述参数确定模块 1202具体包括：调整参数确定模块 1206，用于确定所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述的拾音区域调节模块 1203包括：

参数变换单元 12033，用于利用所述的幅度调整参数和 /或相位调整参数对所述拾音设备中的至少一个麦克风进行幅度调整和 /或相位调整；

合成单元 12034，用于对所述拾音设备中的经过参数变换的麦克风的信号进行合成，得到所述拾音设备输出的音频信号。

其中，通过本发明的方法实施例中的权重值作为音频信号幅度调整的参数，通过延迟参数作为拾音设备的拾取的音频信号的相位调整参数。

本发明的实施例，通过获取外部的拾音区域控制信号实现了对拾音设备拾取的音频信号进行幅度调整和 /或相位调整的控制，有效的解决了现有技术存在的无法实现拾音设备的接口化控制的问题。

可选的，参看图 14，所述进行信号变换的参数为：所述拾音设备至少一个麦克风进行平移和 /或转动的位置移动参数；

所述参数确定模块 1202具体包括：位置移动参数确定模块 1207，用于确定所述拾音设备至少一个麦克风进行平移和 /或转动的位置移动参数；

所述的拾音区域调节模块 1203具体包括：

控制单元 12035，用于利用所述的平移和 /或转动的位置移动参数对所述拾音设备中的至少一个麦克风进行平移和 /或转动控制，使接受控制的各个麦克风达到与各个麦克风对应的位置移动参数所确定的位置。

可选的，参看图 15，上述所述控制单元 12035包括：

平移位置控制单元 120351，用于根据所述拾音设备的至少一个麦克风平移位置移动调节参数调整所述拾音设备的至少一个麦克风和 /或遮挡物，以调整所述拾音设备的至少一个麦克风相对遮挡物的相对位置；转动位置控制单元 120352，用于根据所述转动位置移动调节参数对所述拾音设备的至少一个麦克风进行水平角度和 /或俯仰角度调整。

通过本发明的实施例，能够实现对拾音设备中所包含的麦克风进行位置调节的功能，即能够根据外部的拾音区域控制信号实现对拾音设备所包含的麦克风的平移控制和 /或转动控制，通过对拾音设备的麦克风的有效的控制，能够有效的调节拾音设备的拾音区域。可选的，参看图 16，所述进行信号变换的参数为：所述拾音设备的至少一个麦克风是否拾音的参数；

所述参数确定模块 1202具体包括：拾音确定模块 1208，用于确定所述拾音设备的至少一个麦克风是否拾音的参数；

所述的拾音区域调节模块 1203包括：用于根据所述控制信号确定目标拾音区域，并根据声源定位算法确定声源的位置；判断所述声源的位置是否位于所述目标拾音区域内，如果是，则所述拾音区域调节参数为拾音确认参数，否则为非拾音确认参数；

当所述的拾音设备获取到拾音确认参数时，控制所述拾音设备的至少一个麦克风拾取的音频信号，否则，控制所述拾音设备的至少一个麦克风不进行音频信号的拾取或者对所述拾音设备的至少一个麦克风所拾取的音频信号不进行获取。

本发明的实施例，能够对拾音设备是否进行拾音进行有效的控制，解决了现有技术中无法通过获取外部参数来进行拾音区域以及拾音信号的调整的问题。

可选的，所述拾音设备的麦克风个数至少为四个时，所有麦克风分布在同一平面上，或者除拾音设备的第一麦克风外的其他麦克风呈多边形分布，所述拾音设备的第一麦克风与所述其他麦克风呈多棱锥形分布。

本实施例提供了拾音设备多个麦克风的布局方式，通过不同的布局方式，能够有效的对拾音区域进行控制。

其中，所述拾音设备的任意的两个麦克风的间距的最大值与所述单个麦克风的最大拾音角度的正弦值呈反比。

可选的，所述拾音设备还设置有专用于拾取背景音的麦克风，所述用于拾取背景音的麦克风拾取的背景音经过衰减后与所述拾音控制后的音频信号叠力口。

其中，所述拾音控制装置还包括：背景音调节模块，用于从拾音区域调节的控制信号提取出用来控制背景音比重相关的控制参数，根据此控制参数对所述拾音设备的至少一个麦克风进行拾音控制，使输出的音频信号背景音比重相应变化。

通过本发明的实施例能够有效的改变现有技术中无法实现对拾音设备所获取的音频信号进行前景音以及背景音的调节问题，通过本发明的实施例，能够图 17为本发明的一个实现技术方案框图，其中

麦克风单元包含一个或为多个（阵列）指向麦克风和 /或全向麦克；网络接口用于通过网络接收远端的对麦克风的 PTZ控制命令，网络接口可以是基于分组交换的 IP网络或电路交换的 ISDN、 El网络，包括有线（如以太网、 xDSL等）和无线（如 WiFi、 WiMAX、 UMTS, CDMA2000, TD-SCDMA ) 接入方式，通过远端控制协议实现远端对拾音设备的控制；

本地控制接口用于接收本地对麦克风的 PTZ控制命令，接口可以是红外、蓝牙、 RS232 等有线或无线接口，通过本地的控制协议完成本地的拾音设备的控制；

PTZ控制单元将 PTZ控制信号转换为拾音区域调节单元和云台（可选）所需的参数；

拾音区域调节单元对阵列麦克输入的数字音频信号进行相位和幅度的加权等处理，输出与 PTZ对应区域的音频信号，滤除区域外的信号。拾音区域调节单元也可以采用现有技术 1中的方式进行 ZOOM调节，通过遮挡关系来调节拾音角度，以机械方式代替阵列麦克风进行 ZOOM调节；

云台（可选的），以机械方式替代阵列麦克风进行水平（P )和俯仰（T )的调整；

音效调整单元，进一步进行声音的放大（可以与视频缩放同步），背景音特殊处理等。

实际调节过程中，为了能够有实时的反馈效果，可以采用连续的调节方式，即用户发送一个启动调节的命令， PTZ控制模块就以一定的频率持续的产生调节参数（以一定的步长为增量），直到用户发送停止调节的命令。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现，当然也可以全部通过硬件来实施，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如 ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例或者实施例的某些部分所述的方法。

虽然通过实施例描绘了本发明，本领域普通技术人员知道，本发明有许多变形和变化而不脱离本发明的精神，本发明的申请文件的权利要求包括这些变形和变化。

Claims

权利要求书

1、一种拾音控制方法，其特征在于，包括：

接收控制信号，并根据所述控制信号确定目标拾音区域的拾音区域调节参数，所述拾音区域调节参数用于调节所述拾音设备，使所述拾音设备调节到目标拾音区域；

2、如权利要求 1所述的方法，其特征在于，所述根据所述拾音区域调节参数，对所述拾音区域中的至少一个麦克风进行拾音控制包括：

当所述控制信号包含拾音控制的启动信息时，利用目标拾音区域的拾音区域调节参数对所述拾音设备进行调节，直到如下之一条件下结束调节：

接收到包含有针对所述拾音设备停止拾音控制的控制信号；

或者直到调节了预定次数；

或者直到调节持续时长达到预定时长。

3、如权利要求 1或 2所述的方法，其特征在于，当所述控制信号包括对拾音设备所拾取的信号进行信号变换的指令时，从所述信号变换的指令中提取对所述拾音设备的至少一个麦克风所拾取的信号进行信号变换的参数；

且所述根据所述拾音区域调节参数对所述拾音设备至少一个麦克风进行拾音控制包括：

根据所述信号变换的参数对所述拾音设备至少一个麦克风拾取的音频信号进行相应的变换得到变换后的信号，将此变换后的信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

4、如权利要求 3所述的方法，其特征在于，所述对拾音设备的至少一个麦克风的信号进行信号变换的参数包括：所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

且所述根据所述拾音区域调节参数对所述拾音设备的至少一个麦克风进行拾音控制包括：

根据所述幅度调整参数和 /或相位调整参数对所述拾音设备的至少一个麦克风拾取的音频信号的幅度和 /或相位进行相应的变换得到变换后的信号，将此变换后的信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

5、如权利要求 1或 2所述的方法，其特征在于，当所述控制信号包括对所述拾音设备进行位置移动控制的指令时，从所述位置移动控制的指令中提取对所述拾音设备至少一个麦克风进行平移和 /或转动的位置移动参数；

利用所述的平移和 /或转动的位置移动参数对所述拾音设备中的至少一个麦克风进行平移和 /或转动控制，将所述拾音设备的至少一个麦克风进行平移和 /或转动控制之后所获取的音频信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

6、如权利要求 5所述的方法，其特征在于，对所述拾音设备至少一个麦克风进行平移的位置移动参数为：对应所述拾音设备至少一个麦克风的拾音方位的平移位置移动调节参数；所述拾音设备的至少一个麦克风进行转动的位置移动参数为：对应所述拾音设备的至少一个麦克风的拾音角度的转动位置移动调节参数；

且利用所述的平移和 /或转动的位置移动参数对所述拾音设备中的至少一个麦克风进行平移和 /或转动控制包括：

根据所述拾音设备的至少一个麦克风平移位置移动调节参数调整所述拾音设备的至少一个麦克风和 /或遮挡物，以调整所述拾音设备的至少一个麦克风相对遮挡物的相对位置，将所述拾音设备的至少一个麦克风调整与遮挡物相对位置之后所获取的音频信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号；

和 /或

根据所述转动位置移动调节参数对所述拾音设备的至少一个麦克风进行水平和 /或俯仰角度调整，将所述拾音设备的至少一个麦克风水平和 /或俯仰角度调整之后所获取的音频信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

7、如权利要求 1或 2所述的方法，其特征在于，当所述控制信号包括对所述拾音设备进行是否拾音的指令时，从所述是否拾音的指令确定目标拾音区域的拾音区域调节参数包括：

根据所述控制信号确定目标拾音区域，并根据声源定位算法确定声源的位置；

判断所述声源的位置是否位于所述目标拾音区域内，如果是，则所述拾音区域调节参数为拾音确认参数，否则为非拾音确认参数；

当获取到拾音确认参数时，控制所述拾音设备的至少一个麦克风进行音频信号拾取，否则，控制所述拾音设备的至少一个麦克风不进行音频信号的拾取。

8、如权利要求 4或 6任意一项所述的方法，其特征在于，所述根据所述拾音区域调节参数对所述拾音设备中的至少一个麦克风进行拾音控制还包括：对所述拾音设备中各个麦克风所拾取的音频信号的合成信号的增益进行调整，所述增益随所述拾音设备的拾音角度的减小而增大。

9、如权利要求 1或 2所述的方法，其特征在于，所述接收控制信号，并根据所述控制信号确定目标拾音区域的拾音区域调节参数，还包括：接收调整背景音系数的控制信号，从所述调整背景音的控制信号提取相关的背景音系数控制参数，根据所述背景音系数控制参数对所述拾音设备进行拾音控制，使拾取的音频信号的背景音系数相应变化。

10、如权利要求 1或 2所述的方法，其特征在于，所述控制信号为对所述拾音设备进行控制的 P/T/Z控制信号。

11、一种拾音控制装置，其特征在于，包括：

12、如权利要求 11所述的装置，其特征在于，所述装置还包括：

拾音控制停止模块，用于接收到包含有针对所述拾音设备停止拾音控制的控制信号后，停止对所述拾音设备的拾音控制。

13、如权利要求 11或 12所述的装置，其特征在于，所述接收模块包括：信号变换指令接收单元，用于接收包括对拾音设备所拾取的信号进行信号变换的指令的控制信号；

信号变换参数确定模块，用于从所述信号变换的指令中提取对所述拾音设备的至少一个麦克风所拾取的信号进行信号变换的参数；

所述拾音控制模块包括：

参数变换单元，用于根据所述信号变换的参数对所述拾音设备至少一个麦克风拾取的音频信号进行相应的变换得到变换后的信号；

14、如权利要求 13所述的装置，其特征在于，所述进行信号变换的参数为：所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述信号变换参数确定模块，具体用于确定所述拾音设备中至少一个麦克风对应的幅度调整参数和 /或相位调整参数；

所述参数变换单元，具体用于根据所述幅度调整参数和 /或相位调整参数对所述拾音设备的至少一个麦克风拾取的音频信号的幅度和 /或相位进行相应的变换得到变换后的信号；

所述合成单元，具体用于将所述变换后的信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

15、如权利要求 11或 12所述的装置，其特征在于，所述接收模块包括：位置移动控制指令接收单元，用于接收包括对所述拾音设备进行位置移动控制的指令的控制信号；

所述拾音控制模块包括：

合成单元，用于将所述拾音设备的至少一个麦克风进行平移和 /或转动控制之后所获取的音频信号与所述拾音设备的其他麦克风拾取的音频信号进行合成，以滤除或减小不属于所述目标拾音区域的音频信号。

16、如权利要求 15所述的装置，其特征在于，所述平移和 /或转动控制单元包括：

平移控制单元，用于根据所述拾音设备的至少一个麦克风平移位置移动调节参数调整所述拾音设备的至少一个麦克风和 /或遮挡物，以调整所述拾音设备的至少一个麦克风相对遮挡物的相对位置；

转动控制单元，用于根据所述转动位置移动调节参数对所述拾音设备的至少一个麦克风进行水平和 /或俯仰角度调整。

17、如权利要求 11或 12所述的装置，其特征在于，所述接收模块包括：是否拾音指令接收单元，用于接收包括对所述拾音设备进行是否拾音的指令的控制信号；

拾音确认参数确定模块，用于根据所述控制信号确定目标拾音区域，并根据声源定位算法确定声源的位置；判断所述声源的位置是否位于所述目标拾音区域内，如果是，则所述拾音区域调节参数为拾音确认参数，否则为非拾音确认参数；

所述拾音控制模块，具体用于当获取到拾音确认参数时，控制所述拾音设备的至少一个麦克风进行音频信号拾取，否则，控制所述拾音设备的至少一个麦克风不进行音频信号的拾取。

18、如权利要求 11或 12所述的装置，其特征在于，所述拾音设备的麦克风个数至少为四个时，所有麦克风分布在同一平面上，或者除拾音设备的第一麦克风外的其他麦克风呈多边形分布，所述拾音设备的第一麦克风与所述其他麦克风呈多棱锥形分布。

19、如权利要求 18所述的方法，其特征在于，所述拾音设备的任意两个麦克风的间距的最大值与所述单个麦克风的最大拾音角度的正弦值呈反比。

20、如权利要求 11或 12所述的装置，其特征在于，所述接收模块包括：背景音调整指令接收单元，用于接收包括对背景音系数进行调整的控制信号；

背景音系数控制参数确定模块，用于从所述调整背景音的控制信号提取相关的背景音系数控制参数；

所述拾音控制模块包括：

系数调整单元，用于根据所述背景音系数控制参数对所述拾音设备进行拾音控制，使拾取的音频信号的背景音系数相应变化。