WO2023093078A1

WO2023093078A1 - 导播控制的方法、装置、存储介质和计算机程序产品

Info

Publication number: WO2023093078A1
Application number: PCT/CN2022/105499
Authority: WO
Inventors: 张磊; 刘智辉
Original assignee: 华为技术有限公司
Priority date: 2021-11-25
Filing date: 2022-07-13
Publication date: 2023-06-01
Also published as: CN116193053A

Abstract

本申请实施例公开了一种导播控制的方法、装置、存储介质和计算机程序产品，属于通信技术领域。应用于导播控制系统，所述方法包括：控制设备在声源对象发声时，基于第一麦克风阵列的检测数据确定所述声源对象相对于所述第一麦克风阵列的方位角θ ₁，并基于第二麦克风阵列的检测数据确定所述声源对象相对于所述第二麦克风阵列的方位角θ ₂；所述控制设备基于所述方位角θ ₁、所述方位角θ ₂、所述第一麦克风阵列的位置和所述第二麦克风阵列的位置，确定所述声源对象的位置；所述控制设备基于所述声源对象的位置控制摄像机对所述声源对象进行拍摄，得到导播视频图像。采用本申请，可以准确识别发言者，从而提升自动导播的准确度。

Description

导播控制的方法、装置、存储介质和计算机程序产品

本申请要求于2021年11月25日提交的申请号为202111415949.4、发明名称为“一种分布式导播的硬件装置和方法”的中国专利申请的优先权，以及于2022年02月08日提交的申请号为202210119348.7、发明名称为“导播控制的方法、装置、存储介质和计算机程序产品”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，特别涉及一种导播控制的方法、装置、存储介质和计算机程序产品。

背景技术

导播是指在视频拍摄过程中基于实时拍摄需求控制摄像机对场景中的关键对象(人或物)进行拍摄以输出视频图像。例如，在视频会议中，可以控制摄像机对当前的发言人进行拍摄，发言人变换时，可以控制摄像机对新的发言人进行拍摄。导播的过程中，为了得到包含关键对象的视频图像，可以对摄像机拍摄方向进行调整，也可以在多个摄像机中进行视频图像选择，还可以在视频图像中进行局部截取。

目前，随着计算机技术的发展，自动导播得到了飞速发展，正在逐渐取代人工导播。一般，自动导播的处理过程是：由控制设备对摄像机的实时拍摄的视频图像进行识别，确定图像中具有指定特征的对象(即上述的关键对象)，控制摄像机对该对象进行拍摄。例如，在会议场景中，控制设备可以识别实时拍摄的视频图像中站立或存在嘴部动作(在讲话)的人物，将该人物确定为发言者，然后控制摄像机拍摄发言者的特写进行播放。

然而，现有技术中的自动导播方法局限性比较明显，有时候导播的准确度较差。

发明内容

本申请实施例提供了一种导播控制方法，可以解决现有技术中导播准确度较差的问题。所述技术方案如下：

第一方面，提供了一种导播控制的方法，该方法应用于导播控制系统，导播控制系统包括第一麦克风阵列、第二麦克风阵列、摄像机和控制设备，该方法包括：控制设备确定第一麦克风阵列的位置以及摄像机的位置；在声源对象发声时，控制设备根据声源对象相对于第一麦克风阵列的位置、声源对象相对于第二麦克风阵列的位置、第一麦克风阵列的位置和第二麦克风阵列的位置，确定声源对象的位置；控制设备基于声源对象的位置以及摄像机的位置，确定对摄像机的导播操作。

在发言人讲话时，第一麦克风阵列中的每个麦克风可以检测到相应的音频数据，第一麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定发言人相对于第一麦克风阵列的方位角θ ₁，声源定位过程使用的算法可以是可控波束(steered-response power，SRP)算法等。同样地，控制设备也可以根据第二麦克风阵列的麦克风检测到的音频数据进行声源定位，确定发言人相对于第二麦克风阵列的方位角θ ₂。

对于第一麦克风阵列和第二麦克风的偏角都为0度的情况，控制设备可以根据方位角θ ₁、方位角θ ₂、第一麦克风阵列的位置和第二麦克风阵列的位置，以及第一麦克风阵列、第二麦克风阵列和发言人之间的几何关系，通过计算得到发言人的位置。

对于第一麦克风阵列和第二麦克风阵列的偏角都不为0度的情况，控制设备可以根据第一麦克风阵列的偏角γ ₁、第二麦克风阵列的偏角γ ₂、方位角θ ₁、方位角θ ₂、第一麦克风阵列的位置和第二麦克风阵列的位置，以及第一麦克风阵列、第二麦克风阵列、发言人之间的几何关系，通过计算得到发言人的位置。

控制设备确定发言人的位置后，可以基于发言人的位置和摄像机的位置，计算发言人相对于摄像机的方位角以及发言人与摄像机的距离。该距离是平面等效距离，也即摄像机的等效中心和发言人的等效中心在平面内的投影距离。

可以基于发言人相对于摄像机的方位角，确定摄像机的导播旋转角。摄像机可以包括可旋转摄像头和固定底座，摄像头可以相对于固定底座进行旋转，可以为摄像头指定一个初始拍摄方向，初始拍摄方向和摄像头的基准方向可以相同，该导播旋转角可以是摄像头实时的拍摄方向相对于初始拍摄方向的角度，初始拍摄方向可以认为是0度方向，导播旋转角和发言人相对于摄像机的方位角可以相同。

在确定发言人相对于摄像机的距离之后，可以基于该距离，确定摄像机的导播焦距。控制设备可以查询预先存储的第一对应关系表，确定该距离对应的导播焦距。第一对应关系表中可以记录有发言人相对于摄像机的距离和摄像机焦距的对应关系。

对于摄像机的偏角为0度的情况，控制设备可以根据发言人的位置、摄像机的位置确定摄像机的导播旋转角和导播焦距，从而可以控制摄像机旋转至导播旋转角，并控制摄像机按照导播焦距进行拍摄。

对于摄像机的偏角不为0度的情况，控制设备可以根据摄像机的偏角、发言人的位置、摄像机的位置确定摄像机的导播旋转角和导播焦距，从而可以控制摄像机云台旋转至导播旋转角，并控制摄像机按照导播焦距进行拍摄。

需要说明的是，上述导播控制系统的示例中，可以添加多个摄像头布置在不同的位置，以更好地拍摄参会成员。

对于导播控制系统中存在至少两个摄像头的情况，控制设备可以基于发言人的位置和两个摄像机的位置，确定两个摄像机中与发言人距离较远的目标摄像机，基于发言人的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。

控制设备可以基于声源对象的位置和多个摄像机的位置，控制多个摄像机对声源对象进行拍摄，得到多个视频图像。然后，可以对得到的多个视频图像进行图像识别，选取满足目标条件的视频图像作为导播视频图像。目标条件可以有多种，例如，选取人脸角度最接近正面的视频图像作为导播视频图像等，视频图像中的人脸角度可以使用人脸角度检测的机器学习模型来确定。

本申请实施例所示的方案，只要声源对象在发声，就可以基于声音对其进行定位。这样，避免了在基于图像识别进行声源对象定位时要求发言者必须具有明显动作(如明显的嘴部动作)的问题，这样，摆脱了现有技术中基于图像识别的自动导播方法的局限性，提高了导播的准确度。

在一种可能的实现方式中，第一麦克风阵列中集成有第一发声器，第二麦克风阵列包括第一麦克风和第二麦克风，控制设备基于第一麦克风和第二麦克风接收到第一发声器发出的声音信号的时间以及第一发声器发出声音信号的时间确定第一发声器与第一麦克风之间的距离D ₁以及第一发声器与第二麦克风之间的距离D ₂；控制设备基于第一麦克风的位置、第二麦克风的位置、距离D ₁和距离D ₂，确定第一麦克风阵列相对于第二麦克风阵列的位置。

其中，第一发声器和第一麦克风阵列的等效中心可以相同，即第一发声器的位置和第一麦克风阵列的位置可以相同。第一麦克风阵列相对于第二麦克风阵列的位置，可以是第一麦克风阵列中的第一发声器相对于所述第二麦克风阵列的位置。具体实现中，可以利用坐标系来确定所述位置，比如，将坐标系的原点设置在第二麦克风阵列中心时，所述第一麦克风阵列的坐标体现的是所述第一麦克风阵列相对于所述第二麦克风阵列的位置。

获取第一发声器发出声音信号的时间的方式可以有多种，后续处理中发声器发出声音信号的时间都可以参照该处说明。

方式一，可以设置第一发声器在每次上电时发出声音信号，控制设备可以获取第一发声器上电的时间，作为第一发声器发出声音信号的时间。

方式二，控制设备指示第一发声器发出声音信号，第一发声器发出声音信号时，可以记录下发出声音信号的时间，然后将该时间发送至控制设备。

控制设备控制第一发声器发出声音信号S ₁时，第一发声器将发出声音信号S ₁的时间点t ₁发送给控制设备进行记录。第二麦克风阵列中的每个麦克风可以接收到声音信号，并记录检测到该声音信号的时间点，发送给控制设备。控制设备可以获取第二麦克风阵列中的第一麦克风检测到声音信号S ₁的时间点t ₂、以及第二麦克风阵列中的第二麦克风检测到声音信号S ₁的时间点t ₃，然后，可以计算得到时间点t ₁与时间点t ₂之间的时长ΔT ₁、时间点t ₁与时间点t ₃之间的时长ΔT ₂。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风与第一发声器的距离D ₁和第二麦克风与第一发声器的距离D ₂。

根据第一麦克风和第二麦克风的位置，可以确定第一麦克风和第二麦克风之间的距离为D。然后，控制设备可以根据距离D、距离D ₁和距离D ₂，以及第一麦克风、第二麦克风和第一发声器之间的几何关系，通过计算得到第一发声器的位置。

本申请实施例所示的方案，基于第一麦克风和第二麦克风接收到第一发声器发出的声音信号的时间以及第一发声器发出声音信号的时间确定第一发声器与第一麦克风之间的距离D ₁以及第一发声器与第二麦克风之间的距离D ₂，然后基于第一麦克风的位置、第二麦克风的位置、距离D ₁和距离D ₂，确定第一麦克风阵列相对于第二麦克风阵列的位置。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，导播控制系统还包括第二发声器和第三发声器，第二发声器和第三发声器与第二麦克风阵列集成在同一电子屏幕上，控制设备获得第一麦克风阵列发送的第二发声器相对于第一麦克风阵列的方位角θ ₃和第三发声器相对于第一麦克风阵列的方位角θ ₄；控制设备基于方位角θ ₃、方位角θ ₄、第二发声器的位置与第三发声器的位置，确定第一麦克风阵列的方位。

其中，第二发声器的位置和第三发声器的位置可以是预先设置好的，控制设备中可以预先存储有第二发声器的位置与第三发声器的位置，而不需要从麦克风阵列处获得。设备的方位指的是设备的基准方向朝向的方向，可以用设备的基准方向与相对于指定方向的夹角表示 (也即设备的偏角)，指定方向可以是X轴或Y轴方向。

第二发声器发出声音信号S ₂时，第一麦克风阵列中的每个麦克风可以检测到相应的音频数据，第一麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第二发声器相对于第一麦克风阵列的方位角θ ₃。同样地，第三发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第三发声器相对于第一麦克风阵列的方位角θ ₄。这里对方位角的计算原理进行介绍，也即对前面提到的SRP算法进行介绍，该算法的计算公式如下：

X _m(k)代表第m个麦克风k频段的快速傅里叶变换(fast fourier transform，FFT)值，s(θ)代表二维空间平面位于角度θ的声源对应的导向矢量，导向矢量可以根据麦克风阵列内部麦克风的布局以及角度搜索范围(人为设置，后续进行最大极值点的确定时所针对的角度范围)提前计算好。以麦克风阵列中各麦克风线型布局为例，导向矢量的计算公式为：

我们选取第一麦克风为参考麦克风，d _mcosθ代表声源到达第m个麦克风与参考麦克风之间路程差。对于单声源定位，在θ属于角度搜索范围前提下，确定Y(θ)的最大极值点对应的角度θ，即为声源对象的方位角。

控制设备可以根据第二发声器的位置坐标、第三发声器的位置坐标，确定第二发声器和第三发声器的距离L。然后控制设备可以基于方位角θ ₃、方位角θ ₄、第二发声器的位置、第三发声器的位置，以及第一麦克风阵列、第二发声器和第三发声器之间的位置关系，通过计算确定第一麦克风阵列的偏角θ ₅。

本申请实施例所示的方案，首先获得第一麦克风阵列发送的第二发声器相对于第一麦克风阵列的方位角θ ₃和第三发声器相对于第一麦克风阵列的方位角θ ₄，然后基于方位角θ ₃、方位角θ ₄、第二发声器的位置与第三发声器的位置，确定第一麦克风阵列的方位。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，摄像机集成有第四发声器，第二麦克风阵列包括第一麦克风和第二麦克风，控制设备基于第一麦克风和第二麦克风接收到第四发声器发出声音信号的时间以及第四发声器发出声音信号的时间，确定第一麦克风与第四发声器的距离D ₃、以及第二麦克风与第四发声器的距离D ₄；控制设备基于第一麦克风的位置、第二麦克风的位置、距离D ₃和距离D ₄，确定摄像机相对于第二麦克风阵列的位置。

其中，第四发声器和摄像机的等效中心可以相同，即第四发声器的位置和摄像机的位置可以相同。

控制设备控制第四发声器发出声音信号S ₄时，可以记录第四发声器发出声音信号S ₄的时间点t ₄。第二麦克风阵列中的每个麦克风可以检测到相应的音频数据，并记录有音频数据对应的检测时间点，即检测到该音频数据的时间点。控制设备可以获取第二麦克风阵列中的第一麦克风检测到声音信号S ₄的时间点t ₅、以及第二麦克风阵列中的第二麦克风检测到声音信号S ₄的时间点t ₆，然后，可以计算得到时间点t ₄与时间点t ₅之间的时长ΔT ₃、时间点t ₄与时间点t ₆之间的时长ΔT ₄。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风与第四发声器的距离D ₃和确定第二麦克风与第四发声器的距离D ₄。

根据第一麦克风和第二麦克风的位置，可以确定第一麦克风和第二麦克风之间的距离为D。然后，控制设备可以根据距离D、距离D ₃和距离D ₄，以及第一麦克风、第二麦克风和第四发声器之间的几何关系，通过计算得到第四发声器的位置。

本申请实施例所示的方案，首先基于第一麦克风和第二麦克风接收到第四发声器发出声音信号的时间以及第四发声器发出声音信号的时间，确定第一麦克风与第四发声器的距离D ₃、以及第二麦克风与第四发声器的距离D ₄，然后基于第一麦克风的位置、第二麦克风的位置、距离D ₃和距离D ₄，确定摄像机相对于第二麦克风阵列的位置。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，摄像机集成有第四发声器和第三麦克风阵列，控制设备基于第三麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第三麦克风阵列的方位角θ ₆，基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇；控制设备基于方位角θ ₆、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的偏角。

其中，第一麦克风阵列的方位可以是人工测量并存储到控制设备中，也可以是通过参数标定过程测定的。第三麦克风阵列的等效中心和摄像机的等效中心可以相同，即第三麦克风的位置和摄像机的位置可以相同。第三麦克风的偏角和摄像机的偏角可以相同。第四发声器的等效中心和摄像机的等效中心可以相同，即第四发声器的位置和摄像机的位置可以相同。

第一发声器发出声音信号S ₅时，第三麦克风阵列中的每个麦克风可以检测到相应的音频数据，第三麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第一发声器相对于第三麦克风阵列的方位角θ ₆。同样地，第四发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第四发声器相对于第一麦克风阵列的方位角θ ₇。根据方位角θ ₆、方位角θ ₇、偏角θ ₅，以及第一发声器、第三麦克风阵列和第四发声器之间的几何关系，可以计算得到第三麦克风和摄像机的偏角θ ₈。

本申请实施例所示的方案，首先基于第三麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第三麦克风阵列的方位角θ ₆，基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇，然后基于方位角θ ₆、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的偏角。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，第一麦克风阵列集成有发光器，摄像机集成有第四发声器，控制设备确定摄像机拍摄的图像中的发光点位置，图像是发光器发光时拍摄的，基于图像中的发光点位置以及摄像机的旋转角，确定发光器相对于摄像机的方位角θ ₉；控制设备基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇；控制设备基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的方位。

其中，第一麦克风阵列的方位是第一麦克风阵列的基准方向相对于第一指定方向的角度，第一指定方向可以是X轴正向，或者其他指定的方向。摄像机的方位是摄像机的基准方向相对于第二指定方向的角度，第二指定方向可以是Y轴正向。发光器的等效中心与第一麦克风阵列的等效中心可以相同，即发光器的位置与第一麦克风阵列的位置可以相同。第四发声器的等效中心和摄像机的等效中心可以相同，即第四发声器的位置和摄像机的位置可以相同。

控制设备可以记录有摄像机焦距与水平拍摄角度范围(又称为水平视场角)的对应关系。该对应关系可以是摄像机上报给控制设备的，也可以是人工录入控制设备的，等等。控制设备可以确定摄像机当前的焦距。然后在上述对应关系表中查找当前的焦距对应的水平拍摄角度范围γ ₄。控制器在控制发光器发光之后，可以获取摄像机拍摄的图像，并在图像中确定发光点位置与图像纵向中轴线的距离L ₃。控制设备中可以记录有图像左侧或右侧边界与图像纵向中轴线的距离L ₄。摄像头的实时拍摄方向对应于图像的纵向中轴线。根据水平拍摄角度γ ₄、距离L ₃和距离L ₄，可以确定发光器相对于摄像头的方位角γ ₅，方位角γ ₅是从摄像头的实时拍摄方向到发光器与摄像头的连线的逆时针夹角。此时控制设备还可以获取摄像机当前的旋转角γ ₆。根据方位角γ ₅和旋转角γ ₆，可以计算得到发光器相对于摄像机的方位角θ ₉。旋转角γ ₆是摄像机的摄像头相对于固定底座的旋转角度，一般摄像头是在控制设备的控制下转动的，所以控制设备是已知该旋转角γ ₆的。需要说明的是，旋转角并非计算摄像机的方位的必要参数，在其他可能的情况中，也可以不使用旋转角而计算得到摄像机的方位。

控制设备可以控制第四发声器发出声音信号S ₆，第四发声器发出声音信号S ₆时，第一麦克风阵列中的每个麦克风可以检测到相应的音频数据，第一麦克风阵列可以将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第四发声器相对于第一麦克风阵列的方位角θ ₇。

控制设备基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的偏角θ ₅，以及第一麦克风阵列、摄像机和第四发声器之间的几何关系，可以计算得到摄像机的偏角θ ₈。

本申请实施例所示的方案，首先确定摄像机拍摄的图像中的发光点位置，基于图像中的发光点位置以及摄像机的旋转角，确定发光器相对于摄像机的方位角θ ₉，然后基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇，进而基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的方位。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，第二麦克风阵列包括第一麦克风和第二麦克风，控制设备基于第二麦克风阵列在第一发声器发出声音信号时的检测数据确定第一发声器与第二麦克风阵列之间的距离D ₅以及第一发声器相对于第二麦克风阵列的方位角θ ₁₀；控制设备基于距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，确定第一麦克风阵列的位置。

其中，第一发声器和第一麦克风阵列的等效中心可以相同，即第一发声器的位置和第一麦克风阵列的位置可以相同。

控制设备控制第一发声器发出声音信号S ₇时，可以记录第一发声器发出声音信号S ₇的时间点t ₇。第二麦克风阵列的麦克风可以检测到相应的音频数据，并记录有音频数据对应的检测时间点t ₈，即检测到该音频数据的时间点。控制设备可以获取第二麦克风阵列检测到声音信号S ₇的时间点t ₇、以及第二麦克风阵列检测到声音信号S ₇的时间点t ₈，然后，可以计算得到时间点t ₇与时间点t ₈之间的时长ΔT ₅。进而，控制设备可以根据预先存储的音速数据V，计算得到第二麦克风阵列与第一发声器的距离D ₅。

同时，第二麦克风阵列可以将声音信号S ₇对应的音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀。

控制设备可以根据距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，以及第一发声器与第二麦克风阵列的几何关系，计算得到第一发声器的位置。

本申请实施例所示的方案，首先基于第二麦克风阵列在第一发声器发出声音信号时的检测数据确定第一发声器与第二麦克风阵列之间的距离D ₅以及第一发声器相对于第二麦克风阵列的方位角θ ₁₀，然后基于距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，确定第一麦克风阵列的位置。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，第二麦克风阵列集成有第五发声器，控制设备基于第二麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀，以及基于第一麦克风阵列在第五发声器发出声音信号时的检测数据，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁；控制设备基于方位角θ ₁₀、方位角θ ₁₁和第二麦克风阵列的方位，确定第一麦克风阵列的方位。

第一发声器发出声音信号S ₇时，第二麦克风阵列的麦克风可以检测到相应的音频数据，第二麦克风阵列可以将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀。同样地，第五发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁。

对于θ ₁₂为0度的情况，控制设备可以根据方位角θ ₁₀、方位角θ ₁₁，以及第二麦克风阵列和第一麦克风阵列的几何关系，确定第一麦克风阵列的偏角θ ₅。对于θ ₁₂不为0度的情况，控制设备可以根据方位角θ ₁₀、方位角θ ₁₁、夹角θ ₁₂，以及第二麦克风阵列和第一麦克风阵列的几何关系，确定第一麦克风阵列的偏角θ ₅。

需要说明的是，第一麦克风阵列和第二麦克风阵列之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第一麦克风阵列的偏角。

本申请实施例所示的方案，首先基于第二麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀，以及基于第一麦克风阵列在第五发声器发出声音信号时的检测数据，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁，然后设备基于方位角θ ₁₀、方位角θ ₁₁和第二麦克风阵列的方位，确定第一麦克风阵列的方位。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，摄像机集成有第四发声器，控制设备基于第一麦克风阵列和第二麦克风阵列接收到第四发声器发出的声音信号的时间和第四发声器发出声音信号的时间，确定第一麦克风阵列与第四发声器的距离D ₆、以及第二麦克风阵列与第四发声器的距离D ₇；控制设备基于第一麦克风阵列的位置、第二麦克风阵列的位置、距离D ₆和距离D ₇，确定摄像机的位置。

控制设备控制第四发声器发出声音信号S ₉时，可以记录第四发声器发出声音信号S ₉的时间点t ₉。第一麦克风阵列和第二麦克风阵列可以检测到相应的音频数据，并记录有音频数据对应的检测时间点，即检测到该音频数据的时间点。控制设备可以获取第一麦克风阵列检测到声音信号S ₉的时间点t ₁₀、以及第二麦克风阵列检测到声音信号S ₉的时间点t ₁₁，然后，可以计算得到时间点t ₉与时间点t ₁₀之间的时长ΔT ₆、时间点t ₉与时间点t ₁₁之间的时长ΔT ₇。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风阵列与第四发声器的距离D ₆和确定第二麦克风阵列与第四发声器的距离D ₇。

根据第一麦克风阵列和第二麦克风阵列的位置，可以确定第一麦克风阵列和第二麦克风阵列之间的距离为D ₈。然后，控制设备可以根据距离D ₆、距离D ₇和距离D ₈，以及第一麦克风阵列、第二麦克风阵列和第四发声器之间的几何关系，通过计算得到第四发声器的位置。

本申请实施例所示的方案，首先基于第一麦克风阵列和第二麦克风阵列接收到第四发声器发出的声音信号的时间和第四发声器发出声音信号的时间，确定第一麦克风阵列与第四发声器的距离D ₆、以及第二麦克风阵列与第四发声器的距离D ₇，然后基于第一麦克风阵列的位置、第二麦克风阵列的位置、距离D ₆和距离D ₇，确定摄像机的位置。这样，无需人工标定设备参数，从而，提高了标定设备参数的便捷性。

在一种可能的实现方式中，控制设备基于声源对象的位置以及摄像机的位置，控制设备基于声源对象的位置和摄像机的位置，确定声源对象相对于摄像机的方位角、以及声源对象与摄像机的距离；控制设备基于声源对象相对于摄像机的方位角，确定摄像机的导播旋转角，并基于声源对象与摄像机的距离，确定摄像机的导播焦距。

可以基于发言人的位置和摄像机的位置，计算发言人相对于摄像机的方位角以及发言人与摄像机的距离。该距离是平面等效距离，也即摄像机的等效中心和发言人的等效中心在平面内的投影距离。

然后，可以基于发言人相对于摄像机的方位角，确定摄像机的导播旋转角。摄像机可以包括可旋转摄像头和固定底座，摄像头可以相对于固定底座进行旋转，可以为摄像头指定一个初始拍摄方向，初始拍摄方向和摄像头的基准方向可以相同，该导播旋转角可以是摄像头实时的拍摄方向相对于初始拍摄方向的角度，初始拍摄方向可以认为是0度方向，导播旋转角和发言人相对于摄像机的方位角可以相同。

本申请实施例所示的方案，首先基于声源对象的位置以及摄像机的位置，控制设备基于声源对象的位置和摄像机的位置，确定声源对象相对于摄像机的方位角、以及声源对象与摄像机的距离，然后基于声源对象相对于摄像机的方位角，确定摄像机的导播旋转角，并基于声源对象与摄像机的距离，确定摄像机的导播焦距。这样，无需人工确定导播参数，从而，提高了导播过程的便捷性。

在一种可能的实现方式中，第一发声器发出声音信号的时间是第一发声器上电的时间。

在一种可能的实现方式中，导播控制系统还包括另一摄像机；控制设备基于声源对象的位置和两个摄像机的位置，确定两个摄像机中与声源对象距离较远的目标摄像机，基于声源对象的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。

这种处理方式可以适用于如下场景：会议室中布置有长条桌，长条桌两侧布置有若干椅子，发言人面向长条桌坐在椅子上。长条桌两侧的墙壁上分别设置有一个摄像机。在这种场景下，对于分别布置在长条桌两侧的墙壁上的两个摄像机而言，距离发言人较远的摄像机能够更好地拍摄到发言人的人脸。

本申请实施例所示的方案，基于声源对象的位置和两个摄像机的位置，确定两个摄像机中与声源对象距离较远的目标摄像机，基于声源对象的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。这样，能够在常规会议场景下更好地拍摄到发言人的人脸，提高了自动导播的准确度。

第二方面，提供了一种导播控制的装置，该装置包括一个或多个模块，该一个或多个模块用于实现第一方面及其可能的实现方式的方法。

第三方面，提供了一种计算机设备，计算机设备包括存储器和处理器，存储器用于存储计算机指令；处理器执行存储器存储的计算机指令，以使计算机设备执行第一方面及其可能的实现方式的方法。

第四方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序代码，当计算机程序代码被计算机设备执行时，计算机设备执行第一方面及其可能的实现方式的方法。

第五方面，提供了一种计算机程序产品，计算机程序产品包括计算机程序代码，在计算机程序代码被计算机设备执行时，计算机设备执行第一方面及其可能的实现方式的方法。

本申请实施例提供的技术方案带来的有益效果是：

附图说明

图1是本申请实施例提供的一种导播控制系统的示意图；

图2是本申请实施例提供的一种计算机设备的结构示意图；

图3是本申请实施例提供的一种导播控制系统的示意图；

图4是本申请实施例提供的一种导播控制方法的流程图；

图5是本申请实施例提供的一种处理示意图；

图6是本申请实施例提供的一种处理示意图；

图7是本申请实施例提供的一种处理示意图；

图8是本申请实施例提供的一种导播控制系统的示意图；

图9是本申请实施例提供的一种处理示意图；

图10是本申请实施例提供的一种处理示意图；

图11是本申请实施例提供的一种处理示意图；

图12是本申请实施例提供的一种导播控制系统的示意图；

图13是本申请实施例提供的一种处理示意图；

图14是本申请实施例提供的一种处理示意图；

图15是本申请实施例提供的一种处理示意图；

图16是本申请实施例提供的一种导播控制系统的示意图；

图17是本申请实施例提供的一种处理示意图；

图18是本申请实施例提供的一种处理示意图；

图19是本申请实施例提供的一种处理示意图；

图20是本申请实施例提供的一种导播控制的装置示意图。

具体实施方式

下面对本实施例中使用的一些名词进行解释。

基准方向：导播控制系统中的设备都可以是有向设备，有向设备具有基准方向，也可以称作设备的正方向，设备的基准方向会随设备的旋转而旋转。基准方向一般在设备生产过程中就已经人为设定好，而且还可以在设备上设置相应的图标进行标记，以方便用户安装。例如，某云台摄像机的基准方向是云台座的任意指定半径方向，在云台座上，该半径的位置处，可以印制有一个线条标记。

有向设备的特点是，设备的实时输出参数中会包括方位角或旋转角(下面会分别进行介绍)，这类角度参数都需要以基准方向为参照来确定。

方位角：B对象相对于A设备的方位角，指的是从A设备的基准方向到B对象等效中心与A设备等效中心的连线在平面内的夹角。本实施例将从A设备的基准方向到B对象等效中心与A设备等效中心的连线在平面内的逆时针夹角定义为B设备相对于A设备的方位角。

偏角：设备的基准方向相对于指定方向(可以人为设置)的夹角。本实施例将设备的从基准方向到指定方向在平面内的逆时针夹角定义为该设备的偏角。

方位：设备的方位指的是设备的基准方向朝向的方向，可以用设备的基准方向与相对于指定方向的夹角表示(也即设备的偏角)，指定方向可以是X轴或Y轴方向。

指定方向：是用于确定设备的偏角而设置的一个方向，导播控制系统中，可以针对不同的设备设置不同的指定方向，也可以对不同的设备设置相同的指定方向。在建立直角坐标系的情况下，指定方向是以坐标轴为参照的方向。上面已经提到，设备的偏角是以指定方向为参照，那么实际上设备的偏角也是以坐标轴为参照的。导播操作的过程中，声源对象的方位以麦克风阵列的基准方向为参照，那么实际上声源对象的方位也可以最终表示为与坐标轴的相对角度。实际应用中，为了计算方便，一般会把指定方向设置为某坐标轴的正向。

旋转角：C设备中可以包括M部件和N部件，M部件可旋转的安装在N部件上，M部件的旋转角，指的是M部件的正方向相对于N部件的正方向的旋转角，这里，N部件的正方向可以认为是C设备的基准方向。

声源对象：当前发声的人或物，一般是当前的发言人。

拍摄角度范围：又称视场角，指的是摄像机当前能够拍摄到的水平方向的角度和竖直方向的角度。

图像纵向中轴线：指的是图像竖直方向上能够将图像均分为二的假想线。

发声器：本申请实施例中的发声器是能够在控制设备控制下发出声音的器件。下面涉及的发声器可以为超声波发声器，发出的声音为超声波。

本申请实施例提供了一种导播控制方法，该方法可以应用在导播控制系统中。该导播控制系统可以包括麦克风阵列、摄像机和控制设备等。麦克风阵列可以有多种，例如分布式麦克风阵列(“分布式”是指不集成在其它设备上)或者集成在其它设备上的麦克风阵列。摄像机可以有多种，例如分布式摄像机或集成在其他设备上的摄像机。控制设备可以是独立的控制设备，也可以是集成有麦克风阵列和/或摄像机的控制设备。该导播控制系统还可以包括终端设备(如智慧屏或投影仪)等设备。控制设备、麦克风阵列和摄像机中的一种或多种设备可以集成在终端设备上。导播控制系统可以用于多种场景的拍摄和导播，例如会议场景、教学场景或节目录制场景，等等。本实施例以会议场景的导播为例进行说明，其他情况与之类似，在此不作赘述。

会议场景可以有多种，一种非常常见的会议场景是长条桌会议场景，该会议场景可以设置有条形会议桌和若干个座位，座位布置在条形会议桌周围，会议进行过程中，参会人员可以坐在座位上进行会议。本申请实施例以这种会议场景为例进行方案说明。

如图1所示，导播控制系统可以包括第一麦克风阵列、第二麦克风阵列、控制设备和摄像机等。第一麦克风阵列和第二麦克风阵列可以是分布式麦克风阵列。分布式麦克风阵列可以摆放在会议场景中的任意位置。控制设备可以是独立的设备，也可以集成在麦克风阵列或摄像机上。

在控制设备执行导播控制方法之前，可以设定平面坐标系，该平面坐标系可以是水平面内的二维直角坐标系，可以设定会议室空间内的任一点为平面坐标系的原点，平面坐标系的X轴方向和Y轴方向可以是水平面内任意两个相互垂直的方向。控制设备中可以记录有麦克风阵列、摄像机等部分或全部设备的位置、指定方向和偏角，设备的位置可以是该设备的等效中心在平面坐标系的投影点的坐标。一般会将会议室中某个位置不会随意移动的设备的等效中心作为坐标系的原点，并将以该设备作为参照的方向为X轴方向和Y轴方向。例如，将会议终端的等效中心作为坐标系的原点，将会议终端的屏幕法向作为Y轴方向，将水平面内与法向垂直的方向作为X轴方向。

基于上述导播控制系统，本申请实施例提供了一种导播控制方法，该方法可以由导播控制系统中的控制设备来执行。该控制设备可以是服务器、终端或集成在其他设备中的一个组件等。服务器可以是单独的服务器或服务器组。终端可以是布置在会议室中的设备，或者是布置在企业机房中的设备，还可以是便携设备，如智慧屏、台式计算机、笔记本计算机、手机、平板电脑、智能手表等。该控制设备可以集成在智慧屏、摄像机、麦克风阵列等设备中。

图2是本申请实施例提供的一种控制设备的结构示意图，从硬件组成上来看，控制设备20的结构可以如图2所示，包括处理器201、存储器202和通信部件203。

处理器201可以是中央处理器(central processing unit，CPU)或系统级芯片(system on chip，SoC)等，处理器201可以用于确定声源对象相对于第一麦克风阵列的方位角θ ₁、声源对象相对于第二麦克风阵列的方位角θ ₂，还可以用于确定声源对象的位置等等。

存储器202可以包括各种易失性存储器或非易失性存储器，如固态硬盘(solid state disk，SSD)、动态随机存取存储器(dynamic random access memory，DRAM)内存等。存储器202可以用于存储记录有导播控制的过程中使用到的初始数据、中间数据和结果数据，例如第一麦克风阵列的检测数据、第二麦克风阵列的检测数据、声源对象相对于第一麦克风阵列的方位角θ ₁、声源对象相对于第二麦克风阵列的方位角θ ₂、第一麦克风阵列的位置、第二麦克风阵列的位置和声源对象的位置，等等。

通信部件203可以是有线网络连接器、无线保真(wireless fidelity，WiFi)模块、蓝牙模块、蜂巢网通信模块等。通信部件203可以用于与其他设备进行数据传输，其他设备可以是服务器、也可以是终端等。例如，控制设备20可以接收第一麦克风阵列的检测数据、第二麦克风阵列的检测数据，还可以将声源对象的位置发送至服务器进行存储。

如图3所示，导播控制系统可以包括第一麦克风阵列，第二麦克风阵列和摄像机。第一麦克风阵列和第二麦克风阵列为分布式麦克风阵列。第一麦克风阵列的数量可以包括一个或多个。摄像机可以是分布式摄像机，摄像机的数量可以包括一个或多个。

在会议室中上述各设备的位置可以任意设置，例如，对于长条桌会议室，第一麦克风阵列和第二麦克风阵列可以放置于长条桌上，两个摄像机可以分别悬挂在长条桌两侧的墙面上。控制设备中可以记录有第一麦克风阵列、第二麦克风阵列、摄像机等设备的位置和偏角，设备的位置可以是该设备的等效中心在平面坐标系的投影点的坐标。

下面针对图3所示的导播控制系统，对本申请实施例提供的导播控制方法的处理流程进行详细说明，该处理流程可以如图4所示。本申请实施例以声源对象为会议场景下的发言人为例进行说明，其他情况与之类似在此不做赘述。

401，控制设备确定第一麦克风阵列的位置以及摄像机的位置。

控制设备可以获取预先存储的第一麦克风阵列的位置以及摄像机的位置。或者，控制设备可以通过参数标定过程来测定第一麦克风阵列的位置以及摄像机的位置，参数标定的具体处理过程在后面内容中会进行详细说明。

402，在发言人发声时，控制设备根据发言人相对于第一麦克风阵列的位置、发言人相对于第二麦克风阵列的位置、第一麦克风阵列的位置和第二麦克风阵列的位置，确定发言人的位置。

其中，发言人相对于第一麦克风阵列的位置和发言人相对于第二麦克风阵列的位置可以通过方位角来表示。

在发言人讲话时，第一麦克风阵列中的每个麦克风可以检测到相应的音频数据，第一麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定发言人相对于第一麦克风阵列的方位角θ ₁，声源定位过程使用的算法可以是可控波束(steered-response power，SRP)算法等。同样地，控制设备也可以根据第二麦克风阵列的麦克风检测到的音频数据进行声源定位，确定发言人相对于第二麦克风阵列的方位角θ ₂。参考图5，方位角θ ₁是从第一麦克风阵列的基准方向到发言人与第一麦克风阵列的连线在水平面内的逆时针夹角，方位角θ ₂是从第一麦克风阵列的基准方向到发言人与第二麦克风阵列的连线在水平面内的逆时针夹角。

下面分两种具体情况介绍一下确定发言人位置的处理：

情况一

参考图6，发言人的位置坐标表示为(x，y)，第一麦克风阵列的坐标表示为(x ₁，y ₁)，第二麦克风阵列的坐标表示为(x ₂，y ₂)，计算过程可以如下：

进一步计算可以得到发言人的位置坐标(x，y)。

情况二

对于第一麦克风阵列和第二麦克风阵列的偏角都不为0度的情况，控制设备可以根据第一麦克风阵列的偏角γ ₁、第二麦克风阵列的偏角γ ₂、方位角θ ₁、方位角θ ₂、第一麦克风阵列的位置和第二麦克风阵列的位置，以及第一麦克风阵列、第二麦克风阵列、发言人之间的几何关系，通过计算得到发言人的位置。参考图7，发言人的位置坐标表示为(x，y)，第一麦克风阵列的坐标表示为(x ₁，y ₁)，第二麦克风阵列的坐标表示为(x ₂，y ₂)，计算过程可以如下：

进一步计算可以得到发言人的位置坐标(x，y)。

需要说明的是，第一麦克风阵列、第二麦克风阵列、发言人之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到发言人的位置。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

403，控制设备基于发言人的位置以及摄像机的位置，确定对摄像机的导播操作。

下面分两种具体情况介绍一下控制摄像机的导播操作的处理：

情况一

情况二

需要说明的是，上述导播控制系统的示例中，可以添加多个摄像头布置在不同的位置，以更好地拍摄参会成员。以下针对多摄像头的情况介绍几种不同的处理方式：

方式一，对于导播控制系统中存在至少两个摄像头的情况，控制设备可以基于发言人的位置和两个摄像机的位置，确定两个摄像机中与发言人距离较远的目标摄像机，基于发言人的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。

这种处理方式可以适用于如下场景：会议室中布置有长条桌，长条桌两侧布置有若干椅子，发言人面向长条桌坐在椅子上。长条桌两侧的墙壁上分别设置有一个摄像机。在这种场景下，对于分别布置在长条桌两侧的墙壁上的两个摄像机而言，距离发言人较远的摄像机能够更好地拍摄到发言人的人脸。因此，可以将两个摄像机中与发言人距离较远的摄像机确定为目标摄像机，然后基于发言人的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。

方式二，控制设备可以基于声源对象的位置和多个摄像机的位置，控制多个摄像机对声源对象进行拍摄，得到多个视频图像。然后，可以对得到的多个视频图像进行图像识别，选取满足目标条件的视频图像作为导播视频图像。目标条件可以有多种，例如，选取人脸角度最接近正面的视频图像作为导播视频图像等，视频图像中的人脸角度可以使用人脸角度检测的机器学习模型来确定。

上述对发言人的定位过程中，可能涉及的参数包括各设备的位置以及各设备的偏角。这些参数可以全部是预先录入控制设备的，可以在安装后测量录入，或者也可以在设备出厂前录入，这种情况下，安装时要考虑该出厂配置。这些参数也可以有一部分是预先录入控制设备的，另一部分则可以通过参数标定过程来测定。具体哪些参数需要预先录入、哪些参数需要标定，可以基于导播控制系统中的设备情况来确定，例如，位置可以随时改变的设备的参数需要标定，如分布式的麦克风阵列等，位置相对固定的设备的参数可以预先录入，如会议终端上集成的麦克风阵列。

技术人员可以在控制设备中预先录入指定设备的位置和偏角，然后由控制设备通过参数标定过程来测定指定设备外的其他设备的位置和偏角。例如，指定设备可以是某个麦克风阵列等。下面针对几种不同情况的导播控制系统，对参数标定的过程进行详细说明。

情况一，如图8所示，导播控制系统可以包括第一麦克风阵列、会议终端和摄像机。第一麦克风阵列为分布式麦克风阵列，可以集成有第一发声器，第一麦克风阵列的数量可以包括一个或多个。会议终端可以是智慧屏，会议终端可以集成有控制设备、第二麦克风阵列、第二发声器和第三发声器。摄像机可以是分布式摄像机，可以集成有第四发声器和第三麦克风阵列，摄像机的数量可以包括一个或多个。发声器可以有多种可能性，如普通扬声器或超声波发射器等。

在会议室中上述各设备的位置可以任意设置，例如，对于长条桌会议室，会议终端安装在长条桌一端的墙面上，第二麦克风阵列安装于会议终端的顶部正中位置，第二发声器和第三发声器安装于会议终端两侧，第一麦克风阵列可以放置于长条桌上，两个摄像机可以分别悬挂在长条桌两侧的墙面上。

控制设备可以预先记录有第二麦克风阵列的位置、第二麦克风阵列的偏角、第二麦克风阵列中第一麦克风的位置、第二麦克风阵列中第二麦克风的位置、第二发声器的位置、第三发声器的位置，并预先记录第一麦克风阵列对应的第一指定方向，摄像机对应的第二指定方向。示例性地，控制设备以第二麦克风阵列的中心位置为坐标原点、以第二麦克风阵列的基准方向为X轴正向在水平面内建立平面直角坐标系。可替代地，也可以设置第二麦克风阵列的基准方向为屏幕方向，而且，第二麦克风阵列中的第一麦克风和第二麦克风在会议终端上可以是相对于中心位置对称设置的。麦克风阵列中的麦克风之间的距离通常是明确的，当第一麦克风和第二麦克风之间的距离为D时，所以第一麦克风的位置坐标可以记录为(0，-D/2),第二麦克风的位置坐标可以记录为(0，D/2)。同样的，第二发声器和第三发声器在会议终端上一般是相对于中心位置对称设置的。当第二发声器和第三发声器之间的距离为L时，第二发声器的位置坐标可以记录为(0，-L/2)，第三发声器的位置坐标可以记录为(0，L/2)。上述第一麦克风、第二麦克风、第二发声器和第三发声器的位置，可以会议终端出厂前预先存储。另外，可以设置并记录第一麦克风阵列对应的第一指定方向为X轴正向，摄像机对应的第二指定方向为Y轴正向。

基于上述导播控制系统，下面分别介绍第一麦克风阵列的位置、第一麦克风阵列的偏角、摄像机的位置和摄像机的偏角的标定过程。

(1)第一麦克风阵列的位置标定(如果存在多个第一麦克风阵列，则每个第一麦克风阵列的位置标定均可以采用如下处理方式)

控制设备控制第一发声器发出声音信号S ₁，基于第一发声器发出声音信号S ₁的时间点和第二麦克风阵列中的第一麦克风、第二麦克风检测到声音信号S ₁的时间点，确定第一麦克风与第一发声器的距离D ₁、以及第二麦克风与第一发声器的距离D ₂，控制设备基于第一麦克风的位置、第二麦克风的位置、距离D ₁和距离D ₂，确定第一发声器和第一麦克风阵列的位置。

在实施中，控制设备控制第一发声器发出声音信号S ₁时，第一发声器将发出声音信号S ₁ 的时间点t ₁发送给控制设备进行记录。第二麦克风阵列中的每个麦克风可以接收到声音信号，并记录检测到该声音信号的时间点，发送给控制设备。控制设备可以获取第二麦克风阵列中的第一麦克风检测到声音信号S ₁的时间点t ₂、以及第二麦克风阵列中的第二麦克风检测到声音信号S ₁的时间点t ₃，然后，可以计算得到时间点t ₁与时间点t ₂之间的时长ΔT ₁、时间点t ₁与时间点t ₃之间的时长ΔT ₂。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风与第一发声器的距离D ₁和第二麦克风与第一发声器的距离D ₂。

根据第一麦克风和第二麦克风的位置，可以确定第一麦克风和第二麦克风之间的距离为D。然后，控制设备可以根据距离D、距离D ₁和距离D ₂，以及第一麦克风、第二麦克风和第一发声器之间的几何关系，通过计算得到第一发声器的位置。参考图9，从第一麦克风与第一发声器的连线到第一麦克风与第二麦克风的连线在水平面内的逆时针夹角表示为γ ₃，第一发声器的坐标表示为(x ₁，y ₁)，计算过程可以如下：

需要说明的是，第一麦克风、第二麦克风、第一发声器之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第一发声器的位置。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

基于图9，对方位角的计算原理进行介绍，也即对前面提到的SRP算法进行介绍：

该算法的计算公式如下：

我们选取第一麦克风为参考麦克风，d _mcosθ代表声源到达第m个麦克风与参考麦克风之间路程差。

对于单声源定位，在θ属于角度搜索范围前提下，确定Y(θ)的最大极值点对应的角度θ，即为声源对象的方位角。

(2)第一麦克风阵列的偏角标定(如果存在多个第一麦克风阵列，则每个第一麦克风阵列的偏角标定均可以采用如下处理方式)

第一麦克风阵列的偏角是第一麦克风阵列的基准方向相对于第一指定方向的夹角，第一指定方向可以是X轴正向。

控制设备控制第二发声器发出声音信号S ₂，基于第一麦克风阵列的检测数据，确定第二发声器相对于第一麦克风阵列的方位角θ ₃，控制设备控制第三发声器发出声音信号S ₃，基于第一麦克风阵列的检测数据，确定第三发声器相对于第一麦克风阵列的方位角θ ₄，基于方位角θ ₃、方位角θ ₄、第二发声器的位置与第三发声器的位置，确定第一麦克风阵列的偏角θ ₅。

在实施中，第二发声器发出声音信号S ₂时，第一麦克风阵列中的每个麦克风可以检测到相应的音频数据，第一麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第二发声器相对于第一麦克风阵列的方位角θ ₃。同样地，第三发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第三发声器相对于第一麦克风阵列的方位角θ ₄。控制设备可以根据第二发声器的位置坐标、第三发声器的位置坐标，确定第二发声器和第三发声器的距离L。然后控制设备可以基于方位角θ ₃、方位角θ ₄、第二发声器的位置、第三发声器的位置，以及第一麦克风阵列、第二发声器和第三发声器之间的位置关系，通过计算确定第一麦克风阵列的偏角θ ₅。参考图10，第一麦克风阵列的坐标表示为(x ₁，y ₁)，第二发声器的坐标表示为(0，-L/2)，第三发声器的坐标表示为(0，L/2)，第二发声器和第一麦克风阵列的距离表示为L ₁、第三发声器和第一麦克风阵列的距离表示为L ₂，计算过程可以如下：

cos(θ ₃-θ ₅-π)·L ₁＝cos(π-θ ₄+θ ₅)·L ₂

sin(θ ₃-θ ₅-π)·L ₁+sin(π-θ ₄+θ ₅)·L ₂＝L

进一步计算可以得到偏角θ ₅。

需要说明的是，第一麦克风阵列、第二发声器、第三发声器之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第一麦克风阵列的偏角。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

(3)摄像机的位置标定(如果存在多个摄像机，则每个摄像机的位置标定均可以采用如下处理方式)

控制设备控制第四发声器发出声音信号S ₄，基于第四发声器发出声音信号S ₄的时间点和第二麦克风阵列中的第一麦克风、第二麦克风检测到声音信号S ₄的时间点，确定第一麦克风与第四发声器的距离D ₃、以及第二麦克风与第四发声器的距离D ₄，控制设备基于第一麦克风的位置、第二麦克风的位置、距离D ₃和距离D ₄，确定第四发声器和摄像机的位置。

在实施中，控制设备控制第四发声器发出声音信号S ₄时，可以记录第四发声器发出声音信号S ₄的时间点t ₄。第二麦克风阵列中的每个麦克风可以检测到相应的音频数据，并记录有音频数据对应的检测时间点，即检测到该音频数据的时间点。控制设备可以获取第二麦克风阵列中的第一麦克风检测到声音信号S ₄的时间点t ₅、以及第二麦克风阵列中的第二麦克风检测到声音信号S ₄的时间点t ₆，然后，可以计算得到时间点t ₄与时间点t ₅之间的时长ΔT ₃、时间点t ₄与时间点t ₆之间的时长ΔT ₄。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风与第四发声器的距离D ₃和确定第二麦克风与第四发声器的距离D ₄。

根据第一麦克风和第二麦克风的位置，可以确定第一麦克风和第二麦克风之间的距离为D。然后，控制设备可以根据距离D、距离D ₃和距离D ₄，以及第一麦克风、第二麦克风和第四发声器之间的几何关系，通过计算得到第四发声器的位置。确定第四发声器的位置的计算过程与情况一中确定第一发声器的位置的过程相似，可以参照情况一中第一麦克风阵列的位置标定的相关说明。

(4)摄像机的偏角标定(如果存在多个摄像机，则每个摄像机的偏角标定均可以采用如下处理方式)

控制设备控制第一发声器发出声音信号S ₅，基于第三麦克风阵列的检测数据，确定第一发声器相对于第三麦克风阵列的方位角θ ₆，并控制第四发声器发出声音信号S ₆，基于第一麦克风阵列的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇，控制设备基于方位角θ ₆、方位角θ ₇和第一麦克风阵列的偏角θ ₅，确定第三麦克风阵列和摄像机的偏角θ ₈。

其中，第三麦克风阵列的等效中心和摄像机的等效中心可以相同，即第三麦克风的位置和摄像机的位置可以相同。第三麦克风的偏角和摄像机的偏角可以相同。第四发声器的等效中心和摄像机的等效中心可以相同，即第四发声器的位置和摄像机的位置可以相同。

在实施中，第一发声器发出声音信号S ₅时，第三麦克风阵列中的每个麦克风可以检测到相应的音频数据，第三麦克风阵列将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第一发声器相对于第三麦克风阵列的方位角θ ₆。同样地，第四发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第四发声器相对于第一麦克风阵列的方位角θ ₇。

根据方位角θ ₆、方位角θ ₇、偏角θ ₅，以及第一发声器、第三麦克风阵列和第四发声器之间的几何关系，可以计算得到第三麦克风和摄像机的偏角θ ₈。参考图11，计算过程可以如下：

需要说明的是，第一发声器、第三麦克风阵列、第四发声器之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第三麦克风阵列和摄像机的偏角。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

情况二，如图12所示，导播控制系统的架构与情况一相似，不同之处在于摄像机可以没有集成第三麦克风阵列，以及第一麦克风阵列除了集成有第一发声器外，还可以集成有发光器。发光器可以有多种可能性，如普通LED光源或红外LED光源等。

控制设备可以预先记录有第二麦克风阵列的位置、第二麦克风阵列的偏角、第二麦克风阵列中第一麦克风的位置、第二麦克风阵列中第二麦克风的位置、第二发声器的位置、第三发声器的位置，并预先记录第一麦克风阵列对应的第一指定方向，摄像机对应的第二指定方向。示例性地，控制设备以第二麦克风阵列的位置为坐标原点、以第二麦克风阵列的基准方向为X轴正向在水平面内建立平面直角坐标系。第二麦克风阵列中的第一麦克风和第二麦克风在会议终端上可以是相对于中心位置对称设置的。当第一麦克风和第二麦克风之间的距离为D时，第二麦克风阵列中第一麦克风的位置坐标可以记录为(0，-D/2),第二麦克风阵列中第二麦克风的位置坐标可以记录为(0，D/2)。同样的，第二发声器和第三发声器在会议终端上一般是相对于中心位置对称设置的。当第二发声器和第三发声器之间的距离为L时，第二发声器的位置坐标可以记录为(0，-L/2)，第三发声器的位置坐标可以记录为(0，L/2)。另外，可以设置并记录第一麦克风阵列对应的第一指定方向为X轴正向，摄像机对应的第二指定方向为Y轴正向。

情况二的第一麦克风阵列的位置标定、第一麦克风阵列的偏角标定与摄像机的位置标定与情况一的相应处理相似，可以参照情况一相应处理的说明，在此不做赘述。情况二的摄像机的偏角标定与情况一的相应处理不同，下面将详细说明：

摄像机的偏角标定(如果存在多个摄像机，则每个摄像机的偏角标定均可以采用如下处理方式)

摄像机的偏角是摄像机的基准方向相对于第二指定方向的角度，第二指定方向可以是Y轴正向。

控制设备控制发光器发光，确定摄像机拍摄的图像中的发光点位置，基于图像中的发光点位置，确定发光器相对于摄像机的方位角θ ₉，并控制第四发声器发出声音信号S ₆，基于第一麦克风阵列的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇，控制设备基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的基准方向与第一指定方向的夹角θ ₅，确定摄像机的偏角θ ₈。

其中，发光器的等效中心与第一麦克风阵列的等效中心可以相同，即发光器的位置与第一麦克风阵列的位置可以相同。第四发声器的等效中心和摄像机的等效中心可以相同，即第四发声器的位置和摄像机的位置可以相同。

在实施中，控制设备可以记录有摄像机焦距与水平拍摄角度范围(又称为水平视场角)的对应关系。该对应关系可以是摄像机上报给控制设备的，也可以是人工录入控制设备的，等等。控制设备可以确定摄像机当前的焦距。然后在上述对应关系表中查找当前的焦距对应的水平拍摄角度范围γ ₄。控制器在控制发光器发光之后，可以获取摄像机拍摄的图像，并在图像中确定发光点位置与图像纵向中轴线的距离L ₃。控制设备中可以记录有图像左侧或右侧边界与图像纵向中轴线的距离L ₄。摄像头的实时拍摄方向对应于图像的纵向中轴线。根据水平拍摄角度γ ₄、距离L ₃和距离L ₄，可以确定发光器相对于摄像头的方位角γ ₅，方位角γ ₅是从摄像头的实时拍摄方向到发光器与摄像头的连线的逆时针夹角。参考图13和图14，计算过程可以如下：

此时控制设备还可以获取摄像机当前的旋转角γ ₆。根据方位角γ ₅和旋转角γ ₆，可以计算得到发光器相对于摄像机的方位角θ ₉。参考图14，计算过程可以如下：

θ ₉＝γ ₆+γ ₅

旋转角γ ₆是摄像机的摄像头相对于固定底座的旋转角度，一般摄像头是在控制设备的控制下转动的，所以控制设备是已知该旋转角γ ₆的。

需要说明的是，发光器、摄像头和固定底座之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到方位角θ ₉。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

控制设备基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的偏角θ ₅，以及第一麦克风阵列、摄像机和第四发声器之间的几何关系，可以计算得到摄像机的偏角θ ₈。参考图15，计算过程可以如下：

对于计算出的θ ₈，可以将其数值调整到0～2π的范围内，例如，θ ₈为560°，可以将其调整为200°(即560°-360°)。

需要说明的是，第一麦克风阵列、摄像机和第四发声器之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到摄像机的偏角。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

情况三，如图16所示，导播控制系统可以包括第一麦克风阵列、第二麦克风阵列和摄像机。第一麦克风阵列和第二麦克风阵列均为分布式麦克风阵列，第一麦克风阵列可以集成有第一发声器和发光器，第二麦克风阵列可以集成有第五发声器。第一麦克风阵列的数量可以包括一个或多个。摄像机可以是分布式摄像机，可以集成有第四发声器，摄像机的数量可以包括一个或多个。发声器可以有多种可能性，如普通扬声器或超声波发射器等。发光器可以有多种可能性，如普通LED光源或红外LED光源等。导播控制系统中还可以包括会议终端，控制设备可以集成在会议终端中，或者也可以集成在其他设备中，或者也可以是一个额外的单独的终端设备。

在会议室中上述各设备的位置可以任意设置，例如，对于长条桌会议室，第一麦克风阵列和第二麦克风阵列可以放置于长条桌上，两个摄像机可以分别悬挂在长条桌两侧的墙面上。

控制设备可以预先记录有第二麦克风阵列的位置、第二麦克风阵列的偏角，并预先记录第一麦克风阵列对应的第一指定方向，摄像机对应的第二指定方向。示例性地，控制设备以第二麦克风阵列的位置为坐标原点、以第二麦克风阵列的基准方向为X轴正向在水平面内建立平面直角坐标系。可以设置并记录第一麦克风阵列对应的第一指定方向为X轴正向，摄像机对应的第二指定方向为Y轴正向。

控制设备控制第一发声器发出声音信号S ₇，基于第一发声器发出声音信号S ₇的时间点和第二麦克风阵列检测到声音信号S ₇的时间点，确定第二麦克风阵列与第一发声器的距离D ₅，并基于第二麦克风阵列的检测数据，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀，控制设备基于距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，确定第一发声器和第一麦克风阵列的位置。

在实施中，控制设备控制第一发声器发出声音信号S ₇时，可以记录第一发声器发出声音信号S ₇的时间点t ₇。第二麦克风阵列的麦克风可以检测到相应的音频数据，并记录有音频数据对应的检测时间点t ₈，即检测到该音频数据的时间点。控制设备可以获取第二麦克风阵列检测到声音信号S ₇的时间点t ₇、以及第二麦克风阵列检测到声音信号S ₇的时间点t ₈，然后，可以计算得到时间点t ₇与时间点t ₈之间的时长ΔT ₅。进而，控制设备可以根据预先存储的音速数据V，计算得到第二麦克风阵列与第一发声器的距离D ₅。

控制设备可以根据距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，以及第一发声器与第二麦克风阵列的几何关系，计算得到第一发声器的位置。第一发声器的坐标表示为(x ₁，y ₁)，参考图17，计算过程可以如下：

x ₁＝D ₅·sinθ ₁₀

y ₁＝D ₅·cosθ ₁₀

需要说明的是，第一发声器和第二麦克风阵列之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第一发声器的位置。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

控制设备控制第一发声器发出声音信号S ₇，基于第二麦克风阵列的检测数据，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀，并控制第五发声器发出声音信号S ₈，基于第一麦克风阵列的检测数据，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁，控制设备基于方位角θ ₁₀、方位角θ ₁₁和第二麦克风阵列的基准方向与第一指定方向的夹角θ ₁₂，确定第一麦克风阵列的偏角θ ₅。

在实施中，第一发声器发出声音信号S ₇时，第二麦克风阵列的麦克风可以检测到相应的音频数据，第二麦克风阵列可以将这些音频数据发送至控制设备。控制设备可以根据这些音频数据进行声源定位，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀。同样地，第五发声器发声时，控制设备也可以根据第一麦克风阵列的麦克风检测到的音频数据进行声源定位，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁。

对于θ ₁₂为0度的情况，控制设备可以根据方位角θ ₁₀、方位角θ ₁₁，以及第二麦克风阵列和第一麦克风阵列的几何关系，确定第一麦克风阵列的偏角θ ₅。参考图18，计算过程可以如下：

θ ₅＝θ ₁₁-θ ₁₀-π

对于θ ₁₂不为0度的情况，控制设备可以根据方位角θ ₁₀、方位角θ ₁₁、夹角θ ₁₂，以及第二麦克风阵列和第一麦克风阵列的几何关系，确定第一麦克风阵列的偏角θ ₅。参考图19，计算过程可以如下：

θ ₅＝θ ₁₂+θ ₁₁-θ ₁₀-π

需要说明的是，第一麦克风阵列和第二麦克风阵列之间的位置关系有多种可能，上述说明过程仅以其中的一种位置关系为例进行说明，对于其他可能的位置关系，均可以根据上述相关数据通过几何运算得到第一麦克风阵列的偏角。上述说明过程中采用的位置关系和计算方法不构成对本实施例的限定。

控制设备控制第四发声器发出声音信号S ₉，基于第四发声器发出声音信号S ₉的时间点和第一麦克风阵列、第二麦克风阵列检测到声音信号S ₉的时间点，确定第一麦克风阵列与第四发声器的距离D ₆、以及第二麦克风阵列与第四发声器的距离D ₇，基于第一麦克风阵列的位置、第二麦克风阵列的位置、距离D ₆和距离D ₇，确定第四发声器和摄像机的位置。

在实施中，控制设备控制第四发声器发出声音信号S ₉时，可以记录第四发声器发出声音信号S ₉的时间点t ₉。第一麦克风阵列和第二麦克风阵列可以检测到相应的音频数据，并记录有音频数据对应的检测时间点，即检测到该音频数据的时间点。控制设备可以获取第一麦克风阵列检测到声音信号S ₉的时间点t ₁₀、以及第二麦克风阵列检测到声音信号S ₉的时间点t ₁₁，然后，可以计算得到时间点t ₉与时间点t ₁₀之间的时长ΔT ₆、时间点t ₉与时间点t ₁₁之间的时长ΔT ₇。进而，控制设备可以根据预先存储的音速数据V，计算得到第一麦克风阵列与第四发声器的距离D ₆和确定第二麦克风阵列与第四发声器的距离D ₇。

根据第一麦克风阵列和第二麦克风阵列的位置，可以确定第一麦克风阵列和第二麦克风阵列之间的距离为D ₈。然后，控制设备可以根据距离D ₆、距离D ₇和距离D ₈，以及第一麦克风阵列、第二麦克风阵列和第四发声器之间的几何关系，通过计算得到第四发声器的位置。确定第四发声器的位置的计算过程与情况一中确定第一发声器的位置的过程相似，可以参照情况一的第一麦克风阵列的位置标定的相关说明。

情况三的摄像机的偏角标定与情况二的相应处理相似，可以参照情况二的摄像机的偏角标定的说明，在此不做赘述。

基于相同的技术构思，本申请实施例还提供了一种导播控制的装置，该装置可以应用于上述实施例提到的导播控制系统中的控制设备，导播控制系统包括第一麦克风阵列、第二麦克风阵列、摄像机和控制设备，如图20所示，该装置包括：

标定模块2001，用于确定第一麦克风阵列的位置以及摄像机的位置。具体可以实现上述步骤401的标定功能，以及其他隐含步骤。

确定模块2002，用于在声源对象发声时，根据声源对象相对于第一麦克风阵列的位置、声源对象相对于第二麦克风阵列的位置、第一麦克风阵列的位置和第二麦克风阵列的位置，确定声源对象的位置。具体可以实现上述步骤402的确定功能，以及其他隐含步骤。

控制模块2003，用于基于声源对象的位置以及摄像机的位置，确定对摄像机的导播操作。具体可以实现上述步骤403的控制功能，以及其他隐含步骤。

在一种可能的实现方式中，第一麦克风阵列中集成有第一发声器，第二麦克风阵列包括第一麦克风和第二麦克风，标定模块2001用于：基于第一麦克风和第二麦克风接收到第一发声器发出的声音信号的时间以及第一发声器发出声音信号的时间确定第一发声器与第一麦克风之间的距离D ₁以及第一发声器与第二麦克风之间的距离D ₂；基于第一麦克风的位置、第二麦克风的位置、距离D ₁和距离D ₂，确定第一麦克风阵列相对于第二麦克风阵列的位置。

在一种可能的实现方式中，导播控制系统还包括第二发声器和第三发声器，第二发声器和第三发声器与第二麦克风阵列集成在同一电子屏幕上，标定模块2001还用于：获得第一麦克风阵列发送的第二发声器相对于第一麦克风阵列的方位角θ ₃和第三发声器相对于第一麦克风阵列的方位角θ ₄；基于方位角θ ₃、方位角θ ₄、第二发声器的位置与第三发声器的位置，确定第一麦克风阵列的方位。

在一种可能的实现方式中，摄像机集成有第四发声器，第二麦克风阵列包括第一麦克风和第二麦克风，标定模块2001用于：基于第一麦克风和第二麦克风接收到第四发声器发出声音信号的时间以及第四发声器发出声音信号的时间，确定第一麦克风与第四发声器的距离D ₃、以及第二麦克风与第四发声器的距离D ₄；基于第一麦克风的位置、第二麦克风的位置、距离D ₃和距离D ₄，确定摄像机相对于第二麦克风阵列的位置。

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，摄像机集成有第四发声器和第三麦克风阵列，标定模块2001用于：基于第三麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第三麦克风阵列的方位角θ ₆，基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇；基于方位角θ ₆、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的偏角。

在一种可能的实现方式中，第一麦克风阵列集成有发光器，摄像机集成有第四发声器，标定模块2001用于：确定摄像机拍摄的图像中的发光点位置，图像是发光器发光时拍摄的，基于图像中的发光点位置以及摄像机的旋转角，确定发光器相对于摄像机的方位角θ ₉；基于第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定第四发声器相对于第一麦克风阵列的方位角θ ₇；基于方位角θ ₉、方位角θ ₇和第一麦克风阵列的方位，确定摄像机的方位

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，第二麦克风阵列包括第一麦克风和第二麦克风，标定模块2001用于：基于第二麦克风阵列在第一发声器发出声音信号时的检测数据确定第一发声器与第二麦克风阵列之间的距离D ₅以及第一发声器相对于第二麦克风阵列的方位角θ ₁₀；基于距离D ₅、方位角θ ₁₀和第二麦克风阵列的位置，确定第一麦克风阵列的位置。

在一种可能的实现方式中，第一麦克风阵列集成有第一发声器，第二麦克风阵列集成有第五发声器，标定模块2001用于：基于第二麦克风阵列在第一发声器发出声音信号时的检测数据，确定第一发声器相对于第二麦克风阵列的方位角θ ₁₀，以及基于第一麦克风阵列在第五发声器发出声音信号时的检测数据，确定第五发声器相对于第一麦克风阵列的方位角θ ₁₁；基于方位角θ ₁₀、方位角θ ₁₁和第二麦克风阵列的方位，确定第一麦克风阵列的方位。

在一种可能的实现方式中，摄像机集成有第四发声器，标定模块2001还用于：基于第一麦克风阵列和第二麦克风阵列接收到第四发声器发出的声音信号的时间和第四发声器发出声音信号的时间，确定第一麦克风阵列与第四发声器的距离D ₆、以及第二麦克风阵列与第四发声器的距离D ₇；基于第一麦克风阵列的位置、第二麦克风阵列的位置、距离D ₆和距离D ₇，确定摄像机的位置。

在一种可能的实现方式中，控制模块2003，用于：基于声源对象的位置和摄像机的位置，确定声源对象相对于摄像机的方位角、以及声源对象与摄像机的距离；基于声源对象相对于摄像机的方位角，确定摄像机的导播旋转角，并基于声源对象与摄像机的距离，确定摄像机的导播焦距。

在一种可能的实现方式中，导播控制系统还包括另一摄像机；控制模块2003，用于：基于声源对象的位置和两个摄像机的位置，确定两个摄像机中与声源对象距离较远的目标摄像机，基于声源对象的位置以及目标摄像机的位置，确定对目标摄像机的导播操作。

需要说明的是，上述标定模块2001、确定模块2002和控制模块2003可以由处理器实现，或者由处理器配合存储器、收发器来实现。

需要说明的是：上述实施例提供的导播控制的装置在执行导播控制处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的导播控制的装置与导播控制的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令，在设备上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴光缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是设备能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(如软盘、硬盘和磁带等)，也可以是光介质(如数字视盘(digital video disk，DVD)等)，或者半导体介质(如固态硬盘等)。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请一个实施例，并不用以限制本申请，凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种导播控制的方法，其特征在于，所述方法应用于导播控制系统，所述导播控制系统包括第一麦克风阵列、第二麦克风阵列、摄像机和控制设备，所述方法包括：

所述控制设备确定第一麦克风阵列的位置以及所述摄像机的位置；

在声源对象发声时，所述控制设备根据所述声源对象相对于所述第一麦克风阵列的位置、所述声源对象相对于所述第二麦克风阵列的位置、所述第一麦克风阵列的位置和所述第二麦克风阵列的位置，确定所述声源对象的位置；

所述控制设备基于所述声源对象的位置以及所述摄像机的位置，确定对所述摄像机的导播操作。
根据权利要求1所述的方法，其特征在于，所述第一麦克风阵列中集成有第一发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述确定所述第一麦克风阵列的位置包括：

所述控制设备基于所述第一麦克风和所述第二麦克风接收到所述第一发声器发出的声音信号的时间以及所述第一发声器发出声音信号的时间确定所述第一发声器与所述第一麦克风之间的距离D ₁以及所述第一发声器与所述第二麦克风之间的距离D ₂；

所述控制设备基于所述第一麦克风的位置、所述第二麦克风的位置、所述距离D ₁和所述距离D ₂，确定所述第一麦克风阵列相对于所述第二麦克风阵列的位置。
根据权利要求1或2所述的方法，其特征在于，所述导播控制系统还包括第二发声器和第三发声器，所述第二发声器和所述第三发声器与所述第二麦克风阵列集成在同一电子屏幕上，所述确定所述第一麦克风阵列的位置还包括：

所述控制设备获得所述第一麦克风阵列发送的所述第二发声器相对于所述第一麦克风阵列的方位角θ ₃和所述第三发声器相对于所述第一麦克风阵列的方位角θ ₄；

所述控制设备基于所述方位角θ ₃、所述方位角θ ₄、所述第二发声器的位置与所述第三发声器的位置，确定所述第一麦克风阵列的方位。
根据权利要求1所述的方法，其特征在于，所述摄像机集成有第四发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述确定所述摄像机的位置包括：

所述控制设备基于所述第一麦克风和所述第二麦克风接收到所述第四发声器发出声音信号的时间以及所述第四发声器发出声音信号的时间，确定所述第一麦克风与所述第四发声器的距离D ₃、以及所述第二麦克风与所述第四发声器的距离D ₄；

所述控制设备基于所述第一麦克风的位置、所述第二麦克风的位置、所述距离D ₃和所述距离D ₄，确定所述摄像机相对于所述第二麦克风阵列的位置。
根据权利要求3所述的方法，其特征在于，所述第一麦克风阵列集成有第一发声器，所述摄像机集成有第四发声器和第三麦克风阵列，所述确定所述摄像机的位置包括：

所述控制设备基于所述第三麦克风阵列在所述第一发声器发出声音信号时的检测数据，确定所述第一发声器相对于所述第三麦克风阵列的方位角θ ₆，基于所述第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定所述第四发声器相对于所述第一麦克风阵列的方位角θ ₇；

所述控制设备基于所述方位角θ ₆、所述方位角θ ₇和所述第一麦克风阵列的方位，确定所述摄像机的偏角。
根据权利要求3所述的方法，其特征在于，所述第一麦克风阵列集成有发光器，所述摄像机集成有第四发声器，所述确定所述摄像机的位置包括：

所述控制设备确定所述摄像机拍摄的图像中的发光点位置，所述图像是发光器发光时拍摄的，基于所述图像中的发光点位置以及所述摄像机的旋转角，确定所述发光器相对于所述摄像机的方位角θ ₉；

所述控制设备基于所述第一麦克风阵列在所述第四发声器发出声音信号时的检测数据，确定所述第四发声器相对于所述第一麦克风阵列的方位角θ ₇；

所述控制设备基于所述方位角θ ₉、所述方位角θ ₇和所述第一麦克风阵列的方位，确定所述摄像机的方位。
根据权利要求1所述的方法，其特征在于，所述第一麦克风阵列集成有第一发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述确定所述第一麦克风阵列的位置包括：

所述控制设备基于所述第二麦克风阵列在所述第一发声器发出声音信号时的检测数据确定所述第一发声器与所述第二麦克风阵列之间的距离D ₅以及所述第一发声器相对于所述第二麦克风阵列的方位角θ ₁₀；

所述控制设备基于所述距离D ₅、所述方位角θ ₁₀和所述第二麦克风阵列的位置，确定所述第一麦克风阵列的位置。
根据权利要求1所述的方法，其特征在于，所述第一麦克风阵列集成有第一发声器，第二麦克风阵列集成有第五发声器，所述确定第一麦克风阵列包括：

所述控制设备基于所述第二麦克风阵列在所述第一发声器发出声音信号时的检测数据，确定所述第一发声器相对于所述第二麦克风阵列的方位角θ ₁₀，以及基于所述第一麦克风阵列在所述第五发声器发出声音信号时的检测数据，确定所述第五发声器相对于所述第一麦克风阵列的方位角θ ₁₁；

所述控制设备基于所述方位角θ ₁₀、所述方位角θ ₁₁和所述第二麦克风阵列的方位，确定所述第一麦克风阵列的方位。
根据权利要求1所述的方法，其特征在于，所述摄像机集成有第四发声器，所述方法还包括：

所述控制设备基于所述第一麦克风阵列和所述第二麦克风阵列接收到所述第四发声器发出的声音信号的时间和所述第四发声器发出所述声音信号的时间，确定所述第一麦克风阵列与所述第四发声器的距离D ₆、以及所述第二麦克风阵列与所述第四发声器的距离D ₇；

所述控制设备基于所述第一麦克风阵列的位置、所述第二麦克风阵列的位置、所述距离D ₆和所述距离D ₇，确定所述摄像机的位置。
根据权利要求1所述的方法，其特征在于，所述控制设备基于所述声源对象的位置以及所述摄像机的位置，确定对所述摄像机的导播操作，包括：

所述控制设备基于所述声源对象的位置和所述摄像机的位置，确定所述声源对象相对于所述摄像机的方位角、以及所述声源对象与所述摄像机的距离；

所述控制设备基于所述声源对象相对于所述摄像机的方位角，确定所述摄像机的导播旋转角，并基于所述声源对象与所述摄像机的距离，确定所述摄像机的导播焦距。
根据权利要求1所述的方法，其特征在于，所述导播控制系统还包括另一摄像机；

所述控制设备基于所述声源对象的位置以及所述摄像机的位置，确定对所述摄像机的导播操作，包括：

所述控制设备基于所述声源对象的位置和所述两个摄像机的位置，确定两个摄像机中与所述声源对象距离较远的目标摄像机，基于所述声源对象的位置以及所述目标摄像机的位置，确定对所述目标摄像机的导播操作。
一种导播控制的装置，其特征在于，所述装置应用于导播控制系统中的控制设备，所述导播控制系统包括第一麦克风阵列、第二麦克风阵列、摄像机和所述控制设备，所述装置包括：

标定模块，用于确定第一麦克风阵列的位置以及所述摄像机的位置；

确定模块，用于在声源对象发声时，根据所述声源对象相对于所述第一麦克风阵列的位置、所述声源对象相对于所述第二麦克风阵列的位置、所述第一麦克风阵列的位置和所述第二麦克风阵列的位置，确定所述声源对象的位置；

控制模块，用于基于所述声源对象的位置以及所述摄像机的位置，确定对所述摄像机的导播操作。
根据权利要求12所述的装置，其特征在于，所述第一麦克风阵列中集成有第一发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述标定模块用于：

基于所述第一麦克风和所述第二麦克风接收到所述第一发声器发出的声音信号的时间以及所述第一发声器发出声音信号的时间确定所述第一发声器与所述第一麦克风之间的距离D ₁以及所述第一发声器与所述第二麦克风之间的距离D ₂；

基于所述第一麦克风的位置、所述第二麦克风的位置、所述距离D ₁和所述距离D ₂，确定所述第一麦克风阵列相对于所述第二麦克风阵列的位置。
根据权利要求12或13所述的装置，其特征在于，所述导播控制系统还包括第二发声器和第三发声器，所述第二发声器和所述第三发声器与所述第二麦克风阵列集成在同一电子屏幕上，所述标定模块还用于：

获得所述第一麦克风阵列发送的所述第二发声器相对于所述第一麦克风阵列的方位角θ ₃ 和所述第三发声器相对于所述第一麦克风阵列的方位角θ ₄；

基于所述方位角θ ₃、所述方位角θ ₄、所述第二发声器的位置与所述第三发声器的位置，确定所述第一麦克风阵列的方位。
根据权利要求12所述的装置，其特征在于，所述摄像机集成有第四发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述标定模块用于：

基于所述第一麦克风和所述第二麦克风接收到所述第四发声器发出声音信号的时间以及所述第四发声器发出声音信号的时间，确定所述第一麦克风与所述第四发声器的距离D ₃、以及所述第二麦克风与所述第四发声器的距离D ₄；

基于所述第一麦克风的位置、所述第二麦克风的位置、所述距离D ₃和所述距离D ₄，确定所述摄像机相对于所述第二麦克风阵列的位置。
根据权利要求14所述的装置，其特征在于，所述第一麦克风阵列集成有第一发声器，所述摄像机集成有第四发声器和第三麦克风阵列，所述标定模块用于：

基于所述第三麦克风阵列在所述第一发声器发出声音信号时的检测数据，确定所述第一发声器相对于所述第三麦克风阵列的方位角θ ₆，基于所述第一麦克风阵列在第四发声器发出声音信号时的检测数据，确定所述第四发声器相对于所述第一麦克风阵列的方位角θ ₇；

基于所述方位角θ ₆、所述方位角θ ₇和所述第一麦克风阵列的方位，确定所述摄像机的偏角。
根据权利要求14所述的装置，其特征在于，所述第一麦克风阵列集成有发光器，所述摄像机集成有第四发声器，所述标定模块用于：

确定所述摄像机拍摄的图像中的发光点位置，所述图像是发光器发光时拍摄的，基于所述图像中的发光点位置以及所述摄像机的旋转角，确定所述发光器相对于所述摄像机的方位角θ ₉；

基于所述第一麦克风阵列在所述第四发声器发出声音信号时的检测数据，确定所述第四发声器相对于所述第一麦克风阵列的方位角θ ₇；

基于所述方位角θ ₉、所述方位角θ ₇和所述第一麦克风阵列的方位，确定所述摄像机的方位。
根据权利要求12所述的装置，其特征在于，所述第一麦克风阵列集成有第一发声器，所述第二麦克风阵列包括第一麦克风和第二麦克风，所述标定模块用于：

基于所述第二麦克风阵列在所述第一发声器发出声音信号时的检测数据确定所述第一发声器与所述第二麦克风阵列之间的距离D ₅以及所述第一发声器相对于所述第二麦克风阵列的方位角θ ₁₀；

基于所述距离D ₅、所述方位角θ ₁₀和所述第二麦克风阵列的位置，确定所述第一麦克风阵列的位置。
根据权利要求12所述的装置，其特征在于，所述第一麦克风阵列集成有第一发声器，第二麦克风阵列集成有第五发声器，所述标定模块用于：

基于所述第二麦克风阵列在所述第一发声器发出声音信号时的检测数据，确定所述第一发声器相对于所述第二麦克风阵列的方位角θ ₁₀，以及基于所述第一麦克风阵列在所述第五发声器发出声音信号时的检测数据，确定所述第五发声器相对于所述第一麦克风阵列的方位角θ ₁₁；

基于所述方位角θ ₁₀、所述方位角θ ₁₁和所述第二麦克风阵列的方位，确定所述第一麦克风阵列的方位。
根据权利要求12所述的装置，其特征在于，所述摄像机集成有第四发声器，所述标定模块还用于：

基于所述第一麦克风阵列和所述第二麦克风阵列接收到所述第四发声器发出的声音信号的时间和所述第四发声器发出所述声音信号的时间，确定所述第一麦克风阵列与所述第四发声器的距离D ₆、以及所述第二麦克风阵列与所述第四发声器的距离D ₇；

基于所述第一麦克风阵列的位置、所述第二麦克风阵列的位置、所述距离D ₆和所述距离D ₇，确定所述摄像机的位置。
根据权利要求12所述的装置，其特征在于，所述控制模块，用于：

基于所述声源对象的位置和所述摄像机的位置，确定所述声源对象相对于所述摄像机的方位角、以及所述声源对象与所述摄像机的距离；

基于所述声源对象相对于所述摄像机的方位角，确定所述摄像机的导播旋转角，并基于所述声源对象与所述摄像机的距离，确定所述摄像机的导播焦距。
根据权利要求12所述的装置，其特征在于，所述导播控制系统还包括另一摄像机；

所述控制模块，用于：

基于所述声源对象的位置和所述两个摄像机的位置，确定两个摄像机中与所述声源对象距离较远的目标摄像机，基于所述声源对象的位置以及所述目标摄像机的位置，确定对所述目标摄像机的导播操作。
一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器用于存储计算机指令；所述处理器用于执行所述存储器存储的计算机指令，以使所述计算机设备执行上述权利要求1至11中任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序代码，当所述计算机程序代码被计算机设备执行时，所述计算机设备执行上述权利要求1至11中任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序代码，在所述计算机程序代码被计算机设备执行时，所述计算机设备执行上述权利要求1至11中任一项所述的方法。