WO2012083799A1

WO2012083799A1 - 级联会议中级联会场的处理方法、装置及系统

Info

Publication number: WO2012083799A1
Application number: PCT/CN2011/083806
Authority: WO
Inventors: 梁丽燕
Original assignee: 华为终端有限公司
Priority date: 2010-12-24
Filing date: 2011-12-12
Publication date: 2012-06-28
Also published as: EP2574051B1; EP2574051A4; EP2574051A1; US20130100239A1; CN102547210A; ES2585003T3; CN102547210B; US8836753B2

Description

级联^义中级联会场的处理方法、装置及系统本申请要求于 2010 年 12 月 24 日提交中国专利局、申请号为 201010605183.1、发明名称为"级联会议中级联会场的处理方法、装置及系统" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域

本发明涉及通信技术领域，尤其涉及级联会议中级联会场的处理方法、装置及系统。背景技术

一般的视频会议中，通常是一个多点控制单元（MCU, Multipoint Control Unit )下的普通会场间开会，即会议中的普通会场都是连接在同一个 MCU上的。但随着会议容量的增加或者是组网的越来越复杂，这就需要召开级联会议，即不仅每个 MCU下的会场入会，并且多个 MCU间通过级联会场把多个 MCU的会议连成一个会议，这样就达到了多个 MCU的会场一起开会的目的。例如某系统需要召开全国会议，其在北京、各省会、各地市、各县均有 MCU 及会场，这样就可以召开一个全国范围内的级联会议，分别在北京、各省会、各地市安排 MCU,各会场分别连接到所属的 MCU即可。由于参会会场众多，并且分散在不同的地方，通过级联会议各会场只需要连接最近的 MCU, 减少对网络的要求。

如下举具体实例对现有的一种级联会议中级联会场的处理方法进行描述，如图 1所示，在包含远程呈现会场的级联会议中， MCU1连接有三个会场，分别是远程呈现会场 Tl、 Τ3和普通会场 Τ2, 远程呈现会场 T1包括三个屏分别为 TIL, TIC, T1R, 远程呈现会场 Τ3包括三个屏分别为 T3L, T3C, T3R, MCU2连接有三个会场，分别是远程呈现会场 Τ4、 Τ6和普通会场 Τ5, 远程呈现会场 Τ4包括三个屏分别为 T4L, T4C, T4R, 远程呈现会场 Τ6包括三个屏分别为 T6L, T6C, T6R。

假设每个 MCU都支持保留声音最大 2方的音频数据，即 MCU从所连接的所有会场（包括普通会场，远程呈现会场和级联会场）中最多选择声音最大的两个会场的音频数据进行混音，如果连接的会场不到两个，则会选择连接的所有的会场的数据进行混音。

若 MCU1和 MCU2级联召开会议，级联音频通道为 T12, 假设级联视频通道为一条视频码流，为会场 T1 的中屏 T1C。会议混音处理为：在 MCU1 的处理中，假设级联通道为最大 2方混音，并且假设当时 MCU1上的声音最大的 2方为会场 T1和 T2, 则 MCU1输出到 MCU2的级联音频通道的混音码流为 T12=T1+T2。在 MCU2中 , 假设当时声音最大的 2方为级联会场 T12和 Τ5, 如果远程呈现会场 Τ4和 Τ6分别显示的图像为 T1C、 T5、 T6R和 T4L、 T1C、 T5, 则对于 Τ4和 Τ6会场听到声音的情况如下：

对会场 Τ4来说，其听到的声音为 T12+T5即 T1+T2+T5, 同时因为会场 Τ4为远程呈现会场，其三个屏幕显示的图像分别为 T1会场中屏即 T1C、 T5、 Τ6会场的右屏 T6R的图像。由于用户希望 Τ4会场看到的图像方位与听到的声音方位对应，即听到 T1的声音在左边，听到 Τ5的声音在中间，而听到 Τ6 的声音在右边，由于各会场本身的声音有一定的方位，并不一定与图像显示的方位一致，所以 MCU2就需要对 Τ4听到的声音进行处理，即对各会场的声音进行方位调整，调整至对应图像的方位后再进行混音输出给会场 Τ4,这样， Τ4听到的声音方位就能和图像的方位相对应。

对远程呈现会场 Τ6来说，也有和 Τ4同样的问题，也是需要对其听到的声音（T12+T5 )的方位进行调整，使其与看到图像的方位相对应。对会场 Τ4、 Τ5、 Τ6来说，由于这三个会场与 MCU2直接相连， MUC2可以直接对其音频数据进行处理，分别适应会场 Τ4和 Τ6的方位调整。

如现有技术的上述方案中， T12为级联会场，音频数据为上一级 MCU混音的结果，即为会场 T1和 Τ2的数据之和，由于 Τ4和 Τ6均显示会场 T1C的图像，但图像的位置不一样，如果按照各会场显示图像的位置对 T1的音频方位进行调整，由于 T1和 Τ2的数据无法分开，也就是同时调整了 Τ2的声音方位，由于两个会场看到 T1 的图像方位不一样，必然会导致 Τ4和 Τ6听到的 Τ2的方位不一样，不能实现级联会议中各会场的图像方位与声音方位——对应的效果。

从以上可以看出，级联会场的音频数据作为上一级 MCU混音的结果，其声音方位常与显示会场的图像位置不一致，由于作为混音的结果其数据无法分开，针对不同的显示屏幕对音频方位进行调整时不能单独的对和该显示屏幕对应的音频进行调整，而是将该混音的结果做统一的调整，即会将不应该调整的音频方位也做了调整，不能实现级联会议中各会场的图像方位和声音方位的——对应，降低了与会者的用户体验。发明内容

本发明实施例提供了一种级联会议中级联会场的处理方法、装置及系统，用于实现级联会议中各会场的图像方位和声音方位的——对应，提高与会者的用户体验。

本发明实施例提供的一种级联会议中级联会场的处理方法，包括：接收级联会场发送的音频码流，其中，级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的；接收非级联会场发送的音频码流；从待选择的音频数据中选择出满足预置条件的音频数据，其中，待选择的音频数据包括：接收到的级联会场发送的音频码流和非级联会场发送的音频码流；对满足预置条件的音频数据的方位顺序进行调整。

本发明实施例提供的另一种级联会议中级联会场的处理方法，包括：接收非级联会场发送的音频码流；从待选择的音频数据中选择出满足预置条件的音频数据，其中，待选择的音频数据至少包括接收到的非级联会场发送的音频码流；对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得第一级联会场能够识别出级联会场音频数据；将级联会场音频数据进行编码获得音频码流；向第一级联会场发送音频码流。

本发明实施例提供的一种级联会议中级联会场的处理装置，包括：接收单元，用于接收级联会场发送的音频码流，其中，级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的；还用于接收非级联会场发送的音频码流；选择单元，用于从待选择的音频数据中选择出满足预置条件的音频数据，其中，待选择的音频数据包括：接收到的级联会场发送的音频码流和非级联会场发送的音频码流；顺序调整单元，用于对满足预置条件的音频数据的方位顺序进行调整。

本发明实施例提供的另一种级联会议中级联会场的处理装置，包括：接收单元，用于接收非级联会场发送的音频码流；选择单元，用于从待选择的音频数据中选择出满足预置条件的音频数据，其中，待选择的音频数据至少包括接收到的非级联会场发送的音频码流；处理单元，用于对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得第一级联会场能够识别出级联会场音频数据；编码单元，用于将级联会场音频数据进行编码获得音频码流；发送单元，用于向第一级联会场发送音频码流。

本发明另外提供了一种级联会议系统。

从以上技术方案可以看出，本发明实施例具有以下优点：

从本发明实施例提供的以上技术方案可以看出，由于本发明实施例的级联会议中级联会场的处理装置接收到级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的，当级联会议中级联会场的处理装置需要对音频数据进行方位顺序上的调整时能够直接对需要调整的音频数据方位进行单独调整，即级联会议中级联会场的处理装置对单个音频数据方位的调整不会影响到其它音频数据，能够实现级联会议中各会场的图像方位和声音方位的一一对应，提高了与会者的用户体验。附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的技术人员来讲，还可以根据这些附图获得其他的附图。

图 1是现有技术中一个级联会议中级联会场的结构图；图；意图；意图；意图；

图 6是本发明实施例中一个级联会议中级联会场的结构图；

图 Ί是本发明实施例中另一个级联会议中级联会场的结构图；

图 8是本发明实施例中一个级联会议中级联会场的处理装置的示意图；图 9是本发明实施例中另一个级联会议中级联会场的处理装置的示意图；图 10是本发明实施例中另一个级联会议中级联会场的处理装置的示意图。具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域的技术人员所获得的所有其他实施例，都属于本发明保护的范围。图 2描述的本发明一个实施例提供的级联会议中级联会场的处理方法的流程。该实施例描述的是作为接收端的级联会议中级联会场的处理装置的处理流程，该级联会议中级联会场的处理装置与级联会场连接，还与非级联会场，如：普通会场和 /或远程呈现会场相连，本发明实施例包括如下步骤：

201、接收级联会场发送的音频码流。

具体可以接收与级联会议中级联会场的处理装置连接的级联会场发送的音频码流。在本发明实施例中，接收到的级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的，与现有技术中级联会场将音频码流进行混音然后发送是不同的。

在本发明实施例中可以只设置有一条音频级联通道，该音频级联通道包括两条以上的音频声道，则音频码流是以不同的会场占用不同的音频声道发送的，即在各个不同的音频声道中分别传输不同会场的音频码流。

在本发明实施例中也可以设置有两条以上的音频级联通道，则音频码流是以不同的会场占用不同的音频级联通道发送的，即在各个音频级联通道中分别传输不同会场的音频码流。当音频码流以不同的会场占用不同的音频级联通道发送时，本发明实施例还包括：接收级联会场发送的音频级联通道组成信息，其中，音频级联通道组成信息为级联会场建立的音频级联通道的数目信息，以便获取到接收到的级联会场发送的音频码流占用的音频级联通道的数目。

202、接收非级联会场发送的音频码流。

具体可以接收与级联会议中级联会场的处理装置连接的普通会场发送的音频码流，和 /或与级联会议中级联会场的处理装置连接的远程呈现会场各个屏幕分别对应的音频码流，在本发明实施例中，将远程呈现会场的各个屏幕分别对应的多个音频码流分别作为单个的音频码流输入，该多个音频码流之间是独立的，远程呈现会场对该多个音频码流的发送是独立的。

需要说明的是，在本发明实施例中步骤 201和步骤 202之间没有先后顺序的区别，可以先执行步骤 201后执行步骤 202, 也可以先执行步骤 202后执行步骤 201 , 也可以同时执行步骤 201和 202, 此处不作限定。

203、从待选择的音频数据中选择出满足预置条件的音频数据。

从待选择的音频数据中选择满足预置条件的音频数据，其中，每个会场的音频数据作为一个音频数据参加是否满足预置条件的选择，待选择的音频数据包括：接收到的级联会场发送的音频码流和非级联会场发送的音频码流。选择的音频数据的数量小于或等于预定数量，其中，预定数量是根据预置条件预先设定。在本发明实施例中预置的条件具体可以为保留级联会场和非级联会场中声音最大几方的音频数据，例如，当保留级联会场和非级联会场中声音最大 3 方的音频数据时，从所有的音频数据中选择出声音音量从大到小的前 3 个音频数据。根据保留声音最大几方的音频数据的原则，从音频数据中筛选出满足预置条件的音频数据，选择的音频数据的数量少于或等于预定数量。

在本发明实施例中预置的条件具体还可以为保留预置会场的音频数据，如可以预先设置特定的会场，具体可以为用户指定的一个或两个以上的会场，则在本发明实施例中满足预置条件为保留预置会场的音频数据，如待选择的音频数据包括普通会场 T1的音频数据，普通会场 T2的音频数据，远程呈现会场 T3的音频数据，远程呈现会场 T4的音频数据，则假设预置的条件为只保留用户指定的 T1会场的音频数据和 T2会场的音频数据，则经过该预置条件的筛选，可以保留下来 T1会场的音频数据和 T2会场的音频数据，而 T3 会场的音频数据和 T4会场的音频数据由于不是用户指定的会场的音频数据而不会被保留。

需要说明的是，在实际应用中，预置的条件还具体可以为满足其它的条件，只要是可以对不同的会场的音频数据可以进行筛选即可，此处不做限定。

在本发明实施例中，预定数量是预先设定的，具体根据级联会议中级联会场的处理装置选择的保留声音最大几方的音频数据确定，例如级联会议中级联会场的处理装置支持保留最大 2方音频数据，则预定数量为 2; 级联会议中级联会场的处理装置支持保留最大 3方音频数据，则预定数量为 3。例如在级联会议中级联会场的处理装置支持保留最大 3 方音频数据时，如果级联会议中级联会场的处理装置连接的会场（包括普通会场和远程呈现会场以及级联会场）的数量大于或等于 3个，则可以选择音量最大的 3个音频数据作为级联会场音频数据，如果在级联会议中级联会场的处理装置连接的会场少于 3 个时，则只能选择少于 3个的音频数据。

204、对满足预置条件的音频数据的方位顺序进行调整。

当选择出满足预置条件的音频数据后，级联会议中级联会场的处理装置对满足预置条件的音频数据的方位顺序进行调整，具体可以采用如下方式实现：

如果非级联会场的视频源只有一个屏被显示在多个屏中的一个屏中或者是在多画面中的一个位置的画面，则该非级联会场的视频源的所有屏对应的音频数据的输出方位顺序都为被显示的那个屏在多个屏中的显示方位顺序相同或者在多画面中的那个位置的画面所在的方位顺序，例如，一个远程呈现会场 T1 , 包括三个屏 TIL, TIC, T1R, 只被显示其中的一个屏 T1L, 则该远程呈现会场的三个屏 TIL, TIC, T1R对应的音频数据输出方位都和被显示的那个屏 T1L在多个屏中的显示方位顺序相同，或在多画面中的那个位置的画面所在的方位顺序相同。

如果非级联会场的视频源的多个屏中有两个以上的屏被显示，则视频源被显示的两个以上的屏对应的音频数据输出方位顺序和视频源被显示的这些屏的方位顺序——对应，视频源的多个屏中没有被显示的屏对应的音频数据输出方位顺序为和视频源被显示所有屏中的其中一个屏保持相同，例如，远程呈现会场 T1 , 包括三个屏 TIL, TIC, T1R, 只有屏 TIL, T1C被显示，而 T1R没有被显示，则被显示的 TIL, T1C对应的音频数据输出方位顺序和被显示的 TIL, T1C的方位顺序相同，没有被显示的 T1R对应的音频数据可以和被显示的所有屏 TIL, T1C中的其中一个屏的方位顺序相同。

如果非级联会场的视频源中的一个屏被同时显示在多个多画面中或者是一个多画面和独立屏中，则视频源对应的音频数据的输出方位顺序优先级从高到氏依次为：独立屏的方位、子画面大的屏的方位、以中、左、右优先级显示的屏的方位。例如，远程呈现会场 T1 , 包括三个屏 TIL, TIC, T1R, 有一个屏 T1L被显示在多个多画面中或者是一个多画面和独立屏中，那么该屏 T1L对应的音频数据输出方位的顺序优先级依次为：独立屏的方位、子画面大的屏的方位、以中、左、右优先级显示的屏的方位。

需要说明的是，上述实施例只是根据视频源的方位顺序对音频数据进行方位调整的其中一种方式，也可以采用其它的实现方式，只要输出的音频数据的方位顺序符合一定的顺序要求即可。如：如果非级联会场的音频数据满足了预置条件而被保留下来，但却没有看该会场的图象，即此会场为不可见会场，则调整策略可以是：保持会场本身的音频数据的方位顺序，或者，将音频数据的方位顺序设置在一个固定位置，如固定在中间的方位出声，或者是两边的方位，另外由于没看到其图象，也可以固定在屏幕外的某个地方。

在本发明实施例中，由于级联会议的级联会场的处理装置接收到级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的，当级联会议中级联会场的处理装置需要对音频数据进行方位顺序上的调整时能够直接对需要调整的音频数据进行单独调整，即级联会议中级联会场的处理装置对单个音频数据方位的调整不会影响到其它音频数据，能够实现级联会议中各会场的图像方位和声音方位的——对应，提高了与会者的用户体验。

需要说明的是，在图 2所示的实施例中，步骤 202之后还可以包括：对级联会场发送的音频码流和非级联会场发送的音频码流进行解码，则待选择的音频数据具体包括：对级联会场发送的音频码流和非级联会场发送的音频码流进行解码的结果。

上述实施例中描述的是级联会议中级联会场的处理装置接收到级联会场发送的音频码流以及非级联会场发送的音频码流后，对音频数据进行方位顺序的调整。下面对级联会议中级联会场的处理装置向第一级联会场发送音频码流的角度出发进行描述，请参阅如下实施例。图 3描述的本发明一个实施例提供的级联会议中级联会场的处理方法的流程，该实施例描述的是级联会议中级联会场的处理装置的处理流程，该级联会议中级联会场的处理装置与第一级联会场连接，还与非级联会场如：普通会场和 /或远程呈现会场相连，本发明实施例包括如下步骤：

301、接收非级联会场发送的音频码流。

具体可以接收与级联会议中级联会场的处理装置连接的普通会场发送的音频码流，和 /或与级联会议中级联会场的处理装置连接的远程呈现会场各个屏幕分别对应的音频码流，在本发明实施例中，将远程呈现会场的各个屏幕分别对应的多个音频码流分别作为单独的音频码流输入，该多个音频码流之间是独立的，远程呈现会场对该多个音频码流的发送是独立的。

302、从待选择的音频数据中选择满足预置条件的音频数据。

其中，待选择的音频数据至少包括非级联会场发送的音频码流，从待选择的音频数据中选择满足预置条件的音频数据，选择的音频数据的数量小于或等于预定数量，其中，预定数量是根据预置条件预先设定，关于预置条件的说明，可参照图 2中步骤 203的说明。

303、对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理。

当级联会议中级联会场的处理装置选择出满足预置条件的音频数据后，可以分别按照不同的会场占用不同的音频声道或音频级联通道进行处理，获得级联会场音频数据，使得第一级联会场能够识别出该级联会场音频数据。

需要说明的是，在本发明实施例中对音频数据的处理是以会场为单位，按照各个音频声道或音频级联通道分别进行的，可以保证对单个音频数据的处理不会影响到其它的音频数据，具体的处理方法将在后续实施例中说明。

304、将级联会场音频数据进行编码获得音频码流。

其中，将上述步骤中得到的级联会场音频数据进行编码，将编码的结果作为音频码流。

305、向第一级联会场发送音频码流。

在进行编码之后获得音频码流后，向第一级联会场发送该音频码流。需要说明的是，本发明实施例中第一级联会场是直接与级联会议中级联会场的处理装置连接的级联会场。

从本发明实施例中可以看出，由于本发明实施例的级联会议中级联会场的处理装置对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得作为接收端的第一级联会场当需要对音频数据进行方位顺序上的调整时能够直接对音频数据进行单独调整。

进一步地，本发明提供另一个级联会议中级联会场的处理方法的实施例，具体请参阅图 4, 该级联会议中级联会场的处理装置与第一级联会场，第二级联会场相连接，还与非级联会场相连，在本发明实施例中只设置有一条音频级联通道，该音频级联通道包括两条以上的音频声道，即在各个音频声道中分别传输音频码流。本发明实施例包括：

401、接收非级联会场发送的音频码流，以及第二级联会场发送的音频码流。

当级联会议中级联会场的处理装置连接有第二级联会场时，级联会议中级联会场的处理装置也接收第二级联会场发送的音频码流。需要说明的是，本发明实施例中第二级联会场是直接与级联会议中级联会场的处理装置连接的一个级联会场。

402、从待选择的音频数据中选择出满足预置条件的音频数据。

待选择的音频数据至少包括非级联会场发送的音频码流，本发明实施例中预置的条件具体可以为保留级联会场和非级联会场中声音最大几方的音频数据，根据保留声音最大几方的音频数据的原则从待选择的音频数据中筛选出音频数据，选择的音频数据的数量少于或等于预定数量。

在本发明实施例中，参加保留声音最大几方的音频数据比较的有级联会议中级联会场的处理装置连接的非级联会场发送的音频码流和第二级联会场发送的音频码流，其中，第二级联会场的音频码流是作为一个会场的音频码流参加比较的，在步骤 402 中，可以将第二级联会场的音频码流叠加起来作为一个音频码流参加比较，在实际应用中，还可以通过其他方式如将第二级联会场的音频码流的包络信息通过实时传送协议（RTP, Real-time Transport Protocol )填充信息的方式向级联会议中级联会场的处理装置发送，级联会议中级联会场的处理装置接收到该音频包络信息后，将该音频包络信息参加保留声音最大几方的音频数据的比较。 403、当满足预置条件的音频数据为远程呈现会场的屏幕对应的音频数据时，将远程呈现会场的屏幕对应的音频数据作为单独的会场对应的音频数据。

本发明实施例中，将满足预置条件的远程呈现会场的屏幕作为单独的会场通过单独的音频声道进行传输，级联会场也作为一个会场通过单独的音频声道进行传输。

404、或，当满足预置条件的音频数据为普通会场对应的音频数据且普通会场的声道数不是单声道时，将该普通会场的音频数据混音为单声道音频数据。

本发明实施例中，将满足预置条件，声道数不是单声道的普通会场的音频数据混音为单声道音频数据，通过一个音频声道进行传输。

405、根据需要发送的视频码流的方位顺序，对满足预置条件的音频数据按照不同的会场分别调整方位顺序。

其中，需要发送的视频码流为级联会议中级联会场的处理装置接收到的视频码流中的一部分或者全部，具体需要向第一级联会场发送哪些视频码流，可以由用户来选择决定，也可以由级联会议中级联会场的处理装置决定，此处不作限定。

在本步骤中，将调整过方位顺序的满足预置条件的音频数据作为级联会场音频数据。

在本发明实施例中，根据需要发送的视频码流的方位顺序，对满足预置条件的音频数据按照不同的会场分别调整方位顺序，以使得作为接收端的第一级联会场能够根据视频码流的方位顺序，识别出满足预置条件的音频数据的方位顺序。

在实际应用中，若满足预置条件的音频数据对应的视频源和需要发送的视频码流相同，将满足预置条件的音频数据的方位顺序调整为和需要发送的视频码流相同的方位顺序；若满足预置条件的音频数据对应的视频源和需要发送的视频码流不相同，将满足预置条件的音频数据的方位顺序按照图 2 中的步骤 204描述的策略调整。例如：需要发送的视频码流为 T2、 T1C、 T3R, 若满足预置条件的音频数据为 T3R、 T2、 TIL, 则由于音频数据 T2和视频码流 T2相同，将音频数据 Τ2调整至和视频码流相同的顺序即左边，音频数据 T1L和视频码流均不相同 , 但是视频码流中存在 T1C, 由于视频码流 T1C和音频码流 T1L同为一个会场 T1的两个码流，将音频数据 T1L的方位顺序调整为所显示的视频码流 T1C的方位顺序，即该音频数据 T1L调整为视频源 T1C 的方位顺序即中间，音频数据 T3R和视频码流 T3R相同，将音频数据 T3R调整至和视频码流 T3R 方位相同的右边，故调整过方位顺序后的音频数据为 T2、 TIL, T3R。

需要说明的是，本步骤 405也可以使用如下步骤进行替换：

将满足预置条件的音频数据按照不同的会场占用不同的音频声道进行排序，将排序过的满足预置条件的音频数据作为级联会场音频数据，其中，排序可以为按照声音最大几方的音频数据的顺序依次排列，但也可以是其它的顺序，此处不作限定。

然后，生成音频会场位置信息，其中，音频会场位置信息为满足预置条件的音频数据的位置排序信息。

最后，将生成的音频会场位置信息发送给第一级联会场，在具体实现时可以采用 RTP填充信息的填充数据方式向第一级联会场发送，同样可以采取其它实现方式，此处不作限定。

406、将级联会场音频数据进行编码获得音频码流。

其中，将上述步骤中得到的级联会场音频数据进行编码，即可以获取到音频码流。

407、向第一级联会场发送音频码流。

在进行编码之后获得了音频码流之后，向第一级联会场发送音频码流。需要说明的是，本发明实施例中第一级联会场是直接与级联会议中级联会场的处理装置连接的另一个级联会场。

在本发明实施例中的步骤 406中，根据需要发送的视频码流的方位顺序，对相应的级联会场音频数据也作了方位顺序上的调整，使得作为接收端的第一级联会场能够根据视频码流的方位顺序，识别出满足预置条件的音频数据的方位顺序，使得第一级联会场就可以对音频数据进行单独的调整。从本发明实施例中可以看出，由于本发明实施例的级联会议中级联会场的处理装置对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得作为接收端的第一级联会场当需要对音频数据进行方位顺序上的调整时能够直接对音频数据进行单独调整。

可选地，本发明提供另一个级联会议中级联会场的处理方法的实施例，具体请参阅图 5 , 该级联会议中级联会场的处理装置与第一级联会场，第二级联会场相连接，还与非级联会场相连，在本发明实施例中设置有两条以上的音频级联通道，这与现有技术中只有一条音频级联通道是不同的，即在各个音频级联通道中分别传输音频码流。本发明实施例包括：

501、接收非级联会场发送的音频码流，以及第二级联会场发送的音频码流。

本步骤中的内容和上一实施例中步骤 401 的内容相同，具体可参照该步骤，此处不作详细描述。

502、对非级联会场发送的音频码流和第二级联会场发送的音频码流进行解码。

获取到非级联会场发送的音频码流和第二级联会场发送的第二音频码流后，可以对该音频码流进行解码，需要说明的是，对音频码流进行解码时可选的一种实现形式。

503、从待选择的音频数据中选择出满足预置条件的音频数据；待选择的音频数据具体包括：对非级联会场发送的音频码流和第二级联会场发送的音频码流进行解码的结果，本发明实施例中可以选择根据保留声音最大几方的音频数据的原则从待选择的音频数据中选择音频数据，选择的音频数据的数量少于或等于预定数量。

504、将满足预置条件的音频数据按照不同的会场占用不同的音频级联通道进行处理得到级联会场音频数据；

在本步骤中，将满足预置条件的音频数据按照不同的会场占用不同的音频级联通道进行处理，即在一个音频级联通道中只用来传输一个会场的音频数据，将满足预置条件的音频数据作为级联会场音频数据。本发明实施例中，将满足预置条件的会场作为单独的会场通过音频级联通道进行传输音频数据，级联会议中级联会场设置有多条的音频级联通道，那么本发明实施例中可以按照各个音频级联通道对各个会场的音频数据进行处理，每条音频级联通道的声道数可以为单声道、双声道、三声道或者是更多的声道数，此处不作限定。

505、生成音频级联通道组成信息，其中，音频级联通道组成信息为级联会场建立的音频级联通道的数目信息，以便获取到接收到的级联会场发送的音频码流占用的音频级联通道的数目。

506、将级联会场音频数据进行编码获得音频码流。

其中，将上述步骤中满足预置条件的音频数据进行编码，作为音频码流。

507、向第一级联会场发送音频码流，并向第一级联会场发送音频级联通道组成信息。

在进行编码之后获得需要发送的音频码流后，向第一级联会场发送。由于本发明实施例中级联会议中级联会场的处理装置设置有多条音频级联通道，而音频级联通道的满足预置条件的却总是会时刻变化，在本发明实施例中还需要向第一级联会场发送音频级联通道组成信息。

从本发明实施例中可以看出，由于本发明实施例的级联会议中级联会场的处理装置选择出满足预置条件的音频数据是按照不同的音频级联通道分别发送，使得作为接收端的级联会议中级联会场的处理装置当需要对音频数据进行方位顺序上的调整时能够直接对音频数据进行单独调整。

如下举具体实例对本发明实施例进行描述，如图 6,描述了本发明一个实施例提供的一个级联会议中级联会场的结构，以设置有一个音频级联通道，该音频级联通道包括两个以上的音频声道为例，请参阅图 6所示：

级联会场有 2个 MCU, 分别是 MCU1和 MCU2, 其中， MCU1与 MCU2 连接。

其中， MCU1连接有 1个普通会场和 2个远程呈现会场，如图 6所示，为没有对音频码流顺序进行调整之前的示意图，在图 6 中， 1 个普通会场为 T2, 2个远程呈现会场分别是 T1和 Τ3 , 远程呈现会场 T1和 Τ3分别有三个屏幕，分别为 T1L、 T1C、 T1R和 T3L、 T3C、 T3R, 同时 MCU2作为 MCU1 的级联会场也与 MCU1连接， MCU2连接有 2个普通会场和 1个远程呈现会场，如图 6所示， 2个普通会场分别是 T5和 T6, 1个远程呈现会场为 T4, 包含三个屏幕，分别为 T4L、 T4C、 T4R。每个 MCU都是支持保留最大 3方音频会场，即 MCU从所连接的所有会场（包括普通会场、远程呈现会场和级联会场）中选择声音最大的 3个会场的音频数据进行编码。

MCU1可以接收到 T1L、 T1C、 T1R、 T2和 T3L、 T3C、 T3R发送的音频码流， MCU2可以接收到 T4L、 T4C、 T4R、 T5和 Τ6发送的音频码流以及 MCU1发送的级联会场音频码流和级联会场视频码流，如图 6所示，本发明实施例中， MCU1向 MCU2发送的级联会场视频码流为 T2、 T1C、 T3R, 本实施例不描述 MCU1向 T1L、 T1C、 T1R、 T2和 T3L、 T3C、 T3R发送级联会场媒体数据的过程，只描述 MCU1向 MCU2发送级联会场音频码流的过程。

对于 MCU1分别对音频码流进行解码获得 T1L、 T1C、 T1R、 T2和 T3L、 T3C、 T3R对应的会场音频数据，将 T1L、 T1C、 T1R、 T2和 T3L、 T3C、 T3R对应的会场音频数据作为待选择的音频数据，根据保留声音最大 3方的音频数据的原则从待选择的音频数据中筛选出音频数据，假设根据保留声音最大的 3方的音频数据筛选出的音频数据为 T1C、 T2、 T3R, 则接收到的级联会场视频码流和陣选出的音频数据的音频源完全相同，即级联会场视频码流 T2、 T1C、 T3R和筛选出的音频数据 T1C、 T2、 T3R完全相同，则可以按照级联会场视频码流的顺序对陣选出的音频数据的方位顺序进行相对应的调整，则调整后，筛选出的音频数据的方位顺序和级联会场视频码流的方位顺序相同，从而将调整过顺序的音频数据作为级联会场音频数据并进行编码，获得 MCU1的音频码流 TIC, Τ2, T3R, 则 MCU2能够识别出该音频码流。

若根据保留声音最大 3方的音频数据筛选出的音频数据不是 T1C、 T2、 T3R, 即筛选出的音频数据的来源和级联会场视频码流的来源不同，则定义筛选出的音频数据所在的会场是不可见会场，则可以将不可见会场对应的音频数据按照图 2中的步骤 204描述的策略调整。下面从 MCU 2作为接收端的角度进行描述，首先接收 MCU 1发送的音频码流，接收与 MCU 2相连接的非级联会场 T4 , T5 , T6发送的音频码流，然后从待选择的音频数据中选择出满足预置条件的音频数据，选择音频数据的过程和 MCU1 中的处理过程相同，此处不再贅述。最后，对选择出的音频数据可以进行方位顺序上的调整，具体的调整策略已经在图 2 的实施例中作了说明，此处不再贅述。本发明实施例中，对单个音频数据方位的调整不会影响到其它音频数据，能够实现级联会议中各会场的图像方位和声音方位的一一对应，提高了与会者的用户体验。

如下举另一具体实例对本发明实施例进行描述，如图 7 , 描述了本发明另一个实施例提供的一个级联会议中级联会场的结构，本发明实施例中设置有两条以上的音频级联通道，即在各个音频级联通道中分别传输音频码流，请参阅图 Ί所示：

级联会场有 2个 MCU, 分别是 MCU1和 MCU2, 其中， MCU1与 MCU2 连接， MUC1和 MUC2之间连接有四条音频级联通道，四条视频级联通道。其中， MCU1连接有两个普通会场和两个远程呈现会场，如图 Ί所示，两个普通会场为 T2和 T7 , 两个远程呈现会场分别是 T1和 T3 , 同时 MCU2作为 MCU1的级联会场也与 MCU1连接， MCU2连接有两个普通会场和一个远程呈现会场，如图 7所示， 2个普通会场分别是 T5和 T6。 MCU1与 MCU2间的级联视频源为 T2、 T1C、 T3R、 T7。每个 MCU都是支持保留最大 4方音频会场，即 MCU从所连接的所有会场（包括普通会场、远程呈现会场和级联会场）中选择声音最大的 4个会场的音频数据。

在本发明实施例中 , MCU1和 MCU2的音频级联通道为多条，具体可以根据级联会议的要求而定，同时，音频级联通道同样按照保留声音最大几方的音频数据的原则对音频数据进行筛选，在本发明实施例中音频级联通道为 4 条，每条音频级联通道的声道数可以为单声道、双声道、三声道或者是更多的声道数，此处不作限定。由于音频级联通道为多条，本发明实施例中可以将远程呈现会场的音频数据作为一个会场的音频数据，但是音频级联通道的声道数可以设为双声道或三声道，以保证一个音频级联通道能够加载一个远程呈现会场的全部音频。

MCU1可以接收到 Tl、 Τ2、 Τ3和 Τ7发送的音频码流， MCU2可以接收到 Τ4、 Τ5和 Τ6发送的音频码流以及 MCU1发送的级联会场音频码流和级联会场视频码流，如图 7所示，本发明实施例中， MCU1向 MCU2发送的级联会场视频码流为 T2、 T1C、 T3R、 T7, 本实施例不描述 MCU1向 Tl、 T2、 Τ3 和 Τ7发送级联会场媒体数据的过程，只描述 MCU1向 MCU2发送级联会场音频码流的过程。

MCU1分别对音频码流进行解码获得 Tl、 Τ2、 Τ3和 Τ7对应的会场音频数据，将 Tl、 Τ2、 Τ3和 Τ7对应的会场音频数据作为待选择的音频数据，根据保留最大 4方会场的音频数据的原则从待选择的音频数据中筛选出音频数据为 Tl、 Τ2、 Τ3和 Τ7, 作为级联会场音频数据。然后，分别将该四路音频数据加载到相应的音频级联通道，若筛选出的音频数据为远方呈现会场的音频数据，则相应的加载到多声道的音频级联通道。

获得级联会场音频数据之后，对级联会场音频数据进行编码获得级联会场音频码流，然后，向级联会场 MCU 2发送级联会场音频码流，并向级联会场 MCU 2发送级联会场视频码流。

由于级联通道的音频最大方是时时变化的，所以需要在级联音频通道的码流中同时也向 MCU 2发送音频级联通道组成信息，其中，音频级联通道组成信息为级联会场建立的音频级联通道的数目信息，以便获取到接收到的音频码流占用的音频级联通道的数目，具体可以通过 RTP填充信息的形式发送，但不仅限该方式，此处不作限定。

MCU2收到级联音频通道的最大方会场的数据后，加上和 MCU2直接相连的会场音频数据， MCU2实际上相当于收到了 Τ7、 Τ1、 Τ2、 Τ3、 Τ4、 Τ5、 Τ6各个会场的独立数据，根据本 MCU上会场所需要显示的视频码流的情况对对应会场的音频码流的方位进行调整处理，使每个会场视频码流的方位顺序与对应的音频码流的方位顺序——对应。全相同时，则按照如图 2所示的本发明实施例中的处理方式，此处不再贅述。述，下面对级联会议中级联会场的处理装置进行描述，本发明实施例提供的级联会议中级联会场的处理装置可以作为 MCU使用。

请参阅图 8,本发明实施例的级联会议中级联会场的处理装置的一个例子包括：

接收单元 801 , 用于接收级联会场发送的音频码流，级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的；还用于接收非级联会场发送的音频码流；

选择单元 802,用于从待选择的音频数据中选择出满足预置条件的音频数据，待选择的音频数据包括：级联会场发送的音频码流和非级联会场发送的音频码流；

顺序调整单元 803 ,用于对选择单元 803选择出的音频数据的方位顺序进行调整。

在本发明实施例中，由于级联会议中级联会场的处理装置接收到级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的，当级联会议中级联会场的处理装置需要对音频数据进行方位顺序上的调整时能够直接对需要调整的音频数据方位进行单独调整，即级联会议中级联会场的处理装置对单个音频数据方位的调整不会影响到其它音频数据，能够实现级联会议中各会场的图像方位和声音方位的——对应，提高了与会者的用户体验。

需要说明的是，在本发明图 8所示的实施例中，当级联会场发送的音频码流以不同的会场占用不同的音频级联通道发送时，接收单元 801 , 还用于接收级联会场发送的音频级联通道组成信息，其中，音频级联通道组成信息为级联会场建立的音频级联通道的数目信息，以便获取到接收到的音频码流占用的音频级联通道的数目。

级联会议中级联会场的处理装置还可以包括：解码单元，用于对级联会场发送的音频码流和非级联会场发送的音频码流进行解码。

上述实施例中描述的是级联会议中级联会场的处理装置从接收级联会场的音频码流，对满足预置条件的音频数据进行方位顺序的调整。下面对级联会议中级联会场的处理装置从向级联会场发送音频码流的角度出发进行描述，请参阅图 9:

接收单元 901 , 用于接收非级联会场发送的音频码流，还用于接收第二级联会场发送的音频码流；

解码单元 902, 用于对接收单元 901接收到的音频码流进行解码；选择单元 903 ,用于从待选择的音频数据中选择出满足预置条件的音频数据，待选择的音频数据具体包括解码单元 902解码的结果；

处理单元 904,用于对选择单元 903选择出的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得第一级联会场能够识别出级联会场音频数据；

编码单元 905 , 用于将处理单元 904的处理结果进行编码获得音频码流；发送单元 906, 用于向第一级联会场发送音频码流。

进一步地，请参阅图 10, 在本发明实施例中只设置有一条音频级联通道，该音频级联通道包括两条以上的音频声道，即在各个音频声道中分别传输音频码流。本发明实施例的级联会议中级联会场的处理装置的另一个例子包括：接收单元 1001 , 用于接收非级联会场发送的音频码流；还用于接收第二级联会场发送的音频码流；

解码单元 1002, 用于对接收单元 1001接收到的音频码流进行解码；选择单元 1003 , 用于从待选择的音频数据中选择出满足预置条件的音频数据，待选择的音频数据具体包括解码单元 1002解码的结果；

处理单元 1004, 包括：会场识别模块 10041 , 用于若满足预置条件的音频数据为远程呈现会场的屏幕对应的音频数据，将远程呈现会场的屏幕对应的音频数据作为单独的会场对应的音频数据；混音模块 10042, 用于若满足预置条件的音频数据为普通会场对应的音频数据且普通会场的声道数不是单声道，将普通会场的音频数据混音为单声道音频数据；关联模块 1043 , 用于根据需要发送的视频码流的方位顺序，对满足预置条件的音频数据按照不同的会场占用不同的音频声道分别调整方位顺序，将调整过方位顺序的满足预置条件的音频数据作为级联会场音频数据；

编码单元 1005 ,用于将处理单元 1004获取到的级联会场音频数据进行编码获得音频码流；

发送单元 1006, 用于向第一级联会场发送音频码流。

需要说明的是，本发明实施例中，处理单元 1004包括会场识别模块 10041 和混音模块 10042时也可以不包括关联模块 10043而包括如下模块：排序模块，用于将满足预置条件的音频数据按照不同的会场占用不同的音频声道进行排序，将排序过的满足预置条件的音频数据作为级联会场音频数据；生成模块，用于生成音频会场位置信息，音频会场位置信息为满足预置条件的音装置中发送单元 1006, 还用于向第一级联会场发送音频会场位置信息。

在本发明实施例中也可以设置有两条以上的音频级联通道，即在各个音频级联通道中分别传输音频码流，级联会议中级联会场的处理装置此时包括如下单元：生成单元，用于生成音频级联通道组成信息，其中，音频级联通道组成信息为级联会场建立的音频级联通道的数目信息，以便获取到接收到的级联会场发送的音频码流占用的音频级联通道的数目；同时本发明实施例中的级联会议中级联会场的处理装置中发送单元 1006, 还用于向第一级联会场发送音频级联通道组成信息。

从本发明实施例中可以看出，由于级联会议中级联会场的处理装置对满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得作为接收端的第一级联会场当需要对音频数据进行方位顺序上的调整时能够直接对音频数据进行单独调整。

本发明实施例还提供了一种级联会议系统，包括：如图 8所示的级联会议中级联会场的处理装置；

和,

如图 9或图 10所示的级联会议中级联会场的处理装置。

从本发明实施例可以看出，由于级联会议系统接收到的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的，当级联会议系统需要对音频数据进行方位顺序上的调整时能够直接对需要调整的音频数据进行单独调整，即级联会议系统对单个音频数据方位的调整不会影响到其它音频数据，能够实现级联会议中各会场的图像方位和声音方位的——对应，提高了与会者的用户体验。

上述装置和系统内的各模块之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述„

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。行了详细介绍，对于本领域的一般技术人员，依据本发明实施例的思想在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

+

Claims

权利要求书

1、一种级联会议中级联会场的处理方法，其特征在于，包括：

接收级联会场发送的音频码流，所述级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的；

接收非级联会场发送的音频码流；

从待选择的音频数据中选择出满足预置条件的音频数据，所述待选择的音频数据包括：所述接收到的级联会场发送的音频码流和非级联会场发送的音频码流；

对所述满足预置条件的音频数据的方位顺序进行调整。

2、根据权利要求 1所述的级联会议中级联会场的处理方法，其特征在于，所述非级联会场包括：普通会场和 /或远程呈现会场。

3、根据权利要求 1所述的级联会议中级联会场的处理方法，其特征在于，当所述级联会场发送的音频码流以不同的会场占用不同的音频级联通道发送时，所述方法还包括：接收所述级联会场发送的音频级联通道组成信息，所述音频级联通道组成信息为所述级联会场建立的音频级联通道的数目信息，以便获取到所述接收到的级联会场发送的音频码流占用的音频级联通道的数目。

4、根据权利要求 1所述的级联会议中级联会场的处理方法，其特征在于，所述对所述满足预置条件的音频数据的方位顺序进行调整包括：

如果非级联会场的视频源只有一个屏被显示在多个屏中的一个屏中或者是在多画面中的一个位置的画面，则所述视频源的所有屏对应的音频数据的输出方位顺序都为被显示的那个屏在多个屏中的显示方位顺序或者在多画面中的那个位置的画面所在的方位顺序；

如果非级联会场的视频源的多个屏中有两个以上的屏被显示，则所述视频源被显示的两个以上的屏对应的音频数据输出方位顺序和所述视频源被显示的两个以上的屏的方位顺序——对应，所述视频源的多个屏中没有被显示的屏对应的音频数据输出方位顺序为和所述视频源被显示所有屏中的其中一个屏保持相同；

如果非级联会场的视频源的一个屏被同时显示在多个多画面中或者是一个多画面和独立屏中，则所述视频源对应的音频数据的输出方位顺序优先级从高到氐依次为：独立屏的方位、子画面大的屏的方位、以中、左、右优先级显示的屏的方位。

5、根据权利要求 1所述的级联会议中级联会场的处理方法，其特征在于，所述预置条件为保留级联会场和非级联会场中声音最大几方的音频数据。

6、根据权利要求 1所述的级联会议中级联会场的处理方法，其特征在于，所述接收非级联会场发送的音频码流之后包括：

对所述接收到的级联会场发送的音频码流和非级联会场发送的音频码流进行解码；

所述待选择的音频数据具体包括：对所述接收到的级联会场发送的音频码流和非级联会场发送的音频码流进行解码的结果。

7、一种级联会议中级联会场的处理方法，其特征在于，包括：

接收非级联会场发送的音频码流；

从待选择的音频数据中选择出满足预置条件的音频数据，所述待选择的音频数据至少包括所述接收到的非级联会场发送的音频码流；

对所述满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得第一级联会场能够识别出所述级联会场音频数据；

将所述级联会场音频数据进行编码获得音频码流；

向第一级联会场发送所述音频码流。

8、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述非级联会场包括：普通会场和 /或远程呈现会场。

9、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述对所述满足预置条件的音频数据以不同的会场占用不同的音频声道进行处理获得级联会场音频数据包括：

若所述满足预置条件的音频数据为远程呈现会场的屏幕对应的音频数据，将所述远程呈现会场的屏幕对应的音频数据作为单独的会场对应的音频数据；若所述满足预置条件的音频数据为普通会场对应的音频数据且所述普通会场的声道数不是单声道，将所述普通会场的音频数据混音为单声道音频数据；根据需要发送的视频码流的方位顺序，对所述满足预置条件的音频数据按照不同的会场占用不同的音频声道分别调整方位顺序，将调整过方位顺序的满足预置条件的音频数据作为级联会场音频数据。

10、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述对所述满足预置条件的音频数据以不同的会场占用不同的音频声道进行处理得到级联会场音频数据包括：

若所述满足预置条件的音频数据为远程呈现会场的屏幕对应的音频数据，将所述远程呈现会场的屏幕对应的音频数据作为单独的会场对应的音频数据；若所述满足预置条件的音频数据为普通会场对应的音频数据且所述普通会场的声道数不是单声道，将所述普通会场的音频数据混音为单声道音频数据；将所述满足预置条件的音频数据按照不同的会场分别占用不同的音频声道进行排序，将排序过的满足预置条件的音频数据作为级联会场音频数据；

生成音频会场位置信息，所述音频会场位置信息为所述满足预置条件的音频数据的位置排序信息；

所述对所述满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据之后包括：向所述第一级联会场发送所述音频会场位置信息。

11、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述对所述满足预置条件的音频数据以不同的会场占用不同的音频级联通道进行处理得到级联会场音频数据之后包括：

生成音频级联通道组成信息，所述音频级联通道组成信息为所述级联会场建立的音频级联通道的数目信息，以便获取到所述接收到的级联会场发送的音频码流占用的音频级联通道的数目；

所述对所述满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据之后包括：向所述第一级联会场发送音频级联通道组成信息。

12、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述预置条件为保留级联会场和非级联会场中声音最大几方的音频数据。

13、根据权利要求 7所述的级联会议中级联会场的处理方法，其特征在于，所述方法还包括：

接收第二级联会场发送的音频码流；

所述待选择的音频数据还包括所述第二级联会场发送的音频码流。

14、根据权利要求 13所述的级联会议中级联会场的处理方法，其特征在于，所述接收非级联会场发送的音频码流之后包括：

对非级联会场发送的音频码流和第二级联会场发送的音频码流进行解码；所述待选择的音频数据具体包括：对非级联会场发送的音频码流和第二级联会场发送的音频码流进行解码的结果。

15、一种级联会议中级联会场的处理装置，其特征在于，包括：

接收单元，用于接收级联会场发送的音频码流，所述级联会场发送的音频码流是以不同的会场占用不同的音频声道或音频级联通道发送的；

所述接收单元，还用于接收非级联会场发送的音频码流；

选择单元，用于从待选择的音频数据中选择出满足预置条件的音频数据，所述待选择的音频数据包括：所述接收到的级联会场发送的音频码流和非级联会场发送的音频码流；

顺序调整单元，用于对所述满足预置条件的音频数据的方位顺序进行调整。

16、根据权利要求 15所述的级联会议中级联会场的处理装置，其特征在于，当所述级联会场发送的音频码流以不同的会场占用不同的音频级联通道发送时，

所述接收单元，还用于接收所述级联会场发送的音频级联通道组成信息，所述音频级联通道组成信息为所述级联会场建立的音频级联通道的数目信息，以便获取到所述接收到的音频码流占用的音频级联通道数目。

17、根据权利要求 15所述的级联会议中级联会场的处理装置，其特征在于，所述装置还包括：

解码单元，用于对级联会场发送的音频码流和非级联会场发送的音频码流进行解码。

18、一种级联会议中级联会场的处理装置，其特征在于，包括：接收单元，用于接收非级联会场发送的音频码流；

选择单元，用于从待选择的音频数据中选择出满足预置条件的音频数据，所述待选择的音频数据至少包括非级联会场发送的音频码流；

处理单元，用于对所述满足预置条件的音频数据以不同的会场占用不同的音频声道或音频级联通道进行处理得到级联会场音频数据，使得第一级联会场能够识别出所述级联会场音频数据；

编码单元，用于将所述级联会场音频数据进行编码获得音频码流；发送单元，用于向第一级联会场发送所述音频码流。

19、根据权利要求 18所述的级联会议中级联会场的处理装置，其特征在于，当对所述满足预置条件的音频数据以不同的会场占用不同的音频声道进行处理获得级联会场音频数据时，所述处理单元包括：

会场识别模块，用于若所述满足预置条件的音频数据为远程呈现会场的屏幕对应的音频数据，将所述远程呈现会场的屏幕对应的音频数据作为单独的会场对应的音频数据；

混音模块，用于若所述满足预置条件的音频数据为普通会场对应的音频数据且所述普通会场的声道数不是单声道，将所述普通会场的音频数据混音为单声道音频数据；

关联模块，用于根据所述需要发送的视频码流的方位顺序，对所述满足预置条件的音频数据按照不同的会场占用不同的音频声道分别调整方位顺序，将调整过方位顺序的满足预置条件的音频数据作为级联会场音频数据。

20、根据权利要求 18所述的级联会议中级联会场的处理装置，其特征在于，当对所述满足预置条件的音频数据以不同的会场占用不同的音频声道进行处理得到级联会场音频数据时，所述处理单元包括：

排序模块，用于将所述满足预置条件的音频数据按照不同的会场占用不同的音频声道进行排序，将排序过的满足预置条件的音频数据作为级联会场音频数据；

生成模块，用于生成音频会场位置信息，所述音频会场位置信息为所述满足预置条件的音频数据的位置排序信息；

所述发送单元，还用于向所述第一级联会场发送所述音频会场位置信息。

21、根据权利要求 18所述的级联会议中级联会场的处理装置，其特征在于，当对所述满足预置条件的音频数据以不同的会场占用不同的音频级联通道进行处理得到级联会场音频数据时，所述装置还包括：

生成单元，用于生成音频级联通道组成信息，所述音频级联通道组成信息为所述级联会场建立的音频级联通道的数目信息，以便获取到所述接收到的级联会场发送的音频码流占用的音频级联通道的数目；

所述发送单元，还用于向所述第一级联会场发送音频级联通道组成信息。

22、根据权利要求 18所述的级联会议中级联会场的处理装置，其特征在于，所述接收单元，还用于接收第二级联会场发送的音频码流。

23、根据权利要求 22所述的级联会议中级联会场的处理装置，其特征在于，所述装置还包括：解码单元，用于对非级联会场发送的音频码流和第二级联会场发送的音频码流进行解码。

24、一种级联会议系统，其特征在于，包括：

如权利要求 15或 17所述的级联会议中级联会场的处理装置；

和,

如权利要求 18至 23中任一所述的级联会议中级联会场的处理装置。