WO2014172907A1

WO2014172907A1 - 视频会议处理方法及设备

Info

Publication number: WO2014172907A1
Application number: PCT/CN2013/074860
Authority: WO
Inventors: 董建明; 葛鹏; 汤畅; 孙喆
Original assignee: 华为技术有限公司
Priority date: 2013-04-27
Filing date: 2013-04-27
Publication date: 2014-10-30
Also published as: EP2816801B1; EP2816801A4; US20140327727A1; CN104380720B; CN104380720A; EP2816801A1; US9392191B2

Abstract

本发明实施例提供一种视频会议处理方法及设备，该视频会议处理方法，包括：视频会议服务器接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息；视频会议服务器从接收到的第二视频信息、及第一视频信息中共获得预设数量的个人视频信息，并将预设数量的个人视频信息合成以生成合成视频；视频会议服务器将合成视频发送给第三视频终端进行显示。本发明实施例提供的视频会议处理方法及设备，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，为最大效率的信息显示提供了灵活性。

Description

视频会议处理方法及设备技术领域本发明实施例涉及通信技术，尤其涉及一种视频会议处理方法及设备。背景技术

随着网络技术的飞速发展，视频会议已经成为当前发展最快的多媒体通信方式。传统的商务、行政会议已经向视频会议转换。视频会议系统将两个或两个以上不同地方的个人或群体，通过现有的各种电气通讯传输媒体，将人物的静、动态图像、语音、文字、图片等多种资料分送到各个用户的计算机上，使得在地理上分散的用户可以共聚一处，通过图像、声音等多种方式交流信息，在效果上可以代替现场举行的会议。

现有技术中，通常在每个会场设置摄像头和显示装置，摄像头可以釆集本地会场的图像，显示装置同时显示本地会场的图像和其他会场的图像。由于显示的图像均以会场为单位，每个会场图像的显示空间有限，但是每个会场的参会人员的数量又不确定，艮难保证对于观看者而言，清楚地看到发言者或者想要看到的参会人员。而且，当会场的数量比较多时，在同一显示装置上显示所有会场的图像，效果也不佳。发明内容

本发明实施例提供一种视频会议处理方法及设备，以避免以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，为最大效率的信息显示提供灵活性。

第一方面，本发明实施例提供一种视频会议处理方法，包括：

视频会议服务器接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二所述视频会议服务器从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；

所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示。

在第一种可能的实现方式中，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述视频会议服务器将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第二种可能的实现方式中，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或第三视频终端发送的第二与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息；

结合第一方面的第二种实现方式，在第三种可能的实现方式中，所述第二与会者替换指令中还携带有位置信息，所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息包括：

所述视频会议服务器根据所述第二与会者替换指令将所述合成视频中所包含的与所述第二与会者替换指令中所包含位置信息对应的个人视频信息作为所述的目标个人视频信息。

在第四种可能的实现方式中，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述视频会议服务器将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第五种可能的实现方式中，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；息中删除所述第五与会者标识指示的个人视频信息；

所述视频会议服务器将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

结合第一方面或第一方面的第一至第五任一种可能的实现方式，在第六种可能的实现方式中，所述视频会议服务器将所述预设数量的所述个人视频信息合成以生成合成视频包括：

所述视频会议服务器对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

结合第一方面或第一方面的第一至第五任一种可能的实现方式，在第七种可能的实现方式中，所述视频会议服务器将所述预设数量的所述个人视频信息合成以生成合成视频包括：

所述视频会议服务器将从所述预设数量的所述个人视频信息提取出的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

第二方面，本发明实施例提供一种视频会议处理方法，包括：

第三视频终端接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

所述第三视频终端将所述合成视频进行显示。

在第一种可能的实现方式中，所述方法还包括：

所述第三视频终端接收至少一个视频釆集装置发送的视频信息，将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频信息包括所述第三视频终端所在的会场中每个与会者的个人视频信息；

所述第三视频终端将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在第二种可能的实现方式中，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

所述第三视频终端根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述第三视频终端向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述第三视频终端接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并显示。

在第三种可能的实现方式中，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

所述第三视频终端当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；

所述第三视频终端生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

所述第三视频终端向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

在第四种可能的实现方式中，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

所述第三视频终端根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述第三视频终端向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述第三视频终端接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并显示。

在第五种可能的实现方式中，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

所述第三视频终端根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

所述第三视频终端向所述视频会议服务器发送所述删除指令用以使所述所述第五与会者标识指示的个人视频信息；

所述第三视频终端接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并显示。

第三方面，本发明实施例提供一种视频会议服务器，包括：

接收单元，用于接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二处理单元，与所述接收单元相连，用于从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；

发送单元，与所述处理单元相连，用于将所述合成视频发送给所述第三视频终端进行显示。

在第一种可能的实现方式中，所述接收单元还用于接收所述第一视频终端、所述第二视频终端、所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理单元还用于根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述发送单元还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第二种可能的实现方式中，所述接收单元还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理单元还用于根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息；

结合第三方面的第二种实现方式，在第三种可能的实现方式中，所述第二与会者替换指令中还携带有位置信息；

所述处理单元还用于根据所述第二与会者替换指令将所述合成视频中所包含的与所述第二与会者替换指令中所包含位置信息对应的个人视频信息作为所述的目标个人视频信息。

在第四种可能的实现方式中，所述接收单元还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理单元还用于根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述发送单元还用于将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第五种可能的实现方式中，所述接收单元还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

所述处理单元还用于根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；

所述发送单元还用于将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

结合第三方面或第三方面的第一至第五任一种可能的实现方式，在第六种可能的实现方式中，所述处理单元还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

结合第三方面或第三方面的第一至第五任一种可能的实现方式，在第七种可能的实现方式中，所述处理单元还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

第四方面，本发明实施例提供一种第三视频终端，包括：

接收单元，用于接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

显示单元，与所述接收单元相连，用于将所述合成视频进行显示。

在第一种可能的实现方式中，所述接收单元还用于接收至少一个视频釆集装置发送的视频信息；

所述第三视频终端还包括：第一处理单元，与所述接收单元相连，将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频第一发送单元，与所述处理单元相连，用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在第二种可能的实现方式中，所述的第三视频终端，还包括：

第二处理单元，用于根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

第二发送单元，与所述第二处理单元相连，用于向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述接收单元还用于接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并通过所述显示单元显示。

在第三种可能的实现方式中，所述第三视频终端，还包括：

第三处理单元，用于当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

第三发送单元，与所述第三处理单元相连，用于向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

在第四种可能的实现方式中，所述第三视频终端，还包括：

第四处理单元，用于根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

第四发送单元，与所述第四处理单元相连，用于向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述接收单元还用于接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并通过所述显示单元显示。

在第五种可能的实现方式中，所述第三视频终端，还包括：

第五处理单元，用于根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

第五发送单元，与所述第五处理单元相连，用于向所述视频会议服务器发送所述删除指令用以使所述视频服务器根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；所述接收单元还用于接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并通过所述显示单元显示。

第五方面，本发明实施例提供一种视频会议服务器，包括：处理器，通信接口，存储器和总线；

其中所述处理器、所述通信接口和所述存储器通过所述总线互联；所述通信接口，用于接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述所述存储器，用于存储指令或数据；

所述处理器调用存储在所述存储器中的指令以实现从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；

所述通信接口还用于将所述合成视频发送给所述第三视频终端进行显示。

在第一种可能的实现方式中，所述通信接口还用于接收所述第一视频终端、所述第二视频终端、所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理器还用于调用所述存储器的指令和数据以实现，根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述通信接口还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第二种可能的实现方式中，所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理器还用于调用所述存储器的指令和数据以实现，根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息；

结合第五方面的第二种实现方式，在第三种可能的实现方式中，所述第二与会者替换指令中还携带有位置信息；

所述处理器还用于调用所述存储器的指令和数据以实现，根据所述第二包含位置信息对应的个人视频信息作为所述的目标个人视频信息。

在第四种可能的实现方式中，所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述处理器还用于调用所述存储器的指令和数据以实现，根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述通信接口还用于将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在第五种可能的实现方式中，所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

所述处理器还用于调用所述存储器的指令和数据以实现，根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；

所述通信接口还用于将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

结合第五方面或第五方面的第一至第五任一种可能的实现方式，在第六种可能的实现方式中，所述处理器还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

结合第五方面或第五方面的第一至第五任一种可能的实现方式，在第七种可能的实现方式中，所述处理器还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

第六方面，本发明实施例提供一种第三视频终端，包括：处理器，通信接口，存储器、总线和显示器；

其中所述处理器、所述通信接口、所述存储器和所述显示器通过所述总线互联；

所述通信接口用于接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；所述存储器，用于存储指令或数据；

所述处理器调用存储在所述存储器中的指令以实现将所述合成视频通过所述显示器进行显示。

在第一种可能的实现方式中，所述通信接口还用于接收至少一个视频釆集装置发送的视频信息；

所述处理器还用于将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频信息包括所述第所述通信接口还用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在第二种可能的实现方式中，所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述通信接口还用于向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并通过所述显示器显示。

在第三种可能的实现方式中，所述处理器还用于当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

所述通信接口还用于向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

在第四种可能的实现方式中，所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述通信接口还用于向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并通过所述显示器显示。

在第五种可能的实现方式中，所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

所述通信接口还用于向所述视频会议服务器发送所述删除指令用以使所除所述第五与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并通过所述显示器显示。由上述技术方案可知，本发明实施例提供的视频会议处理方法及设备，视频会议服务器接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，第一视频信息包括第一视频终端所在的会场中每个与会者的个人视频信息，第二视频信息包括第二视频终端所在的会场中每个与会者的个人视频信息；从接收到的第二视频信息、及第一视频信息中共获得预设数量的个人视频信息，并将预设数量的个人视频信息合成以生成合成视频，以使在合成视频中，预设数量的个人视频信息分别对应的与会者均处于一致的会场背景中；将合成视频发送给第三视频终端进行显示。由于合成视频的生成是以与会者的个人视频信息为基础，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，突破了物理空间的限制，为最大效率的信息显示提供了灵活性。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例提供的第一种视频会议处理方法流程图；

图 2为本发明实施例提供的会场布局示意图；

图 3为本发明实施例提供的第二种视频会议处理方法流程图；

图 4为本发明实施例提供的第三种视频会议处理方法流程图；

图 5为本发明实施例提供的第四种视频会议处理方法流程图；

图 6为本发明实施例提供的第五种视频会议处理方法流程图；

图 7为本发明实施例提供的图像单元示意图；

图 8为本发明实施例提供的第六种视频会议处理方法流程图；

图 9为本发明实施例提供的第七种视频会议处理方法流程图；

图 10为本发明实施例提供的第八种视频会议处理方法流程图；图 1 1为本发明实施例提供的第九种视频会议处理方法流程图；图 12为本发明实施例提供的第十种视频会议处理方法流程图；图 13为本发明实施例提供的第一种视频会议服务器结构示意图;

图 14为本发明实施例提供的第一种第一视频终端结构示意图；图 15为本发明实施例提供的第二种第一视频终端结构示意图；图 16为本发明实施例提供的第二种视频会议服务器结构示意图;

图 17为本发明实施例提供的第三种第一视频终端结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明实施例提供的第一种视频会议处理方法流程图。如图 1所频的处理过程，本实施例提供的视频会议处理方法具体包括：

步骤 S 10、视频会议服务器接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第一视频信息包括所述第

步骤 S20、所述视频会议服务器从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；

步骤 S30、所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示。

具体地，参与视频会议的会场为至少两个，每个会场中至少有一个参与者。每个会场中设置有视频终端，会场中还设置有用以釆集会场视频的视频釆集装置，用以釆集会场语音的语音釆集装置，以及用以显示其他会场视频的显示装置。视频釆集装置可以为摄像头，语音釆集装置可以为麦克风，显示装置可以为显示器或电视机等。视频釆集装置、语音釆集装置和显示装置可以集成在视频终端中，也可以单独设置。可以在会场中为每个参与者都设置一个视频釆集装置和一个声音釆集装置，专门用于釆集该参与者的实时个人视频和语音。视频终端将每个视频釆集装置釆集到的个人视频信息打包形成视频信息发送给视频会议服务器，同时将声音釆集装置釆集到的语音发送给视频会议服务器。也可以在会场中设置一个视频釆集装置和声音釆集装置，统一釆集所有参与者的视频和语音。视频终端将视频釆集装置釆集到的视频作为视频信息发送给视频会议服务器，同时将声音釆集装置釆集到的语音发送给视频会议服务器，则该视频信息中也包括每个参与者的个人视频信息，视频会议服务器可以将每个参与者的个人视频信息分割开来。每个会场的会场背景可以一致设置，因此，每个个人视频信息中的与会者所在的会场背景一致。也可以在生成合成视频的过程中，使得合成视频中所显示的与会者的会场背景一致。

视频会议服务器根据每个视频终端发送的视频信息，为每个视频终端分别生成合成视频，以使的每个会场的视频终端所显示的为其他会场的视频图像。为了描述方面，视频会议服务器为一个视频终端生成合成视频的过程为例对本实施例进行说明，该视频终端为第三视频终端，则其他的视频终端为第一视频终端和第二视频终端，视频会议服务器从第一视频终端接收到的视频信息为第一视频信息，视频会议服务器从第二视频终端接收到的视频信息为第二视频信息，视频会议服务器从第三视频终端接收到的视频信息为第三视频信息。本实施例中的第一、第二和第三仅用于区分，不用于顺序限定。

视频会议服务器在为第三视频终端生成合成视频的过程中，从接收到的第二视频信息、及第一视频信息中共获得预设数量的个人视频信息。在实际实现过程中，可以根据预设规则从第一视频信息和第二视频信息中获取预设数量的个人视频信信息。该预设数量可以根据实际的显示效果需要和显示装置的规格参数来具体设置，获取到的个人视频信息可以全是第一视频信息中的个人视频信息，也可以全是第二视频信息中的个人视频信息，还可以部分时第一视频信息中的个人视频信息，部分为第二视频信息中的个人视频信息。预设规则可以有多种方式，例如，在第一种实现方式中，对于视频会议系统的初始处理，可以从首先接入视频会议服务器的视频终端发送的视频信息中确定预设数量的个人视频信息；在第二种实现方式中，每个会场具有优先级以标识该会场的重要程度，从优先级最高的会场对应的视频终端发送的视频信息中确定预设数量的个人视频信息；在第三种实现方式中，每个与会者具有优先级以标识该与会者的重要程度，可以按照优先级由高到低确定预设数量的视频信息；在第四种实现方式中，视频终端还可以发送用以指示正在发言的与会者的与会者标识给视频会议服务器，以使得视频会议服务器可以将正在发言的与会者的视频信息作为合成视频的一部分。预设规则可以根据实际的会议需要来设置，不以本实施例为限。

视频会议服务器将该预设数量的个人视频信息合成为合成视频，并将该合成视频发送给第三视频终端。第三视频终端将该合成视频显示给该第三视频终端所在会场的与会者，或者，该第三视频终端通过独立的显示装置显示该合成视频，以实现视频会议过程。

本实施例提供的视频会议处理方法，视频会议服务器接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，第一视频信息包括第二视频终端所在的会场中每个与会者的个人视频信息；从接收到的第二视频信息、及第一视频信息中共获得预设数量的个人视频信息，并将预设数量的个人视频信息合成以生成合成视频，以使在合成视频中，预设数量的个人视频信息分别对应的与会者均处于一致的会场背景中；将合成视频发送给第三视频终端进行显示。由于合成视频的生成是以与会者的个人视频信息为基础，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，突破了物理空间的限制，为最大效率的信息显示提供了灵活性。

在实际应用过程中，为了达到更好的视频会议效果，每个会场可以统一布局。图 2为本发明实施例提供的会场布局示意图，如图 2所示，会场中可以设置有视频釆集装置 001、背景墙装置 002、大屏显示装置 003、声音定位录入装置 004、与会者坐席装置 005和视频终端 006。与会者坐席装置 005用于给与会者提供座位，座位可以使用固定式坐席，如沙发等，也可以使用非固定式坐席，如带轮子的转椅等，座位的数量例如为图 2所示的六个。与会者坐席装置 005可以摆设半圓形的桌子，与会者坐席装置 005的座位也按照桌子圓弧的形状摆设。大屏显示装置 003可以由多个或一个大尺寸显示器组建的装置，其大小不得低于一个固定的尺寸，以保证视频釆集装置 001拍摄的图像在本装置显像时得到接近与真实比例人物大小的视觉感受，大屏显示装置 003设置成圓弧状。当大屏显示装置 003所显示的合成视频中的与会者的数量也为六个，则可以实现会场的与会者与大屏显示装置 003所显示的与会者在同一会场围着一张圓桌进行会议的感觉。对于每个与会者设置一个视频釆集装置 001 , 视频釆集装置 001可以与声音定位录入装置 004配合，或者其他手段输入的指令，拍摄指定区域的图像。声音定位录入装置 004由多个或一个收音装置与声音定位装置组成。通过声音定位装置捕捉与会者发声方向，生成指令发送给视频釆集装置 001 , 并录入该发声位的语音信息。不同会场的背景墙装置 002结构形态一致，布局在大屏显示装置 003和与会者坐席装置 005后方并不得低于一个固定的尺寸。背景墙装置 002上可以布置多种纹理形态，以便于视频会议服务器对个人视频信息合成处理生成合成视频，通过大屏显示装置 003呈现的合成视频与布局在大屏显示装置 003后方及与会者坐席装置 005后方的背景墙装置 002, 互相接合 /拼合，实现与会者从感知上产生在同一空间中进行沟通的体验感。视频终端 006可以通过但不限于使用可视化的可触摸的多点控制器，实体按键控制器或其他形式实现。通过该视频终端 006对各会场中的沟通需求进行控制，包括但不限于：显示模式的切换，个人视频信息的切换，声控切换的开关，文档的演示等。

在本实施例中，视频会议服务器初始化的处理过程，可以为：根据设置规则将最先接入的视频终端发送的视频信息中的个人视频信息生成合成视频，由此可以简化初始的处理流程，而且，可以提高为视频终端提供合成视频的速度，缩短用户的等待时间。该设置规则具体用以指示如何从最先接入的视频终端发送的视频信息中确定个人视频信息。例如，若最先接入的视频终端发送的视频信息中的个人视频信息的数量恰好等于或小于所述预设数量，则可以直接将视频信息中的所有的个人视频信息生成合成视频；若最先接入的视频终端发送的视频信息中的个人视频信息的数量多于所述预设数量，可以按照视频信息中个人视频信息的顺序，依次选取，也可以根据用户预设选取特定位置与会者的个人视频信息。

图 3为本发明实施例提供的第二种视频会议处理方法流程图。如图 3所示，在本实施例中，步骤 S30, 所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还可以包括：

步骤 S40、所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

步骤 S50、所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

步骤 S60、所述视频会议服务器将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

具体地，可以预先为参加会议的每个与会者分配标识，则在视频会议过程中与该与会者相关的处理都可以通过该标识实现。在会场为统一布局的应用场景下，每个会场中的座位数量及摆放位置固定，为了简化处理流程，可以为每个座位分配标识，以达到对不同的与会者进行区分的目的。

在初始过程中，每个会场的视频终端接入视频会议服务器，视频会议服务器可以从最先接入的视频终端发送的视频信息中确定预设数量的个人视频信息，生成合成视频并发送给第三视频终端。第三视频终端所在的会场的管理人员或者参与人员可以根据需要切换合成视频中的个人视频信息，例如，将合成视频中的某个与会者的个人视频信息，切换为想要看到的与会者的个人视频信息。第三视频终端可以提供可视的人机交互界面，该人机交互界面可以通过但不限于触摸屏、键盘或重力感应等方式实现切换指示信息的输入，触摸屏或者操作界面显示屏可以显示图像交互界面。第三视频终端为用户显示每个与会者的图片以及编号，用户可以直接点击需要切换的两位与会者的图片或者输入两位与会者的编号以实现切换。第三视频终端根据用户的输入生成该第一与会者替换指令，该第一与会者替换指令中携带有第一与会者标识和第二与会者标识，第一与会者标识用以指示切换前的与会者，第二与会者标识用以指示切换后的与会者。

视频会议服务器还可以将发送给第三视频终端中所包含的个人视频信息所对应的与会者的信息同步给其他视频终端，例如第一视频终端和第二视频终端，因此，第一视频终端或第二视频终端所在会场的管理人员或者参与人员也可以根据会议需要进行上述切换操作，在此不再赘述。

在另一种应用场景下，若每个会场的座位固定且数量一致。例如，设置有三个会场，分别为会场 1、会场 2和会场 3 , 每个会场都设置有六个座位，分别为座位 1 , 座位 2, 座位 3 , 座位 4, 座位 5和座位 6。第三视频终端设置在会场 3 , 初始时，第三视频终端显示的为会场 1 的六位与会者的视频信息，用户只点击想要看到的与会者的图片，或者输入该与会者的编号，若用户输入的为会场 2座位 3的与会者，则第三视频终端生成的第一与会者替换指令中所携带的第一与会者标识用以指示会场 1座位 3的与会者，第二与会者标识用以指示会场 2座位 3的与会者。

上述切换过程是通过用户手动触发，视频终端为用户提供手动切换模式，当用户选择该模式时，需要用户手动输入触发切换流程。

在实际应用中，第二与会者标识的数量可以为一个或多个，即，将合成视频中的一个与会者的个人视频信息替换为一个或多个其他与会者的个人视频信息，为了保证显示效果，第二与会者标识的数量不宜过多。

图 4为本发明实施例提供的第三种视频会议处理方法流程图。如图 4所示，在本实施例中，步骤 S30, 所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还可以包括：

步骤 S41、所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或第三视频终端发送的第二与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

步骤 S51、所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息；

步骤 S61、所述视频会议服务器将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

具体地，切换过程还可以通过声控触发。当某个会场中有与会者发言时，视频终端可以通过语音釆集装置上传的语音识别到与会者处于发言的状态，或者，还可以设置发言按钮，与会者发言时触按该按钮，以使得视频终端可以获知哪位与会者正在发言。视频终端生成第二与会者替换指令，该第二与会者替换指令中携带有用以指示正在发言的与会者的标识。视频会议服务器可以根据第二预设规则确定被替换的与会者，该第二预设规则也可以预先设置，例如可以为根据发言的与会者的位置，将合成视频中相应为的与会者替换。

仍以设置有三个会场，分别为会场 1、会场 2和会场 3 , 每个会场都设置有六个座位，分别为座位 1 , 座位 2, 座位 3 , 座位 4, 座位 5和座位 6为例进行说明。第三视频终端设置在会场 3 , 初始时，第三视频终端显示的为会场 1的六位与会者的个人视频信息，会场 2的座位 2的与会者开始发言，则会场 2的视频终端检测到该与会者发言时，生成与会者替换指令，与会者替换指令中携带有用以指示会场 2座位 2的与会者的标识。视频会议服务器当接收到该与会者替换指令时，在为其他视频终端生成合成视频的过程中，将该发言的与会者的个人视频信息合成到合成视频中，以实现切换，例如，将发送给第三视频终端的合成视频中的某个个人视频信息替换为会场 2座位 2 的与会者的个人视频信息。

视频终端还可以为用户提供声控切换模式，当用户选择该模式时，通过声音触发切换流程。当然，在实际应用过程中。手动切换模式和声控切换模块可以并存，可以以声控切换为主要的切换模式，以保证与会者可以看到发言者，再以手动切换为辅助的切换模式，以保证与会者可以看到想要看到的重要与会者。

在本实施例中，所述第二与会者替换指令中还携带有位置信息，步骤 S51 , 所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，具体可以包括：所述视频会议服务器根据所述第二与会者替换指令将所述合成视频中所包含的与所述第二与会者替换指令中所包含位置信息对应的个人视频信息作为所述的目标个人视频信息。

具体地，视频会议服务器中存储有与会者的标识和该与会者的位置信息的对应关系，可以根据第三与会者标识从上述对应关系中获得该与会者的位置信息，也可以在视频终端发送的第二与会者替换指令中携带位置信息。当每个会场中的与会者数量一致，合成视频中的视频信息的数量也与会场中的与会者的数量相同时，会场中所显示的合成视频中每个与会者的位置与实际会场中的与会者的位置相同，切换时，将位置相同的与会者之间进行切换，可以降低切换时所带来的突兀感。

图 5为本发明实施例提供的第四种视频会议处理方法流程图。如图 5所示，在本实施例中，步骤 S30, 所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还可以包括：

步骤 S42、所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

步骤 S52、所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

步骤 S62、所述视频会议服务器将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

具体地，视频终端所在的会场的管理人员或者参与人员可以根据需要在合成视频中添加想要看到的与会者的视频，则管理人员或者参与人员可以输入添加指示信息，以使得视频终端生成添加指令。该第四与会者标识的数量可以为一个或多个，为了保证显示效果，第四与会者标识的数量不宜过多。

图 6为本发明实施例提供的第五种视频会议处理方法流程图。如图 6所示，在本实施例中，步骤 S30, 所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：步骤 S43、所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

步骤 S53、所述视频服务器根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；

步骤 S63、所述视频会议服务器将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

具体地，视频终端所在的会场的管理人员或者参与人员可以根据需要在合成视频中删除某个与会者的视频，则管理人员或者参与人员可以输入删除指示信息，以使得视频终端生成删除指令。该第五与会者标识的数量可以为一个或多个，为了保证显示效果，合成视频中被删除的视频信息的位置可以通过静态换面来显示。

视频会议服务器生成合成视频的方式可以有多种，以保证合成视频中每个与会者的尺寸一直即可。为了降低视频会议服务器的处理难度，与会者的座位和视频釆集装置布置在一个对应的物理位置上，视频釆集装置可以基于但不仅限于人脸捕捉，人体红外特征捕捉等现有技术，将所拍摄到的参与总者布置在一个预设尺寸的图像单元中，如图 7 所示，该图像单元的尺寸为 el.l X el.2, 并将与会者画面布置在以 el.l x el.2尺寸的图像单元中的 el.7轴心位置。因为视频是一种连续动态的画面，故允许用户在 el. l X el.2尺寸的图像单元中以 el.7 为轴心位置的左右小范围的在阈值内的移动。优选地， el.l X el.2 的单元尺寸满足 el.3 , el.5 , el.6 的尺寸规格要求。其中，一个 el. l x el .3 的图像单元为最小显示单元， el.5 的尺寸定义是为了符合用户在多点视频会议中自然的手部动作，保证在一定范围内的与会者的行为都可以被视频釆集装置拍摄成功。 el.6 的尺寸定义是基于视频釆集装置拍摄到的与会者画面是以坐姿为主的情况下，与会者有站立的需求时，保证视频釆集装置拍摄的画面可以将参与人的站立状况的画面全面拍摄成功，避免出现头部超出摄像范围情况。

在本实施例中，步骤 S30, 所述视频会议服务器将所述预设数量的所述个人视频信息合成以生成合成视频，具体可以包括：

具体地，在合成视频的一种实现方式中，图 7所示的图像单元中还可以设置尺寸为 el . l x el .4的合并区域，用于多个 el . l x el .2尺寸的图像单元进行合成过程中的重叠，融合合并区域。通过合并区域的设置，并在个人视频信息的合并过程中，将合并区域进行融合处理，使得每个个人视频信息之间衔接自然，提高了视频会议的显示效果。

当系统中的视频终端发送过来的视频信息的规格不是上述预设规格时，基于发明的以与会者为单位的显示机制进行兼容。某个视频终端发送的视频信息中的个人视频的尺寸为 fl x f2, 调整其竖向方向画面比例与 el . l吻合，在画面的左右两侧保留尺寸为 e 1.1 X e 1.4合并区域用于与其他个人视频信息合并。当某个会场没有视频只有语音接入时，也可以为该会场设置一个明显的图标表示接入源，该图标可以是上述 el . l x el .2尺寸规格，并设置有尺寸为 el . l el .4的合并区域。

在实际应用中，优选地，合成视频中的个人视频信息为一横排，以实现模拟会议现场的显示效果。合成视频中的个人视频信息也可以为多排显示，可以实现模拟阶梯会场的显示效果。

具体地，在合成视频的一种实现方式中，视频会议服务器可以基于但不仅限于图像抠取等现有技术将个人视频信息中的与会者的人像从当前背景图像抠取出，并合并到预设背景图像中，以得到该合成视频。当会场中设置背景墙时，预设背景图像具体可以与背景墙的图像一致，以形成具有统一会场感的画面效果。在实际应用过程中，人像抠取的工作也可以由视频终端实现，视频终端可以直接将抠取好的人像发送给视频会议服务器。

图 8为本发明实施例提供的第六种视频会议处理方法流程图。如图 8所示，本实施例提供的视频会议处理方法具体可以与本发明任意实施例提供的应用于视频会议服务器的方法配合实现，具体实现过程在此不再赘述。本实施例提供的视频会议处理方法具体包括：

步骤 C10、第三视频终端接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

步骤 C20、所述第三视频终端将所述合成视频进行显示。

本实施例提供的视频会议处理方法，第三视频终端接收视频会议服务器发送的合成视频，其中，合成视频通过视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将预设数量的个人视频信息合成而得到，在合成视频中，预设数量的个人视频信息分别对应的与会者均处于一致的会场背景中，

将合成视频进行显示。由于合成视频的生成是以与会者的视频信息为基础，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，突破了物理空间的限制，为最大效率的信息显示提供了灵活性。

图 9为本发明实施例提供的第七种视频会议处理方法流程图。如图 9所示，在本实施例中，步骤 C10 , 所述方法还可以包括：

步骤 C30、所述第三视频终端接收至少一个视频釆集装置发送的视频信息，将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频信息包括所述第三视频终端所在的会场中每个与会者的个人视频信息。

步骤 C31、所述第三视频终端将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在本实施例中，步骤 C20, 所述第三视频终端将所述合成视频进行显示之后，所述方法还可以包括：

步骤 C40, 所述第三视频终端根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

步骤 C50、所述第三视频终端向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

步骤 C60、所述第三视频终端接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并显示。

图 10为本发明实施例提供的第八种视频会议处理方法流程图。如图 10 所示，在本实施例中，步骤 C20, 所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

步骤 C41、所述第三视频终端当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；

步骤 C51、所述第三视频终端生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

步骤 C61、所述第三视频终端向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

具体地，第三视频终端在持续一段时间内捕捉到声音强度大于预设阈值的声音时，可以认为检测到存在与会者正在发言，以避免突发的声响对切换流程的频繁触发。

图 11 为本发明实施例提供的第九种视频会议处理方法流程图。如图 11 所示，在本实施例中，步骤 C20, 所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

步骤 C42、所述第三视频终端根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

步骤 C52、所述第三视频终端向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

步骤 C62、所述第三视频终端接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并显示。

图 12为本发明实施例提供的第十种视频会议处理方法流程图。如图 12 所示，在本实施例中，步骤 C20, 所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

步骤 C43、所述第三视频终端根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

步骤 C53、所述第三视频终端向所述视频会议服务器发送所述删除指令信息中删除所述第五与会者标识指示的个人视频信息；

步骤 C63、所述第三视频终端接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并显示。

图 13 为本发明实施例提供的第一种视频会议服务器结构示意图。如图 13所示，本实施例提供的视频会议服务器具体可以实现本发明任意实施例提供的应用于视频会议服务器的视频会议处理方法的各个步骤，具体实现过程在此不再赞述。

本实施例提供的视频会议服务器，具体包括：

接收单元 1 1 , 用于接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第处理单元 12, 与所述接收单元 1 1相连，用于从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；

发送单元 13 , 与所述处理单元 12相连，用于将所述合成视频发送给所述第三视频终端进行显示。

本实施例提供的视频会议服务器，由于合成视频的生成是以与会者的视频信息为基础，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，突破了物理空间的限制，为最大效率的信息显示提供了灵活性。

在本实施例中，所述接收单元 1 1还用于接收所述第一视频终端、所述第二视频终端、所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理单元 12还用于根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息。所述发送单元 13 还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述接收单元 11还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理单元 12还用于根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。所述发送单元 13 还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述第二与会者替换指令中还携带有位置信息。所述处理单元 12还用于根据所述第二与会者替换指令将所述合成视频中所包含的与所述第二与会者替换指令中所包含位置信息对应的个人视频信息作为所述的目标个人视频信息。

在本实施例中，所述接收单元 11还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理单元 12还用于根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息。所述发送单元 13 还用于将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述接收单元 11还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息。所述息中删除所述第五与会者标识指示的个人视频信息。所述发送单元 13 还用于将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述处理单元 12还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

在本实施例中，所述处理单元 12还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

图 14为本发明实施例提供的第一种第三视频终端结构示意图。如图 14 所示，本实施例提供的第三视频终端 600具体可以实现本发明任意实施例提供的用于第三视频终端的视频会议处理方法的各个步骤，具体实现过程在此不再赘述。

本实施例提供的第三视频终端 600, 包括：

接收单元 21 , 用于接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

显示单元 22, 与所述接收单元 21相连，用于将所述合成视频进行显示。本实施例提供的第三视频终端 600, 由于合成视频的生成是以与会者的视频信息为基础，避免了以会场的整体视频为基础时，由于会场的不均等性造成的显示效果不佳的缺陷，突破了物理空间的限制，为最大效率的信息显示提供了灵活性。

图 15为本发明实施例提供的第二种第三视频终端 600结构示意图。如图 15所示，在本实施例中，所述接收单元 21还用于接收至少一个视频釆集装置发送的视频信息。所述第三视频终端 600还可以包括：

第一处理单元 211 , 与所述接收单元 21相连，将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端 600所在的会场中至少一个与会者的视频信息，所述第三视频信息包括所述第三视频终端 600所在的会场中每个与会者的个人视频信息。

第一发送单元 212, 与所述第一处理单元 211相连，用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在本实施例中，所述第三视频终端 600还可以包括：

第二处理单元 221 , 用于根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

第二发送单元 222, 与所述第二处理单元 221相连，用于向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

所述接收单元 21 还用于接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并通过所述显示单元 22显示。

在本实施例中，所述第三视频终端 600还可以包括：

第三处理单元 231 , 用于当在预设时间范围内检测到所述第三视频终端 600 所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

第三发送单元 232, 与所述第三处理单元 231相连，用于向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

在本实施例中，所述第三视频终端 600还可以包括：

第四处理单元 241 , 用于根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

第四发送单元 242, 与所述第四处理单元 241相连，用于向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

所述接收单元 21 还用于接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并通过所述显示单元 22显示。在本实施例中 , 所述第三视频终端 600还可以包括：

第五处理单元 251 , 用于根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

第五发送单元 252, 与所述第五处理单元 251相连，用于向所述视频会议服务器发送所述删除指令用以使所述视频服务器根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；

所述接收单元 21 还用于接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并通过所述显示单元 22显示。

图 16 为本发明实施例提供的第二种视频会议服务器结构示意图。如图 16所示，本实施例提供的视频会议服务器 700具体可以实现本发明任意实施例提供的应用于视频会议服务器的视频会议处理方法的各个步骤，具体实现过程在此不再赘述。

本实施例提供的视频会议服务器 700包括：处理器 710, 通信接口 720, 存储器 730和总线 740, 其中所述处理器 710、所述通信接口 720和所述存储器 730通过所述总线 740互联。所述通信接口 720用于接收第一视频终端发送的第一视频信息，以及第二视频终端发送的第二视频信息，其中，所述第息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息。所述存储器 730用于存储指令或数据。所述处理器 710调用存储在所述存储器 730 中的指令以实现从接收到的所述第二视频信息、及所述第一视频信息中共获得预设数量的所述个人视频信息，并将所述预设数量的所述个人视频信息合成以生成合成视频，以使在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中。所述通信接口 720 还用于将所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述通信接口 720还用于接收所述第一视频终端、所述第二视频终端、所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第 ― 与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理器 710还用于调用所述存储器 730的指令和数据以实现，根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息。所述通信接口 720还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述通信接口 720还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理器 710还用于调用所述存储器 730的指令和数据以实现，根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。所述通信接口 720还用于将替换所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述第二与会者替换指令中还携带有位置信息。所述处理器 710还用于调用所述存储器 730的指令和数据以实现，根据所述第二与含位置信息对应的个人视频信息作为所述的目标个人视频信息。

在本实施例中，所述通信接口 720还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述处理器 710还用于调用所述存储器 730的指令和数据以实现，根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息。所述通信接口 720还用于将添加所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述通信接口 720还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息。所述处理器 710还用于调用所述存储器 730的指令和数据以实现，根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息。所述通信接口 720还用于将删除所述个人视频信息后的所述合成视频发送给所述第三视频终端进行显示。

在本实施例中，所述处理器 710还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

在本实施例中，所述处理器 710还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

图 17为本发明实施例提供的第三种第一视频终端结构示意图。如图 17 所示，本实施例提供的第一视频终端 800具体可以实现本发明任意实施例提赘述。

本实施例提供的第一视频终端 800包括：处理器 810, 通信接口 820, 存储器 830和总线 840 , 其中所述处理器 810、所述通信接口 820和所述存储器 830通过所述总线 840互联。所述通信接口 820用于接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息。所述存储器 830用于存储指令或数据。所述处理器 810调用存储在所述存储器 830中的指令以实现将所述合成视频通过所述显示器进行显示。

在本实施例中，所述通信接口 820还用于接收至少一个视频釆集装置发送的视频信息。所述处理器 810还用于将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频信息接口 820还用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

在本实施例中，所述处理器 810还用于调用所述存储器 830的指令和数据以实现，根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述通信接口 820还用于向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述第一与会者替换指令发送的替换所述个人视频信息后的所述合成视频并通过所述显示器显示。

在本实施例中，所述处理器 810还用于当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息。所述通信接口 820还用于向所述视频会议服务器发送所述第二与会者替换指令用以使所述视频会议服务器根据所述第二与会者替换指令从所述发送给所述第一视频终端或第二视频终端的合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息。

在本实施例中，所述处理器 810还用于调用所述存储器 830的指令和数据以实现，根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息。所述通信接口 820还用于向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并通过所述显示器显示。

在本实施例中，所述处理器 810还用于调用所述存储器 830的指令和数据以实现，根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息。所述通信接口 820还用于向所述视频会议服务器发送所述删除指令用以使所述视频服务器根据所述删除指令在所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并通过所述显示器显示。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括： ROM、 RAM, 磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求书

1、一种视频会议处理方法，其特征在于，包括：

2、根据权利要求 1所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

3、根据权利要求 1所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或第三视频终端发送的第二与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息，将选择的所述目标个人视频信息替换为所述第三与会者标识指示的个人视频信息；

4、根据权利要求 3 所述的视频会议处理方法，其特征在于，所述第二与会者替换指令中还携带有位置信息 , 所述视频会议服务器根据所述第二与会者替换指令从所述合成视频所包含的个人视频信息中选择目标个人视频信息包括：

5、根据权利要求 1 所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

所述视频会议服务器接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；

6、根据权利要求 1 所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述合成视频发送给所述第三视频终端进行显示之后，所述方法还包括：

7、根据权利要求 1-6任一所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述预设数量的所述个人视频信息合成以生成合成视频包括：

8、根据权利要求 1-6任一所述的视频会议处理方法，其特征在于，所述视频会议服务器将所述预设数量的所述个人视频信息合成以生成合成视频包括：

9、一种视频会议处理方法，其特征在于，包括：第三视频终端接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中，所信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

所述第三视频终端将所述合成视频进行显示。

10、根据权利要求 9所述的视频会议处理方法，其特征在于，所述方法还包括：

1 1、根据权利要求 9所述的视频会议处理方法，其特征在于，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

所述第三视频终端根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；所述第三视频终端向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

12、根据权利要求 9所述的视频会议处理方法，其特征在于，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

13、根据权利要求 9所述的视频会议处理方法，其特征在于，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

14、根据权利要求 9所述的视频会议处理方法，其特征在于，所述第三视频终端将所述合成视频进行显示之后，所述方法还包括：

15、一种视频会议服务器，其特征在于，包括：

16、根据权利要求 15所述的视频会议服务器，其特征在于：

所述接收单元还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

17、根据权利要求 15所述的视频会议服务器，其特征在于：

所述接收单元还用于接收所述第一视频终端、或所述第二视频终端、或第三视频终端发送的第二与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

18、根据权利要求 17所述的视频会议服务器，其特征在于：所述第二与会者替换指令中还携带有位置信息；

19、根据权利要求 15所述的视频会议服务器，其特征在于：所述接收单元还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

20、根据权利要求 15所述的视频会议服务器，其特征在于：

所述接收单元还用于接收所述所述第一视频终端、所述第二视频终端、第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

21、根据权利要求 15-20任一所述的视频会议服务器，其特征在于：所述处理单元还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

22、根据权利要求 15-20任一所述的视频会议服务器，其特征在于：所述处理单元还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

23、一种第三视频终端，其特征在于，包括：

24、根据权利要求 23所述的第三视频终端，其特征在于：

所述接收单元还用于接收至少一个视频釆集装置发送的视频信息；所述第三视频终端还包括：

第一处理单元，与所述接收单元相连，将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频第一发送单元，与所述第一处理单元相连，用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

25、根据权利要求 23所述的第三视频终端，其特征在于，还包括：第二处理单元，用于根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；第二发送单元，与所述第二处理单元相连，用于向所述视频会议服务器发送所述第一与会者替换指令用以使所述视频会议服务器根据所述第一与会者替换指令用所述第二与会者标识指示的个人视频信息替换所述合成视频中所述第一与会者标识指示的个人视频信息；

26、根据权利要求 23所述的第三视频终端，其特征在于，还包括：第三处理单元，用于当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

27、根据权利要求 23所述的第三视频终端，其特征在于，还包括：第四处理单元，用于根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

28、根据权利要求 23所述的第三视频终端，其特征在于，还包括：第五处理单元，用于根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

29、一种视频会议服务器，其特征在于，包括：处理器，通信接口，存储器和总线；

30、根据权利要求 29所述的视频会议服务器，其特征在于：

所述通信接口还用于接收所述第一视频终端、所述第二视频终端、所述第三视频终端发送的第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

31、根据权利要求 29所述的视频会议服务器，其特征在于：

所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的第一与会者替换指令，其中，所述第二与会者替换指令中携带有第三与会者标识，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换所述合成视频包含的个人视频信息，所述第三与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

32、根据权利要求 31所述的视频会议服务器，其特征在于：所述第二与会者替换指令中还携带有位置信息；

33、根据权利要求 29所述的视频会议服务器，其特征在于：

所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

34、根据权利要求 29所述的视频会议服务器，其特征在于：

所述通信接口还用于接收所述第一视频终端、所述第二视频终端、或所述第三视频终端发送的删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

35、根据权利要求 29-34任一所述的视频会议服务器，其特征在于：所述处理器还用于对所述预设数量的所述个人视频信息中的对应图像进行拼接，生成合成图像，其中，所述预设数量的所述个人视频信息中的对应图像在时序上同步；组合多幅所述合成图像以生成合成视频。

36、根据权利要求 29-34任一所述的视频会议服务器，其特征在于：所述处理器还用于将所述预设数量的所述个人视频信息包含的图像信息排列在预设背景图像中生成合成图像，其中，从所述第一视频信息、所述第二视频信息中获得的所述预设数量的所述个人视频信息包含的图像信息在时序上同步；组合多幅所述合成图像以生成合成视频。

37、一种第三视频终端，其特征在于，包括：处理器，通信接口，存储器、总线和显示器；

所述通信接口用于接收视频会议服务器发送的合成视频，其中，所述合成视频通过所述视频会议服务器从第一视频终端接收到的第一视频信息、及从第二视频终端接收到的第二视频信息中共获得预设数量的个人视频信息，并将所述预设数量的所述个人视频信息合成而得到，在所述合成视频中，所述预设数量的所述个人视频信息分别对应的与会者均处于一致的会场背景中；所述第一视频信息包括所述第一视频终端所在的会场中每个与会者的个人视频信息，所述第二视频信息包括所述第二视频终端所在的会场中每个与会者的个人视频信息；

所述存储器，用于存储指令或数据；

38、根据权利要求 37所述的第三视频终端，其特征在于：

所述通信接口还用于接收至少一个视频釆集装置发送的视频信息；所述处理器还用于将接收到的视频信息打包形成第三视频信息，其中，所述至少一个视频釆集装置中的每个视频釆集装置用以釆集第三视频终端所在的会场中至少一个与会者的视频信息，所述第三视频信息包括所述第所述通信接口还用于将所述第三视频信息发送给所述视频会议服务器，以使所述视频会议服务器根据所述第三视频信息和所述第一视频信息生成合成视频发送给所述第二视频终端，或根据所述第三视频信息和所述第二视频信息生成合成视频发送给所述第一视频终端。

39、根据权利要求 37所述的第三视频终端，其特征在于：

所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的切换指示信息生成第一与会者替换指令，其中，所述第一与会者替换指令中携带有第一与会者标识和第二与会者标识，所述第一与会者替换指令用于指示用所述第二与会者标识指示的个人视频信息替换所述合成视频中包含的所述第一与会者标识指示的个人视频信息，所述第一与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息，所述第二与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；

40、根据权利要求 37所述的第三视频终端，其特征在于：

所述处理器还用于当在预设时间范围内检测到所述第三视频终端所在的会场中的语音釆集装置具有语音输入时，确定用以指示正在发言的与会者的第三与会者标识；生成携带有所述第三与会者标识的第二与会者替换指令，其中，所述第二与会者替换指令用于指示用所述第三与会者标识指示的个人视频信息替换发送给所述第一视频终端或所述第二视频终端的合成视频包含的个人视频信息；

41、根据权利要求 37所述的第三视频终端，其特征在于：

所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的添加指示信息生成添加指令，其中，所述添加指令中携带有第四与会者标识，所述添加指令用于指示在所述合成视频中添加所述第四与会者标识指示的个人视频信息，所述第四与会者标识指示的个人视频信息是包含于除所述合成视频中之外的所述第一视频信息的个人视频信息、或包含于除所述合成视频中之外的所述第二视频信息的个人视频信息；所述通信接口还用于向所述视频会议服务器发送所述添加指令用以使所述视频服务器根据所述添加指令在所述合成视频中添加所述第四与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述添加指令发送的添加所述个人视频信息后的所述合成视频并通过所述显示器显示。

42、根据权利要求 37所述的第三视频终端，其特征在于：

所述处理器还用于调用所述存储器的指令和数据以实现，根据接收到的用户输入的删除指示信息生成删除指令，其中，所述删除指令中携带有第五与会者标识，所述删除指令用于指示从所述合成视频所包含的个人视频信息中删除所述第五与会者标识指示的个人视频信息，所述第五与会者标识指示的个人视频信息是包含于所述合成视频中的个人视频信息；

所述通信接口还用于向所述视频会议服务器发送所述删除指令用以使所除所述第五与会者标识指示的个人视频信息；接收所述视频会议服务器根据所述删除指令发送的删除所述个人视频信息后的所述合成视频并通过所述显示器显示。