CN105592286A

CN105592286A - 即时通信界面信息处理方法及装置

Info

Publication number: CN105592286A
Application number: CN201410569510.0A
Authority: CN
Inventors: 刘抒炎
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2014-10-22
Filing date: 2014-10-22
Publication date: 2016-05-18
Anticipated expiration: 2034-10-22
Also published as: CN105592286B; HK1224118A1

Abstract

本申请公开了即时通信界面信息处理方法及装置，其中，所述方法包括：在第一用户与至少两个第二用户参与的多用户视频会话中，监控各个用户的语音数据；根据监控结果，确定主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；根据所述布局信息，对会话窗口中的各个视频进行显示。通过本申请，能够使得会话窗口中提供的视频显示区域的作用得以更有效的发挥。

Description

即时通信界面信息处理方法及装置

技术领域

本申请涉及即时通信技术领域，特别是涉及即时通信界面信息处理方法及装置。

背景技术

在网络越来越发达的今天，人们对网络的依赖也越来越多，由此产生的即时通信工具也越来越多。使用这种即时通信工具，人们可以通过文字、语音甚至视频等多种方式进行聊天，并且，这种聊天可以在多个用户之间同时进行。例如，多人视频聊天就是其中的一种具体实现形式，在这种聊天形式下，可以在对话窗口中开启多个视频显示区域，显示出各个参与者的头像等视频图像，用户在通过语音的方式进行对话的过程中，还可以观看到各个参与者的视频图形。

另一方面，随着移动通讯技术以及终端技术的发展，在线聊天行为已经逐渐从PC机转移到移动终端设备上，人们可以随时随地的发起或者加入聊天。但是，移动终端设备相对于传统的PC机设备而言，其屏幕尺寸比较小，如果将多个参与者的视频图像都平铺式的显示在屏幕上，则每个视频图像的面积可能都会比较小，以至于每个视频图像都很模糊，无法清晰识别出具体的图像内容，使得这种视频图像形同虚设，失去了其应有的价值。

因此，在进行多人视频通信的过程中，如何使得会话窗口中提供的视频显示区域的作用得以更有效的发挥，是迫切需要本领域技术人员解决的技术问题。

发明内容

本申请提供了即时通信界面信息处理方法及装置，能够使得会话窗口中提供的视频显示区域的作用得以更有效的发挥。

本申请提供了如下方案：

一种即时通信界面信息处理方法，包括：

在第一用户与至少两个第二用户参与的多用户视频会话中，监控各个用户的语音数据；

根据监控结果，确定主体会话者身份标识以及数目，所述主体会话者为正在发声的用户；

根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

根据所述布局信息，对会话窗口中的各个视频进行显示。

一种即时通信界面信息处理方法，包括：

在多用户视频会话中，监控各个用户的语音数据；

根据监控结果，确定当前的主体会话者身份标识以及数目，所述主体会话者为正在发声的用户；

将所述当前的主体会话者身份标识以及数目发送到各个用户的客户端，以便所述各个用户的客户端根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，并根据布局信息，对会话窗口中的各个视频进行显示，其中所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示。

一种即时通信界面信息处理方法，包括：

从服务端获取当前的多用户视频会话中的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

根据所述主体会话者数目，确定对会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

根据所述布局信息，对会话窗口中的各个视频进行显示。

一种即时通信界面信息处理装置，包括：

监控单元，用于在第一用户与至少两个第二用户参与的多用户视频会话中，监控各个用户的语音数据；

确定单元，用于根据监控结果，确定主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

布局单元，用于根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

显示单元，用于根据所述布局信息，对会话窗口中的各个视频进行显示。

一种即时通信界面信息处理装置，包括：

监控单元，用于在多用户视频会话中，监控各个用户的语音数据；

确定单元，用于根据监控结果，确定当前的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

发送单元，用于将所述当前的主体会话者身份标识以及数目发送到各个用户的客户端，以便所述各个用户的客户端根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，并根据布局信息，对会话窗口中的各个视频进行显示，其中所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示。

一种即时通信界面信息处理装置，包括：

获取单元，用于从服务端获取当前的多用户视频会话中的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

布局单元，用于根据所述主体会话者数目，确定对会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

根据本申请提供的具体实施例，本申请公开了以下技术效果：

通过本申请实施例，可以根据当前的主体会话者数目对会话窗口中各个视频显示区域进行布局，并可以根据布局情况，将主体会话者的视频图像进行突出显示。因此，可以使得正在发言的用户的视频图像更容易被用户关注，使得会话窗口中提供的视频显示区域的作用得以更有效的发挥。

当然，实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一提供的方法的流程图；

图2是本申请实施例提供的方法中第一用户界面示意图；

图3是本申请实施例提供的方法中第二用户界面示意图；

图4是本申请实施例提供的方法中第三用户界面示意图；

图5是本申请实施例提供的方法中第四用户界面示意图；

图6是本申请实施例二提供的方法的流程图；

图7是本申请实施例三提供的方法的流程图；

图8是本申请实施例提供的第一装置的示意图；

图9是本申请实施例提供的第二装置的示意图；

图10是本申请实施例提供的第三装置的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

在本申请实施例中，可以根据主体会话者数目的多少来对对话窗口中的各个视频显示区域进行布局，并且将主体会话者的视频图像按照一定的显示方式进行显示，这样，至少可以使得正在发声的用户的视频图像得以更有效的显示。下面对具体的实现方案进行详细地介绍。

为了便于理解，下面首先对即时通信(IM)，以及基于IM技术的多用户视频对话的技术背景进行简单的介绍。

IM工具一般采用的是C/S通信模式，即客户/服务模式。所谓的C/S通信模式，是把一个应用划分成功能不同的两个部分，分别在不同的计算机上运行，其中一个为服务端程序，用来响应和提供固定的服务，一个为客户端程序，用来向服务端发出请求和要求某种服务。在数量关系上，通常有一对一的(即一个服务端程序和一个客户端程序之间通信)，也有一对多的(即一个服务端程序和多个客户端程序之间通信)，也有多对多的(即多个服务端程序和多个客户端程序之间通信)。所谓服务端程序、客户端程序也是相对的概念，有时在一个程序中既有服务端又有客户端的功能。

按此原理，IM程序一般也分成了两个程序，一个安装在即时通信工具开发商的服务器上，称之为服务端程序，一个安装在用户的计算机上，称之为客户端程序。常规方式下，当一个用户与另一个用户聊天时，第一个客户先把聊天数据发送给服务端，然后服务端再把聊天数据转发给第二个客户，服务端好像一个中转站。这在客户数量比较少时，服务器还能承受，在用户数量比较多时，服务器肯定要瘫痪。何况客户之间还要传送文件、语音聊天、视频聊天等等。为了减少服务器的压力，各客户端之间需要直接通信。

因此，在IM工具中，通信过程会发生在服务端和客户端之间、以及客户端与客户端之间。其中，服务端和客户端之间的通信主要用于客户端程序登录、验证用户密码、获取其他在线好友信息等等。例如，用户A输入自己的用户名和密码登录IM服务端，服务端通过读取用户数据库来验证用户身份，如果用户名、密码都正确，就登记用户A的IP地址、IM客户端软件的版本号及使用的TCP/UDP端口号，然后返回用户A登录成功的标志，此时用户A在IM系统中的状态为在线(OnlinePresence)。同时，服务端还可以根据用户A存储在IM服务器上的好友列表(BuddyList)，将用户A在线的相关信息发送到也同时在线的IM好友的终端设备，这些信息包括在线状态、IP地址、IM客户端使用的TCP端口(Port)号等，IM好友终端设备上的IM客户端收到此信息后可以弹出一个小窗口予以提示，等等。

客户端与客户端之间的通信一般用于在线好友间直接通信聊天。此时每个客户端程序上既有实现服务端功能的部分，又有实现客户端功能的部分，前者用于接收聊天数据，后者用于发送聊天数据。例如，如果用户A想与他的在线好友用户B聊天，他将直接通过服务端发送过来的用户B的IP地址、TCP端口号等信息，直接向用户B的终端设备发出聊天信息，用户B的IM客户端软件收到后显示在屏幕上，然后用户B再直接回复到用户A的终端设备。这样，双方的即时文字消息就不通过IM服务器中转，而是通过网络进行点对点的直接通讯，这称为对等通讯方式(PeerToPeer)。

当然，在商用IM系统中，如果用户A与用户B的点对点通讯由于防火墙、网络速度等原因难以建立或者速度很慢，IM服务器还提供消息中转服务，即用户A和用户B的即时消息全部先发送到IM服务器，再由服务器转发给对方。

而关于基于IM技术的多用户视频聊天技术，在具体实现时，在某用户发起多用户视频聊天请求，并选择了参与者之后，该请求可以发送到服务端，在各参与者同意加入之后，服务端可以将各个参与者用户的IP地址、TCP端口号等通信地址信息在各参与者中进行广播，这样，各个参与者都可以分别与其他参与者之间建立起通信通道。这种通信通道可以分为视频数据通道以及音频数据通道，视频数据通道与音频数据通道一般是成对出现的，顾名思义，视频数据通道用于传输用户的视频数据，音频数据通道用于传输用户的音频数据。一般而言，只要参与者的终端设备启动图像摄取装置，则与其他参与者的视频、音频数据通道中就会一直有数据在传输，并在参与者的会话窗口中进行显示。当然，音频数据通道中传输的数据可能是参与者用户所处环境中的一些声音，不一定是用户的语音数据，只有当参与者用户说话时，音频数据通道中才会传输用户的语音数据。

也就是说，在多用户视频对话时，用户之间的音频、视频数据可以是在用户的终端设备之间端对端对等传输的，不需要通过服务端的中转。当然，在实际应用中，也可以通过服务器的中转来实现。

下面首先对对等传输实现方式下本申请实施例的具体实现进行介绍。

实施例一

参见图1，本申请实施例首先提供了一种即时通信界面信息处理方法，该方法的前提是基于对等传输方式实现多用户视频通信，也就是说，用户之间的音频、视频数据可以是在用户的终端设备之间端对端对等传输，此时，该方法可以包括以下步骤：

S101：在第一用户与至少两个第二用户参与的多用户视频会话中，监控各个用户的语音数据；

在该实施例一中，各个步骤的执行主体可以是多用户视频会话的其中任意一个参与者用户的IM客户端。其中，为了便于描述，将当前所在终端设备的用户称为第一用户，其他参与者用户称为第二用户，由于是多人视频会话，因此，这种第二用户为至少两个。显然，这种第一用户与第二用户的概念是相对的，对于一次多用户视频会话，每个参与者之间都是对等的，无论从哪个参与者自身角度出发，该参与者都是第一用户，自身以外的其他参与者都是第二用户。

具体实现时，当前第一用户的IM客户端可以监控各个参与者的语音数据。其中，所谓的语音数据可以是指用户通过说话等发出的语音的数据。如前文所述，终端设备的音频采集设备采集到的数据可能是一些环境音等，如果某参与者的音频数据通道中仅包含环境音数据，则证明该参与者并没有说话，也即没有语音数据，也就是说，该参与者虽然选择加入了此次多用户视频会话，但是当前没有说话。此时，其他参与者可能也不需要格外关注该参与者的视频图像，只有当前正在发声的用户的视频图像，可能才是其他参与者所最需要关注的，最应该突出显示，以便更清晰的展示给其他参与者。因此，在本申请实施例中，首先可监控各个用户的语音数据，也即，从众多参与者中识别出哪个或者哪些用户正在说话。

具体的，对于IM客户端而言，其获取到的音频数据可能有两个来源，一个是当前的第一用户，另一个来源就是各个第二用户发送来的音频数据。因此，在对各个用户的语音数据进行监控时，也可以是分两个方面进行，一方面，监控当前所在终端设备的音频采集装置是否采集到第一预置长度阈值的连贯语音信号，如果是，则确定当前第一用户正在发声。另一方面，可以监控各第二用户客户端与该当前第一用户客户端之间建立的音频数据通道中是否接收到第一预置阈值的连贯语音信号，如果某第二用户客户端对应的音频数据通道中接收到第一预置阈值的连贯语音信号，则确定该第二用户正在发声。

需要说明的是，关于具体如何识别出语音数据、环境音、连贯语音信号及其长度等，可以参见已有技术中的实现，这里不再详述。

S102：根据监控结果，确定主体会话者身份标识以及数目，所述主体会话者为正在发声的用户；

在对各个参与者用户的语音数据进行监控的过程中，就可以确定出主体会话者身份标识以及数目，也即确定出当前正在有哪个或哪些用户正在发声，以及当前正在发声的用户的数量。需要说明的，在多用户视频会话的存续期间内，前述步骤S101以及该步骤S102可以是在不断进行的，因此，根据监控结果的变化，确定出的当前的主体会话者标识以及数目也可能在不断变化。例如，监控到某用户A正在发声，并且该语音数据尚未结束时，可能又监控到用户B开始发声，此时，当前的主体会话者用户由一个变为两个，等等。

S103：根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

S104：根据所述布局信息，对会话窗口中的各个视频进行显示。

在确定出主体会话者数目之后，可以根据主体会话者数目确定出会话窗口中各个视频显示区域的布局信息，进而可以根据该布局信息对会话窗口中的各个视频进行显示。其中，这里的布局信息主要可以包括：按照第一显示方式对主体会话者的视频图像的信息进行显示，也就是说，在按照布局信息对各个视频进行显示时，可以按照第一显示方式对主体会话者的视频图像进行显示。当然，由于主体会话者数目可能在不断发声变化，因此，该步骤S103中会话窗口中各个视频显示区域的布局信息也可能是在不断变化的，以适应主体会话者数目的变化。

其中，根据主体会话者数目的不同，确定出的布局信息内容可以是不同的。例如，如果某时刻无主体会话者，则确定出的布局信息可以是：将各个用户的视频显示区域按照第二显示方式在所述会话窗口中显示。也就是说，由于此时各个参与者均未发言，因此，在会话窗口中显示时，“地位”也平等。其中，关于第二显示方式，可以有多种，例如，如图2所示，在当前参与者用户数目为9个的情况下，会话窗口中平铺显示有9个视频显示区域，各个视频显示区域的面积都可以是相同的。

如果所述主体会话者数目大于等于一、小于等于第二阈值(一般可以为2)，则确定出的布局信息中，所谓的第一显示方式可以为：在会话窗口的中间区域对主体会话者的视频图像进行显示。这样，具体在显示时，可以在会话窗口的中间区域创建对应数目的视频显示区域，然后将主体会话者的视频图像显示在中间区域的各个视频显示区域内。由于一个会话窗口的中间区域一般是最便于观察的位置，更容易引起用户的注意，因此，通过这种位置上的调整，使得当前正在发言的用户的视频图像得到用户的关注。

当然，在这种情况下，还可以确定出非主体会话者的数目(用此次会话的参与者用户总数减去当前主体会话者数目即可)，并在布局信息中添加关于这种非主体会话者的视频图像的布局信息，也即，布局信息中还可以包括：按照第三显示方式对非主体会话者视频图像的信息进行显示。具体的，所谓的第三显示方式可以是在会话窗口的周边区域对非主体会话者视频图像的信息进行显示，且中间区域的视频显示区域的面积大于周边区域的视频显示区域的面积。这样，具体在根据布局信息进行各用户的视频图像的显示时，可以在会话窗口的周边区域创建对应非主体会话者数目的视频显示区域，且可以使得中间区域的视频显示区域的面积大于周边区域的视频显示区域的面积，这样，在将主体会话者的视频图像显示在所述中间区域的视频显示区域内的同时，还可以将各个非主体会话者的视频图像显示在周边区域的视频显示区域。

例如，如图3所示，如果当前主体会话者数目为一个，则可以在中间区域创建一个面积较大的视频显示区域，并将该主体会话者用户的视频数据展示在该区域内；同时，在会话窗口的周边区域还创建有8个面积较小的视频显示区域，可以将非主体会话者用户的视频数据展示在这些视频显示区域。

如图4所示，如果当前主体会话者数目为两个，则可以在中间区域创建两个面积较大的视频显示区域，并将这两个主体会话者用户的视频数据展示在该区域内；同时，在会话窗口的周边区域还创建有8个面积较小的视频显示区域，可以将非主体会话者用户的视频数据展示在这些视频显示区域。

这样，可以使得当前正在发言的用户的视频数据更容易被用户关注，更有效的发挥出各个视频显示区域的价值。另外，为了进一步突出显示主体会话者用户的视频数据，还可以在中间区域的视频显示区域内添加预置的标识(例如，图3中所示的标识301、图4中所示的标识401、402)，以更加形象地指示对应的用户正在发声。

如果主体会话者数目大于第二阈值(例如2个)，则布局信息中还可以包括：按照第四显示方式对各个用户的视频显示区域进行显示，并在主体会话者的视频图像所在的视频显示区域内添加预置的标识，以指示对应的用户为主体会话者。例如，具体的，可以将各个用户的视频显示区域在会话窗口中平铺显示，此时，为了对当前主体会话者对应的视频数据进行突出显示，可以在各主体会话者对应的视频显示区域内添加预置的标识，以指示对应的用户正在发声。例如，如图5所示，其中标识501、502、503、504所示均为这种标识，其指示出对应的用户正在发言。

总之，通过本申请实施例，可以根据当前的主体会话者数目确定会话窗口中各个视频显示区域的布局信息，其中可以包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示，这样可以根据布局信息，对会话窗口中的各个视频进行显示。因此，可以使得正在发言的用户的视频图像更容易被用户关注，使得会话窗口中提供的视频显示区域的作用得以更有效的发挥。

实施例二

以上实施例一是对端对端对等通信情况下的多用户视频通信情况，本申请实施例的具体实现进行了介绍，在该实施例二中，假设在多用户视频通信过程中，各个用户的视频、音频数据需要通过服务器端的中转，对这种情况进行详细介绍。参见图6，该实施例二从服务端的角度，提供了一种即时通信界面信息处理方法，该方法可以包括以下步骤：

S601：在多用户视频会话中，监控各个用户的语音数据；

在该场景下，由于各个客户端的数据都需要通过服务端的中转，服务端与各个参与者用户的客户端之间都建立有数据通道，用于接收各个用户客户端发送的音频、视频数据。进而，服务端就可以对各个音频数据通道中接收到的音频数据进行分析。例如，当发现从某音频数据通道中接收到第一预置长度阈值的连贯语音信号，则可以确定该音频数据通道对应的用户正在发声。

S602：根据监控结果，确定当前的主体会话者身份标识以及数目，所述主体会话者为正在发声的用户；

在确定出当前正在发声的用户后，还可以确定出当前正在发声的用户的数目。

S603：将所述当前的主体会话者身份标识以及数目发送到各个用户的客户端，以便所述各个用户的客户端根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，并根据布局信息，对会话窗口中的各个视频进行显示，其中所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示。

具体实现时，在服务端与各个客户端的下行数据通道中，还可以增加一条数据通道，用于传输这种主体会话者标识以及数目信息。这样，当服务端识别出当前的主体会话者标识以及数目之后，就可以通过该数据通道发送给各个参与者用户的客户端。这样，客户端就可以根据所述主体会话者数目对会话窗口中各个视频显示区域进行布局，并根据布局情况，将所述主体会话者的视频图像进行突出显示。

其中，客户端具体根据主体会话者数目对视频显示区域进行布局的具体方式，以及对各个主体会话者的视频图像进行突出显示的具体方式，可以与实施例一中是相同的，这里不再赘述。

另外，如实施例一中所述，服务端对各用户的语音数据的监控过程是不断在进行的，因此，确定出的主体会话者标识以及数目也可能在不断变化。具体实现时，服务端可以是在确定出的主体会话者标识和/或数目发生变化时，再重新向各个客户端发送变化后的主体会话者标识和/或数目信息，以便客户端根据更新后的信息，对会话窗口中各个视频显示区域的布局情况，或者主体会话者的视频图像的突出显示情况进行调整。

实施例三

该实施例三的应用场景是与实施例二相同的，从客户端的角度对本申请实施例进行介绍。参见图7，该方法可以包括以下步骤：

S701：从服务端获取当前的多用户视频会话中的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

S702：根据所述主体会话者数目，确定对会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

S703：根据所述布局信息，对会话窗口中的各个视频进行显示。

由于实施例三与实施例二是相对应的，只是在描述的角度上有所不同，因此，相关的实现细节可以参见实施例二中的介绍，这里不再赘述。

需要说明的是，在本申请中的各个具体实施例，关于具体的视频数据、音频数据的传输，与各自所在场景下已有技术中的实现都可以是相同的，因此，这里不再详述。

与本申请实施例一提供的即时通信界面信息处理方法对应，本申请实施例还提供了一种即时通信界面信息处理装置，参见图8，该装置具体可以包括：

监控单元801，用于在第一用户与至少两个第二用户参与的多用户视频会话中，监控各个用户的语音数据；

确定单元802，用于根据监控结果，确定主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

布局单元803，用于根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

显示单元804，用于根据所述布局信息，对会话窗口中的各个视频进行显示。

其中，所述监控单元801具体可以包括：

第一监控子单元，用于监控当前所在终端设备的音频采集装置是否采集到第一预置长度阈值的连贯语音信号，如果是，则确定当前第一用户为主体会话者；

第二监控子单元，用于监控各第二用户客户端与该当前第一用户客户端之间建立的音频数据通道中是否接收到第一预置长度阈值的连贯语音信号，如果某第二用户客户端对应的音频数据通道中接收到第一预置长度阈值的连贯语音信号，则确定该第二用户为主体会话者。

具体实现时，布局信息还可以包括：

如果无主体会话者，则将各个用户的视频显示区域按照第二显示方式在所述会话窗口中进行显示。

其中，所述第一显示方式包括：如果所述主体会话者数目大于等于一、小于等于第二阈值，则在所述会话窗口的中间区域对所述主体会话者的视频图像进行显示；

此时，所述显示单元804包括：

第一创建子单元，用于在所述会话窗口的中间区域创建对应数目的视频显示区域；

主体会话者图像显示子单元，用于将所述主体会话者的视频图像显示在所述中间区域的各个视频显示区域内。

此时，布局信息中还可以包括：按照第三显示方式对非主体会话者视频图像的信息进行显示，其中，所述第三显示方式包括：在所述会话窗口的周边区域对非主体会话者视频图像的信息进行显示，且中间区域的视频显示区域的面积大于周边区域的视频显示区域的面积；显示单元804还可以包括：

数目确定子单元，用于确定非主体会话者的数目；

第二创建子单元，用于在所述会话窗口的周边区域创建对应所述非主体会话者数目的视频显示区域；

主体会话者图像显示子单元，用于将各个非主体会话者的视频图像显示在所述周边区域的视频显示区域。

另外，所述布局信息中还包括：

在所述中间区域的视频显示区域内添加预置的标识，以指示对应的用户正在发声。

另外，布局信息包括：

如果所述主体会话者数目大于第二阈值，则按照第四显示方式对各个用户的视频显示区域进行显示，并在所述主体会话者的视频图像所在的视频显示区域内添加预置的标识，以指示对应的用户为主体会话者。

与本申请实施例二提供的即时通信界面信息处理方法相对应，本申请实施例还提供了一种即时通信界面信息处理装置，参见图9，该装置可以包括：

监控单元901，用于在多用户视频会话中，监控各个用户的语音数据；

确定单元902，用于根据监控结果，确定当前的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

发送单元903，用于将所述当前的主体会话者身份标识以及数目发送到各个用户的客户端，以便所述各个用户的客户端根据所述主体会话者数目，确定会话窗口中各个视频显示区域的布局信息，并根据布局信息，对会话窗口中的各个视频进行显示，其中所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示。

具体实现时，所述发送单元903还可以用于：

当所述当前的主体会话者标识和/或数目发生变化时，将变化后的所述标识和/或数目信息发送到各个用户的客户端，以便客户端根据新接收到的所述标识和/或数目信息，重新对会话窗口中各个视频显示区域进行布局，并根据布局情况，将变化后的主体会话者的视频图像进行突出显示。

与本申请实施例三提供的即时通信界面信息处理方法相对应，本申请实施例还提供了一种即时通信界面信息处理装置，参见图10，该装置可以包括：

获取单元1001，用于从服务端获取当前的多用户视频会话中的主体会话者身份标识以及数目；所述主体会话者为正在发声的用户；

布局单元1002，用于根据所述主体会话者数目，确定对会话窗口中各个视频显示区域的布局信息，所述布局信息中包括按照第一显示方式对所述主体会话者的视频图像的信息进行显示；

突出显示单元1003，用于根据所述布局信息，对会话窗口中的各个视频进行显示。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上对本申请所提供的即时通信界面信息处理方法及装置，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种即时通信界面信息处理方法，其特征在于，包括：

根据所述布局信息，对会话窗口中的各个视频进行显示。

2.根据权利要求1所述的方法，其特征在于，所述监控各个用户的语音数据，包括：

监控当前所在终端设备的音频采集装置是否采集到第一预置长度阈值的连贯语音信号，如果是，则确定当前第一用户为主体会话者；

监控各第二用户客户端与该当前第一用户客户端之间建立的音频数据通道中是否接收到第一预置长度阈值的连贯语音信号，如果某第二用户客户端对应的音频数据通道中接收到第一预置长度阈值的连贯语音信号，则确定该第二用户为主体会话者。

3.根据权利要求1所述的方法，其特征在于，所述布局信息还包括：

4.根据权利要求1所述的方法，其特征在于，所述第一显示方式包括：如果所述主体会话者数目大于等于一、小于等于第二阈值，则在所述会话窗口的中间区域对所述主体会话者的视频图像进行显示；

所述根据所述布局信息，对会话窗口中的各个视频进行显示，包括：

在所述会话窗口的中间区域创建对应数目的视频显示区域；

将所述主体会话者的视频图像显示在所述中间区域的各个视频显示区域内。

5.根据权利要求4所述的方法，其特征在于，所述布局信息中还包括：按照第三显示方式对非主体会话者视频图像的信息进行显示，所述第三显示方式包括：在所述会话窗口的周边区域对非主体会话者视频图像的信息进行显示，且中间区域的视频显示区域的面积大于周边区域的视频显示区域的面积，所述根据所述布局信息，对会话窗口中的各个视频进行显示，还包括：

确定非主体会话者的数目；

在所述会话窗口的周边区域创建对应所述非主体会话者数目的视频显示区域；

将各个非主体会话者的视频图像显示在所述周边区域的视频显示区域。

6.根据权利要求4所述的方法，其特征在于，所述布局信息中还包括：

在所述中间区域的视频显示区域内添加预置的标识，以指示对应的用户为主体会话者。

7.根据权利要求1所述的方法，其特征在于，所述布局信息包括：

8.一种即时通信界面信息处理方法，其特征在于，包括：

在多用户视频会话中，监控各个用户的语音数据；

9.一种即时通信界面信息处理方法，其特征在于，包括：

根据所述布局信息，对会话窗口中的各个视频进行显示。

10.一种即时通信界面信息处理装置，其特征在于，包括：

11.一种即时通信界面信息处理装置，其特征在于，包括：

12.一种即时通信界面信息处理装置，其特征在于，包括：