CN106301811A

CN106301811A - 实现多媒体会议的方法及装置

Info

Publication number: CN106301811A
Application number: CN201510255577.1A
Authority: CN
Inventors: 应益峰
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2015-05-19
Filing date: 2015-05-19
Publication date: 2017-01-04
Also published as: WO2016184118A1

Abstract

本发明实施例公开了一种实现多媒体会议的方法及装置，由客户端获取本地与会者的发言语音信息，并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器，再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端，其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

Description

实现多媒体会议的方法及装置

技术领域

本发明涉及多媒体会议技术领域，更为具体地说，特别是涉及一种实现多媒体会议的方法及装置。

背景技术

多媒体会议是一种在网络上开展的融合语音、视频、数据于一体的会议，多媒体会议借助宽带接入网络，为用户提供语音、视频、数据、即时消息等远距离传输的多媒体业务，通过统一的Web门户，用户即可创建多媒体会议。

但是现有技术的多媒体会议中，会议发言人与其它与会者经常出现沟通不畅的情况，例如：当会议发言人与其它与会者的母语不同或者会议发言人带有方言时，常常发生其它与会者无法准确理解会议发言人的意思的情况；又如，在多媒体会议中，若其它与会者走神，错过会议发言人的部分发言，导致无法准确理解会议发言人的发言内容，大大降低了会议沟通的效果。

发明内容

本发明实施例中提供了一种实现多媒体会议的方法及装置，以解决现有技术的多媒体会议中与会者无法准确理解会议发言人的发言内容的问题。

为了解决上述技术问题，本发明实施例公开了如下技术方案：

第一方面，本发明提供一种实现多媒体会议的方法，包括：

客户端获取本地与会者的发言语音信息，并将所述发言语音信息发送给多媒体会议服务器；

所述客户端将所述发言语音信息转换成发言文字信息；

所述客户端将所述发言文字信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端；

其中，所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。

结合第一方面，在第一方面的第一种可能的实现方式中，所述客户端将所述发言语音信息转换为发言文字信息，包括：

接收多媒体会议服务器发送的发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID，所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出的前预设数量个与会者；

判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同；

如果所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同，利用语音识别引擎将采集到的发言语音信息转换成发言文字信息。

结合第一方面，在第一方面的第二种可能的实现方式中，所述客户端获取本地与会者的发言语音信息，包括：

所述客户端判断所述本地与会者是否具有发言权限；

如果所述本地与会者具有发言权限，则利用语音设备采集所述本地与会者的发言语音信息。

结合第一方面，在第一方面的第三种可能的实现方式中，所述客户端获取本地与会者的发言语音信息，包括：

所述客户端向多媒体会议服务器发送发言请求消息，所述发言请求消息携带所述本地与会者的用户ID，以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端；

当所述客户端接收到所述多媒体会议服务器发送的语音设备开启指令时，利用语音设备采集所述本地与会者的发言语音信息；所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。

第二方面，本发明提供一种实现多媒体会议的方法，包括：

多媒体会议服务器获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息，所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到；

所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息；

其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。

结合第二方面，在第二方面的第一种可能的实现方式中，还包括：

所述多媒体会议服务器检测客户端发送的语音信息的能量；

所述多媒体会议服务器按照所述能量由大到小的顺序确定前预设数量个与会者为发言人；

所述多媒体会议服务器向所述发言人对应的客户端发送发言通知消息，所述发言通知消息携带所述发言人的用户身份识别信息ID，以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。

结合第二方面，在第二方面的第二种可能的实现方式中，还包括：

所述多媒体会议服务器接收客户端发送的发言请求消息，所述发言请求消息携带所述客户端对应的与会者的用户ID；

所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端，以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限；

所述多媒体会议服务器接收所述主持人对应的客户端发送的发言响应消息，并根据发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令，以使具有发言权限的与会者采集发言语音信息；

其中，所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。

第三方面，本发明提供一种实现多媒体会议的方法，包括：

客户端获取本地与会者的发言语音信息；

所述客户端将所述发言语音信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息，以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端

第四方面，本发明提供一种实现多媒体会议的方法，包括：

多媒体会议服务器获取客户端发送的发言语音信息；

所述多媒体会议服务器将所述发言语音信息转换成发言文字信息；

所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息；

其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。

结合第四方面，在第四方面的第一种可能的实现方式中，所述多媒体会议服务器将所述发言语音信息转换成发言文字信息包括：

多媒体会议服务器检测客户端发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人；

利用语音识别引擎将确定出的发言人对应的客户端发送的发言语音信息转换为发言文字信息。

第五方面，本发明提供一种实现多媒体会议的装置，用于客户端，包括：

获取单元，用于获取本地与会者的发言语音信息；

转换单元，用于将所述发言语音信息转换成发言文字信息；

发送单元，用于将所述发言语音信息及所述发言文字信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端；

结合第五方面，在第五方面的第一种可能的实现方式中，所述获取单元包括：

第一判断子单元，用于判断所述本地与会者是否具有发言权限；

第一采集子单元，用于当所述第一判断单元判定所述本地与会者具有发言权限时，则利用语音设备采集所述本地与会者的发言语音信息。

结合第五方面，在第五方面的第二种可能的实现方式中，所述转换单元包括：

第一接收子单元，用于接收多媒体会议服务器发送的发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID，所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出的前预设数量个与会者；

第二判断子单元，用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同；

第二采集子单元，用于当所述第二判断子单元判定所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同时，利用语音设备采集所述本地与会者的发言语音信息。

结合第五方面，在第五方面的第三种可能的实现方式中，所述获取单元具体包括：

第一发送子单元，用于向多媒体会议服务器发送发言请求消息，所述发言请求消息携带所述本地与会者的用户ID，以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端；

第二接收子单元，用于接收所述多媒体会议服务器发送的语音设备开启指令，

第三采集子单元，用于当所述第二接收子单元接收到所述语音设备开启指令时，利用语音设备采集所述本地与会者的发言语音信息；所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。

第六方面，本发明提供一种实现多媒体会议的装置，用于多媒体会议服务器端，包括：

获取单元，用于获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息，所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到；

第一发送单元，用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息；

结合第六方面，在第六方面的第一种可能的实现方式中，还包括：

检测单元，用于检测客户端发送的语音信息的能量；

确定单元，用于按照所述能量由大到小的顺序确定前预设数量个与会者为发言人；

第二发送单元，用于向所述发言人对应的客户端发送发言通知消息，所述发言通知消息携带所述发言人的用户身份识别信息ID，以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。

结合第六方面，在第六方面的第二种可能的实现方式中，还包括：

第一接收单元，用于接收客户端发送的发言请求消息，所述发言请求消息携带所述客户端对应的与会者的用户ID；

第三发送单元，用于将所述发言请求消息发送给主持人对应的客户端，以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限；

第二接收单元，用于接收所述主持人对应的客户端发送的发言响应消息；所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生；

第四发送单元，用于根据所述发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令。

第七方面，本发明提供一种实现多媒体会议的装置，应用于客户端，包括：

获取单元，用于获取本地与会者的发言语音信息；

发送单元，用于将所述发言语音信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息，以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端

第八方面，本发明提供一种实现多媒体会议的装置，应用于多媒体服务器中，包括：

获取单元，用于获取客户端发送的发言语音信息；

转换单元，用于将所述发言语音信息转换成发言文字信息；

发送单元，用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息；

结合第八方面，在第八方面的第一种可能的实现方式中，所述转换单元包括：

检测子单元，用于检测客户端发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人；

转换子单元，用于利用语音识别引擎将确定出的发言人发送的发言语音信息转换为发言文字信息。

第九方面，提供一种实现多媒体会议系统，包括：客户端和多媒体会议服务器；

所述客户端，用于获取本地与会者的发言语音信息并发送给多媒体会议服务器；以及将所述发言语音信息转换成发言文字信息，并将所述发言文字信息发送给多媒体会议服务器；

所述多媒体会议服务器，用于将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端；

结合第九方面，在第九方面的第一种可能的实现方式中，所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，并向发言人对应的客户端发送发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID；

所述客户端，用于接收多媒体会议服务器发送的发言通知消息，并根据所述发言通知信息确定本地与会者是发言人时，获取本地与会者的发言语音信息并发送给所述多媒体会议服务器，以及将所述发言语音信息转换成发言文字信息，并将所述发言文字信息发送给所述多媒体会议服务器。

第十方面，本发明还提供了一种实现多媒体会议系统，包括：客户端和多媒体会议服务器；

所述客户端，用于获取本地与会者的发言语音信息，并发送给多媒体会议服务器；

所述多媒体会议服务器，用于将所述发言语音信息转换成发言文字信息，并将所述发言语音信息及与所述发言语音信息对应的发言文字信息发送给其它与会者对应的客户端；其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者；

所述其它与会者对应的客户端，还用于向用户展示所述多媒体会议服务器发送的发言语音信息及发言文字信息。

结合第十方面，在第十方面的第一种可能的实现方式中，所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，当接收到的发言语音信息来自确定出的发言人时，将所述发言语音信息转换成发言文字信息。

由以上技术方案可见，本发明实施例提供的实现多媒体会议的方案，发言人的客户端能够将发言人的发言语音信息转换为发言文字信息，并通过多媒体会议服务器将该发言文字信息转发给参加多媒体会议的与会者中除发言人之外的其它与会者对应的客户端，以便在所述其它与会者对应的客户端上显示发言人的发言信息，避免了与会者只能够接收发言语音信息，导致与会者无法准确了解发言人的发言内容的情况，从而提高了会议沟通的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例示出的一种多媒体会议的框图；

图2是本发明实施例示出的一种实现多媒体会议的方法流程图；

图3是本发明实施例示出的再一种实现多媒体会议的方法流程图；

图4是本发明实施例示出的另一种实现多媒体会议的方法流程图；

图5是本发明实施例示出的又一种实现多媒体会议的方法流程图；

图6是本发明实施例示出的另一种实现多媒体会议的方法流程图；

图7是本发明实施例的另一种实现多媒体会议的方法的流程图；

图8是本发明实施例示出的一种实现多媒体会议的装置结构示意图；

图9是本发明实施例示出的另一种实现多媒体会议的装置结构示意图；

图10是本发明实施例示出的一种获取单元的结构示意图；

图11是本发明实施例示出的一种转换单元的结构示意图；

图12是本发明实施例示出的又一种获取单元的结构示意图；

图13是本发明实施例示出的又一种实现多媒体会议装置结构示意图；

图14是本发明实施例示出的另一种实现多媒体会议的装置结构示意图；

图15是本发明实施例示出的再一种实现多媒体会议的装置结构示意图；

图16是本发明实施例示出的一种应用于客户端的实现多媒体会议的装置的结构示意图；

图17是本发明实施例示出的一种应用于多媒体会议服务器的实现多媒体会议的装置的结构示意图；

图18是本发明实施例示出的一种实现多媒体会议的客户端的结构示意图；

图19是本发明实施例示出的一种多媒体会议服务器的结构示意图；

图20是本发明实施例示出的另一种多媒体会议服务器的结构示意图；

图21是本发明实施例示出的另一种实现多媒体会议的客户端的结构示意图；

图22是本发明实施例示出的另一种多媒体会议服务器的结构示意图。

具体实施方式

本发明实施例所提供的多媒体会议的方案，解决了背景技术中所介绍的与会者无法准确了解发言人的发言信息，导致降低会议沟通的问题。

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都应当属于本发明保护的范围。

以上是本发明的核心思想，为了使本技术领域的人员更好地理解本发明方案，下面结合附图对本发明作进一步的详细说明。

为了使本技术领域的人员更好地理解本发明实施例中的技术方案，并使本发明实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例中技术方案作进一步详细的说明。

图1是对媒体会议系统的框图，如图1所示，该多媒体会议系统包括多个客户端1和至少一个多媒体会议服务器2。其中，客户端可以是个人PC机、笔记本电脑等终端。

客户端获取与会者的媒体流信息(例如，语音信息)，并将媒体流信息上传至多媒体会议服务器2，由多媒体会议服务器2将各个客户端发送的媒体流进行混音处理后发送给各个终端，从而使在地理上分散的用户通过图形、声音等方式进行交流。

图2是本发明实施例示出的一种实现多媒体会议的方法的流程图，该方法应用于图1所示的客户端中，如图2所示，该方法包括如下步骤：

S110，客户端获取本地与会者的发言语音信息，并将所述发言语音信息发送给多媒体会议服务器。

本地与会者是指与客户端处于同一地理空间的与会者。例如，与会者A使用客户端a参加多媒体会议，对于客户端a而言，与会者A即与客户端a对应的本地与会者。

客户端可以使用语音设备获取本地与会者的发言语音信息。该语音设备可以包括集成于客户端上的语音信息采集硬件和控制该语音信息采集硬件的操作软件。其中，所述语音信息采集硬件能够实现语音采集、语音编码及语音解码等功能，例如，MIC。所述操作软件可以查询本地语音信息采集硬件的数量和名称，还可以开启、关闭或者静音该语音采集硬件。

本实施例适用于讨论式会议应用场景，每个与会者都可以发言，这样，每个客户端都能够获得与自身对应的与会者的发言语音信息。如果客户端通过语音设备获取与会者的发言语音信息，则每个与会者对应的语音设备都处于开启状态。

S120，客户端将发言语音信息转换成发言文字信息。

客户端利用语音识别技术将获得的本地发言人的发言语音信息转换成发言文字信息。客户端获得的本地与会者的发言语音信息能量相对较强，因此由发言人对应的客户端将发言语音信息转换发言文字信息的准确率较高。同时，此种方式不需要其它与会者对应的客户端将发言人的发言语音信息转换为发言文字信息，节省了其它与会者对应的客户端的资源。

可选地，发言人对应的客户端还可以存储发言文字信息，以便利用所述发言文字信息生成会议纪要。同理，参加多媒体会议的其它与会者对应的客户端也可以存储接收到的发言文字信息，以便根据所述发言文字信息生成会议纪要。此外，发言人对应的客户端也可以显示所述发言文字信息，从而方便发言人查看自己的发言内容。

S130，客户端将所述发言文字信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。

所述其它与会者是参加多媒体会议的全部与会者中除发言人之外的其它与会者。

多媒体会议服务器将接收到发言语音信息及发言文字信息发送给参加本次多媒体会议的其它与会者对应的客户端。其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息，从而有助于与会者快速理解发言人的发言内容。

例如，参加本地多媒体会议的与会者包括A、B、C、D和E，其中，与会者A是发言人，则与会者B、C、D、E是其它与会者。多媒体会议服务器将与会者A的发言语音信息和发言文字信息发送给B、C、D、E。

可以在客户端和多媒体会议服务器上都集成T.120协议标准，从而在客户端和多媒体会议服务器之间实现发言语音信息及发言文字信息的收发功能。其中，T.120标准包括T.120-T.127等一系列协议，该协议标准能够实现客户端之间以及客户端与多媒体会议服务器之间的信息传输的可靠性，同时，能够提供点到多点的数据分发服务，并选择传输效率最佳的传输路径传输数据。

本实施例示出的实现多媒体会议的方法，由客户端获取本地与会者的发言语音信息，并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器，再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端，其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

在一种应用场景中，所有与会者都允许发言，例如，讨论式会议。但是，如果将所有与会者发出的语音信息都转换成相应的文字信息，将会造成很多与会议无关的语音转换成文字，并造成很多与会议无关的文字显示给与会者，对与会者造成干扰。鉴于上述应用场景，可以将语音能量较大的与会者确定为发言人，并将发言人的发言语音信息转换成发言文字信息，其它语音能量较小的与会者的语音内容被忽略。

图3是本发明实施例示出的另一种实现多媒体会议方法的流程图，该实施例适用于与会者人数较多，与会者均能发言的应用场景。如图3所示，该方法可以包括以下步骤：

S210，多媒体会议服务器检测客户端发送的语音信息的能量。

参加多媒体会议的客户端将获得的与会者的语音信息发送给多媒体会议服务器，由多媒体会议服务器检测接收到的语音信息的能量。

本实施例中，检测语音信息的能量可以由多媒体会议服务器中的语音会议桥实现。所述语音会议桥用于提供服务器侧的语音会场，将各发言人的语音混音后送给每个与会者。

S220，多媒体会议服务器按照语音信息的能量由大到小的顺序，确定前预设数量个与会者为发言人。

多媒体会议服务器通过检测参加多媒体会议的与会者发送的语音信息的能量，按照能量由大到小进行排序并依次确定出前预设数量个与会者为发言人。例如，所述预设数量可以是一个，即将语音信息的能量最大的与会者确定为发言人；或者，所述预设数量可以是两个，即将语音信息的能量最大的两个与会者确定为发言人。

需要说明的是，此种应用场景下，如果发言人在不同时刻发出语音的能量不同，多媒体会议服务器根据语音信息的能量确定出的发言人可能不同。

S230，多媒体会议服务器向参加多媒体会议的与会者发送发言通知消息，所述发言通知消息携带发言人的用户ID(Identification，身份标识)。

其中，多媒体会议服务器可以通过广播的形式将发言通知消息发送给所有参加多媒体会议的与会者的客户端，并由与会者的客户端根据发言通知消息中的用户ID判断本客户端所对应的与会者是否为发言人；也可以将发言通知消息一对一发送给该用户ID所对应的与会者的客户端，由其来根据用户ID进行判断。

与会者的客户端接收多媒体会议服务器的发言通知消息，由于该发言通知消息中含有用户ID,与会者的客户端可将该用户ID与自身的用户ID进行比较，从而判断自身客户端所对应的与会者是否是发言人。

S240，当客户端确定所述发言通知消息所携带的用户ID与自身的用户ID相同时，确定本地与会者为发言人。

S250，发言人对应的客户端获取发言人的发言语音信息，并将该发言语音信息发送给多媒体会议服务器。

S260，发言人对应的客户端将所述发言语音信息转换为发言文字信息。

S270，发言人对应的客户端将所述发言文字信息发送给多媒体会议服务器。

S280，多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端。

S290，所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。

本实施例提供的实现多媒体会议的方法，多媒体会议服务器检测各个与会者发出语音信息的能量，并按照能量由大到小的顺序，确定前预设数量个与会者为发言人，即只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字，导致很多与会议无关的文字显示给与会者，对与会者造成的干扰现象出现。

在另一种应用场景中，只需要主持人和主讲人的发言内容转换成对应的文字信息，忽略其它与会者的发言内容。

图4是本发明实施例示出的另一种实现多媒体会议的方法流程图。本实施例中，只将具有发言权限的发言人的发言内容转换成文字信息。如图4所示，该方法包括以下步骤：

S310，客户端判断本地与会者是否具有发言权限；如果所述本地与会者具有发言权限，则执行S320；否则，结束本次流程。

在会议具有主持人和固定的主讲人的应用场景中，通常主讲人和主持人具有发言权限。判断与会者是否具有发言权限可以包括判断与会者的身份属性是否具有主讲人权限或主持人权限。

S320，客户端获取本地与会者的发言语音信息，并将该发言语音信息发送给多媒体会议服务器。

S330，客户端将所述发言语音信息转换为发言文字信息。

其中，客户端可以内置语音识别引擎，客户端利用语音识别引擎将本地与会者的发言语音信息转换为发言文字信息。

S340，客户端将发言文字信息发送给多媒体会议服务器。

客户端可以在获得本地与会者的发言语音信息后，就立即将所述发言语音信息发送给多媒体会议服务器，以使多媒体会议服务器及时将发言人的发言语音信息转发给其它与会者，保证语音信息传输的实时性。当然，如果发言语音信息转换成发言文字信息所需时间很短，一般在毫秒级，则可以将发言语音信息和发言文字信息一起发送给多媒体会议服务器，从而使其它与会者对应的客户端接播放发言语音信息和显示的发言文字信息同步进行。

S350，多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。

S360，其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。

本实施例提供的实现多媒体会议的方法，只将具有发言权限的与会者的发言语音信息转换成发言文字信息，而不是将所有与会者的发言内容转换成对应的文字信息。利用该方法能够避免将多媒体会议中与会者发出的与会议无关的语音内容转换成相应的文字信息转发给其它与会者，进而避免其它与会者的客户端显示过多不重要的文字信息对与会者造成干扰的现象发生。

在又一种应用场景中，只有主持人和主讲人能够发言，其它与会者不能发言，其它与会者的语音设备被关闭，且与会者自己不能开启语音设备。当与会者需要发言时，与会者可以请求主持人开启该与会者的语音设备。

图5是本发明实施例示出的又一种实现多媒体会议的方法流程图。该方法应用于主持人指定发言人的应用场景，该方法包括以下步骤：

S410，客户端向多媒体会议服务器发送发言请求消息，所述发言请求消息携带所述客户端对应与会者的用户身份识别ID。

除主持人和主讲人之外的其它与会者需要发言时，由该与会者对应的客户端向多媒体会议服务器发送发言请求消息。所述发言请求消息携带该与会者的用户ID。

S420，多媒体会议服务器将该发言请求消息转发给主持人所对应的客户端。

S430，主持人对应的客户端根据发言请求消息确定允许所述与会者发言时，向多媒体会议服务器发送发言响应消息。

主持人对应的客户端接收到所述发言请求消息后，根据发言请求消息携带的用户ID判断是否允许该与会者发言，如果允许该与会者发言，则产生发言响应消息并发送给多媒体会议服务器。该发言响应消息中也可以携带该与会者的用户ID，以方便多媒体会议服务器识别该与会者。

其中，主持人对应的客户端可以根据预先设定的与会者的身份属性判断是否允许与会者发言。

S440，多媒体会议服务器根据所述发言响应消息，生成语音设备开启指令，并向发言人对应的客户端发送所述语音设备开启指令。

多媒体会议服务器根据接收到发言响应消息生成语音设备开启指令，该语音设备开启指令用于控制主持人允许发言的与会者对应的语音设备开启。

S450，当发言人对应的客户端接收到所述语音设备开启指令时，利用语音设备获取发言人的发言语音信息，并将该发言语音信息发送给多媒体会议服务器。

S460，发言人对应的客户端将所述发言语音信息转换成发言文字信息。

S470，发言人对应的客户端将发言文字信息发送给多媒体会议服务器。

S480，多媒体会议服务器将所述发言语音信息和发言文字信息发送给除发言人之外的其它与会者对应的客户端。

S490，所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。

本实施例提供的实现多媒体会议的方法，除主持人或主讲人之外的其它与会者需要发言时，向主持人的客户端发送发言请求消息，由主持人根据所述发言请求消息判断是否允许所述与会者发言，若允许所述与会者发言，则向多媒体会议服务器发送允许所述与会者发言的发言响应消息，多媒体会议服务器根据该发言响应消息产生语音设备开启指令，控制所述与会者对应的语音设备开启。由该与会者对应的语音设备获取该与会者的发言语音信息，由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该方法适用于正式会议或级别较高的会议场景，扩大了多媒体会议实现方法的适用范围。

图6是本发明实施例示出的另一种实现多媒体会议的方法流程图，如图6所示，该方法包括以下步骤：

S510，客户端获取本地与会者的发言语音信息，并将该发言语音信息发送给多媒体会议服务器。

客户端利用语音设备采集与会者的发言语音信息。

S520，多媒体会议服务器将所述发言语音信息转换为发言文字信息。

多媒体会议服务器在将各个与会者发送的语音信息进行混音之前，将接收到的发言语音信息利用语音识别引擎转换为发言文字信息。

在本发明的一个实施例中，全部参加多媒体会议的与会者可以自由发言，任意一个与会者都能够将获得的本地与会者的发言语音信息发送给多媒体会议服务器。相应地，多媒体会议服务器可以将任意一个与会者的发言文字信息转换成发言文字信息。

在本发明的另一个实施例中，只有主持人和主讲人可以发言，只有主持人和主讲人可以将获得的发言语音信息发送给多媒体会议服务器。多媒体会议服务器将接收到的发言语音信息转换成发言文字信息。

S530，多媒体会议服务器将所述发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者的客户端。所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。

S540，所述其它与会者的客户端展示所述发言语音信息及对应的发言文字信息。

本实施例提供的实现多媒体会议的方法，与会者的客户端获得发言语音信息后发送给多媒体会议服务器，由多媒体会议服务器将发言语音信息转换成发言文字信息，然后，再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样，参加多媒体会议的与会者既能够听到发言人的发言语音信息，又能够看到相应的发言文字信息，能够准确理解发言人的发言内容，提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息，不需要在各个客户端上集成语音识别引擎，降低了客户端的生产成本。

图7是本发明实施例的另一种实现多媒体会议的方法的流程图，本实施例根据与会者法语音信息的能量大小，确定能量最大的预设数量个与会者为发言人，并将发言人的发言语音信息转换成发言文字信息。如图7所示，该方法可以包括以下步骤：

S610，多媒体会议服务器检测客户端发送的语音信息的能量。

S620，多媒体会议服务器按照语音信息的能量由大到小的顺序，确定前预设数量个与会者为发言人。

S630，客户端获取本地与会者的发言语音信息并将该发言语音信息发送给多媒体会议服务器。

S640，多媒体会议服务器将确定出的发言人对应的客户端发送的发言语音信息转换为发言文字信息。

S650，多媒体会议服务器将发言人对应的客户端发送的发言语音信息及对应的发言文字信息，发送给参加多媒体会议的其它与会者的客户端。

所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。

S660，其它与会者的客户端展示接收到的发言语音信息和对应的发言文字信息。

本实施例提供的实现多媒体会议的方法，多媒体会议服务器检测各个与会者发出语音信息的能量，并按照能量由大到小的顺序，确定前预设数量个与会者为发言人。多媒体会议服务器只将确定出的发言人的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字，导致很多与会议无关的文字显示给与会者，对与会者造成的干扰现象出现。

图8是本发明实施例示出的一种实现多媒体会议的装置结构示意图，如图8所示，该实现多媒体会议的装置，用于客户端，包括：获取单元110、转换单元120和发送单元130。

获取单元110，用于获取本地的发言语音信息。

本地与会者是指与客户端处于同一地理空间的与会者，例如，与会者A使用客户端a参加多媒体会议，对于客户端a而言，与会者A即与客户端a对应的本地与会者。

所述获取单元110可以使用语音设备获取本地与会者的发言语音信息。该语音设备可以包括集成于客户端上的语音信息采集硬件和控制该语音信息采集硬件的操作软件。其中，所述语音信息采集硬件能够实现语音采集、语音编码及语音解码等功能。所述操作软件可以查询本地语音信息采集硬件的数量和名称，还可以开启、关闭或者静音该语音采集硬件。

本实施例中的实现多媒体的装置可以适用于讨论式会议应用场景，每个与会者都可以发言，这样，每个客户端都能够获得与自身对应的与会者的发言语音信息。如果客户端通过语音设备获取与会者的发言语音信息，则每个与会者对应的语音设备都处于开启状态。

转换单元120，用于将发言语音信息转换成发言文字信息。

其中，转换单元120利用语音识别技术将获取的本地发言人的发言语音信息转换为发言文字信息。

客户端获得的本地与会者的发言语音信息能量相对较强，因此由发言人对应的客户端将发言语音信息转换发言文字信息的准确率较高。同时，此种方式不需要其它与会者对应的客户端将发言人的发言语音信息转换发言文字信息，节省了其它与会者对应的客户端的资源。

发送单元130，用于将发言语音信息及发言文字信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。

其中，所述其它与会者是参加多媒体会议的全部与会者中除发言人之外的其它与会者。

客户端将发言语音信息及发言文字信息发送多媒体会议服务器，以使多媒体会议服务器将其发送给参加本次多媒体会议的其它与会者对应的客户端，最终使得其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息，从而有助于与会者快速理解发言人的发言内容。

该实施例示出的实现多媒体会议的装置，由获取单元获取本地与会者的发言语音信息，并通过转换单元将发言语音信息转换为发言文字信息。然后通过发送单元将发言语音信息及发言文字信息发送给多媒体会议服务器，再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端，其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

图9是本发明实施例另一种实现多媒体会议的装置的结构示意图，该装置在图8所示实施例的基础上还可以包括：显示单元140和存储单元150。

显示单元140，用于显示发言文字信息。

存储单元150，用于存储所述发言文字信息。

可选地，通过增加存储单元150，发言人对应的客户端还可以存储发言文字信息，以便利用所述发言文字信息生成会议纪要。同理，参加多媒体会议的其它与会者对应的客户端也可以存储接收到的发言文字信息，以便根据所述发言文字信息生成会议纪要。此外，发言人对应的客户端也可以显示所述发言文字信息，从而方便发言人查看自己的发言内容。

在一种应用场景中，只需要主持人和主讲人的发言内容转换成对应的文字信息，忽略其它与会者的发言内容。

图10是本发明实施例示出的一种获取单元110的结构示意图，该实现多获取单元110适用于只需要主持人或者主讲人的发言内容转换成对应的文字信息，忽略其它与会者的发言内容的应用场景。如图8所示，该获取单元110可以包括第一判断子单元1101和第一采集子单元1102：

第一判断子单元1101，用于当本地客户端对应的与会者需要发言时，判断所述与会者是否具有发言权限。

在会议具有主持人和固定的主讲人的应用场景中，通常只有主讲人和主持人具有发言权限。判断与会者是否具有发言权限可以包括判断与会者的身份属性是否具有主讲人权限或主持人权限。

第一采集子单元1102，用于当所述第一判断单元1101判定所述本地与会者自身具有发言权限具有主讲人权限或主持人权限时，利用语音设备采集发言语音信息。

本实施例提供的实现多媒体会议的装置中，只将具有发言权限的与会者的发言语音信息转换成发言文字信息，而不是将所有与会者的发言内容转换成对应的文字信息。利用该装置能够避免将多媒体会议中与会者发出的与会议无关的语音内容转换成相应的文字信息转发给其它与会者，进而避免其它与会者的客户端显示过多不重要的文字信息对与会者造成干扰的现象发生。

在另一种应用场景中，所有与会者都允许发言，例如，讨论式会议。但是，如果将所有与会者发出的语音信息都转换成相应的文字信息，将会造成很多与会议无关的语音转换成文字，并造成很多与会议无关的文字显示给与会者，对与会者造成干扰。鉴于上述应用场景，可以将语音能量较大的与会者确定为发言人，并将发言人的发言语音信息转换成发言文字信息，其它语音能量较小的与会者的语音内容被忽略。

图11是本发明实施例示出的一种转换单元120的结构示意图，该转换单元120适用于与会人数较多，与会者均能够发言的应用场景。如图11所示，该转换单元120可以包括第一接收子单元1201、第二判断子单元1202和第二采集子单元1203：

第一接收子单元1201，用于接收多媒体会议服务器发送的发言通知消息，由于该发言通知消息携带发言人的用户身份识别信息ID，所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出的前预设数量个与会者，与会者的客户端可将该用户ID与自身的用户ID进行比较，从而判断自身客户端所对应的与会者是否是发言人。

第二判断子单元1202，用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同。

第二采集子单元1203，用于当所述第二判断子单元1202判定所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同时，利用语音设备采集所述本地与会者的发言语音信息。

本实施例中，通过转换单元120中的第一接收子单元接收多媒体会议服务器发送的发言通知消息，由于该发言通知消息携带发言人的用户身份标识信息ID，所述发言人可由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量，按照由大到小的顺序依次确定的前设数量个与会者，即客户端只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。能够避免将很多与会议无关的语音转换成文字，导致很多与会议无关的文字显示给与会者，对与会者造成的干扰现象出现。

图12是本发明实施例示出的又一种获取单元110的结构示意图。该获取单元110应用于主持人指定发言人的应用场景，如图12所示，所述获取单元110包括：第一发送子单元1103、第二接收子单元1104和第三采集子单元1105。

第一发送子单元1103，用于向多媒体会议服务器发送发言请求消息，所述发言请求消息携带所述本地与会者的用户ID，以使所述多媒体会议服务器将所述发言请求消息发送给主持人。

第二接收子单元1104，用于接收所述多媒体会议服务器发送的语音设备开启指令，

该语音设备开启指令由所述多媒体会议服务器在接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生，具体地，主持人对应的客户端接收到所述发言请求消息后，根据发言请求消息携带的用户ID判断是否允许该与会者发言，如果允许该与会者发言，则主持人人对应的客户端将产生发言响应消息并发送给多媒体会议服务器。该发言响应消息中也可以携带该与会者的用户ID，以方便多媒体会议服务器识别该与会者。

第三采集子单元1105，用于当所述第二接收子单元1104接收到所述语音设备开启指令时，利用语音设备采集所述本地与会者的发言语音信息。

本实施例提供的获取单元，除主持人或主讲人之外的其它与会者需要发言时，通过多媒体会议服务器向主持人的客户端转发言请求消息，由主持人根据所述发言请求消息判断是否允许所述与会者发言，若被允许所述与会者发言，则主持人的客户端向多媒体会议服务器发送允许所述与会者发言的发言响应消息，以使多媒体会议服务器根据该发言响应消息产生语音设备开启指令，控制所述与会者对应的语音设备开启。由该与会者对应的语音设备获取该与会者的发言语音信息，由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该装置适用于正式会议或级别较高的会议场景，扩大了多媒体会议实现方法的适用范围。

图13是本发明实施例示出的又一种实现多媒体会议的装置结构示意图，如图13所示，该实现多媒体会议的装置，用于多媒体会议服务器，如图13所示，该装置包括获取单元210和第一发送单元220。

获取单元210，用于获取客户端发送的发言语音信息及发言文字信息。

第一发送单元220，用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息；其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。

本实施例示出的应用于多媒体会议服务器的实现多媒体会议的装置，客户端获取本地与会者的发言语音信息并发送给多媒体会议服务器；然后，由多媒体会议服务器将发言语音信息及发言文字信息转发给参加多媒体会议的其它与会者对应的客户端，以使所述其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

在一种应用场景中，所有与会者都允许发言，例如，讨论式会议。但是，如果多媒体会议服务器将所有与会者发出的语音信息和文字信息都发送给其它与会者，将会造成很多与会议无关的语音转换成文字，并造成很多与会议无关的文字显示给与会者，对与会者造成干扰。鉴于上述应用场景，可以将语音能量较大的与会者确定为发言人，并将发言人的发言语音信息转换成发言文字信息，其它语音能量较小的与会者的语音内容被忽略。

图14是本发明实施例示出的另一种实现多媒体会议的装置的结构示意图，该实施例适用于与会者人数较多且与会者均能发言的应用场景，该装置在图13所示的实施例的基础上还可以包括检测单元230、确定单元240和第二发送单元250。

检测单元230，用于检测客户端发送的语音信息的能量。

多媒体会议服务器将接收参加多媒体会议的与会者的客户端获得的该与会者的语音信息，由多媒体会议服务器检测接收到的语音信息的能量。

确定单元240，用于按照所述能量由大到小的顺序确定前预设数量个与会者为发言人。

多媒体会议服务器通过检测参加多媒体会议的与会者发送的语音信息的能量，按照能量由大到小进行排序并依次确定出预设数量个与会者为发言人。例如，所述预设数量可以是一个，即将语音信息的能量最大的与会者确定为发言人；或者，所述预设数量可以是两个，即将语音信息的能量最大的两个与会者确定为发言人。

第二发送单元250，用于向所述发言人对应的客户端发送发言通知消息，所述发言通知消息携带所述发言人的用户身份识别信息ID，以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。

其中，多媒体会议服务器可以通过广播的形式将发言通知消息发送给所有参加多媒体会议的与会者的客户端，并由与会者的客户端根据发言通知消息中的用户ID判断本客户端所对应的与会者是否为发言人；也可以将发言通知消息一对一发送给该用户ID所对应的与会者的客户端，由客户端根据用户ID判断自身是否是发言人。

与会者的客户端接收多媒体会议服务器的发言通知消息，由于该发言通知消息中含有用户ID,与会者的客户端可将该用户ID与自身的用户ID进行比较，从而判断客户端所对应的与会者是否是发言人。

本实施例提供的实现多媒体会议的装置，多媒体会议服务器检测各个与会者发出语音信息的能量，并按照能量由大到小的顺序，确定前预设数量个与会者为发言人，即只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。该装置能够避免让很多客户端产生的与会议无关的语音转换成文字，导致很多与会议无关的文字显示给与会者，对与会者造成的干扰现象出现。

图15是本发明实施例示出的又一种实现多媒体会议的装置的结构示意图。该实现多媒体会议的装置应用于主持人指定发言人的应用场景，该装置在图13中所示的实施例的基础上还可以包括：第一接收单元260、第三发送单元270、第二接收单元280和第四发送单元290。

第一接收单元260，用于接收客户端发送的发言请求消息，所述发言请求消息携带所述客户端对应的与会者的用户ID。

第三发送单元270，用于将所述发言请求消息发送给主持人对应的客户端，以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限。

第二接收单元280，用于接收所述主持人对应的客户端发送的发言响应消息。

主持人对应的客户端接收到所述发言请求消息后，根据发言请求消息携带的用户ID判断是否允许该与会者发言。如果允许该与会者发言，则产生发言响应消息，多媒体会议服务器将接收到该与会者的发言响应消息。该发言响应消息中也可以携带该与会者的用户ID，以方便多媒体会议服务器识别该与会者。

其中，主持人对应的客户端可以根据预先设定的与会者的身份属性判断是否允许与会者发言。例如，在建立多媒体会议时，主持人就可以根据与会者的与会身份判断该与会者是否能够发言，例如，会议的主讲人允许发言。

第四发送单元290，用于向具有发言权限的与会者对应的客户端发送语音设备开启指令，所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。

本实施例提供的实现多媒体会议的装置，除主持人或主讲人之外的其它与会者需要发言时，多媒体会议服务器将向主持人的客户端转发所述其它与会者的发言请求消息，由主持人根据所述发言请求消息判断是否允许所述与会者发言，若允许所述与会者发言，则多媒体会议服务器将接收到主持人客户端发送的允许所述与会者发言的发言响应消息，多媒体会议服务器根据该发言响应消息产生语音设备开启指令，控制所述与会者对应的语音设备开启。开启后，该与会者对应的语音设备获取该与会者的发言语音信息，由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该方法适用于正式会议或级别较高的会议场景，扩大了多媒体会议实现方法的适用范围。

相应于上述的图6～图7所示的实现多媒体会议的方法实施例，本发明还提供了相应的装置实施例。

图16是本发明实施例示出的一种应用于客户端的实现多媒体会议的装置的结构示意图，该装置包括：获取单元310和发送单元320。

获取单元310，用于获取本地与会者的发言语音信息。

发送单元320，用于将所述发言语音信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息，以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端

本实施例提供的实现多媒体会议的装置，与会者的客户端获得发言语音信息后发送给多媒体会议服务器，由多媒体会议服务器将发言语音信息转换成发言文字信息，然后，再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样，参加多媒体会议的与会者既能够听到发言人的发言语音信息，又能够看到相应的发言文字信息，能够准确理解发言人的发言内容，提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息，不需要在各个客户端上集成语音识别引擎，降低了客户端的生产成本。

图17是本发明实施例示出的一种应用于多媒体会议服务器的实现多媒体会议的装置的结构示意图，该装置包括：获取单元410、转换单元420和发送单元430。

获取单元410，用于获取客户端发送的发言语音信息。

转换单元420，用于将所述发言语音信息转换成发言文字信息。

在本发明一个实施例中，多媒体会议服务器根据与会者法语音信息的能量大小，确定能量最大的预设数量个与会者为发言人，并将接收到的发言人的发言语音信息转换成发言文字信息。该转换单元420可以包括检测子单元和转换子单元。

所述检测子单元，用于检测客户端发送的语音信息的能量，按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人；所述转换子单元，用于利用语音识别引擎将确定出的发言人发送的发言语音信息转换为发言文字信息。

发送单元430，用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。

本实施例提供的实现多媒体会议的装置，多媒体会议服务器检测各个与会者发出语音信息的能量，并按照能量由大到小的顺序，确定前预设数量个与会者为发言人。多媒体会议服务器只将确定出的发言人的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字，导致很多与会议无关的文字显示给与会者，对与会者造成的干扰现象出现。

相应于图8～图12所示的应用于客户端的实现多媒体会议的装置，本发明实施例还提供了一种实现多媒体会议的客户端，请参见图18，所述客户端包括：处理器1411、发送器1412和存储器1413；

存储器1413内存储有处理器1411能够执行的操作指令，处理器1411读取存储器1413内的操作指令用于实现以下功能：获取本地与会者的发言语音信息，并将发言语音信息转换为发言文字信息。

在本发明的实施例中，可以通过语音设备采集与会者的音频信号进行相应的处理后提供给处理器1411，例如，所述语音设备可以是MIC。

在本发明的一个实施例中，处理器1411具体用于：判断本地与会者是否具有发言权限；如果所述本地与会者具有发言权限，则采集所述本地与会者的发言语音信息。

所述发送器1412用于将所述发言语音信息及所述发言文字信息发送给多媒体会议服务器；以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者对应的客户端，其中所述其它与会者为参加多媒体会议的全部与会者中除发言人外的其它与会者。

在本发明的一个实施例中，多媒体会议服务器根据与会者法语音信息的能量大小，确定能量最大的预设数量个与会者为发言人，再由客户端将发言人的发言语音信息转换成发言文字信息。本实施例中，实现多媒体会议的客户端还可以包括接收器。

所述接收器，用于接收多媒体会议服务器发送的发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID，所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量，按照所述能量有道到小的顺序依次确定出的前设数量个与会者；

所述处理器1411，还用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同，如果所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同，确定本地与会者为发言人，然后获取本地与会者的发言语音信息。

在本发明的又一个实施例中，只有主持人和主讲人能够发言，其它与会者不能发言，其它与会者的语音设备被关闭，且与会者自己不能开启语音设备。当与会者需要发言时，与会者可以请求主持人开启该与会者的语音设备。

所述发送器1412还用于向多媒体会议服务器发送发言请求消息，所述发言请求消息携带所述本地与会者的用户ID，以使多媒体会议服务器将所述发言请求消息发送给主持人。

所述接收器，还用于在接收到多媒体会议服务器发送的语音设备开启指令，并将语音设备开启指令提供给语音设备，以使语音设备采集本地与会者的发言语音信息，所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。

在本发明的另一个实施例中，所述实现多媒体会议的客户端还可以包括显示器。该显示器，用于显示所述发言文字信息。所述存储器，还用于存储所述发言文字信息，以便利用发言文字信息生成会议纪要。

本实施例提供的客户端，由客户端获取本地与会者的发言语音信息，并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器，再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端，其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

相应于图13～图15所示的应用于多媒体会议服务器的实现多媒体会议的装置，本发明实施例还提供了一种多媒体会议服务器，请参考图19，所述多媒体会议服务器包括：接收器1511和发送器1512。

所述接收器1511，用于获取客户端发送的发言语音信息及发言文字信息。

所述发送器1512，用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端，以使其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息，其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。

在本发明的一个具体的实施例中，如图20所示，所述多媒体会议服务器还包括处理器1513。

其中，所述接收器1511，还用于获取客户端发送的语音信息能量。

所述处理器1513，用于按照语音信息的能量由大到小的顺序，确定预设数量个与会者作为发言人。

所述发送器1512具体用于：向参加多媒体会议的与会者发送发言通知消息，其中，所述发言通知消息携带发言人的用户ID，以使与会者的客户端获取多媒体会议服务器发送的发言语音信息。

在本发明的另一个实施例中，所述接收器1511，还用于接收客户端发送的发言请求消息，所述发言请求消息携带所述客户端对应的与会者的用户ID。

所述发送器1512，还用于将所述发言请求消息发送给主持人对应的客户端，以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限；

所述接收器1511，还用于接收所述主持人对应的客户端发送的发言响应消息，向具有发言权限的与会者对应的客户端发送语音设备开启指令，所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。

本实施例提供的多媒体会议服务器，接收客户端发送的客户端获取本地与会者的发言语音信息并发送给多媒体会议服务器；然后，由多媒体会议服务器将发言语音信息及发言文字信息转发给参加多媒体会议的其它与会者对应的客户端，以使所述其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置，与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息，这样，与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容，因此提高了多媒体会议的沟通效果。

本发明还提供了一种多媒体会议系统，包括图18所示的客户端和图19-图20所示的多媒体会议服务器。

在本发明一个实施例中，所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，并向发言人对应的客户端发送发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID。

相应于图16所示的应用于客户端的实现多媒体会议的装置，本发明还提供了一种实现多媒体会议的客户端。如图21所示，该客户端包括：处理器1610和发送器1620。

处理器1610，用于获取本地与会者的发言语音信息。

发送器1620，用于将所述发言语音信息发送给多媒体会议服务器，以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息，以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端

本实施例提供的实现多媒体会议的客户端，与会者的客户端获得发言语音信息后发送给多媒体会议服务器，由多媒体会议服务器将发言语音信息转换成发言文字信息，然后，再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样，参加多媒体会议的与会者既能够听到发言人的发言语音信息，又能够看到相应的发言文字信息，能够准确理解发言人的发言内容，提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息，不需要在各个客户端上集成语音识别引擎，降低了客户端的生产成本。

相应于图17所示的应用于多媒体会议服务器的实现多媒体会议的装置，本发明还提供了多媒体会议服务器，如图22所示，所述多媒体会议服务器包括：处理器1710和发送器1720。

处理器1710，用于获取客户端发送的发言语音信息，并将所述发言语音信息转换成发言文字信息。

发送器1720，用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端，以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。

本发明还提供了另一种多媒体会议系统，包括图21所示的客户端及图22所示的多媒体会议服务器。

所述多媒体会议服务器，用于将所述发言语音信息转换成发言文字信息，并将所述发言语音信息及与所述发言语音信息对应的发言文字信息发送给其它与会者对应的客户端；其中，所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。

在本发明一个实施例中，所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，当接收到的发言语音信息来自确定出的发言人时，将所述发言语音信息转换成发言文字信息。

通过以上的方法实施例的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本发明的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种实现多媒体会议的方法，其特征在于，包括：

所述客户端将所述发言语音信息转换成发言文字信息；

2.根据权利要求1所述的方法，其特征在于，所述客户端将所述发言语音信息转换为发言文字信息，包括：

3.根据权利要求1所述的方法，其特征在于，所述客户端获取本地与会者的发言语音信息，包括：

所述客户端判断所述本地与会者是否具有发言权限；

4.根据权利要求1所述的方法，其特征在于，所述客户端获取本地与会者的发言语音信息，包括：

5.一种实现多媒体会议的方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，还包括：

所述多媒体会议服务器检测客户端发送的语音信息的能量；

7.根据权利要求5所述的方法，其特征在于，还包括：

8.一种实现多媒体会议的方法，其特征在于，包括：

客户端获取本地与会者的发言语音信息；

9.一种实现多媒体会议的方法，其特征在于，包括：

多媒体会议服务器获取客户端发送的发言语音信息；

10.根据权利要求9所述的方法，其特征在于，所述多媒体会议服务器将所述发言语音信息转换成发言文字信息包括：

11.一种实现多媒体会议的装置，用于客户端，其特征在于，包括：

获取单元，用于获取本地与会者的发言语音信息；

转换单元，用于将所述发言语音信息转换成发言文字信息；

12.根据权利要求11所述的装置，其特征在于，所述获取单元包括：

13.根据权利要求11所述的装置，其特征在于，所述转换单元包括：

14.根据权利要求11所述的装置，其特征在于，所述获取单元具体包括：

15.一种实现多媒体会议的装置，用于多媒体会议服务器端，其特征在于，包括：

16.根据权利要求15所述的装置，其特征在于，还包括：

检测单元，用于检测客户端发送的语音信息的能量；

17.根据权利要求15所述的装置，其特征在于，还包括：

18.一种实现多媒体会议的装置，应用于客户端，其特征在于，包括：

获取单元，用于获取本地与会者的发言语音信息；

19.一种实现多媒体会议的装置，应用于多媒体服务器中，其特征在于，包括：

获取单元，用于获取客户端发送的发言语音信息；

转换单元，用于将所述发言语音信息转换成发言文字信息；

20.根据权利要求19所述的装置，其特征在于，所述转换单元包括：

21.一种实现多媒体会议系统，其特征在于，包括：客户端和多媒体会议服务器；

22.根据权利要求21所述的多媒体会议系统，其特征在于：

所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，并向发言人对应的客户端发送发言通知消息，所述发言通知消息携带发言人的用户身份识别信息ID；

23.一种实现多媒体会议系统，其特征在于，包括：客户端和多媒体会议服务器；

24.根据权利要求23所述的多媒体会议系统，其特征在于：

所述多媒体会议服务器，还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量，按照所述能量由大到小的顺序确定前预设数量个与会者为发言人，当接收到的发言语音信息来自确定出的发言人时，将所述发言语音信息转换成发言文字信息。