CN106301811A - 实现多媒体会议的方法及装置 - Google Patents

实现多媒体会议的方法及装置 Download PDF

Info

Publication number
CN106301811A
CN106301811A CN201510255577.1A CN201510255577A CN106301811A CN 106301811 A CN106301811 A CN 106301811A CN 201510255577 A CN201510255577 A CN 201510255577A CN 106301811 A CN106301811 A CN 106301811A
Authority
CN
China
Prior art keywords
speech
participant
voice messaging
client
multimedia conferencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510255577.1A
Other languages
English (en)
Inventor
应益峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510255577.1A priority Critical patent/CN106301811A/zh
Priority to PCT/CN2015/099559 priority patent/WO2016184118A1/zh
Publication of CN106301811A publication Critical patent/CN106301811A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种实现多媒体会议的方法及装置,由客户端获取本地与会者的发言语音信息,并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器,再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端,其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。

Description

实现多媒体会议的方法及装置
技术领域
本发明涉及多媒体会议技术领域,更为具体地说,特别是涉及一种实现多媒体会议的方法及装置。
背景技术
多媒体会议是一种在网络上开展的融合语音、视频、数据于一体的会议,多媒体会议借助宽带接入网络,为用户提供语音、视频、数据、即时消息等远距离传输的多媒体业务,通过统一的Web门户,用户即可创建多媒体会议。
但是现有技术的多媒体会议中,会议发言人与其它与会者经常出现沟通不畅的情况,例如:当会议发言人与其它与会者的母语不同或者会议发言人带有方言时,常常发生其它与会者无法准确理解会议发言人的意思的情况;又如,在多媒体会议中,若其它与会者走神,错过会议发言人的部分发言,导致无法准确理解会议发言人的发言内容,大大降低了会议沟通的效果。
发明内容
本发明实施例中提供了一种实现多媒体会议的方法及装置,以解决现有技术的多媒体会议中与会者无法准确理解会议发言人的发言内容的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
第一方面,本发明提供一种实现多媒体会议的方法,包括:
客户端获取本地与会者的发言语音信息,并将所述发言语音信息发送给多媒体会议服务器;
所述客户端将所述发言语音信息转换成发言文字信息;
所述客户端将所述发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
结合第一方面,在第一方面的第一种可能的实现方式中,所述客户端将所述发言语音信息转换为发言文字信息,包括:
接收多媒体会议服务器发送的发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出的前预设数量个与会者;
判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同;
如果所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同,利用语音识别引擎将采集到的发言语音信息转换成发言文字信息。
结合第一方面,在第一方面的第二种可能的实现方式中,所述客户端获取本地与会者的发言语音信息,包括:
所述客户端判断所述本地与会者是否具有发言权限;
如果所述本地与会者具有发言权限,则利用语音设备采集所述本地与会者的发言语音信息。
结合第一方面,在第一方面的第三种可能的实现方式中,所述客户端获取本地与会者的发言语音信息,包括:
所述客户端向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端;
当所述客户端接收到所述多媒体会议服务器发送的语音设备开启指令时,利用语音设备采集所述本地与会者的发言语音信息;所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。
第二方面,本发明提供一种实现多媒体会议的方法,包括:
多媒体会议服务器获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息,所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到;
所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
结合第二方面,在第二方面的第一种可能的实现方式中,还包括:
所述多媒体会议服务器检测客户端发送的语音信息的能量;
所述多媒体会议服务器按照所述能量由大到小的顺序确定前预设数量个与会者为发言人;
所述多媒体会议服务器向所述发言人对应的客户端发送发言通知消息,所述发言通知消息携带所述发言人的用户身份识别信息ID,以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。
结合第二方面,在第二方面的第二种可能的实现方式中,还包括:
所述多媒体会议服务器接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID;
所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限;
所述多媒体会议服务器接收所述主持人对应的客户端发送的发言响应消息,并根据发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令,以使具有发言权限的与会者采集发言语音信息;
其中,所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。
第三方面,本发明提供一种实现多媒体会议的方法,包括:
客户端获取本地与会者的发言语音信息;
所述客户端将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
第四方面,本发明提供一种实现多媒体会议的方法,包括:
多媒体会议服务器获取客户端发送的发言语音信息;
所述多媒体会议服务器将所述发言语音信息转换成发言文字信息;
所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
结合第四方面,在第四方面的第一种可能的实现方式中,所述多媒体会议服务器将所述发言语音信息转换成发言文字信息包括:
多媒体会议服务器检测客户端发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人;
利用语音识别引擎将确定出的发言人对应的客户端发送的发言语音信息转换为发言文字信息。
第五方面,本发明提供一种实现多媒体会议的装置,用于客户端,包括:
获取单元,用于获取本地与会者的发言语音信息;
转换单元,用于将所述发言语音信息转换成发言文字信息;
发送单元,用于将所述发言语音信息及所述发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
结合第五方面,在第五方面的第一种可能的实现方式中,所述获取单元包括:
第一判断子单元,用于判断所述本地与会者是否具有发言权限;
第一采集子单元,用于当所述第一判断单元判定所述本地与会者具有发言权限时,则利用语音设备采集所述本地与会者的发言语音信息。
结合第五方面,在第五方面的第二种可能的实现方式中,所述转换单元包括:
第一接收子单元,用于接收多媒体会议服务器发送的发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出的前预设数量个与会者;
第二判断子单元,用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同;
第二采集子单元,用于当所述第二判断子单元判定所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同时,利用语音设备采集所述本地与会者的发言语音信息。
结合第五方面,在第五方面的第三种可能的实现方式中,所述获取单元具体包括:
第一发送子单元,用于向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端;
第二接收子单元,用于接收所述多媒体会议服务器发送的语音设备开启指令,
第三采集子单元,用于当所述第二接收子单元接收到所述语音设备开启指令时,利用语音设备采集所述本地与会者的发言语音信息;所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。
第六方面,本发明提供一种实现多媒体会议的装置,用于多媒体会议服务器端,包括:
获取单元,用于获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息,所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到;
第一发送单元,用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
结合第六方面,在第六方面的第一种可能的实现方式中,还包括:
检测单元,用于检测客户端发送的语音信息的能量;
确定单元,用于按照所述能量由大到小的顺序确定前预设数量个与会者为发言人;
第二发送单元,用于向所述发言人对应的客户端发送发言通知消息,所述发言通知消息携带所述发言人的用户身份识别信息ID,以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。
结合第六方面,在第六方面的第二种可能的实现方式中,还包括:
第一接收单元,用于接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID;
第三发送单元,用于将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限;
第二接收单元,用于接收所述主持人对应的客户端发送的发言响应消息;所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生;
第四发送单元,用于根据所述发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令。
第七方面,本发明提供一种实现多媒体会议的装置,应用于客户端,包括:
获取单元,用于获取本地与会者的发言语音信息;
发送单元,用于将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
第八方面,本发明提供一种实现多媒体会议的装置,应用于多媒体服务器中,包括:
获取单元,用于获取客户端发送的发言语音信息;
转换单元,用于将所述发言语音信息转换成发言文字信息;
发送单元,用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
结合第八方面,在第八方面的第一种可能的实现方式中,所述转换单元包括:
检测子单元,用于检测客户端发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人;
转换子单元,用于利用语音识别引擎将确定出的发言人发送的发言语音信息转换为发言文字信息。
第九方面,提供一种实现多媒体会议系统,包括:客户端和多媒体会议服务器;
所述客户端,用于获取本地与会者的发言语音信息并发送给多媒体会议服务器;以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
结合第九方面,在第九方面的第一种可能的实现方式中,所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,并向发言人对应的客户端发送发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID;
所述客户端,用于接收多媒体会议服务器发送的发言通知消息,并根据所述发言通知信息确定本地与会者是发言人时,获取本地与会者的发言语音信息并发送给所述多媒体会议服务器,以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给所述多媒体会议服务器。
第十方面,本发明还提供了一种实现多媒体会议系统,包括:客户端和多媒体会议服务器;
所述客户端,用于获取本地与会者的发言语音信息,并发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息转换成发言文字信息,并将所述发言语音信息及与所述发言语音信息对应的发言文字信息发送给其它与会者对应的客户端;其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者;
所述其它与会者对应的客户端,还用于向用户展示所述多媒体会议服务器发送的发言语音信息及发言文字信息。
结合第十方面,在第十方面的第一种可能的实现方式中,所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,当接收到的发言语音信息来自确定出的发言人时,将所述发言语音信息转换成发言文字信息。
由以上技术方案可见,本发明实施例提供的实现多媒体会议的方案,发言人的客户端能够将发言人的发言语音信息转换为发言文字信息,并通过多媒体会议服务器将该发言文字信息转发给参加多媒体会议的与会者中除发言人之外的其它与会者对应的客户端,以便在所述其它与会者对应的客户端上显示发言人的发言信息,避免了与会者只能够接收发言语音信息,导致与会者无法准确了解发言人的发言内容的情况,从而提高了会议沟通的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例示出的一种多媒体会议的框图;
图2是本发明实施例示出的一种实现多媒体会议的方法流程图;
图3是本发明实施例示出的再一种实现多媒体会议的方法流程图;
图4是本发明实施例示出的另一种实现多媒体会议的方法流程图;
图5是本发明实施例示出的又一种实现多媒体会议的方法流程图;
图6是本发明实施例示出的另一种实现多媒体会议的方法流程图;
图7是本发明实施例的另一种实现多媒体会议的方法的流程图;
图8是本发明实施例示出的一种实现多媒体会议的装置结构示意图;
图9是本发明实施例示出的另一种实现多媒体会议的装置结构示意图;
图10是本发明实施例示出的一种获取单元的结构示意图;
图11是本发明实施例示出的一种转换单元的结构示意图;
图12是本发明实施例示出的又一种获取单元的结构示意图;
图13是本发明实施例示出的又一种实现多媒体会议装置结构示意图;
图14是本发明实施例示出的另一种实现多媒体会议的装置结构示意图;
图15是本发明实施例示出的再一种实现多媒体会议的装置结构示意图;
图16是本发明实施例示出的一种应用于客户端的实现多媒体会议的装置的结构示意图;
图17是本发明实施例示出的一种应用于多媒体会议服务器的实现多媒体会议的装置的结构示意图;
图18是本发明实施例示出的一种实现多媒体会议的客户端的结构示意图;
图19是本发明实施例示出的一种多媒体会议服务器的结构示意图;
图20是本发明实施例示出的另一种多媒体会议服务器的结构示意图;
图21是本发明实施例示出的另一种实现多媒体会议的客户端的结构示意图;
图22是本发明实施例示出的另一种多媒体会议服务器的结构示意图。
具体实施方式
本发明实施例所提供的多媒体会议的方案,解决了背景技术中所介绍的与会者无法准确了解发言人的发言信息,导致降低会议沟通的问题。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本发明保护的范围。
以上是本发明的核心思想,为了使本技术领域的人员更好地理解本发明方案,下面结合附图对本发明作进一步的详细说明。
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
图1是对媒体会议系统的框图,如图1所示,该多媒体会议系统包括多个客户端1和至少一个多媒体会议服务器2。其中,客户端可以是个人PC机、笔记本电脑等终端。
客户端获取与会者的媒体流信息(例如,语音信息),并将媒体流信息上传至多媒体会议服务器2,由多媒体会议服务器2将各个客户端发送的媒体流进行混音处理后发送给各个终端,从而使在地理上分散的用户通过图形、声音等方式进行交流。
图2是本发明实施例示出的一种实现多媒体会议的方法的流程图,该方法应用于图1所示的客户端中,如图2所示,该方法包括如下步骤:
S110,客户端获取本地与会者的发言语音信息,并将所述发言语音信息发送给多媒体会议服务器。
本地与会者是指与客户端处于同一地理空间的与会者。例如,与会者A使用客户端a参加多媒体会议,对于客户端a而言,与会者A即与客户端a对应的本地与会者。
客户端可以使用语音设备获取本地与会者的发言语音信息。该语音设备可以包括集成于客户端上的语音信息采集硬件和控制该语音信息采集硬件的操作软件。其中,所述语音信息采集硬件能够实现语音采集、语音编码及语音解码等功能,例如,MIC。所述操作软件可以查询本地语音信息采集硬件的数量和名称,还可以开启、关闭或者静音该语音采集硬件。
本实施例适用于讨论式会议应用场景,每个与会者都可以发言,这样,每个客户端都能够获得与自身对应的与会者的发言语音信息。如果客户端通过语音设备获取与会者的发言语音信息,则每个与会者对应的语音设备都处于开启状态。
S120,客户端将发言语音信息转换成发言文字信息。
客户端利用语音识别技术将获得的本地发言人的发言语音信息转换成发言文字信息。客户端获得的本地与会者的发言语音信息能量相对较强,因此由发言人对应的客户端将发言语音信息转换发言文字信息的准确率较高。同时,此种方式不需要其它与会者对应的客户端将发言人的发言语音信息转换为发言文字信息,节省了其它与会者对应的客户端的资源。
可选地,发言人对应的客户端还可以存储发言文字信息,以便利用所述发言文字信息生成会议纪要。同理,参加多媒体会议的其它与会者对应的客户端也可以存储接收到的发言文字信息,以便根据所述发言文字信息生成会议纪要。此外,发言人对应的客户端也可以显示所述发言文字信息,从而方便发言人查看自己的发言内容。
S130,客户端将所述发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。
所述其它与会者是参加多媒体会议的全部与会者中除发言人之外的其它与会者。
多媒体会议服务器将接收到发言语音信息及发言文字信息发送给参加本次多媒体会议的其它与会者对应的客户端。其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息,从而有助于与会者快速理解发言人的发言内容。
例如,参加本地多媒体会议的与会者包括A、B、C、D和E,其中,与会者A是发言人,则与会者B、C、D、E是其它与会者。多媒体会议服务器将与会者A的发言语音信息和发言文字信息发送给B、C、D、E。
可以在客户端和多媒体会议服务器上都集成T.120协议标准,从而在客户端和多媒体会议服务器之间实现发言语音信息及发言文字信息的收发功能。其中,T.120标准包括T.120-T.127等一系列协议,该协议标准能够实现客户端之间以及客户端与多媒体会议服务器之间的信息传输的可靠性,同时,能够提供点到多点的数据分发服务,并选择传输效率最佳的传输路径传输数据。
本实施例示出的实现多媒体会议的方法,由客户端获取本地与会者的发言语音信息,并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器,再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端,其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。
在一种应用场景中,所有与会者都允许发言,例如,讨论式会议。但是,如果将所有与会者发出的语音信息都转换成相应的文字信息,将会造成很多与会议无关的语音转换成文字,并造成很多与会议无关的文字显示给与会者,对与会者造成干扰。鉴于上述应用场景,可以将语音能量较大的与会者确定为发言人,并将发言人的发言语音信息转换成发言文字信息,其它语音能量较小的与会者的语音内容被忽略。
图3是本发明实施例示出的另一种实现多媒体会议方法的流程图,该实施例适用于与会者人数较多,与会者均能发言的应用场景。如图3所示,该方法可以包括以下步骤:
S210,多媒体会议服务器检测客户端发送的语音信息的能量。
参加多媒体会议的客户端将获得的与会者的语音信息发送给多媒体会议服务器,由多媒体会议服务器检测接收到的语音信息的能量。
本实施例中,检测语音信息的能量可以由多媒体会议服务器中的语音会议桥实现。所述语音会议桥用于提供服务器侧的语音会场,将各发言人的语音混音后送给每个与会者。
S220,多媒体会议服务器按照语音信息的能量由大到小的顺序,确定前预设数量个与会者为发言人。
多媒体会议服务器通过检测参加多媒体会议的与会者发送的语音信息的能量,按照能量由大到小进行排序并依次确定出前预设数量个与会者为发言人。例如,所述预设数量可以是一个,即将语音信息的能量最大的与会者确定为发言人;或者,所述预设数量可以是两个,即将语音信息的能量最大的两个与会者确定为发言人。
需要说明的是,此种应用场景下,如果发言人在不同时刻发出语音的能量不同,多媒体会议服务器根据语音信息的能量确定出的发言人可能不同。
S230,多媒体会议服务器向参加多媒体会议的与会者发送发言通知消息,所述发言通知消息携带发言人的用户ID(Identification,身份标识)。
其中,多媒体会议服务器可以通过广播的形式将发言通知消息发送给所有参加多媒体会议的与会者的客户端,并由与会者的客户端根据发言通知消息中的用户ID判断本客户端所对应的与会者是否为发言人;也可以将发言通知消息一对一发送给该用户ID所对应的与会者的客户端,由其来根据用户ID进行判断。
与会者的客户端接收多媒体会议服务器的发言通知消息,由于该发言通知消息中含有用户ID,与会者的客户端可将该用户ID与自身的用户ID进行比较,从而判断自身客户端所对应的与会者是否是发言人。
S240,当客户端确定所述发言通知消息所携带的用户ID与自身的用户ID相同时,确定本地与会者为发言人。
S250,发言人对应的客户端获取发言人的发言语音信息,并将该发言语音信息发送给多媒体会议服务器。
S260,发言人对应的客户端将所述发言语音信息转换为发言文字信息。
S270,发言人对应的客户端将所述发言文字信息发送给多媒体会议服务器。
S280,多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端。
S290,所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。
本实施例提供的实现多媒体会议的方法,多媒体会议服务器检测各个与会者发出语音信息的能量,并按照能量由大到小的顺序,确定前预设数量个与会者为发言人,即只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
在另一种应用场景中,只需要主持人和主讲人的发言内容转换成对应的文字信息,忽略其它与会者的发言内容。
图4是本发明实施例示出的另一种实现多媒体会议的方法流程图。本实施例中,只将具有发言权限的发言人的发言内容转换成文字信息。如图4所示,该方法包括以下步骤:
S310,客户端判断本地与会者是否具有发言权限;如果所述本地与会者具有发言权限,则执行S320;否则,结束本次流程。
在会议具有主持人和固定的主讲人的应用场景中,通常主讲人和主持人具有发言权限。判断与会者是否具有发言权限可以包括判断与会者的身份属性是否具有主讲人权限或主持人权限。
S320,客户端获取本地与会者的发言语音信息,并将该发言语音信息发送给多媒体会议服务器。
S330,客户端将所述发言语音信息转换为发言文字信息。
其中,客户端可以内置语音识别引擎,客户端利用语音识别引擎将本地与会者的发言语音信息转换为发言文字信息。
S340,客户端将发言文字信息发送给多媒体会议服务器。
客户端可以在获得本地与会者的发言语音信息后,就立即将所述发言语音信息发送给多媒体会议服务器,以使多媒体会议服务器及时将发言人的发言语音信息转发给其它与会者,保证语音信息传输的实时性。当然,如果发言语音信息转换成发言文字信息所需时间很短,一般在毫秒级,则可以将发言语音信息和发言文字信息一起发送给多媒体会议服务器,从而使其它与会者对应的客户端接播放发言语音信息和显示的发言文字信息同步进行。
S350,多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。
S360,其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。
本实施例提供的实现多媒体会议的方法,只将具有发言权限的与会者的发言语音信息转换成发言文字信息,而不是将所有与会者的发言内容转换成对应的文字信息。利用该方法能够避免将多媒体会议中与会者发出的与会议无关的语音内容转换成相应的文字信息转发给其它与会者,进而避免其它与会者的客户端显示过多不重要的文字信息对与会者造成干扰的现象发生。
在又一种应用场景中,只有主持人和主讲人能够发言,其它与会者不能发言,其它与会者的语音设备被关闭,且与会者自己不能开启语音设备。当与会者需要发言时,与会者可以请求主持人开启该与会者的语音设备。
图5是本发明实施例示出的又一种实现多媒体会议的方法流程图。该方法应用于主持人指定发言人的应用场景,该方法包括以下步骤:
S410,客户端向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述客户端对应与会者的用户身份识别ID。
除主持人和主讲人之外的其它与会者需要发言时,由该与会者对应的客户端向多媒体会议服务器发送发言请求消息。所述发言请求消息携带该与会者的用户ID。
S420,多媒体会议服务器将该发言请求消息转发给主持人所对应的客户端。
S430,主持人对应的客户端根据发言请求消息确定允许所述与会者发言时,向多媒体会议服务器发送发言响应消息。
主持人对应的客户端接收到所述发言请求消息后,根据发言请求消息携带的用户ID判断是否允许该与会者发言,如果允许该与会者发言,则产生发言响应消息并发送给多媒体会议服务器。该发言响应消息中也可以携带该与会者的用户ID,以方便多媒体会议服务器识别该与会者。
其中,主持人对应的客户端可以根据预先设定的与会者的身份属性判断是否允许与会者发言。
S440,多媒体会议服务器根据所述发言响应消息,生成语音设备开启指令,并向发言人对应的客户端发送所述语音设备开启指令。
多媒体会议服务器根据接收到发言响应消息生成语音设备开启指令,该语音设备开启指令用于控制主持人允许发言的与会者对应的语音设备开启。
S450,当发言人对应的客户端接收到所述语音设备开启指令时,利用语音设备获取发言人的发言语音信息,并将该发言语音信息发送给多媒体会议服务器。
S460,发言人对应的客户端将所述发言语音信息转换成发言文字信息。
S470,发言人对应的客户端将发言文字信息发送给多媒体会议服务器。
S480,多媒体会议服务器将所述发言语音信息和发言文字信息发送给除发言人之外的其它与会者对应的客户端。
S490,所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。
本实施例提供的实现多媒体会议的方法,除主持人或主讲人之外的其它与会者需要发言时,向主持人的客户端发送发言请求消息,由主持人根据所述发言请求消息判断是否允许所述与会者发言,若允许所述与会者发言,则向多媒体会议服务器发送允许所述与会者发言的发言响应消息,多媒体会议服务器根据该发言响应消息产生语音设备开启指令,控制所述与会者对应的语音设备开启。由该与会者对应的语音设备获取该与会者的发言语音信息,由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该方法适用于正式会议或级别较高的会议场景,扩大了多媒体会议实现方法的适用范围。
图6是本发明实施例示出的另一种实现多媒体会议的方法流程图,如图6所示,该方法包括以下步骤:
S510,客户端获取本地与会者的发言语音信息,并将该发言语音信息发送给多媒体会议服务器。
客户端利用语音设备采集与会者的发言语音信息。
S520,多媒体会议服务器将所述发言语音信息转换为发言文字信息。
多媒体会议服务器在将各个与会者发送的语音信息进行混音之前,将接收到的发言语音信息利用语音识别引擎转换为发言文字信息。
在本发明的一个实施例中,全部参加多媒体会议的与会者可以自由发言,任意一个与会者都能够将获得的本地与会者的发言语音信息发送给多媒体会议服务器。相应地,多媒体会议服务器可以将任意一个与会者的发言文字信息转换成发言文字信息。
在本发明的另一个实施例中,只有主持人和主讲人可以发言,只有主持人和主讲人可以将获得的发言语音信息发送给多媒体会议服务器。多媒体会议服务器将接收到的发言语音信息转换成发言文字信息。
S530,多媒体会议服务器将所述发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者的客户端。所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
S540,所述其它与会者的客户端展示所述发言语音信息及对应的发言文字信息。
本实施例提供的实现多媒体会议的方法,与会者的客户端获得发言语音信息后发送给多媒体会议服务器,由多媒体会议服务器将发言语音信息转换成发言文字信息,然后,再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样,参加多媒体会议的与会者既能够听到发言人的发言语音信息,又能够看到相应的发言文字信息,能够准确理解发言人的发言内容,提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息,不需要在各个客户端上集成语音识别引擎,降低了客户端的生产成本。
图7是本发明实施例的另一种实现多媒体会议的方法的流程图,本实施例根据与会者法语音信息的能量大小,确定能量最大的预设数量个与会者为发言人,并将发言人的发言语音信息转换成发言文字信息。如图7所示,该方法可以包括以下步骤:
S610,多媒体会议服务器检测客户端发送的语音信息的能量。
S620,多媒体会议服务器按照语音信息的能量由大到小的顺序,确定前预设数量个与会者为发言人。
S630,客户端获取本地与会者的发言语音信息并将该发言语音信息发送给多媒体会议服务器。
S640,多媒体会议服务器将确定出的发言人对应的客户端发送的发言语音信息转换为发言文字信息。
S650,多媒体会议服务器将发言人对应的客户端发送的发言语音信息及对应的发言文字信息,发送给参加多媒体会议的其它与会者的客户端。
所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
S660,其它与会者的客户端展示接收到的发言语音信息和对应的发言文字信息。
本实施例提供的实现多媒体会议的方法,多媒体会议服务器检测各个与会者发出语音信息的能量,并按照能量由大到小的顺序,确定前预设数量个与会者为发言人。多媒体会议服务器只将确定出的发言人的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
图8是本发明实施例示出的一种实现多媒体会议的装置结构示意图,如图8所示,该实现多媒体会议的装置,用于客户端,包括:获取单元110、转换单元120和发送单元130。
获取单元110,用于获取本地的发言语音信息。
本地与会者是指与客户端处于同一地理空间的与会者,例如,与会者A使用客户端a参加多媒体会议,对于客户端a而言,与会者A即与客户端a对应的本地与会者。
所述获取单元110可以使用语音设备获取本地与会者的发言语音信息。该语音设备可以包括集成于客户端上的语音信息采集硬件和控制该语音信息采集硬件的操作软件。其中,所述语音信息采集硬件能够实现语音采集、语音编码及语音解码等功能。所述操作软件可以查询本地语音信息采集硬件的数量和名称,还可以开启、关闭或者静音该语音采集硬件。
本实施例中的实现多媒体的装置可以适用于讨论式会议应用场景,每个与会者都可以发言,这样,每个客户端都能够获得与自身对应的与会者的发言语音信息。如果客户端通过语音设备获取与会者的发言语音信息,则每个与会者对应的语音设备都处于开启状态。
转换单元120,用于将发言语音信息转换成发言文字信息。
其中,转换单元120利用语音识别技术将获取的本地发言人的发言语音信息转换为发言文字信息。
客户端获得的本地与会者的发言语音信息能量相对较强,因此由发言人对应的客户端将发言语音信息转换发言文字信息的准确率较高。同时,此种方式不需要其它与会者对应的客户端将发言人的发言语音信息转换发言文字信息,节省了其它与会者对应的客户端的资源。
发送单元130,用于将发言语音信息及发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端。
其中,所述其它与会者是参加多媒体会议的全部与会者中除发言人之外的其它与会者。
客户端将发言语音信息及发言文字信息发送多媒体会议服务器,以使多媒体会议服务器将其发送给参加本次多媒体会议的其它与会者对应的客户端,最终使得其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息,从而有助于与会者快速理解发言人的发言内容。
例如,参加本地多媒体会议的与会者包括A、B、C、D和E,其中,与会者A是发言人,则与会者B、C、D、E是其它与会者。多媒体会议服务器将与会者A的发言语音信息和发言文字信息发送给B、C、D、E。
可以在客户端和多媒体会议服务器上都集成T.120协议标准,从而在客户端和多媒体会议服务器之间实现发言语音信息及发言文字信息的收发功能。其中,T.120标准包括T.120-T.127等一系列协议,该协议标准能够实现客户端之间以及客户端与多媒体会议服务器之间的信息传输的可靠性,同时,能够提供点到多点的数据分发服务,并选择传输效率最佳的传输路径传输数据。
该实施例示出的实现多媒体会议的装置,由获取单元获取本地与会者的发言语音信息,并通过转换单元将发言语音信息转换为发言文字信息。然后通过发送单元将发言语音信息及发言文字信息发送给多媒体会议服务器,再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端,其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。
图9是本发明实施例另一种实现多媒体会议的装置的结构示意图,该装置在图8所示实施例的基础上还可以包括:显示单元140和存储单元150。
显示单元140,用于显示发言文字信息。
存储单元150,用于存储所述发言文字信息。
可选地,通过增加存储单元150,发言人对应的客户端还可以存储发言文字信息,以便利用所述发言文字信息生成会议纪要。同理,参加多媒体会议的其它与会者对应的客户端也可以存储接收到的发言文字信息,以便根据所述发言文字信息生成会议纪要。此外,发言人对应的客户端也可以显示所述发言文字信息,从而方便发言人查看自己的发言内容。
在一种应用场景中,只需要主持人和主讲人的发言内容转换成对应的文字信息,忽略其它与会者的发言内容。
图10是本发明实施例示出的一种获取单元110的结构示意图,该实现多获取单元110适用于只需要主持人或者主讲人的发言内容转换成对应的文字信息,忽略其它与会者的发言内容的应用场景。如图8所示,该获取单元110可以包括第一判断子单元1101和第一采集子单元1102:
第一判断子单元1101,用于当本地客户端对应的与会者需要发言时,判断所述与会者是否具有发言权限。
在会议具有主持人和固定的主讲人的应用场景中,通常只有主讲人和主持人具有发言权限。判断与会者是否具有发言权限可以包括判断与会者的身份属性是否具有主讲人权限或主持人权限。
第一采集子单元1102,用于当所述第一判断单元1101判定所述本地与会者自身具有发言权限具有主讲人权限或主持人权限时,利用语音设备采集发言语音信息。
本实施例提供的实现多媒体会议的装置中,只将具有发言权限的与会者的发言语音信息转换成发言文字信息,而不是将所有与会者的发言内容转换成对应的文字信息。利用该装置能够避免将多媒体会议中与会者发出的与会议无关的语音内容转换成相应的文字信息转发给其它与会者,进而避免其它与会者的客户端显示过多不重要的文字信息对与会者造成干扰的现象发生。
在另一种应用场景中,所有与会者都允许发言,例如,讨论式会议。但是,如果将所有与会者发出的语音信息都转换成相应的文字信息,将会造成很多与会议无关的语音转换成文字,并造成很多与会议无关的文字显示给与会者,对与会者造成干扰。鉴于上述应用场景,可以将语音能量较大的与会者确定为发言人,并将发言人的发言语音信息转换成发言文字信息,其它语音能量较小的与会者的语音内容被忽略。
图11是本发明实施例示出的一种转换单元120的结构示意图,该转换单元120适用于与会人数较多,与会者均能够发言的应用场景。如图11所示,该转换单元120可以包括第一接收子单元1201、第二判断子单元1202和第二采集子单元1203:
第一接收子单元1201,用于接收多媒体会议服务器发送的发言通知消息,由于该发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出的前预设数量个与会者,与会者的客户端可将该用户ID与自身的用户ID进行比较,从而判断自身客户端所对应的与会者是否是发言人。
第二判断子单元1202,用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同。
第二采集子单元1203,用于当所述第二判断子单元1202判定所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同时,利用语音设备采集所述本地与会者的发言语音信息。
本实施例中,通过转换单元120中的第一接收子单元接收多媒体会议服务器发送的发言通知消息,由于该发言通知消息携带发言人的用户身份标识信息ID,所述发言人可由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照由大到小的顺序依次确定的前设数量个与会者,即客户端只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。能够避免将很多与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
在又一种应用场景中,只有主持人和主讲人能够发言,其它与会者不能发言,其它与会者的语音设备被关闭,且与会者自己不能开启语音设备。当与会者需要发言时,与会者可以请求主持人开启该与会者的语音设备。
图12是本发明实施例示出的又一种获取单元110的结构示意图。该获取单元110应用于主持人指定发言人的应用场景,如图12所示,所述获取单元110包括:第一发送子单元1103、第二接收子单元1104和第三采集子单元1105。
第一发送子单元1103,用于向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使所述多媒体会议服务器将所述发言请求消息发送给主持人。
除主持人和主讲人之外的其它与会者需要发言时,由该与会者对应的客户端向多媒体会议服务器发送发言请求消息。所述发言请求消息携带该与会者的用户ID。
第二接收子单元1104,用于接收所述多媒体会议服务器发送的语音设备开启指令,
该语音设备开启指令由所述多媒体会议服务器在接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生,具体地,主持人对应的客户端接收到所述发言请求消息后,根据发言请求消息携带的用户ID判断是否允许该与会者发言,如果允许该与会者发言,则主持人人对应的客户端将产生发言响应消息并发送给多媒体会议服务器。该发言响应消息中也可以携带该与会者的用户ID,以方便多媒体会议服务器识别该与会者。
其中,主持人对应的客户端可以根据预先设定的与会者的身份属性判断是否允许与会者发言。
第三采集子单元1105,用于当所述第二接收子单元1104接收到所述语音设备开启指令时,利用语音设备采集所述本地与会者的发言语音信息。
本实施例提供的获取单元,除主持人或主讲人之外的其它与会者需要发言时,通过多媒体会议服务器向主持人的客户端转发言请求消息,由主持人根据所述发言请求消息判断是否允许所述与会者发言,若被允许所述与会者发言,则主持人的客户端向多媒体会议服务器发送允许所述与会者发言的发言响应消息,以使多媒体会议服务器根据该发言响应消息产生语音设备开启指令,控制所述与会者对应的语音设备开启。由该与会者对应的语音设备获取该与会者的发言语音信息,由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该装置适用于正式会议或级别较高的会议场景,扩大了多媒体会议实现方法的适用范围。
图13是本发明实施例示出的又一种实现多媒体会议的装置结构示意图,如图13所示,该实现多媒体会议的装置,用于多媒体会议服务器,如图13所示,该装置包括获取单元210和第一发送单元220。
获取单元210,用于获取客户端发送的发言语音信息及发言文字信息。
第一发送单元220,用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
多媒体会议服务器将接收到发言语音信息及发言文字信息发送给参加本次多媒体会议的其它与会者对应的客户端。其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息,从而有助于与会者快速理解发言人的发言内容。
本实施例示出的应用于多媒体会议服务器的实现多媒体会议的装置,客户端获取本地与会者的发言语音信息并发送给多媒体会议服务器;然后,由多媒体会议服务器将发言语音信息及发言文字信息转发给参加多媒体会议的其它与会者对应的客户端,以使所述其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。
在一种应用场景中,所有与会者都允许发言,例如,讨论式会议。但是,如果多媒体会议服务器将所有与会者发出的语音信息和文字信息都发送给其它与会者,将会造成很多与会议无关的语音转换成文字,并造成很多与会议无关的文字显示给与会者,对与会者造成干扰。鉴于上述应用场景,可以将语音能量较大的与会者确定为发言人,并将发言人的发言语音信息转换成发言文字信息,其它语音能量较小的与会者的语音内容被忽略。
图14是本发明实施例示出的另一种实现多媒体会议的装置的结构示意图,该实施例适用于与会者人数较多且与会者均能发言的应用场景,该装置在图13所示的实施例的基础上还可以包括检测单元230、确定单元240和第二发送单元250。
检测单元230,用于检测客户端发送的语音信息的能量。
多媒体会议服务器将接收参加多媒体会议的与会者的客户端获得的该与会者的语音信息,由多媒体会议服务器检测接收到的语音信息的能量。
本实施例中,检测语音信息的能量可以由多媒体会议服务器中的语音会议桥实现。所述语音会议桥用于提供服务器侧的语音会场,将各发言人的语音混音后送给每个与会者。
确定单元240,用于按照所述能量由大到小的顺序确定前预设数量个与会者为发言人。
多媒体会议服务器通过检测参加多媒体会议的与会者发送的语音信息的能量,按照能量由大到小进行排序并依次确定出预设数量个与会者为发言人。例如,所述预设数量可以是一个,即将语音信息的能量最大的与会者确定为发言人;或者,所述预设数量可以是两个,即将语音信息的能量最大的两个与会者确定为发言人。
需要说明的是,此种应用场景下,如果发言人在不同时刻发出语音的能量不同,多媒体会议服务器根据语音信息的能量确定出的发言人可能不同。
第二发送单元250,用于向所述发言人对应的客户端发送发言通知消息,所述发言通知消息携带所述发言人的用户身份识别信息ID,以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。
其中,多媒体会议服务器可以通过广播的形式将发言通知消息发送给所有参加多媒体会议的与会者的客户端,并由与会者的客户端根据发言通知消息中的用户ID判断本客户端所对应的与会者是否为发言人;也可以将发言通知消息一对一发送给该用户ID所对应的与会者的客户端,由客户端根据用户ID判断自身是否是发言人。
与会者的客户端接收多媒体会议服务器的发言通知消息,由于该发言通知消息中含有用户ID,与会者的客户端可将该用户ID与自身的用户ID进行比较,从而判断客户端所对应的与会者是否是发言人。
本实施例提供的实现多媒体会议的装置,多媒体会议服务器检测各个与会者发出语音信息的能量,并按照能量由大到小的顺序,确定前预设数量个与会者为发言人,即只将能量最大的预设数量个与会者的发言内容转换成对应的文字信息。该装置能够避免让很多客户端产生的与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
图15是本发明实施例示出的又一种实现多媒体会议的装置的结构示意图。该实现多媒体会议的装置应用于主持人指定发言人的应用场景,该装置在图13中所示的实施例的基础上还可以包括:第一接收单元260、第三发送单元270、第二接收单元280和第四发送单元290。
第一接收单元260,用于接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID。
第三发送单元270,用于将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限。
第二接收单元280,用于接收所述主持人对应的客户端发送的发言响应消息。
主持人对应的客户端接收到所述发言请求消息后,根据发言请求消息携带的用户ID判断是否允许该与会者发言。如果允许该与会者发言,则产生发言响应消息,多媒体会议服务器将接收到该与会者的发言响应消息。该发言响应消息中也可以携带该与会者的用户ID,以方便多媒体会议服务器识别该与会者。
其中,主持人对应的客户端可以根据预先设定的与会者的身份属性判断是否允许与会者发言。例如,在建立多媒体会议时,主持人就可以根据与会者的与会身份判断该与会者是否能够发言,例如,会议的主讲人允许发言。
第四发送单元290,用于向具有发言权限的与会者对应的客户端发送语音设备开启指令,所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。
多媒体会议服务器根据接收到发言响应消息生成语音设备开启指令,该语音设备开启指令用于控制主持人允许发言的与会者对应的语音设备开启。
本实施例提供的实现多媒体会议的装置,除主持人或主讲人之外的其它与会者需要发言时,多媒体会议服务器将向主持人的客户端转发所述其它与会者的发言请求消息,由主持人根据所述发言请求消息判断是否允许所述与会者发言,若允许所述与会者发言,则多媒体会议服务器将接收到主持人客户端发送的允许所述与会者发言的发言响应消息,多媒体会议服务器根据该发言响应消息产生语音设备开启指令,控制所述与会者对应的语音设备开启。开启后,该与会者对应的语音设备获取该与会者的发言语音信息,由该与会者对应的客户端将所述发言语音信息转换成发言文字信息。该方法适用于正式会议或级别较高的会议场景,扩大了多媒体会议实现方法的适用范围。
相应于上述的图6~图7所示的实现多媒体会议的方法实施例,本发明还提供了相应的装置实施例。
图16是本发明实施例示出的一种应用于客户端的实现多媒体会议的装置的结构示意图,该装置包括:获取单元310和发送单元320。
获取单元310,用于获取本地与会者的发言语音信息。
发送单元320,用于将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
本实施例提供的实现多媒体会议的装置,与会者的客户端获得发言语音信息后发送给多媒体会议服务器,由多媒体会议服务器将发言语音信息转换成发言文字信息,然后,再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样,参加多媒体会议的与会者既能够听到发言人的发言语音信息,又能够看到相应的发言文字信息,能够准确理解发言人的发言内容,提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息,不需要在各个客户端上集成语音识别引擎,降低了客户端的生产成本。
图17是本发明实施例示出的一种应用于多媒体会议服务器的实现多媒体会议的装置的结构示意图,该装置包括:获取单元410、转换单元420和发送单元430。
获取单元410,用于获取客户端发送的发言语音信息。
转换单元420,用于将所述发言语音信息转换成发言文字信息。
在本发明一个实施例中,多媒体会议服务器根据与会者法语音信息的能量大小,确定能量最大的预设数量个与会者为发言人,并将接收到的发言人的发言语音信息转换成发言文字信息。该转换单元420可以包括检测子单元和转换子单元。
所述检测子单元,用于检测客户端发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人;所述转换子单元,用于利用语音识别引擎将确定出的发言人发送的发言语音信息转换为发言文字信息。
发送单元430,用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
本实施例提供的实现多媒体会议的装置,多媒体会议服务器检测各个与会者发出语音信息的能量,并按照能量由大到小的顺序,确定前预设数量个与会者为发言人。多媒体会议服务器只将确定出的发言人的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
相应于图8~图12所示的应用于客户端的实现多媒体会议的装置,本发明实施例还提供了一种实现多媒体会议的客户端,请参见图18,所述客户端包括:处理器1411、发送器1412和存储器1413;
存储器1413内存储有处理器1411能够执行的操作指令,处理器1411读取存储器1413内的操作指令用于实现以下功能:获取本地与会者的发言语音信息,并将发言语音信息转换为发言文字信息。
在本发明的实施例中,可以通过语音设备采集与会者的音频信号进行相应的处理后提供给处理器1411,例如,所述语音设备可以是MIC。
在本发明的一个实施例中,处理器1411具体用于:判断本地与会者是否具有发言权限;如果所述本地与会者具有发言权限,则采集所述本地与会者的发言语音信息。
所述发送器1412用于将所述发言语音信息及所述发言文字信息发送给多媒体会议服务器;以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者对应的客户端,其中所述其它与会者为参加多媒体会议的全部与会者中除发言人外的其它与会者。
在本发明的一个实施例中,多媒体会议服务器根据与会者法语音信息的能量大小,确定能量最大的预设数量个与会者为发言人,再由客户端将发言人的发言语音信息转换成发言文字信息。本实施例中,实现多媒体会议的客户端还可以包括接收器。
所述接收器,用于接收多媒体会议服务器发送的发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量有道到小的顺序依次确定出的前设数量个与会者;
所述处理器1411,还用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同,如果所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同,确定本地与会者为发言人,然后获取本地与会者的发言语音信息。
在本发明的又一个实施例中,只有主持人和主讲人能够发言,其它与会者不能发言,其它与会者的语音设备被关闭,且与会者自己不能开启语音设备。当与会者需要发言时,与会者可以请求主持人开启该与会者的语音设备。
所述发送器1412还用于向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使多媒体会议服务器将所述发言请求消息发送给主持人。
所述接收器,还用于在接收到多媒体会议服务器发送的语音设备开启指令,并将语音设备开启指令提供给语音设备,以使语音设备采集本地与会者的发言语音信息,所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。
在本发明的另一个实施例中,所述实现多媒体会议的客户端还可以包括显示器。该显示器,用于显示所述发言文字信息。所述存储器,还用于存储所述发言文字信息,以便利用发言文字信息生成会议纪要。
本实施例提供的客户端,由客户端获取本地与会者的发言语音信息,并将发言语音信息转换为发言文字信息。然后将发言语音信息及发言文字信息发送给多媒体会议服务器,再由多媒体会议服务器转发给参加多媒体会议的其它与会者对应的客户端,其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的方法,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。
相应于图13~图15所示的应用于多媒体会议服务器的实现多媒体会议的装置,本发明实施例还提供了一种多媒体会议服务器,请参考图19,所述多媒体会议服务器包括:接收器1511和发送器1512。
所述接收器1511,用于获取客户端发送的发言语音信息及发言文字信息。
所述发送器1512,用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息,其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
在本发明的一个具体的实施例中,如图20所示,所述多媒体会议服务器还包括处理器1513。
其中,所述接收器1511,还用于获取客户端发送的语音信息能量。
所述处理器1513,用于按照语音信息的能量由大到小的顺序,确定预设数量个与会者作为发言人。
所述发送器1512具体用于:向参加多媒体会议的与会者发送发言通知消息,其中,所述发言通知消息携带发言人的用户ID,以使与会者的客户端获取多媒体会议服务器发送的发言语音信息。
在本发明的另一个实施例中,所述接收器1511,还用于接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID。
所述发送器1512,还用于将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限;
所述接收器1511,还用于接收所述主持人对应的客户端发送的发言响应消息,向具有发言权限的与会者对应的客户端发送语音设备开启指令,所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。
本实施例提供的多媒体会议服务器,接收客户端发送的客户端获取本地与会者的发言语音信息并发送给多媒体会议服务器;然后,由多媒体会议服务器将发言语音信息及发言文字信息转发给参加多媒体会议的其它与会者对应的客户端,以使所述其它与会者对应的客户端展示接收到的发言语音信息及发言文字信息。利用本发明提供的实现多媒体会议的装置,与会者既能够听到发言人的发言语音信息又能够看到对应的发言文字信息,这样,与会者能够结合发言文字信息和发言语音信息准确理解发言人的发言内容,因此提高了多媒体会议的沟通效果。
本发明还提供了一种多媒体会议系统,包括图18所示的客户端和图19-图20所示的多媒体会议服务器。
所述客户端,用于获取本地与会者的发言语音信息并发送给多媒体会议服务器;以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
在本发明一个实施例中,所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,并向发言人对应的客户端发送发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID。
所述客户端,用于接收多媒体会议服务器发送的发言通知消息,并根据所述发言通知信息确定本地与会者是发言人时,获取本地与会者的发言语音信息并发送给所述多媒体会议服务器,以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给所述多媒体会议服务器。
相应于图16所示的应用于客户端的实现多媒体会议的装置,本发明还提供了一种实现多媒体会议的客户端。如图21所示,该客户端包括:处理器1610和发送器1620。
处理器1610,用于获取本地与会者的发言语音信息。
发送器1620,用于将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
本实施例提供的实现多媒体会议的客户端,与会者的客户端获得发言语音信息后发送给多媒体会议服务器,由多媒体会议服务器将发言语音信息转换成发言文字信息,然后,再将发言语音信息及对应的发言文字信息发送给参加多媒体会议的其它与会者对应的客户端。这样,参加多媒体会议的与会者既能够听到发言人的发言语音信息,又能够看到相应的发言文字信息,能够准确理解发言人的发言内容,提高多媒体会议的沟通效果。该方法由多媒体会议服务器将发言语音信息转换成发言文字信息,不需要在各个客户端上集成语音识别引擎,降低了客户端的生产成本。
相应于图17所示的应用于多媒体会议服务器的实现多媒体会议的装置,本发明还提供了多媒体会议服务器,如图22所示,所述多媒体会议服务器包括:处理器1710和发送器1720。
处理器1710,用于获取客户端发送的发言语音信息,并将所述发言语音信息转换成发言文字信息。
发送器1720,用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息。
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
本实施例提供的实现多媒体会议的装置,多媒体会议服务器检测各个与会者发出语音信息的能量,并按照能量由大到小的顺序,确定前预设数量个与会者为发言人。多媒体会议服务器只将确定出的发言人的发言内容转换成对应的文字信息。该方法能够避免将很多与会议无关的语音转换成文字,导致很多与会议无关的文字显示给与会者,对与会者造成的干扰现象出现。
本发明还提供了另一种多媒体会议系统,包括图21所示的客户端及图22所示的多媒体会议服务器。
所述客户端,用于获取本地与会者的发言语音信息,并发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息转换成发言文字信息,并将所述发言语音信息及与所述发言语音信息对应的发言文字信息发送给其它与会者对应的客户端;其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
所述其它与会者对应的客户端,还用于向用户展示所述多媒体会议服务器发送的发言语音信息及发言文字信息。
在本发明一个实施例中,所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,当接收到的发言语音信息来自确定出的发言人时,将所述发言语音信息转换成发言文字信息。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (24)

1.一种实现多媒体会议的方法,其特征在于,包括:
客户端获取本地与会者的发言语音信息,并将所述发言语音信息发送给多媒体会议服务器;
所述客户端将所述发言语音信息转换成发言文字信息;
所述客户端将所述发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
2.根据权利要求1所述的方法,其特征在于,所述客户端将所述发言语音信息转换为发言文字信息,包括:
接收多媒体会议服务器发送的发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出的前预设数量个与会者;
判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同;
如果所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同,利用语音识别引擎将采集到的发言语音信息转换成发言文字信息。
3.根据权利要求1所述的方法,其特征在于,所述客户端获取本地与会者的发言语音信息,包括:
所述客户端判断所述本地与会者是否具有发言权限;
如果所述本地与会者具有发言权限,则利用语音设备采集所述本地与会者的发言语音信息。
4.根据权利要求1所述的方法,其特征在于,所述客户端获取本地与会者的发言语音信息,包括:
所述客户端向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端;
当所述客户端接收到所述多媒体会议服务器发送的语音设备开启指令时,利用语音设备采集所述本地与会者的发言语音信息;所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。
5.一种实现多媒体会议的方法,其特征在于,包括:
多媒体会议服务器获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息,所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到;
所述多媒体会议服务器将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
6.根据权利要求5所述的方法,其特征在于,还包括:
所述多媒体会议服务器检测客户端发送的语音信息的能量;
所述多媒体会议服务器按照所述能量由大到小的顺序确定前预设数量个与会者为发言人;
所述多媒体会议服务器向所述发言人对应的客户端发送发言通知消息,所述发言通知消息携带所述发言人的用户身份识别信息ID,以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。
7.根据权利要求5所述的方法,其特征在于,还包括:
所述多媒体会议服务器接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID;
所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限;
所述多媒体会议服务器接收所述主持人对应的客户端发送的发言响应消息,并根据发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令,以使具有发言权限的与会者采集发言语音信息;
其中,所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生。
8.一种实现多媒体会议的方法,其特征在于,包括:
客户端获取本地与会者的发言语音信息;
所述客户端将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
9.一种实现多媒体会议的方法,其特征在于,包括:
多媒体会议服务器获取客户端发送的发言语音信息;
所述多媒体会议服务器将所述发言语音信息转换成发言文字信息;
所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
10.根据权利要求9所述的方法,其特征在于,所述多媒体会议服务器将所述发言语音信息转换成发言文字信息包括:
多媒体会议服务器检测客户端发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人;
利用语音识别引擎将确定出的发言人对应的客户端发送的发言语音信息转换为发言文字信息。
11.一种实现多媒体会议的装置,用于客户端,其特征在于,包括:
获取单元,用于获取本地与会者的发言语音信息;
转换单元,用于将所述发言语音信息转换成发言文字信息;
发送单元,用于将所述发言语音信息及所述发言文字信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给所述多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
12.根据权利要求11所述的装置,其特征在于,所述获取单元包括:
第一判断子单元,用于判断所述本地与会者是否具有发言权限;
第一采集子单元,用于当所述第一判断单元判定所述本地与会者具有发言权限时,则利用语音设备采集所述本地与会者的发言语音信息。
13.根据权利要求11所述的装置,其特征在于,所述转换单元包括:
第一接收子单元,用于接收多媒体会议服务器发送的发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID,所述发言人由多媒体会议服务器根据参加多媒体会议的与会者发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出的前预设数量个与会者;
第二判断子单元,用于判断所述发言通知消息所携带的用户ID与所述本地与会者的用户ID是否相同;
第二采集子单元,用于当所述第二判断子单元判定所述发言通知消息所携带的用户ID与所述本地与会者的用户ID相同时,利用语音设备采集所述本地与会者的发言语音信息。
14.根据权利要求11所述的装置,其特征在于,所述获取单元具体包括:
第一发送子单元,用于向多媒体会议服务器发送发言请求消息,所述发言请求消息携带所述本地与会者的用户ID,以使所述多媒体会议服务器将所述发言请求消息发送给主持人对应的客户端;
第二接收子单元,用于接收所述多媒体会议服务器发送的语音设备开启指令,
第三采集子单元,用于当所述第二接收子单元接收到所述语音设备开启指令时,利用语音设备采集所述本地与会者的发言语音信息;所述语音设备开启指令由所述多媒体会议服务器接收到主持人对应的客户端根据发言请求消息返回的发言响应消息产生。
15.一种实现多媒体会议的装置,用于多媒体会议服务器端,其特征在于,包括:
获取单元,用于获取客户端发送的发言语音信息及与所述发言语音信息相对应的发言文字信息,所述发言文字信息由所述客户端将获得的发言语音信息利用语音识别引擎转换得到;
第一发送单元,用于将所述发言语音信息及发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息及发言文字信息的与会者之外的与会者。
16.根据权利要求15所述的装置,其特征在于,还包括:
检测单元,用于检测客户端发送的语音信息的能量;
确定单元,用于按照所述能量由大到小的顺序确定前预设数量个与会者为发言人;
第二发送单元,用于向所述发言人对应的客户端发送发言通知消息,所述发言通知消息携带所述发言人的用户身份识别信息ID,以使所述发言人对应的客户端获取所述发言人的发言语音信息并将所述发言语音信息转换为发言文字信息。
17.根据权利要求15所述的装置,其特征在于,还包括:
第一接收单元,用于接收客户端发送的发言请求消息,所述发言请求消息携带所述客户端对应的与会者的用户ID;
第三发送单元,用于将所述发言请求消息发送给主持人对应的客户端,以使所述主持人对应的客户端根据所述发言请求消息判断发送发言请求消息的与会者是否具有发言权限;
第二接收单元,用于接收所述主持人对应的客户端发送的发言响应消息;所述发言响应消息由所述主持人对应的客户端确定发送所述发言请求消息的与会者具有发言权限时产生;
第四发送单元,用于根据所述发言响应消息向具有发言权限的与会者对应的客户端发送语音设备开启指令。
18.一种实现多媒体会议的装置,应用于客户端,其特征在于,包括:
获取单元,用于获取本地与会者的发言语音信息;
发送单元,用于将所述发言语音信息发送给多媒体会议服务器,以使所述多媒体会议服务器将所述发言语音信息转换为发言文字信息,以及使所述多媒体会议服务器将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
19.一种实现多媒体会议的装置,应用于多媒体服务器中,其特征在于,包括:
获取单元,用于获取客户端发送的发言语音信息;
转换单元,用于将所述发言语音信息转换成发言文字信息;
发送单元,用于将所述发言语音信息及所述发言文字信息发送给其它与会者对应的客户端,以使所述其它与会者对应的客户端展示所述发言语音信息及所述发言文字信息;
其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者。
20.根据权利要求19所述的装置,其特征在于,所述转换单元包括:
检测子单元,用于检测客户端发送的语音信息的能量,按照所述能量由大到小的顺序依次确定出前预设数量个与会者为发言人;
转换子单元,用于利用语音识别引擎将确定出的发言人发送的发言语音信息转换为发言文字信息。
21.一种实现多媒体会议系统,其特征在于,包括:客户端和多媒体会议服务器;
所述客户端,用于获取本地与会者的发言语音信息并发送给多媒体会议服务器;以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息及所述发言文字信息发送给参加多媒体会议的其它与会者的客户端;
其中,所述其它与会者是所述多媒体会议的与会者中除所述本地与会者之外的其它与会者。
22.根据权利要求21所述的多媒体会议系统,其特征在于:
所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,并向发言人对应的客户端发送发言通知消息,所述发言通知消息携带发言人的用户身份识别信息ID;
所述客户端,用于接收多媒体会议服务器发送的发言通知消息,并根据所述发言通知信息确定本地与会者是发言人时,获取本地与会者的发言语音信息并发送给所述多媒体会议服务器,以及将所述发言语音信息转换成发言文字信息,并将所述发言文字信息发送给所述多媒体会议服务器。
23.一种实现多媒体会议系统,其特征在于,包括:客户端和多媒体会议服务器;
所述客户端,用于获取本地与会者的发言语音信息,并发送给多媒体会议服务器;
所述多媒体会议服务器,用于将所述发言语音信息转换成发言文字信息,并将所述发言语音信息及与所述发言语音信息对应的发言文字信息发送给其它与会者对应的客户端;其中,所述其它与会者是参加所述多媒体会议的与会者中除发送所述发言语音信息的与会者之外的与会者;
所述其它与会者对应的客户端,还用于向用户展示所述多媒体会议服务器发送的发言语音信息及发言文字信息。
24.根据权利要求23所述的多媒体会议系统,其特征在于:
所述多媒体会议服务器,还用于检测参加所述多媒体体会议的客户端发送的语音信息的能量,按照所述能量由大到小的顺序确定前预设数量个与会者为发言人,当接收到的发言语音信息来自确定出的发言人时,将所述发言语音信息转换成发言文字信息。
CN201510255577.1A 2015-05-19 2015-05-19 实现多媒体会议的方法及装置 Pending CN106301811A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510255577.1A CN106301811A (zh) 2015-05-19 2015-05-19 实现多媒体会议的方法及装置
PCT/CN2015/099559 WO2016184118A1 (zh) 2015-05-19 2015-12-29 实现多媒体会议的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510255577.1A CN106301811A (zh) 2015-05-19 2015-05-19 实现多媒体会议的方法及装置

Publications (1)

Publication Number Publication Date
CN106301811A true CN106301811A (zh) 2017-01-04

Family

ID=57319318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510255577.1A Pending CN106301811A (zh) 2015-05-19 2015-05-19 实现多媒体会议的方法及装置

Country Status (2)

Country Link
CN (1) CN106301811A (zh)
WO (1) WO2016184118A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566340A (zh) * 2017-07-27 2018-01-09 杭州迅宜通信技术有限公司 一种会议辅助通信方法及其存储介质、装置
CN107993665A (zh) * 2017-12-14 2018-05-04 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN108234274A (zh) * 2016-12-12 2018-06-29 苏州乐聚堂电子科技有限公司 一种语音消息的显示方法
CN109003608A (zh) * 2018-08-07 2018-12-14 北京东土科技股份有限公司 庭审控制方法、系统、计算机设备及存储介质
CN109802968A (zh) * 2019-01-28 2019-05-24 深圳市飞图视讯有限公司 一种会议发言系统
CN110491384A (zh) * 2019-08-29 2019-11-22 联想(北京)有限公司 一种语音数据处理方法及装置
CN110557596A (zh) * 2018-06-04 2019-12-10 杭州海康威视数字技术股份有限公司 会议系统
CN110600035A (zh) * 2019-09-17 2019-12-20 深圳市天道日新科技有限公司 一种基于语音实时转写的展示系统
CN110648665A (zh) * 2019-09-09 2020-01-03 北京左医科技有限公司 一种会话过程记录系统及方法
CN111354356A (zh) * 2018-12-24 2020-06-30 北京搜狗科技发展有限公司 一种语音数据处理方法及装置
CN112420047A (zh) * 2019-08-23 2021-02-26 珠海金山办公软件有限公司 一种网络会议的通信方法、装置、用户终端及存储介质
CN112564926A (zh) * 2021-02-19 2021-03-26 全时云商务服务股份有限公司 一种网络会议的处理方法及系统
CN113128221A (zh) * 2021-05-08 2021-07-16 聚好看科技股份有限公司 一种保存发言内容的方法、显示设备及服务器
CN114339126A (zh) * 2021-12-29 2022-04-12 苏州科达特种视讯有限公司 视频会议中的字幕显示方法、设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291502B (zh) * 2020-02-24 2023-05-26 北京字节跳动网络技术有限公司 信息交互方法、装置、系统和电子设备
CN114567747A (zh) * 2020-11-27 2022-05-31 北京新媒传信科技有限公司 一种会议数据传输方法及会议系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267527A1 (en) * 2003-06-25 2004-12-30 International Business Machines Corporation Voice-to-text reduction for real time IM/chat/SMS
US20070143103A1 (en) * 2005-12-21 2007-06-21 Cisco Technology, Inc. Conference captioning
CN101309390A (zh) * 2007-05-17 2008-11-19 华为技术有限公司 视讯通信系统、装置及其字幕显示方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267527A1 (en) * 2003-06-25 2004-12-30 International Business Machines Corporation Voice-to-text reduction for real time IM/chat/SMS
US20070143103A1 (en) * 2005-12-21 2007-06-21 Cisco Technology, Inc. Conference captioning
CN101309390A (zh) * 2007-05-17 2008-11-19 华为技术有限公司 视讯通信系统、装置及其字幕显示方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234274A (zh) * 2016-12-12 2018-06-29 苏州乐聚堂电子科技有限公司 一种语音消息的显示方法
CN107566340A (zh) * 2017-07-27 2018-01-09 杭州迅宜通信技术有限公司 一种会议辅助通信方法及其存储介质、装置
CN107566340B (zh) * 2017-07-27 2020-12-08 杭州迅宜通信技术有限公司 一种会议辅助通信方法及其存储介质、装置
CN107993665A (zh) * 2017-12-14 2018-05-04 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN107993665B (zh) * 2017-12-14 2021-04-30 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN110557596A (zh) * 2018-06-04 2019-12-10 杭州海康威视数字技术股份有限公司 会议系统
CN109003608A (zh) * 2018-08-07 2018-12-14 北京东土科技股份有限公司 庭审控制方法、系统、计算机设备及存储介质
CN111354356A (zh) * 2018-12-24 2020-06-30 北京搜狗科技发展有限公司 一种语音数据处理方法及装置
CN111354356B (zh) * 2018-12-24 2024-04-30 北京搜狗科技发展有限公司 一种语音数据处理方法及装置
CN109802968B (zh) * 2019-01-28 2021-06-22 深圳市飞图视讯有限公司 一种会议发言系统
CN109802968A (zh) * 2019-01-28 2019-05-24 深圳市飞图视讯有限公司 一种会议发言系统
CN112420047A (zh) * 2019-08-23 2021-02-26 珠海金山办公软件有限公司 一种网络会议的通信方法、装置、用户终端及存储介质
CN110491384A (zh) * 2019-08-29 2019-11-22 联想(北京)有限公司 一种语音数据处理方法及装置
CN110491384B (zh) * 2019-08-29 2022-04-22 联想(北京)有限公司 一种语音数据处理方法及装置
CN110648665A (zh) * 2019-09-09 2020-01-03 北京左医科技有限公司 一种会话过程记录系统及方法
CN110600035A (zh) * 2019-09-17 2019-12-20 深圳市天道日新科技有限公司 一种基于语音实时转写的展示系统
CN112564926A (zh) * 2021-02-19 2021-03-26 全时云商务服务股份有限公司 一种网络会议的处理方法及系统
CN112564926B (zh) * 2021-02-19 2021-05-11 全时云商务服务股份有限公司 一种网络会议的处理方法及系统
CN113128221A (zh) * 2021-05-08 2021-07-16 聚好看科技股份有限公司 一种保存发言内容的方法、显示设备及服务器
CN114339126A (zh) * 2021-12-29 2022-04-12 苏州科达特种视讯有限公司 视频会议中的字幕显示方法、设备及存储介质

Also Published As

Publication number Publication date
WO2016184118A1 (zh) 2016-11-24

Similar Documents

Publication Publication Date Title
CN106301811A (zh) 实现多媒体会议的方法及装置
CN103392337B (zh) 传输管理系统、传输系统和传输管理系统程序
CN110459221A (zh) 多设备协同语音交互的方法和装置
CN106385603B (zh) 媒体文件的消息传输方法和装置
US20050207357A1 (en) Multipoint conferencing system employing IP network and its configuration method
KR102085383B1 (ko) 그룹 채팅 서비스를 이용하는 단말 및 이의 운용 방법
CN103905216B (zh) 组队方法、客户端、服务器及系统
US20120259924A1 (en) Method and apparatus for providing summary information in a live media session
CN105812713A (zh) 多人视频会议服务的参与者扩展方法及mcu网关
CN106789593B (zh) 一种融合手语的即时消息处理方法、服务器及系统
CN110267064A (zh) 音频播放状态处理方法、装置、设备及存储介质
CN103929349A (zh) 一种添加即时消息联系人的方法、装置和系统
CN102970512A (zh) 一种录制视频会议的控制方法及系统
CN103346953A (zh) 一种群组通讯数据交互的方法、装置及系统
CN103167327A (zh) 信息互动方法、装置及系统
CN109660368A (zh) 一种云会议系统及方法
CN108271096A (zh) 一种任务执行方法、装置、智能音箱及存储介质
CN104751868B (zh) 语音录制方法、通话录音回放方法以及相关装置和系统
CN115209083A (zh) 一种多视频会议协同开会方法、终端及存储介质
CN114710684B (zh) 一种直播间连麦方法、装置、设备及存储介质
CN114979545A (zh) 多终端的通话方法和存储介质及电子设备
CN114710461A (zh) 多端音视频即时通讯方法及系统
CN113450797A (zh) 基于在线会议的音频处理方法、设备、存储介质及系统
JP2003223407A (ja) コンテンツ共有支援システム、ユーザ端末装置、コンテンツ共有支援サーバ、複数のユーザ間でコンテンツを共有するための方法、そのプログラム並びにプログラム記録媒体
CN112839192A (zh) 基于浏览器的音视频通讯系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104