CN111355919B - 一种通信会话控制方法及装置 - Google Patents
一种通信会话控制方法及装置 Download PDFInfo
- Publication number
- CN111355919B CN111355919B CN201811580965.7A CN201811580965A CN111355919B CN 111355919 B CN111355919 B CN 111355919B CN 201811580965 A CN201811580965 A CN 201811580965A CN 111355919 B CN111355919 B CN 111355919B
- Authority
- CN
- China
- Prior art keywords
- participant
- communication session
- mute state
- participants
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,不仅可以将静音权限赋予给通信会话中更多的参与者,能够对嘈杂参与者快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,可以减少通信会话中的不可控行为,提高通信会话可靠性和质量。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置。
背景技术
两个或更多终端设备可以进行通信会话,例如电话会议或者视频会议,这也是一种目前常用的会话手段,非常方便。在进行通信会话时,通常会包括会议主持人和普通参与者,每个参与通信会话的终端设备都可以无差别地接收所有参与者的声音和/或画面,并且通常会议主持人具有控制参与者静音或发言状态的权限,可以使噪声嘈杂的参与者静音,但是只有会议主持人具有该权限,可能会处理不及时,降低通信会话质量。
现有技术中,提供了一种对通信会话控制方法,主要是可以授权参与通信会话的每一个参与者都具有使其他参与者静音或解除静音的权限,若为静音状态,则所有其他参与者都接收不到其音频数据,若解除静音状态,则所有其他参与者都可以接收其音频数据,但是这种方式,每个参与者具有同等的静音控制权限,会导致更多的不可控行为,例如可能出现恶意静音行为,影响通信会话的质量。
发明内容
本发明实施例提供一种通信会话控制方法及装置,以解决现有技术中通信会话静音控制权限的设置,可能会出现不可控行为,降低通信会话质量的问题。
本发明实施例提供的具体技术方案如下:
一种通信会话控制方法,通信会话中至少包括多个参与者,并且至少其中一个为管理方,包括:
获取通信会话中任意一个参与者的音频数据;
判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者。
可选的,判断所述任意一个参与者是否为静音状态时,进一步包括:若确定所述任意一个参与者不是静音状态,则将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者。
可选的,判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,进一步包括:若确定是预设管理方将所述任意一个参与者设置为静音状态,则不将所述任意一个参与者的音频数据转发给所有参与者。
可选的,若确定不是所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,进一步包括:
识别所述任意一个参与者是否正在发言;
根据识别结果,确定是否解除所述任意一个参与者的静音状态。
可选的,识别所述任意一个参与者是否正在发言,具体包括:
获取所述任意一个参与者的视频数据;
根据人脸识别算法,提取所述视频数据中的人脸信息,根据人脸信息,确定所述任意一个参与者是否正在发言。
可选的,根据识别结果,确定是否解除所述任意一个参与者的静音状态,具体包括:
若确定所述任意一个参与者正在发言,则解除所述任意一个参与者的静音状态,并将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者;
若确定所述任意一个参与者没有发言,则不解除所述任意一个参与者的静音状态。
可选的,若所述通信会话为视频通信会话,则进一步包括:
获取所述任意一个参与者的视频数据;
将所述任意一个参与者的视频数据转发给所述通信会话中的所有参与者。
一种通信会话控制装置,通信会话中至少包括多个参与者,并且至少其中一个为管理方,包括:
获取模块,用于获取通信会话中任意一个参与者的音频数据;
判断模块,用于判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
处理模块,用于若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者。
一种电子设备,包括:
至少一个存储器,用于存储计算机程序;
至少一个处理器,用于执行存储器中存储的计算机程序时实现上述任一种通信会话控制方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种通信会话控制方法的步骤。
本发明实施例中,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,可以将静音权限赋予通信会话中更多的参与者,能够对嘈杂参与者的快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,其他参与者正常接收,这样,可以减少通信会话中可能出现的不可控行为,提高通信会话可靠性和质量。
附图说明
图1为本发明实施例中通信会话控制方法的应用架构示意图;
图2为本发明实施例中一种通信会话控制方法的流程图;
图3为本发明实施例中另一种通信会话控制方法的流程图;
图4为本发明实施例中通信会话控制装置结构示意图;
图5为本发明实施例中电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前多个终端设备进行通信会话时,每个参与通信会话的终端设备都可以无差别地接收所有参与者的声音和/或画面,并且通常会议主持人具有控制参与者静音或发言状态的权限,可以屏蔽某参与者的噪声。
现有技术中提供的方案,还可以授权参与通信会话的每一个参与者都具有使其他参与者静音或解除静音的权限,每个参与者具有同等的静音控制权限,这样,将静音控制权限给予更多的参与者,可以对导致嘈杂参与者进行快速静音,提高通信会话质量,但是会导致更多的不可控行为。例如,若某个参与者正在发言时,被其他参与者误将其状态设置为静音状态,则所有参与者都将无法接收到其发言内容,可能会导致参与者错失重要的信息。又例如,可能出现两个参与者之间的恶意静音行为,将影响整个通信会话的通话质量。
因此,本发明实施例中为解决上述问题,将静音控制权限进行细分,主要分为主控制权限和临时控制权限,其中,主控制权限分配给通信会话中的管理方,例如为会议主持人,临时控制权限分配给普通参与者。这样,若会议主持人将某个参与者静音,则其他参与者,包括会议主持人都将无法收到该参与者的音频数据,而且其静音状态只有会议主持人有权限将其解除;若不是管理方将某个参与者静音,例如,参与者X将参与者Y静音,其中,参与者Y可以为会议主持人,则只有参与者X无法接收到参与者Y的音频数据,其他参与者可以正常接收。
并且还可以识别参与者Y是否正在发言,从而确定是否解除其静音状态,若参与者Y正在发言,则解除其静音状态,这时包括参与者X在内的所有参与者都可以接收到参与者Y的音频数据。
参阅图1所示,为本发明实施例中通信会话方法的应用架构示意图,至少包括多个参与者和服务器。
通信会话中可以包括1~N个参与者,每个参与者对应一个终端设备,也可以称为参与终端,终端设备可以是智能手机、平板电脑、便携式个人计算机等任何智能设备,通过智能设备上集成的音频采集装置和图像采集装置采集音频数据和视频数据。
其中,音频采集装置,例如为麦克风,图像采集装置例如为摄像头。
其中,通信会话的多个参与者中至少其中一个为管理方,较佳的为一个,例如管理方为通信会话的主持人,具有静音的主控制权限。
终端设备与服务器之间通过互联网相连,实现相互之间的通信。
服务器可以为终端设备提供各种网络服务,可以认为是提供相应网络服务的后台服务器,例如为视频会议服务器,或电话会议服务器。
例如,通信会话为视频会议,服务器为视频会议服务器,通过各个终端设备采集音视频数据,并将音视频数据发送给服务器,服务器进行处理,再将任意终端设备采集到的音视频数据转发给其他终端设备,其中,音视频数据即为音频数据和视频数据的简称。
本发明实施例中,服务器可以通过判断是否转发音视频数据,来使某个参与者静音或发言,本发明实施例中通信会话控制方法主要是由服务器执行。
其中,服务器可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。
需要说明的是,本发明实施例中的应用架构图是为了更加清楚地说明本发明实施例中的技术方案,并不构成对本发明实施例提供的技术方案的限制,对于其它的应用架构和业务应用,本发明实施例提供的技术方案对于类似的问题,同样适用。
本发明各个实施例中,以通信会话控制方法用于图1所示的应用架构图为例进行示意性说明。值得说明的是,本发明实施例中的通信会话控制方法可以应用于视频会议或电话会议等,并不进行限制。
参阅图2所示,为本发明实施例中,通信会话控制方法的流程图,该方法包括:
步骤200:获取通信会话中任意一个参与者的音频数据。
本发明实施例中,以任意一个参与者的音频数据是否转发,即其静音状态的控制为例进行说明,针对通信会话中所有参与者的音频数据处理都是类似的。
执行步骤200之前,建立通信会话,例如,各参与者通过终端设备上安装的相应的客户端加入通信会话。
例如,若通信会话为视频会议,则通过视频会议客户端加入视频会议。
这样,执行步骤200时,通过终端设备上集成的麦克风采集参与者的音频数据,然后,终端设备上的客户端将音频数据发送给服务器,进而服务器可以获取到各个参与者的音频数据。
步骤210:判断任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为通信会话中预设管理方将任意一个参与者设置为静音状态。
执行步骤210时,包括:
1)判断任意一个参与者是否为静音状态。
2)若确定为静音状态,则进一步判断是否为通信会话中预设管理方将任意一个参与者设置为静音状态。
其中,预设管理方为通信会话中具有主静音控制权限的参与者,例如,通常为通信会话主持人,也可以称为管理终端。
本发明实施例中,主要将静音控制权限分为主控制权限和临时控制权限,若其为静音状态,则需要进一步判断是否为管理方将其设置为静音状态的,从而可以通过判断的结果,进行相应的处理,来避免通信会话中的恶意静音或误静音的行为,减少不可控行为。
进一步地,判断该任意一个参与者是否为静音状态时,若确定该任意一个参与者不是静音状态,则将该任意一个参与者的音频数据转发给通信会话中的所有参与者。
即若参与者不是静音状态,则通信会话中所有参与者都可以接收到其音频数据,不需要限制其音频数据的转发。
步骤220:若确定不是,则将任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者。
也就是说,若该任意一个参与者的静音状态不是管理方设置的,例如是普通参与者X设置的,这时,只要参与者X无法接收到该任意一个参与者的音频数据,而其他参与者都可以正常接收该任意一个参与者的音频数据。
其中,需要说明的是,任意的参与者,包括管理方和普通参与者,都可以将通信会话中的参与者设置为静音状态,例如普通参与者X可以将管理方设置为静音状态,这样,相对于只有管理方可以设置其他参与者静音的情况,所有参与者都可以静音权限,可以对背景噪声较大的参与者快速静音,屏蔽噪声干扰,提高通信会话的质量。
并且本发明实施例中,普通参与者设置静音状态的,只有该将其设置为静音状态的参与者无法接收其音频数据,这样,还可以避免参与者之间的恶意静音行为或误操作行为,不会影响通信会话中其他参与者的通话质量。
进一步地,若静音状态的参与者正在发言,则可能会造成将其设置为静音状态的普通参与者错失一些重要信息,因此为保证可靠性,本发明实施例中还提供了一种可能的实施方式,具体为:
若确定不是通信会话中预设管理方将该任意一个参与者设置为静音状态时,进一步包括:识别任意一个参与者是否正在发言;根据识别结果,确定是否解除任意一个参与者的静音状态。
具体地:1)识别任意一个参与者是否正在发言,具体包括:获取任意一个参与者的视频数据;根据人脸识别算法,提取视频数据中的人脸信息,根据人脸信息,确定任意一个参与者是否正在发言。
本发明实施例中提供了一种通过人脸识别技术,来判断参与者是否正在发言的方式,例如,提取出人脸信息后,可以通过识别人脸中口部肌肉的动态变化,来确定是否正在发言。
2)根据识别结果,确定是否解除该任意一个参与者的静音状态,具体包括:若确定该任意一个参与者正在发言,则解除任意一个参与者的静音状态,并将任意一个参与者的音频数据转发给通信会话中的所有参与者;若确定该任意一个参与者没有发言,则不解除任意一个参与者的静音状态。
本发明实施例中,为防止将其设置为静音状态的参与者错失其发言,因此,通过人脸识别技术判断,若正在发言,即判断出该任意一个参与者在说话,则自动解除其静音状态,这时,将该任意一个参与者设置为静音状态的参与者也可以接收到该任意一个参与者的发言。
也就是说,本发明实施例中,通信会话中的除管理方的其他参与者,可以有设置他人静音的权限,但主要是为了屏蔽噪声的干扰,不是参与者发言的声音,因此若正在发言,则解除静音状态,通信会话中的除管理方的其他参与者不能屏蔽他人的正常发言。
并且,若判断没有发言,则无需解除其静音状态,仍然是将该任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,将其设置为静音状态的参与者无法接收其音频数据。
进一步地,由于人脸识别可能会消耗一定时间,为了保证视频会议中视频流畅,本发明实施例中还提供了一种可能的实施方式,基于预设帧周期进行人脸识别,确定其是否正在发言。
其中,预设帧周期,例如1帧,即隔帧处理,本发明实施例中并不进行限制,可以根据处理速度和硬件要求进行设置。
进一步地,在判断是否为通信会话中预设管理方将该任意一个参与者设置为静音状态时,还可以包括:若确定是预设管理方将该任意一个参与者设置为静音状态,则不将该任意一个参与者的音频数据转发给所有参与者。
也就是说,本发明实施例中,通信会话中的管理方具有使其它成员静音的主控制权,若管理方将某个参与者静音,则其他参与者,包括管理方都将无法接收到该静音状态的参与者的音频数据,并且此时该参与者的静音状态只有管理方有权限将其解除,即管理方不仅可以屏蔽其他参与者的噪声,也可以禁止其他参与者的发言。
进一步地,本发明实施例中若通信会话为视频通信会话,则还包括:获取任意一个参与者的视频数据;将任意一个参与者的视频数据转发给通信会话中的所有参与者。
即若为视频通信会话,不管该任意一个参与者是否为静音状态,都可以将其视频数据转发给所有参与者。
本发明实施例中,服务器获取到任意一个参与者的音频数据后,判断该任意一个参与者是否为静音状态,若确定为静音状态,则需要进一步判断是否为预设管理方将该任意一个参与者设置为静音状态,若确定是,则不将该任意一个参与者的音频数据转发给所有参与者,若确定不是,则将该任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,将其设置为静音状态的参与者不能接收其音频数据,这样,不仅可以将静音权限赋予通信会话中更多的参与者,能够对嘈杂参与者的快速静音,提高通信会话的质量,并且本发明实施例中,还将静音权限进行细分,管理方具有主控制权限,若管理方将某参与者静音,则其他参与者包括管理方都无法收到该某参与者的音频数据,并且只有管理方能解除其静音状态,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,其他参与者正常接收,这样,可以减少通信会话中可能出现的不可控行为,提高通信会话可靠性和质量。
并且,若不是管理方将某参与者静音时,还可以通过识别该参与者是否正在发言,从而确定是否解除其静音状态,可以避免将其设置为静音状态的参与者遗漏其正常的发言内容,提升通信会话体验。
下面采用具体的应用场景进行具体说明,以通信会话为视频会议,上述任意一个参与者为参与者Y为例,并且为便于描述,将音频数据和视频数据的之和简称为音视频数据,则基于上述实施例,具体参阅图3所示,为本发明实施例中另一种通信会话控制方法流程图,具体包括:
步骤300:开始。
步骤301:获取参与者Y的音视频数据。
例如,通过参与者Y的终端设备上的摄像头和麦克风,采集参与者Y的视频数据和音频数据。
步骤302:判断参与者Y是否为静音状态,若是,则执行步骤304,否则,则执行步骤303。
步骤303:将参与者Y的音视频数据转发给所有参与者。
即参与者Y不是静音状态时,可以将其音视频数据转发给所有参与者。
步骤304:判断是否为预设管理方将参与者Y设置为静音状态,若是,则执行步骤305,否则,则执行步骤306。
即本发明实施例中区分静音权限,若参与者Y是静音状态,还需要进一步判断将参与者Y设置为静音状态的是管理方还是普通参与者。
步骤305:将参与者Y的视频数据转发给所有参与者。
即若是管理方将参与者Y设置为静音状态,则只转发参与者Y的视频数据,其音频数据不进行转发,视频会议中其他参与者只能看到参与者Y的视频数据,但不能听到声音。
步骤306:识别参与者Y是否正在发言。
具体地:获取参与者Y的视频数据,并根据人脸识别算法,提取视频数据中的人脸信息,根据人脸信息,确定参与者Y是否正在发言。
步骤307:判断参与者Y是否正在发言,若是,则执行步骤308,否则,则执行步骤309。
步骤308:解除参与者Y的静音状态,并将参与者Y的音视频数据转发给所有参与者。
即这时,判断出参与者Y正在发言,可以自动解除其静音状态,所有参与者包括将其设置为静音状态的参与者,都可以接收到其音视频数据。
步骤309:将参与者Y的视频数据转发给所有参与者,并将参与者Y的音频数据转发给除将其设置为静音状态的参与者之外的其他参与者。
即若参与者Y没有发言,并且其静音状态不是管理方设置的,例如为某个普通参与者X设置的,则这时只有参与者X不能接收到参与者Y的音频数据,其他参与者可以正常接收参与者Y的音频数据,并且此时所有参与者,包括参与者X都可以接收其视频数据。
步骤310:结束。
基于上述实施例,参阅图4所示为本发明实施例中,通信会话控制装置结构示意图,其中,通信会话中至少包括多个参与者,并且至少其中一个为管理方,该装置具体包括:
获取模块40,用于获取通信会话中任意一个参与者的音频数据;
判断模块41,用于判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
处理模块42,用于若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者。
可选的,判断所述任意一个参与者是否为静音状态时,处理模块42进一步用于:若确定所述任意一个参与者不是静音状态,则将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者。
可选的,判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,处理模块42进一步用于:若确定是预设管理方将所述任意一个参与者设置为静音状态,则不将所述任意一个参与者的音频数据转发给所有参与者。
可选的,若确定不是所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,进一步包括:
识别模块43,用于识别所述任意一个参与者是否正在发言;
确定模块44,用于根据识别结果,确定是否解除所述任意一个参与者的静音状态。
可选的,识别所述任意一个参与者是否正在发言时,识别模块43具体用于:获取所述任意一个参与者的视频数据;根据人脸识别算法,提取所述视频数据中的人脸信息,根据人脸信息,确定所述任意一个参与者是否正在发言。
可选的,根据识别结果,确定是否解除所述任意一个参与者的静音状态时,确定模块44具体用于:
若确定所述任意一个参与者正在发言,则解除所述任意一个参与者的静音状态,并将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者;
若确定所述任意一个参与者没有发言,则不解除所述任意一个参与者的静音状态。
可选的,若所述通信会话为视频通信会话,则获取模块40进一步用于:获取所述任意一个参与者的视频数据;
处理模块42进一步用于:将所述任意一个参与者的视频数据转发给所述通信会话中的所有参与者。
参阅图5所示,本发明实施例中,一种电子设备结构示意图。
本发明实施例提供了一种电子设备,该电子设备可以包括处理器510(CenterProcessing Unit,CPU)、存储器520、输入设备530和输出设备540等,输入设备530可以包括键盘、鼠标、触摸屏等,输出设备540可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器520可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器510提供存储器520中存储的程序指令和数据。在本发明实施例中,存储器520可以用于存储上述通信会话控制方法的程序。
处理器510通过调用存储器520存储的程序指令,处理器510用于按照获得的程序指令执行:
获取通信会话中任意一个参与者的音频数据;
判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者。
可选的,判断所述任意一个参与者是否为静音状态时,处理器510进一步用于:若确定所述任意一个参与者不是静音状态,则将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者。
可选的,判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,处理器510进一步用于:
若确定是预设管理方将所述任意一个参与者设置为静音状态,则不将所述任意一个参与者的音频数据转发给所有参与者。
可选的,若确定不是所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,处理器510进一步用于:
识别所述任意一个参与者是否正在发言;
根据识别结果,确定是否解除所述任意一个参与者的静音状态。
可选的,识别所述任意一个参与者是否正在发言时,处理器510具体用于:
获取所述任意一个参与者的视频数据;
根据人脸识别算法,提取所述视频数据中的人脸信息,根据人脸信息,确定所述任意一个参与者是否正在发言。
可选的,根据识别结果,确定是否解除所述任意一个参与者的静音状态时,处理器510具体用于:
若确定所述任意一个参与者正在发言,则解除所述任意一个参与者的静音状态,并将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者;
若确定所述任意一个参与者没有发言,则不解除所述任意一个参与者的静音状态。
可选的,若所述通信会话为视频通信会话,则处理器510进一步用于:
获取所述任意一个参与者的视频数据;
将所述任意一个参与者的视频数据转发给所述通信会话中的所有参与者。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的通信会话控制方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种通信会话控制方法,其特征在于,通信会话中至少包括多个参与者,并且至少其中一个为管理方,包括:
获取通信会话中任意一个参与者的音频数据;
判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者;
若确定不是所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,进一步包括:识别所述任意一个参与者是否正在发言;根据识别结果,确定是否解除所述任意一个参与者的静音状态。
2.如权利要求1所述的方法,其特征在于,判断所述任意一个参与者是否为静音状态时,进一步包括:
若确定所述任意一个参与者不是静音状态,则将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者。
3.如权利要求1所述的方法,其特征在于,判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,进一步包括:
若确定是预设管理方将所述任意一个参与者设置为静音状态,则不将所述任意一个参与者的音频数据转发给所有参与者。
4.如权利要求1所述的方法,其特征在于,识别所述任意一个参与者是否正在发言,具体包括:
获取所述任意一个参与者的视频数据;
根据人脸识别算法,提取所述视频数据中的人脸信息,根据人脸信息,确定所述任意一个参与者是否正在发言。
5.如权利要求1所述的方法,其特征在于,根据识别结果,确定是否解除所述任意一个参与者的静音状态,具体包括:
若确定所述任意一个参与者正在发言,则解除所述任意一个参与者的静音状态,并将所述任意一个参与者的音频数据转发给所述通信会话中的所有参与者;
若确定所述任意一个参与者没有发言,则不解除所述任意一个参与者的静音状态。
6.如权利要求1-5任一项所述的方法,其特征在于,若所述通信会话为视频通信会话,则进一步包括:
获取所述任意一个参与者的视频数据;
将所述任意一个参与者的视频数据转发给所述通信会话中的所有参与者。
7.一种通信会话控制装置,其特征在于,通信会话中至少包括多个参与者,并且至少其中一个为管理方,包括:
获取模块,用于获取通信会话中任意一个参与者的音频数据;
判断模块,用于判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;
处理模块,用于若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者;
若确定不是所述通信会话中预设管理方将所述任意一个参与者设置为静音状态时,还包括:识别模块,用于识别所述任意一个参与者是否正在发言;确定模块,用于根据识别结果,确定是否解除所述任意一个参与者的静音状态。
8.一种电子设备,其特征在于,包括:
至少一个存储器,用于存储计算机程序;
至少一个处理器,用于执行存储器中存储的计算机程序时实现如权利要求1-6中任意一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-6中任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811580965.7A CN111355919B (zh) | 2018-12-24 | 2018-12-24 | 一种通信会话控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811580965.7A CN111355919B (zh) | 2018-12-24 | 2018-12-24 | 一种通信会话控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111355919A CN111355919A (zh) | 2020-06-30 |
CN111355919B true CN111355919B (zh) | 2021-05-25 |
Family
ID=71195462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811580965.7A Active CN111355919B (zh) | 2018-12-24 | 2018-12-24 | 一种通信会话控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111355919B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112203038B (zh) * | 2020-10-12 | 2022-09-16 | 北京字节跳动网络技术有限公司 | 在线会议的处理方法、装置、电子设备及计算机存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025972A (zh) * | 2010-12-16 | 2011-04-20 | 中兴通讯股份有限公司 | 应用于视频会议的静音指示的方法及装置 |
CN103703719A (zh) * | 2011-05-31 | 2014-04-02 | 谷歌公司 | 使通信会话中的参与者静音 |
CN103903074A (zh) * | 2012-12-24 | 2014-07-02 | 华为技术有限公司 | 一种视频交流的信息处理方法及装置 |
CN105979197A (zh) * | 2016-07-19 | 2016-09-28 | 块互动(北京)科技有限公司 | 基于啸叫音自动识别的远程会议控制方法及装置 |
CN108111701A (zh) * | 2016-11-24 | 2018-06-01 | 北京中创视讯科技有限公司 | 静音处理方法和装置 |
CN108347418A (zh) * | 2017-01-24 | 2018-07-31 | 展讯通信(上海)有限公司 | 会议电话的控制方法、装置及多通终端 |
CN108900796A (zh) * | 2018-08-28 | 2018-11-27 | 广东佳米科技有限公司 | 一种渐进式会议控制方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009057725A1 (de) * | 2009-12-10 | 2011-06-16 | Siemens Enterprise Communications Gmbh & Co. Kg | Signalgebende Vorrichtung, Signalisiervorrichtung, Signalgebungsverfahren sowie Signalisierverfahren |
CN102137062B (zh) * | 2010-01-22 | 2016-06-08 | 中兴通讯股份有限公司 | 基于下一代业务接口的多媒体会议控制方法及系统 |
CN108933673B (zh) * | 2017-05-25 | 2023-04-07 | 中兴通讯股份有限公司 | 一种视频会议实现方法、终端、服务器及存储介质 |
US20180351885A1 (en) * | 2017-06-01 | 2018-12-06 | Motorola Mobility Llc | Managing Mute or Snooze Functionality in a Chat Conversation |
-
2018
- 2018-12-24 CN CN201811580965.7A patent/CN111355919B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025972A (zh) * | 2010-12-16 | 2011-04-20 | 中兴通讯股份有限公司 | 应用于视频会议的静音指示的方法及装置 |
CN103703719A (zh) * | 2011-05-31 | 2014-04-02 | 谷歌公司 | 使通信会话中的参与者静音 |
CN103903074A (zh) * | 2012-12-24 | 2014-07-02 | 华为技术有限公司 | 一种视频交流的信息处理方法及装置 |
CN105979197A (zh) * | 2016-07-19 | 2016-09-28 | 块互动(北京)科技有限公司 | 基于啸叫音自动识别的远程会议控制方法及装置 |
CN108111701A (zh) * | 2016-11-24 | 2018-06-01 | 北京中创视讯科技有限公司 | 静音处理方法和装置 |
CN108347418A (zh) * | 2017-01-24 | 2018-07-31 | 展讯通信(上海)有限公司 | 会议电话的控制方法、装置及多通终端 |
CN108900796A (zh) * | 2018-08-28 | 2018-11-27 | 广东佳米科技有限公司 | 一种渐进式会议控制方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于IMS的多媒体会议系统的研究与设计;杨长虹;《陕西科技大学学报(自然科学版)》;20101025;第28卷(第5期);120-124 * |
Also Published As
Publication number | Publication date |
---|---|
CN111355919A (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10491858B2 (en) | Video conference audio/video verification | |
US8630208B1 (en) | Muting of communication session participants | |
US11710488B2 (en) | Transcription of communications using multiple speech recognition systems | |
US10142578B2 (en) | Method and system for communication | |
US10732924B2 (en) | Teleconference recording management system | |
US10586131B2 (en) | Multimedia conferencing system for determining participant engagement | |
WO2016127691A1 (zh) | 一种播报多媒体会议中动态信息的方法及装置 | |
US11164577B2 (en) | Conversation aware meeting prompts | |
CN115022576A (zh) | 一种极端网络环境下网络会议优化方法及装置 | |
US9325853B1 (en) | Equalization of silence audio levels in packet media conferencing systems | |
US20180255163A1 (en) | Automatically delaying playback of a message | |
CN111355919B (zh) | 一种通信会话控制方法及装置 | |
CN116758896A (zh) | 会议音频语种调整方法、装置、电子设备和存储介质 | |
US11783837B2 (en) | Transcription generation technique selection | |
US20200184973A1 (en) | Transcription of communications | |
US10182207B2 (en) | Handling nuisance in teleconference system | |
CN115550595A (zh) | 线上会议实现方法、装置、设备及可读存储介质 | |
US10818295B1 (en) | Maintaining network connections | |
CN108924465B (zh) | 视频会议发言人终端的确定方法、装置、设备和存储介质 | |
US20150036552A1 (en) | Method and Apparatus for the Encoding of Participants in a Conference Setting | |
CN113923395A (zh) | 一种提升会议质量的方法、设备和存储介质 | |
KR102505345B1 (ko) | 하울링 제거 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
WO2024120022A1 (zh) | 会议系统的控制方法、服务器和存储介质 | |
US20240129432A1 (en) | Systems and methods for enabling a smart search and the sharing of results during a conference | |
US20230282225A1 (en) | Dynamic noise and speech removal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |