CN105141884A - 混合会议中广播音视频码流的控制方法、装置及系统 - Google Patents

混合会议中广播音视频码流的控制方法、装置及系统 Download PDF

Info

Publication number
CN105141884A
CN105141884A CN201510530888.4A CN201510530888A CN105141884A CN 105141884 A CN105141884 A CN 105141884A CN 201510530888 A CN201510530888 A CN 201510530888A CN 105141884 A CN105141884 A CN 105141884A
Authority
CN
China
Prior art keywords
video
terminal
code stream
audio
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510530888.4A
Other languages
English (en)
Inventor
石文娟
罗东礼
房滔
万春雷
范军爽
翟小刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Keda Technology Co Ltd
Original Assignee
Suzhou Keda Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Keda Technology Co Ltd filed Critical Suzhou Keda Technology Co Ltd
Priority to CN201510530888.4A priority Critical patent/CN105141884A/zh
Publication of CN105141884A publication Critical patent/CN105141884A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种混合会议中广播音视频码流的控制方法、装置及系统,其中该方法包括以下步骤:根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;对所述多路音视频码流进行解码;将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;将所述单路音视频码流发送给所述观众终端。本发明能够实现在不会额外增加单流终端占用带宽的情况下在混合会议中广播音视频码流。

Description

混合会议中广播音视频码流的控制方法、装置及系统
技术领域
本发明涉及多媒体通信技术领域,具体地说涉及一种混合会议中广播音视频码流的控制方法、装置及系统。
背景技术
目前的视频会议终端分为单流终端和多流终端,单流终端是只具有接收和发送单路音视频码流能力的终端,多流终端是具有接收和发送多路音视频码流能力的终端。
在多流终端和单流终端的混合会议中,特别是目前的网真视频会议中,需要多流终端发送或接收多路音视频码流以实现重现会议室一比一大小的全景画面,如图1所示,多流终端发送和接收多路音视频码流给会议控制服务器,单流终端发送单路音视频码流给会议控制服务器,为了保证单流终端也能接收到多流终端的全部图像,目前大多数方法是通过扩充单流终端的接收能力,例如单流终端接收多路音视频码流,让单流终端定制播放的画面,该方法会使单流终端产生额外的带宽要求,对网络带宽的要求过高,对单流终端的解码能力也有非常高的要求。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中通过扩充单流终端的接收能力来实现单流终端能够接收多流终端的全部图像会带来对带宽要求过高的问题,从而提出一种不会额外增加单流终端占用带宽的混合会议中广播音视频码流的控制方法、装置及系统。
本发明的一种混合会议中广播音视频码流的控制方法,包括以下步骤:
根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;
当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;
对所述多路音视频码流进行解码;
将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;
将所述单路音视频码流发送给所述观众终端。
优选地,还包括以下步骤:
当所述广播终端为单流终端时,接收所述广播终端发送的单路音视频码流;
将该单路音视频码流发送给所述观众终端。
优选地,根据广播终端或观众终端所支持的媒体流数分别判断是多流终端还是单流终端的步骤包括:
接收所述广播终端或观众终端发送的媒体能力消息;
判断所述媒体能力消息中包含的音频标签或视频标签是多路还是单路;
当包含的音频标签或视频标签是多路时,判断所述广播终端或观众终端为多流终端;
当包含的音频标签或视频标签是单路时,判断所述广播终端或观众终端为单流终端。
优选地,所述将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
本发明的一种混合会议中广播音视频码流的控制装置,包括:
第一判断单元,用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;
第一接收单元,用于当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;
解码单元,用于对所述多路音视频码流进行解码;
编码单元,用于将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;
第一发送单元,用于将所述单路音视频码流发送给所述观众终端。
优选地,还包括:
第二接收单元,用于当所述广播终端为单流终端时,接收所述广播终端发送的单路音视频码流;
第二发送单元,用于将该单路音视频码流发送给所述观众终端。
优选地,所述第一判断单元包括:
第三接收单元,用于接收所述广播终端或观众终端发送的媒体能力消息;
第二判断单元,用于判断所述媒体能力消息中包含的音频标签或视频标签是多路还是单路;
第一终端类型获得单元,用于当包含的音频标签或视频标签是多路时,判断所述广播终端或观众终端为多流终端;
第二终端类型获得单元,用于当包含的音频标签或视频标签是单路时,判断所述广播终端或观众终端为单流终端。
优选地,所述编码单元包括:
发言坐席确定单元,用于对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
单路音频码流获得单元,用于对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
单路视频码流获得单元,用于将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
本发明的一种混合会议中广播音视频码流的控制系统,包括会议控制服务器、广播终端和观众终端;
所述会议控制服务器,用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;对所述多路音视频码流进行解码;将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;将所述单路音视频码流发送给所述观众终端。
所述广播终端,用于向所述会议控制服务器发送音视频码流;
所述观众终端,用于接收所述会议控制服务器发送的音视频码流。
优选地,所述将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
本发明的上述技术方案相比现有技术具有以下优点:
本发明中,首先根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端,会议控制服务器据此进行音视频码流的调度控制,从而在会议过程中,会议控制服务器可以让与会的各种终端都能自动接收最优的效果,使与会者无需进行任何操作进而只专注于会议内容;特别是对于广播终端为多流终端且观众终端为单流终端的情况,会议控制服务器将接收到的多流广播终端发送的多路音视频码流进行解码、编码操作后进行合成,形成单路音视频码流后发送给单流观众终端,从而单流终端可以接收到包含所有多路音视频码流信息的会议画面图像和内容等,并且不会额外增加单流终端的占用带宽,降低了对单流终端带宽的要求,节约了带宽资源,也降低了混合会议系统的成本。
本发明中,通过在构建混合会议时,各个终端会向会议控制服务器上报媒体能力,根据终端向会议控制服务器发送的媒体能力消息中包含的音频标签或视频标签是多路还是单路,来判断终端是多流终端还是单流终端,从而实现了对多流终端和单流终端的快速、有效地区分,提高了判断的效率和节约了整个方法的处理时间。
本发明中,通过对解码后的语音数据进行语音激励,可以有效地分辨出作为发言坐席一路的语音数据,使得会议控制服务器可以时刻监视到发言坐席。在语音合成时,合成为一路的合成语音数据,并将其编码成为单路音频码流。通过根据一大多小的画面风格,将发言座席一路的视频数据缩放后填充到大画面中,以大图像的形式展现,将解码后的视频数据中的其他视频数据填充到小画面中,以小图像的形式展现,并以填充后的画面风格编码成为单路视频码流,从而可以将发言坐席可以大图像突出显示,即合成的大图像可以随着发言坐席的改变而改变,起到了突出发言人的作用,并保证了在多路音视频码流编码合成时可以包含所有多路音视频码流的信息,在单流终端上可以展现出会场的全景图像。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是现有技术中单流终端与多流终端之间音视频码流的收发过程图;
图2是本发明实施例1中单流终端与多流终端之间音视频码流的收发过程图;
图3是本发明实施例1中混合会议中广播音视频码流的控制方法的一个具体示例的流程图;
图4是本发明实施例1中混合会议中广播音视频码流的控制方法的一个具体示例的流程图;
图5是本发明实施例2中混合会议中广播音视频码流的控制装置的一个具体示例的结构框图;
图6是本发明实施例3中混合会议中广播音视频码流的控制系统的一个具体示例的结构框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
如图2所示,与会议控制服务器建立会议的包括多个多流终端和多个单流终端,构成一种混合会议的形式。其中音视频码流的收发过程可以分为如下两类:
1)一个多流终端作为广播终端、其他多流终端和单流终端均作为观众终端进行的音视频码流的收发过程,如图2中实线箭头所示,一个多流终端将多路音视频码流发送给会议控制服务器,会议控制服务器将多路音视频码流发送给其他多流终端,同时还将该多路音视频码流转化成单路音视频码流,并将其发送给单流终端;
2)一个单流终端作为广播终端、其他单流终端和多流终端均作为观众终端进行的音视频码流的收发过程,如图2中虚线箭头所示,一个单流终端将单路音视频码流发送给会议控制服务器,会议控制服务器将该单路音视频码流发送给其他单流终端和多流终端。
为了能在单流终端与多流终端之间对音视频码流的收发进行控制,本实施例提供一种混合会议中广播音视频码流的控制方法,如图3所示,该方法例如应用于图2中的会议控制服务器,包括以下步骤:
步骤S1、根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端。当广播终端为多流终端且观众终端为单流终端时,进入步骤S2至S5;当广播终端为多流终端且观众终端为多流终端时,进入步骤S6;当广播终端为单流终端且观众终端为单流终端或多流终端时,进入步骤S7。
步骤S2、接收广播终端发送的多路音视频码流。
步骤S3、对多路音视频码流进行解码。可以采用任意现有的音视频码流解码方法来对多路音视频码流进行解码。
步骤S4、将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流。
步骤S5、将单路音视频码流发送给观众终端。
步骤S6、接收广播终端发送的多路音视频码流,并直接将接收到的多路音视频码流转发给观众终端。
步骤S7、接收广播终端发送的单路音视频码流,并直接将接收到的单路音视频码流转发给观众终端。
本实施例,首先根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端,会议控制服务器据此进行音视频码流的调度控制,从而在会议过程中,会议控制服务器可以让与会的各种终端都能自动接收最优的效果,使与会者无需进行任何操作进而只专注于会议内容;特别是对于广播终端为多流终端且观众终端为单流终端的情况,会议控制服务器将接收到的多流广播终端发送的多路音视频码流进行解码、编码操作后进行合成,形成单路音视频码流后发送给单流观众终端,从而单流终端可以接收到包含所有多路音视频码流信息的会议画面图像和内容等,并且不会额外增加单流终端的占用带宽,降低了对单流终端带宽的要求,节约了带宽资源,也降低了混合会议系统的成本。
作为一种优选实施方式,如图4所示,上述步骤S1中判断广播终端是多流终端还是单流终端的步骤包括:
步骤S11、接收广播终端发送的媒体能力消息。
步骤S12、判断媒体能力消息中包含的音频(audio)标签或视频(video)标签是多路还是单路。
步骤S13、当包含的音频(audio)标签或视频(video)标签是多路时,判断广播终端为多流终端。
步骤S14、当包含的是音频(audio)标签或视频(video)标签是单路时,判断广播终端为单流终端。
上述步骤S1中判断观众终端是多流终端还是单流终端的步骤与上述判断广播终端的步骤相同。本领域的技术人员应当理解,判断广播终端或观众终端是多流终端还是单流终端的方式并不限于上述步骤S11-S14来实现,也可以采用能够区分是多流终端还是单流终端的其他方法来实现。
本实施例,通过在构建混合会议时,各个终端会向会议控制服务器上报媒体能力,根据终端向会议控制服务器发送的媒体能力消息中包含的音频标签或视频标签是多路还是单路,来判断终端是多流终端还是单流终端,从而实现了对多流终端和单流终端的快速、有效地区分,提高了判断的效率和节约了整个方法的处理时间。
作为一种优选实施方式,上述步骤S4中将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
步骤S41、对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据。
步骤S42、对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流。即实现了将多路音频码流进行语音合成为一路语音,形成单路音频码流。
步骤S43、将发言座席一路的视频数据缩放后填充到大画面中,将解码后视频数据中的其他视频数据填充到小画面中,以形成一大多小的画面风格,并以填充后的画面风格编码成为单路视频码流。通过,将发言座席一路的视频数据缩放后填充到大画面中,同时将解码后视频数据中的的其他视频数据填充到小画面中,从而可以突出发言坐席一路的视频数据。在本实施例中,该缩放的过程例如是当发言坐席一路的视频码流所对应的图像与大画面相比较小时,需要对图像进行放大处理,即发言坐席一路的视频码流解码后的视频数据扩充(放大)后填充到大画面中;当发言坐席一路的视频码流所对应的图像与大画面相比较大时,需要对图像进行缩小处理,即发言坐席一路的视频码流解码后的视频数据缩减后填充到大画面中,该数据扩充或缩减的方式可以采用一些常规的处理方式。即实现了将多路视频码流进行画面合成为一路画面,形成单路视频码流。
本领域的技术人员应当理解,将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的方式并不限于上述步骤S41-S43来实现,也可以采用能够实现多路音视频码流转换成单路音视频码流的其他方法来实现。
本实施例,通过对解码后的语音数据进行语音激励,可以有效地分辨出作为发言坐席一路的语音数据,使得会议控制服务器可以时刻监视到发言坐席。在语音合成时,合成为一路的语音数据,并将其编码成为单路音频码流。通过根据一大多小的画面风格,将发言座席一路的视频数据缩放后填充到大画面中,以大图像的形式展现,将解码后的视频数据中的其他视频数据填充到小画面中,以小图像的形式展现,并以填充后的画面风格编码成为单路视频码流,从而可以将发言坐席可以大图像突出显示,即合成的大图像可以随着发言坐席的改变而改变,起到了突出发言人的作用,并保证了在多路音视频码流编码合成时可以包含所有多路音视频码流的信息,在单流终端上可以展现出会场的全景图像。
实施例2
对应于实施例1,本实施例提供一种混合会议中广播音视频码流的控制装置,如图5所示,该装置例如应用于图2中的会议控制服务器,包括:
第一判断单元1,用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端。
第一接收单元2,用于当广播终端为多流终端且观众终端为单流终端时,接收广播终端发送的多路音视频码流。
解码单元3,用于对多路音视频码流进行解码。
编码单元4,用于将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流。
第一发送单元5,用于将单路音视频码流发送给观众终端。
第一收发单元6,用于当广播终端为多流终端且观众终端为多流终端时,接收广播终端发送的多路音视频码流,并直接将接收到的多路音视频码流转发给观众终端。
第二收发单元7,用于当广播终端为单流终端且观众终端为单流终端或多流终端时,接收广播终端发送的单路音视频码流,并直接将接收到的单路音视频码流转发给观众终端。
本实施例,首先根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端,会议控制服务器据此进行音视频码流的调度控制,从而在会议过程中,会议控制服务器可以让与会的各种终端都能自动接收最优的效果,使与会者无需进行任何操作进而只专注于会议内容;特别是对于广播终端为多流终端且观众终端为单流终端的情况,会议控制服务器将接收到的多流广播终端发送的多路音视频码流进行解码、编码操作后进行合成,形成单路音视频码流后发送给单流观众终端,从而单流终端可以接收到包含所有多路音视频码流信息的会议画面图像和内容等,并且不会额外增加单流终端的占用带宽,降低了对单流终端带宽的要求,节约了带宽资源,也降低了混合会议系统的成本。
作为一种优选实施方式,上述第一判断单元1包括:
第三接收单元,用于接收广播终端或观众终端发送的媒体能力消息。
第二判断单元,用于判断媒体能力消息中包含的音频(audio)标签或视频(video)标签是多路还是单路。
第一终端类型获得单元,用于当包含的音频(audio)标签或视频(video)标签是多路时,判断广播终端或观众终端为多流终端。
第二终端类型获得单元,用于当包含的音频(audio)标签或视频(video)标签是单路时,判断广播终端或观众终端为单流终端。
本领域的技术人员应当理解,第一判断单元1中判断广播终端或观众终端是多流终端还是单流终端的方式并不限于上述各个单元来实现,也可以采用能够实现是多流终端还是单流终端判断的其他单元来实现。
本实施例,通过在构建混合会议时,各个终端会向会议控制服务器上报媒体能力,根据终端向会议控制服务器发送的媒体能力消息中包含的音频标签或视频标签是多路还是单路,来判断终端是多流终端还是单流终端,从而实现了对多流终端和单流终端的快速、有效地区分,提高了判断的效率和节约了整个方法的处理时间。
作为一种优选实施方式,上述编码单元4包括:
发言坐席确定单元,用于对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
单路音频码流获得单元,用于对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
单路视频码流获得单元,用于为突出发言坐席一路的视频数据,将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
本领域的技术人员应当理解,编码单元4中将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的方式并不限于上述各个单元来实现,也可以采用能够实现多路音视频码流转换成单路音视频码流的其他单元来实现。
本实施例,通过对解码后的语音数据进行语音激励,可以有效地分辨出作为发言坐席一路的语音数据,使得会议控制服务器可以时刻监视到发言坐席。在语音合成时,合成为一路的语音数据,并将其编码成为单路音频码流。通过根据一大多小的画面风格,将发言座席一路的视频数据缩放后填充到大画面中,以大图像的形式展现,将解码后的视频数据中的其他视频数据填充到小画面中,以小图像的形式展现,并以填充后的画面风格编码成为单路视频码流,从而可以将发言坐席可以大图像突出显示,即合成的大图像可以随着发言坐席的改变而改变,起到了突出发言人的作用,并保证了在多路音视频码流编码合成时可以包含所有多路音视频码流的信息,在单流终端上可以展现出会场的全景图像。
实施例3
本实施例提供一种混合会议中广播音视频码流的控制系统,如图6所示,包括会议控制服务器10、广播终端20和观众终端30。该系统中广播终端20和观众终端30均可为多个。
会议控制服务器10用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;当广播终端为多流终端且观众终端为单流终端时,接收广播终端发送的多路音视频码流;对多路音视频码流进行解码;将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;将单路音视频码流发送给所述观众终端;
当广播终端为多流终端且观众终端为多流终端时,接收广播终端发送的多路音视频码流,并直接将接收到的多路音视频码流转发给观众终端;
当广播终端为单流终端且观众终端为单流终端或多流终端时,接收广播终端发送的单路音视频码流,并直接将接收到的单路音视频码流转发给观众终端。
广播终端20用于向会议控制服务器发送音视频码流,当广播终端20为多流终端时向会议控制服务器发送多路音视频码流;当为单流终端时向会议控制服务器发送单路音视频码流。
观众终端30用于接收会议控制服务器发送的音视频码流,当观众终端30为多流终端时接收会议控制服务器发送的多路音视频码流;当为单流终端时接收会议控制服务器发送的单路音视频码流。
本实施例,首先根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端,会议控制服务器据此进行音视频码流的调度控制,从而在会议过程中,会议控制服务器可以让与会的各种终端都能自动接收最优的效果,使与会者无需进行任何操作进而只专注于会议内容;特别是对于广播终端为多流终端且观众终端为单流终端的情况,会议控制服务器将接收到的多流广播终端发送的多路音视频码流进行解码、编码操作后进行合成,形成单路音视频码流后发送给单流观众终端,从而单流终端可以接收到包含所有多路音视频码流信息的会议画面图像和内容等,并且不会额外增加单流终端的占用带宽,降低了对单流终端带宽的要求,节约了带宽资源,也降低了混合会议系统的成本。
作为一种优选实施方式,上述判断广播终端是多流终端还是单流终端的步骤包括:
接收广播终端发送的媒体能力消息。
判断媒体能力消息中包含的音频(audio)标签或视频(video)标签是多路还是单路。
当包含的音频(audio)标签或视频(video)标签是多路时,判断广播终端为多流终端。
当包含的音频(audio)标签或视频(video)标签是单路时,判断广播终端为单流终端。
判断观众终端是多流终端还是单流终端的步骤与上述判断广播终端的步骤相同。本领域的技术人员应当理解,判断广播终端或观众终端是多流终端还是单流终端的方式并不限于上述步骤来实现,也可以采用能够区分是多流终端还是单流终端的其他方法来实现。
本实施例,通过在构建混合会议时,各个终端会向会议控制服务器上报媒体能力,根据终端向会议控制服务器发送的媒体能力消息中包含的音频标签或视频标签是多路还是单路,来判断终端是多流终端还是单流终端,从而实现了对多流终端和单流终端的快速、有效地区分,提高了判断的效率和节约了整个方法的处理时间。
作为一种优选实施方式,上述将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据。
对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流。即实现了将多路音频码流进行语音合成为一路语音,形成单路音频码流。
为突出发言坐席一路的视频数据,将发言座席一路的视频数据缩放后填充到大画面中,将解码后视频数据中的的其他视频数据填充到小画面中,以形成一大多小的画面风格,并以填充后的画面风格编码成为单路视频码流。
本领域的技术人员应当理解,将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的方式并不限于上述步骤来实现,也可以采用能够实现多路音视频码流转换成单路音视频码流的其他方法来实现。
本实施例,通过对解码后的语音数据进行语音激励,可以有效地分辨出作为发言坐席一路的语音数据,使得会议控制服务器可以时刻监视到发言坐席。在语音合成时,合成为一路语音数据,并将其编码成为单路音频码流。通过根据一大多小的画面风格,将发言座席一路的视频数据缩放后填充到大画面中,以大图像的形式展现,将解码后的视频数据中的其他视频数据填充到小画面中,以小图像的形式展现,并以填充后的画面风格编码成为单路视频码流,从而可以将发言坐席可以大图像突出显示,即合成的大图像可以随着发言坐席的改变而改变,起到了突出发言人的作用,并保证了在多路音视频码流编码合成时可以包含所有多路音视频码流的信息,在单流终端上可以展现出会场的全景图像。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种混合会议中广播音视频码流的控制方法,其特征在于,包括以下步骤:
根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;
当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;
对所述多路音视频码流进行解码;
将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;
将所述单路音视频码流发送给所述观众终端。
2.根据权利要求1所述的控制方法,其特征在于,还包括以下步骤:
当所述广播终端为单流终端时,接收所述广播终端发送的单路音视频码流;
将该单路音视频码流发送给所述观众终端。
3.根据权利要求1或2所述的控制方法,其特征在于,根据广播终端或观众终端所支持的媒体流数分别判断是多流终端还是单流终端的步骤包括:
接收所述广播终端或观众终端发送的媒体能力消息;
判断所述媒体能力消息中包含的音频标签或视频标签是多路还是单路;
当包含的音频标签或视频标签是多路时,判断所述广播终端或观众终端为多流终端;
当包含的音频标签或视频标签是单路时,判断所述广播终端或观众终端为单流终端。
4.根据权利要求1-3任一项所述的控制方法,其特征在于,所述将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
5.一种混合会议中广播音视频码流的控制装置,其特征在于,包括:
第一判断单元,用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;
第一接收单元,用于当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;
解码单元,用于对所述多路音视频码流进行解码;
编码单元,用于将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;
第一发送单元,用于将所述单路音视频码流发送给所述观众终端。
6.根据权利要求5所述的控制装置,其特征在于,还包括:
第二接收单元,用于当所述广播终端为单流终端时,接收所述广播终端发送的单路音视频码流;
第二发送单元,用于将该单路音视频码流发送给所述观众终端。
7.根据权利要求5或6所述的控制装置,其特征在于,所述第一判断单元包括:
第三接收单元,用于接收所述广播终端或观众终端发送的媒体能力消息;
第二判断单元,用于判断所述媒体能力消息中包含的音频标签或视频标签是多路还是单路;
第一终端类型获得单元,用于当包含的音频标签或视频标签是多路时,判断所述广播终端或观众终端为多流终端;
第二终端类型获得单元,用于当包含的音频标签或视频标签是单路时,判断所述广播终端或观众终端为单流终端。
8.根据权利要求5-7任一项所述的控制装置,其特征在于,所述编码单元包括:
发言坐席确定单元,用于对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
单路音频码流获得单元,用于对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
单路视频码流获得单元,用于将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
9.一种混合会议中广播音视频码流的控制系统,其特征在于,包括会议控制服务器、广播终端和观众终端;
所述会议控制服务器,用于根据广播终端和观众终端所支持的媒体流数分别判断是多流终端还是单流终端;当所述广播终端为多流终端且所述观众终端为单流终端时,接收所述广播终端发送的多路音视频码流;对所述多路音视频码流进行解码;将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流;将所述单路音视频码流发送给所述观众终端;
所述广播终端,用于向所述会议控制服务器发送音视频码流;
所述观众终端,用于接收所述会议控制服务器发送的音视频码流。
10.根据权利要求9所述的控制系统,其特征在于,所述将解码后的数据进行合成,并将合成后的数据编码成为单路音视频码流的步骤包括:
对解码后的语音数据进行语音激励,确定出数据中发言座席一路的语音数据,并获得相对应的解码后的视频数据中发言坐席一路的视频数据;
对解码后的语音数据进行语音合成,并将合成后的语音数据进行编码后获得单路音频码流;
将发言座席一路的视频数据缩放后填充到大画面中,将解码后的视频数据中的其他视频数据填充到小画面中,并以填充后的画面风格编码成为单路视频码流。
CN201510530888.4A 2015-08-26 2015-08-26 混合会议中广播音视频码流的控制方法、装置及系统 Pending CN105141884A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510530888.4A CN105141884A (zh) 2015-08-26 2015-08-26 混合会议中广播音视频码流的控制方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510530888.4A CN105141884A (zh) 2015-08-26 2015-08-26 混合会议中广播音视频码流的控制方法、装置及系统

Publications (1)

Publication Number Publication Date
CN105141884A true CN105141884A (zh) 2015-12-09

Family

ID=54727080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510530888.4A Pending CN105141884A (zh) 2015-08-26 2015-08-26 混合会议中广播音视频码流的控制方法、装置及系统

Country Status (1)

Country Link
CN (1) CN105141884A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107197172A (zh) * 2017-06-21 2017-09-22 北京小米移动软件有限公司 视频直播方法、装置和系统
CN107241564A (zh) * 2016-03-29 2017-10-10 华为技术有限公司 基于ims网络架构的多流视频会议方法、装置及系统
CN109660751A (zh) * 2018-12-28 2019-04-19 中兴通讯股份有限公司 一种视频会议实现方法及装置、视频会议系统、存储介质
CN110971862A (zh) * 2019-11-04 2020-04-07 厦门亿联网络技术股份有限公司 一种视频会议广播方法及装置
CN111405231A (zh) * 2020-03-03 2020-07-10 浙江华创视讯科技有限公司 视频会议方法、装置、设备和计算机可读存储介质
CN111478934A (zh) * 2019-07-15 2020-07-31 广州湖森电子科技有限公司 坐席内容推送方法、坐席协作控制系统及装置
CN111711835A (zh) * 2020-05-18 2020-09-25 深圳市东微智能科技股份有限公司 多路音视频整合方法、系统及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060092269A1 (en) * 2003-10-08 2006-05-04 Cisco Technology, Inc. Dynamically switched and static multiple video streams for a multimedia conference
US20080059581A1 (en) * 2006-09-05 2008-03-06 Andrew Pepperell Viewing data as part of a video conference
WO2008135999A1 (en) * 2007-05-08 2008-11-13 Radvision Ltd. Devices, methods, and media for providing multi-point video conferencing unit functions
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
CN103338348A (zh) * 2013-07-17 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种网络音视频会议的实现方法、系统和服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060092269A1 (en) * 2003-10-08 2006-05-04 Cisco Technology, Inc. Dynamically switched and static multiple video streams for a multimedia conference
US20080059581A1 (en) * 2006-09-05 2008-03-06 Andrew Pepperell Viewing data as part of a video conference
WO2008135999A1 (en) * 2007-05-08 2008-11-13 Radvision Ltd. Devices, methods, and media for providing multi-point video conferencing unit functions
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
CN103338348A (zh) * 2013-07-17 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种网络音视频会议的实现方法、系统和服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杜玉霞,孔维宏: "《现代教育技术》", 31 August 2013, 北京:清华大学出版社 *
王毅: "《楼宇自动化工程》", 30 June 2015, 北京:中国电力出版社 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241564A (zh) * 2016-03-29 2017-10-10 华为技术有限公司 基于ims网络架构的多流视频会议方法、装置及系统
CN107241564B (zh) * 2016-03-29 2020-09-18 华为技术有限公司 基于ims网络架构的多流视频会议方法、装置及系统
CN107197172A (zh) * 2017-06-21 2017-09-22 北京小米移动软件有限公司 视频直播方法、装置和系统
CN109660751A (zh) * 2018-12-28 2019-04-19 中兴通讯股份有限公司 一种视频会议实现方法及装置、视频会议系统、存储介质
WO2020134761A1 (zh) * 2018-12-28 2020-07-02 中兴通讯股份有限公司 视频会议实现方法及装置、视频会议系统、存储介质
CN111478934A (zh) * 2019-07-15 2020-07-31 广州湖森电子科技有限公司 坐席内容推送方法、坐席协作控制系统及装置
CN110971862A (zh) * 2019-11-04 2020-04-07 厦门亿联网络技术股份有限公司 一种视频会议广播方法及装置
CN111405231A (zh) * 2020-03-03 2020-07-10 浙江华创视讯科技有限公司 视频会议方法、装置、设备和计算机可读存储介质
CN111405231B (zh) * 2020-03-03 2021-10-15 浙江华创视讯科技有限公司 视频会议方法、装置、设备和计算机可读存储介质
CN111711835A (zh) * 2020-05-18 2020-09-25 深圳市东微智能科技股份有限公司 多路音视频整合方法、系统及计算机可读存储介质
CN111711835B (zh) * 2020-05-18 2022-09-20 深圳市东微智能科技股份有限公司 多路音视频整合方法、系统及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN105141884A (zh) 混合会议中广播音视频码流的控制方法、装置及系统
CN107483460B (zh) 一种多平台并行导播推流的方法及系统
US20110261151A1 (en) Video and audio processing method, multipoint control unit and videoconference system
CN102752642B (zh) 一种基于ip网络的多终端视频同步播放的方法及系统
CN100454820C (zh) Mcu级联系统和该系统的创建及通信方法
EP1487216A2 (en) Device and method for receiving and transmitting digital multimedia broadcasting
CN109089129B (zh) 一种稳健的多视频捆绑直播系统及其方法
CN108055497B (zh) 一种会议信号播放方法和装置、视频会议终端、移动设备
US9497390B2 (en) Video processing method, apparatus, and system
WO2007082433A1 (fr) Appareil, dispositif de réseau et procédé de transmission de signaux audio et vidéo
US20070223535A1 (en) Mobile communication terminal, mobile communication method, and information recording medium
CN104822070B (zh) 多路视频流播放方法及装置
CN101262587A (zh) 一种实现多画面视频会议的方法及多点控制单元
CN101516057B (zh) 一种通过移动终端实现流媒体播放的方法
KR20140138954A (ko) 멀티미디어 비디오 데이터의 송신, 수신 방법 및 대응되는 장치
CN111385515B (zh) 视频会议数据的传输方法和视频会议数据的传输系统
CN103716681A (zh) 一种码流切换方法及电子设备
CN112019792A (zh) 会议控制方法、装置、终端设备和存储介质
CN111147362A (zh) 多人即时通讯方法、系统、装置及电子设备
CN104283857A (zh) 多媒体会议的建立方法、装置及系统
CN101345844A (zh) 一种多媒体码流传输方法和一种多点控制单元
CN106663431B (zh) 发送装置、发送方法、接收装置以及接收方法
EP3734967A1 (en) Video conference transmission method and apparatus, and mcu
CN112019488B (zh) 一种语音处理的方法、装置、设备和存储介质
CN111083427B (zh) 嵌入式终端、4k视频会议系统的数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209