CN101179693B - 一种会议电视系统的混音处理方法 - Google Patents

一种会议电视系统的混音处理方法 Download PDF

Info

Publication number
CN101179693B
CN101179693B CN2007100772740A CN200710077274A CN101179693B CN 101179693 B CN101179693 B CN 101179693B CN 2007100772740 A CN2007100772740 A CN 2007100772740A CN 200710077274 A CN200710077274 A CN 200710077274A CN 101179693 B CN101179693 B CN 101179693B
Authority
CN
China
Prior art keywords
terminal
meeting
place
audio mixing
place terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007100772740A
Other languages
English (en)
Other versions
CN101179693A (zh
Inventor
唐庶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Di Vision Ltd By Share Ltd
Original Assignee
SHENZHEN DVISION VIDEO TELECOMMUNICATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN DVISION VIDEO TELECOMMUNICATION CO Ltd filed Critical SHENZHEN DVISION VIDEO TELECOMMUNICATION CO Ltd
Priority to CN2007100772740A priority Critical patent/CN101179693B/zh
Publication of CN101179693A publication Critical patent/CN101179693A/zh
Application granted granted Critical
Publication of CN101179693B publication Critical patent/CN101179693B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种会议电视系统的混音处理方法,包括至少一个会场终端,包含如下步骤:A、解码各会场终端的语音码流,获得各会场终端语音信号;B、将会场终端中的主席终端和发言人终端选定为混音激活终端;C、对主席终端和发言人终端外的会场终端,比较各会场终端的语音信号音量值,按各会场终端的语音信号音量值由大至小的顺序依序至少选出一个会场终端作为混音激活终端;D、将步骤B和C中确定的混音激活终端的语音信号按预定原则进行混音,发送给相应会场终端。本发明不但能随时听见每个会场的发言,而且能够保证不会有太多的会场混合在一起而造成声音的杂乱,实际混音效果清晰,易于辨认,而且也节约了多点控制单元的处理能力。

Description

一种会议电视系统的混音处理方法
技术领域
本发明涉及会议电视领域,具体地说涉及一种会议电视系统的混音处理方法。
背景技术
随着电信技术的发展,会议电视业务得到了越来越广泛的应用,会议电视系统中一般包括用于会议控制的多点控制单元(MCU)和至少一个会场终端(与会者)。一般的语音业务中仅涉及到两个通话方,而在会议电视系统中,通常与会者都不止两个,其中任一与会者的语音都可以传送至所有其他与会者,而每一与会者都同时可听到多个其他与会者的声音。因此,在会议电视系统中,通常都需要进行混音处理,即将多个与会者的语音混合起来,以便任一与会者都可同时听到其他与会者的声音。
通常,在一个会议电视系统的多个会场终端中,包括有以下几种类型的会场终端:
主席终端:即整个会议中的主席会场,能够取得会议的控制权。
发言人终端:即会议中的当前发言人会场,一般在一个会议中的一个时刻只有一个发言人,与会的其他会场终端都可以看到发言人会场的图像。
其他终端:一般的与会会场。
在实际的会议过程中,绝大多数情况下只有主席和发言人说话,其他的一般会场处于听的状态。因此,可确定对于会议电视系统的混音处理的需求主要是:
1)每个会场需要随时听见其他会场的声音;
2)应该保证主席和发言人会场的声音优先权;此外,可能出现的插话会场应该是声音较大的一方,以符合人们收听声音最大的一方的习惯。
传统的混音方法中,包括有全混音方法,即将同时说话的所有会场的语音信号混音发送给各会场,这种方案虽然满足会场可随时听见其他会场的声音的需求,然而,对于一个会场终端数目众多的会议电视系统而言,不加区分的将所有会场终端的声音都进行混合,不仅对于会议电视系统的MCU处理要求较高,同时,也容易造成混音效果不佳,甚至让人无法听清。
另一种现有的混音方法是:混合数个声音较大的会场终端的语音信号。这种方法虽然符合人们收听声音最大一方的习惯,然而,常常有可能将主席终端和发言人终端淹没,导致会议的秩序混乱,也容易造成声音的频繁切换。
发明内容
有鉴于此,本发明所要解决的技术问题是提供一种会议电视系统的混音处理方法,可以提高混音效果,降低MCU的能力消耗,同时保证会议的有序进行。
为实现上述目的,本发明采用如下技术方案:
一种会议电视系统的混音处理方法,包括至少一个会场终端,该方法包含如下步骤:
A、解码各会场终端的语音码流,获得各会场终端语音信号;
B、将会场终端中的主席终端和发言人终端选定为混音激活终端;
C、对主席终端和发言人终端外的会场终端,比较各会场终端的语音信号音量值,按各会场终端的语音信号音量值由大至小的顺序依序至少选出一个会场终端作为混音激活终端;
D、将步骤B和C中确定的混音激活终端的语音信号按预定原则进行混音,发送给相应会场终端。
所述步骤D中,混音激活终端的语音信号按预定原则进行混音,发送给相应会场终端是按如下方式实现:
1)对混音激活终端,将除该混音激活终端外的其他混音激活终端的语音信号进行混音,发送给该混音激活终端;
2)对混音激活终端以外的其他会场终端,将全部混音激活终端的语音信号进行混音,发送给各其他会场终端。
所述步骤C中,比较各会场终端语音信号音量值是采用延时处理方式:连续多次采集各会场终端的语音信号音量值,计算采集到的各会场终端的多个语音信号音量值的平均值,对各会场终端语音信号音量值的所述平均值进行比较。
所述步骤C中,比较各会场终端语音信号音量值是采用延时处理方式:连续多次采集各会场终端的语音信号音量值,计算采集到的各会场终端的多个语音信号音量值的平均值,对各会场终端语音信号音量值的所述平均值进行比较。
当主席终端和发言人终端为同一会场终端时,所述步骤C中,对主席终端和发言人终端外的会场终端,按各会场终端语音信号音量值由大至小的顺序依序至少选出两个会场终端作为混音激活终端。
所述步骤D中,当混音信号超过设定的混音门限时,在将混音信号发送给相应的会场终端前,还包括对混音信号进行箝位处理的步骤。
所述步骤D中,确定的混音激活终端的总数为3个。
本发明的有益效果在于:确定主席终端、发言人终端和各会场终端的语音信号音量值由大至小的顺序依序至少选出的一个会场终端作为混音激活终端。因此在保证会议有序进行的基础上,降低了多点控制单元的处理能力消耗,混音效果清晰。
附图说明
图1是本发明具体实施方式的会议电视系统的系统框架示意图;
图2是本发明具体实施方式的混音处理方法的流程图。
具体实施方式
下面对照附图结合具体实施方式对本发明作详细说明。
如图1所示,图中示意性地展示了一个会议电视系统,包括一个多点控制单元和6个会场终端。需要了解的是,会场终端的数目并不构成对本发明的限定。
如图2所示,本发明具体实施方式的所述方法,包含如下步骤:
1、解码各会场终端的语音码流,获得各会场终端语音信号;
2、将会场终端中的主席终端和发言人终端选定为混音激活终端;
3、对主席终端和发言人终端外的会场终端,比较各会场终端的语音信号音量值,按各会场终端的语音信号音量值由大至小的顺序依序至少选出一个会场终端作为混音激活终端;
4、将步骤B和C中确定的混音激活终端的语音信号按预定原则进行混音,发送给相应会场终端。
在步骤4中,混音激活终端的语音信号按预定原则进行混音,发送给相应会场终端采用如下方式:
对混音激活终端,将除该混音激活终端外的其他混音激活终端的语音信号进行混音,发送给该混音激活终端;
对混音激活终端以外的其他会场终端,将全部混音激活终端的语音信号进行混音,发送给各其他会场终端。
下面以一实例对本发明作进一步说明。
如图1所示,一会议电视系统中包括6个会场终端:A会场终端、B会场终端、C会场终端、D会场终端、E会场终端、F会场终端;在一采样周期,通常为20毫秒,所有说话的会场终端的声音码流传送到多点控制单元,多点控制单元对这些声音码流进行解码,得到每个会场终端的语音信号。
定义所有允许加入混音的会场终端为混音候选终端,实际选定加入混音的终端为混音激活终端。以上语音信号到达多点控制单元的终端即混音候选终端。由于通常混音候选终端的数目较多,如果全部加入混音,容易造成混音效果不佳的缺陷。实验表明,混音三路的效果是在满足同时发言的条件下最好的选择。
在一个有序进行的会议过程中,通常应该保证主席终端和发言人终端的声音能够被其他会场听见。因此,可以通过多点控制单元对主席终端和发言人终端设定标志位或优先级的方式,将两者选定为必选的混音激活终端。对于主席终端和发言人终端之外的其他混音候选终端,比较各会场终端的语音信号音量值,按该音量值由大至小的顺序依序至少选出一个会场终端作为混音激活终端。在混音三路的情况下,如果主席终端和发言人终端不同,则选出的是声音最大的会场终端作为主席终端和发言人终端之外的另一个混音激活终端;如果主席终端和发言人终端是同一个会场终端,则选出的是声音最大和次大的两个会场终端作为另外两个混音激活终端。
确定了三个混音激活终端之后,将对三路语音信号按预定的原则进行混音处理,首先是语音信号的叠加,假设A会场终端为主席终端,B会场终端为发言人终端,C会场终端为声音最大终端,由于通常说话方并不需要在混音中听到自己的声音,因此,叠加的原则是:
对于主席终端A,叠加的语音信号是B+C;
对于发言人终端B,叠加的语音信号是A+C;
对于声音最大终端C,叠加的语音信号是A+B;
对于其他会场终端D、E、F,叠加的语音信号是A+B+C。
叠加后的混音信号有可能音量过高,从而使得收听效果不佳,因此还需设定一个混音门限,当叠加的语音信号超过该混音门限,则对叠加的语音信号按照一定的收缩系数进行收缩。收缩系数主要用于确定在多大的音量下进行何种程度的收缩,这可以通过实验进行确定。
最后,对上述四种叠加语音信号进行编码,按上述的预定原则,发送到相应的会场终端。
进一步的,在确定声音最大的会场终端的过程中,可以采用延时处理方式,通常在现有技术中确定声音最大终端时,采用在20毫秒中采样声音,以采样点中音量绝对值最大作为终端的音量参考值,此种方式可能因突如其来的噪声而造成声音最大会场终端的误判。因此,可连续多次采集各会场终端的语音音量,计算各会场终端的连续多次语音音量采集值的平均值,对各会场终端语音音量的所述平均值进行比较,从而更准确地确定声音最大的会场终端。
比较全混音方法和本发明方法对MCU的处理要求,如果会场终端数为N,对于全混音方法,首先其解码次数为N,然后对于每一终端,需要混合其自身以外的其他会场终端的语音信号,因此叠加次数和编码次数同样也是N。当N数目很大时,将造成MCU的严重消耗。而对于本发明的方法,其在N<=4的情况下,与全混音方法相同,然而,在N>4的时候,从上述说明可以看出,其编码次数仍然为N,但是,叠加次数和编码次数都将降至仅有4次,从而不仅大大降低了MCU的处理消耗,同时实际的混音效果清晰,易于辨认。
与混音数个声音最大的现有混音方法相比,首先,由于在实际会议过程中,主席和发言人在相对长的时间内是基本固定的,不会频繁变化,将其作为必选混音激活终端,可以避免混音激活终端变化过快,此外,也避免了可能出现主席和发言人被排除在混音激活终端之外的情况,这些都可以保证会议的有序进行,使得会议电视系统更加稳定有效。
本发明通过确定主席终端、发言人终端和按其他会场终端的语音音量由大至小的顺序依序至少选出的一个会场终端作为混音激活终端,从而可以满足良好的混音需求,同时不但能随时听见每个会场的发言,而且能够保证不会有太多的会场混合在一起而造成声音的杂乱。采用本发明的方法,会议过程可以保持有序进行,混音效果清晰易辨,多点控制单元的处理能力消耗不高,整个会议电视系统运行稳定高效。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (5)

1.一种会议电视系统的混音处理方法,包括至少一个会场终端,其特征在于,该方法包含如下步骤:
A、解码各会场终端的语音码流,获得各会场终端语音信号;
B、将会场终端中的主席终端和发言人终端选定为混音激活终端;
C、对主席终端和发言人终端外的会场终端,比较各会场终端的语音信号音量值,按各会场终端的语音信号音量值由大至小的顺序依序至少选出一个会场终端作为混音激活终端;
D、将步骤B和C中确定的混音激活终端的语音信号按下述原则进行混音并发送给相应会场终端:
1)对混音激活终端,将除该混音激活终端外的其他混音激活终端的语音信号进行混音,发送给该混音激活终端;
2)对混音激活终端以外的其他会场终端,将全部混音激活终端的语音信号进行混音,发送给各其他会场终端。
2.如权利要求1所述的混音处理方法,其特征在于,所述步骤C中,比较各会场终端语音信号音量值是采用延时处理方式:连续多次采集各会场终端的语音信号音量值,计算采集到的各会场终端的多个语音信号音量值的平均值,对各会场终端语音信号音量值的所述平均值进行比较。
3.如权利要求1或2所述的混音处理方法,其特征在于,当主席终端和发言人终端为同一会场终端时,所述步骤C中,对主席终端和发言人终端外的会场终端,按各会场终端语音信号音量值由大至小的顺序依序至少选出两个会场终端作为混音激活终端。
4.如权利要求1或2所述的混音处理方法,其特征在于,所述步骤D中,当混音信号超过设定的混音门限时,在将混音信号发送给相应的会场终端前,还包括对混音信号进行箝位处理的步骤。
5.如权利要求1或2所述的混音处理方法,其特征在于,所述步骤D中,确定的混音激活终端的总数为3个。
CN2007100772740A 2007-09-26 2007-09-26 一种会议电视系统的混音处理方法 Expired - Fee Related CN101179693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100772740A CN101179693B (zh) 2007-09-26 2007-09-26 一种会议电视系统的混音处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100772740A CN101179693B (zh) 2007-09-26 2007-09-26 一种会议电视系统的混音处理方法

Publications (2)

Publication Number Publication Date
CN101179693A CN101179693A (zh) 2008-05-14
CN101179693B true CN101179693B (zh) 2011-02-02

Family

ID=39405757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100772740A Expired - Fee Related CN101179693B (zh) 2007-09-26 2007-09-26 一种会议电视系统的混音处理方法

Country Status (1)

Country Link
CN (1) CN101179693B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101466043B (zh) * 2008-12-30 2010-12-15 华为终端有限公司 一种多路音频信号处理的方法、设备及系统
CN101510988B (zh) * 2009-02-19 2012-03-21 华为终端有限公司 一种语音信号的处理、播放方法和装置
CN102065265B (zh) 2009-11-13 2012-10-17 华为终端有限公司 实现混音的方法、装置和系统
CN102202038B (zh) * 2010-03-24 2015-05-06 华为技术有限公司 一种实现语音能量显示的方法、系统、会议服务器和终端
CN101877643B (zh) * 2010-06-29 2014-12-10 中兴通讯股份有限公司 多点混音远景呈现方法、装置及系统
CN103050124B (zh) 2011-10-13 2016-03-30 华为终端有限公司 混音方法、装置及系统
CN102857732B (zh) * 2012-05-25 2015-12-09 华为技术有限公司 一种多画面视讯会议中的画面控制方法、设备及系统
CN102833520A (zh) * 2012-08-16 2012-12-19 华为技术有限公司 一种视频会议信号处理的方法、视频会议服务器及系统
CN102984496B (zh) * 2012-12-21 2015-08-19 华为技术有限公司 视频会议中的视音频信息的处理方法、装置及系统
CN106161814B (zh) * 2015-03-24 2019-02-05 北京视联动力国际信息技术有限公司 一种多方会议的混音方法和装置
CN104811318A (zh) * 2015-04-15 2015-07-29 南京农业大学 一种声音控制语音交流的方法
CN106973253B (zh) * 2016-01-13 2020-04-14 华为技术有限公司 一种调整媒体流传输的方法及装置
JP6846753B2 (ja) * 2017-06-28 2021-03-24 株式会社オプティム コンピュータシステム、Web会議音声補助方法及びプログラム
CN107613151A (zh) * 2017-08-11 2018-01-19 华迪计算机集团有限公司 一种用于会议代表之间互动的电话会议的混音方法及系统
CN108847231B (zh) * 2018-05-30 2021-02-02 出门问问信息科技有限公司 远场语音识别方法、装置及系统
CN109547732A (zh) * 2018-12-19 2019-03-29 深圳银澎云计算有限公司 一种音视频处理方法、装置、服务器及视频会议系统
CN109901811B (zh) * 2019-02-26 2022-09-06 北京华夏电通科技股份有限公司 应用于数字化庭审中的混音方法及装置
CN109831833B (zh) * 2019-03-18 2021-01-05 成都极客通科技有限公司 一种基于混音控制的紧急插话系统及方法
WO2020218094A1 (ja) * 2019-04-26 2020-10-29 株式会社ソニー・インタラクティブエンタテインメント 情報処理システム、情報処理装置、情報処理装置の制御方法、及びプログラム

Also Published As

Publication number Publication date
CN101179693A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
CN101179693B (zh) 一种会议电视系统的混音处理方法
US8340269B2 (en) Method, device, and system for processing multi-channel audio signals
US8805928B2 (en) Control unit for multipoint multimedia/audio system
CN101502089B (zh) 进行音频会议的方法、音频会议装置和编码器之间的切换方法
EP1360798B1 (en) Control unit for multipoint multimedia/audio conference
CN112422879B (zh) 媒体能力动态调整方法及装置
CN112104836A (zh) 一种音频服务器混音方法、系统、存储介质及设备
WO2008141539A1 (fr) Procédé d'affichage de légendes, système et appareil de communication vidéo
WO2013053336A1 (zh) 混音方法、装置及系统
WO2005112413A1 (fr) Procede et appareil de commutation audio
CN102915736B (zh) 混音处理方法和混音处理系统
CN101656863A (zh) 一种会议控制的方法、装置和系统
CN102118523A (zh) 一种用于集中式电话会议的混音控制方法
CN103051864A (zh) 移动视频会议方法及其系统
CN102404543B (zh) 级联会议中级联会场的处理方法、装置及级联会议系统
CN102025972A (zh) 应用于视频会议的静音指示的方法及装置
CN1878289A (zh) 在发送音视频文件中叠加语音的方法
CN102457700B (zh) 音频数据传输方法及系统
CN101335867A (zh) 一种会议电视系统的语音激励控制方法
US8515039B2 (en) Method for carrying out a voice conference and voice conference system
EP2572499A1 (en) Encoder adaption in teleconferencing system
CN103093754A (zh) 用于同声传译业务的语音弱化处理方法
CN1845573A (zh) 支持大容量混音的同声传译视频会议系统及方法
US7058026B1 (en) Internet teleconferencing
US8837330B1 (en) Methods, systems, and media for combining conferencing signals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DEWEY VIDEO CO., LTD., SHENZHEN

Free format text: FORMER OWNER: SHENZHEN CITY LISHI VIDEO TECHNOLOGY LTD.; APPLICANT

Effective date: 20080620

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20080620

Address after: Shenzhen Institute of Aerospace Science and technology innovation, South ten road, science and technology of Nanshan District, 4D, postcode: 518057

Applicant after: SHENZHEN DVISION VIDEO Co.,Ltd.

Address before: 19C, postal code of Yihai Plaza, Nanshan District Chuang Road, Shenzhen, Guangdong, China: 518054

Applicant before: Shenzhen Lishi Video Technology Co.,Ltd.

Co-applicant before: SHENZHEN DVISION VIDEO Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Nanshan District Xili Street Tea Light Road Shenzhen City, Guangdong province 518057 No. 1089 Shenzhen integrated circuit design and application of Industrial Park 306-1, room 307-2, 306-2

Patentee after: Shenzhen Di vision Limited by Share Ltd.

Address before: Nanshan District scientific and Technological Innovation Research Institute of Shenzhen science and technology south ten, 4D

Patentee before: SHENZHEN DVISION VIDEO Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 1202-1203, building 3, R & D building 3, Fangda Plaza, No. 28, Gaofa West Road, Taoyuan community, Taoyuan Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Di vision Limited by Share Ltd.

Address before: Nanshan District Xili Street Tea Light Road Shenzhen City, Guangdong province 518057 No. 1089 Shenzhen integrated circuit design and application of Industrial Park 306-1, room 307-2, 306-2

Patentee before: Shenzhen Di vision Limited by Share Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110202

Termination date: 20210926