CN1206860C - 一种智能控制视频会议的混音系统及控制会议进程的方法 - Google Patents
一种智能控制视频会议的混音系统及控制会议进程的方法 Download PDFInfo
- Publication number
- CN1206860C CN1206860C CN 03102814 CN03102814A CN1206860C CN 1206860 C CN1206860 C CN 1206860C CN 03102814 CN03102814 CN 03102814 CN 03102814 A CN03102814 A CN 03102814A CN 1206860 C CN1206860 C CN 1206860C
- Authority
- CN
- China
- Prior art keywords
- data
- voice data
- spokesman
- people
- server end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及智能控制视频会议的混音系统及控制会议进程的方法,其目的是简化会议的进程,使得“询问-应答”过程变得没有必要,减小网络负荷,操作更为方便。混音系统分为客户端和服务器端,客户端有会议主席、主席指定的发言人及若干个旁听者三种终端;服务器端有网络接口、中央处理器、启动快闪存储器、程序快闪存储器、随机存储器、缓冲器及数据总线和地址总线;客户端和服务器端连接成一个声音采集、处理、发送硬件系统。控制方法也分为客户端和服务器端实现的步骤,根据声音数据“捎带”的发言人状况信息,判断是否为主席、主席指定的发言人或旁听者,再根据当时的情况实际发送或不发送该路音频数据。本发明用于在网络中召开视频会议。
Description
技术领域
本发明涉及一种在视频会议中智能控制会议进程的混音系统及控制会议进程的方法。适用于在网络中召开视频会议。
背景技术
目前,视频会议的服务器端一般都使用了混音器,用于混合不同与会者的声音,并将混合后的音频数据发送到各客户端。在视频会议中,存在一些身份不同的角色,有“会议主席”,主席指定的“发言人”,以及“旁听者”。作为旁听者如果要插话,需通过操作界面向会议主席提出申请,经主席同意后才取得发言权,系统开始传送该插话人的声音数据;同样,发言完毕后,通过操作界面向会议主席提出退出申请,经主席同意之后退出发言,系统停止发送该路数据。由于旁听者每一次加入或退出发言,都需要经历一次“询问-应答”过程,在此过程中旁听者/插话人和主席需要进行额外的操作,这样不但增加了网络的负荷,也不能集中精力于会议本身。
发明内容
本发明要解决的技术问题是:提供一种智能控制视频会议的混音系统及控制会议进程的方法,该混音系统解决了在视频会议进程中加入和退出发言的繁琐操作,使得“询问-应答”过程变得没有必要,减小了网络的负荷,使操作更加方便。
本发明所采用的技术方案是:智能控制视频会议的混音系统,该混音系统分为客户端A和服务器端B,其中:
i)客户端A包括会议主席a、主席指定的发言人b及若干个旁听者c三种终端;
ii)服务器端B包括网络接口、中央处理器、启动快闪存储器、程序快闪存储器、随机存储器、缓冲器及数据总线和地址总线;
iii)客户端A和服务器端B连接成一个声音采集、处理、发送硬件系统;
iv)客户端A的音频数据首先通过麦克风进入模数转换器A/D,A/D将音频信号数字化成PCM格式的数据流,通过网络接口发送至服务器端B,其特点在于:
v)服务器端通电时从启动快闪存储器启动,然后将固化在程序快闪存储器中的声音处理程序载入内存区,中央处理器从内存区调入指令,这些指令根据设定的三个门限值即阈值上限、阈值下限和声音停止时间逻辑判断出是否该路数据参加混音,对于不参加的PCM流不做处理,对于参加混音的数据流进行混音运算,混音算法即是对各路数据进行线性叠加,具体算法由固化在程序快闪存储器中的程序提供,在运行时被载入内存区供中央处理器调度;
vi)混音后的数据仍然保持PCM格式,这些PCM流通过网络接口传送到相应的终端,在终端D/A转换器将PCM流转换成模拟信号,输出到音频播放设备。
vii)在服务器端B,所述设定的三个门限值是用于比较声音数据的“过零率”的,即单位时间内信号波穿过横轴,也就是过零电平的次数,混音器在每次得到采样数据后,对数据的过零率加以分析,有两种情况:
i)如果超出一定的数值,即阈值上限,则认定数据为“有声”,只有被认定为有声的数据才参加混音;
ii)设定声音停止时间,对这一段时间内的过零率进行累加,如果数值小于某一特定的值,即阈值下限,则可以断定为“无声”,只要被认定为无声,就应该立即退出发言。
本发明智能控制视频会议进程的方法包括客户端A实现的步骤I和服务器端B实现的步骤II,其中:
步骤I表现为1)、客户端A程序对声音数据“捎带”的发言人状况信息I进行判断,若是主席a或主席指定的发言人b,直接向服务器B发送声音数据,若否,判断是否是插话人,如旁听者c;
2)、客户端程序不间断地取得发言人状况信息I,并且解析出最多两个发言人ID,对照自身的ID,即可得出两个简单的事实,即“自身是否插话人”和“当前是否可插话”,如果解析出的两个ID中有一个和自身相等则是插话人c,继续向服务器发送声音数据,如果不等则自身不是插话人c;
3)、再根据发言人状况信息I判断是否可以插话,如果解析出的两个ID均非0,说明插话人名额已满,不发送数据,如果只有一个ID非0或两个都是0,则当前状态可插话,开始向服务器发送声音数据;
步骤II表现为1)、服务器端B在网络中检测到客户端A发来的声音数据后,取得该路数据中的ID,如果是主席a或者主席指定的发言人b终端发来的声音数据,直接参混,否则认定是插话人,如旁听者c;
2)服务器端程序先计算过零率R和时间T内的总过零率A,然后程序根据解析出的ID判断是否当前插话人,若是,根据值A考察是否变为无声,如果变为无声,进行信息设定,从发言人状况信息I中剔除该路ID,并停止(发送)混合该路音频数据,如果没有变为无声,继续(发送)混合该路音频数据;
3)若不是当前插话人,根据值R判断是否变为有声,如果变为有声,进行信息设定,从发言人状况信息I中加入该路ID,并开始(发送)混合该路音频数据,如果没有变为有声,抛弃该数据包。
本发明的有益效果是:由于本发明是通过“有声/无声检测”简化了旁听者/插话人和主席的操作,使“询问-应答”过程变得没有必要,减小了网络的负荷,使与会者能够集中精力于会议本身。
附图说明
图1是本发明的硬件结构框图。
图2是客户端A的工作流程图。
图3是服务器端B的工作流程图。
具体实施方式
本发明混音系统分为客户端A和服务器端B,客户端终端有会议主席a、主席指定的发言人b和若干个旁听者/插话人c。
服务器端B在硬件实现方面由网络接口1(100BASE-T)、中央处理器2(MPC860)、随机存储器3、启动快闪存储器4、程序快闪存储器5、缓冲器6、数据总线7、9和地址总线8、10组成(参阅图1)。
客户端A的音频数据首先通过麦克风进入模数转换器A/D,A/D将音频信号数字化成PCM(pulse code modulation)格式的数据流,通过网络接口1发送至服务器端B。
服务器端B通电时从启动快闪存储器4启动,然后将固化在程序快闪存储器5中的声音处理程序载入内存区,中央处理器2从内存区调入指令,这些指令根据设定的三个门限值即阈值上限、阈值下限和声音停止时间逻辑判断出是否该路数据参加混音,对于不参加的PCM流不做处理,对于参加混音的数据流进行混音运算,混音算法即是对各路数据进行线性叠加,具体算法由固化在程序快闪存储器5中的程序提供,在运行时被载入内存区供中央处理器2调度;混音后的数据仍然保持PCM格式,这些PCM流通过网络接口1传送到相应的终端,在终端D/A转换器将PCM流转换成模拟信号,输出到音频播放设备。
在服务器端B的声音处理程序中,和这些预置的门限值(阈值上限、阈值下限和声音停止时间)进行比较的是声音数据的“过零率”,即单位时间内信号波穿过横轴(零电平)的次数,混音器在每次得到采样数据后,对数据的过零率加以分析,如果超出一定的数值,即阈值上限,则认定数据为“有声”,只有被认定为有声的数据才参加混音;设定声音停止时间,对这一段时间内的过零率进行累加,如果数值小于某一特定的值,即阈值下限,则可以断定为“无声”,只要被认定为无声,就应该立即退出发言。
服务器端的声音处理程序还对“当前插话人状况”信息进行设定,并将它打包到不间断发送的音频数据里,向客户端转发。客户端装有“信息解析程序”,客户端通过解析收到的音频数据,将其中“当前插话人状况”的信息I解析出来,直接决定本地是否有必要向服务器发送声音数据。
由前面的分析可知,这里的发言人状况信息I通过音频数据被“捎带”到客户端,所以起着纽带的作用,而信息设定是由声音检测的结果带动改为引发的,这里需要获取的是两个重要转变,有声向无声的转变和无声向有声的转变。通过这两个转变,自动进行加入和退出会议的操作,而“审批”过程由客户端A代替会议主席根据信息I自动完成,实现会议进程的自动有序控制。例如,对于每一个终端,都有一个独立的非0数值ID,长度为1个字节,如果系统允许的最大插话人数N为2,那么我们就把信息I规定为2字节长,其内容分别就是两个插话人的ID,(有必要说明一下为什么是两个,因为一般最多允许4个人同时讲话,去掉a,b,所以插话人数最多为2),不难想象,如果只有一个插话人或者没有插话人,那么对应的位置就为0。
图2所示的是客户端A的工作流程图,其步骤为:
1)、客户端A程序对声音数据“捎带”的发言人状况信息I进行判断,若是主席或主席指定的发言人,直接向服务器B发送声音数据,若否,判断是否是插话人;
2)、客户端程序不间断地取得发言人状况信息I,并且解析出最多两个发言人ID,对照自身的ID,即可得出两个简单的事实,即“自身是否插话人”和“当前是否可插话”,如果解析出的两个ID中有一个和自身相等则是插话人,继续向服务器发送声音数据,如果不等则自身不是插话人;
3)、再根据发言人状况信息I判断是否可以插话,如果解析出的两个ID均非0,说明插话人名额已满,不发送数据,如果只有一个ID非0或两个都是0,则当前状态可插话,开始向服务器发声音数据。
图3所示的是服务器端B的工作流程图,其步骤为:
1)、服务器端B在网络中检测到客户端A发来的声音数据后,取得该路数据中的ID,如果是主席或者主席指定的发言人终端发来的声音数据,直接参混,否则认定是插话人即旁听者;
2)服务器端程序先计算过零率R和时间T内的总过零率A,然后程序根据解析出的ID判断是否当前插话人,若是,根据值A考察是否变为无声,如果变为无声,进行信息设定,从发言人状况信息I中剔除该路ID,并停止(发送)混合该路音频数据,如果没有变为无声,继续(发送)混合该路音频数据;
3)若不是当前插话人,根据值R判断是否变为有声,如果变为有声,进行信息设定,从发言人状况信息I中加入该路ID,并开始(发送)混合该路音频数据,如果没有变为有声,抛弃该数据包。
Claims (2)
1、一种智能控制视频会议的混音系统,该混音器分为客户端A和服务器端B,其中:
i)客户端A包括会议主席a、主席指定的发言人b及若干个旁听者c三种终端;
ii)服务器端B包括网络接口(1)、中央处理器(2)、启动快闪存储器(4)、程序快闪存储器(5)、随机存储器(3)、缓冲器(6)及数据总线(7、9)和地址总线(8、10);
iii)客户端A和服务器端B连接成一个声音采集、处理、发送硬件系统;
iv)客户端A的音频数据首先通过麦克风进入模数转换器A/D,A/D将音频信号数字化成PCM格式的数据流,通过网络接口(1)发送至服务器端B,其特征在于:
v)服务器端通电时从启动快闪存储器(4)启动,然后将固化在程序快闪存储器(5)中的声音处理程序载入内存区,中央处理器(2)从内存区调入指令,这些指令根据设定的三个门限值即阈值上限、阈值下限和声音停止时间逻辑判断出是否该路数据参加混音,对于不参加的PCM流不做处理,对于参加混音的数据流进行混音运算,混音算法即是对各路数据进行线性叠加,具体算法由固化在程序快闪存储器(5)中的程序提供,在运行时被载入内存区供中央处理器(2)调度;
vi)混音后的数据仍然保持PCM格式,这些PCM流通过网络接口(1)传送到相应的终端,在终端D/A转换器将PCM流转换成模拟信号,输出到音频播放设备。
vii)在服务器端B,所述设定的三个门限值是用于比较声音数据的“过零率”的,即单位时间内信号波穿过横轴,也就是过零电平的次数,混音器在每次得到采样数据后,对数据的过零率加以分析,有两种情况:
i)如果超出一定的数值,即阈值上限,则认定数据为“有声”,只有被认定为有声的数据才参加混音;
ii)设定声音停止时间,对这一段时间内的过零率进行累加,如果数值小于某一特定的值,即阈值下限,则可以断定为“无声”,只要被认定为无声,就应该立即退出发言。
2、一种智能控制视频会议进程的方法,该方法包括客户端A实现的步骤I和服务器端B实现的步骤II,其中:
步骤I表现为1)、客户端A程序对声音数据“捎带”的发言人状况信息I进行判断,若是主席a或主席指定的发言人b,直接向服务器B发送声音数据,若否,判断是否是插话人,如旁听者c;
2)、客户端程序不间断地取得发言人状况信息I,并且解析出最多两个发言人ID,对照自身的ID,即可得出两个简单的事实,即“自身是否插话人”和“当前是否可插话”,如果解析出的两个ID中有一个和自身相等则是插话人c,继续向服务器发送声音数据,如果不等则自身不是插话人c;
3)、再根据发言人状况信息I判断是否可以插话,如果解析出的两个ID均非0,说明插话人名额已满,不发送数据,如果只有一个ID非0或两个都是0,则当前状态可插话,开始向服务器发送声音数据;
步骤II表现为1)、服务器端B在网络中检测到客户端A发来的声音数据后,取得该路数据中的ID,如果是主席a或者主席指定的发言人b终端发来的声音数据,直接参混,否则认定是插话人,如旁听者c;
2)服务器端程序先计算过零率R和时间T内的总过零率A,然后程序根据解析出的ID判断是否当前插话人,若是,根据值A考察是否变为无声,如果变为无声,进行信息设定,从发言人状况信息I中剔除该路ID,并停止发送混合该路音频数据,如果没有变为无声,继续发送混合该路音频数据;
3)若不是当前插话人,根据值R判断是否变为有声,如果变为有声,进行信息设定,从发言人状况信息I中加入该路ID,并开始发送混合该路音频数据,如果没有变为有声,抛弃该数据包。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03102814 CN1206860C (zh) | 2003-01-16 | 2003-01-16 | 一种智能控制视频会议的混音系统及控制会议进程的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03102814 CN1206860C (zh) | 2003-01-16 | 2003-01-16 | 一种智能控制视频会议的混音系统及控制会议进程的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1443006A CN1443006A (zh) | 2003-09-17 |
CN1206860C true CN1206860C (zh) | 2005-06-15 |
Family
ID=27796563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 03102814 Expired - Fee Related CN1206860C (zh) | 2003-01-16 | 2003-01-16 | 一种智能控制视频会议的混音系统及控制会议进程的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1206860C (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100401765C (zh) * | 2005-03-24 | 2008-07-09 | 华为技术有限公司 | 一种视讯会议的控制方法 |
CN100399744C (zh) * | 2005-04-30 | 2008-07-02 | 腾讯科技(深圳)有限公司 | 一种实现群组聊天的方法 |
GB2432759B (en) * | 2005-11-26 | 2008-07-02 | Wolfson Ltd | Audio device |
CN101502089B (zh) * | 2006-07-28 | 2013-07-03 | 西门子企业通讯有限责任两合公司 | 进行音频会议的方法、音频会议装置和编码器之间的切换方法 |
CN101373442B (zh) * | 2008-09-02 | 2011-11-09 | 广东威创视讯科技股份有限公司 | 一种用于传输用户操作事件的方法 |
CN101374344B (zh) * | 2008-10-20 | 2011-10-26 | 杭州优能通信系统有限公司 | 一种无线应急通信综合调度系统 |
CN106162043A (zh) * | 2015-04-14 | 2016-11-23 | 杭州施强网络科技有限公司 | 一种视频会议系统中多媒体文件演示方法 |
CN106534762B (zh) * | 2016-11-16 | 2019-12-13 | 深圳市捷视飞通科技股份有限公司 | 低延时分布式音频处理方法及系统 |
CN107040746B (zh) * | 2017-03-31 | 2019-11-15 | 北京奇艺世纪科技有限公司 | 基于语音控制的多人视频聊天方法及装置 |
CN109510905B (zh) * | 2018-12-06 | 2020-10-30 | 中通天鸿(北京)通信科技股份有限公司 | 多路语音的混音方法及系统 |
CN109976700A (zh) * | 2019-01-25 | 2019-07-05 | 广州富港万嘉智能科技有限公司 | 一种录音权限转移的方法、电子设备及存储介质 |
CN109859753A (zh) * | 2019-02-26 | 2019-06-07 | 北京华夏电通科技有限公司 | 应用于数字法庭的语音激励方法及装置 |
CN109817237A (zh) * | 2019-03-06 | 2019-05-28 | 小雅智能平台(深圳)有限公司 | 一种音频自动处理方法、终端及计算机可读存储介质 |
CN114866813A (zh) * | 2022-04-27 | 2022-08-05 | 北京金山云网络技术有限公司 | 全景直播系统、方法和装置、电子设备、存储介质 |
-
2003
- 2003-01-16 CN CN 03102814 patent/CN1206860C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1443006A (zh) | 2003-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1206860C (zh) | 一种智能控制视频会议的混音系统及控制会议进程的方法 | |
US8170191B2 (en) | Method and system for handling audio signals of conference | |
DE60123823T2 (de) | Vorrichtungen und Verfahren zur Behandlung von RTP- und TCP-Datenverkehr | |
US10244120B2 (en) | Method for carrying out an audio conference, audio conference device, and method for switching between encoders | |
RU2293368C2 (ru) | Способ (варианты) и система (варианты) для управления конференциями и блок управления для многоточечной мультимедийной/речевой системы | |
EP2367343B1 (en) | Audio mixing | |
US6807563B1 (en) | Automatic teleconferencing control system | |
CN1672394A (zh) | 动态确定会议电话桥分器要接收的信息流的会议服务器 | |
WO2000072563A1 (en) | Automatic teleconferencing control system | |
CN112885329B (zh) | 一种提高混音音质的控制方法、装置及存储介质 | |
WO2001045326A2 (en) | Method and device for controlling a telecommunication conference | |
CN100484175C (zh) | 一种会场当前说话者上报的实现方法及系统 | |
EP1668953B1 (en) | Managing multicast conference calls | |
CN100493123C (zh) | 电话会议系统和控制方法 | |
WO2008011901A1 (de) | Verfahren zum durchführen einer sprachkonferenz und sprachkonferenzsystem | |
CN1433207A (zh) | 一种电话视频会议系统及其音频/视频处理方法 | |
Smith et al. | Speaker selection for tandem-free operation VoIP conference bridges | |
CN1610401A (zh) | 多点会议中终端入会及退会的方法 | |
Baskaran et al. | Audio mixer with automatic gain controller for software based multipoint control unit | |
CN1543181A (zh) | 一种分布式混音处理方法 | |
CN106027947A (zh) | 一种会议中成员智能发言控制的方法 | |
CN1277401C (zh) | 电话会议混音方法 | |
CN103095939B (zh) | 会议语音控制方法及系统 | |
JP2016528829A (ja) | 会議設定における参加者の符号化方法および装置 | |
CN114173011B (zh) | 一种面向协同指挥媒体引擎的混音控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right |
Effective date of registration: 20080319 Pledge (preservation): Preservation |
|
PD01 | Discharge of preservation of patent |
Date of cancellation: 20080919 Pledge (preservation): Preservation registration |
|
PD01 | Discharge of preservation of patent |
Date of cancellation: 20080919 Pledge (preservation): Preservation registration |
|
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |