CN100442810C - 一种混音处理方法 - Google Patents
一种混音处理方法 Download PDFInfo
- Publication number
- CN100442810C CN100442810C CNB021576572A CN02157657A CN100442810C CN 100442810 C CN100442810 C CN 100442810C CN B021576572 A CNB021576572 A CN B021576572A CN 02157657 A CN02157657 A CN 02157657A CN 100442810 C CN100442810 C CN 100442810C
- Authority
- CN
- China
- Prior art keywords
- correspondent
- voice
- encoding
- voice signal
- decoding mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明的目的是提供一种用于多方通话(例如会议电话/电视业务中)的混音处理方法,它可以使得多方通话业务中使用各种语音编解码方式的用户都接收到语音质量令人满意的信号。本发明的混音处理方法包含以下步骤:(1)判断通话各方是否采用基于分析-合成的语音编解码方式;(2)通过比较正在通话各方语音信号的能量或幅度和优先级设定规则,从中确定出最优先通话方、次优先通话方和语音信号混合处理所需的通话方;(3)对确定的混合处理所需通话方的语音信号进行语音混合处理;(4)将次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其它通话方发送语音信号:如果通话方采用基于分析-合成的语音编解码方式,则向其传送最优先通话方的语音信号,否则向其传送经过混合处理的语音信号。
Description
技术领域
本发明涉及语音处理方法,特别涉及一种用于多方通话(例如会议电话和会议电视等场合)的混音处理方法。
背景技术
随着通信网络及业务的蓬勃发展,多方通话业务已经成为公共交换电信网/综合业务数字网(PSTN/ISDN)、分组语音网和移动网必备的补充业务,同时在上述网络中会议电话和会议电视业务应用也越来越广泛。基本的语音业务仅涉及两个通话方,通话双方可互相听到对方的声音,而在多方通话业务和会议业务中,同时通话方可能不止两方,其中任意一方的语音信号都可以被传送至所有其他通话方,而每一通话方都同时可听到多个其他通话方的声音。为此,在多方通话或会议电话业务中通常需要进行混音处理,也即将多个通话方的语音信号混合起来,以便任意一个通话成员都可同时听到其它通话方的声音。
传统的混音一般采用两种方法,以下分别加以描述。在第一种方法中,通信系统首先比较所有正在讲话的通话方的语音信号强弱(以语音信号的能量或幅度量度),找出声音最强的通话方(以下简称为最大方)和声音次强的通话方(以下简称为次大方),然后将最大方的语音信号传送给所有其他通话方,并将次大方的语音信号传送给最大方,以下将这种方法称之为最大方比较法。这种方法的优点是实现方式较简单,缺点是当两方或多方同时或很快地交替说话时(例如两个人争吵的情况),将使得各方无法同时听到说话者的声音,并会导致最大方声音的频繁切换,混音效果很差,甚至根本无法听清声音。
另一种方法称之为多方混音法,其基本原理是将通话中声音较强的几方或所有方的语音信号都混合起来(例如采用线性或非线性叠加方式处理)后传送给所有各方。该方法能很好地解决最大方比较法中的频繁切换问题,混音效果较好,但是一般仅适合通话各方都使用G.711编解码传输语音或基于波形的语音编解码情况,即,仅适合PSTN/ISDN网络中的多方通话业务,但不适合通话方中有使用低比特率语音编解码的情况(例如移动网络和分组语音网络中的多方通话业务)。这是因为,目前移动网络和分组语音网络等通信网络所采用的低比特率语音编解码方法都基于参数编码原理或分析-合成方式,即通过提取说话人语音信号中的特征参数来压缩语音,例如GSM网络中的全球移动通信系统(GSM)全速率/半速率/增强型全速率(GSM-FR/HR/EFR)语音编解码方法,通用移动电信系统(UMTS)网络中的自适应多码速率(AMR)语音编解码方法以及H.323网络中的G.723.1、G.729等语音编解码方法。就上述这些基于分析-合成的语音编解码而言,其仅能够提取单个说话人语音信号中的特征参数,对于包含多个说话者声音的混音信号,由于无法区分出每个说话人语音信号中的特征参数,因此难以进行语音编解码处理。也就是说,经过混音后的语音信号若经过低比特率语音编解码处理,语音质量非常差,特别是混音信号包含较多方语音的情况下更是如此。
在实际应用中,随着移动通信和分组语音通信的普及,多方通话或会议业务必然将包括移动用户和分组语音用户,因此需要一种混音方法,它适用于同时包含高、低比特率语音编解码用户的多方通话业务。
发明内容
本发明的目的是提供一种用于多方通话(例如会议电话和电视业务中)的混音处理方法,它可以使得多方通话业务中的使用各种语音编解码方式的用户都能接收到语音质量令人满意的信号。
按照本发明的用于多方通话业务的混音处理方法,业务处理系统对通话各方语音信号的混音处理包含以下步骤:
(1)判断通话各方是否采用基于分析-合成的语音编解码方式;
(2)通过比较正在通话各方语音信号的能量或幅度和优先级设定规则,从中确定出最优先通话方、次优先通话方和语音信号混合处理所需通话方;
(3)对确定的混合处理所需通话方的语音信号进行语音混合处理;
(4)将次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其它通话方发送语音信号:如果通话方采用基于分析-合成的语音编解码方式,则向其传送最优先通话方的语音信号,否则向其传送经过混合处理的语音信号。
对于采用基于分析-合成的语音编解码方式的通话方(例如GSM或UTMS网移动用户、使用低比特率语音编解码的分组语音用户),本发明的方法只传送最优先通话方的语音信号而不传送混合处理后的语音信号,因此有效解决了在这些语音编解码方式下无法从多方混音中提取特征参数的问题,提高了这部分通话方接收到的声音效果。对于采用其它基于波形的语音编解码方式的通话方(例如PSTN/ISDN用户),本发明的方法传送混合处理后的多方语音信号,解决了最大方比较法中最大方声音频繁切换的问题,显著提高了混音效果和质量。
附图简述
图1为本发明混音处理方法的流程图。
具体实施方式
如上所述,最大方比较法不适合于多方通话中最大方声音频繁切换的情形,而多方混音法虽然很好地解决了最大方比较法中的频繁切换问题,混音效果较好,但是不适合通话方中有使用基于分析-合成的语音编解码方式的情况(例如GSM或UTMS移动网络和H.323分组语音网络中的多方通话业务)。针对多方通话业务中包含不同语音编解码方式通话方的情形,本发明的方法采用相应的优化方式分别处理两种通话方的语音信号传送,以下结合图1描述本发明方法的原理。
如图1所示,在步骤1中,实现多方通话业务的处理系统首先根据语音信号的能量或幅度和优先级设置规则确定最优先通话方、次优先通话方和语音信号混合处理所需通话方。值得指出的是,这里最优先通话方、次优化通话方和语音信号混合处理所需通话方的确定与最大方比较法或多方混音法中的略有不同,在上述最大方比较法或多方混音法中,确定的判决仅是语音信号的强弱,而本发明的方法还考虑到优先级设定规则。至于优先级设定规则,本发明并无限制。例如,设定规则可以是,只要主持会议的通话方讲话,其即被确定为最优先通话方和语音信号混合处理所需通话方,又如,当多个通话方的语音信号强弱差不多时,可以按照通话方讲话开始时间的先后设定最优先通话方和次优先通话方。
接着进入步骤2,对步骤(1)所确定的混合处理所需通话方的语音信号进行信号混合处理,语音信号混合的方式可以采用例如线性叠加或非线性叠加等式,本发明对此并无限制。
在步骤3中,将步骤(1)确定的次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其它通话方发送语音信号:如果接收语音信号的通话方采用基于分析-合成的语音编解码方式,则向其传送最优先通话方的语音信号,否则向其传送经过混合处理的语音信号。完成上述处理后即返回步骤1以进行下一次混音处理。
在上述方法中,使用G.711编解码之类较基于波形的语音编解码方式的通话方(PSTN/ISDN用户)将接收到经过混合处理的连续声音,而使用基于分析-合成的语音编解码方式的通话方(GSM或UTMS移动用户和H.323分组语音用户)将接收到最优先通话方较清晰的声音。
在上述混音处理方法中,比较好的是,业务处理系统根据多方通话业务呼叫建立时各方呼叫局的信息(特别是各方呼叫局向及呼叫参数的信息)判断其是否采用低比特率语音编解码,并且如果无法判断,则确定其采用基于分析-合成的语音编解码方式以确保通话方收听到的语音信号质量至少维持在一定的水平之上。
以下进一步描述本发明方法的较佳实施方式。为了方便地管理多方通话或会议电话业务中各个通话方的信息,可以在业务开始时创建存储相关信息的表格并且进行实时动态维护该表格。表格存储的信息包括但不限于:每个通话方的标识、传送和接收语音信号所用的通道编号、语音编解码方式标识信息、与混音处理方式有关的状态信息等。所谓语音编解码方式标识信息即该通话方当前是否采用基于分析-合成的语音编解码方式的信息,例如可以用一个取值为1的比特表示其采用基于分析-合成的语音编解码方式而用一个取值为0的比特表示其采用基于波形的语音编解码方式。所谓与混音处理方式有关的状态信息即该通话方当前是否为最优先通话方、次优先通话方或语音信号混合处理所需的通话方。
表1示出了这样一种表格的示例。如表1所示,第一行为所存储信息类型的名称,包括呼叫方编号、通话所用通道编号、是否使用基于分析-合成的语音编解码方式的标志、最优先标识、次优先标识以及是否参与语音信号混合处理的标识等。每个通话方都被视为多方通话或会议电话的呼叫方,当呼叫建立时由业务处理系统将呼叫方的编号、所用通道编号以及是否使用低比特率语音编解码的标志信息写入表1相应的位置。例如表1即假设呼叫方1(即编号为1的呼叫方,以下同)使用编号为3的通道并且采用比特1表示基于分析-合成的语音编解码方式,呼叫方2使用编号为1的通道并且采用比特0表示基于波形的语音编解码方式,呼叫方3使用编号为2的通道并且采用比特0基于波形的语音编解码方式。
业务处理系统按照先前描述的方式,根据语音信号能量或幅度大小和优先级别设定规则,从通话各方的语音信号确立最优先通话方、次优先通话方和语音信号混合处理所需的通话方,并且将判断结果写入表1相应的位置。例如假定根据判断结果,呼叫方1~3都为语音信号混合处理所需的通话方,呼叫方2为最优先通话方而呼叫方3为次优先通话方,因此在表1中,呼叫方2的最优先标识比特取值为1,呼叫方3的次优先标识比特取值为1,呼叫方1~3的是否参与混合处理的标识比特取值为1。
随后,业务处理系统按照表1进行相应的操作。具体而言,业务处理系统将呼叫方1~3的语音信号进行混合,将呼叫方3的语音信号传送给呼叫方2,将呼叫方2的语音信号传送给呼叫方1,而将混合处理后的语音信号传送给呼叫方3。
值得指出的是,表1存储的信息是动态变化的,例如当有新的通话方建立呼叫时或者已有通话方退出呼叫时,表1的呼叫方信息将作增删,又如,业务处理系统在确定最优先通话方、次优先通话方和语音信号混合处理所需的通话方后即以最新确定的结果更新表1相应的内容。
表1
呼叫方编号 | 通道编号 | 是否使用基于分析-合成的语音编解码方式 | 最优先标识 | 次优先标识 | 是否参与混合处理 |
1 | 3 | 1 | 1 | ||
2 | 1 | 0 | 1 | 1 | |
3 | 2 | 0 | 1 | 1 |
Claims (5)
1.一种用于多方通话的混音处理方法,其特征在于,业务处理系统对通话各方语音信号的混音处理包含以下步骤:
(1)判断通话各方是否采用基于分析-合成的语音编解码方式;
(2)通过比较正在通话各方语音信号的能量或幅度和优先级设定规则,从中确定出最优先通话方、次优先通话方和语音信号混合处理所需通话方;
(3)对确定的混合处理所需通话方的语音信号进行混合处理;
(4)将次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其它通话方发送语音信号:如果通话方采用基于分析-合成的语音编解码方式,则向其传送最优先通话方的语音信号,否则向其传送经过混合处理的语音信号。
2.如权利要求1所述的混音处理方法,其特征在于,所述业务处理系统根据多方通话业务呼叫建立时各方呼叫局向及呼叫参数的信息判断其是否采用基于分析-合成的语音编解码方式。
3.如权利要求2所述的混音处理方法,其特征在于,如果无法判断是否采用基于分析-合成的语音编解码方式,则认为通话方其采用基于分析-合成的语音编解码方式。
4.如权利要求1-3中任意一项所述的混音处理方法,其特征在于,步骤(2)中的所述混合处理采用语音信号的线性或非线性叠加方式实现。
5.如权利要求1-3中任意一项所述的混音处理方法,其特征在于,基于波形的语音编解码方式为G.711协议语音编解码方式,所述基于分析-合成的语音编解码方式为GSM全速率/半速率/增强型全速率语音编解码方式、自适应多码速率语音编解码方式、G.723.1协议语音编解码方式和G.729协议语音编解码方式中的其中一种方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021576572A CN100442810C (zh) | 2002-12-23 | 2002-12-23 | 一种混音处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021576572A CN100442810C (zh) | 2002-12-23 | 2002-12-23 | 一种混音处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1510898A CN1510898A (zh) | 2004-07-07 |
CN100442810C true CN100442810C (zh) | 2008-12-10 |
Family
ID=34236626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021576572A Expired - Lifetime CN100442810C (zh) | 2002-12-23 | 2002-12-23 | 一种混音处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100442810C (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100399744C (zh) * | 2005-04-30 | 2008-07-02 | 腾讯科技(深圳)有限公司 | 一种实现群组聊天的方法 |
CN100459696C (zh) * | 2006-09-29 | 2009-02-04 | 华为技术有限公司 | 一种音频混音处理方法及其装置 |
CN101466043B (zh) | 2008-12-30 | 2010-12-15 | 华为终端有限公司 | 一种多路音频信号处理的方法、设备及系统 |
CN101707593B (zh) * | 2009-11-17 | 2012-12-19 | 红杉树(杭州)信息技术有限公司 | 一种基于树形服务器、pc客户端和电话设备客户端的会议系统 |
CN102404546A (zh) * | 2011-10-28 | 2012-04-04 | 广东威创视讯科技股份有限公司 | 会议音频系统 |
CN104660423A (zh) * | 2013-11-25 | 2015-05-27 | 北京信威通信技术股份有限公司 | 结合组呼的会议实现方法、装置和系统 |
CN106878230A (zh) * | 2015-12-10 | 2017-06-20 | 中国电信股份有限公司 | 网络电话会议中的音频处理方法、服务器以及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123977A (zh) * | 1994-05-17 | 1996-06-05 | 摩托罗拉公司 | 在快速分组网中分布电话会议的方法 |
JP2001024800A (ja) * | 1999-07-06 | 2001-01-26 | Nec Eng Ltd | 音声会議システム |
-
2002
- 2002-12-23 CN CNB021576572A patent/CN100442810C/zh not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123977A (zh) * | 1994-05-17 | 1996-06-05 | 摩托罗拉公司 | 在快速分组网中分布电话会议的方法 |
JP2001024800A (ja) * | 1999-07-06 | 2001-01-26 | Nec Eng Ltd | 音声会議システム |
Also Published As
Publication number | Publication date |
---|---|
CN1510898A (zh) | 2004-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1371580A (zh) | 蜂窝电话的基于网络的噪声抑制 | |
WO2001065763A3 (en) | Providing location information for telephony over data communication networks | |
EP1755325A3 (en) | Method and apparatus for mobile teleconferencing | |
TW200509660A (en) | Method and system for enhanced conferencing using instant messaging | |
ID22038A (id) | Metode dan sistem panggilan konferensi untuk suatu kanal komunikasi tanpa kabel | |
CN100442810C (zh) | 一种混音处理方法 | |
CN101340631A (zh) | 结合彩铃对用户发出提醒信息的系统和方法 | |
CN101132442B (zh) | 一种操作彩铃的方法 | |
CN100518219C (zh) | 一种在终端上实现彩色回铃音业务的方法 | |
CN100463404C (zh) | 利用媒体资源服务器实现电话会议业务的方法 | |
CN101252766B (zh) | 小灵通手机生产测试系统 | |
CN103686059B (zh) | 分布式混音处理方法及系统 | |
JP4352138B2 (ja) | 携帯電話での同報通話システム | |
CN100499714C (zh) | 一种即时语音消息系统 | |
CN100505801C (zh) | 一种通话中加入背景音的方法及其系统 | |
CN101115096B (zh) | 一种实现彩铃互听的方法、系统及交换机 | |
CN101111035A (zh) | 在ptt终端中实现语音缓冲的装置和方法 | |
CN105120049B (zh) | 一种家庭网关及其实现电话录音的方法 | |
CN100397892C (zh) | 基于移动通信网络的可视电话呼叫的处理方法 | |
US20080280597A1 (en) | Method for Adding Background Sound to Mobile Communication Telephone Talking and Communication System Thereof | |
CN100461947C (zh) | 多用户电话号码无线终端及其呼入、呼出方法 | |
CN100450223C (zh) | 一种在移动软交换架构下实现集群业务的方法 | |
GB0307720D0 (en) | Telecommunications services apparatus | |
CN108924372A (zh) | 一种用于电话调度中心的多维度录音方法 | |
CN100456783C (zh) | 移动通信通话中背景音的加入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20081210 |
|
CX01 | Expiry of patent term |