CN103093754A - 用于同声传译业务的语音弱化处理方法 - Google Patents
用于同声传译业务的语音弱化处理方法 Download PDFInfo
- Publication number
- CN103093754A CN103093754A CN 201310055867 CN201310055867A CN103093754A CN 103093754 A CN103093754 A CN 103093754A CN 201310055867 CN201310055867 CN 201310055867 CN 201310055867 A CN201310055867 A CN 201310055867A CN 103093754 A CN103093754 A CN 103093754A
- Authority
- CN
- China
- Prior art keywords
- voice
- correspondent
- encoding
- voice signal
- weaken
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种同声传译业务的语音弱化处理方法,主要解决现有技术中存在翻译声音与源语言声音混音效果差的问题。本发明通过采用包括如下步骤:1)通过比较所接入通道组内各通话方通道的语音信号的能量或幅度和优先级设定规则,从中分析确定出最优先通话方、次优先通话方、单向广播方、定向广播方、单向接收方、定向接收方和语音信号弱化混合处理所需的通话方;2)对确定的语音弱化混合处理所需通话方的语音信号经多重编码和对编码的二次优化处理后进行语音弱化混合处理;3)在所接入通道组内的通话方通道上依据优先级设定规则传送语音弱化混合处理后的语音信号的技术方案较好地解决了该问题,可用于多语种同声传译服务的多方通话业务中。
Description
技术领域
本发明涉及一种用于同声传译业务的语音弱化处理方法。
背景技术
随着通信网络及业务的蓬勃发展,多方通话业务已经成为公共交换电信网/综合业务数字网(PSTN/ISDN)、分组语音网和移动网必备的补充业务,同时在网络电话会议和视频会议业务应用也越来越广泛,基本的语音业务涉及两个通话方,通话双方可以相互听到对方的声音,而在多方通话业务和会议业务中,同时通话可能不止两方,其中任意一方的语音信号够可以被传送至所有其他通话方,而每一通话方都同时可听到多个其他通话方的声音。而当上述多方通话业务(包括网络电话会议和视频会议业务)中使用多种语言时,需要对发言者的讲话内容进行口头翻译(简称口译)。口译有多种分类,按照传送方式的不同,包括同声传译和交替传译,目前的国际会议基本上以同声传译为主。在基于多语种同声传译服务的多方通话业务和会议业务中,通话双方或多方都能听到翻译的声音,而为了保证和提升基于同声传译业务翻译准确性和安全性,在将翻译的声音传送给对方任一听众的同时,还需将演讲者声音传送给对方任一听众,为了避免翻译声音和演讲者源语言声音的混淆,需要对演讲者声音的进行弱化处理。为此,在基于多语种同声传译翻译服务的多方通话业务和会议业务中需要增加能实时调整任一音源音量的混音处理,也即将不同的音频流在某个节点处通过优化处理混合成一个音频流,以便任意一个通话成员都可同时听到其他通话方的清晰有层次感的整体声音。
传统的混音一般采用两种方法,以下分别加以描述。在第一种方法中,通信系统首先比较所有正在讲话的通话方的语音信号强弱(以语音信号的能量或幅度量度),找出声音最强的通话方(以下简称为最大方)和声音次强的通话方(以下简称次大方),然后将最大方的语音信号传送给所有其他通话方,并将次大方的语音信号传送给最大方,以下将这种方法称之为最大方比较法。这种方法的优点是实现方式较简单、缺点是当两方或多方同时或很快地交替说话时(例如两个人争吵的情况),降使得各方无法同时听到说话者的声音,并导致最大方声音的频繁切换,混音效果很差,甚至根本无法听清声音。
另一种方法称之为多方混音法,其基本原理是将通话中声音较强的几方或所有方的语音信号都混合起来(例如采用线性或非线性叠加方式处理)后传送给所有各方。该方法能很好地解决最大方比较法中的频繁切换问题,混音效果较好,但是一般仅适合通话各方面使用G.711编解码传输语音或基于波形的语音编解码情况,即,仅适合PSTN/ISDN网络中的多方通话业务,但不适合通话方中有使用低比特率语音编解码的情况(例如移动网络和分组语音网络中的多方通话业务)。这是因为,目前移动网络和分组语音网络等通信网络所采用的低比特率语音编解码方法都基于参数编码原理或分析-合成方式,即通过提取说话人语音信号中的特征参数来压缩语音,例如GSM网络中的全球移动通信系统(GSM)全速率/半速率/增强型全速率(GSM-FR/HR/EFR)语音编解码方法,通信移动电信系统(UMTS)网络中的自适应多码速率(AMR)语音编解码方法以及H.323网络中的G.723.1、G.729等语音编解码方法。就上述基于分析-合成的语音编解码而言,其仅能够提取单个说话人语音信号中的特征参数,对于包含多个说话者声音的混音信号,由于无法区分出每个说话人语音信号若经过低比特率语音编解码处理,语音质量非常差,特别是混音信号包含较多方语音的情况下更是如此。
随着移动通信和分组语音通信的普及,基于多语种同声传译服务的多方通话业务或会议业务中必然将包括移动用户和分组语音用户,因此一种适用于同时包含高、低比特率语音编解码用户、并能在讲不同语言的用户沟通过程中实现源语言声音弱化的混音处理技术在多方通话业务中具有重要的应用价值。
中国发明专利200610040060.1公开了一种混音处理方法,该发明采用对于采用基于分析-合成的语音编解码方式的通话方(例如GSM或UTMS网络移动用户、使用低比特率语音编解码的分组语音用户)只传送最优先通话方的语音信号而不传送混合处理后的语音信号;对于采用其他基于波形的语音编解码方式的通话(例如PSTN/ISDN用户),传送混合处理后的多方语音信号的方法。该方法虽然可以使得多方通话业务中使用各种语音编解码方式的用户都接收到语音质量信号得到一定的改进,但仍有其局限性:因采用常见的线性叠加混音算法,当混音语音数达到一定数目时存在混音后音量降低、求和溢出及引入随机噪音的缺点;另外,不包含语音弱化功能,用于同声传译业务中存在混音处理后的翻译声音与源语言声音易于混淆的缺点。
中国发明专利200910179642.1公开了一种支持同声传译视讯会议的方法、装置及系统,该发明采用各会议终端能够按照自身的翻译语言类型对会场的原始语音进行翻译后输出,由MCU(多点控制器)将会议终端翻译后的翻译语音进行混音处理后,再按照语言类型发送给其他的会议终端的方法。该方法虽然能将多个翻译声音经混音处理后按照语言类型传送给对方会议终端的任一与会者,但存在每个会场必须设置自己专门的翻译机构和混音处理后的翻译声音和演讲者源语言声音易于混淆的缺点。
发明内容
本发明所要解决的技术问题是现有技术存在翻译声音与源语言声音混音效果差的问题,提供了一种新的用于同声传译业务的语音弱化处理方法。该方法具有翻译声音与源语言声音混音效果好的特点。
为解决上述技术问题,本发明采用技术方案如下:一种用于同声传译业务的语音弱化处理方法,通过采用包括如下步骤:
1)通过比较所接入通道组内各通话方通道的语音信号的能量或幅度和优先级设定规则,从中分析确定出最优先通话方、次优先通话方、单向广播方、定向广播方、单向接收方、定向接收方和语音信号弱化混合处理所需的通话方;
2)对确定的语音弱化混合处理所需通话方的语音信号经多重编码和对编码的二次优化处理后进行语音弱化混合处理;
3)在所接入通道组内的通话方通道上依据优先级设定规则传送语音弱化混合处理后的语音信号;
其中,步骤3)包括将次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其他通话方发送语音信号:如果通话方采用基于分析-合成的语音编码方式,则向其传送最优先通话方的语音信号,否则向其传送经过语音弱化混合处理的语音信号;将经过语音弱化混合处理的单向广播方的语音信号优先传送给单向接收方,然后再传送给除定向接收方之外的其他通话方;将经过语音弱化混合处理的定向广播方的语音信号优先并仅发送给定向接收方。
上述技术方案中,优选地,步骤2)中所述的多重编码和对编码的二次优化处理包括将单向广播方的语音信号增至最高优先级,将定向广播方的语音信号相对定向点设置为最高优先级,将单向接收方的收话通道设置为最高优先级并同时屏蔽广播端口,以及将定向接收方的收话通道设置为最高优先级的多重编码处理。
上述技术方案中,优选地,所述业务处理系统根据多方通话业务呼叫建立时各方呼叫局向及呼叫参数的信息判断其是否采用基于分析-合成的语音编解码方式。其中,如果无法判断是否采用分析-合成的语音编解码方式,则默认根据网络环境以及承载服务器的配置寻找最优的语音编解码方案,并且在环境变优的情况下可以自动切换到保持高效的更优方案。
上述技术方案中,优选地,步骤2)中的所述混合处理采用语音信号的线性或非线性叠加方式算法实现。更优选地,所述混合处理采用优化的拉格朗日小波蝴蝶算法。
上述技术方案中,优选地,所述基于波形的编解码方式包含但不限于G.711协议语音编解码方式、G.276协议语音编解码方式、GSM全速率/半速率/增强型全速率语音编解码方式、自适应多码速率语音编解码方式、G.723.1协议语音编解码方式、G.729协议语音编解码方式中的其中一种或多重叠加。编解码方式的选择基于实际处理环境,包括但不限于网络环境和服务器配置环境。
与现有技术相比,本发明提供的一种用于同声传译业务的语音弱化处理方法,首先,通过根据网络环境以及承载服务器的配置寻找最优的语音编解码方案和对多方用户的语音信号进行多重编码或对编码二次优化处理,以及按一定的优先级设定规则传送语音弱化处理后语音信号,不仅有效解决了基于分析-合成的语音编解码方式下无法从多方混音汇总提取特征参数的问题和最大方比较法中最大方声音频繁切换的问题,而且可根据用户的具体要求,优先传送所需的语音弱化混合处理语音信号,显著提高了各通话方接收到的声音效果和保证了语音信号传输的安全性;其次,通过在语音弱化混合处理中采用优化的拉格朗日小波蝴蝶算法,避免了常用的迭代算法计算量大、递归算法运行效率较低和递归次数过多容易造成栈溢出等缺点,有效提高了混音处理效率和避免了音频传输过程中可能产生的丢包,杂音,回声等音频干扰隐患;再次,通过在语音混合处理过程中实时调整每一个音源的音量,并在音频流中的相互干扰断点进行优化处理,让多重音源不会相互干扰,以突出翻译声音,弱化源语言声音,使得整体声音清晰有层次感,该模式不仅符合用户要求,而且最大化提升了同声传译过程中的准确性和安全性。本发明通过上述技术的综合使用,使得基于多语种同声传译服务的多方通话业务中的语音质量更清晰、自然、有层次感,使得基于多语种同声传译服务的多方通话业务中使用各种语音编解码方式的用户都接收到语音质量令人满意的信号,取得了较好的技术效果。
附图说明
图1为本发明的一种用于同声传译业务的语音弱化处理方法流程图。
图2~4为本发明的实施例中三方参与双语同声传译业务示意图。
图5为本发明的实施例中多方参与多语同声传译业务示意图。
图6为本发明的实施例中双语同声传译业务会议异地接入、多方参与流程图。
图7为本发明的实施例中设定两名翻译员的同声传译业务会议异地接入、多方参与流程图。
参阅图1,本发明的一种用于同声传译业务的语音弱化处理方法流程图,如图所示,所述方法采用以下步骤:
在步骤1)中实现基于多语种同声传译服务的多方通话业务处理系统首先根据语音信号的能量或幅度和优先级设置规则确定最优先通话方、次优先通话方、单向广播方、定向广播方、单向接收方、定向接收方和语音信号弱化混合处理所需的通话方。值得指出的是,这里最优先通话方、次优先通话方和语音信号弱化混合处理所需的通话方和语音信号混合处理所需通话方的确定与最大方比较法或多方混音法中的略有不同,在上述最大方比较法或多方混音法中,确定的判决仅是语音信号的强弱,而本发明的方法还考虑优先级设置规则。至于优先级设置规则,本发明并无限制。例如,设置规则可以是,只要主持会议的通话方讲话,其即被确定为最优先通话方和语音弱化混合处理所需通话方;又如,只要同声传译业务会议翻译员讲话,其即被确定为语音弱化混合处理所需通话方;又如,当多个通话方的语音信号强弱差不多时,可以按照通话方讲话开始时间的先后设定最优先通话方、次优先通话方。
接着进入步骤2),对步骤1)所确定的语音弱化混合处理所需通话方的语音信号经多重编码和对编码的二次优化处理后进行语音弱化混合处理,语音弱化混合处理的方式采用线性或非线性叠加方式算法实现,优选采用优化的拉格朗日小波蝴蝶算法进行语音弱化混合处理。其算法的思路如下:首先取采样点数n=2J,得到信号向量一般来说采样点之间的时间间隔是相等的,我们可以把f看作均匀分布于[0,1)上n个点取值的离散函数。这n个点是将[0,1)区间n等分所得到小区间的左端点。为了将向量展开,我们首先要将一阶小波函数写成向量形式。方法是将[0,1)区间上的小波变换函数在上述n个点取值,就得到了向量形式的一阶小波。
由于在20尺度上有一个φ(盒函数)和一个W(即W(t)),2-1尺度上有2个W(即W(2t),W(2t-1)),···,2-j尺度上有j个W;再注意到有:n=1+20+......+2J-1,故从20尺度到2-J尺度上依上述方法得到共n个向量形式的一阶小波。可以证明它们是线性无关的,从而任何n维的信号向量可以表示为它们的线性组合,也就是可以沿它们展开。
在步骤3)中,将步骤1)确定的次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其他通话方发送语音信号:如果通话方采用基于分析-合成的语音编码方式,则向其传送最优先通话方的语音信号,否则向其传送经过语音弱化混合处理的语音信号;将经过语音弱化混合处理的单向广播方的语音信号优先传送给单向接收方,然后再传送给除定向接收方之外的其他通话方;将经过语音弱化混合处理的定向广播方的语音信号优先并仅发送给定向接收方。完成上述处理后即返回步骤1)以进行下一次混音处理。
在上述方法中,使用G.711语音编解码之类较基于波形的语音编解码方式的通话方(PSTN/ISDN用户)将接收到经过混合处理的连续声音,而使用基于分析-合成的语音编解码方式的通话方(GSM或UTMS移动网络和H.323分组语音网络中的多方通话业务)将接收到最优先通话方较清晰的声音。另外,比较好的是,业务处理系统根据多方通话业务呼叫建立时各方呼叫局的信息(特别是各方呼叫局向及呼叫参数的信息)判断其是否采用低比特率语音编解码,并且如果无法判断,则默认根据网络环境以及承载服务器的配置寻找最优的语音编解码方案,并且在环境变优的情况下可以自动切换到保持高效的更优方案,以确保通话方收听到的语音信号质量至少维持在一定的水平之上。
上述方法在基于多语种同声传译服务的多方通话业务或会议业务中具体使用时,对于发言权,需要进行权限设定,对于一般身份的客户,其发言的语种只能使用默认的一种语种,只有身份为翻译或高级的客户可以选择发言的语种为其他语种;另外,对于一些特殊身份的客户,其只具有发言权或定向发言权,没有接收权。对于接收权,需要进行权限设定,根据客户收听选择的语种将其所需要的语种和源语言语种语音弱化混合处理后的压缩传送。对于发言与收听处于同一语种的客户,还需先将其声音从混合的声音中减掉,以避免该客户听到自己的声音;另外,对于一些特殊身份的客户,其只具有接收权没有发言权或只能定向接收部分客户混合后的声音,没有发言权。
一般情况下,为了方便地管理多方通话或会议电话业务中各个通话方的信息,可以在业务开始时创建存储相关信息的表格并且进行实时动态维护表格。表格存储的信息包括但不限于:每个通话方的标识、语种、传送和接收语音信号所用的通道编码、语音编解码方式标识信息、与语音弱化混音处理方式有关的状态信息等。例如可以用一个取值为1的比特表示其采用分析-合成的语音编解码方式而用一个取值为0的比特表示其采用基于波形的语音编解码方式。所谓与语音弱化混音处理方式有关的状态信息即该通话方当前是否为最优先通话方、次优先通话方、单向广播方、定向广播方、单向接收方、定向接收方和语音信号弱化混合处理所需的通话方。
为使本发明的目的、技术方案及效果更加清楚、明确,以下结合实施例对本发明进一步的详细说明。
具体实施方式
【实施例1】
参照图2~4,具体到用户A、用户B和翻译员三方参与的双语同传业务的实施例,其中包括:用户A、用户B和翻译员均不在同一地点(参见图2);用户A和翻译员在同一地点,用户B在另一地点(异地)(参见图3);用户A和用户B在同一地点,翻译员在另一地点(异地)(参见图4)。当呼叫建立时由同声传译业务处理系统将上述三方的编号,语种(用户A只懂中文,翻译员懂中文和英语,用户B只懂英语)、所用通道编号以及上述三方的通道均采用比特0表示基于波形的语音编解码方式都写入同声传译业务处理系统的存储表格中。当用户A讲话时,翻译员同时进行翻译,按照图1所示的方法,同声传译业务处理系统根据上述三方的语音信号能量或幅度大小和优先级设定规则,判定用户A和翻译员为语音弱化混合处理所需的通话方,用户A为最优先通话方而翻译员为次优先通话方,并将该判断结果存储于表格里。按照图1所示的方法,同声传译业务处理系统将用户A和翻译员的语音信号进行语音弱化混合处理,将翻译员的语音信号传送给用户A,而将语音弱化混合处理的语音信号传送给用户B。这样用户A将听到翻译员的声音,用户B将听到翻译员的声音和系统自动弱化的用户A的声音。同样,当用户A停止讲话,用户B讲话时,翻译员同时进行翻译,同声传译业务处理系统在确定用户B和翻译员为语音弱化混合处理所需的通话方,用户B为最优先通话方而翻译员为次优先通话方的后即以最新确定的结果更新存储表的相应的内容,并按照与用户A相同的步骤进行语音弱化混合处理后传送,这样用户B将听到翻译员的声音,用户A将听到翻译员的声音和系统自动弱化的用户B的声音。
【实施例2】
参照图5,具体到用户A、用户B、用户C、用户D、翻译员a和翻译员b多方参与的双语同传业务的实施例,其中用户A、用户B、用户C、用户D均不在同一地点,翻译员a和翻译员b在同一地点。当呼叫建立时由同声传译业务处理系统将上述各方的编号,语种(用户A和用户C只懂中文,用户B只懂英语,用户D只懂德语,翻译员a懂中文和英语,翻译员b懂中文和德语)、所用通道编号以及上述用户C的通道采用比特1表示采用基于分析-合成的语音编解码方式,其他各呼叫方采用比特0表示基于波形的语音编解码方式都写入同声传译业务处理系统的存储表格中。当用户A讲话时,翻译员a和翻译员b同时进行翻译,按照图1所示的方法,同声传译业务处理系统根据上述各方的语音信号能量或幅度大小和优先级设定规则,判定用户A和翻译员a和翻译员b均为语音弱化混合处理所需的通话方,用户A为最优先通话方而翻译员a和翻译员b均为次优先通话方,并将该判断结果存储于表格里。按照图1所示的方法,同声传译业务处理系统将用户A、翻译员a和翻译员b的语音信号进行语音弱化混合处理,将用户A的语音信号传送给用户C,将翻译员a和翻译员b的混合处理后的语音信号传送给用户A,而将用户A和翻译员a语音弱化混合处理的语音信号传送给用户B,将用户A和翻译员b语音弱化混合处理的语音信号传送给用户D。这样用户A将听到翻译员a和翻译员b的声音,用户B将听到翻译员a的声音和系统自动弱化的用户A的声音,用户D将听到翻译员b的声音和系统自动弱化的用户A的声音。同样用户A讲话时,翻译员a和翻译员b同时进行翻译,同声传译业务处理系统将重新判断的结果更新存储表格的相应内容,并按照与用户A讲话时相同的方法进行语音弱化混合处理后传送。当只有用户B讲话时,翻译员a同时进行翻译,在听到翻译员a的声音的同时,翻译员b同时进行翻译,按照图1所示的方法,同声传译业务处理系统判定用户B、翻译员a和翻译员b为语音弱化混合处理所需的通话方,用户B和翻译员a之间,用户B为最优先通话方,翻译员a为次优先通话方,翻译员a和翻译员b之间,翻译员a为最优先通话方,翻译员b为次优先通话方的后即以最新确定的结果更新存储表的相应的内容,然后进行语音弱化混合处理,将翻译员b的语音信号传给翻译员a,将翻译员a和翻译员b的混合处理后的语音信号传送给用户B,将用户B和翻译员a语音弱化混合处理的语音信号传送给用户C,将用户B和翻译员a语音弱化混合处理的语音信号传送给用户A,将用户B和翻译员b语音弱化混合处理的语音信号传送给用户D。这样用户B将听到翻译员a和翻译员b的声音,用户C和用户A将听到翻译员a的声音和系统自动弱化的用户B的声音,用户D将听到翻译员b的声音和系统自动弱化的用户B的声音,同样用户D讲话时,同声传译业务处理系统按照与用户D讲话时相同的方法进行语音弱化混合处理后传送。
【实施例3】
参照图6,具体到甲方代表(人员为多位,同地或异地)、乙方代表(人员为多位,同地或异地)和翻译员多方参与的双语同传业务会议的实施例。甲方代表人员只懂中文,乙方代表人员只懂英语,翻译员懂中文和英语。当呼叫建立时由同声传译业务处理系统将上述甲方代表和乙方代表根据语种分为2个通道组,同时再将各通道组内接入的通话方的通道不同进行通道编号,以及上述甲方代表中心点A和分布点B的通道采用比特1表示采用基于分析-合成的语音编解码方式,甲方代表分布点C的通道采用的语音编解码方式未知,同声传译业务处理系统根据分布点C的通道的网络环境以及承载服务器的配置选择分析-合成的语音编解码方式进行编码后采用比特1表示,上述乙方代表的通道均采用比特0表示基于波形的语音编解码方式都写入同声传译业务处理系统的存储表格中。按照图1所示的方法,当甲方代表中心点A讲话时,翻译员同时进行翻译,同声传译业务处理系统根据上述甲、乙各方的语音信号能量或幅度大小和优先级设定规则,判定甲方代表中心点A和翻译员均为语音弱化混合处理所需的通话方,甲方代表中心点A为最优先通话方而翻译员均为次优先通话方,并将该判断结果存储于表格里。按照图1所示的方法,同声传译业务处理系统将甲方代表中心点A和翻译员的语音信号进行语音弱化混合处理,将翻译员的语音信号传给甲方代表中心点A,将甲方代表中心点A的语音信号传送给甲方分布点B和分布点C的代表,将甲方代表中心点A和翻译员的语音弱化混合处理后的语音信号传送乙方各点代表。这样甲方分布点B和C的代表将听到甲方代表中心点发言者的声音,甲方中心点A的代表将听到翻译员的声音,乙方代表将听到翻译员的声音和系统自动弱化的甲方代表中心点A发言者的声音。同样,当乙方代表开始讲话时,此时同声传译业务处理系统进行确认,确认允许乙方代表讲话,并且翻译员实时进行翻译,同声传译业务处理系统按照与甲方代表讲话相同的方法以最新判定结果更新存储表的相应的内容,并进行语音弱化混合处理,这样甲方代表将听到翻译员的声音和系统自动弱化的乙方代表讲话的声音。
【实施例4】
考虑在用户实际的业务开展中,可能遇到如客户甲、乙方代表母语为小语种或面对客户双方参会人员,发言内容,背景专业程度等不同,需要对翻译人员有较高要求时,可以设定两名或多名翻译员协助完成。参照图7,具体到设定两名翻译员的同声传译业务会议异地接入、多方参与的实施例,该实施例为甲方代表在中心A会场召开会议,并将会议的内容和精神传达给中心点B、分布点C和分布点D的乙方代表,并且要求乙方代表就会议具体内容进行讨论。甲方代表人员只懂中文,中心点B乙方代表只懂英语,分布点C乙方代表只懂英语,分布点D乙方代表只懂日语,翻译员甲懂中文和英语,翻译员乙懂英语和日语。当呼叫建立时由同声传译业务处理系统将上述甲方代表和乙方代表根据语种分为3个通道组,同时再将各通道组内接入的通话方的通道不同进行通道编号,以及上述甲、乙各方代表的通道均采用比特0表示基于波形的语音编解码方式都写入同声传译业务处理系统的存储表格中。按照图1所示的方法,当中心点A甲方代表讲话时,翻译员甲和翻译员乙同时进行翻译,同声传译业务处理系统根据上述甲、乙各方的语音信号能量或幅度大小和优先级设定规则,判定中心点A甲方代表、翻译员甲和翻译员乙均为语音弱化混合处理所需的通话方,中心点A甲方代表为单向广播方并对其进行编码优化处理将其升至为最优级,中心点B乙方代表为单向接收方并对其进行编码优化处理将其升至为最优级,翻译员甲为最优先通话方而翻译员乙为次优先通话方,并将该判断结果存储于表格里。按照图1所示的方法,同声传译业务处理系统将中心点A甲方代表、翻译员甲和翻译员乙的语音信号进行语音弱化混合处理,将翻译员乙的语音信号传给翻译员甲,将中心点A甲方代表和翻译员甲的语音弱化混合处理后的语音信号优先传给中心点B乙方代表,将中心点A甲方代表和翻译员甲的语音弱化混合处理后的语音信号传给分布点C乙方代表,将中心点A甲方代表和翻译员乙的语音弱化混合处理后的语音信号传给分布点D乙方代表。这样中心点B乙方代表将优先听到翻译员甲的声音和系统自动弱化后的中心点A甲方代表发言者的声音,分布点C乙方代表将听到翻译员甲的声音和系统自动弱化后的中心点A甲方代表发言者的声音,分布点D乙方代表将听到翻译员乙的声音和系统自动弱化后的中心点A甲方代表发言者的声音。当分布点C乙方代表针对具体问题与分布点D乙方代表讨论时,此时甲方代表与乙方代表之间的会议仍可在继续,按照图1所示的方法,当分布点C乙方代表讲话时,翻译员乙同时进行翻译,同声传译业务处理系统根据上述各方的语音信号能量或幅度大小和优先级设定规则,判定分布点C乙方代表和翻译员乙均为语音弱化混合处理所需的通话方,分布点C乙方代表为定向广播方并对其进行编码优化处理将其升至为最优级,分布点D乙方代表为定向接收方并对其进行编码优化处理将其升至为最优级,并以最新判定结果更新存储表的相应的内容。同声传译业务处理系统将分布点C乙方代表和翻译员乙的语音信号进行语音弱化混合处理,将分布点C乙方代表和翻译员乙的语音弱化混合处理后的语音信号优先并仅传给分布点D乙方代表,这样分布点D乙方代表将听到翻译员乙的声音和系统自动弱化后的分布点C乙方代表发言者的声音,而中心点A甲方代表和中心点B乙方代表均听不到翻译员乙和分布点C乙方代表发言者的声音。
Claims (7)
1.一种用于同声传译业务的语音弱化处理方法,通过采用包括如下步骤:
1)通过比较所接入通道组内各通话方通道的语音信号的能量或幅度和优先级设定规则,从中分析确定出最优先通话方、次优先通话方、单向广播方、定向广播方、单向接收方、定向接收方和语音信号弱化混合处理所需的通话方;
2)对确定的语音弱化混合处理所需通话方的语音信号经多重编码和对编码的二次优化处理后进行语音弱化混合处理;
3)在所接入通道组内的通话方通道上依据优先级设定规则传送语音弱化混合处理后的语音信号;
其中,步骤3)包括将次优先通话方的语音信号发送给最优先通话方,并且以下述方式向其他通话方发送语音信号:如果通话方采用基于分析-合成的语音编码方式,则向其传送最优先通话方的语音信号,否则向其传送经过语音弱化混合处理的语音信号;将经过语音弱化混合处理的单向广播方的语音信号优先传送给单向接收方,然后再传送给除定向接收方之外的其他通话方;将经过语音弱化混合处理的定向广播方的语音信号优先并仅发送给定向接收方。
2.根据权利要求1所述的用于同声传译业务的语音弱化处理方法,其特征在于步骤2)中所述的多重编码和对编码的二次优化处理包括将单向广播方的语音信号增至最高优先级,将定向广播方的语音信号相对定向点设置为最高优先级,将单向接收方的收话通道设置为最高优先级并同时屏蔽广播端口,以及将定向接收方的收话通道设置为最高优先级的多重编码处理。
3.根据权利要求1所述的用于同声传译业务的语音弱化处理方法,其特征在于所述业务处理系统根据多方通话业务呼叫建立时各方呼叫局向及呼叫参数的信息判断其是否采用基于分析-合成的语音编解码方式。
4.根据权利要求3所述的用于同声传译业务的语音弱化处理方法,其特征在于如果无法判断是否采用分析-合成的语音编解码方式,则默认根据网络环境以及承载服务器的配置寻找最优的语音编解码方案,并且在环境变优的情况下可以自动切换到保持高效的更优方案。
5.根据权利要求1所述的用于同声传译业务的语音弱化处理方法,其特征在于步骤2)中的所述混合处理采用语音信号的线性或非线性叠加方式算法实现。
6.根据权利要求5所述的用于同声传译业务的语音弱化处理方法,其特征在于所述混合处理采用优化的拉格朗日小波蝴蝶算法。
7.根据权利要求1~3中任意一项所述的用于同声传译业务的语音弱化处理方法,其特征在于所述基于波形的编解码方式包含但不限于G.711协议语音编解码方式、G.276协议语音编解码方式、GSM全速率/半速率/增强型全速率语音编解码方式、自适应多码速率语音编解码方式、G.723.1协议语音编解码方式、G.729协议语音编解码方式中的其中一种或多重叠加。编解码方式的选择基于实际处理环境,包括但不限于网络环境和服务器配置环境。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310055867 CN103093754A (zh) | 2013-02-21 | 2013-02-21 | 用于同声传译业务的语音弱化处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310055867 CN103093754A (zh) | 2013-02-21 | 2013-02-21 | 用于同声传译业务的语音弱化处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103093754A true CN103093754A (zh) | 2013-05-08 |
Family
ID=48206259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201310055867 Pending CN103093754A (zh) | 2013-02-21 | 2013-02-21 | 用于同声传译业务的语音弱化处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103093754A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106464768A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中的翻译 |
CN107910006A (zh) * | 2017-12-06 | 2018-04-13 | 广州宝镜智能科技有限公司 | 语音识别方法、装置和多信源语音区分识别系统 |
CN109618258A (zh) * | 2018-12-10 | 2019-04-12 | 深圳市友杰智新科技有限公司 | 一种蓝牙耳机的语音实时翻译方法及系统 |
CN114222031A (zh) * | 2021-12-21 | 2022-03-22 | 瑞德电子(信丰)有限公司 | 网络音频插座双向音频数据传输方法 |
CN114783437A (zh) * | 2022-06-15 | 2022-07-22 | 湖南正宇软件技术开发有限公司 | 一种人机语音交互实现方法、系统及电子设备 |
CN114222031B (zh) * | 2021-12-21 | 2024-06-11 | 瑞德电子(信丰)有限公司 | 网络音频插座双向音频数据传输方法 |
-
2013
- 2013-02-21 CN CN 201310055867 patent/CN103093754A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106464768A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中的翻译 |
CN107910006A (zh) * | 2017-12-06 | 2018-04-13 | 广州宝镜智能科技有限公司 | 语音识别方法、装置和多信源语音区分识别系统 |
CN109618258A (zh) * | 2018-12-10 | 2019-04-12 | 深圳市友杰智新科技有限公司 | 一种蓝牙耳机的语音实时翻译方法及系统 |
CN114222031A (zh) * | 2021-12-21 | 2022-03-22 | 瑞德电子(信丰)有限公司 | 网络音频插座双向音频数据传输方法 |
CN114222031B (zh) * | 2021-12-21 | 2024-06-11 | 瑞德电子(信丰)有限公司 | 网络音频插座双向音频数据传输方法 |
CN114783437A (zh) * | 2022-06-15 | 2022-07-22 | 湖南正宇软件技术开发有限公司 | 一种人机语音交互实现方法、系统及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10834252B2 (en) | Transcribing audio communication sessions | |
CN102017513B (zh) | 用于实时网络通信的方法、实时多语种通信的方法及系统 | |
KR100366325B1 (ko) | 통신 시스템에서의 다자 통신을 실행하기 위한 방법 및 장치 | |
GB2412536B (en) | Multipoint conferencing system employing ip network and its configuration method | |
KR20140103290A (ko) | 회의 시스템에서의 에코 소거를 위한 방법 및 장치 | |
CN103093754A (zh) | 用于同声传译业务的语音弱化处理方法 | |
CN103780403A (zh) | 电话会议的处理方法、装置和系统 | |
CN103500580A (zh) | 混音处理方法及系统 | |
CN101488870B (zh) | 语音混音的实现方法、系统及设备 | |
CN102348097A (zh) | 视频会议中的对话方法及多点控制单元 | |
CN102377888A (zh) | 实现微波通信网上公务电话的系统、装置及方法 | |
CN115662437B (zh) | 一种多话筒同时使用场景下的语音转写方法 | |
CN100442810C (zh) | 一种混音处理方法 | |
CN112019488A (zh) | 一种语音处理的方法、装置、设备和存储介质 | |
CN103686059A (zh) | 分布式混音处理方法及系统 | |
CN111432294B (zh) | 全双工对讲机的无线通信方法与系统 | |
CN114979545A (zh) | 多终端的通话方法和存储介质及电子设备 | |
EP2536176B1 (en) | Text-to-speech injection apparatus for telecommunication system | |
Aguilera et al. | An immersive multi-party conferencing system for mobile devices using binaural audio | |
CN101312549B (zh) | 文本信息转换成流媒体或多媒体进而被终端接收的方法 | |
CN104378390B (zh) | 基于信道的VoIP通信方法、系统、终端和服务器 | |
CN204231472U (zh) | 一种带特征识别的智能会议电话机 | |
CN105743920A (zh) | 一种多方视频会话系统的通信方法 | |
CN103875241B (zh) | 用于在传输数字图像时间序列时处理干扰的方法和设备 | |
CN104580779A (zh) | 一种远程语音翻译终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130508 |