CN103548141B - 从第一语音流中选择编码分组来创建第二语音流 - Google Patents

从第一语音流中选择编码分组来创建第二语音流 Download PDF

Info

Publication number
CN103548141B
CN103548141B CN201280025092.8A CN201280025092A CN103548141B CN 103548141 B CN103548141 B CN 103548141B CN 201280025092 A CN201280025092 A CN 201280025092A CN 103548141 B CN103548141 B CN 103548141B
Authority
CN
China
Prior art keywords
silence suppression
voice flow
packet
scheme
coding groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280025092.8A
Other languages
English (en)
Other versions
CN103548141A (zh
Inventor
J·A·希尔特纳
A·H·马滕
D·R·舒马赫
A·J·萨奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Original Assignee
Alcatel Lucent SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel Lucent SAS filed Critical Alcatel Lucent SAS
Publication of CN103548141A publication Critical patent/CN103548141A/zh
Application granted granted Critical
Publication of CN103548141B publication Critical patent/CN103548141B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/10Architectures or entities
    • H04L65/1053IP private branch exchange [PBX] functionality entities or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5603Access techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

在一种实施方式中,从主叫方接收用于分组交换呼叫的第一语音流。所述语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组。从所述多个编码分组中选择编码分组的子集以便创建符合第二静音抑制方案的第二语音流。所述第二语音流包括所述编码分组的子集。所述第一静音抑制方案与所述第二静音抑制方案不同。向所述分组交换呼叫的被叫方转发所述第二语音流。

Description

从第一语音流中选择编码分组来创建第二语音流
技术领域
本发明一般涉及语音流中的静音抑制(silence suppression)。
背景技术
在发送设备处使用编解码器创建代表用户语音的编码分组来执行通过分组交换网络的语音电话。所述编码分组通过分组交换网络被转发并且在接收设备处被解码。发送和接收设备的示例包括:移动电话、智能电话、因特网协议语音(VoIP)终端、个人计算机、或其他电话设备。在一个实施方式中,移动电话将呼叫方的语音编码成多个编码分组。所述移动电话将所述编码分组作为语音流(例如,分组流)向所述分组交换网络发送。所述分组交换网络将所述语音流向被叫方的移动电话转发,在被叫方的移动电话中解码所述编码分组用于回放给所述被叫方。类似地,所述被叫方的语音被编码并且被转发给所述主叫方以用于回放。
在这个实施方式中,所述移动电话使用增强型可变速率编解码器(Enhanced Variable Rate Codec(EVRC))标准从所述用户语音来创建编码分组。每个编码分组代表所述用户语音和/或背景噪音的20毫秒样本。基于所述样本,所述编码分组以由EVRC标准定义的多个预设的码速率中的一个码速率和相关联的大小被创建。在EVRC中,码速率的示例包括:全速率、半速率、和八分之一(eighth)速率,其分别具有171比特、80比特、和16比特的分组大小。本领域的技术人员将了解,以所述八分之一速率(例如,八分之一速率帧、八分之一速率分组、或速率八分之一帧)编码的编码分组或帧通常用于主要是背景噪音的样本,这是因为他们有更小的帧大小,使用更少的网络资源来传送,并且所述背景噪音对所述用户之间的会话来说不是必需的。
当所述主叫方基本上是静音的时,例如当正在听所述被叫方或在会话中的暂停期间,八分之一速率帧由所述发送设备编码并且被转发给所述被叫方。因为背景噪音通常不是所述会话的重要部分,因此八分之一速率帧中的一些可以从通过所述分组交换网络传输的所述语音流中被移除并且在在所述接收设备处回放前用另一个八分之一速率帧来替换或取代。从所述语音流中完全移除背景噪音对于所述被叫方来说听起来好像是所述呼叫已经被丢弃或以其他方式结束。
发明内容
在一个实施方式中本发明包括一种方法。从主叫方接收用于分组交换呼叫的第一语音流。所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组。从所述多个编码分组中选择编码分组的子集以便创建符合第二静音抑制方案的第二语音流。所述第二语音流包括编码分组的所述子集。所述第一静音抑制方案与所述第二静音抑制方案不同。向所述分组交换呼叫的被叫方转发所述第二语音流。
本发明的另一个实施方式包括一种装置。所述装置包括静音抑制接口组件,该静音抑制接口组件被配置为从主叫方接收分组交换呼叫的第一语音流。所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组。所述静音抑制接口组件被配置为从所述多个编码分组中选择编码分组的子集以便创建符合第二静音抑制方案的第二语音流。所述第二语音流包括所述编码分组的子集。所述第一静音抑制方案与第二静音抑制方案不同。所述静音抑制接口组件被配置为向所述分组交换呼叫的被叫方转发所述第二语音流。
本发明的再一个实施包括一种产品(article)。所述产品包括存储指令的一个或多个非易失性的处理器可读的媒介,当所述处理器执行所述指令时,使得所述处理器执行一种方法。所述方法包括从主叫方接收用于分组交换呼叫的第一语音流的步骤,其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组。所述方法还包括从所述多个编码分组中选择编码分组的子集以便创建符合第二静音抑制方案的第二语音流的步骤,其中所述第二语音流包括所述编码分组的子集,并且其中所述第一静音抑制方案与所述第二静音抑制方案不同。所述方法还包括向所述分组交换呼叫的被叫方转发所述第二语音流的步骤。
附图说明
图1是包括发送设备、分组交换网络、和接收设备的装置的一个实施例的表现形式。
图2是通过图1的所述装置的分组流的一种实施方式的表现形式,该表现形式说明在所述分组交换网络中的静音抑制。
图3是包括发送设备、分组交换网络、接收设备、和静音抑制接口组件的装置的一种实施例的表现形式。
图4是图3的所述装置的另一个实施例的表现形式,该表现形式说明与所述分组交换网络的分组交换机组合或集成的静音抑制接口组件。
图5是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明EVRC-NW DTX静音抑制方案到RFC4788或类似的静音抑制方案的透传(pass through)。
图6是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明EVRC-NW DTX静音抑制方案到RFC4788或类似的静音抑制方案之间的协调(mediation)。
图7是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明具有不同的静音抑制间隔的图5的透传。
图8是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明具有不同的静音抑制间隔的图6的协调。
图9是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明失配的编解码器之间的协调。
图10是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明失配的编解码器之间的另一种协调。
图11是通过图4的所述装置的分组流的一种实施方式的表现形式,该表现形式说明图5的透传的另一种变化。
图12是通过图3的所述装置的另一个实施例的表现形式,该表现形式说明作为发送设备和接收设备的IP语音终端。
具体实施方式
如在背景技术中所描述的,一些八分之一速率分组可从所述语音流中被移除以便提高所述语音流的传输效率。移除的八分之一速率分组也被称为静音抑制。例如,静音抑制方案包括规则和/或参数,其可被用于从连续的分组流中“丢弃”或忽略一个或多个八分之一速率(或背景噪音)分组以创建不连续流。本领域的技术人员将了解,静音抑制方案既可被用于减少向所述分组交换网络传送或跨越所述分组交换网络传送的代表背景噪音的编码分组的数量,又可被用于在所述语音流中维持一定数量的背景噪音或“舒适噪音”。
当前实施的发送设备、接收设备、和分组交换网可在所述分组交换网络的一个或多个部分上应用静音抑制方案。静音抑制的一个示例是不连续发送(DTX)方案。DTX方案的示例在第三代合作伙伴计划2(3GPP2)的文档C.S0076-0和C.S0014-D(www.3gpp2.org)中并且也在互联网工程任务组(IETF)的互联网标准文档RFC3558和RFC4788中、并且还在IETF互联网草案“draft-ietf-avt-rtp-evrc-nw-02”(www.ietf.org)中均有描述,其通过引用被包含于此。
在一个示例中,当所述分组交换网络使用IETF兼容的(例如,RFC4788,IETF草案draft-ietf-avt-rtp-evrc-nw-02,或类似的)静音抑制时,所述发送和/或接收设备可使用3GPP2兼容的静音抑制(例如,在通过所述分组交换网络发送语音流前)。3GPP2增强型变速率编解码窄带-宽带(EVRC-NW;在C.S0014-D中被描述)描述了改进的DTX方案。因此,符合所述EVRC-NW静音抑制方案的语音流可能不符合RFC4788或类似的(例如,IETF draft-ietf-avt-rtp-evrc-nw-02)静音抑制方案。
参照图1,现有技术的装置100包括发送设备110、分组交换网络130、和接收设备140。装置100被配置为将来自发送设备110的用户(未示出)的语音流(即语音载体流量)传输到接收设备140的用户(未示出)。如上所述,所述语音流包括以不同速率编码的多个语音分组或帧。一个或多个语音分组从发送设备110被转发,通过分组交换网络130,并且到达接收设备140。
在一个实施方式中,发送设备110和接收设备140包括蜂窝通信网络的移动站。例如,发送设备110包括在主叫方网络(或呼叫域)112中的移动站114,并且接收设备140包括在被叫方网络(或呼叫域)142中的移动站146。本领域的技术人员将了解,移动站114和146被配置为通过相应的空中接口118和148与相应的基站116和144通信。在一个示例中,基站116和144包括蜂窝基站。
在这个实施方式中,分组交换网络130包括核心网、传输网、回程网络、或其他分组交换网络。在一个示例中,分组交换网络130包括一个或多个分组交换机132和134。分组交换机132和134的示例包括分组交换网关(PSG)、媒体网关(MGW)、分组帧选择器、路由器、和其他网络设备。在可替换实施方式中,分组交换网络130包括免编解码操作(TrFO)网络或与TrFO网络耦合,例如TrFO网络160。虽然只示出两个分组交换机,但是分组交换网络130可包括另外的分组交换机。因此,本领域的技术人员将了解分组交换机132和134可位于所述分组交换网络的内部或边缘。
分组交换机132被配置为分别通过接口120和162与基站116和TrFO网络160通信。分组交换机134被配置为分别通过接口150和164与基站144和TrFO网络160通信。本领域的技术人员将了解接口120、162、150和164的示例包括:有线、无线、光纤、或其他通信链路。
在一个示例中,分组交换网络130包括一个或多个分组交换机控制器(PSC)136和137或与一个或多个分组交换机控制器(PSC)136和137耦合。分组交换机控制器(PSC)136和137的示例包括:接入管理器、移动交换中心(MSC)、或移动软交换中心(MSCe)组件。在一个示例中,分组交换机控制器136和137被配置为管理主叫方网络112、被叫方网络142和分组交换网络130之间的通信。例如,本领域的技术人员将了解分组交换机控制器136和137指示基站116和144和分组交换机132和134来创建用于分组交换呼叫的语音载体路径。在其他实施中,分组交换网络132和134可以由单个分组交换机控制器控制。
发送设备110、分组交换网络130、和接收设备140中的一个或多个被配置为使用相应的静音抑制方案。参照图2,现有技术的分组流200代表图1的装置100的移动站114和146之间的电话(例如,语音流)的分组流的一种示例。分组流200示出在编码分组之间具有20毫秒间隔的400毫秒的静音或背景噪音的持续时间的样本。在这个示例中,呼叫域(例如,移动站114和114、和基站116和144)被配置为在不使用静音抑制方案的情况下转发所述语音分组通过接口118、120、148和150。因此,八分之一速率编码分组250、251、252、…270(例如,静音帧)从移动台114经由基站116被转发给分组交换机132。
图2的分组交换机132被配置为使用静音抑制方案来跨越TrFO网络160到分组交换机134。在一个示例中,分组交换机132的静音抑制方案与所述RFC4788或类似的DTX方案(包括IETF草案draft-ietf-avt-rtp-evrc-nw-02)兼容或符合所述RFC4788或类似的DTX方案(包括IETF草案draft-ietf-avt-rtp-evrc-nw-02)。如在3GPP2C.S0076-0中所描述的,所述DTX方案包括静音插入描述(SID)帧,该帧是在DTX静音时间段期间发送的八分之一速率分组。“保证的更新间隔”或静音抑制间隔N是从一个SID帧到下一个SID帧的分组数量。例如,静音抑制间隔N=5分组表示保证将SID帧在每5个分组发送一次。本领域的技术人员将了解虽然所述SID帧或分组的发送是“保证的”,但是所述基站或另一个组件可能丢失传输中的分组,但是帧更新由所述设置间隔保证。C.S0076-0的DTX方案允许静音抑制间隔N在1到50的范围内,而C.S0014-D的所述改进的DTX方案允许静音抑制间隔N为1、4或8。
在图2的示例中,对于所述静音抑制方案的静音抑制间隔N,分组交换机132使用值N=10。因此,分组交换机132将转发从基站116接收的十个八分之一速率分组中的一个。参照图2,在示出的时间段期间分组交换机132将编码分组250、260和270转给分组交换机134并且“丢弃”或忽略分组251到259和261到269。
因为基站144和移动站146没有被配置为静音抑制,所以被分组交换机132丢弃的分组被分组交换机134替换或取代。例如,在所述静音抑制间隔上,分组交换机134重复或拷贝最后接收的分组(例如,分组250、260和270)以便对移动站146(和基站144)表现为连续的分组序列从分组交换机134被发送。因此,图2示出分组交换机134发送分组250的十个样本,本领域的技术人员将了解,所述十个样本为一个“原始”分组和九个另外的样本或拷贝。
参照图3,装置300的一个实施方式包括装置100的组件并且还包括静音抑制接口(SSI)组件320。在一个示例中,SSI组件320包括:网络基础设施设备、应用服务器、或其他计算设备。在另一个示例中,SSI组件320包括被配置为执行存储在储存器中的软件或指令的处理器或计算机。例如,如本文所描述的,SSI组件320包括可记录的输出存储介质322的实例。在一个示例中,SSI组件320包括所述第一和/或第二静音抑制方案的一个或多个参数或规则,例如,所述参数或规则存储在可记录的数据存储介质322上。在一个示例中,SSI组件320被配置为用另外的和/或新的静音抑制方案或静音抑制方案的参数或规则来更新以便支持可替代的编解码器、传送设备、和/或接收设备。例如,SSI组件320接收第三静音抑制方案的一个或多个参数,并且将所述参数存储在可记录的数据存储介质322中。所述参数和/或静音抑制方案可通过网络、人机接口设备(例如,键盘或终端)、或通过可记录的数据存储介质322的另一个实例来接收。
在图3的实施方式中,SSI组件320被示出为与主叫方网络112和分组交换网络130分离的组件。然而,在可替代实施方式中,SSI组件320可以是在所述主叫方网络或分组交换网络130内的设备或组件。SSI组件320也可与主叫方网络112、被叫方网络142、或分组交换网络130的设备或组件(例如基站116或144、分组交换机132、或分组交换机134)组合或集成构成。在其他的实施方式中,空中接口118和148可以被有线、光纤、或其他通信链路代替。另外,主叫方网络112和被叫方网络142可以是同一个网络或包括有线网络。
参照图4,装置400代表装置300的另一种实施方式并且示出与分组交换机132组合的SSI组件320。在可替代实施方式中,本领域的技术人员将了解SSI组件320可与编解码器模块、语音质量增强模块(例如,回音消除器、噪音抑制器、自动增益控制器、和噪音补偿器)、分组帧选择器、网络交换机、网桥、或路由器组合或由其实施。
SSI组件320被配置为在第一和第二静音抑制方案之间进行协调。例如,本领域的技术人员将了解,SSI组件320被配置为接收符合所述第一静音抑制方案的第一语音流,改变所述第一语音流以便创建符合所述第二静音抑制方案的第二语音流,并且转发第二语音流。在一个示例中,SSI组件320被配置为在发送设备110和接收设备140之间双向协调。例如,设备110或者140可经由SSI组件320发送语音流和/或接收改变的语音流。
参照图5,图5示出图4的实施方式的分组流500的一个示例。在这个实施方式中,SSI组件320(被示出与分组交换机132组合)被配置为通过“透传”每个被接收的八分之一速率分组(如本文所描述,除了“空白”)在两种不同的静音抑制方案之间协调。在分组流500中,主叫方网络112和被叫方网络142被配置为使用增强型变速率编解码窄带-宽带(EVRC-NW)DTX流来用于具有静音抑制间隔N=4的静音抑制,而分组交换网络130和TrFO网络130被配置为使用依照RFC4788或类似的(例如,IETF draft-ietf-avt-rtp-evrc-nw-02)DTX流来用于具有静音抑制间隔N=10的静音抑制。例如,接口118、120、148、和150(如在图4中所示)被配置为用于EVRC-NW DTX流,并且所述接口162和164(图4)被配置为用于RFC4788或类似的DTX流。
分组流500示出了在主叫方和被叫方网络112和142之间使用更加新的静音抑制方案、同时维护当前已经在网络112和142之间的分组交换网络130中使用的静音抑制方案的协调的潜在问题。例如,与不使用异步分组的第二静音抑制方案(例如,RFC4788)相比,使用异步分组的第一静音抑制方案(例如,EVRC-NW)可能有另外的分组。
所述问题的一种解决方案是从符合所述第一静音抑制方案的语音流中选择分组的子集,以使得所述分组的子集与所述第二静音抑制方案兼容,因为所关心的是静音抑制而不是语音编码。再一个解决方案是应用端到端的相同的静音抑制方案。然而,在所述静音抑制方案中的这种改变将需要相当多的资源(例如,升级所述分组交换网络来支持更加新的EVRC-NW编解码和静音抑制方案)。
参照图5,所述第一静音抑制方案包括EVRC-NW DTX方案,其中静音抑制间隔N=4。因此,移动站114在每个第四编码分组之后发送一个八分之一速率分组,例如,基于所述静音抑制间隔来发送八分之一速率(或SID)分组550、554、558、562、566、和570。在一个示例中,所述八分之一速率分组550、554、558、562、566、和570包括同步分组或“非-关键(critical)”分组。所述EVRC-NW DTX方案还定义“关键”或异步分组,其包括由所述移动编码器指示在背景噪音中的重要变化的八分之一速率分组。关键分组可独立于所述静音抑制间隔被传送。关键分组的示例包括分组556和558,其出现在所述静音抑制间隔之外。移动站114将所述语音流的多个编码分组(包括所述八分之一速率分组550、554、556、558、562、566、568、和570)发送给基站116。
在图5的实施方式中,基站116被配置为将所述同步和异步分组连同“空白”或空白580转发给分组交换机132(和SSI组件320)。在一个示例中,空白580提供所述接口120或“电话线路”仍旧活跃并且期望更新或分组的指示。在这个示例中,空白580没有被转发给分组交换机134或TrFO网络160。
分组交换机132将所述同步和异步分组(但是没有所述空白580)转发(例如,选择并且透传)给分组交换机134。分组交换机134将所述同步和异步分组连同代替由分组交换机132丢弃的分组的重复分组转发给基站144。例如,分组交换机134发送四个分组550的样本,两个分组554的样本,等等。基站144应用N=4的静音抑制方案,以便将所述语音流转发给移动台146。
图5是由SSI组件320在不同的静音抑制方案之间提供协调的解决方案的一种实施例。相对于图2,图5示出TrFO网络160上的流量增加,其中静音根据RFC4788(或类似的)DTX方案被抑制。此外,这个实施例依赖于EVRC-NW窄带(NB)模式与EVRC-B声码器相兼容的前提。本领域的技术人员将了解,此处,所述移动台仅直接使用EVRC-NW NB模式,并且不允许宽带(WB)模式0。
因此,图5示出在主叫方网络112或者被叫方网络中所使用的静音抑制方案由静音抑制接口组件320适配用于端到端静音抑制方案的实施例。然而,在分组交换网络130中,这个解决方案缺少维护现有配置的灵活性,该灵活性可能是分组交换网络130的运营商期望的。同样,在主叫方网络112、分组交换网络130、或被叫方网络142的配置(例如,静音抑制方案)不同的情况下是不可使用的。分组交换网络130的目标和操作组件可能不同于主叫方网络112和被叫方网络142的目标和操作组件。有利地,如在图6和8-10中所配置的SSI组件320允许主叫方网络112、被叫方网络142、和分组交换网络130独立地并且根据相应的运营商的偏好各自管理所述分组交换呼叫的语音流。相反,图5、7、和11的配置可能需要额外的资源以便提供端到端解决方案。
参照图6,示出了装置300的另一个实施方式的分组流600。SSI组件320(被示出为与分组交换机132组合)被配置为在主叫方网络112和分组交换网络130之间协调。在这个示例中,移动站114使用N=4的EVRC-NWDTX作为第一静音抑制方案并且在分组交换机132和134之间使用第二静音抑制方案(RFC4788或类似的,其中N=10)。分组流600示出400毫秒时间段的通过所述语音流的背景噪音。
分组交换机132被配置为根据所述第二静音抑制方案改变从基站116接收的语音流。类似于在图5中的分组流500,所述同步分组550、554、558、562、566、和570,所述异步分组556和568,和空白580经由基站116被转发给分组交换机132。分组交换机132对所述同步分组、异步分组、和空白进行计数以确定何时应用所述静音抑制间隔。在一个示例中,分组交换机132通过从所述语音流的所述多个接收的分组中选择接收的分组的子集来改变所述语音流。从接收的分组的所述子集中,分组交换机132创建符合分组交换网络130的所述静音抑制方案的第二语音流。例如,基于所述第二静音抑制方案的参数分组交换机132选择所述分组。本领域的技术人员将了解,在所述静音抑制间隔N=10上(替代所述第一静音抑制方案的所述静音抑制间隔N=4),分组交换机132为分组交换网络130选择最近接收的分组。
所述第二语音流包括由分组交换机132选择的分组550、558和570。所述第二语音流经由TrFO网络160被转发给分组交换机134。分组交换机134将所述第二语音流连同用于填充所述语音流的剩余分组的所述最近接收的分组(例如,分组550和558)的拷贝转发给基站144。本领域的技术人员将了解,然后基站144将被叫方网络142的静音抑制方案(例如,其中N=4)应用于所接收到的语音流。
参照图7,分组流700类似于图5的分组流500,但是其中主叫方网络112和被叫方网络142的静音抑制间隔具有N=8的保证更新间隔。分组交换机132透传符合移动台114和基站116的所述静音抑制方案的分组550、556、558、和568。分组交换机134将所接收的分组连同拷贝透传给基站144。然后基站144应用N=8的静音抑制方案来将所述分组转发给移动台146。因此,移动站只接收分组550、558、和566而不接收关键分组556、568或所述拷贝。
图8示出类似于图6的分组流600的分组流800。然而,分组流800示出用于分组交换网络130的更新间隔N=10和用于主叫方网络112和被叫方网络142的更新间隔N=8。因此,SSI组件320维护TrFO网络160的现有设置。而且,所述SSI组件320通过选择所接收到的分组的子集来适配或改变从基站116接收的语音流。SSI组件320促进具有不同的静音抑制方案的网络之间的传输,例如,所述静音抑制方案的更新间隔(或其他参数、规则、等等)在主叫方网络112和被叫方网络142之间失配。
参照图9,分组流900类似于分组流800,但是为失配的编解码器进行了修改。在适配系统中,其允许在将被发送的分组化的语音数据中的静音间隔在网络内处于不同的更新间隔,呼叫域可使用不同的静音抑制方案,或可使用不包括静音抑制方案的语音编码器。在分组流900中,移动站114和基站116使用N=8的EVRC-NW,而移动站146和基站144的编解码器是不包括静音抑制的EVRC-B。此处,被叫方网络142不使用任何形式的静音抑制。当接收侧使用更旧的服务选项或编解码器(如示出的EVRC-B)或通过设置N=1静音抑制被禁用时,这种情况可出现。
分组交换机132通过选择所接收的分组550、556、558、566、和568的子集来改变从基站116接收的语音流。改变的语音流包括分组550、558、和568。分组550、558、和568被转发给分组交换机134,其将所述分组连同拷贝经由基站144转发给移动站146。因此,具有不同的静音抑制方案的两个呼叫域与使用没有静音抑制方案的更旧的语音编解码器的电话域连接。
参照图10,分组流1000示出从EVRC-B到EVRC-NW的语音流的失配的编解码器的接口,其中N=10用于在分组交换网络130中的所述静音抑制方案。此处,移动台114正使用更旧的语音编码器(例如,EVRC-B)并且不执行静音抑制。移动台146正使用新的包括静音抑制协议的语音编码器,其中N=8。
图10示出用于图9的语音流的“反转”的编解码,或所述EVRC-NWDTX方案应用于如在图2中所示的在主叫方网络112中没有静音抑制的第一语音流。具体地,分组交换机132将静音抑制应用于分组251到259和261到269,并且将分组250、260、和270传送给分组交换机134。分组交换机134转发分组250、260、和270连同分组250和260的拷贝。然而,在图10中,基站144将移动台146的静音抑制方案应用于所述语音流。
如在图9和图10中所示,在静音抑制方案中存在另外的变化并且是在在本发明的范围内可预料到的。例如,为适应在SSI组件320中应用不同的静音抑制方案,可由基站114和116做出调整以便同意发送所述空白的分组,并且可由分组交换机132和134将所述调整设置为透传或不透传关键分组。
参照图11,分组流1100示出图5的“透传”的另一种变化。在这个示例中,主叫方网络112使用N=8的EVRC-NW DTX。被叫方网络142不执行静音抑制并且使用EVRC-B编解码器。在这个示例中,分组交换机132被配置为应用N=10的静音抑制方案。
虽然上述描述的部分涉及诸如移动站、分组交换网络、和例如EVRC的编解码器,但是本领域的技术人员将了解可替代实施方式和实施例是可行的。移动台的可替代实施方式包括:移动电话、智能电话、语音邮件服务器、因特网互联协议语音(VoIP)终端、个人计算机、会话发起协议(SIP)设备、电话设备、或被配置为接收语音的其他设备。分组交换网络的可替代实施方式包括:局域网、广域网、互联网、其他分组交换网、及其组合。编解码器的可替代实施方式包括:EVRC-A、EVRC-B、EVRC-WB、EVRC-NW、长期演进(LTE)编解码器、自适应多速率(AMR)编解码器、和包括背景噪音在内的分组可被消除的其他语音和音频编解码器。因此,另外的实施例包括:有线或固定电话网络、私人电话网络、语音邮件服务、及其组合。另外,虽然静音抑制方案与DTX兼容并且描述了上述提及的3GPP2和IETF文档,但是本领域的技术人员将了解,可以使用具有不同的规则、参数、或用于从所述语音流中丢弃或忽略分组的可替代的静音抑制方案。
参照图3的实施方式,静音抑制接口组件320被配置为在发送设备110和分组交换网络130之间(例如,在第一和第二静音抑制方案之间)协调。在替代的实施方式中,静音抑制接口组件320被配置为在具有一个或多个相应的静音抑制方案的一个或多个另外的设备、网络、和/或电话域之间协调。在第一示例中,静音抑制接口组件320被配置为在一种静音抑制方案和Z个另外的静音抑制方案的集合之间提供协调(例如,“一对多”或1对Z协调)。在第二示例中,静音抑制接口组件320被配置为在Y个静音抑制方案的第二集合和所述静音抑制方案的第一集合之间提供协调,例如Y对Z协调。在一个示例中,静音抑制接口组件320包括在多个静音抑制方案之间的1xZ或YxZ决策表和/或协调矩阵。因此,本领域的技术人员将了解,静音抑制接口组件320被配置为在发送设备110、计算设备140、和/或分组交换网络130的多个实例之间用相应的静音抑制方案来进行协调。
参照图12,装置1200代表装置300的另一种实施。装置1200包括:发送设备110、计算设备140、和分组交换网络130。在这个实施方式中,发送设备110和接收设备140分别包括IP语音终端1210和1240。VoIP终端1210和1240被配置为通过分组交换网络130进行通信。VoIP终端1210被配置为使用第一静音抑制方案,并且被配置为将符合所述第一静音抑制方案的语音流发送给分组交换机132。分组交换机132包括SSI组件320,并且被配置为将所述语音流改变成符合第二静音抑制方案。因此,分组交换机132从所述语音流中选择分组的子集以创建符合第二静音抑制方案的第二语音流。本领域的技术人员将了解,分组交换机134被配置为在VoIP终端1240处回放前将一个或多个分组替换成或替代成所述第二语音流。
在一个示例中,装置300使用一个或多个非易失性处理器可读的介质。所述非易失性的处理器可读的介质存储用于执行(例如,由处理器或计算机)本发明的一个或多个实施方式的一个或多个部分的软件(例如,编译的或解释的代码)、固件和/或汇编语言。所述装置300的非易失性处理器可读的介质的示例包括SSI组件320的可记录数据存储介质322。在一个示例中,所述装置300的非易失性处理器可读的介质包括:磁介质、电介质、光介质、生物介质、和原子数据存储介质。例如,所述非易失性处理器可读的介质包括:软盘、磁带、CD-ROM、DVD-ROM、硬盘、和电子存储器。在另一个示例中,所述非易失性处理器可读的介质包括可移动的或便携的设备,例如闪存盘。
在一个示例中,装置300包括诸如一个或多个电子组件、硬件组件、和计算机软件组件之类的多个组件。在装置300中,多个这样的组件可以被组合或分割。本领域的技术人员将了解,装置300的组件示例使用和/或包括用任何的若干可编程语言写出的或实现的一组和/或一系列的计算机指令。
本文中所详细描述的步骤和操作仅是示例。在不背离本发明的精神的情况下,这些步骤或操作可以有多种变化。例如,可以以不同的顺序执行所述步骤,或可增加、删除、或修改步骤。
虽然本发明的示例实施方式在本文中已经被示出并且被详细描述,但是在不背离本发明的精神的情况下各种修改、增加、替代等等可由相关领域的技术人员做出是显而易见的,因此这些修改、增加、替代等等被认为是落入如在以下权利要求限定的本发明的范围内。

Claims (13)

1.一种用于从第一语音流中选择编码分组来创建第二语音流的方法,该方法包括以下步骤:
从主叫方接收用于分组交换呼叫的第一语音流,其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组;
从所述多个编码分组中选择编码分组的子集来创建符合第二静音抑制方案的第二语音流,其中所述第二语音流包括所述编码分组的子集,其中所述第一静音抑制方案与所述第二静音抑制方案不同;以及
向所述分组交换呼叫的被叫方转发所述第二语音流,其中所述第一语音流包括第一不连续传输(DTX)流,并且其中所述第二语音流包括第二DTX流;
其中选择所述编码分组的子集的步骤包括以下步骤:
根据所述第二静音抑制方案选择所述编码分组的子集,以使得所述第二DTX流符合所述第二静音抑制方案;
其中所述第一静音抑制方案和第二静音抑制方案包括相应的第一静音抑制间隔和第二静音抑制间隔;
其中所述多个编码分组包括以下至少一者:
同步分组,该同步分组根据所述第一静音抑制方案基于所述第一静音抑制间隔被发送,或
异步分组,该异步分组根据所述第一静音抑制方案独立于所述第一静音抑制间隔被发送;
其中选择所述编码分组的子集的步骤包括以下步骤:
基于所述第二静音抑制间隔选择所述同步分组或所述异步分组中的至少一者的最近接收到的分组,其中所述编码分组的子集包括所述最近接收到的分组;
其中转发所述第二DTX流的步骤包括以下步骤:
基于所述第二静音抑制间隔转发所述最近接收到的分组。
2.根据权利要求1所述的方法,其中所述第一静音抑制间隔与所述第二静音抑制间隔不同。
3.根据权利要求1所述的方法,其中所述第一静音抑制方案符合增强型可变速率编解码器窄带-宽带(EVRC-NW)标准;
其中所述同步分组包括所述EVRC-NW标准的八分之一速率非关键分组;
其中所述第二静音抑制方案符合增强型可变速率编解码器B(EVRC-B)标准。
4.根据权利要求3所述的方法,其中接收所述第一语音流的步骤包括:
从采用所述EVRC-NW标准的蜂窝基站接收所述第一语音流;
其中转发所述第二DTX流的步骤包括:
向采用EVRC-B标准的免编解码操作(TrFO)网络转发所述第二DTX流。
5.根据权利要求1所述的方法,该方法还包括以下步骤:
接收与所述第一静音抑制方案和第二静音抑制方案不同的第三静音抑制方案的一个或多个参数;
存储所述第三静音抑制方案的一个或多个参数;以及
基于所述第三静音抑制方案的一个或多个参数来选择所述编码分组的子集。
6.一种用于从第一语音流中选择编码分组来创建第二语音流的装置,该装置包括:
静音抑制接口组件,该静音抑制接口组件被配置为从发送设备接收用于分组交换呼叫的第一语音流;
其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组;
其中所述静音抑制接口组件被配置为从所述多个编码分组中选择编码分组的子集来创建符合第二静音抑制方案的第二语音流;
其中所述第二语音流包括所述编码分组的子集;
其中所述第一静音抑制方案与所述第二静音抑制方案不同;
其中所述静音抑制接口组件被配置为向所述分组交换呼叫的接收设备转发所述第二语音流;
其中所述第一语音流包括第一不连续传输(DTX)流;
其中所述第二语音流包括第二DTX流;
其中所述第一静音抑制方案和第二静音抑制方案包括相应的第一静音抑制间隔和第二静音抑制间隔;
其中所述多个编码分组包括以下至少一者:
同步分组,该同步分组根据所述第一静音抑制方案基于所述第一静音抑制间隔被发送,或
异步分组,该异步分组根据所述第一静音抑制方案独立与所示所述第一静音抑制间隔被发送;
其中所述静音抑制接口组件被配置为基于所述第二静音抑制间隔来选择所述同步分组或所述异步分组中的至少一者的最近接收到的分组。
7.根据权利要求6所述的装置,其中所述第一静音抑制间隔与所述第二静音抑制间隔不同。
8.根据权利要求7所述的装置,其中所述第二语音流是通过分组交换网络经由所述静音抑制接口组件向所述接收设备转发的。
9.根据权利要求6所述的装置,其中所述第一静音抑制方案符合增强型可变速率编解码器窄带-宽带(EVRC-NW)标准;
其中所述同步分组包括所述EVRC-NW标准的八分之一速率非关键分组;
其中所述第二静音抑制方案符合增强型可变速率编解码器B(EVRC-B)标准。
10.一种用于从第一语音流中选择编码分组来创建第二语音流的装置,该装置包括:
静音抑制接口组件,该静音抑制接口组件被配置为从发送设备接收用于分组交换呼叫的第一语音流;
其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组;
其中所述静音抑制接口组件被配置为从所述多个编码分组中选择编码分组的子集来创建符合第二静音抑制方案的第二语音流;
其中所述第二语音流包括所述编码分组的子集;
其中所述第一静音抑制方案与所述第二静音抑制方案不同;
其中所述静音抑制接口组件被配置为向所述分组交换呼叫的接收设备转发所述第二语音流;
其中所述静音抑制接口组件被配置为在数目为Y个的静音抑制方案的第一集合和数目为Z个的静音抑制方案的第二集合之间进行协调;
其中所述静音抑制方案的第一集合包括所述第一静音抑制方案;
其中所述静音抑制方案的第二集合包括所述第二静音抑制方案。
11.一种用于从第一语音流中选择编码分组来创建第二语音流的方法,该方法包括以下步骤:
从主叫方接收用于分组交换呼叫的第一语音流,其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组;
从所述多个编码分组中选择编码分组的子集来创建符合第二静音抑制方案的第二语音流,其中所述第二语音流包括所述编码分组的子集,其中所述第一静音抑制方案与所述第二静音抑制方案不同;以及
向所述分组交换呼叫的被叫方转发所述第二语音流,其中所述第一语音流包括第一不连续传输(DTX)流,并且其中所述第二语音流包括第二DTX流;
其中选择所述编码分组的子集的步骤包括以下步骤:根据所述第二静音抑制方案选择所述编码分组的子集,以使得所述第二DTX流符合所述第二静音抑制方案;
其中选择所述编码分组的子集的步骤包括:
接收所述第二静音抑制方案的一个或多个参数;以及
基于所述一个或多个参数来选择所述编码分组的子集。
12.一种用于从第一语音流中选择编码分组来创建第二语音流的产品,该产品包括:
一个或多个非暂时性处理器可读介质,该非暂时性处理器可读介质存储指令,当该指令被处理器执行时,使得所述处理器执行包括以下步骤的方法:
从主叫方接收用于分组交换呼叫的第一语音流,其中所述第一语音流符合第一静音抑制方案并且包括所述分组交换呼叫的多个编码分组;
从所述多个编码分组中选择编码分组的子集来创建符合第二静音抑制方案的第二语音流,其中所述第二语音流包括所述编码分组的子集,其中所述第一静音抑制方案与所述第二静音抑制方案不同;以及
向所述分组交换呼叫的被叫方转发所述第二语音流,其中所述第一语音流包括第一不连续传输(DTX)流,并且其中所述第二语音流包括第二DTX流;
其中选择所述编码分组的子集的步骤包括以下步骤:
根据所述第二静音抑制方案选择所述编码分组的子集,以使得所述第二DTX流符合所述第二静音抑制方案;
其中所述第一静音抑制方案和第二静音抑制方案包括相应的第一静音抑制间隔和第二静音抑制间隔;
其中所述多个编码分组包括以下至少一者:
同步分组,该同步分组根据所述第一静音抑制方案基于所述第一静音抑制间隔被发送,或
异步分组,该异步分组根据所述第一静音抑制方案独立于所述第一静音抑制间隔被发送;
其中选择所述编码分组的子集的步骤包括以下步骤:
基于所述第二静音抑制间隔选择所述同步分组或所述异步分组中的至少一者的最近接收到的分组,其中所述编码分组的子集包括所述最近接收到的分组;
其中转发所述第二DTX流的步骤包括以下步骤:
基于所述第二静音抑制间隔转发所述最近接收到的分组。
13.根据权利要求12所述的产品,其中所述第一静音抑制间隔与所述第二静音抑制间隔不同。
CN201280025092.8A 2011-05-24 2012-04-16 从第一语音流中选择编码分组来创建第二语音流 Expired - Fee Related CN103548141B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/068,924 2011-05-24
US13/068,924 US8751223B2 (en) 2011-05-24 2011-05-24 Encoded packet selection from a first voice stream to create a second voice stream
PCT/US2012/033742 WO2012161887A1 (en) 2011-05-24 2012-04-16 Encoded packet selection from a first voice stream to create a second voice stream

Publications (2)

Publication Number Publication Date
CN103548141A CN103548141A (zh) 2014-01-29
CN103548141B true CN103548141B (zh) 2016-08-17

Family

ID=46025937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280025092.8A Expired - Fee Related CN103548141B (zh) 2011-05-24 2012-04-16 从第一语音流中选择编码分组来创建第二语音流

Country Status (6)

Country Link
US (1) US8751223B2 (zh)
EP (1) EP2715793B1 (zh)
JP (1) JP5868496B2 (zh)
KR (1) KR101502315B1 (zh)
CN (1) CN103548141B (zh)
WO (1) WO2012161887A1 (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496100A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于对无效帧进行宽带编码和解码的系统、方法和设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US7499403B2 (en) 2003-05-07 2009-03-03 Alcatel-Lucent Usa Inc. Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream
EP1897085B1 (en) * 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
CN101322181B (zh) * 2005-11-30 2012-04-18 艾利森电话股份有限公司 有效的语音流转换方法及装置
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
JP5270762B2 (ja) * 2008-10-16 2013-08-21 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 無音挿入記述子(sid)の散発的な信号を制御する装置および方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496100A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于对无效帧进行宽带编码和解码的系统、方法和设备

Also Published As

Publication number Publication date
EP2715793B1 (en) 2018-04-04
JP5868496B2 (ja) 2016-02-24
CN103548141A (zh) 2014-01-29
EP2715793A1 (en) 2014-04-09
WO2012161887A1 (en) 2012-11-29
US8751223B2 (en) 2014-06-10
KR20140002068A (ko) 2014-01-07
JP2014518054A (ja) 2014-07-24
KR101502315B1 (ko) 2015-03-13
US20120303364A1 (en) 2012-11-29

Similar Documents

Publication Publication Date Title
CN1849824B (zh) 用于执行分布式视频会议的系统和方法
CN105765920B (zh) 用于在分布式云中媒体处理的方法和装置
CN110089092A (zh) 辅助终端互操作的网络核心
CN103138874B (zh) 一种编解码动态协商方法及设备
CN1917532B (zh) 基于移动通信网的多媒体彩铃业务的实现方法
CN101212459A (zh) 控制媒体编码速率的方法、系统和设备
DE502007001693D1 (de) Steuerung der dienstqualität und/oder der vergebührung von telekommunikationsdiensten
US10535359B2 (en) Hybrid RTP payload format
CN1922812B (zh) 优化分组交换网中的资源使用
CN107211057A (zh) 改进通信会话的体验质量
CN109891917A (zh) 使用兼容的有效负载的网络-终端互操作
CN103210681A (zh) 核心网和通信系统
US7701980B1 (en) Predetermined jitter buffer settings
CN101662468B (zh) 一种媒体协商的方法和系统
CN101584248B (zh) 沿复杂的呼叫路径控制编解码器选择的技术
JP2012105211A (ja) コアネットワークおよび通信システム
Smith et al. Tandem-free VoIP conferencing: A bridge to next-generation networks
CN103548141B (zh) 从第一语音流中选择编码分组来创建第二语音流
CN101553042A (zh) 一种网关选择的方法、系统及设备
CN100454904C (zh) 软交换架构下ip直连组网方法、设备及其系统
JP2011055332A (ja) 通信中継システム
CN101695122A (zh) 指挥调度系统
CN103999424B (zh) 用于传送呼叫的数据分组的路由系统
CN100499605C (zh) 网络侧对呼叫处理的方法
Smith et al. Tandem-free operation for VoIP conference bridges

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

Termination date: 20200416

CF01 Termination of patent right due to non-payment of annual fee