CN101636786B - 在通信系统中传送数据的方法 - Google Patents

在通信系统中传送数据的方法 Download PDF

Info

Publication number
CN101636786B
CN101636786B CN200780052275.8A CN200780052275A CN101636786B CN 101636786 B CN101636786 B CN 101636786B CN 200780052275 A CN200780052275 A CN 200780052275A CN 101636786 B CN101636786 B CN 101636786B
Authority
CN
China
Prior art keywords
frame
signal
data
stable
data flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200780052275.8A
Other languages
English (en)
Other versions
CN101636786A (zh
Inventor
约纳斯·林德布卢姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Skype Ltd Ireland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Skype Ltd Ireland filed Critical Skype Ltd Ireland
Publication of CN101636786A publication Critical patent/CN101636786A/zh
Application granted granted Critical
Publication of CN101636786B publication Critical patent/CN101636786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Abstract

一种在通信网络中将数据从第一节点传送到第二节点的方法,包括:接收信号;将所述信号分割为排列在第一数据流中的数据元,所述数据元包括活动数据元和非活动数据元;分析所述信号的至少一个特征以判定所述信号是否是稳定的;如果判定出信号的包含在多个数据元中的部分是稳定的,则从第一数据流的多个数据元中丢弃至少一个活动数据元;将未从第一数据流中丢弃的数据元输入核心流;以及将所述核心流从所述第一节点传送到所述第二节点。

Description

在通信系统中传送数据的方法
技术领域
本发明涉及通信系统。本发明尤其涉及一种用于在通信系统中对数据进行编码、传送和接收的方法及装置。
背景技术
在通信系统中设置有这样一种通信网络,所述通信网络可以将两个通信终端链接在一起,从而两个终端在呼叫或者其它通信事件中可以向彼此发送信息。信息可以包括语音、文本、图像或视频。
现代通信系统基于数字信号的传输。诸如语音的模拟信息被输入一个终端的传送器处的模数转换器中,并且被转换为数字信号。然后数字信号被编码并置于数据包中以通过信道传输至另一个终端的接收器中。
每个数据包包括报头部及净荷部。数据包的报头部包含用于传送及处理数据包的数据。该信息可以包括唯一识别该包的标识号及源地址、用于检测处理出错的报头检验和,及目的地址。数据包的净荷部包括旨在传输用的数字信号的信息。该信息可以包括在净荷中作为诸如语音帧的编码帧,其中每一帧代表模拟信号的一部分。
发送信息的信道的劣化将影响接收器所接收的信息。信道的劣化会导致包序的变化、一些包延迟到达接收器,并且导致其它包的丢失。劣化可能是由信道不完整性、信道中的噪声及过载引起的。这最终导致接收终端输出的信号的质量下降。
适于传送数字信息的一类通信网络是互联网。网间协议网络中用来传送语音信号的协议通常被称作“基于网际协议的语音传输(VolP)”。VolP是语音通话在因特网上或通过其它任何基于IP的网络的路由选择。
使用VolP的通信系统的一个实例是对等通信系统,在对等通信系统中,多个终端用户为了通信目的能够经由诸如互联网的通信结构而连接。对等网络也可以使用其它协议以促进对诸如文本图像或视频的其它数据的传递。通信结构相对于其中的用于连接终端用户的通信路由交换基本上是分散的。也就是说,终端用户基于一个或多个授权证书的交换(用户身份证书-UIC)能够建立他们自己到达所述结构的通信路由以获得对所述结构的访问。所述结构包括将证书发给终端用户的管理装置。WO 2005/009019中描述了这样的一种通信系统。
Steffen praestholm等人的“通过感知帧废弃进行的包语音速率自适应(Packet Voice Rate Adaptation Through Perceptual Frame Discarding)”公开了一种在编码系统中废弃帧的方法。所公开的该方法利用对语音质量(PESQ)的客观测量来评估废弃的效果。这是通过根据对被解码的帧的该客观测量和丢包隐藏(代替该帧)来评估客观差别而实现的。由于所使用的丢包隐藏方法的局限,该方法所产生的音频质量是有限的。此外,由于对语音质量的客观测量的闭环评估,对每帧进行评估以鉴别哪些帧被废弃在计算上是复杂的。
现有技术使用复杂的计算方法来实现传送数据的质量的有限改进。这增加了处理开销(包括硬件资源)和处理时间。
因此,本发明的目的是改进接收信号的感知质量。本发明的进一步的目的在于提供一种无需使用复杂的计算方法即可改进接收信号的质量的方法。
发明内容
根据本发明的第一方案,提供了一种在通信网络中将数据从第一节点传送到第二节点的方法,所述方法包括:接收信号;将所述信号分割为排列在第一数据流中的数据元,所述数据元包括活动数据元和非活动数据元;分析所述信号的至少一个特征以判定所述信号是否是稳定的;如果判定出信号的包含在多个数据元中的部分是稳定的,则从第一数据流的多个数据元中丢弃至少一个活动数据元;将未从第一数据流中丢弃的数据元输入核心流;以及将所述核心流从所述第一节点传送到所述第二节点。
根据本发明的第二方案,提供了一种在通信网络中将数据从第一节点传送到第二节点的方法,所述方法包括:接收信号;将所述信号分割为排列在第一数据流中的数据元;分析所述信号的至少一个参数以判定所述信号是否是稳定的;如果判定出所述信号是稳定的,则从第一数据流中丢弃至少一个数据元;在被丢弃的数据元的位置处将指示所述数据元已经被丢弃的指示符插入第一数据流,将未从第一数据流中丢弃的数据元和所述指示符输入核心流;以及将所述核心流从所述第一节点传送到所述第二节点。
根据本发明的第三方案,提供了一种在通信网络中从一个节点接收数据的方法,所述方法包括以下步骤:接收包括数据元流的信号;检测位于所述数据元流中的指示符;判定在所述指示符的位置处数据元被从数据流中丢弃;基于数据元已经被丢弃的判定来处理数据元流;以及输出经处理的数据元流。
根据本发明的第四方案,提供了一种在通信网络中从一个传送节点接收数据元流的方法,其中,所述传送节点设置为如果判定出数据元流是稳定的则按照预定条件从所述数据元流中丢弃数据元,所述方法包括以下步骤:接收数据元流;分析所述数据元流的至少一个特征以判定传送节点是否已判定出数据元流是稳定的;如果判定出传送节点已判定出数据元流是稳定的,则基于预定条件来重构被丢弃的数据元。
根据本发明的第五方案,提供了一种传送装置,其布置为在通信网络中将数据从第一节点传送到第二节点,所述传送装置包括:器件,其用于接收信号;器件,其用于将所述信号分割为排列在第一数据流中的数据元;器件,其用于分析所述信号的至少一个特征以判定所述信号是否是稳定的;器件,其用于如果判定出所述信号是稳定的,则从第一数据流中丢弃至少一个数据元;器件,其用于在被丢弃的数据元的位置处将指示所述数据元已经被丢弃的指示符插入第一数据流,器件,其用于将未从第一数据流中丢弃的数据元和所述指示符输入核心流;以及器件,其用于将所述核心流从所述第一节点传送到所述第二节点。
根据本发明的第六方案,提供了一种传送装置,其布置为在通信网络中将数据从第一节点传送到第二节点,所述传送装置包括:接收器,其布置为接收信号;编码器,其布置为将所述信号分割为排列在第一数据流中的数据元,所述数据元包括活动数据元和非活动数据元,以及分析所述信号的至少一个特征以判定所述信号是否是稳定的;降率模块(rate reducer module),其布置为如果判定出信号的包含在多个数据元中的部分是稳定的则从第一数据流的多个数据元中丢弃至少一个活动数据元,以及将未从第一数据流中丢弃的数据元输入核心流;以及传送器,其布置为将所述核心流从所述第一节点传送到所述第二节点。
根据本发明的第七方案,提供了一种接收装置,其布置为经由通信网络从传送装置接收数据,所述接收装置包括:器件,其用于接收数据元流;器件,其用于检测位于所述数据元流中的指示符;器件,其用于判定在所述指示符的位置处数据元被从数据流中丢弃;器件,其用于基于数据元已经被丢弃的判定来处理数据元流;以及器件,其用于输出经处理的数据元流。
根据本发明的第八方案,提供了一种接收装置,其布置为在通信网络中从一个传送节点接收数据元流,其中,所述传送节点设置为如果判定出数据元流是稳定的则按照预定条件从所述数据元流中丢弃数据元,所述接收装置包括:
接收器件,其用于接收数据元流;
分析器件,其用于分析所述数据元流的至少一个特征以判定传送节点是否已判定出数据元流是稳定的;以及
重构器件,其用于如果判定出传送节点已判定出数据元流是稳定的,则基于预定条件来重构被丢弃的数据元。
根据本发明的第九方案,提供了一种通信系统,其包括布置为将数据传送到第二节点的第一节点,其中所述第一节点包括:器件,其用于输入信号;器件,其用于将所述信号分割为排列在第一数据流中的数据元,所述数据元包括活动数据元和非活动数据元;器件,其用于分析所述信号的至少一个特征以判定所述信号是否是稳定的;器件,其用于如果判定出信号的包含在多个数据元中的部分是稳定的,则从第一数据流的多个数据元中丢弃至少一个活动数据元;器件,其用于将未从第一数据流中丢弃的数据元输入核心流;器件,其用于将所述核心流从所述第一节点传送到所述第二节点;并且其中所述第二节点包括用于接收核心流的接收器件。
根据本发明的第十方案,提供了一种通信系统,其包括布置为将数据传送到第二节点的第一节点,其中所述第一节点包括:器件,其用于输入信号;器件,其用于将所述信号分割为排列在第一数据流中的数据元;器件,其用于分析所述信号的至少一个特征以判定所述信号是否是稳定的;器件,其用于如果判定出所述信号是稳定的,则从第一数据流中丢弃至少一个数据元;器件,其用于在被丢弃的数据元的位置处将指示所述数据元已经被丢弃的指示符插入第一数据流,器件,其用于将未从第一数据流中丢弃的数据元和所述指示符输入核心流;以及器件,其用于将所述核心流从所述第一节点传送到所述第二节点;并且其中所述第二节点包括:器件,其用于接收核心流;器件,其用于检测位于所述核心流中的指示符;以及器件,其用于判定在所述指示符的位置处数据元被从数据流中丢弃;器件,其用于基于数据元已经被丢弃的判定来处理所述核心流中的数据元流;以及器件,其用于输出经处理的数据元流。
附图说明
为了更好的理解本发明并且示出本发明是如何实施的,将参照下列附图来描述本发明的实施例:
图1示出了连接至通信网络的两个终端。
图2示出了根据本发明的实施例的连接至网络的一个终端;
图3示出了从编码器输出的数据帧;
图4示出了按照本发明的一个实施例的已经被丢弃的数据帧。
图5示出了按照本发明的一个实施例的在降率模块和封包器之间传送的核心流和辅助流。
图6示出了根据本发明的一个实施例的如何将数据帧插入包中;以及
图7示出了根据本发明的可选实施例的如何将数据帧插入包中。
具体实施方式
首先将参照图1,其示出了连接至通信网络104的源终端100及目的终端112。源终端设置为经由通信网络104将数据传送至目的终端112。在本发明的一个实施例中,通信网络为由互联网提供的VoIP网络。应该意识到的是,尽管此处所显示及更详细地描述的示例性通信系统使用了VoIP网络的术语,但是本发明的实施例也可以用在有利于数据传递的任何其它适合的通信系统中。本发明的实施例尤其适于非同步通信网络,诸如基于帧的系统,如ATM、蓝牙和增强全球移动通信系统数据传输率(EDGE)网络。
例如,终端100及终端112可以为个人计算机、游戏装置、个人数字助理、适当激活的移动电话、电视或者其它可以连接至网络104的装置。
图2显示了连接至网络104的源终端100。终端100具有用户接口装置以从终端用户接收信息和向终端用户输出信息。在本发明的一个优选实施例中,该终端的接口装置包括扬声器110和麦克风120。接口装置还可以包括诸如屏幕的显示器件以及诸如键盘、鼠标或摄像头的数据输入器件(未显示)。终端100可以经由电缆(有线)连接或无线连接而连接至网络104。
终端100包括信号接收电路180和信号传送电路190,信号接收电路180用于接收来自网络104的信号,信号传送电路190用于经由网络104将信号传送到目的终端112。
信号接收电路180包括解包器106、抖动缓冲器150、解码器160和数模转换器170。目的终端112中也设置有信号接收电路。
该解包器接收来自网络的包,并且在将包的净荷中的数据传递到抖动缓冲器之前删掉每个包中的报头。接收电路的抖动缓冲器150对从解包器106接收到的数据进行缓冲。数据被缓冲以在数据输出至编码器之前产生延迟,从而允许数据包连续输出。解码器160根据用来在传送器处对包进行编码的编码方案对包进行解码。然后将从解码器160输出的经解码的数字信号输入到将数字信号转换成模拟信号的数模转换器170中。然后将模拟信号输出到诸如扬声器110的输出装置。
按照本发明的一个实施例,信号传送电路190包括封包器105、降率模块(RRM)108、编码器140和模数转换器130。在操作中,将诸如语音的模拟信号从麦克风120输入到模数转换器130中。然后将数字信号输入到编码器中。
该编码器设置为将数字信号的位流中的位分组成帧,该帧代表信号的待编码部分。然后根据编码器中执行的编码方案对帧进行编码。然后将如图3所示的编码帧输入到RMM108中。
编码器140使用的编码方案不采用帧间编码方法。帧间编码的一个例子是如下的一种编码方法:该方法是通过获得两帧之间的差值并且仅传送帧间差值的信息来实现的。通过利用不采用帧间编码方法的编码方案,在本发明的实施例中,能够废弃所选择的编码帧,而不会显著影响接收信号的感知质量。
根据本发明的一个实施例,对信号的特征进行分析以判定信号的稳定性。如果信号被判定为是稳定的,则可以在传送信号之前删掉所选择的帧。
当信号中的信息涉及语音时,活动帧可以定义为是包含含有语音活动的信息的帧。相反,非活动帧可以定义为是包含语音非活动周期的帧。
可以根据语音学分类对活动帧进行分类,即将一个活动帧分类为稳定浊音、稳定清音或者不稳定短暂音。语音的常用模式包括稳定音或不稳定音的声音周期。在语音学中,稳定音可以分为稳定浊音和稳定清音。对于稳定浊音来说,声韧带振动。稳定浊音的一个例子是元音,诸如单词“bar”中的“a”。对于稳定清音来说,声韧带不振动。稳定清音的一个例子是在延长的辅音之中,诸如单词“signal”中的“s”。通常,稳定浊音(诸如“a”)比稳定清音(诸如“s”)具有更高的能量。对于所有稳定音来说,在发音期间能量保持基本恒定。
不稳定音涉及语音起音(speech onset)、破裂音等,诸如单词“target”中的“t”。不稳定音也被称为短暂音。通常,对于不稳定音来说,在发音期间能量会变化。
根据本发明的实施例,当信号被判定为是稳定的时,仅包含稳定浊音或稳定清音的活动帧会被丢弃。非活动帧也可以被丢弃。然而,包含短暂音的活动帧不能被丢弃。
可以用各种方式来判定信号的稳定性。可以在任何阶段从测量到的信号的一个特征来判定信号的稳定性。例如,该特征可以从输入到传送电路中的模拟数据、从模数转换器输出的数字数据、数据帧、编码数据帧中测量,或从数据包中测量。
在本发明的一个实施例中,测量的特征可以是信号的能量、信号的基本频率或信号的频谱含量。如果测量出的特征在预定范围内保持恒定或者保持低于预定阈值预定时间,则信号可以被判定为是稳定的。
可选地,可以通过随着时间推移分析信号质量之间的差别来判定稳定性。例如,可以测量信号的基本频率之间的平方误差距离。可以对于每帧或对于每n帧来测量信号的基本频率之间的平方误差距离。可选地,可以采用用于编码每帧的位数来判定稳定性。可以对于每帧或对于每n帧测量位数。然后通过对帧间的平方误差距离和预定阈值进行比较,可以判定出信号的稳定性。
还可以从信号中所包含的语音信息来判定信号的稳定性。
如果信号包括稳定清音周期或稳定浊音周期,则信号可以被判定为是稳定的。因此,如果连续帧包括浊音数据,则一帧可以被丢弃。同理,如果连续帧包括清音数据,则一帧可以被丢弃。
信号参数可以将一帧分类为包含稳定浊音、稳定清音或不稳定短暂音,该信号参数包括帧中的信号信息的能量、基本频率和频谱含量。该列表是可以对帧进行分类的参数的一个例子,并不是详尽的。
根据本发明的一个实施例,编码器140在每个帧被编码之前对每个帧的信号参数进行分析,并且将每个帧分类为浊音帧、清音帧或短暂音帧。
经编码的帧在被输出到封包器105之前被输入到RRM108中,在封包器105处,在帧经由网络104被传送到目的终端之前,将帧插入数据包的净荷中。
图3示出了从编码器输入到RRM中的编码帧204的流。编码帧204包括编码清音帧201、编码短暂音帧202和编码浊音帧203。
本发明的发明人已经证明了:在信号传送到接收装置之前可以丢弃一些帧而不会显著改变接收信号的感知质量。
根据本发明的一个实施例,设置降率模块(RRM),以基于信号的稳定性来选择传输中可以丢弃的帧或包。
现在将参照图3和图4来详细描述降率模块的操作。
根据本发明的一个实施例,RRM108基于可以判定信号的稳定性的信息来选择待丢弃的帧。在本发明的一个实施例中,该信息可以由编码器提供。编码器提供给RRM关于每个帧中的数据的信息。该信息可以涉及数据帧的帧能量、基本频率、语音学分类或允许评定信号的稳定性的任何其它的信号特征,以上描述了这些信息的例子。
在本发明的一个实施例中,编码器可以提供关于用于每帧的多个参数的信息。例如,可以提供帧分类和帧的基本频率。
在本发明的一个实施例中,RRM仅丢弃清音帧、浊音帧或非活动帧,因为对任何短暂音帧的丢弃将对信号质量产生不利的影响。RRM还可以设置为不丢弃紧邻短暂音包出现的一帧。
图3是编码帧204的流,示出了哪些编码帧将被丢弃。图3示出了RRM108已经从编码帧204的流中选择了待丢弃的清音编码帧301和浊音编码帧302和303。
根据图3所示的实施例,RRM设置为:如果周围的帧被分类为相同的数据类型,则丢弃一帧。如图3所示,被丢弃的清音帧301在其前具有一个清音帧并且在其后具有一个清音帧。同理,在编码帧的流中,被丢弃的浊音帧302和303在它们之前和之后各自具有浊音帧。
在本发明的一个实施例中,可以响应于通信网络的状态来调整用于丢弃帧的条件。例如,如果通信网络的状态良好,则信号应保持稳定的帧的数量可以减少。
在本发明的一个可选实施例中,可以应用附加条件来选择待丢弃的帧。除了要求周围的帧被分类为与待丢弃的帧具有相同类型之外,还可以要求周围的帧具有表现为恒定的另一个参数。例如,还可以要求基本频率是恒定的或在预定的范围之内。
将编码帧204的流中未丢弃的帧放入到核心流中,核心流被输入到封包器105中。如图6所示,在将包传送过网络104之前,封包器105将帧插入到包601的净荷中。在本发明的一个优选实施例中,将两个帧插入到每个包的净荷中。
本发明的发明人发现,在实践中,通过使用上述丢弃包的方法,核心流中的平均数据传输率为40-45%,小于输入到RRM204中的数据流204的数据传输率。
在本发明的一个实施例中,使用代表包的净荷中每个被丢弃的帧的一个位来置换被丢弃的帧。根据本发明的该实施例,RRM设置为,当一帧被丢弃时,在被丢弃的该帧的位置处将一个位插入到包的净荷中。
根据本发明的该实施例,目的终端112的接收电路中的解码器160设置为检测包的净荷中所包含的位,并判定出该位代表在包传送之前被丢弃的帧。因此,当目的终端112接收到包时,接收器可以立即判定出帧从净荷中被丢弃。在已知包被有意丢弃的情况下,接收器可以对被丢弃的包进行更好的重构。例如,位的存在向接收器表明由于信号被判定为是稳定的所以帧被丢弃。这使得接收器在已知待重构的帧将产生稳定的信号的情况下重构被丢弃的帧。而且,根据本发明的一个实施例,当接收器接收到用于代替被丢弃的包的一个位时,接收器将不会试图使用诸如合成滤波器系数的信号衰减或带宽扩展的技术来补偿被丢弃的帧。
此外,传送用于代替被丢弃的帧的一个位,这允许接收器使用接收到的包来建立传输统计以判定信道质量。
根据本发明的一个实施例,由解码器对被丢弃的帧进行重构。
在被丢弃帧的位置处传送用于代替被丢弃的帧的位,这还允许接收器判定包的净荷中所包含的每个帧的正确的时间标识和重构帧的正确的时间标识。因此,传送电路不是为包中所包含的每个帧传送一个时间标识,而是仅需要为每个包传送一个时间标识。
在本发明的一个可选实施例中,在包的净荷中不是传送位来代表被丢弃的帧。在本发明的该实施例中,解码器认识到RRM中所采用的丢弃一帧的具体条件。
解码器分析接收信号中的信息,从该信息可以判定信号的稳定性。该信息可以涉及数据帧的帧能量、基本频率、语音学分类、或允许评定信号的稳定性的任何其它的信号特征。由于解码器认识到RRM采用的丢弃一帧的条件,所以解码器可以从接收信号的稳定性判定出编码器丢弃了哪些帧。例如,解码器可以知道,在语音非活动周期每第n帧可能已经被丢弃。然后解码器可以在已知传送器处丢弃帧的条件的情况下重新创建被丢弃的帧。
在本发明的一个实施例中,从数据流204丢弃的数据包是被RRM丢弃的。
现在将参考图5,其示出了本发明的一个可选实施例,其中,RRM108设置为可选择性地传送数据流204中丢弃的至少一些帧。如图5所示,核心流501包含数据流204中未被RRM108丢弃的帧,核心流501被输入封包器105。辅助数据流502包含RRM已经决定传送的数据流204中丢弃的数据帧,辅助数据流502也被输入到封包器105中。将辅助数据流502中的被丢弃的帧输入到封包器105中的决定可以取决于通信系统的状态。根据本发明的一个实施例,RRM可以设置为检测网络连接的带宽,并且如果可利用的带宽高于阈值,则RRM传送辅助流。在本发明的另一实施例中,RRM基于从目的端接收到的数据信道所判定出的信息可以决定传送丢弃帧。该信息可以包括关于包丢失和抖动的信息。
核心数据流和辅助数据流中的帧以它们在数据流204中排列的顺序到达封包器。
在本发明的一个实施例中,将帧以它们被接收到的顺序插入包的净荷中,而不论帧是接收在核心数据流中还是辅助数据流502中。在本发明的该实施例中,包的净荷可以包括来自核心流的帧和来自辅助流的帧。
图7示出了本发明的一个可选实施例,其中核心流501中的输入封包器中的帧被输入包601的净荷中,而辅助流502中的输入封包器中的帧被插入到包602的净荷中。在该实施例中,包可以包含来自核心流501的帧或者来自辅助流502的帧。
前向纠错(FEC)方法可以用来保护传送的数据。在本发明的一个实施例中,与应用到包含来自辅助流的帧的包的FEC相比,更多的FEC可以应用于包含来自核心流的帧的包。例如,包含来自核心流的帧的包可以被传送两次。
在本发明的另一实施例中,包含来自核心流的帧的包可以在通信网络中的一个单独信道上被传送至包含来自辅助流的帧的包。
在本发明的一个实施例中,当来自核心流的帧以包的形式独立于来自辅助流的帧传送时,包报头提供了关于包净荷中所包含的每个帧的顺序的信息。该信息允许目的终端112处的接收器以帧在编码器240输出的数据流204中排列的顺序对帧重新排序。指示该顺序的信息可以是指示帧何时输入封包器105的“时间标识”。
在本发明的一个可选实施例中,编码器不对帧的参数进行分析。相反,RRM108设置为对帧进行部分解码以判定帧的参数,从而选择传输中待丢弃的帧。
在本发明的一个可选实施例中,RRM分析用于对帧进行编码的位数。如果用来对帧进行编码的位数低于预定阈值,则可以丢弃该帧。可选地,如果位数在预定的范围之内,则可以丢弃该帧。例如,用63-94范围内的位数进行编码的帧可以被认为是属于特定类型的数据,(例如噪音),这些帧可以被废弃。
在本发明的另一个可选实施例中,RRM被布置在编码器的上游。在该实施例中,RRM可以在每个帧被编码之前分析每个帧。在对旨在传输用的帧进行编码之前,可以丢弃所选择的帧。
在本发明的一个可选实施例中,RRM可以构成编码器的一部分。
在本发明的一个可选实施例中,在将数据分割为帧之前测量信号参数。如果基于测量出的信号参数判定出信号的一部分是稳定的,则RRM可以判定出可以从信号的该部分中丢弃一帧。
在本发明的一个实施例中,网络104是对等网络。
在本发明的另一个可选例中,RRM可以位于对等网络104中的节点处。节点可以是布置为将来自源终端的信号转发到目的终端的诸如PC的转发终端。当转发终端向目的终端传送信号时,位于转发终端处的RRM分析信号中的至少一些帧的参数,并丢弃从传输中所选择的帧。在该实施例中,由于在转发终端处没有对帧进行编码,所以转发终端的RRM没有必要对帧进行部分解码以判定信号参数。
在本发明的另一个可选实施例中,RRM放在封包器和网络之间。在本发明的该实施例中,RRM设置为从包的净荷中丢弃帧。如果一个包的净荷中的所有帧被丢弃,则该包被丢弃。
在本发明的一个可选实施例中,源终端和目的终端可以设置为传送和接收视频数据。在本发明的该实施例中,RRM以与涉及音频帧所描述的相同的方式来丢弃被分类为稳定的视频帧。可以基于运动向量或相关指标的变化来评定视频帧的稳定性。这些技术在本领域是公知的,在此不进行进一步的描述。
在本发明的另一个可选实施例中,在对帧进行编码之前或者在将帧输入到RRM之前,可以丢弃包含不发音的帧(又称为不发音帧)。由语音活动检测器根据已知的方法可以判定出不发音帧。
尽管已经参照优选实施例具体地示出并描述了本发明,但是本领域技术人员应该理解的是,可以在不背离由权利要求限定的本发明的范围的情况下对形式及细节做出各种变化。

Claims (41)

1.一种在通信网络中将数据从第一节点传送到第二节点的方法,包括:
接收信号;
将所述信号分割为排列在第一数据流中的帧,所述帧包括活动帧和非活动帧;
分析所述信号的至少一个特征以判定所述信号在多个帧中是否是稳定的;
将活动帧分类为包含稳定浊音、稳定清音或者不稳定短暂音;
如果判定出信号在多个帧中保持稳定,则从第一数据流的多个帧中选择待丢弃的至少一个活动帧,其中选择出的帧来自分类为包含稳定浊音或稳定清音而不包含不稳定短暂音的帧;
丢弃选择出的至少一个帧;
将未从第一数据流中丢弃的帧输入核心流;以及
将所述核心流从所述第一节点传送到所述第二节点,其中帧在传送核心流的包之前插入到包中;
其中响应于通信网络的状态来调整应保持稳定的帧的数量。
2.根据权利要求1所述的方法,其中,所述信号的特征指示帧是活动的还是非活动的。
3.根据权利要求1所述的方法,其中,所述信号的特征指示帧是稳定的还是不稳定的。
4.根据权利要求1所述的方法,其中,所分析的特征指示帧的数据类型。
5.根据权利要求1所述的方法,其中,所述数据包括音频数据。
6.根据权利要求4所述的方法,其中,所述数据类型是浊音数据、清音数据、短暂音数据或不发音数据。
7.根据权利要求6所述的方法,其中,所述活动帧的数据类型是浊音、清音或短暂音。
8.根据权利要求6所述的方法,其中,所述非活动帧的数据类型是不发音类型。
9.根据权利要求1所述的方法,其中,如果特征保持恒定,则信号被判定为是稳定的。
10.根据权利要求1所述的方法,其中,如果特征保持在预限定的范围内,则信号被判定为是稳定的。
11.根据权利要求1所述的方法,其中,对于每个连续的帧分析信号的特征。
12.根据权利要求1所述的方法,其中,对于每n个帧分析信号的特征。
13.根据权利要求10所述的方法,其中,对于每个帧所分析的特征是不同的。
14.根据权利要求1所述的方法,其中,如果多个帧具有相同的数据类型,则信号被判定为是稳定的。
15.根据权利要求3所述的方法,其中,仅稳定的帧被丢弃。
16.根据权利要求1所述的方法,其中,如果使用了低于预定阈值的多个位对一个帧进行编码,则所述帧被丢弃。
17.根据权利要求3所述的方法,其中,一个稳定的帧当在数据流中它之前有另一稳定的帧时被丢弃。
18.根据权利要求17所述的方法,其中,一个稳定的帧只有当在数据流中它之后还跟随有一个稳定的帧时才被丢弃。
19.根据权利要求7所述的方法,其中,一个浊音帧当在数据流中它之前有另一浊音帧时被丢弃。
20.根据权利要求19所述的方法,其中,一个浊音帧只有当在数据流中它之后还跟随有一个浊音帧时才被丢弃。
21.根据权利要求7所述的方法,其中,一个清音帧当在数据流中它之前有另一清音帧时被丢弃。
22.根据权利要求21所述的方法,其中,一个清音帧只有当在数据流中它之后还跟随有一个清音帧时才被丢弃。
23.根据前述任一项权利要求所述的方法,其中,帧以包传送。
24.根据权利要求1-22中任一项权利要求所述的方法,其中,所述方法进一步包括以下步骤:
判定通信网络的传输条件;以及
如果通信网络的传输条件满足预定阈值,则将从第一数据流中丢弃的帧输入辅助数据流;以及
传送辅助数据流中的帧。
25.根据权利要求24所述的方法,其中,包的净荷用来传送来自核心流的帧和来自辅助流的帧。
26.根据权利要求24所述的方法,其中,来自核心流的帧和来自辅助流的帧以独立的包传送。
27.根据权利要求23所述的方法,其中,每个包包括报头,报头含有指示每个帧在第一数据流中排列的顺序的信息。
28.根据权利要求23所述的方法,其中,将位插入包的净荷中以指示被丢弃的帧。
29.根据权利要求1所述的方法,其中,所分析的特征是以下中的至少一个:能量、频率、频谱含量、谱包络、编码位数。
30.根据权利要求1所述的方法,其中,分析信号的一个以上的特征以判定信号是否是稳定的。
31.根据权利要求1所述的方法,其中,当在信号上检测到语音活动时,分析信号的特征。
32.一种在通信网络中将数据从第一节点传送到第二节点的方法,包括:
接收信号;
将所述信号分割为排列在第一数据流中的帧;
分析所述信号的至少一个参数以判定所述信号是否是稳定的;
如果判定出所述信号是稳定的,则从第一数据流中丢弃至少一个帧;
在被丢弃的帧的位置处将指示所述帧已经被丢弃的指示符插入第一数据流,
将未从第一数据流中丢弃的帧和所述指示符输入核心流;以及
将所述核心流从所述第一节点传送到所述第二节点。
33.根据权利要求32所述的方法,其中,所述指示符是位。
34.根据权利要求32或33所述的方法,其中,所述数据是音频数据。
35.根据权利要求32或33所述的方法,其中,所述数据是视频数据。
36.一种在通信网络中将数据从第一节点传送到第二节点的方法,包括:
接收包括具有活动和非活动帧的数据流的信号;
分析所述信号的至少一个特征以判定所述信号是否是稳定的;
如果判定出信号的包含在多个帧中的部分是稳定的,则从第一数据流的多个帧中丢弃至少一个活动帧;
将未从第一数据流中丢弃的帧输入核心流;以及
将所述核心流从所述第一节点传送到所述第二节点。
37.一种在通信网络中将数据从第一节点传送到第二节点的方法,包括:
接收信号;
将所述信号分割为排列在第一数据流中的帧,所述帧包括浊音帧和清音帧;
分析所述信号的至少一个参数以判定所述信号是否是稳定的;
根据编码方案对每个帧进行编码;
如果判定出信号的包含在多个帧中的部分是稳定的,则从第一数据流的多个帧中丢弃至少一个浊音帧或清音帧;
将未从第一数据流中丢弃的帧输入核心流;以及
将所述核心流从所述第一节点传送到所述第二节点。
38.一种传送装置,其布置为在通信网络中将音频数据从第一节点传送到第二节点,所述传送装置包括:
接收器,其布置为接收信号;
编码器,其布置为将所述信号分割为排列在第一数据流中的帧,所述帧包括活动帧和非活动帧,以及分析所述信号的至少一个特征以判定所述信号在多个帧中是否是稳定的,所述编码器将活动帧分类为包含稳定浊音、稳定清音或者不稳定短暂音;
降率模块,其布置为如果判定出信号在多个帧中是稳定的则从第一数据流的多个帧中选择待丢弃的至少一个活动帧,其中选择出的帧来自分类为包含稳定浊音或稳定清音而不包含不稳定短暂音的帧;
所述降率模块进一步布置为丢弃选择出的至少一个帧;以及
将未从第一数据流中丢弃的帧输入核心流;以及
传送器,其布置为将所述核心流从所述第一节点传送到所述第二节点,其中帧在传送核心流的包之前插入到包中;
其中响应于通信网络的状态来调整应保持稳定的帧的数量。
39.一种传送装置,其布置为在通信网络中将数据从第一节点传送到第二节点,所述传送装置包括:
接收器,其布置为接收信号;
编码器,其布置为将所述信号分割为排列在第一数据流中的帧,并分析所述信号的至少一个特征以判定所述信号是否是稳定的;
降率模块,其布置为如果判定出所述信号是稳定的则从第一数据流中丢弃至少一个帧,在被丢弃的帧的位置处将指示所述帧已经被丢弃的指示符插入第一数据流,并将未从第一数据流中丢弃的帧和所述指示符输入核心流;以及
传送器,其布置为将所述核心流从所述第一节点传送到所述第二节点。
40.一种通信系统,其包括布置为将数据传送到第二节点的第一节点,其中所述第一节点包括:
用于输入信号的器件;
用于将所述信号分割为排列在第一数据流中的帧的器件;
器件,其用于分析所述信号的至少一个特征以判定所述信号是否是稳定的;
用于如果判定出所述信号是稳定的,则从第一数据流中丢弃至少一个帧的器件;
用于在被丢弃的帧的位置处将指示所述帧已经被丢弃的指示符插入第一数据流的器件,
用于将未从第一数据流中丢弃的帧和所述指示符输入核心流的器件;以及
用于将所述核心流从所述第一节点传送到所述第二节点的器件;
并且其中所述第二节点包括:
用于接收核心流的器件;
用于检测位于所述核心流中的指示符的器件;以及
用于判定在所述指示符的位置处帧被从数据流中丢弃的器件;
用于基于帧已经被丢弃的判定来处理所述核心流中的帧流的器件;以及
用于输出经处理的帧流的器件。
41.一种通信系统,其包括布置为将数据传送到第二节点的第一节点,其中所述第一节点包括:
接收器,其布置为接收信号;
编码器,其布置为将所述信号分割为排列在第一数据流中的帧,所述帧包括活动帧和非活动帧,并分析所述信号的至少一个特征以判定所述信号在多个帧中是否是稳定的,所述编码器将活动帧分类为包含稳定浊音、稳定清音或者不稳定短暂音;
降率模块,其布置为如果判定出信号在多个帧中是稳定的则从第一数据流的多个帧中选择待丢弃的至少一个活动帧,其中选择出的帧来自分类为包含稳定浊音或稳定清音而不包含不稳定短暂音的帧;
所述降率模块进一步布置为丢弃选择出的至少一个帧;以及
将未从第一数据流中丢弃的帧输入核心流;以及
传送器,其布置为将所述核心流从所述第一节点传送到所述第二节点;并且其中帧在传送核心流的包之前插入到包;
其中响应于通信网络的状态来调整应保持稳定的帧的数量。
CN200780052275.8A 2007-03-20 2007-12-20 在通信系统中传送数据的方法 Active CN101636786B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0705324.2 2007-03-20
GBGB0705324.2A GB0705324D0 (en) 2007-03-20 2007-03-20 Method of transmitting data in a communication system
PCT/IB2007/004448 WO2008114085A2 (en) 2007-03-20 2007-12-20 Method and device for transmitting data in a communication system

Publications (2)

Publication Number Publication Date
CN101636786A CN101636786A (zh) 2010-01-27
CN101636786B true CN101636786B (zh) 2013-08-21

Family

ID=38008748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780052275.8A Active CN101636786B (zh) 2007-03-20 2007-12-20 在通信系统中传送数据的方法

Country Status (6)

Country Link
US (1) US8429285B2 (zh)
EP (1) EP2137727B1 (zh)
CN (1) CN101636786B (zh)
CA (1) CA2682153C (zh)
GB (1) GB0705324D0 (zh)
WO (1) WO2008114085A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0705324D0 (en) 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
NO2780522T3 (zh) 2014-05-15 2018-06-09
US10334518B2 (en) * 2015-10-20 2019-06-25 Qualcomm Incorporated Power gains and capacity gains for a relaxed frame erasure rate
EP3264644A1 (en) 2016-07-01 2018-01-03 Nxp B.V. Multiple source receiver
WO2018107536A1 (zh) * 2016-12-12 2018-06-21 苏州宝时得电动工具有限公司 自动工作系统,自移动设备及其控制方法
US11206244B2 (en) * 2018-12-21 2021-12-21 ARRIS Enterprise LLC Method to preserve video data obfuscation for video frames

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1692408A (zh) * 2002-07-05 2005-11-02 诺基亚有限公司 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US20040153313A1 (en) * 2001-05-11 2004-08-05 Roland Aubauer Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US7359979B2 (en) 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP
JP2007535193A (ja) 2003-07-16 2007-11-29 スカイプ・リミテッド ピアツーピア電話システムおよび方法
US7546508B2 (en) 2003-12-19 2009-06-09 Nokia Corporation Codec-assisted capacity enhancement of wireless VoIP
EP1982331B1 (en) 2006-02-06 2017-10-18 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for speech coding in wireless communication systems
GB0705324D0 (en) 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1692408A (zh) * 2002-07-05 2005-11-02 诺基亚有限公司 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置

Also Published As

Publication number Publication date
GB0705324D0 (en) 2007-04-25
US20080235389A1 (en) 2008-09-25
WO2008114085A3 (en) 2009-04-09
EP2137727A2 (en) 2009-12-30
EP2137727B1 (en) 2017-04-19
CA2682153A1 (en) 2008-09-25
CN101636786A (zh) 2010-01-27
WO2008114085A2 (en) 2008-09-25
US8429285B2 (en) 2013-04-23
CA2682153C (en) 2015-11-17

Similar Documents

Publication Publication Date Title
Bacioccola et al. User-level performance evaluation of voip using ns-2
CN101636786B (zh) 在通信系统中传送数据的方法
KR100501324B1 (ko) 음성 품질 예측값을 이용한 보이스 오버 인터넷프로토콜에서의 콜 라우팅 방법
US20020015387A1 (en) Voice traffic packet capture and analysis tool for a data network
US7450601B2 (en) Method and communication apparatus for controlling a jitter buffer
US9437216B2 (en) Method of transmitting data in a communication system
CN101636990B (zh) 在通信系统中传输数据的方法
EP1458145A1 (en) Error concealment apparatus and method
CN102340426A (zh) 一种评估voip语音质量的方法及装置
EP1724759A1 (en) Method and system for efficient transmission of communication traffic
US20120307677A1 (en) Transmitting Data in a Communication System
JPWO2011090185A1 (ja) 音声品質計測装置、音声品質計測方法およびプログラム
US20020016708A1 (en) Method and apparatus for utilizing a network processor as part of a test system
JP4217121B2 (ja) Ipネットワークシステムにおける音声品質評価方法および音声品質調整装置
US7657388B2 (en) Quality assessment tool
Zhang et al. Perceived QoS assessment for Voip networks
US7299176B1 (en) Voice quality analysis of speech packets by substituting coded reference speech for the coded speech in received packets
EP1443497B1 (en) Audio signal quality assessment method
Hammer et al. Corrupted speech data considered useful
Rahdari et al. Using Bayesian classifiers for estimating quality of VoIP
Fatih User-level Performance Evaluation of VoIP under Different Background TCP Traffic Conditions in ns-2
Jung et al. Improving wireless VoIP quality by using adaptive packet coding
Nithya et al. Performace analysis of CODEC's with QoS constrainsts in Voice over Internet Protocol V6
Turkes et al. Priority-Based Voice Segmentation and Transmission in Quality-Driven Wireless Audio Sensor Networks.
KR101447666B1 (ko) 음성 트래픽의 중요도를 고려한 적응적 버퍼 관리 방법 및 이의 저장 매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Dublin, Ireland

Applicant after: Scape Co., Ltd.

Address before: Dublin, Ireland

Applicant before: Skyper Ltd.

Address after: Dublin, Ireland

Applicant after: Scape Co., Ltd.

Address before: Dublin, Ireland

Applicant before: Skyper Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SKYPER LTD. TO: SKYPE LTD.

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200515

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Ai Erlandubailin

Patentee before: Skype

TR01 Transfer of patent right