CN1361911A - 提供解码器到编码器的反馈以改进帧删除情况下预测语言编码装置性能的方法和装置 - Google Patents
提供解码器到编码器的反馈以改进帧删除情况下预测语言编码装置性能的方法和装置 Download PDFInfo
- Publication number
- CN1361911A CN1361911A CN00810493A CN00810493A CN1361911A CN 1361911 A CN1361911 A CN 1361911A CN 00810493 A CN00810493 A CN 00810493A CN 00810493 A CN00810493 A CN 00810493A CN 1361911 A CN1361911 A CN 1361911A
- Authority
- CN
- China
- Prior art keywords
- scrambler
- demoder
- packet
- language code
- code device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000004044 response Effects 0.000 claims abstract description 7
- 238000004891 communication Methods 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 23
- 238000012217 deletion Methods 0.000 claims description 14
- 230000037430 deletion Effects 0.000 claims description 14
- 230000008713 feedback mechanism Effects 0.000 claims description 10
- 238000011002 quantification Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000007704 transition Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 206010003497 Asphyxia Diseases 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000012464 large buffer Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
从解码器向编码器提供反馈以改进帧删除情况下预测语言编码装置性能的方法和装置,它包括如果接收语言编码装置中的解码器(104、110、200、300)没有接收到发射语言编码装置中编码器(100、106)发送的帧,就通知接收语言编码装置中的编码器(100、106)。响应通知,将改变的数据包从接收语言编码装置中的编码器(100、106)发送到发射语言编码装置中的解码器(104、110、200、300)。当接收到改变的数据包时,发射语言编码装置中的解码器(100、106)通知发射语言编码装置中的编码器(100、106)。然后,发射语言编码装置中的编码器(100、106)处用改变的编码格式将数据包编码。改变的编码格式可以是低记忆编码格式或无记忆编码格式。改变的数据包可以具有被设置为数字值1的删除指示符比特。
Description
发明背景
I.发明领域
本发明一般涉及语言处理领域,尤其涉及提供从解码器到协同配置的编码器的反馈以改进帧删除情况下预测语言编码装置性能的方法和装置。
II.背景技术
用数字技术发送话音已非常普及,尤其在长距离和数字无线电话应用中。接着产生了对确定在信道上发送的最小信息量的兴趣,同时保持重建语言的感觉质量。如果通过简单地采样和数字化发送语言,那么需要大约每秒64千比特(kbps)的数据率,以获得传统模拟电话的语言质量。然而,通过使用语言分析,之后通过适当的编码、发送、并在接收机端再合成,可以大大降低数据率。
用于压缩语言的装置发现在电信的众多领域中有用。典型的领域是无线通信。无线通信领域具有很多应用,包括如无绳电话、寻呼、无线局部环路、如蜂窝和PCS电话系统的无线电话,移动因特网协议(IP)电话,和卫星通信系统。尤其重要的应用是移动用户的无线电话。
已经发展了各种空中接口用于无线通信系统,包括如频分多址(FDMA)、时分多址(TDMA)、和码分多址(CDMA)。在与之的连接中,建立了各种国内和国际的标准,包括如高级移动电话业务(AMPS),全球移动通信系统(GSM)、和临时标准(IS-95)。典型的无线电话通信系统是码分多址(CDMA)系统。电信工业协会(TIA)和其它公知的标准团体颁布了IS-95标准及其衍生物IS-95A、ANSI J-STD-008、IS-95B、提议的第三代标准IS-95C和IS-2000等等(这里统称为IS-95),以规定CDMA空中接口在蜂窝或PCS电话通信系统中的使用。美国专利号5,103,459和4,901,307中描述了根据使用IS-95标准实质构造的典型无线通信系统,这两个申请都转让给本发明的受让人,并通过引用全面结合于此。
通过使用提取关于人类语言产生模型的参数以压缩语言的技术的装置称为语言编码装置(coder)。语言编码装置将输入语言信号分成时间块或分析帧。语言编码装置通常包括编码器和解码器。编码器分析输入语言帧,以提取某些相关的参数,然后将参数量化成二进制表示,也就是一组比特或二进制数据包。在通信信道上将数据包从接收机发送到解码器。解码器处理数据包,将它们去量化以产生参数,并使用去量化参数再合成语言帧。
语言编码装置的功能是通过除去语言中的所有固有冗余将数字化的语言信号压缩成低比特率的信号。通过用一组参数表示输入语言帧并使用量化用一组比特表示参数,以实现数字压缩。如果输入语言帧具有比特数Ni且语言编码装置产生的数据包具有比特数No,那么语言编码装置获得的压缩因数为Cr=Ni/No。问题是在获得目标压缩因数的同时保持解码语言的高话音质量。语言编码装置的性能依赖于(1)语言模型、或上述分析和合成过程的组合执行得多好,(2)以目标比特率每帧No比特每帧执行的参数量化过程有多好。因此,语言模型的目标是用每帧一小组参数获取语言信号的本质,或目标语言质量。
也许语言编码装置设计中最重要的是搜索一组好的参数(包括向量),以描述语言信号。一组好的参数要求低的系统带宽,用于感觉精确的语言信号的重建。音调、信号功率、频谱包络(或共振峰),振幅和相位谱都是语言编码参数的实例。
语言编码装置可以是时域编码装置,它通过使用较高的时间分辨每次处理小片段语言(通常是5毫秒(ms)子帧)的编码,以试图获取时域语言波形。对于每个子帧,通过本领域所熟知的各种搜索算法发现了用码本空间的高精度表示。另外,语言编码装置可以是频域编码装置,它试图获取带有一组参数(分析)的输入语言帧的短期频谱,并使用相应的合成过程从频谱参数中重建语言波形。参数量化器根据A.Gersho & R.M.Gray,VectorQuantization and Signal Compression(1992)中描述的量化技术通过用存储的代码向量表示法表示参数,以保存参数。
公知的时域语言编码装置是L.B.Rabiner&R.W.Schafer,DigitalProcessing of Speech Signal 396-453(1978)中描述的代码受激线性预测编码装置(CELP),它通过引用全面结合于此。在CELP编码装置中,线性预测(LP)分析除去语言信号中的短期相关或冗余,它找出短期共振峰滤波器的系数。将短期预测滤波器施加到输入语言帧产生LP剩余信号,用长期预测滤波器参数和随后的随机码本将该信号进一步模型化和量化。因此,CELP编码将时域语言波形的编码任务分成LP短期滤波器系数编码和LP剩余编码的分离任务。可以以固定的速率(也就是对每个帧使用相同的比特数目No)或变化的速率(其中不同比特率用于不同类型的帧内容)执行时域编码。变化速率编码装置试图只使用编码参数编码以达到目标质量水平所需的比特量。美国专利号5,414,796中描述了典型的变化速率CELP编码装置,该申请转让给了本发明的受让人,并通过引用全面结合于此。
时域编码装置如CELP编码装置通常依赖于每帧高的比特数No,以保持时域语言波形的精确度。这种编码装置通常传送由相对大的每帧比特数No(如8kbps或更大)提供的较好语言质量。然而,在低比特率(4kbps或更低)时,由于有限的可获得比特数,时域编码装置就不能保持高质量和稳健的性能。在低比特率时,有限的码本空间箝制了符合传统时域编码装置波形匹配的容量,编码装置在较高速率的工业应用中已成功发展。因此,尽管随着时间推移而进行了改进,但是以低比特率工作的很多CELP编码系统遭受感觉上通常表征为噪声的严重的失真。
当前涌现了研究兴趣和较强的商业需要以发展在中到低比特率(也就是在2.4到4kbps范围内或更小)上工作的高质量的语言编码装置。应用领域包括无线电话、卫星通信、因特网电话、各种多媒体和话音流应用、话音邮件和其它具有存储系统。驱动力是高容量的需要,是在包丢失情况下稳健性能的要求。各种近来的语言编码标准化努力是另一直接驱动力,用于推进低速率语言编码算法的研究和发展。低速率语言编码装置在每个允许的应用带宽中产生更多的信道或用户,而且与适当信道编码附加层耦合的低速率语言编码装置能够适应编码装置规范的总比特预算,并能在信道出错条件下传送稳健的性能。
传统的低到中比特率、预测语言编码装置在引起帧删除的较差信道条件下执行得较差。语言编码装置的预测性质指出在帧删除(也就是在传输中丢失因此没有被接收到的帧)之后接收到的帧将根据较差的先前信息合成,解码器将失去与关联编码器的同步。因此合成的帧退化,语言质量也受影响。因此期望改进较差信道条件下的语言编码装置性能。因此需要使用反馈机构在帧删除情况下改进性能的语言编码装置。
发明内容
本发明是针对使用反馈机构在帧删除情况下改进性能的语言编码装置。因此,在本发明的一个方面,语言编码系统最好包括包含第一编码器和第一解码器的第一语言编码装置;和包含第二编码器和第二解码器的第二语言编码装置,其中第一编码器被构造成将语言帧的数据包编码,并通过通信信道将数据包发送到第二解码器,第二解码器被构造成接收并将数据包解码,如果第二解码器没有接收到发送帧就发送信号到第二编码器,第二编码器被构造成编码并发送数据包,并响应来自第二解码器的信号改变数据包,第一解码器被构造成接收并解码数据包,并且根据接收到来自第二编码器的改变的数据包发送信号到第一编码器,第一编码器还被构造成响应来自第一解码器的信号,使用改变的编码格式将数据包编码。
在本发明的另一方面,从第一语言编码装置中的第一解码器向第二语言编码装置中的第一编码器提供反馈的方法最好包括以下步骤,如果第一解码器没有接收到第一编码器发送的帧,就通知第一语言编码装置中的第二编码器;响应通知,将改变的数据包从第二编码器发送到第二解码器;当第二解码器接收到来自第二编码器的改变的数据包时,通知第一编码器;并且在第一编码器处用改变的编码格式将数据包编码。
在本发明的另一方面,反馈机构在语言编码系统中,语言编码系统包括第一和第二语言编码装置,第一语言编码装置包括第一编码器和第一解码器,第二语言编码装置包括第二编码器和第二解码器,最好包括如果第二解码器没有接收到第一编码器发送的帧,就通知第二编码器的装置;响应通知将改变的数据包从第二编码器发送到第一解码器的装置;当第一解码器接收到来自第二编码器的改变的数据包时,通知第一编码器的装置;和在第一编码器处用改变的编码格式将数据包编码的装置。
附图说明
图1是无线电话系统的框图。
图2是语言编码装置在每个终端处终止的通信信道的框图。
图3是编码器的框图。
图4是解码器的框图。
图5是表示语言编码判定过程的流程图。
图6A是语言信号振幅相对时间的图像;图6B是线性预测(LP)剩余振幅相对时间的图像。
图7是使用反馈回路的语言编码系统的框图,反馈回路从接收机处解码器到接收机处编码器、从接收机处编码器到发射机处解码器、从发射机处解码器到发射机处编码器。
较佳实施例的详细描述
这里以下所述的典型实施例存在于被构造成使用CDMA空中接口的无线电话通信系统中。然而,本领域熟练的技术人员应该理解使用本发明特征的次采样方法和装置可以存在于使用本领域熟练技术人员所熟知的较宽范围技术的任何各种通信系统中。
如图1所示,CDMA无线电话系统一般包括多个移动用户单元10、多个基站12、基站控制器(BSC)14,和移动交换中心(MSC)16。MSC 16被构造成与传统公共交换电话网(PSTN)18连接。MSC 16还被构造成与BSC 14连接。BSC 14提供回传线路耦合到基站12。回传线路可以被构造成支持几个已知接口中的任何一个,如E1/T1、ATM、IP、PPP、Frame Relay、HDSL、ADSL或xDSL。应该理解系统中有多于两个的BSC 14。每个基站12最好包括至少一个扇区(未图示),每个扇区包括一全向天线或从基站12发出的特定径向方向的天线。另一种情况是,每个扇区可以包括两个天线用于分集接收。每个基站12最好被设计成支持多个频率分配。扇区的相交和频率分配可以称为CDMA信道。基站12也熟知为基站收发机子系统(BTS)12。另一种情况是,“基站”可用于工业中以统称为BSC 14和一个和多个BTS 12。BTS 12也可以表示为“区站”12。另一种情况是,给定BTS 12的各个扇区也可称为区站。移动用户单元10通常是蜂窝或PCS电话10。系统最好被构造成根据IS-95标准使用。
在蜂窝电话系统的典型工作中,基站12从移动单元组10接收反向链路信号组。移动单元10传导电话呼叫或其它通信。给定基站12接收到的每个反向链路信号在该基站12中被处理。所得的数据被发送到BSC 14。BSC 14提供呼叫资源分配和移动管理功能,包括基站12之间软越区切换的控制。BSC14还将接收到的数据发送到MSC 16,MSC 16为与PSTN 18的接口提供附加的路由服务。类似地,PSTN 18和MSC 16连接,MSC 16和BSC 14连接,BSC 14依次控制基站12发送前向链路信号组到移动单元组10。
在图2中,第一编码器100接收数字化的语言样本s(n)并将样本s(n)编码,用于在传输介质102、或通信信道102上发送到第一解码器104。解码器104将编码语言样本解码,并合成输出语言信号SSYNTH(n)。为了在反方向上发送,第二编码器106将对在通信信道108上传输的数字化语言样本s(n)编码。第二解码器110接收并将编码语言样本解码,产生合成的输出语言信号SSYNTH(n)。
语言样本s(n)表示根据本领域中各种熟知的任何方法数字化并量化的语言信号,这些方法如脉冲编码调制(PCM)、压扩μ律、或A律。如本领域中所熟知的,语言样本s(n)组织成输入数据帧,其中每个帧包括预定个数的数字化语言样本s(n)。在典型实施例中,使用8kHz的采样速率,每个20ms的帧包括160个样本。在以下描述的实施例中,数据传输速率最好在帧到帧的基础上从13.2kbps(全速率)变化到6.2kbps(半速率)到2.6kbps(四分之一速率)到1kbps(八分之一速率)。数据传输速率的变化是有利的,因为对于包含相对较少语言信息的帧可以选用较低的比特率。本领域熟练的技术人员能够理解还可以使用其它采样速率和数据传输速率。
第一编码器100和第二解码器110一同组成第一语言编码装置。语言编码装置可用于发送语言信号的任何通信装置中,包括如以上参考图1描述的用户单元、BTS或BSC。类似地,第二编码器106和第一解码器104一同组成第二语言编码装置。本领域熟练的技术人员应该理解语言编码装置可以用数字信号处理器(DSP)、专用集成电路(ASIC)、离散门逻辑、固件、或任何传统可编程软件模块和微处理器实现。软件模块可存在于RAM存储器、快闪存储器、寄存器或本领域中所熟知的任何其它形式的可写存储媒介。另一种情况是,任何传统的处理器、控制器或状态机都可以替代微处理器。美国专利号5,727,123中中和1994年2月16日提交的美国申请序号08/197,417题为“VOCODER ASIC”的申请中都描述了专门为语言编码设计的典型ASIC,这两个申请都转让给了本发明的受让人,并通过引用全面结合于此。
在图3中,可用于语言编码装置的编码器200包括模式判定模块202、音调估计模块204、LP分析模块206、LP分析滤波器208、LP量化模块210、和剩余量化模块212。输入语言帧s(n)提供给模式判定模块202、音调估计模块204、LP分析模块206、LP分析滤波器208。模式判定模块202根据每个输入语言帧s(n)的周期、能量信噪比(SNR)或零交叉速率以及其它特征产生模式索引IM和模式M。美国专利号5,911,128中描述了根据周期将语言帧分类的各种方法,该申请转让给了本发明的受让人,并通过引用全面结合于此。这种方法还结合入电信工业协会工业临时标准TIA/EIA IS-127和TIA/EIA IS-733。1998年12月21日提交的美国申请序号09/217,341题为“VARAIBLE RATE SPEECHCODING”的申请中还描述了典型的模式判定方案,该申请转让给了本发明的受让人,并通过参考全面结合于此。
音调估计模块204根据每个输入语言帧s(n)产生音调索引IP和滞后值P0。LP分析模块206执行每个输入语言帧s(n)的线性预测分析,以产生LP参数a。LP参数a提供给LP量化模块210。LP量化模块210还接收模式M,以此执行模式依赖方式的量化过程。LP量化模块210产生LP索引ILP和量化LP参数
除了输入语言帧s(n)外LP分析滤波器208还接收量化LP参数
。LP分析滤波器208产生LP剩余信号R[n],它表示输入语言帧s(n)和根据量化线性预测参数
重建的语言之间的误差。LP剩余R[n]、模式M和量化LP参数
被提供给剩余量化模块212。根据这些值,剩余量化模块212产生剩余索引IR和量化剩余信号
在图4中,可用于语言编码装置的解码器300包括LP参数解码模块302、剩余解码模块304、模式解码模块306和LP合成滤波器308。模式解码模块306接收并将模式索引IM解码,从中产生模式M。LP参数解码模块302接收模式M和LP索引ILP。LP参数解码模块302将接收到的值解码,产生量化LP参数
剩余解码模块304接收剩余索引IR、音调索引IP、和模式索引IM。剩余解码模块304将接收到的值解码,产生量化剩余信号
。量化剩余信号
和量化LP参数
被提供给LP合成滤波器308,它从中合成解码输出语言信号
本领域中熟知图3中编码器200和图4中解码器300中各种模块的操作和实施,并且在上述美国专利号5,414,196和L.B.Rabiner & R.W.Schafer,Digital Processing of Speech Signals 396-453(1978)中对其进行了描述。
如图5中流程图所示,根据一个实施例的语言编码装置遵循处理语言样本用于发送的一组步骤。在步骤400中,语言编码装置接收连续帧中的语言信号的数字样本。一当接收给定的帧,语言编码装置就进入步骤402。在步骤402中,语言编码装置检测帧的能量。能量是帧中语言活动性的衡量。通过将数字化语言样本振幅的平方求和并将所得的能量和阈值比较,执行语言检测。在一个实施例中,阈值根据背景噪声电平的变化而自适应改变。上述美国专利号5,414,796中描述了典型的可变阈值语言活动性检测器。一些无声的语言声很可能是低能量样本,它可能被当做背景噪声而错误编码。为了防止这种情况的发生,使用低能量样本的频谱倾斜,以区别无声语言和背景噪声,如上述美国专利号5,414,796中所描述的。
在检测帧的能量之后,语言编码装置进入步骤404。在步骤404中,语言编码装置确定检测到的帧能量是否足以将帧分类为包含语言信息。如果检测到的帧能量低于预定的阈值电平,那么语言编码装置执行步骤406。在步骤406中,语言编码装置将帧作为背景噪声(也就是无语言或静音)编码。在一个实施例中,以1/8速率或1kbps将背景噪声帧编码。如果在步骤404中检测到的帧能量符合或超过预定的阈值电平,那么帧被分类为语言,语言编码装置执行步骤408。
在步骤408中,语言编码装置确定帧是否为无声语言,也就是语言编码装置测试帧的周期。各种已知的周期确定方法包括如使用零交叉和使用归一化自相关函数(NACF)。尤其,上述美国专利号5,911,128中和美国申请序号09/217,341中描述了使用零交叉和NACF检测周期。此外,以上用于区别有声语言和无声语言的方法被结合入电信工业协会临时标准TIA/EIA IS-127和TIA/EIA IS-733。如果在步骤408中确定帧是无声语言,语言编码装置执行步骤410。在步骤410中,语言编码装置将帧作为无声语言编码。在一个实施例中,以1/4速率或2.6kbps将无声语言帧编码。如果在步骤408中,确定帧不是无声语言,语言编码装置执行步骤412。
在步骤412中,语言编码装置使用本领域中熟知的周期检测方法确定帧是否是过渡语言,如上述美国专利号5,911,128中所描述的方法。如果确定帧是过渡语言,语言编码装置执行步骤414。在步骤414中,将帧作为过渡语言(也就是从无声语言过渡到有声语言)编码。在一个实施例中,根据多脉冲内插编码法将过渡语言帧编码,1999年5月7日提交的美国申请序号09/307,294题为“MULTIPULSE INTERPOLATIVE CODING OF TRANSITION SPEECHFRAMES”的申请中描述了该方法,该申请转让给了本发明的受让人,并通过引用全面结合于此。在另一实施例中,以全速率或13.2kbps将过渡语言帧编码。
如果在步骤412中语言编码装置确定帧不是过渡语言,那么语言编码装置执行步骤416。在步骤416中,语言编码装置将帧作为有声语言编码。在一个实施例中,可以以半速率或6.2kbps将有声语言帧编码。也可以以全速率或13.2kbps(或者在8k CELP编码装置中以全速率8kbps)将有声语言帧编码。然而,本领域熟练的技术人员将理解以半速率将有声帧编码,通过开发有声帧的稳态本质,允许编码装置节省有用的带宽。此外,不考虑有声语言编码所用的速率,最好使用来自过去帧的信息将有声语言编码,因此称为预测编码。
本领域熟练的技术人员应该理解遵循图5的步骤可以将语言信号或相应的LP剩余编码。从图6A的曲线图中可以看出作为时间函数的噪声、无声、过渡和有声语言的波形特征。从图6B的曲线图中可以看出作为时间函数的噪声、无声、过渡和有声LP剩余的波形特征。
如图7所示,在一个实施例中,语言编码系统500被构造成提供从接收机处解码器到接收机处编码器、从接收机处编码器到发射机处解码器、从发射机处解码器到发射机处编码器的反馈回路。如下所述,从接收机解码器到发射机编码器的反馈回路最好使语言编码系统500能够通过避免坏帧记忆的传播,在帧删除的情况下改进性能。
语言编码系统500包括第一和第二语言编码装置502、504。仅仅为了解释的目的第一语言编码装置502表示为发射机语言编码装置,第二语言编码装置504表示为接收机语言编码装置。第一语言编码装置502包括编码器506和解码器508。第二语言编码装置504包括编码器510和解码器512。任一语言编码装置502、504最好作为DSP的一部分实现,并存在于如PCS或蜂窝电话系统中的用户单元或基站中、或在卫星系统的用户单元或网关中。
编码器506通过通信信道发送数据包。解码器512接收数据包。如果帧在传输期间丢失(也就是由于较差或有噪声的信道条件),解码器512发送信号到编码器510,表示接收到一帧删除。然后编码器510在将要发送的下一数据包上将表示为删除符指示比特(EIB)的特定比特值设置为1。然后编码器510发送数据包。解码器508接收数据包。解码器508发送信号到编码器506,表示接收到了EIB设置为1的数据包。根据接收到的来自解码器508的信号,编码器506发送低记忆编码数据包作为下一数据包。在特殊的实施例中,编码器506发送无记忆编码数据包作为下一数据包。
由于以下原因语言编码系统500是有益的。通常,预测语言编码装置使用相当大存储量。因此,当编码时每个帧(在特定实施例中,每个帧长20ms)使用来自过去编码帧的信息。这影响了帧删除情况下的语言编码装置性能。例如,如果一个帧(或多个帧)删除了,在基于预测的语言编码装置(使用来自过去帧的信息,预测当前帧)中该删除之后的帧的质量将受到影响。在低比特率语言编码装置中这尤其显著,其中有大量的预测。然而根据上述实施例,当接收机侧语言解码器512接收到删除帧时,解码器512发送反馈到发射机侧的语言编码器506表示解码器512见到-删除,因此请求低记忆(最小预测)编码或无记忆(非预测)编码,使得接收机侧语言解码器512的输出和记忆和发射机侧语言编码器506的输出和记忆再次同步。因此,如上所述,接收机侧的语言解码器512通知接收机侧的语言编码器510发送EIB和下一数据包。然后发射机侧的语言解码器508通知发射机侧的语言编码器506接收到EIB。从而发射机侧的语言编码器506执行低记忆(最小预测)编码或无记忆(非预测)编码,并发送相应的数据包到接收机侧的语言解码器512。然后接收机侧的语言解码器512将低记忆或无记忆数据包解码,并使用解码后的数据包重置或再次同步它的记忆和发射机侧语言编码器506的记忆。接收机侧语言解码器512在接收到低记忆或无记忆编码数据包之前必须等待的最大时间是一个帧周期(因为接收机侧的编码器510可能已经开始产生数据包)加上另一帧周期(因为当接收到EIB时发射机侧的编码器506可能已经开始产生数据包)再加上单向发送延迟时间。
因此,已经描述了从解码器向编码器提供反馈以改进帧删除情况下预测语言编码装置性能的新颖方法和装置。本领域熟练的技术人员将理解结合这里所揭示实施例描述的各种说明性逻辑模块和算法步骤可以通过以下装置实现或执行:数字信号处理器(DSP)、专用集成电路(ASIC)、离散门或晶体管逻辑、离散硬件如寄存器和FIFO,执行一组固件指令的处理器,或任何传统可编程软件模块和处理器。处理器最好是微处理器,但是另外处理器也可以是任何传统的处理器、控制器、微控制器、或状态机。软件模块可存在于RAM存储器、快闪存储器、寄存器或本领域中所熟知的任何其它形式的可写存储媒介。本领域熟练的技术人员还应该理解以上描述中参考的数据、指令、命令、信息、信号、比特、码元和码片最好用电压、电流、电磁波、磁场或粒子、光场或粒子或它们的任何组合表示。
显示并描述了本发明的较佳实施例。然而对本领域熟练的技术人员显而易见的是不脱离本发明的精神和范围可以对这里揭示的实施例进行各种变化。因此,本发明只受以下权利要求书的限制。
Claims (18)
1.一种语言编码系统,其特征在于,它包括:
第一语言编码装置,包括第一编码器和第一解码器;和
第二语言编码装置,包括第二编码器和第二解码器,
其中第一编码器被构造成将语言帧的数据包编码,并通过通信信道将数据包发送到第二解码器,第二解码器被构造成接收并解码数据包,如果第二解码器没有接收到发送帧就发送信号到第二编码器,第二编码器被构造成编码并发送数据包,并响应来自第二解码器的信号改变数据包,第一解码器被构造成接收并解码数据包,并且在接收到来自第二编码器的改变的数据包时发送信号到第一编码器,第一编码器还被构造成响应来自第一解码器的信号,使用改变的编码格式将数据包编码。
2.如权利要求1所述的语言编码系统,其特征在于,改变的数据包包括带有被设置为数值1的删除指示符比特的数据包。
3.如权利要求1所述的语言编码系统,其特征在于,改变的编码格式包括低记忆编码方案。
4.如权利要求1所述的语言编码系统,其特征在于,改变的编码格式包括无记忆编码方案。
5.如权利要求1所述的语言编码系统,其特征在于,第一语言编码装置存在于用户单元中,第二语言编码装置存在于无线通信系统的基站中。
6.如权利要求1所述的语言编码系统,其特征在于,第二语言编码装置存在于用户单元中,第一语言编码装置存在于无线通信系统的基站中。
7.从第一语言编码装置中的第一解码器向第二语言编码装置中的第一编码器提供反馈的方法,其特征在于,包括以下步骤:
如果第一解码器没有接收到第一编码器发送的帧,就通知第一语言编码装置中的第二编码器;
响应通知,将改变的数据包从第二编码器发送到第二解码器;
当第二解码器接收到来自第二编码器的改变的数据包时,通知第一编码器;和
在第一编码器处用改变的编码格式将数据包编码。
8.如权利要求7所述的方法,其特征在于,改变的数据包包括带有被设置为数字值1的删除指示符比特的数据包。
9.如权利要求7所述的方法,其特征在于,改变的编码格式包括低记忆编码方案。
10.如权利要求7所述的方法,其特征在于,改变的编码格式包括无记忆编码方案。
11.如权利要求7所述的方法,其特征在于,第一语言编码装置存在于用户单元中,第二语言编码装置存在于无线通信系统的基站中。
12.如权利要求7所述的方法,其特征在于,第二语言编码装置存在于用户单元中,第一语言编码装置存在于无线通信系统的基站中。
13.语言编码系统中的反馈机构,语言编码系统包括第一和第二语言编码装置,第一语言编码装置包括第一编码器和第一解码器,第二语言编码装置包括第二编码器和第二解码器,反馈机构包括:
如果第二解码器没有接收到第一编码器发送的帧,就通知第二编码器的装置;
响应通知将改变的数据包从第二编码器发送到第一解码器的装置;
当第一解码器接收到来自第二编码器的改变的数据包时,通知第一编码器的装置;和
在第一编码器处用改变的编码格式将数据包编码的装置。
14.如权利要求13所述的反馈机构,其特征在于,改变的数据包包括带有被设置为数字值1的删除指示符比特的数据包。
15.如权利要求13所述的反馈机构,其特征在于,改变的编码格式包括低记忆编码方案。
16.如权利要求13所述的反馈机构,其特征在于,改变的编码格式包括无记忆编码方案。
17.如权利要求13所述的反馈机构,其特征在于,第一语言编码装置存在于用户单元中,第二语言编码装置存在于无线通信系统的基站中。
18.如权利要求13所述的反馈机构,其特征在于,第二语言编码装置存在于用户单元中,第一语言编码装置存在于无线通信系统的基站中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/356,860 | 1999-07-19 | ||
US09/356,860 US6324503B1 (en) | 1999-07-19 | 1999-07-19 | Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1361911A true CN1361911A (zh) | 2002-07-31 |
CN1148721C CN1148721C (zh) | 2004-05-05 |
Family
ID=23403267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB00810493XA Expired - Fee Related CN1148721C (zh) | 1999-07-19 | 2000-07-19 | 提供解码器到编码器的反馈以改进帧删除情况下预测语言编码装置性能的方法和装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6324503B1 (zh) |
EP (1) | EP1204967B1 (zh) |
JP (1) | JP4842472B2 (zh) |
KR (1) | KR20020013962A (zh) |
CN (1) | CN1148721C (zh) |
AT (1) | ATE312399T1 (zh) |
AU (1) | AU6354500A (zh) |
BR (1) | BR0012539A (zh) |
DE (1) | DE60028579T2 (zh) |
ES (1) | ES2257307T3 (zh) |
HK (1) | HK1045398B (zh) |
WO (1) | WO2001006491A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101120400B (zh) * | 2005-01-31 | 2013-03-27 | 斯凯普有限公司 | 在通信系统中生成隐藏帧的方法 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6765904B1 (en) | 1999-08-10 | 2004-07-20 | Texas Instruments Incorporated | Packet networks |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
US6954727B1 (en) * | 1999-05-28 | 2005-10-11 | Koninklijke Philips Electronics N.V. | Reducing artifact generation in a vocoder |
US6744757B1 (en) | 1999-08-10 | 2004-06-01 | Texas Instruments Incorporated | Private branch exchange systems for packet communications |
US6678267B1 (en) * | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
US6801532B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Packet reconstruction processes for packet communications |
US6757256B1 (en) | 1999-08-10 | 2004-06-29 | Texas Instruments Incorporated | Process of sending packets of real-time information |
US6801499B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Diversity schemes for packet communications |
US6804244B1 (en) | 1999-08-10 | 2004-10-12 | Texas Instruments Incorporated | Integrated circuits for packet communications |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US6549886B1 (en) * | 1999-11-03 | 2003-04-15 | Nokia Ip Inc. | System for lost packet recovery in voice over internet protocol based on time domain interpolation |
US7254120B2 (en) * | 1999-12-09 | 2007-08-07 | Broadcom Corporation | Data rate controller |
US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
US6745012B1 (en) * | 2000-11-17 | 2004-06-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive data compression in a wireless telecommunications system |
ATE326088T1 (de) * | 2000-11-21 | 2006-06-15 | Koninkl Philips Electronics Nv | Übertragungssystem mit anzeige von schlechten rahmen zur wiedersynchronisierung |
US6839862B2 (en) * | 2001-05-31 | 2005-01-04 | Koninklijke Philips Electronics N.V. | Parallel data communication having skew intolerant data groups |
US7477876B2 (en) * | 2001-11-02 | 2009-01-13 | Alcatel-Lucent Usa Inc. | Variable rate channel quality feedback in a wireless communication system |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP2007013871A (ja) * | 2005-07-04 | 2007-01-18 | Toshiba Corp | 無線通信システムおよびこの無線通信システムに用いられる復号装置 |
US7734469B1 (en) * | 2005-12-22 | 2010-06-08 | Mindspeed Technologies, Inc. | Density measurement method and system for VoIP devices |
CN101561791B (zh) * | 2008-04-18 | 2010-09-29 | 中兴通讯股份有限公司 | 一种帧宽度可扩展的同步串行接口装置 |
KR200449479Y1 (ko) * | 2010-03-23 | 2010-07-13 | 최창묵 | 시계 수리용 트위저 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
EP2989632A1 (en) * | 2013-04-25 | 2016-03-02 | Nokia Solutions and Networks Oy | Speech transcoding in packet networks |
US10993087B1 (en) | 2019-12-03 | 2021-04-27 | Motorola Solutions, Inc. | Communication systems with call interrupt capabilities |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4410986A (en) * | 1981-04-16 | 1983-10-18 | Bell Telephone Laboratories, Incorporated | Error and status detection circuit for a digital regenerator using quantized feedback |
US4901307A (en) * | 1986-10-17 | 1990-02-13 | Qualcomm, Inc. | Spread spectrum multiple access communication system using satellite or terrestrial repeaters |
JPS6444499A (en) * | 1987-08-12 | 1989-02-16 | Fujitsu Ltd | Forecast encoding system for voice |
US5568483A (en) | 1990-06-25 | 1996-10-22 | Qualcomm Incorporated | Method and apparatus for the formatting of data for transmission |
US5103459B1 (en) | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
ES2348319T3 (es) | 1991-06-11 | 2010-12-02 | Qualcomm Incorporated | Vocodificador de velocidad variable. |
JP3328945B2 (ja) * | 1991-11-26 | 2002-09-30 | 松下電器産業株式会社 | 音声符号化装置、音声符号化方法及び音声復号化方法 |
DE69331166T2 (de) * | 1992-02-03 | 2002-08-22 | Koninklijke Philips Electronics N.V., Eindhoven | Übertragung von digitalen Breitbandsignalen |
JP3353852B2 (ja) * | 1994-02-15 | 2002-12-03 | 日本電信電話株式会社 | 音声の符号化方法 |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
TW271524B (zh) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5768527A (en) | 1996-04-23 | 1998-06-16 | Motorola, Inc. | Device, system and method of real-time multimedia streaming |
AU4497097A (en) * | 1996-09-25 | 1998-04-17 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
JPH10233728A (ja) * | 1997-02-19 | 1998-09-02 | Matsushita Electric Ind Co Ltd | 無線電話装置 |
US6108374A (en) * | 1997-08-25 | 2000-08-22 | Lucent Technologies, Inc. | System and method for measuring channel quality information |
US6058107A (en) | 1998-04-08 | 2000-05-02 | Motorola, Inc. | Method for updating forward power control in a communication system |
-
1999
- 1999-07-19 US US09/356,860 patent/US6324503B1/en not_active Expired - Lifetime
-
2000
- 2000-07-19 WO PCT/US2000/019671 patent/WO2001006491A1/en active IP Right Grant
- 2000-07-19 BR BR0012539-3A patent/BR0012539A/pt not_active IP Right Cessation
- 2000-07-19 KR KR1020027000692A patent/KR20020013962A/ko active Search and Examination
- 2000-07-19 CN CNB00810493XA patent/CN1148721C/zh not_active Expired - Fee Related
- 2000-07-19 JP JP2001511666A patent/JP4842472B2/ja not_active Expired - Lifetime
- 2000-07-19 AU AU63545/00A patent/AU6354500A/en not_active Abandoned
- 2000-07-19 EP EP00950440A patent/EP1204967B1/en not_active Expired - Lifetime
- 2000-07-19 AT AT00950440T patent/ATE312399T1/de not_active IP Right Cessation
- 2000-07-19 DE DE60028579T patent/DE60028579T2/de not_active Expired - Lifetime
- 2000-07-19 ES ES00950440T patent/ES2257307T3/es not_active Expired - Lifetime
-
2002
- 2002-09-20 HK HK02106876.4A patent/HK1045398B/zh not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101120400B (zh) * | 2005-01-31 | 2013-03-27 | 斯凯普有限公司 | 在通信系统中生成隐藏帧的方法 |
Also Published As
Publication number | Publication date |
---|---|
HK1045398B (zh) | 2005-03-04 |
DE60028579D1 (de) | 2006-07-20 |
DE60028579T2 (de) | 2006-09-28 |
HK1045398A1 (en) | 2002-11-22 |
AU6354500A (en) | 2001-02-05 |
JP4842472B2 (ja) | 2011-12-21 |
BR0012539A (pt) | 2002-07-23 |
KR20020013962A (ko) | 2002-02-21 |
WO2001006491A1 (en) | 2001-01-25 |
ATE312399T1 (de) | 2005-12-15 |
EP1204967B1 (en) | 2005-12-07 |
CN1148721C (zh) | 2004-05-05 |
EP1204967A1 (en) | 2002-05-15 |
US6324503B1 (en) | 2001-11-27 |
ES2257307T3 (es) | 2006-08-01 |
JP2003524939A (ja) | 2003-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1361911A (zh) | 提供解码器到编码器的反馈以改进帧删除情况下预测语言编码装置性能的方法和装置 | |
CN1161749C (zh) | 保持语言编码中目标比特率的方法和装置 | |
KR100898323B1 (ko) | 음성 코더용 스펙트럼 크기 양자화 방법 | |
KR100912030B1 (ko) | 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치 | |
CN1432175A (zh) | 可变速率语音编码器中的帧擦除补偿方法 | |
CN1145930C (zh) | 用于交织语音编码器中线性谱信息量化方法的方法和设备 | |
JP2008040509A (ja) | 位相スペクトル情報をサブサンプリングする方法および装置 | |
CA2494956A1 (en) | Bandwidth-adaptive quantization | |
KR100756570B1 (ko) | 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1045398 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040505 Termination date: 20190719 |