CN100349395C - 用于语音帧误差降低的语音通信单元和方法 - Google Patents

用于语音帧误差降低的语音通信单元和方法 Download PDF

Info

Publication number
CN100349395C
CN100349395C CNB038182726A CN03818272A CN100349395C CN 100349395 C CN100349395 C CN 100349395C CN B038182726 A CNB038182726 A CN B038182726A CN 03818272 A CN03818272 A CN 03818272A CN 100349395 C CN100349395 C CN 100349395C
Authority
CN
China
Prior art keywords
speech
frame
transmission path
selective
communication units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB038182726A
Other languages
English (en)
Other versions
CN1672193A (zh
Inventor
乔纳森·阿拉斯泰尔·吉布斯
史蒂芬·阿夫泰拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1672193A publication Critical patent/CN1672193A/zh
Application granted granted Critical
Publication of CN100349395C publication Critical patent/CN100349395C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0083Formatting with frames or packets; Protocol or part of protocol for error control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

一种语音通信单元(100),包括语音编码器(134),能够表示输入语音信号,语音编码器(134)包括传输路径(281),用于将多个语音帧传输到语音解码器,语音编码器(134)的特征在于虚拟传输路径(282),用于传输在传输路径(281)中传输的多个语音帧的一个或多个参考,其中,一个或多个参考涉及在传输路径(281)上传输的多个语音帧内的供选择的语音帧,供选择的语音帧在错误接收帧时用作替代帧。该语音通信单元至少提供这样的优点:提供更准确的替代帧机制,由此降低在恢复的语音帧中可以听得到的不想要的人工噪音的风险。

Description

用于语音帧误差降低的语音通信单元和方法
技术领域
本发明涉及语音编码,以及用来在语音通信单元中提高语音编解码器性能的方法。本发明可用于但不仅限于语音编解码器中的误差降低。
背景技术
现有的许多语音通信系统都使用语音处理单元对语音样本进行编码和解码,例如使用蜂窝电话标准的全球移动通信系统(GSM)和私人移动无线电用户使用的陆地中继无线系统(TETRA)。在此类的语音通信系统中,发送单元内的编码器将模拟语音样本转换为匹配的数字格式以供发送。接收单元内的语音解码器将接收到的数字语音信号转换为人耳可听到的模拟语音样本。
由于这些无线语音通信系统中的频谱是很昂贵的资源,为了使每个频带中的用户数目尽可能多,大家都希望能够限制这些语音信号使用的信道带宽。因此,使用语音编码技术的主要目标就是在不损失逼真度的前提下,通过压缩技术尽可能地降低语音样本所占用的容量。
在语音和数据通信系统的情况下,另一种方法就是为语音信号提供比同类的数据信号更少的保护。这种方法会导致语音包比数据包产生较多的误差,同时损失整个语音包的风险会增加。
在语音解码器中,误差降低技术通常用于提高语音通信单元的性能,例如如果发生以下情况:
(i)收到的语音帧中存在过多的比特误差;或者
(ii)基于网际协议(IP)的网络中的数据包(其中可能包括语音信息)损失。
需要“坏帧”降低技术用来尽量减小收到的误差帧,也就是包含误差或损失的帧,对听觉效果的影响。这些技术重现了丢失的语音帧的估计,而不是向解码后的语音插入静音或噪音。这些技术通常要使用语音的统计静态特性。存在误差的单独帧通常可以进行充分地估计,也就是使用来自前帧语音的能量、基音、频谱和清浊音等类似的参数来替代它。然而,语音并不是真正稳态的,例如语音的起始和爆破音是非常短暂的活动。因此,这种简单的“替代”技术有时会导致不自然的、也是不希望有的人工噪音。
在理想环境中,我们希望可以从传输间断的任意一端插入数据,即从坏帧序列前后取走数据,以及在其间插入。然而,由于会引入不需要的延迟,这种方法在语音通信系统中是无法接受的。
如果收到了几个坏帧,那么通常在少数几帧后语音信号的能量就会降低到零。通常应包括“清浊音”参数,因为它可以根据语音是清音还是浊音来改变重复的内容。原则上,对于浊音语音,优选方案就是重复周期性分量。相反地,对于清音语音,优选方案是产生类似的声谱和类似的能量,而不是周期性的。
本发明的发明人已经发觉并认识到使用“替代”帧机制作为坏帧降低策略的局限性。特别地,他们已经意识到只有在极少数情况下,替代帧才会是真正合适的帧。此外,如果收到的大量帧存在误差,这种情况可能频繁出现在无线通信链路质量较差的条件下,那么替代帧机制就会变得更加无法接受。
因此,当使用这样的语音编解码器时,为了至少减少上述的某些缺陷,需要提供一种改进的误差降低技术。
发明内容
本发明的第一部分中,提供了一种语音通信单元,包括能够表示输入语音信号的语音编码器,该语音编码器包括传输路径,用于将多个语音帧传输到语音解码器,该语音编码器的特征在于
缓冲器,用于储存输入语音信号的语音帧;
一个或多个指针,用于指向以前储存在缓冲器中的多个语音帧;以及
附加虚拟传输路径,用于传输指向表现出与在传输路径中传输的当前语音帧具有相似特性并且以前储存在缓冲器中的多个语音帧的一个或多个指针,其中,所述一个或多个指针指向以前在传输路径上传输的多个缓冲了的语音帧内的供选择的语音帧,在错误地接收了当前语音帧时被用作替代帧。
本发明的第二部分中,一种在语音通信单元中降低坏帧误差的方法,所述方法包括如下步骤:
通过语音通信单元中的语音编码器来在传输路径上将多个语音帧传输到语音解码器;
所述方法的特征在于以下步骤:
在缓冲器中储存语音帧;
在附加虚拟传输路径上传输指向表现出与在传输路径中传输的当前语音帧具有相似特性并且以前储存在缓冲器中的多个语音帧的一个或多个指针,其中所述一个或多个指针指向以前在传输路径上传输的多个缓冲了的语音帧内的供选择的语音帧,当错误地接收了当前语音帧时用作替代帧。
总而言之,本发明的目标是提供一种通信单元,它包括语音编解码器和降低坏帧误差的方法,它至少可以减少上述的现有坏帧误差降低技术存在的缺陷中的某几种。如果传输路径中接收到的语音帧存在误差,那么通过在传输路径上传输语音帧,以及使用在虚拟传输路径中传输的参考/指针来给出语音解码器使用的供选择的替代语音帧的方法,就可以达到目标。通过使用在理想情况下应带有不同误差统计(例如分离FEC机制)的另外的虚拟传输路径,参考/指针就不容易受到参考的语音帧的相同误差的影响。此外,缓冲技术被用于编码器中,从先前传输的大量语音帧中选择供选择的语音帧,选中的供选择的语音帧与要参考的语音帧表现出相似的特性。
附图说明
现在通过参考附图来描述示例的实施例,在图中:
图1示出了无线通信单元的框图,它包括语音编码器,适于支持本发明的优选实施例的不同发明概念;
图2示出了码本激励线性预测语音编码器的框图,适于支持本发明的优选实施例的不同发明概念;
图3示出了依照本发明的优选实施例,由可供选择的虚拟传输路径给出的参考机制的使用,由此从大量的其他帧中选中替代帧;和
图4示出了依照本发明的优选实施例,可供选择的虚拟传输路径的增强使用,它用来解决发生在主传输路径中的多误差。
具体实施方式
现在参看图1,示出了无线用户单元的框图,后文称为移动站(MS)100,适于支持本发明的优选实施例的不同发明概念。MS 100包括天线102,优选连接到在MS 100内的接收器和发送器链之间提供隔离的双工滤波器、天线转换开关或循环器104。
如本领域所知,接收器链通常包括扫描接收器前端电路106(有效提供接收、滤波,以及中频或基带频率转换)。扫描前端电路与信号处理功能单元108串联。信号处理功能单元的输出提供给合适的输出装置110,例如经由语音处理单元130的扬声器。
语音处理单元130包括语音编码功能单元134,它将用户语音编码为适合传输媒介传送的格式。语音处理单元130还包括语音编码功能单元132,它将收到的语音解码为适合经由输出装置(扬声器)110输出的格式。语音处理单元130经由控制器114与存储器单元116和计时器118相连接。特别地,语音处理单元130的操作适于支持本发明的优选实施例的发明概念。特别地,语音处理单元130适于从大量先前传输的语音帧中选中替代语音帧。语音处理单元130或信号处理器108可以启动在可选择的虚拟传输路径到主传输路径中的参考/指针信号(给出选中的替代语音帧)的传输。语音处理单元130的适用性将根据图2进一步说明。
出于完整性考虑,接收器链也包括接收信号强度指示器(RSSI)电路112(图示中与扫描接收器前端106相连,尽管RSSI电路112可以位于接收器链中的其他任何位置)。RSSI电路与控制器114相连接,以维护全部的用户单元控制。控制器114也与扫描接收器前端电路106和信号处理功能单元108(通常通过DSP实现)相连接。因此,控制器114可以从恢复信息中接收到误比特率(BER)和误帧率(FER)数据。控制器114与存储器装置116相连以储存操作规则,例如解码/编码函数等等。计时器118通常与控制器114相连,以控制MS 100内操作(时间相关信号的传输与接收)的定时。
在本发明的环境中,计时器118规定了发送(编码)路径和/或接收(解码)路径中的语音信号的定时。
关于发送链,它本质上包括输入装置120,例如经由语音编码器134与发送器/调制电路122相串联的麦克风传感器。此后,任何发送信号经由功率放大器124从天线102发出。通过来自与双工滤波器或循环器104相连的功率放大器的输出,发送器/调制电路122和功率放大器124对控制器作出响应。发送器/调制电路122和扫描接收器前端电路106中包括上变频和下变频功能单元(未示出)。
当然,MS 100中的不同模块可以按照任意合适的、能够利用本发明的发明概念的功能拓扑进行排列。此外,MS 100中的不同模块可以实现为离散或集成的不同模块形态,因此其根本结构只不过是任意的选择。
本发明预期,语音信号优选的缓冲或处理方法可以在软件、固件或硬件中实现,更适宜的方法是采用软件处理器(或者数字信号处理器(DSP))来完成语音处理功能。
现在参看图2,它依照本发明的优选实施例示出了码本激励线性预测(CELP)语音编码器134的框图。待分析的声音输入信号施加于麦克风202上的语音编码器134。然后,输入信号施加于滤波器204。滤波器204通常具有带通滤波器的特性。然而,如果语音带宽已经足够,那么滤波器204可能包含直接的线路连接。
如本领域所知,来自滤波器204的模拟语音信号接着被转换为N脉冲抽样序列,每个脉冲抽样的幅度由模数(A/D)转换器208中的数字代码表示。抽样率由抽样时钟(SC)决定。抽样时钟(SC)随着帧时钟(FC)一起产生。
用输入语音向量s(n)表示的A/D 208的数字输出,可以施加于系数分析器210。如本领域所知,输入语音向量s(n)可以从分离的帧中重复获得,也就是从由帧时钟(FC)决定长度的时间块中获得。
按照本发明的优选实施例,对于每个语音块,通过参数分析器210可以产生线性预测编码(LPC)参数集。产生的语音编码参数可能包括以下部分:LPC参数、长时预测(LTP)参数、激励增益因子(G2)(连同最佳的随机码本激励码字I一起)。这些语音编码参数应用于复用器250,并通过信道发送给解码器中的语音合成器使用。输入语音向量s(n)还应用于减法器230,其功能随后说明。
图2传统的CELP编码器中,为得到用来表示输入语音样本的求和选择激励向量中的最小加权误差,码本搜索控制器240从模块216中的自适应码本与模块214中的随机码本中选择最佳索引和增益。随机码本214和自适应码本216的输出分别输入到增益功能单元222和218中。如本领域所知,增益调整后的输出在加法器220中求和,然后输入到LPC滤波器224中。
首先,计算自适应码本或长时预测分量l(n)。其特征在于延迟和增益因子“G1”。
对于每个单独的随机码本激励矢量ui(n),比较输入语音矢量s(n)产生重构的语音矢量s’i(n)。增益模块222缩放激励增益因子“G2”,求和模块220增加自适应码本分量。这样的增益可以由系数分析器210预先计算并用于分析所有激励矢量,或者可以与搜索最佳激励码字I进行联合优化,最佳激励码字I是由码本搜索控制器240产生的。
然后通过线性预测编码滤波器224对缩放的激励信号G1l(n)+G2ui(n)进行滤波,滤波器224构成了短时预测(STP)滤波器,用以产生重构的语音矢量s’i(n)。用于第i个激励码矢量的重构语音矢量s’i(n)与输入语音矢量s(n)的相同块进行比较,这是通过在减法器230中对这两个信号相减完成的。
差矢量ei(n)表示原始语音块和重构语音块之间的差。差矢量通过加权滤波器232进行感觉加权,使用由系数分析器210产生的加权滤波器参数(WTP)。感觉加权加强了其中的误差对人耳感觉上更重要的频率,而减弱了其他的频率。
码本搜索控制器240内的能量计算器功能单元计算加权差矢量e’i(n)的能量。码本搜索控制器比较用于当前激励矢量ui(n)的第i个误差信号与以前的误差信号,以确定产生最小误差的激励矢量。具有最小误差的第i个激励矢量的码随后在信道上输出作为最佳激励码I。
缩放激励G1l(n)+G2 u1(n)的副本储存在长时预测存储器216中备用。
另外,码本搜索控制器240可以确定特定的码字,该码字提供具有某些预定标准的误差信号,诸如满足预定的误差门限。
典型语音编码单元的更详细的描述可从下面的文献中找到:A.M.Kondoz,“Digital speech coding for low-bit rate communications systems”,John Wiley,1994。
在本发明的优选实施例中,误差降低技术在复用器250之后应用于语音帧。本发明利用了供选择的(优选为并行的)虚拟传输路径282,其用于发送指向在主传输路径281上从编码器发送的以前编码的语音帧的指针。
在本发明的环境中,术语“虚拟”定义为除了支持语音通信的主传输路径之外的传输路径,其假定为从编码器到解码器。“虚拟”传输路径可以位于相同的比特流内,或者在时分复用机制中的相同时间帧或者多帧内,或者经由不同的通信路由,例如在VoIP系统中。通过利用附加的虚拟传输路径,其理想地带有不同的误差统计(例如分离FEC机制),参考/指针将得到与其参考的语音帧相同的误差。
与已知编码配置的一个显著不同是复用操作之后是第二最小化部分。这样的电路估算缓冲内的语音参数数据并选择最接近当前语音帧的一个。
在增强实施例中,并行虚拟传输路径使用与语音编码器在主传输路径中使用的不同的前向误差校正(FEC)保护。这样,通过使用独立的FEC路径,语音数据包经历不同的误差统计。主传输路径和并行的虚拟传输路径之间的差帮助改进对误差的鲁棒性。
复用器250输出数据包/帧到控制以前复用的帧的缓冲器260。解复用器270访问缓冲器260中的复用信号的缓冲帧。此处,解复用器270将激励参数274与LPC参数272分离。注意到,用于产生激励参数的长时预测器的存储器必须与帧开始处的长时预测器216相同。
对于每一复用语音块,由此产生当前帧和以前帧的线性预测编码(LPC)参数集。在本发明的优选实施例中,每个量化LPC参数和激励参数的集合形成了用于缓冲数据的第j个前帧的重构的语音矢量s’j(n)。其通过在减法器262中对这两个信号相减来与前面缓冲的语音矢量s(n)进行比较。
差矢量ej(n)表示原始和前面缓冲的语音块之间的差。差矢量通过LPC加权滤波器264进行感觉加权。如所指出的,感觉加权增强了那些对人耳感觉更重要的误差的频率,而衰减了其他的频率。
码本搜索控制器266内的能量计算器功能单元计算加权差矢量e’j(n)的能量。码本搜索控制器266比较用于当前激励矢量uj(n)的第j个误差信号与前面的误差信号,以确定产生最小误差的激励矢量。码本搜索控制器266随后选择“帧数据的最佳索引”,以提供最小加权误差。编码器随后将指向前帧的“指针”传送到解码器,该前帧被确定为提供其自身与主传输路径中的各个语音帧之间的最小加权误差。
本质上,参考的语音帧(理想地,在时间或帧数量上与当前传输帧不同)构成了特定移动语音窗内最类似于编码器编码的帧(在感觉加权误差的意义上)的帧。因此,如果错误接收了帧,它表示用于误差降低步骤的当前帧的最佳匹配(指针)。这个表示或指针将在下面结合图3更详细地进行描述。
现在参看图3,示出的缓冲定时图300说明了本发明的优选过程。定时图说明帧-0 310已在语音解码器被接收并被确定为错误。解码器然后接入供选择的虚拟传输路径以确定最适合的帧来替代帧-0 310。如图3所示,供选择的虚拟传输路径包括到帧-4 320的指针,作为帧-0 310的优选替代。通过用帧-4 320替代帧-0 310,在语音解码过程中只对语音质量产生了最小的影响。
本发明的发明人认识到并且使用了这样的事实,即前面几帧(通常)都是由相同讲话者说的,即这些语音帧将表现相似的基音和共振峰位置。因此,很有可能找到与当前语音帧相似的以前的语音帧。
根据本发明的优选实施例,通过为每一缓冲帧评估加权分段信噪比(SEGSNR)或者平均加权SNR来找到最小感觉误差,这里在存储器内给定用于每帧的参数集合。优选地,在语音编解码器子帧级别定义分段。
Figure C0381827200141
这个确定是在编码器中完成的。在存在小基音错误的情况下,预计可能得到相当不同的SEGSNR值。这是因为,源语音和缓冲信号可能快速移出相位。因此,在本发明的增强实施例中,建议在缓冲帧的基音周期附近搜索,例如+/-5%,使用子采样(sub-sample)分解(通常是1/3或1/4采样),选择最大的SEGSNR值。
在本发明另一个增强中,如果错误接收了该帧自身,则用于降低该帧坏接收的帧自身将是用于错误接收的当前帧的最佳的语音信息的源,如图4所示。因此,图4说明了指出怎样处理多误差的定时图。来自帧-0 410的数据已知是错误的。建议的降低误差的过程使用了供选择的虚拟传输路径,其将数据帧-4 420指定为合适的替代。但是,数据帧-4 420也被确定为错误的。在此情况下,指针将来自帧-6 430的数据指定为与恶化帧-4 420最相似的帧。因此,帧-6 430用于替代帧-4 420并且适用于替代帧-0 410。这样,就可以处理多帧错误,以克服存储溢出(out-of-memory)参考的问题。
这可能导致参考(指针)最终有效地直通(lead out of)存储窗。但是,如果窗内的错误值通过去除对多参考的需要而得到更新的话,这就不再是个问题。
总之,在供选择的比特流到主比特流中,参考或指针传输到解码器。参考或指针指出了最佳地匹配了当前传输帧的以前传输的帧。参考或指针优选在并行比特流中传输。如果在语音解码器错误接收了帧,就在帧替代误差降低过程中使用参考或指针。因此,通过将已知的在先或后继帧替代机制扩展到多个帧中的任意帧来增强帧误差的降低。在这点上,在过程中使用的帧的数量受到缓冲/存储装置和/或确定最小加权误差帧所需的处理能力的限制。
如所指出的,语音编码器的语音参数的缓冲/存储处理是基于多个帧进行的。例如,在GSM增强全速率(EFR)编解码器(<12kb/秒)的情况中,三秒钟语音的存储量只有5K字节。因此,最难的任务是从150个可能的帧中识别最接近的帧匹配。因此,在本发明一个实施例中,前面提到的最小加权误差选择技术可用于参数子集或用于得自合成语音的参数,而不是语音编码器帧的所有参数。换句话说,可能参考(或指向)LPC滤波器参数(LSF)和合成语音帧的能量(得自在编码器和解码器中都计算的合成语音的语音参数),而不是精确编码器参数,从而节省了存储和比较处理。
在这点上,由于语音帧包括许多参数,建议的技术可在原理上应用于任意数量的参数。在CELP编码器中,这些参数的例子包括:
(i)线谱对(LSP),其表示LPC参数;
(ii)用于子帧-1的长时预测(LTP)滞后;
(iii)用于子帧-1的LTP增益;
(iv)用于子帧-1的码本索引;
(v)用于子帧-1的码本增益;
(vi)用于子帧-2的长时预测滞后;
(vii)用于子帧-2的LTP增益;
(viii)用于子帧-2的码本索引;
(ix)用于子帧-2的码本增益;
(x)用于子帧-3的长时预测滞后;
(xi)用于子帧-3的LTP增益;
(xii)用于子帧-3的码本索引;
(xiii)用于子帧-3的码本增益;
(xiv)用于子帧-4的长时预测滞后;
(xv)用于子帧-4的LTP增益;
(xvi)用于子帧-4的码本增益;或
(xvii)用于子帧-4的码本增益。
以下也在本发明的考虑范围之内,可以参考来自前面帧的LSP集合发送指针,以匹配当前帧的LSP,而不是整个参数集。另外,有可能使指针用于多个上述参数中的每一个。
在无线通信系统中,并行虚拟传输路径优选地包括:在数据有效荷载的未受保护比特内传输块编码参考字(此处7比特足以支持128帧缓冲,相当于约2.5秒)。这可以通过15比特的BCH块码来编码(具有75比特/秒的等效速率),提供多达2比特的误差校正。
另外,可以预计,供选择的虚拟传输路径可能提供误差校正和误差检测功能的组合。误差检测将是有用的,因为参考的不良接收可导致坏的降低。如果不良地接收了参考字,该机制可以默认到前帧接收。75比特/秒的信道速率将只把GSM全速率信道的粗比特率从22.8K比特/秒降低到22.725K比特/秒,这将导致灵敏度的无关紧要的损失。
在另外的实施例中,这如网际协议语音(VoIP)通信链路,供选择的虚拟传输路径可通过发送多包流来获得。虽然在此情况下希望总的流量基本上不会增加,因为这可能会增加掉包率。
优选机制是,只在发生转变并且语音非稳态的情况下,如上所述发送参考到前面的帧。当语音稳态时,并且当现有技术相对工作很好时,不发送参考。这样,分组网络并不过度超载,但是获得了大部分性能增益。语音信号变得静态的程度可以被生成为一个变量,该变量可在丢包的情况下调整为改进再现质量。
解码器功能基本上是编码器功能的反面(不具有复用器后面的附加电路),因此在这里不再赘述。典型语音解码单元的功能的描述可以在以下参考文献中找到:A.M.Kondoz,“Digital speech coding forlow-bit rate communications systems”,John Wiley,1994。在解码器,解码器遵循标准解码过程,直到它确定坏帧。当检测到坏帧时,解码器评估供选择的虚拟传输路径以确定各个参考/指针所指示的供选择的帧。解码器随后接收“相似”帧,如参考/指针传输中所指出的。以前指示的帧随后用于替代接收的帧,以合成语音。
有利的是,在此描述的发明概念可通过从已构造的FEC机制中窃取比特来对现有编解码器进行花样翻新。
应该理解,坏帧误差降低机制如上所述,提供了至少下面的优点:
(i)提供更准确的替代帧机制,由此降低在恢复的语音帧中可听得到的不想要的人工噪音的风险。
(ii)通过例如从已构造的FEC机制中窃取比特,供选择的虚拟传输路径可对现有编解码器进行花样翻新。
(iii)在只在发生转变且语音非稳态的情况下才发送到以前帧的参考时,将使用现有坏帧误差降低技术,由此最少化本发明中所需的任何附加的数据。
(iv)通过交叉参考为特定帧接收的数据且在该机制中参考帧,可检测到错误接收的参数。
尽管优选实施例讨论了本发明对CELP编码器的应用,发明人可以预期,这里所述的发明概念可用于无线通信单元的其他语音处理单元,诸如通用移动电信系统(UMTS)单元、全球移动通信系统(GSM)、陆地中继无线(TETRA)通信单元、信息和信令的数字交换标准(DIIS)或者网际协议语音(VoIP)。
装置发明
一种语音通信单元,包括能够表示输入语音信号的语音编码器。该语音编码器包括传输路径,用于将多个语音帧传输到语音解码器。该语音编码器进一步包括虚拟传输路径,用于传输在传输路径中传输的多个语音帧的一个或多个参考。所述一个或多个参考涉及在传输路径上传输的多个语音帧内的供选择的语音帧,在坏帧时被用作替代帧。
一种语音通信单元,例如上述的具有语音编码器的语音通信单元,包括语音解码器,适于在传输路径上接收多个语音帧以及在虚拟传输路径上接收一个或多个供选择的语音帧参考。所述一个或多个参考涉及在传输路径上接收的多个语音帧内的供选择的语音帧,当坏帧时用作替代帧。
方法发明
一种在语音通信单元中降低坏帧误差的方法,所述方法包括如下步骤:通过语音通信单元中的语音编码器来在传输路径上将多个语音帧传输到语音解码器。语音编码器在虚拟传输路径上传输在传输路径中传输的多个语音帧的一个或多个参考,其中所述一个或多个参考涉及在传输路径上传输的多个语音帧内的供选择的语音帧,当坏帧时用作替代帧。
这样,当错误接收语音帧时,可以从多个语音帧选择改进替代帧。
因此,这里描述了坏帧误差降低技术和相关语音通信单元及电路,基本上降低了已知误差降低技术的上述缺点中的至少某些缺点。

Claims (13)

1.一种语音通信单元(100),包括能够表示输入语音信号的语音编码器(134),该语音编码器(134)包括传输路径(281),用于将多个语音帧传输到语音解码器,该语音编码器(134)的特征在于
缓冲器,用于储存输入语音信号的语音帧;
一个或多个指针,用于指向以前储存在缓冲器中的多个语音帧;以及
附加虚拟传输路径(282),用于传输指向表现出与在传输路径(281)中传输的当前语音帧具有相似特性并且以前储存在缓冲器中的多个语音帧的一个或多个指针,其中,所述一个或多个指针指向以前在传输路径(281)上传输的多个缓冲了的语音帧内的供选择的语音帧,在错误地接收了当前语音帧时被用作替代帧。
2.根据权利要求1所述的语音通信单元(100),其中,语音编码器(134)的进一步的特征在于:
复用器(250),用于复用所述多个语音帧;
所述缓冲器(260),有效连接到所述复用器(250),用以储存复用的语音数据;和
处理器,有效连接到所述缓冲器(260),用于在所述缓冲器(260)中表征当前语音帧,并选择供选择的语音帧,所选中的供选择的语音帧表现了与所述当前语音帧相似的特性,其中,用附加虚拟传输路径(282)将指向所选中的供选择的语音帧的指针传输到解码器。
3.根据权利要求2所述的语音通信单元(100),其中,所述处理器包括解复用器(270),用于访问缓冲器(260)中的一个或多个语音帧,处理器还从缓冲的语音帧的LPC参数(272)中分离激励参数(274),用以选择表现相似特性的所述语音帧。
4.根据任意前面权利要求所述的语音通信单元(100),其中,所述虚拟传输路径(282)包含在传输路径(281)的相同比特流内或者是独立并行传输路径。
5.根据权利要求1-3中任意一项所述的语音通信单元(100),其中,所述传输路径(281)使用第一前向误差校正保护机制,所述附加虚拟传输路径(282)使用不同于在传输路径(281)中使用的第二前向误差校正保护。
6.根据权利要求2或3中任意一项所述的语音通信单元(100),其中,所述处理器选择所述缓冲器中的供选择的替代帧,用以提供与要被替换的帧的最小加权误差。
7.根据权利要求6所述的语音通信单元(100),其中,所述处理器通过为每一缓冲帧评估加权分段信噪比(SEGSNR)或平均加权SNR来确定最小加权误差。
8.根据权利要求6所述的语音通信单元(100),其中,所述处理器确定语音编码参数子集的最小加权误差。
9.根据权利要求6所述的语音通信单元(100),其中,所述处理器基本上在所述缓冲语音帧的基音周期附近搜索,并选择表现出最高SEGSNR值的帧。
10.根据权利要求1-3中任意一项所述的语音通信单元(100),其中,所述供选择的语音帧(320)只在发生转变以及语音非稳态时用作所述当前语音帧的参考。
11.根据权利要求1-3中任意一项所述的语音通信单元(100),其特征在于语音解码器(132),适于在传输路径(281)上接收多个语音帧以及在虚拟传输路径(282)上接收一个或多个供选择的语音帧(320)指针,其中,所述一个或多个指针涉及以前在传输路径(281)上接收的多个语音帧内的供选择的语音帧(320),当错误地接收了帧时用作替代帧。
12.根据权利要求11所述的语音通信单元(100),其中,如果所述供选择的语音帧(420)是错误地接收的,则选择帧(430)作为所述错误地接收的供选择的帧(420)的供选择的帧,用于替代错误地接收的当前语音帧(410)和错误地接收的供选择的语音帧(420)。
13.一种在语音通信单元(100)中降低坏帧误差的方法,所述方法包括如下步骤:
通过语音通信单元(100)中的语音编码器(134)来在传输路径(281)上将多个语音帧传输到语音解码器;
所述方法的特征在于以下步骤:
在缓冲器中储存语音帧;
在附加虚拟传输路径(282)上传输指向表现出与在传输路径(281)中传输的当前语音帧具有相似特性并且以前储存在缓冲器中的多个语音帧的一个或多个指针,其中所述一个或多个指针指向以前在传输路径(281)上传输的多个缓冲了的语音帧内的供选择的语音帧,当错误地接收了当前语音帧时用作替代帧。
CNB038182726A 2002-07-31 2003-05-12 用于语音帧误差降低的语音通信单元和方法 Expired - Lifetime CN100349395C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0217729.3 2002-07-31
GB0217729A GB2391440B (en) 2002-07-31 2002-07-31 Speech communication unit and method for error mitigation of speech frames

Publications (2)

Publication Number Publication Date
CN1672193A CN1672193A (zh) 2005-09-21
CN100349395C true CN100349395C (zh) 2007-11-14

Family

ID=9941443

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038182726A Expired - Lifetime CN100349395C (zh) 2002-07-31 2003-05-12 用于语音帧误差降低的语音通信单元和方法

Country Status (7)

Country Link
EP (1) EP1527440A1 (zh)
JP (1) JP2005534984A (zh)
KR (1) KR20050027272A (zh)
CN (1) CN100349395C (zh)
AU (1) AU2003240644A1 (zh)
GB (1) GB2391440B (zh)
WO (1) WO2004015690A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007018484B4 (de) 2007-03-20 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen
RU2510974C2 (ru) * 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
US20150326884A1 (en) * 2014-05-12 2015-11-12 Silicon Image, Inc. Error Detection and Mitigation in Video Channels

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917835A (en) * 1996-04-12 1999-06-29 Progressive Networks, Inc. Error mitigation and correction in the delivery of on demand audio
WO2002007061A2 (en) * 2000-07-14 2002-01-24 Conexant Systems, Inc. A speech communication system and method for handling lost frames

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI98164C (fi) * 1994-01-24 1997-04-25 Nokia Mobile Phones Ltd Puhekooderin parametrien käsittely tietoliikennejärjestelmän vastaanottimessa
FI950917A (fi) * 1995-02-28 1996-08-29 Nokia Telecommunications Oy Puhekoodausparametrien käsittely tietoliikennejärjestelmässä

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917835A (en) * 1996-04-12 1999-06-29 Progressive Networks, Inc. Error mitigation and correction in the delivery of on demand audio
WO2002007061A2 (en) * 2000-07-14 2002-01-24 Conexant Systems, Inc. A speech communication system and method for handling lost frames
WO2002007061A3 (en) * 2000-07-14 2002-08-22 Conexant Systems Inc A speech communication system and method for handling lost frames

Also Published As

Publication number Publication date
GB0217729D0 (en) 2002-09-11
GB2391440A (en) 2004-02-04
GB2391440B (en) 2005-02-16
KR20050027272A (ko) 2005-03-18
AU2003240644A1 (en) 2004-02-25
JP2005534984A (ja) 2005-11-17
CN1672193A (zh) 2005-09-21
WO2004015690A1 (en) 2004-02-19
EP1527440A1 (en) 2005-05-04

Similar Documents

Publication Publication Date Title
JP3439869B2 (ja) 音声信号合成方法
US5794199A (en) Method and system for improved discontinuous speech transmission
CN100545908C (zh) 用于隐蔽压缩域分组丢失的方法和装置
JP3102015B2 (ja) 音声復号化方法
US5673266A (en) Subsequent frame variable data rate indication method
US8019599B2 (en) Speech codecs
EP0573398B1 (en) C.E.L.P. Vocoder
US7610197B2 (en) Method and apparatus for comfort noise generation in speech communication systems
Jarvinen et al. GSM enhanced full rate speech codec
JP3241962B2 (ja) 線形予測係数信号生成方法
CN1129263C (zh) 分组编码信号的方法和装置
JPH07311598A (ja) 線形予測係数信号生成方法
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP2746033B2 (ja) 音声復号化装置
US20090168673A1 (en) Method and apparatus for detecting and suppressing echo in packet networks
CN1119058A (zh) Tdma无线系统中的软纠错
KR100935174B1 (ko) 고속 코드-벡터 탐색 장치 및 방법
KR20010022187A (ko) 개선된 음성 인코더를 구비한 전송 시스템
AU739176B2 (en) An information coding method and devices utilizing error correction and error detection
JP3459133B2 (ja) 復号器の動作方法
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2004509367A (ja) 複数チャネル信号の符号化及び復号化
US20050143984A1 (en) Multirate speech codecs
EP1241664A2 (en) Voice encoding/decoding apparatus with packet error resistance and method thereof
US6871175B2 (en) Voice encoding apparatus and method therefor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MOTOROLA MOBILE CO., LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110107

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20110107

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY, Inc.

Address before: Illinois, USA

Patentee before: Motorola, Inc.

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY, Inc.

TR01 Transfer of patent right

Effective date of registration: 20160310

Address after: California, USA

Patentee after: Google Technology Holdings LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY LLC

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20071114