CN1262577A

CN1262577A - 无线语音信道上发送数据的方法

Info

Publication number: CN1262577A
Application number: CN00101021A
Authority: CN
Inventors: 史蒂文·A·博诺; 迈克尔·C·里乔恩
Original assignee: Lucent Technologies Inc
Current assignee: Nokia of America Corp
Priority date: 1999-01-11
Filing date: 2000-01-10
Publication date: 2000-08-09
Also published as: BR0000002A; AU6533799A; JP2000209663A; CA2293165A1; KR20000053407A; EP1020848A2

Abstract

通过设定相应码本的增益为零,非语音信息送出到分配给一个或两个码本输出的位中。设定该增益为零,码本输出不再由接收的声码器解释。按照这个方法,就可以发送这样的附加信息,它对于声码器是完全透明的。这种送出“秘密”消息技术的应用包括,但不限制于,发送用于产生非语音信号的参量。作为一个例子,产生呼叫等待音调,DTMF,或TTY/TDD字符的信息可以隐藏在压缩的位流中,所以可再生这些非语音音调。

Description

无线语音信道上发送数据的方法

本发明涉及电信系统；具体涉及无线语音信道上发送数据。

话音编码器/解码器(声码器)用于压缩话音信号，以减小通信信道上的传输带宽。通过减小每个呼叫的带宽，就可以在相同的信道上安排更多的呼叫。存在这样一类声码器，称之为代码激励线性预测(CELP)声码器。在这些声码器中，语音是用一连串滤波器作为模型。可以用远远少于原始语音的位发送这些滤波器的参量。还需要发送输入(或激励)给这些滤波器以再现原始语音。因为直接发送激励需要太多的带宽，利用少量的非零脉冲代替激励作粗略的近似。可以利用很少的位发送这些脉冲的位置，且作为原始激励的这个粗略近似适合于再现高质量语音。该激励用固定码本贡献和相关的增益代表。此外，语音中找到的准周期性是用自适应码本输出和相关的增益代表。发送固定码本输出及其相关的增益，自适应码本输出及其相关的增益，和滤波器参量(也称之为线性预测编码器参量)以代表编码语音信号。

声码器最初设计成用于压缩语音，把它的特征做成模型和用远远少于发送语音本身的位发送该模型的参量。随着无线电话越来越普遍，人们越来越期望在他们已使用传统陆线电话时非语音应用的相同范围内利用无线电话，例如，访问话音邮件和接收呼叫等待音调。最近，FCC强制规定，听力故障者的文字电话(TTY/TDD)与数字蜂窝式电话相容。非语音应用的问题是，它们不适合声码器的语音模型。当非语音信号通过声码器时，不能总可以接受解码的结果。当无线电话工作在容易发生差错的环境下，这个问题就变得更加严重。为了从传输差错中恢复过来，声码器依赖于语音模型从随机的差错中恢复。非语音信号又一次不能与这个模型匹配，所以再现是不适当的。

通过设定相应码本的增益为零，本发明送出信息到分配给一个或两个码本输出的位中。设定该增益为零，码本输出不再由接收的声码器解释。按照这个方法，就可以发送这样的附加信息，它对于声码器是完全透明的。这种送出“秘密”消息技术的应用包括，但不限制于，发送用于产生非语音信号的参量。作为一个例子，产生呼叫等待音调，DTMF，或TTY/TDD字符的信息可以隐藏在压缩的位流中，所以可再生这些非语音音调。

图1是一个典型声码器的方框图；

图2举例说明声码器10中编码器14的主要功能；和

图3是声码器10中解码器20的功能方框图。

图1表示一个典型声码器的方框图。声码器10接收输入端12上的数字化语音。该数字化语音是已通过模数转换器的模拟语音信号，且已被分成若干帧，每帧通常为20毫秒量级。让输入端12上的信号通过编码语音的编码器部分14，为的是减小用于发送该语音的带宽量。使编码语音出现在输出端16上。编码语音被通信信道另一端上类似的声码器中解码部分接收。通信信道另一端上的解码器类似或等同于声码器10中的解码器部分。编码语音通过输入端18被声码器10接收，且让它通过解码器部分20。解码器部分20利用从发送声码器接收到的编码信号在输出端22上产生数字化语音。

声码器在通信技术中是熟知的。例如，在Bishnu S.Atal，VladimirCuperman，和Allen Gersho编辑的“无线和网络应用中的语音和声频编码”中描述声码器，1993年，Kluwer科学出版社。可以到处购买到由一些公司制造的声码器，诸如，美国加州San Diego的Qualcomm公司，和新泽西州Murray Hill的Lucent Technologies公司。

图2举例说明声码器10中编码器14的主要功能。数字化语音信号在输入端12被接收，且通过线性预测编码器40。线性预测编码器40每帧一次完成输入语音的线性预测分析。线性预测分析在通信技术中是熟知的，根据输入的语音信号产生声域的线性预测合成模型。描述这个模型的线性预测参量或系数作为编码语音信号的一部分通过输出端16发送。编码器40利用这个模型产生代表激励的剩余语音信号，该模型利用它再现输入语音信号。剩余语音信号出现在输出端42。来自输出端42的剩余语音提供给开环音调搜索单元50的输入端48，自适应码本单元72的输入端和固定码本单元82。

脉冲响应单元60从编码器40接收线性预测参量，并产生在编码器40中产生该模型的脉冲响应。这个脉冲响应是用于自适应码本单元和固定码本单元。

开环音调搜索单元50利用来自编码器40的剩余语音信号给其音调做模型，并在输出端52给出一个音调，通常称之为音调周期或音调延迟信号。来自输出端52的音调延迟信号和来自脉冲响应单元60输出端64的脉冲响应信号被自适应码本单元72的输入端70接收。自适应码本单元72产生音调增益输出和音调索引输出，它们成为声码器10的编码语音输出16的一部分。自适应码本72的输出74还提供音调增益信号和音调索引信号给固定码本单元82的输入端80。此外，自适应码本72提供激励信号和自适应码本目标信号给输入端80。

利用来自输入端12的数字化语音信号和线性预测编码器40产生的剩余语音信号，自适应码本72产生其输出。自适应码本72利用数字化语音信号和线性预测编码器40的剩余语音信号形成自适应码本目标信号。自适应码本目标信号是用作固定码本82的输入和作为计算的输入，该计算产生自适应码本单元72的音调增益，音调索引和激励输出。此外，自适应码本目标信号，来自开环音调搜索单元50的音调延迟信号，和脉冲响应单元60的脉冲响应是用于产生音调索引，音调增益和激励信号，这些信号通过固定码本单元82。这些信号的计算方法在声码器技术中是熟知的。

固定码本82利用从输入端80接收到的输入产生固定增益输出和固定索引输出，这些输出是用作输出端16上编码语音的一部分。固定码本单元试图对线性预测编码器40剩余语音信号的随机部分做模型。通过确定当前自适应码本目标信号与剩余语音信号之间的误差，产生固定码本搜索的目标。固定码本搜索产生激励脉冲的固定增益和固定索引信号，使这个误差减至最小。利用自适应码本单元72的输出计算固定增益和固定索引信号，这种计算方法在声码器技术中是熟知的。

开关90和92是用于送出代替位的数据，这些位分别用于送出固定码本输出和自适应码本输出。当开关的接触点在位置“A”时，相关的码本输出被数据或其他信息代替，相关的码本增益设定为零或基本上为零。因此，在接收机上产生的定标码本输出或激励为零或基本上为零，所以不会对接收声码器正在使用的滤波器产生不利的影响，该声码器对正常发送的语音做模型。

图3表示声码器10中解码器20的功能方框图。编码语音信号在解码器20的输入端18被接收。该编码语音信号被解码器100接收。解码器100分别产生对应于固定索引信号和音调索引信号的固定和自适应代码矢量。这些代码矢量与音调增益信号和固定增益信号一起通过单元110的激励结构部分。音调增益信号是用于定标利用音调索引信号产生的自适应矢量，而固定增益信号是用于定标利用固定索引信号得到的固定矢量。解码器100把线性预测代码参量传送给单元110的滤波器或模型合成部分。然后，单元110利用定标矢量激励滤波器，该滤波器是利用线性预测编码器40产生的线性预测系数合成的，并产生一个输出信号，该输出信号代表在输入端12上原先接收到的数字化语音。或者，可以利用后置滤波器给在输出端20上产生的数字化语音信号频谱整形。

当发送的是数据而不是语音信息时，利用音调索引(自适应码本输出)和/或固定索引(固定码本输出)接收该数据。消除了非数据信号对由单元110合成的滤波器的影响，因为与音调或代码索引相关的增益值为零。

可以用各种形式实现这些功能方框图。每个功能块可以是利用微处理器或微计算机分别地实现的，或者它们可以是利用单个微处理器或微计算机实现的。还可以利用从上述制造商或其他半导体制造商得到的可编程数字信号处理器件或专用器件实现每个或全部功能块。

Claims

1.一种在语音信道上发送非语音信息的方法，其特征是，包括以下步骤：

发送非语音信息替代音调索引信息；和

发送音调增益值，该值基本上为零。

2.按照权利要求1的方法，其特征是，非语音信息是DTMF信息。

3.按照权利要求1的方法，其特征是，非语音信息是TTY/TDD信息。

4.一种在语音信道上发送非语音信息的方法，其特征是，包括以下步骤：

发送第一非语音信息替代固定索引信息；和

发送索引增益值，该值基本上为零。

5.按照权利要求4的方法，其特征是，还包括以下步骤：

发送第二非语音信息替代音调索引信息；和

发送音调增益值，该值基本上为零。