CN1262577A - 无线语音信道上发送数据的方法 - Google Patents
无线语音信道上发送数据的方法 Download PDFInfo
- Publication number
- CN1262577A CN1262577A CN00101021A CN00101021A CN1262577A CN 1262577 A CN1262577 A CN 1262577A CN 00101021 A CN00101021 A CN 00101021A CN 00101021 A CN00101021 A CN 00101021A CN 1262577 A CN1262577 A CN 1262577A
- Authority
- CN
- China
- Prior art keywords
- voice
- vocoder
- signal
- output
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 9
- 230000003044 adaptive effect Effects 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 8
- 230000005284 excitation Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000000205 computational method Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmitters (AREA)
Abstract
通过设定相应码本的增益为零,非语音信息送出到分配给一个或两个码本输出的位中。设定该增益为零,码本输出不再由接收的声码器解释。按照这个方法,就可以发送这样的附加信息,它对于声码器是完全透明的。这种送出“秘密”消息技术的应用包括,但不限制于,发送用于产生非语音信号的参量。作为一个例子,产生呼叫等待音调,DTMF,或TTY/TDD字符的信息可以隐藏在压缩的位流中,所以可再生这些非语音音调。
Description
本发明涉及电信系统;具体涉及无线语音信道上发送数据。
话音编码器/解码器(声码器)用于压缩话音信号,以减小通信信道上的传输带宽。通过减小每个呼叫的带宽,就可以在相同的信道上安排更多的呼叫。存在这样一类声码器,称之为代码激励线性预测(CELP)声码器。在这些声码器中,语音是用一连串滤波器作为模型。可以用远远少于原始语音的位发送这些滤波器的参量。还需要发送输入(或激励)给这些滤波器以再现原始语音。因为直接发送激励需要太多的带宽,利用少量的非零脉冲代替激励作粗略的近似。可以利用很少的位发送这些脉冲的位置,且作为原始激励的这个粗略近似适合于再现高质量语音。该激励用固定码本贡献和相关的增益代表。此外,语音中找到的准周期性是用自适应码本输出和相关的增益代表。发送固定码本输出及其相关的增益,自适应码本输出及其相关的增益,和滤波器参量(也称之为线性预测编码器参量)以代表编码语音信号。
声码器最初设计成用于压缩语音,把它的特征做成模型和用远远少于发送语音本身的位发送该模型的参量。随着无线电话越来越普遍,人们越来越期望在他们已使用传统陆线电话时非语音应用的相同范围内利用无线电话,例如,访问话音邮件和接收呼叫等待音调。最近,FCC强制规定,听力故障者的文字电话(TTY/TDD)与数字蜂窝式电话相容。非语音应用的问题是,它们不适合声码器的语音模型。当非语音信号通过声码器时,不能总可以接受解码的结果。当无线电话工作在容易发生差错的环境下,这个问题就变得更加严重。为了从传输差错中恢复过来,声码器依赖于语音模型从随机的差错中恢复。非语音信号又一次不能与这个模型匹配,所以再现是不适当的。
通过设定相应码本的增益为零,本发明送出信息到分配给一个或两个码本输出的位中。设定该增益为零,码本输出不再由接收的声码器解释。按照这个方法,就可以发送这样的附加信息,它对于声码器是完全透明的。这种送出“秘密”消息技术的应用包括,但不限制于,发送用于产生非语音信号的参量。作为一个例子,产生呼叫等待音调,DTMF,或TTY/TDD字符的信息可以隐藏在压缩的位流中,所以可再生这些非语音音调。
图1是一个典型声码器的方框图;
图2举例说明声码器10中编码器14的主要功能;和
图3是声码器10中解码器20的功能方框图。
图1表示一个典型声码器的方框图。声码器10接收输入端12上的数字化语音。该数字化语音是已通过模数转换器的模拟语音信号,且已被分成若干帧,每帧通常为20毫秒量级。让输入端12上的信号通过编码语音的编码器部分14,为的是减小用于发送该语音的带宽量。使编码语音出现在输出端16上。编码语音被通信信道另一端上类似的声码器中解码部分接收。通信信道另一端上的解码器类似或等同于声码器10中的解码器部分。编码语音通过输入端18被声码器10接收,且让它通过解码器部分20。解码器部分20利用从发送声码器接收到的编码信号在输出端22上产生数字化语音。
声码器在通信技术中是熟知的。例如,在Bishnu S.Atal,VladimirCuperman,和Allen Gersho编辑的“无线和网络应用中的语音和声频编码”中描述声码器,1993年,Kluwer科学出版社。可以到处购买到由一些公司制造的声码器,诸如,美国加州San Diego的Qualcomm公司,和新泽西州Murray Hill的Lucent Technologies公司。
图2举例说明声码器10中编码器14的主要功能。数字化语音信号在输入端12被接收,且通过线性预测编码器40。线性预测编码器40每帧一次完成输入语音的线性预测分析。线性预测分析在通信技术中是熟知的,根据输入的语音信号产生声域的线性预测合成模型。描述这个模型的线性预测参量或系数作为编码语音信号的一部分通过输出端16发送。编码器40利用这个模型产生代表激励的剩余语音信号,该模型利用它再现输入语音信号。剩余语音信号出现在输出端42。来自输出端42的剩余语音提供给开环音调搜索单元50的输入端48,自适应码本单元72的输入端和固定码本单元82。
脉冲响应单元60从编码器40接收线性预测参量,并产生在编码器40中产生该模型的脉冲响应。这个脉冲响应是用于自适应码本单元和固定码本单元。
开环音调搜索单元50利用来自编码器40的剩余语音信号给其音调做模型,并在输出端52给出一个音调,通常称之为音调周期或音调延迟信号。来自输出端52的音调延迟信号和来自脉冲响应单元60输出端64的脉冲响应信号被自适应码本单元72的输入端70接收。自适应码本单元72产生音调增益输出和音调索引输出,它们成为声码器10的编码语音输出16的一部分。自适应码本72的输出74还提供音调增益信号和音调索引信号给固定码本单元82的输入端80。此外,自适应码本72提供激励信号和自适应码本目标信号给输入端80。
利用来自输入端12的数字化语音信号和线性预测编码器40产生的剩余语音信号,自适应码本72产生其输出。自适应码本72利用数字化语音信号和线性预测编码器40的剩余语音信号形成自适应码本目标信号。自适应码本目标信号是用作固定码本82的输入和作为计算的输入,该计算产生自适应码本单元72的音调增益,音调索引和激励输出。此外,自适应码本目标信号,来自开环音调搜索单元50的音调延迟信号,和脉冲响应单元60的脉冲响应是用于产生音调索引,音调增益和激励信号,这些信号通过固定码本单元82。这些信号的计算方法在声码器技术中是熟知的。
固定码本82利用从输入端80接收到的输入产生固定增益输出和固定索引输出,这些输出是用作输出端16上编码语音的一部分。固定码本单元试图对线性预测编码器40剩余语音信号的随机部分做模型。通过确定当前自适应码本目标信号与剩余语音信号之间的误差,产生固定码本搜索的目标。固定码本搜索产生激励脉冲的固定增益和固定索引信号,使这个误差减至最小。利用自适应码本单元72的输出计算固定增益和固定索引信号,这种计算方法在声码器技术中是熟知的。
开关90和92是用于送出代替位的数据,这些位分别用于送出固定码本输出和自适应码本输出。当开关的接触点在位置“A”时,相关的码本输出被数据或其他信息代替,相关的码本增益设定为零或基本上为零。因此,在接收机上产生的定标码本输出或激励为零或基本上为零,所以不会对接收声码器正在使用的滤波器产生不利的影响,该声码器对正常发送的语音做模型。
图3表示声码器10中解码器20的功能方框图。编码语音信号在解码器20的输入端18被接收。该编码语音信号被解码器100接收。解码器100分别产生对应于固定索引信号和音调索引信号的固定和自适应代码矢量。这些代码矢量与音调增益信号和固定增益信号一起通过单元110的激励结构部分。音调增益信号是用于定标利用音调索引信号产生的自适应矢量,而固定增益信号是用于定标利用固定索引信号得到的固定矢量。解码器100把线性预测代码参量传送给单元110的滤波器或模型合成部分。然后,单元110利用定标矢量激励滤波器,该滤波器是利用线性预测编码器40产生的线性预测系数合成的,并产生一个输出信号,该输出信号代表在输入端12上原先接收到的数字化语音。或者,可以利用后置滤波器给在输出端20上产生的数字化语音信号频谱整形。
当发送的是数据而不是语音信息时,利用音调索引(自适应码本输出)和/或固定索引(固定码本输出)接收该数据。消除了非数据信号对由单元110合成的滤波器的影响,因为与音调或代码索引相关的增益值为零。
可以用各种形式实现这些功能方框图。每个功能块可以是利用微处理器或微计算机分别地实现的,或者它们可以是利用单个微处理器或微计算机实现的。还可以利用从上述制造商或其他半导体制造商得到的可编程数字信号处理器件或专用器件实现每个或全部功能块。
Claims (5)
1.一种在语音信道上发送非语音信息的方法,其特征是,包括以下步骤:
发送非语音信息替代音调索引信息;和
发送音调增益值,该值基本上为零。
2.按照权利要求1的方法,其特征是,非语音信息是DTMF信息。
3.按照权利要求1的方法,其特征是,非语音信息是TTY/TDD信息。
4.一种在语音信道上发送非语音信息的方法,其特征是,包括以下步骤:
发送第一非语音信息替代固定索引信息;和
发送索引增益值,该值基本上为零。
5.按照权利要求4的方法,其特征是,还包括以下步骤:
发送第二非语音信息替代音调索引信息;和
发送音调增益值,该值基本上为零。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22810299A | 1999-01-11 | 1999-01-11 | |
US09/228,102 | 1999-01-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1262577A true CN1262577A (zh) | 2000-08-09 |
Family
ID=22855803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN00101021A Pending CN1262577A (zh) | 1999-01-11 | 2000-01-10 | 无线语音信道上发送数据的方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1020848A2 (zh) |
JP (1) | JP2000209663A (zh) |
KR (1) | KR20000053407A (zh) |
CN (1) | CN1262577A (zh) |
AU (1) | AU6533799A (zh) |
BR (1) | BR0000002A (zh) |
CA (1) | CA2293165A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002039762A2 (en) * | 2000-11-07 | 2002-05-16 | Ericsson Inc. | Method of and apparatus for detecting tty type calls in cellular systems |
US7310596B2 (en) | 2002-02-04 | 2007-12-18 | Fujitsu Limited | Method and system for embedding and extracting data from encoded voice code |
JP4330346B2 (ja) * | 2002-02-04 | 2009-09-16 | 富士通株式会社 | 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム |
US7932851B1 (en) * | 2002-10-15 | 2011-04-26 | Itt Manufacturing Enterprises, Inc. | Ranging signal structure with hidden acquisition code |
US7970606B2 (en) | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
US7634399B2 (en) | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
EP1455509A3 (de) * | 2003-03-03 | 2005-01-05 | FREQUENTIS GmbH | Verfahren und Anordnung zur Sprachaufzeichnung |
US8359197B2 (en) | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
FR2859566B1 (fr) | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
US7752039B2 (en) * | 2004-11-03 | 2010-07-06 | Nokia Corporation | Method and device for low bit rate speech coding |
DE102007007627A1 (de) * | 2006-09-15 | 2008-03-27 | Rwth Aachen | Steganographie in digitalen Signal-Codierern |
US8036886B2 (en) | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
-
1999
- 1999-12-17 AU AU65337/99A patent/AU6533799A/en not_active Abandoned
- 1999-12-30 CA CA002293165A patent/CA2293165A1/en not_active Abandoned
-
2000
- 2000-01-03 BR BR0000002-7A patent/BR0000002A/pt not_active Application Discontinuation
- 2000-01-06 EP EP00300042A patent/EP1020848A2/en not_active Withdrawn
- 2000-01-07 KR KR1020000000557A patent/KR20000053407A/ko not_active Application Discontinuation
- 2000-01-10 CN CN00101021A patent/CN1262577A/zh active Pending
- 2000-01-11 JP JP2766A patent/JP2000209663A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
BR0000002A (pt) | 2002-01-02 |
AU6533799A (en) | 2000-07-13 |
JP2000209663A (ja) | 2000-07-28 |
CA2293165A1 (en) | 2000-07-11 |
KR20000053407A (ko) | 2000-08-25 |
EP1020848A2 (en) | 2000-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6615169B1 (en) | High frequency enhancement layer coding in wideband speech codec | |
KR100923891B1 (ko) | 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치 | |
US5995923A (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
KR100575193B1 (ko) | 적응 포스트필터를 포함하는 디코딩 방법 및 시스템 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
WO2001059757A2 (en) | Method and apparatus for compression of speech encoded parameters | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
AU730987B2 (en) | Combined speech coder and echo canceler | |
CN1262577A (zh) | 无线语音信道上发送数据的方法 | |
AU2008221657B2 (en) | Method and arrangement for smoothing of stationary background noise | |
US7587312B2 (en) | Method and apparatus for pitch modulation and gender identification of a voice signal | |
AU6203300A (en) | Coded domain echo control | |
JP2003533902A5 (zh) | ||
Choudhary et al. | Study and performance of amr codecs for gsm | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
EP1527440A1 (en) | Speech communication unit and method for error mitigation of speech frames | |
Macario et al. | Speech Coding | |
Kulakcherla | Non linear adaptive filters for echo cancellation of speech coded signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |