JPH02155313A - 符号化方法 - Google Patents
符号化方法Info
- Publication number
- JPH02155313A JPH02155313A JP1270498A JP27049889A JPH02155313A JP H02155313 A JPH02155313 A JP H02155313A JP 1270498 A JP1270498 A JP 1270498A JP 27049889 A JP27049889 A JP 27049889A JP H02155313 A JPH02155313 A JP H02155313A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- voice
- encoding
- code book
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000003044 adaptive effect Effects 0.000 claims abstract description 9
- 238000013139 quantization Methods 0.000 claims description 8
- 230000001052 transient effect Effects 0.000 abstract description 2
- 238000012935 Averaging Methods 0.000 abstract 1
- 230000007774 longterm Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 102100036432 Calcineurin subunit B type 2 Human genes 0.000 description 2
- 101710158087 Calcineurin subunit B type 2 Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 102000003712 Complement factor B Human genes 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/008—Vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明はディジタル音声符号化に関し、さらに具体的に
は、低ビット・レート音声符号化に関するものである。
は、低ビット・レート音声符号化に関するものである。
B、従来技術
音声サンプルのブロックがテーブル・アドレス及び利得
ファクタに符号化される低ビット・レート符号化手法が
提案されている。そのようなコーグはベクトル量子化コ
ーグと呼ばれる。関連の符号化形式についてさらに参照
したい場合は、1987年の音響、音声及び信号処理に
関する国際会議(ICASSP)でのJ、P、アドウル
(Adoul)等によるFast Code−Exci
ted LinearPrediction (CEL
P) Coding Ba5ed on A1gebr
aicCodes″、及び1985年のICASSPで
のM。
ファクタに符号化される低ビット・レート符号化手法が
提案されている。そのようなコーグはベクトル量子化コ
ーグと呼ばれる。関連の符号化形式についてさらに参照
したい場合は、1987年の音響、音声及び信号処理に
関する国際会議(ICASSP)でのJ、P、アドウル
(Adoul)等によるFast Code−Exci
ted LinearPrediction (CEL
P) Coding Ba5ed on A1gebr
aicCodes″、及び1985年のICASSPで
のM。
R,シュローダ(Schroeder )及びB、S、
アタル(Atal)によるCode−Excited
LinearPrediction (CELP) H
igh−quality 5peech atLow
Bit Rates″を参照することができる。
アタル(Atal)によるCode−Excited
LinearPrediction (CELP) H
igh−quality 5peech atLow
Bit Rates″を参照することができる。
CELPコーダコー質ならびにその性能が、特にテーブ
ルの内容に依存することは明らかである。
ルの内容に依存することは明らかである。
このテーブル内容(すなわち、コードブック)には通常
、統計的に設定されたコードワードがロードされ、この
ことはすぐれたトレードオフをもたらすが、状況ごとの
最適な解決法でないことは確かである。
、統計的に設定されたコードワードがロードされ、この
ことはすぐれたトレードオフをもたらすが、状況ごとの
最適な解決法でないことは確かである。
C0発明の要旨
本発明の1つの目的は、CELPコードブックの内容を
動的に最適化するための手法を提供することである。
動的に最適化するための手法を提供することである。
D、実施例
本発明は任意のベクトル量子化手法に適用されるもので
はあるが、CELPと長期予測を組み合わせる符号化ア
ーキテクチャに特に適している。
はあるが、CELPと長期予測を組み合わせる符号化ア
ーキテクチャに特に適している。
符号喚起線形予測(CELP)符号化を長期予測と組み
合わせる効率的な方法は、1988年3月8日に出願さ
れた関連米国特許願第88480006.1号で既に提
案されている。その基本原理を、それぞれ符号する化及
び相関する復号について、第1図及び第2図を参照して
ここで要約する。
合わせる効率的な方法は、1988年3月8日に出願さ
れた関連米国特許願第88480006.1号で既に提
案されている。その基本原理を、それぞれ符号する化及
び相関する復号について、第1図及び第2図を参照して
ここで要約する。
符号化に従って、音声信号s (n)はまず、実行され
たいわゆる短期解析により、適応予測機構A(Z)(1
0)内へ相関解除(濾過)され、その係数(ai)は事
前に強調されたs (n)から得られ、残余信号r (
n)を生じる。予測された残余rp(n)が装置(11
)でr (n)から減算されてエラー残余信号e (n
)を発生し、e(n)はさらにCBLP+−ダ(12)
内でサンプルのブロックまたはサブブロックにより、各
ブロックまたはサブブロックについてテーブル・アドレ
ス(k)及び利得ファクタ(G)に符号化される。要約
すると、CELPコーダコークトル量子化(VQ)探索
装置及びコードブック(CB)を含む。そこでの符号化
はサンプルのブロック単位で行なわれ、符号化されるe
(n)ブロックに最もよく適合するコードブック・ブ
ロック記憶サンプル(すなわち、コードワード)を見つ
けることを含む。最もよく適合するというのは、ここで
は、利得ファクタGがコードワードと、CELP符号化
されるe (n)サンプル・ブロックの間で考慮される
と仮定すると、最小の入城ブロック差エネルギー(平均
2乗誤差)を発生することを意味する。次に、コーグC
(13)内でコードワード・アドレスk及び利得Gを単
に符号化/量子化するだけでよい。チューリッヒにおけ
るディジタル通信に関する1974年の国際セミナーで
A。
たいわゆる短期解析により、適応予測機構A(Z)(1
0)内へ相関解除(濾過)され、その係数(ai)は事
前に強調されたs (n)から得られ、残余信号r (
n)を生じる。予測された残余rp(n)が装置(11
)でr (n)から減算されてエラー残余信号e (n
)を発生し、e(n)はさらにCBLP+−ダ(12)
内でサンプルのブロックまたはサブブロックにより、各
ブロックまたはサブブロックについてテーブル・アドレ
ス(k)及び利得ファクタ(G)に符号化される。要約
すると、CELPコーダコークトル量子化(VQ)探索
装置及びコードブック(CB)を含む。そこでの符号化
はサンプルのブロック単位で行なわれ、符号化されるe
(n)ブロックに最もよく適合するコードブック・ブ
ロック記憶サンプル(すなわち、コードワード)を見つ
けることを含む。最もよく適合するというのは、ここで
は、利得ファクタGがコードワードと、CELP符号化
されるe (n)サンプル・ブロックの間で考慮される
と仮定すると、最小の入城ブロック差エネルギー(平均
2乗誤差)を発生することを意味する。次に、コーグC
(13)内でコードワード・アドレスk及び利得Gを単
に符号化/量子化するだけでよい。チューリッヒにおけ
るディジタル通信に関する1974年の国際セミナーで
A。
クロアシール(Croisier )により発表された
”Progress in PCM and Delt
a Modulation :Block Compa
nded Coding of 5peech Sig
nal″でA、クロアシールにより提案されたブロック
・コンパンデッドPCM (BCPCM)手法を使用し
て、装置13の機能を実行することができる。
”Progress in PCM and Delt
a Modulation :Block Compa
nded Coding of 5peech Sig
nal″でA、クロアシールにより提案されたブロック
・コンパンデッドPCM (BCPCM)手法を使用し
て、装置13の機能を実行することができる。
選択されたコードワードはまた装置π(14)で復号さ
れて、復号されたエラー残余信号e゛(n)を発生し、
e ’ (n)は長期予測(LTP)ループに供給され
て、予測された残余信号rp(n)を提供する。そのた
めに、ピッチ・ハーモニック値M及び利得または比率フ
ァクタBが装置15内で計算され、M長遅延線及びB乗
算装置(図示せず)を含むフィルタ(16)を同調させ
るため使用される。上記フィルタ(16)には信号r
’ (n)=rl (n)+e ’ (n)が供給され
る。
れて、復号されたエラー残余信号e゛(n)を発生し、
e ’ (n)は長期予測(LTP)ループに供給され
て、予測された残余信号rp(n)を提供する。そのた
めに、ピッチ・ハーモニック値M及び利得または比率フ
ァクタBが装置15内で計算され、M長遅延線及びB乗
算装置(図示せず)を含むフィルタ(16)を同調させ
るため使用される。上記フィルタ(16)には信号r
’ (n)=rl (n)+e ’ (n)が供給され
る。
最終的にCELP/LTP符号化されたs (n)は、
いくつかのG1に181M、及び−組のPARCOR関
連係数aiを含む。
いくつかのG1に181M、及び−組のPARCOR関
連係数aiを含む。
復号された5(n)、すなわち、S“(n)を回復する
ためなされる復号動作を、第2図に概略的に示す。コー
ドワード・アドレスには、ローカル・コードブックをア
ドレスし、そこから選択されたコードワードCB (k
)を取り出すため使用される。上記コードワードはGを
乗算されてデコーダ’iC”(21)に置かれ、復号さ
れたエラー残余信号e′(n)を発生する。
ためなされる復号動作を、第2図に概略的に示す。コー
ドワード・アドレスには、ローカル・コードブックをア
ドレスし、そこから選択されたコードワードCB (k
)を取り出すため使用される。上記コードワードはGを
乗算されてデコーダ’iC”(21)に置かれ、復号さ
れたエラー残余信号e′(n)を発生する。
e ” (n)=G−CB (k)
B及びMは、加算機tl(23)に供給するフィルタ(
22)を同調するため使用され、加算機構(23)はe
’(n)を供給されて、復号された残余r’(n)を発
生し、次いで、r’(n)は、ローダにより供給される
一組の係数aiと同調された逆適合予測機tA!(25
)により濾過される。
22)を同調するため使用され、加算機構(23)はe
’(n)を供給されて、復号された残余r’(n)を発
生し、次いで、r’(n)は、ローダにより供給される
一組の係数aiと同調された逆適合予測機tA!(25
)により濾過される。
ローダ/デコーダの係数がコードブックの内容に密接に
依存していることは明らかである。当技術によれば、両
方のコードブックは、一定の、統計的にセットアツプさ
れたコードワードを記憶させられる。本発明は、コード
ブックの内容を動的話者依存性にすることによりコード
ブックの内容を最適化するための手段を提供する。コー
ドブックの調整は、受信停止方式、すなわち、ローダ及
びデコーダが独立して動作する方式か、または伝送処理
中での協調方式のいずれかで行なわれる。
依存していることは明らかである。当技術によれば、両
方のコードブックは、一定の、統計的にセットアツプさ
れたコードワードを記憶させられる。本発明は、コード
ブックの内容を動的話者依存性にすることによりコード
ブックの内容を最適化するための手段を提供する。コー
ドブックの調整は、受信停止方式、すなわち、ローダ及
びデコーダが独立して動作する方式か、または伝送処理
中での協調方式のいずれかで行なわれる。
本発明に関連する原理を示すブロック線図を第3図に示
す。図示のように、入力はe’(n)及びr’(n)の
両方と共にCELPコーダコー給されている。
す。図示のように、入力はe’(n)及びr’(n)の
両方と共にCELPコーダコー給されている。
その結果、符号化/復号の流れ図が第4図に従って作成
される。
される。
音声信号解析(符号化)の場合は、入力信号は短期予測
機構により濾過され、その伝達関数はA(Z)により2
領域で表現され、第1残余信号r(n)を供給する。第
2の残余またはエラー残余e (n)は上記第1の残余
r(n)、及び前に再構成された残余e’(n)に適用
された長期予測機構の出力から得られる。
機構により濾過され、その伝達関数はA(Z)により2
領域で表現され、第1残余信号r(n)を供給する。第
2の残余またはエラー残余e (n)は上記第1の残余
r(n)、及び前に再構成された残余e’(n)に適用
された長期予測機構の出力から得られる。
e (n) ==r (n) −B−r ” (n −
M)r ’ (n) =e ’ (n) +B−r ’
(n−M)残余信号e (n)の符号化は、コードブ
ックCB(1)(ただし、l=1、N+L−1)を備え
た周知の単純化されたCELP手法を使って、20個の
サンプルのサブブロックにより行なわれる(ただし、N
はコードブック内のコードワードの全数、Lはサブブロ
ック長である)。以下では簡単のため、各々の可能なし
サンプル長コードワードを(CB(1)と表示する(i
=1、N)。CB (i)=CB (1)(ただし、l
=IX 1 +L−1)。上記コードブックは、後述
するように、選択された前のシーケンスに従って各サブ
ブロックについて適応的に更新される。言い換えると、
残余e (n)は現在のコードブックのシーケンスCB
及び利得ファクタGにより符号化される。
M)r ’ (n) =e ’ (n) +B−r ’
(n−M)残余信号e (n)の符号化は、コードブ
ックCB(1)(ただし、l=1、N+L−1)を備え
た周知の単純化されたCELP手法を使って、20個の
サンプルのサブブロックにより行なわれる(ただし、N
はコードブック内のコードワードの全数、Lはサブブロ
ック長である)。以下では簡単のため、各々の可能なし
サンプル長コードワードを(CB(1)と表示する(i
=1、N)。CB (i)=CB (1)(ただし、l
=IX 1 +L−1)。上記コードブックは、後述
するように、選択された前のシーケンスに従って各サブ
ブロックについて適応的に更新される。言い換えると、
残余e (n)は現在のコードブックのシーケンスCB
及び利得ファクタGにより符号化される。
次に、コードブックの内容CB (f)は、復号された
第2の剰余信号e’(n)と復号された第1の剰余r’
(n)の−次結合で次のサブブロック符号化のため更新
される。
第2の剰余信号e’(n)と復号された第1の剰余r’
(n)の−次結合で次のサブブロック符号化のため更新
される。
音声信号合成(復号)の場合は、復号された残余エラー
信号e’(n)は、短期予測逆フィルタが後に続いてい
る長期予測逆フィルタに供給される。合成復号された第
1の残余r’(n)はコードブックの更新のためにも使
用される。
信号e’(n)は、短期予測逆フィルタが後に続いてい
る長期予測逆フィルタに供給される。合成復号された第
1の残余r’(n)はコードブックの更新のためにも使
用される。
ローダ内での短期解析及び長期解析の両方の実行に関係
する演算のブロック線図を第5図に示す。
する演算のブロック線図を第5図に示す。
元の音声信号s (n)は、残余r (n)信号を計算
するため使用される8個のparcor関連係数a (
i)を得るため、次の演算により処理される。
するため使用される8個のparcor関連係数a (
i)を得るため、次の演算により処理される。
r (n)はB及びMパラメータの計算で使用され、B
及びMパラメータは残余信号e (n)及びr′(n)
を計算するため使用される。
及びMパラメータは残余信号e (n)及びr′(n)
を計算するため使用される。
B及びMの値を計算するため幾つかの方法が使用可能で
ある。たとえば、IEEE Trans onCom+
aunication1V o l 、 COM −3
0,1982年4月に公表されたB、S、アタル(At
al)のPredictive Coding of
5peech at low BitRate″または
、B、S、アタル及びM、R,シュローダの ”Ada
ptive predictive coding o
fspeech signals ” %Be1l S
ystem TechnicalJournals V
o 1 、49.1970年を参照することができる
。
ある。たとえば、IEEE Trans onCom+
aunication1V o l 、 COM −3
0,1982年4月に公表されたB、S、アタル(At
al)のPredictive Coding of
5peech at low BitRate″または
、B、S、アタル及びM、R,シュローダの ”Ada
ptive predictive coding o
fspeech signals ” %Be1l S
ystem TechnicalJournals V
o 1 、49.1970年を参照することができる
。
一般的に言って、Mはピッチ値またはその高調波である
。音声信号は、各々2.5msの長さのサブブロックに
より考察される20m5の長さのブロックに分割される
と想定する。
。音声信号は、各々2.5msの長さのサブブロックに
より考察される20m5の長さのブロックに分割される
と想定する。
4つのサブブロックのサンプル[r(n)、n=110
00.80コの各々について、復号された残余信号r’
(n−k)の先行サブブロックのサンプルに関する交差
相関演算R(k)が以下に従って行なわれる。
00.80コの各々について、復号された残余信号r’
(n−k)の先行サブブロックのサンプルに関する交差
相関演算R(k)が以下に従って行なわれる。
に=201.、、、120゜
上記R(k)関数のピーク値ロケ−シロンは、求めるM
値を提供する。したがって、次のようになる。
値を提供する。したがって、次のようになる。
R(M)= おΔX R(k)
Mが一般に話者のピッチ期間の高調波に等しいことに留
意されたい。
意されたい。
長期予測機構利得係数Bが次に現在のサブブロックのサ
ンプル[r (n)N n=11.、、.20コについ
て以下を使って得られる。
ンプル[r (n)N n=11.、、.20コについ
て以下を使って得られる。
次に現在のサブブロックの各サンプルについて、以下を
得ることができる。
得ることができる。
r p(n) =B−r ’ (n−M)e (
n)=r (n)−rp (n)短期parcor関
連係数は実際には、第6図の流れ図に示すように、雑音
整形効果を導入するようなされた、事前強調されたs
(n)から得られる。プリエンファシス係数Rは初めに
以下を使つて計算される。
n)=r (n)−rp (n)短期parcor関
連係数は実際には、第6図の流れ図に示すように、雑音
整形効果を導入するようなされた、事前強調されたs
(n)から得られる。プリエンファシス係数Rは初めに
以下を使つて計算される。
R= R2/R1
R1= Σ 5(j)・ 5(j)R2=、八 5
(j−1)・5(j) 事前強調された音声信号は以下でSP (n)により表
される。
(j−1)・5(j) 事前強調された音声信号は以下でSP (n)により表
される。
sp (n)=s (n)−R−s (n−1)事前強
調されたa、パラメータは、いわゆるPARCOR係数
K(i)から増強手順により得られ、係数K(i)は、
通常のルロー・グーアン(Leroux−Guegen
)法を使って、事前強調された信号5p(n)から得
られる。K1係数は、アン(On)/ヤング(Yang
)・アルゴリズムを使って28ビツトで符号化すること
ができる。これらの方法及びアルゴリズムについては、
以下を参照することができる。
調されたa、パラメータは、いわゆるPARCOR係数
K(i)から増強手順により得られ、係数K(i)は、
通常のルロー・グーアン(Leroux−Guegen
)法を使って、事前強調された信号5p(n)から得
られる。K1係数は、アン(On)/ヤング(Yang
)・アルゴリズムを使って28ビツトで符号化すること
ができる。これらの方法及びアルゴリズムについては、
以下を参照することができる。
J、ルロー及びC,グーアン:″Afixedpoin
t computation of partial
correlationcocff 1cients″
11EEE Transactions on八へSP
、 p ])、 ]257−259、 1977年
6月。
t computation of partial
correlationcocff 1cients″
11EEE Transactions on八へSP
、 p ])、 ]257−259、 1977年
6月。
C,に、アン(On)及びS、C,ヤング:”Piec
evise 1inear quantization
of LPCrerlexion coef「1ci
ent″Proc、 Int、 Conf。
evise 1inear quantization
of LPCrerlexion coef「1ci
ent″Proc、 Int、 Conf。
on ASSP 1lartford11977年5月
。
。
J、D、マーケル(Market)及びA、H,グレイ
(Gray) :Linear +>redicti
on ofspeech ” N Springer
Verlag 1976 %増強手順、pp、94−
95゜ a(i)を計算するための上記方法に対するそれ以上の
改善は、以下のアルゴリズムに従って、解析されるサン
プルの連続ブロックに関する速い変更の有害な影響を最
小限にするため補間操作を行なうことによって実現され
る。上記方法により音声信号サンプルの現在のj番目の
ブロックについて計算された予測係数がap(11J)
(1=1.8について)と表示されるものと考えると、
A (z)フィルタ及び1/A (z)フィルタの両方
を同調するため実際に使用される時間nにおける予測係
数a(xljln)は、 a (iv L n)=wn−ap(ilj)+(1−
w’)・ap 1s j−1) (ただし、1=11.、、.8) 及び減衰ファクタを表すw〈1、たとえば、W=0.9
5により与えられる。
(Gray) :Linear +>redicti
on ofspeech ” N Springer
Verlag 1976 %増強手順、pp、94−
95゜ a(i)を計算するための上記方法に対するそれ以上の
改善は、以下のアルゴリズムに従って、解析されるサン
プルの連続ブロックに関する速い変更の有害な影響を最
小限にするため補間操作を行なうことによって実現され
る。上記方法により音声信号サンプルの現在のj番目の
ブロックについて計算された予測係数がap(11J)
(1=1.8について)と表示されるものと考えると、
A (z)フィルタ及び1/A (z)フィルタの両方
を同調するため実際に使用される時間nにおける予測係
数a(xljln)は、 a (iv L n)=wn−ap(ilj)+(1−
w’)・ap 1s j−1) (ただし、1=11.、、.8) 及び減衰ファクタを表すw〈1、たとえば、W=0.9
5により与えられる。
次に、フィルタA (z)の短期濾過動作が以下により
r (n)を計算するため行なわれる。
r (n)を計算するため行なわれる。
r (n)=s (n)−Σ a(i、Ln)・ 5
(n−i)1#I CELP符号化を記述した流れ図を第7図に示す。
(n−i)1#I CELP符号化を記述した流れ図を第7図に示す。
2つのインデックス・カウンタi及びjがi=1及びj
=1にセットされる。テーブルは順に走査される。コー
ドワードCB (i)がテーブルから読み出される。
=1にセットされる。テーブルは順に走査される。コー
ドワードCB (i)がテーブルから読み出される。
第1のスカラー積がi=1で次のように計算される。
5P(i)= Σ CB(i +n −1) ・
e(n)n+1 この値は2乗されてSF3 (i)に置かれ、対応する
コードワード[すなわち、CB2 (i)]の2乗され
た値により除算される。
e(n)n+1 この値は2乗されてSF3 (i)に置かれ、対応する
コードワード[すなわち、CB2 (i)]の2乗され
た値により除算される。
CB2(i)= Σ CB2、(i+n−1)n
+ 1 次にiが1だけ増分され、i=Nになるまで上記演算が
反復される(Nはコードブック内のコードワードの数で
ある)。
+ 1 次にiが1だけ増分され、i=Nになるまで上記演算が
反復される(Nはコードブック内のコードワードの数で
ある)。
ドCB (k)が次に選択される。この演算はテーブル
参照番号にの検出を可能にする。
参照番号にの検出を可能にする。
kが選択されると、対応する利得ファクタが以下を使っ
て計算される。
て計算される。
シーケンスe (n)内のサンプルの数がLの倍数に選
択されたとすると、上記シーケンスe (n)は、各々
Lサンプルの長さの5個のウィンドウに再分割され、次
にjが1だけ増分され、j=Jになるまで上記処理が繰
り返される。
択されたとすると、上記シーケンスe (n)は、各々
Lサンプルの長さの5個のウィンドウに再分割され、次
にjが1だけ増分され、j=Jになるまで上記処理が繰
り返される。
計算は単純化することができ、コーグの複雑さは、各コ
ードワード・エネルギーを単位値にセットするためコー
ドブックを正規化することにより減少させることができ
る。言い換えると、N個のコンポーネント・ベクトル振
幅が1または一定値Cに正規化される。
ードワード・エネルギーを単位値にセットするためコー
ドブックを正規化することにより減少させることができ
る。言い換えると、N個のコンポーネント・ベクトル振
幅が1または一定値Cに正規化される。
CB2 (i)=1
(i=11001、N)
またはCB2 (i)=に
の場合は、最も好ましいkを決定する式が単純化される
(アルゴリズムに含まれるすべての分母は単位値または
Cに等しい)。一方、すぐれた精度を維持するため、G
(k)の式は変化しない。
(アルゴリズムに含まれるすべての分母は単位値または
Cに等しい)。一方、すぐれた精度を維持するため、G
(k)の式は変化しない。
既に述べたように、関連する任意の話者に対してコード
ブックの内容を動的に調整することにより、相当の改善
がコーグにもたらされる。調整はフィードバック更新処
理により実現される。元のコードブックは、順に配置さ
れたN+L−1個の所定のサンプルを含ませられるもの
と仮定し、最適合ロケ−シロンは、コードブックについ
て、現在のサンプル・ブロックまたはサンプル・サブブ
ロックを符号化されたCBLPに移すことにより考察さ
れるものと仮定する。上記コードブックは固定部分及び
適応部分に分割される(第8図参照)。言い換えると、
事前に記憶されたコードブックの内容[CB (1)(
1=1、・・・・、N+L−1)コは次のように分割さ
れる。
ブックの内容を動的に調整することにより、相当の改善
がコーグにもたらされる。調整はフィードバック更新処
理により実現される。元のコードブックは、順に配置さ
れたN+L−1個の所定のサンプルを含ませられるもの
と仮定し、最適合ロケ−シロンは、コードブックについ
て、現在のサンプル・ブロックまたはサンプル・サブブ
ロックを符号化されたCBLPに移すことにより考察さ
れるものと仮定する。上記コードブックは固定部分及び
適応部分に分割される(第8図参照)。言い換えると、
事前に記憶されたコードブックの内容[CB (1)(
1=1、・・・・、N+L−1)コは次のように分割さ
れる。
第1の部分CB(1)(1=11901、N1)。
N1は所定のコードブック・アドレスである。上記第1
の部分は適応コードブック処理の間、元のままに保たれ
る。
の部分は適応コードブック処理の間、元のままに保たれ
る。
この固定部分は、無音、音声の無音部分及び過渡部分を
表す音声残余信号の統計的に選択されたシーケンスを記
憶させられる。
表す音声残余信号の統計的に選択されたシーケンスを記
憶させられる。
第2の部分CB (1)(1=N1+41.。
、、N+L−1)。
上記第2の部分は、幾つかの音声コーバスについて平均
された音声の有音部分を表す音声残余信号のシーケンス
を記憶するよう最初にセットされる。
された音声の有音部分を表す音声残余信号のシーケンス
を記憶するよう最初にセットされる。
この部分は現在の音声符号化処理中に更新される。
この戦略は、高速の変化(過渡状態)に適合することが
できる一方、ゆっくり変化する信号(持続母音)に適合
することを可能にする。
できる一方、ゆっくり変化する信号(持続母音)に適合
することを可能にする。
可変コードブック部分の適応はまず、上記部分1のコー
ドワード(L)を左にシフトすることにある。言い換え
ると、コードブック・アドレスはCB (i)=CB
(i+L)を得るよう変更される。すなわち、N1+L
+1とN+L−1の間のアドレスにおけるコードブック
の内容は、アドレスN1+1とN−1の間に置かれたコ
ードブック部分に置き換わる。
ドワード(L)を左にシフトすることにある。言い換え
ると、コードブック・アドレスはCB (i)=CB
(i+L)を得るよう変更される。すなわち、N1+L
+1とN+L−1の間のアドレスにおけるコードブック
の内容は、アドレスN1+1とN−1の間に置かれたコ
ードブック部分に置き換わる。
次に、NとN+L−1の間に置かれたコードワードが、
次のように一度正規化された最後の符号化ブロックによ
り置き換えられる。
次のように一度正規化された最後の符号化ブロックによ
り置き換えられる。
CB (n)=NORM (a−e ’ (n)+(
1−a)・r’(n)) ただし、NORMは正規化演算を表す。
1−a)・r’(n)) ただし、NORMは正規化演算を表す。
NORM (x (n))
=x(n) ・5QRT(C/SgQ x2(j))
n=11.、、、 し ただし、5QRT()は平方根機能を表す。
n=11.、、、 し ただし、5QRT()は平方根機能を表す。
a<1は加重係数を表す。たとえば、a = 0 。
8゜
Cは最初のコードブックの各コードワードに対する一定
のエネルギー値である。
のエネルギー値である。
CB2 (i)=C(i=L 、、、 、N)コーグが
伝送ネットワーク(図示せず)の一部であると仮定する
と、伝送処理中にコードブックの適応がネットワークの
一端(送信端)で行なわれる間、相関調整が受信装置に
もたらされねばならない(当受信装置及びその付属の送
信装置の両方について)。
伝送ネットワーク(図示せず)の一部であると仮定する
と、伝送処理中にコードブックの適応がネットワークの
一端(送信端)で行なわれる間、相関調整が受信装置に
もたらされねばならない(当受信装置及びその付属の送
信装置の両方について)。
これらの調整は、はとんど別々に動作する両端の装置で
行なうか、または装置の一方の制御のもとで行なわれる
高速起動動作で増強することができる。いずれの場合で
も、ネットワークの両端でのコードブックの更新が同期
されねばならない。
行なうか、または装置の一方の制御のもとで行なわれる
高速起動動作で増強することができる。いずれの場合で
も、ネットワークの両端でのコードブックの更新が同期
されねばならない。
第1のタイプの動作について簡単に述べると、システム
は送信及び受信ネットワーク装置の両方から開始して、
互いに独立してそれらのコードブックを更新する。送信
装置の更新は、各々の送信されたコードワードに基づく
が、上記送信装置の送信システム及び受信システムの両
方がコードブック更新される。ネットワークの他端では
、受信されたコードワードがコードブックの更新を制御
する。
は送信及び受信ネットワーク装置の両方から開始して、
互いに独立してそれらのコードブックを更新する。送信
装置の更新は、各々の送信されたコードワードに基づく
が、上記送信装置の送信システム及び受信システムの両
方がコードブック更新される。ネットワークの他端では
、受信されたコードワードがコードブックの更新を制御
する。
この動作モードは、同期解除されるコードブックの内容
に至る可能性がある。このことは、ネットワークの両端
にとって既知の、事前に選択された特定の事象について
それらの元の内容に強制的にリセットすることにより回
避される。この事象は明らかに会話の終わりに結合され
ねばならないが、さらに、この事象は任意の音声または
会話中に長い無音(所定の持続期間よりも長い無音)の
出現に統合される可能性がある。音声信号はこのときト
ークスパートを含むと言われ、トークスパートごとにリ
セットが行なわれる。任意のトークスパートの始め、す
なわち、長い無音の終わりがいわゆる音声活動検出(V
AD)動作を介して話し平価(送信端)で識別される。
に至る可能性がある。このことは、ネットワークの両端
にとって既知の、事前に選択された特定の事象について
それらの元の内容に強制的にリセットすることにより回
避される。この事象は明らかに会話の終わりに結合され
ねばならないが、さらに、この事象は任意の音声または
会話中に長い無音(所定の持続期間よりも長い無音)の
出現に統合される可能性がある。音声信号はこのときト
ークスパートを含むと言われ、トークスパートごとにリ
セットが行なわれる。任意のトークスパートの始め、す
なわち、長い無音の終わりがいわゆる音声活動検出(V
AD)動作を介して話し平価(送信端)で識別される。
VAD装置は当技術では周知であり、たとえば、さらに
詳細については、番号0127718で公告されたヨー
ロッパ特許出願を参照することができる。
詳細については、番号0127718で公告されたヨー
ロッパ特許出願を参照することができる。
ネットワークの受信端で、長い無音の終わりを幾つかの
手段で識別することができる。たとえば、受信されたフ
レームに1ビツトのフラグを付加することができ、所望
の事象を検出することが可能になる。たとえば、関連ヨ
ーロッパ出願第84430015.2号に開示されてい
るように、上記ビットは、長い無音が終了し、新しいト
ークスパートが開始したときのみ変更させられるだけで
ある。
手段で識別することができる。たとえば、受信されたフ
レームに1ビツトのフラグを付加することができ、所望
の事象を検出することが可能になる。たとえば、関連ヨ
ーロッパ出願第84430015.2号に開示されてい
るように、上記ビットは、長い無音が終了し、新しいト
ークスパートが開始したときのみ変更させられるだけで
ある。
上記1ピツトの変化はコードブックのリセットを制御す
るため使用される。
るため使用される。
音声活動検出が含まれるコードブック・リセット処理を
示す流れ図を第9図に示す。システム全体は通常、音声
活動検出関係を除いて、第4図と関連して開示されるよ
うに働く。システムは、符号化される音声内のどのよう
な無音(すなわち、無活動)でも検出するため、短期解
析を監視させられる。所定のしきい値よりも長い無音が
検出されたときは常に、システムは、リセット・コマン
ドとして動作するフラグをセットする。上記リセット・
コマンドは解析及び合成コードブック可変部分の両方を
それらの元の内容、すなわち、更新の前の内容にリセッ
トする。
示す流れ図を第9図に示す。システム全体は通常、音声
活動検出関係を除いて、第4図と関連して開示されるよ
うに働く。システムは、符号化される音声内のどのよう
な無音(すなわち、無活動)でも検出するため、短期解
析を監視させられる。所定のしきい値よりも長い無音が
検出されたときは常に、システムは、リセット・コマン
ドとして動作するフラグをセットする。上記リセット・
コマンドは解析及び合成コードブック可変部分の両方を
それらの元の内容、すなわち、更新の前の内容にリセッ
トする。
適合コードブック処理は高速起動二重符号化により増強
することができる。任意のトークスバートの始め(VA
D=1)で、残余信号r (n)の最初の20サンプル
がCELP符号化から変更される。それらはその代わり
に3ビツトのブロック・コンパンデッドPCM (BC
PCM)量子化装置によりrc(n)に符号化される。
することができる。任意のトークスバートの始め(VA
D=1)で、残余信号r (n)の最初の20サンプル
がCELP符号化から変更される。それらはその代わり
に3ビツトのブロック・コンパンデッドPCM (BC
PCM)量子化装置によりrc(n)に符号化される。
これら符号化されたサンプルは合成装置に伝送され、構
内的ならびにネットワークの他端で遠隔的に使用されて
、対応するコードブック及び長期遅延線を更新する。
内的ならびにネットワークの他端で遠隔的に使用されて
、対応するコードブック及び長期遅延線を更新する。
これはフレーム・スチール動作に対応する。副情報が送
信されるという事実を示すため1ビツトが使用される。
信されるという事実を示すため1ビツトが使用される。
上記の流れ図を第10図に示す。VADフラグがs (
n)の短期解析から得られ、上記フラグは、現在の信号
サンプル・フレームが音声フレームを表すのか、または
休止フレーム(無音)を表すのかを示す。長い休止を表
すため事前に選択された所定の値まで、連続した休止フ
レームがカウントされ、■ADフラグが発生される。そ
の場合は、音声残余信号r (n)の20個のサンプル
の最初の後続フレームがCELP符号化から変更され(
第10図のスイッチS1参照)、その代わりにフレーム
rc(n)にBCPCM符号化される。
n)の短期解析から得られ、上記フラグは、現在の信号
サンプル・フレームが音声フレームを表すのか、または
休止フレーム(無音)を表すのかを示す。長い休止を表
すため事前に選択された所定の値まで、連続した休止フ
レームがカウントされ、■ADフラグが発生される。そ
の場合は、音声残余信号r (n)の20個のサンプル
の最初の後続フレームがCELP符号化から変更され(
第10図のスイッチS1参照)、その代わりにフレーム
rc(n)にBCPCM符号化される。
上記rc(n)は、考察されるフレームについて長期解
析動作を行なうためr“(n)(またはr(n−M))
フレームとして使用されるフレームr″(n)に復号さ
れる。これは構内解析装置コードブックを更新するため
にも使用される(第10図の点線参照)。
析動作を行なうためr“(n)(またはr(n−M))
フレームとして使用されるフレームr″(n)に復号さ
れる。これは構内解析装置コードブックを更新するため
にも使用される(第10図の点線参照)。
rc(n)は、まずr”(n)にBCPCM復号される
ことにより構内解析のため使用され、■ADフラグによ
り制御されるスイッチS2を介して、合成装置コードブ
ックを更新するためr。
ことにより構内解析のため使用され、■ADフラグによ
り制御されるスイッチS2を介して、合成装置コードブ
ックを更新するためr。
(n)フレームとして使用される。
各トークスパートについて、コードブックが最初に更新
されると、後続の更新が、第3図及び第4図と関連して
示すように行なわれる。言い換えると、 e (n) = r (n) −B−r ” (n−
M)による長期解析から得られるどのようなe (n)
もk及びGにCELP符号化され、合成のため使用され
る(受信装置の合成を示す第10図参照)。
されると、後続の更新が、第3図及び第4図と関連して
示すように行なわれる。言い換えると、 e (n) = r (n) −B−r ” (n−
M)による長期解析から得られるどのようなe (n)
もk及びGにCELP符号化され、合成のため使用され
る(受信装置の合成を示す第10図参照)。
解析中、解析装置コードブックを更新するため、選択さ
れたコードワードCBがr’(n)と共に使用される。
れたコードワードCBがr’(n)と共に使用される。
本明細書に開示されるように、このCELP改善は特に
CELPlLTPタイプに適している。
CELPlLTPタイプに適している。
しかし、これはCELPファミリーのどのコーグにも適
用することができる。
用することができる。
たとえば、マルチレート構造が、1988年3月8日に
出願された関連ヨーロッパ出願第88480007.9
号に示されていた。
出願された関連ヨーロッパ出願第88480007.9
号に示されていた。
第11A図及び第11B図は、上記マルチレート符号化
に含まれる解析動作及び合成動作をそれぞれ要約してい
る。エラー信号e (n)は第1のベクトル量子化装置
(CELP)VQ 1により符号化される。符号化され
たe (n)と符号化されていないe (n)の間の相
異を表すため量子化エラーr (n)が発生され、上記
量子化エラーは次に第2のベクトル量子化装置VQ2内
に符号化される。
に含まれる解析動作及び合成動作をそれぞれ要約してい
る。エラー信号e (n)は第1のベクトル量子化装置
(CELP)VQ 1により符号化される。符号化され
たe (n)と符号化されていないe (n)の間の相
異を表すため量子化エラーr (n)が発生され、上記
量子化エラーは次に第2のベクトル量子化装置VQ2内
に符号化される。
結果として生じるビット・ストリームは2つのビット・
ストリームの連結になるようにされる。
ストリームの連結になるようにされる。
最初のビット・ストリームは、低レートで符号化された
信号を表しくVQ 1に対応する)、他方のビット・ス
トリームは、高レートで符号化された信号を表す(VQ
2に対応する)。
信号を表しくVQ 1に対応する)、他方のビット・ス
トリームは、高レートで符号化された信号を表す(VQ
2に対応する)。
必要な場合、たとえば、通信ネットワークにおける伝送
チャネルが過負荷の場合は、ビット・ストリームは再び
低レートに切り換えることができる。これに関連して、
適応コードブック・アルゴリズムはかなり簡単な方法で
VQI(またはVQ2)に適用することができる。
チャネルが過負荷の場合は、ビット・ストリームは再び
低レートに切り換えることができる。これに関連して、
適応コードブック・アルゴリズムはかなり簡単な方法で
VQI(またはVQ2)に適用することができる。
第1図は、符号化動作を略示するコーグのブロック線図
である。 第2図は、復号動作を略示するデコーダのブロック線図
である。 第3図は、本発明に関連する原理を示すブロック線図で
ある。 第4図は、符号化/復号の流れ図である。 第5図は、コーダ内での短期解析及び長期解析の両方に
関係する演算のブロック線図である。 第6図は、雑音整形効果を導入するための事前強調の流
れ図である。 第7図は、CELP符号化の流れ図である。 第8図は、コードブックの調整を示す略図である。 第9図は、コードブック・リセット処理を示す流れ図で
ある。 第10図は、適合コードブック処理の流れ図である。 第11A図及び第11B図はそれぞれ、マルチレート符
号化に含まれる解析動作及び合成動作を示す図面である
。 出願人 インターナショナル・ビジネス・マシーンズ
・コーポレーション 復代理人
である。 第2図は、復号動作を略示するデコーダのブロック線図
である。 第3図は、本発明に関連する原理を示すブロック線図で
ある。 第4図は、符号化/復号の流れ図である。 第5図は、コーダ内での短期解析及び長期解析の両方に
関係する演算のブロック線図である。 第6図は、雑音整形効果を導入するための事前強調の流
れ図である。 第7図は、CELP符号化の流れ図である。 第8図は、コードブックの調整を示す略図である。 第9図は、コードブック・リセット処理を示す流れ図で
ある。 第10図は、適合コードブック処理の流れ図である。 第11A図及び第11B図はそれぞれ、マルチレート符
号化に含まれる解析動作及び合成動作を示す図面である
。 出願人 インターナショナル・ビジネス・マシーンズ
・コーポレーション 復代理人
Claims (1)
- 【特許請求の範囲】 予め選択されているコードワードを最初に含むベクトル
量子化コーダ・コードブックを信号符合化動作中に動的
に適合化させて、信号サンプルの連続シーケンスを、上
記シーケンスと最も適合するように選択されたコードブ
ック・コードワードのアドレスを含むように符合化する
符合化方法において、 コードブックを固定内容部分と固定長の適応内容部分に
分割し、 選択されたコードワードを上記固定長の適応内容部分に
連続的にロードすることにより上記コードブックを更新
し、以前にロードされたコードワードが上記適応コード
ブック部分からアンロードされるようにしたことを特徴
とする符合化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP88480060.8 | 1988-10-19 | ||
EP88480060A EP0364647B1 (en) | 1988-10-19 | 1988-10-19 | Improvement to vector quantizing coder |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02155313A true JPH02155313A (ja) | 1990-06-14 |
Family
ID=8200501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1270498A Pending JPH02155313A (ja) | 1988-10-19 | 1989-10-19 | 符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5007092A (ja) |
EP (1) | EP0364647B1 (ja) |
JP (1) | JPH02155313A (ja) |
DE (1) | DE3853161T2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
CA2051304C (en) * | 1990-09-18 | 1996-03-05 | Tomohiko Taniguchi | Speech coding and decoding system |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
AU653969B2 (en) * | 1990-09-28 | 1994-10-20 | Philips Electronics N.V. | A method of, system for, coding analogue signals |
US5195168A (en) * | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
JP3129778B2 (ja) * | 1991-08-30 | 2001-01-31 | 富士通株式会社 | ベクトル量子化器 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
DE4315319C2 (de) * | 1993-05-07 | 2002-11-14 | Bosch Gmbh Robert | Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3224955B2 (ja) * | 1994-05-27 | 2001-11-05 | 株式会社東芝 | ベクトル量子化装置およびベクトル量子化方法 |
US5797118A (en) * | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
US5497337A (en) * | 1994-10-21 | 1996-03-05 | International Business Machines Corporation | Method for designing high-Q inductors in silicon technology without expensive metalization |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
FI114248B (fi) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
US6092040A (en) * | 1997-11-21 | 2000-07-18 | Voran; Stephen | Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US7171355B1 (en) | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US20030101049A1 (en) * | 2001-11-26 | 2003-05-29 | Nokia Corporation | Method for stealing speech data frames for signalling purposes |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7103538B1 (en) * | 2002-06-10 | 2006-09-05 | Mindspeed Technologies, Inc. | Fixed code book with embedded adaptive code book |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
JP5215305B2 (ja) * | 2007-07-06 | 2013-06-19 | 第一電子工業株式会社 | 電子部品の製造方法及び該方法により製造する電子部品 |
JP2010034794A (ja) * | 2008-07-28 | 2010-02-12 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63146518A (ja) * | 1986-12-09 | 1988-06-18 | Fujitsu Ltd | 静止画像の符号化方式 |
JPH01277300A (ja) * | 1988-04-28 | 1989-11-07 | Mitsubishi Electric Corp | 学習型ベクトル量子化器 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
DE3779351D1 (ja) * | 1986-03-28 | 1992-07-02 | American Telephone And Telegraph Co., New York, N.Y., Us | |
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
-
1988
- 1988-10-19 DE DE3853161T patent/DE3853161T2/de not_active Expired - Fee Related
- 1988-10-19 EP EP88480060A patent/EP0364647B1/en not_active Expired - Lifetime
-
1989
- 1989-10-13 US US07/420,966 patent/US5007092A/en not_active Expired - Fee Related
- 1989-10-19 JP JP1270498A patent/JPH02155313A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63146518A (ja) * | 1986-12-09 | 1988-06-18 | Fujitsu Ltd | 静止画像の符号化方式 |
JPH01277300A (ja) * | 1988-04-28 | 1989-11-07 | Mitsubishi Electric Corp | 学習型ベクトル量子化器 |
Also Published As
Publication number | Publication date |
---|---|
DE3853161T2 (de) | 1995-08-17 |
US5007092A (en) | 1991-04-09 |
EP0364647A1 (en) | 1990-04-25 |
EP0364647B1 (en) | 1995-02-22 |
DE3853161D1 (de) | 1995-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH02155313A (ja) | 符号化方法 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
US7693710B2 (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
US5966688A (en) | Speech mode based multi-stage vector quantizer | |
US5689615A (en) | Usage of voice activity detection for efficient coding of speech | |
EP1281172A2 (en) | Method and apparatus for compression of speech encoded parameters | |
JP2006525533A (ja) | 可変ビットレート広帯域通話符号化における利得量子化方法および装置 | |
US6052659A (en) | Nonlinear filter for noise suppression in linear prediction speech processing devices | |
JP2002055699A (ja) | 音声符号化装置および音声符号化方法 | |
US8055499B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
US6243674B1 (en) | Adaptively compressing sound with multiple codebooks | |
JP2001519552A (ja) | ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 | |
JP2645465B2 (ja) | 低遅延低ビツトレート音声コーダ | |
AU6203300A (en) | Coded domain echo control | |
WO1997015046A9 (en) | Repetitive sound compression system | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
JPH02231825A (ja) | 音声符号化方法、音声復号方法、およびこれらを使用した通信方法 | |
JP3878254B2 (ja) | 音声圧縮符号化方法および音声圧縮符号化装置 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
KR100392258B1 (ko) | Celp 보코더의 처리 지연시간을 감소하기 위한 인코딩및 디코딩 블럭 구조 및 그 구조를 이용한 인코딩 및디코딩 방법 |