JPH01233500A - 複数レート音声エンコーデイング方法 - Google Patents

複数レート音声エンコーデイング方法

Info

Publication number
JPH01233500A
JPH01233500A JP63316617A JP31661788A JPH01233500A JP H01233500 A JPH01233500 A JP H01233500A JP 63316617 A JP63316617 A JP 63316617A JP 31661788 A JP31661788 A JP 31661788A JP H01233500 A JPH01233500 A JP H01233500A
Authority
JP
Japan
Prior art keywords
signal
signals
coded
term
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63316617A
Other languages
English (en)
Other versions
JPH0833759B2 (ja
Inventor
Francoise Bottau
フランソワ・ボトー
Claude Galand
クロード・ギヤラン
Michele Rosso
ミシエール・ロツソ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH01233500A publication Critical patent/JPH01233500A/ja
Publication of JPH0833759B2 publication Critical patent/JPH0833759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は音声コード化技術、より詳細に言えば、複数レ
ー) (multi−rate )の音声コード化の方
法に関する。
B、従来の技術 ディジタル・ネットワークは、音声信号をデジタル的に
エンコードするのが望ましい場合に、伝送したり記憶し
たりするのに使用される。その目的のために、取り扱わ
れる各音声信号は、最初にサンプルされ、そして各サン
プル・パルスはデジタル的にバイナリ・ビットにエンコ
ードされる。
理論的に言えば、各サンプル・パルスをコード化するの
に用いられるビット数を増加すればするほど、少なくと
もコード化は向上する、即ちエンド・ユーザに与えられ
る前にデコードされたとき、音声に最も近い信号が得ら
れる。然しながら、経済的な観点からみて効果的なネッ
トワークにするために、ネットワークのトラヒックの数
、換言すればユーザの数は、ネットワークの混乱を生ず
ると、どのない範囲で、最大限に増加する必要がある。
このために、トラヒックがネットワーク内で増加した時
に、ユーザの使用を拒絶しないで、コーディング歪み(
ノイズ)を受忍可能な範囲まで拡げることにより、音声
のコード化のビット・レートを低める方法が用いられて
いるけれども、これが、何故上述の方法を使うかの1つ
の理由である。トラヒックの状態が許す限りにおいて、
音声のコード化の質を上げ、トラヒックの密度が高い状
態の下では、予め決められた許容レベルまで上記の質を
下げることは妥当性があると考えられる。一方のコード
化の質(1ビツト・レート)から他方の質へ切換えるこ
のスイッチングは、ネットワーク内のすべてのノードで
出来るだけ簡単に、且つ迅速に行われるべきである。こ
の目的を達成するために、複数レートのコード化装置に
組込みビット・ストリームを持つフレームを与えること
によって、予め決められた一方のビット・レートからよ
り低い所定のビット・レートへの切換えが、フレームの
所定の部分を降下するだけで行えるようにすることが必
要である。
C0発明が解決しようとする問題点 従って、本発明の目的はコード信号励起エンコーディン
グ(Code−Excited encoding )
技術を用いて、音声信号を複数レートでコード化する手
法を提供することにある。
D0問題点を解決するための手段 本発明は、コード励起長期間予測コード化信号発生装置
(Code−Excited Long−term P
redictionCoder) (CE/LT P装
置という)を含む複数レートの音声コード化の方法及び
その装置に関する。
音声信号は、短期間残差信号を誘出するために短期間フ
ィルタで濾過される。この短期間残差信号は、第1のC
E/LTP装置に与えられてコード化される。そして、
このコード化信号をデコードし、とのデコード結果から
、第1のCE/LTP装置への入力信号を差し引いてエ
ラー信号を生成する。上記のエラー信号は、転じて第2
のCE/LTP装置に印加されて、コード化信号を誘導
する。複数レート・フレームは、上記の第1のCE/L
TP装置からのコード化信号と、上記の第2のGE/L
TP装置からのコード化信号の両方を含んでいる。
より詳細にいえば、本発明は、音声信号に基づいて発生
される短期間残差信号を誘出するために、オリジナルの
音声信号を短期間フィルタ作用によって処理した後、第
1のCE/LTP装置に印加することを含んでおり、こ
の第1のGE/LTP装置の動作は、上記第1の長期間
残信号を誘出するために、上記の短期間残差信号から、
第1の予測残差信号を差し引くことと、上記第1の長期
間残差信号を利得g1及びアドレスに1にコード化する
ことと、第1の長期間残差信号から第1のエラー信号を
誘出するために、第1の長期間残差信号から、第1の再
構成された残差信号(コード化された後の信号)を差し
引くことと、上記の第1のエラー信号を、第2のCE/
LTP装置に供給して、利得g2及びアドレスに2にコ
ード化することと、同じ複数レート・コード化フレーム
に(gl、kl)及び(g2、k2)を綜合させること
とを含み、これにより、より低いコード化フレームへの
切換えを(g2、k2)の廃棄によって達成する。すな
わち(gl、kl)のみ伝送することにより達成する。
上述した本発明の原理に従って、第3の、第4の006
等々のCE/LTP装置を設けることによって、明らか
に、より高いレートへ拡大することができる。
E、実施例 第1図を参照すると2レート(bi−rate )コー
ド化装置の実施例の単純化されたブロック図が示されて
おり、既に説明したように、この装置によって、ビット
・レートは、より高いレート数に拡大される。
第1図の装置において、電話用の帯域幅(300ヘルツ
乃至3300ヘルツ)に制限された音声信号が、8キロ
・ヘルツでサンプルされ、そして、月並なデジタル・ア
ナログ・コンバータ(図示せず)において、毎サンプル
・パルス当り12ビツトでデジタル的にエンコードされ
たPCMによって、サンプル・パルス列の信号、5(n
)が入力として与えられている。これらのサンプル信号
は最初の装置10において先ずプリエンファシスされ、
次に、部分的自己相関で誘導される係数a。
(PARCOR誘導)を発生するために演算装置12で
処理される。上記の係数a、は、信号5(n)を濾過す
る短期間予測フィルタ(STP)13を同調するのに用
いられ、そして、その装置13は短期間残差信号r(n
)を与える。上記の短期間残差信号は第1のCE/LT
P装置Aに与えられてコード化される。CB/LTP装
置Aに与えられたこの入力信号は、上記の短期間残差信
号r(n)から、第1の長期間残差信号e(n)を誘出
するために、予め決められた遅延値M(音声ピッチ期間
の倍数に等しい値)によって遅延され、且つ利得係数す
、rl(n−M)を乗算することによって合成された(
再構成された)残差信号に対応する第1の予測残差信号
を、短期間残差信号r(n)から差し引くことによって
、第1の長期間残差信号e(n)を誘出するよう処理さ
れる。
このブロック・コーディング技術が、本発明の目的のた
めに、160サンプル長さのr(n)のブロックにわた
って使用されることは、注意を払う必要がある。パラメ
ータb及びMは80個のサンプル・パルス毎に評価され
る。長期間残差信号e(n)の流れは、L個の順序付け
られたサンプル・パルスのブロックに再分割され、そし
て次に、上記の各ブロックは、コード励起コード化第1
装置(CBLPI )15により処理されて、L個のサ
ンプル・パルスのに個のシーケンス(列)によって標準
化されたコードワードとして利用可能にされる。次の時
点において、第1の長期間残差信号e (n )tコー
ド化することは、不変分散エラー基準の観点から、e(
n)信号の列に最も良く適合したコードワードを選択す
ること、そしてコードワードの参照数字(refere
nce number ) k lで信号e(n)を置
き換えることを含んでいる。事前に記憶されたコードワ
ードが標準化されているものとして、次に、第1の利得
係数g1が決められ、テストされるのがよい。
コードワードの参照数字に1が決められた後、第1のデ
コード装置(DECODEI )16において発生され
、再構成された第1の残差信号el(n)=g1.CB
(kl)は上記の長期間予測装置14に供給される。
また、この再構成された残差信号は、減算装置17にお
いて、信号e(n)から差し引かれ、その出力としてエ
ラー信号r’(n)を与える。
次に、エラー信号r’(n)は、既に述べたCB/LT
P装置Aと同様な第2のCE/LTP装置Bに印加され
る。この第2のCE/LTP装置は、エラー信号r’(
n)が印加される減算器18を含み、コード励起コード
化第2装置(CELP2)19をアドレスするエラー残
差信号e′(n)を発生する。この装置19は、信号e
′(n)を第2の利得係数g2とコードワードのアドレ
スに2とにコード化する。また、上記のコード化装置1
9は、コードワードCB(k2)及び利得g2を第2の
デコード装置(DEGODB2’)20に印加するよう
に動作し、このデコード装置20は下記の数式で表わさ
れるデコーされたエラー信号を与える。
e2(n)=g2.CB(k2) また、上記の信号e2(n)は第1のLTPIと同じ第
2の長期間予測装置(LTP2)に印加され、その出力
は減算装置18においてr’(n)から差し引かれる。
最後に、al、b、M、(gl、kl)及び(gl 2、k2)のデータを複数レート(2レート)フレーム
に多重化することによって、全レードの7レームが発生
される。
既に述べたように、この処理はCB/LTP装置Aまた
はGE/LTP装置Bのよ装置付加的なコード励起長期
間予測コーダを直列に挿入することによって容易に拡張
することができる。
第2図に示した流れ図は、プリエンファシスと、PAR
COFL関連の計算の両方に含まれる動作の詳細を説明
するための図である。160個の信号サンプル・パルス
5(n)の各ブロックは先ず、信号自己相関関数の2つ
の第1値を誘導するために処理される。
プリエンファシス係数Rは、 R=R1/R2 で計算され、そして160個のサンプル・パルス5(n
)のオリジナルの組はプリエンファシスされた組5p(
n)に変換される。5p(n)は次式で与えられる。
sp (n )=s (n )−R,s (n−1)プ
リエンファシスされたa、パラメータは、いゎゆるPA
RCOR係数に、がら、逓昇プロシージャによって誘導
され、これは転じて月並なレロー・グーゲン(Lero
ux−Guegen )法を用いてプリエンファシスさ
れた信号5p(n)から誘導される。8個のal、また
はPARCOR係数に、はU n / Yangアルプ
リズムを用いて28ビツトでコード化される。これらの
方法及びアルゴリズムについては、以下の刊行物を参照
されたい。
−J、Leroux and C,Guegen : 
IEEE Transactionon ASSP p
p、257〜259. June 1977の「部分相
関係数の固定少数点計算J (A fixed poi
ntcomputation of partial 
correctioncoeff 1cients )
と題する刊行物。
−C,に、 UN and S、CYang:Proc
eedings。
International Conference 
on QSSP Hartford。
May 1977のrLPCリフレクション係数の小片
的な線形量子化J (Piecewise 1inea
r quantizationof LPCrefle
xion coefficents)と題する刊行物。
−L+D、Markel and A、H,Gray 
: SpringerVerlag 1976、5te
p−up procedure pp、 94〜95の
「スピーチのリニヤ予測J (Liner predi
ctfon ofspeech)と題する刊行物。
一米国特許第4216354号(欧州特許2998)。
短期間フィルター8は次式で与えられる短期間残差サン
プル・パルス信号r(n)を発生する。
長期間係数のb値及びM値を計算するためには、幾つか
の方法がある0例えば、1つの方法は、1982年4月
のIEEE Trans、 on Coma+unic
ation。
Vol、 C0N−30の「低ビット・レートにおける
スピーチの予測的コード化J (Predictive
 Coding ofSpeech at low B
it Rate)と題する文献、及び1970年のBe
1l System Technical Journ
al、 Vol、49の「スピーチ信号の適合予測コー
ド化J (Adaptiveprediction c
odingof 5peech signals)と題
する文献を参照されたい。
一般的にいえば、Mはピッチ値、またはその高調波であ
り、それを計算する方法は当業者には公知である。
また、非常に異なった方法が欧州特許出願FR9870
04に記載されている。
上記の特許出願に従って、 l?0 上式において、値、b及びMは、80個のサンプル・パ
ルスと、それらよりも先行する前の80個のサンプル・
パルスとを使用して、180個のサンプル・パルスの各
ブロックにわたって2度決定される。
Mの値、即ちピッチに関連する値Mは2つの処理ステッ
プに基づいて計算される。その第1のステップは、粗調
整ピッチに関連したM値のおおざっばな決定を行い、そ
れに続く第2のステップ(微調整ステップ)は、限られ
た数の値について自己相関方法を使用してM値を調節す
る。
1、第1のステップ おおざっばな決定は可変量値及びゼロ交差検出を含む非
直線性技術を用いることに基礎を置いており、より詳細
に言えば以下のステップを含んでいる。
− ゼロ、または予め決められた値L1または前の微調
整値MにL値を強制することによって可変Mlを初期化
すること。
−現在のサブ・ブロックの80個のサンプル・パルスと
、80個の先行する前のサンプル・パルスを含む160
個のサンプル・パルスのブロックのベクトルをロードす
ること。
−160個のサンプル・パルス中の正のピーク値(Vm
ax)と、負のピーク値(Vmln)とを検出すること
−以下の閾値を計算すること。
正の閾値Th”=a、Vmax 負の閾値Th  =a、Vmln αは経験的に選択された値(例えばα=0.5)−以下
の条件に従った現在のサブ・ブロックを表わす新しいベ
クトルX(n)を設定すること。
若し、r(n)≧Th+ならば、X(n)=1若し、r
(n)≦Th−ならば、X(n)=1その他の場合、X
(n)=0 −1.0または1の値のみを含むこの新しいベクトルは
「清浄ベクトル(cleaned vector ) 
Jと呼ばれる。
−清浄ベクトルの2つの値の間の有効ゼロ交差(5i8
nificant zero crossing ) 
(即ち符号が変化すること)を検出すること、換言すれ
ば、相互に近接したゼロ交差を検出すること。
一連続して検出されたゼロ交差の間のr(n)サンプル
区間の数を表わすM′の値を計算すること。
−ΔM=1M’−M+を計算し、そしてΔMが所定の値
D(例えばD=5)よりも大きい任意のM′を捨て去っ
た後、前のおおざっばな値MとM′とを比較すること。
−捨て去らなかったM′の平均値を求めるため、Mの粗
調整値を計算すること。
2、第2のステップ 微調整値Mの決定は、ピッチ付けされたパルスの近くに
位置したサンプル・パルスの囲りで取り上げたサンプル
・パルスのみについて演算が施される自己相関方法を用
いることに基礎を置いている。
第2のステップは以下のステップを含んでいる。
−丁度いま計算されたおおまかなM値(粗調整値)(但
しゼロではないものとする)に等しいM値か、または、
前に測られた微調整値Mに等しいM値を取って初期化す
ること。
−清浄ベクトル、即ち粗ピツチに関する所定数のサンプ
ル・パルスを自己相関ゾーンにロードすること。
−以下の式から誘導された一組のR(k’)値を計算す
ること。
上式において、k′は、選択された自己相関ゾーンの下
限Mmlnから上限Mmaxまでに変化する清浄ベクト
ルのサンプル・パルス・インデックスであり、自己相関
ゾーンの範囲は例えば、Mml n=Lで、Mmax=
120であるとする。
b及びMが計算されると、それらの値は、以下に説明さ
れる変換長期間予測装置14を同調するのに使用される
。この装置14の出力、即ち信号r(n)に対して減算
演算れ予測された第1の長期間残差信号は、第1の長期
間残差信号e(n)を与える。この信号e(n)は転じ
て、係数kl及び利得係数g1にコード化される。係数
に1は装置(CBLPI )15にあるテーブル中に事
前に記憶されているコードワードCB(kl)のアドレ
スを表わしている。コードワード及び利得係数の選択は
、平均二乗誤差を選択基準の基礎としている。換言すれ
ば、それらは、以下の式で与えられる最小値Eを与える
にテーブル・アドレスを見ることによって与えられる。
E=[e(n)0g1.CB(k、n)]T。
[e(n) −gl、CB(k、n)]     (1
)上式において、Tは平均数学的移項演算(means
mathematical transpositio
n operation )を表わす。
CB(k、n)は第1図のコード化装置15内のアドレ
スkに位置するコードワードを表わす。
換言すれば、Lを各コードワードCBのサンプル・パル
ス数とした場合、EはLの2つのコンポーネント・ベク
トルのスカラー量である。
Eを最小化する最適スケール係数G(k)[(1)式中
のgl]は次式をセットすることによって決定される。
G 及び ICB(k、 n)lZ 等式、G(k)の分母は、事前に記憶されたテーブル中
のコードワードを事前に標準化することによって回避す
ることができる標準化のファクタである。
上式(1)は次式のように簡単化することができる。
そして、最適コードワードは等式(2)の最後の項を最
大にするkの値を見出すことによって得られる。
CB2 (k )はICB(k、n)12を表わし、そ
して、 5p(k)はスカラー量eT(n )、CB (k。
n)であるとすると、 先ず、次式を最大にするkの値を見出すことが必要とな
り、 [5P(k)]” CB2(k) そして、次に、以下の式からG(k)の値を決定する。
即ち、 CB2(k) 上式は以下のような異なった数式で表わすことができる
n=1.21.、、、Lを持つ(en)は、ニジコード
されるべきe(n)個のサンプル・パルスのシーケンス
を表わすものとする。そして、n=1.21.、、、L
及びに=1.21160、Kを持つ(Y  k)は夫々
L個のサンプル・パルスのに個のコードワードを含むテ
ーブルを表わすものとする。但しに=2°ピッ1とする
CELPにおいてエンコードする処理動作は以下の結果
をもたらす。
−以下の相関環を計算すること。
71、=/ 上式において、k=11.、、、Kとする。
−以下の条件を最適化するためのkの値を選択すること
Ekopt=Max(Ek) 但しに=11.、、、にとする。
−e(n)シーケンスをCビットのブロック=log2
にビット十〇(k)コーディング・ビットに変換するこ
と。
上述の動作を遂行するアルゴリズムは第3図に示されて
いる。
第1の2つのインデックス・カウンター及びjは1=1
及びj=1にセットされる。コードワードCB(1,n
)はテーブルから読取られる。
第1のスカラー量は次式から計算される。
し この値は二乗されて5P(2)の値とされ、対応するコ
ードワード[即ちCB(1)]の二乗値で割り算される
。次に、lは1つづつ増加され、そして、Kをコード・
ブック中のコードワード数とした場合、I=Kになるま
で、上記の動作が反復される。1=11.、、、にとし
た場合、以下のシーケンス 5P2(1) CB2(1) の範囲内で、以下の最大値 5P2(K) CB2 (K ) を与える最適値のコードワードCB(k)が選択される
。この動作はテーブルの参照数字kt−検出して可能と
なる。
kが選択されると、利得係数は以下の式を用いて計算さ
れる。
シーケンスe(n)内のサンプル・パルスの数がLの倍
数に選択された場合、上記のシーケンスe(n)は、夫
々のウィンドーがL個のサンプル・パルスの長さを持つ
ものとして、JL個のウィンドーに2次分割され、次に
j=JLになるまで、jが1つづつ増加される。
各コードワードのエネルギを単位値にセットするために
、コード・ブックを標準化することによって、計算を簡
単化し、コード化装置の複雑性の単純化を計ることがで
きる。換言すれば、1=11.、、、Kとして、Lのコ
ンポーネント・ベクトルの振幅が、次式で1に標準化さ
れる。
CB2(1)=1 この場合、最良のコードワードkを決定する数式は単純
化される(アルプリズムに含まれるすべての分母を単位
値と等しくする)。スケール係数G(k)は変更される
のに反して、最適のシーケンスのための参照数字には修
正されない。
この方法はテーブルを記憶するために非常に大きなメモ
リを必要とする0例えば、上記のサイズKXLは、K=
256でL=20とした場合、4万バイトの程度になる
異なったアプローチを以下に説明する。システムを初期
化する際に、残差信号のL+に個のサンプル・パルスの
第1のブロック、例えばe(n)がテーブル中に記憶さ
れる。次に後続するL個のワード長さの各列e(n)は
、(L+K ’)個のサンプル・パルスの長さのテーブ
ルにわたって、次の1つのサンプル・パルス位置から(
en)その列をシフトすることによって、(L+K )
個のサンプル・パルスの長いテーブルの列に相関される
上式において、k=11.、、、にとする。
この方法はテーブルに必要とするメモリの大きさを、K
=256でL=20の場合、2万バイトに減少する。
第4図は長期間予測装置14のブロック図を示す。コー
ド化装置15において選択され、デコード装置16によ
って与えられる第1の再構成残差信号、即ち el(n)−gl、CB(kl) が加算器30に供給されると、その出力は、長さが値M
まで調節可能な可変遅延線32に印加される。可変遅延
線32のM値で遅延された出力は、乗算器34において
利得係数すにより乗算演算される。この演算結果の出力
は加算器30に印加される。
第1図に示されたように、計算されたb及びMの値はま
た、長期間残差信号から再構成された誘導信号から差し
引いて誘導されたエラー信号として、後続するCB/L
TP装置のために使用することが出来る。
第5図は本発明に従った複数レート・コーディングに含
まれる動作のアルゴリズムを示す図である。この例は、
説明を簡明にするために、複数レートは2レートとしで
ある。
この処理は以下に述べるステップを含んでいる。
(1) 短期間残差の部分: 5(n)信号はa(1)係数を持つディジタル・フィル
タを用いて短期間フィルタ動作を通じて短期間残差信号
r(n)に変換される。上記の係数は短期間分析動作を
通じてプリエンファシスされた信号sp (n )から
誘導された信号に従属する係数である。
(2) 第1の長期間予測の部分: 短期間残差信号r(n)は以下の条件によって第1の長
期間残差信号e(n)に変換される。
e(n)=r(n) −す、rl(n−M)上式におい
て、bは長期間残差分析から誘導される利得であり、M
はピッチ倍数であり、rl(n−M)はMによって遅延
され再構成された長期間残差信号から誘導される。
(8) コード励起コード化の第1の部分:第1の長期
残差信号は第1のコードワード・テーブルのアドレス(
kl)と、第1の利得係数(gl)にコード化される。
これは、e(n)サンプル・パルスの所定の長さのブロ
ックに最も良く適合したコードワードのアドレスに1を
決定するために、上記のブロックを事前に記憶されたコ
ードワードと相関させることによって達成される。
(4) コード励起コード化信号のエラーの第1の部分
: コード化のエラー信号r’(n)はコード化されでいな
いe(n)からデコードされたel(n)を差し引くこ
とによって誘導される。
(5) 第2の長期間予測の部分: 次に、エラー信号は、前の動作と同様に、即ち既に計算
されたM及びb係数を使用して第2の長期間残差のため
の演算処理を施すことによって、下記のエラー残差e’
(n)に変換される。
e’  (n)=r’  (n)−b、r2(n  M
)(この第2のステップのために、前に計算したb及び
M値を保持することは、演算動作の仕事を軽減する助け
になることは言うまでもない。これらの再計算も同様に
考慮するのが好ましい。)(6) コード励起コード化
の第2部分二転じて、エラー残差信号は、最も良く適合
した第2のコードワードのアドレス(k2)及び第2の
利得係数(g2)を得るために第2のCE/LTP装置
に与えられる。
上述の処理は月並な多重化アプローチを使用して2レー
トのフレームに挿入されるデータ、a9、b、M、(g
l、kl)及び(g2、k2)を与える。この処理は、
(g3、k3)、(g4、k4)1010等々を発生す
るために、最後の3つのステップを繰り返すことによっ
て、更に高いレート数に拡大することができるのは、こ
れ以上の説明を要することなく明らかである。
月並なデマルチブレキシング動作を介して種々のデータ
が相互に分離されているものと仮定して、第6図のアル
ゴリズムに示されたように、複数レート(2レート)フ
レームから元の音声を合成し戻すことが出来る。kl及
びに2の値は、コード化装置の説明と開運して既に述べ
たように、設定されたテーブルから、コードワードCB
(ki)及びCB(k2’)を取出すために、上記のテ
ーブルをアドレスするのに用いられる。これらの動作は
以下の信号を再構成することができる。
el(n)=g1.CB(kl、n) e2(n)=g2.CB(k2.n) 従って、e’  (n)=el(n)+e2(n)であ
る。
次に、上記の信号e’(n)は、b及びMに同調された
長期間合成フィルター/B(z)に供給された後、これ
により、ビ (n)を発生する。
次に、信号r’(n)、は、−組のa、係数に同調され
た短期間合成デジタル・フィルター/A(z)によって
濾過されて、合成された音声信号S′(n)を与える。
上述の音声合成装置(受信装置)のブロック図が第7図
に示されている。デマルチプレクサ6゜はデータ信号を
相互に分離する。kl及びに2はテーブル61及び62
をアドレスするのに使用され、その出力はマルチプレク
サ63及び64に供給されて、el(n)及びe2(n
)を与える。
加算器65はel(n)及びe2(n)を加算し、そし
てその出力は、長さMに調節された可変遅延線68及び
マルチプレクサ69を通った出方と加算器67で加算し
、その結果値はディジタル・フィルタ70[1/A(z
 )3に供給される。従って、加算器67の出力は、a
、に設定された係数によってディジタル・フィルタ7o
で濾過されて、合成された復元音声信号s’(n)を与
える。
本発明の複数レートのアプローチはより巧妙なコーディ
ング方法によって実現することが出来る。
例えば、第8図に示したような通常のベース・バンド・
コードに適用することができる。元の音声信号5(n)
が短期間残差信号r(n)を誘導するように処理された
のち、それは、低域フィルタ(t、pF )70と加算
器71を使用して、低周波帯域幅(LF)信号rl(n
)と、高周波帯域幅(HF)信号rh(n)とに分離さ
れる。高周波帯域幅のエネルギは装置(HFE )72
により計算され、そして装置73において、Eによって
指定されたデータにコード化される。装置73の出力は
番号(3)で示されている。帯域幅LF及びHFの夫々
の信号、即ちrl(n)及びrh(n)は第1図のブロ
ックA及びBで表示されているような複数レートのCB
/LTPコード化装置75及び76に供給される。分離
(b、M)計算装置のいずれも両方の帯域幅に使用する
ことができる。
最後に、マルチプレクサ77に供給される信号は下記に
示すデータである。
−PARCORに関連する係数:a。
一 ピッチ、または長期間に関連するデータ:b及びM −高周波エネルギのデータ二E −低周波帯域幅の複数レートCE/LTP:g1;に1
;gl;に1 − 高周波帯域幅の複数レートCE/LTP:2、 2
. 2. 2 gIIklIg21に2 このアプローチは、全てのレートに共通なデータの組、
即ちa8、b、及びMパラメータと、例えば以下のアプ
ローチに従った出力フレーム中に挿入され、または挿入
されない残りのデータとによって、幾つかのレートでコ
ード化することができる。
−16Kbps(毎秒16キロ・バイト)のビット・レ
ートで全帯域幅のコード化装置:gl;k ; ; g
 2 ; k 2 : g ”r : k ”x : 
gう及びに杉を加算する。
−中間的帯域幅のコード化装置:gl;に1;gl;に
1;g2及びに2のみ。
− 低周波帯域幅のコード化装置:g”;l<’;1.
1 g2.に2及びEo 1.1 − 低レートのコード化装置: g 11 kl及びE
本発明の技術的範囲内で、出力(1)、(2)及び(3
)と、ao、b、M及びEの他の組合せを考えることは
、当業者であれば容易になし得るととは明らかである。
F1発明の効果 本発明は音声信号を複数レートでコード化した音声伝達
用のディジタル・ネットワークにおいて、簡単な構成で
、一方のレートから他方のレートへの切換を、ネットワ
ーク内のすべてのノードについて迅速に行うことができ
る。
【図面の簡単な説明】
第1図は本発明に従ったコード化装置を説明するための
ブロック図、第2図は第1図の装置10.12及び13
に含まれた動作を説明するための流れ図、第3図はコー
ド励起コード化動作を説明するための流れ図、第4図は
第1図の装置14を具体化したブロック図、第5図は第
1図に示した本発明の装置の動作を説明するための流れ
図、第6図は本発明に使用されるデコーダを示す図、第
7図は第6図のデコーダのブロック図、第8図は本発明
に従って、ベース・バンド・コード化を行うコード化装
置のブロック図である。 10・・・・プリエンファシス、13・・・・短期間フ
ィルタ、14・・・・第1の長期間予測装置、15・・
・・コード誘起コード化第1装置、16・・・・第1の
デコード装置、17.18・・・・減算器、19・・・
・コード誘起コード化第2装置、20・・・・第2のデ
コード装置、A、B・・・・CE/LTP装置。 出 願 人  インターナショナル・ビジネス・マシー
ンズ・コーポレーション 復代理人  弁理士  澤  1) 俊  夫第2日 第3m 第5氏 纂6凪 第8国

Claims (1)

  1. 【特許請求の範囲】 原信号をサンプリングしてサンプル・ブロックを生成し
    、各サンプル・ブロックを予め記憶されているテーブル
    ・アドレスにおよび利得係数gに変換するコード励起エ
    ンコーデイング手法を用いて音声起原信号を複数レート
    でエンコーデイングする方法において、 上記音声起原信号に第1のコード励起エンコーデイング
    を実行して第1のテーブル・アドレスに1および第1の
    利得係数g1を生成するステップと、 上記第1のテーブル・アドレスk1および第1の利得係
    数g1をデコードするステップと、上記音声起原信号か
    ら上記デコードの結果信号を差し引いてエラー信号を生
    成するステップと、上記エラー信号に第2のコード励起
    エンコーデイングを実行し第2のテーブル・アドレスk
    2および第2の利得係数g2を生成するステップと、上
    記第1のテーブル・アドレスk1および第1の利得係数
    g1と第2のテーブル・アドレスk2および第2の利得
    係数g2とを多重化するステップとを有し、 低いレートでエンコーデイングを行うときには第2のテ
    ーブル・アドレスk2および第2の利得係数g2を廃棄
    するようにした複数レート音声エンコーデイング方法。
JP63316617A 1988-03-08 1988-12-16 複数レート音声エンコーデイング方法 Expired - Fee Related JPH0833759B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP88480007.9 1988-03-08
EP88480007A EP0331858B1 (en) 1988-03-08 1988-03-08 Multi-rate voice encoding method and device

Publications (2)

Publication Number Publication Date
JPH01233500A true JPH01233500A (ja) 1989-09-19
JPH0833759B2 JPH0833759B2 (ja) 1996-03-29

Family

ID=8200489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63316617A Expired - Fee Related JPH0833759B2 (ja) 1988-03-08 1988-12-16 複数レート音声エンコーデイング方法

Country Status (4)

Country Link
US (1) US4965789A (ja)
EP (1) EP0331858B1 (ja)
JP (1) JPH0833759B2 (ja)
DE (1) DE3883519T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03243998A (ja) * 1990-02-22 1991-10-30 Nec Corp 音声符号化装置
JPH03243999A (ja) * 1990-02-22 1991-10-30 Nec Corp 音声符号化装置
JP2002536693A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 可変率音声符号化に基づいた音声合成装置
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
JP2008171017A (ja) * 1994-08-05 2008-07-24 Qualcomm Inc 減少レート、可変レートの音声分析合成を実行する方法及び装置

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68914147T2 (de) * 1989-06-07 1994-10-20 Ibm Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung.
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
FR2657741B1 (fr) * 1990-01-29 1992-04-03 Cit Alcatel Interface de restructuration de trames pour trains numeriques multiplexes par multiplexage temporel d'affluents numeriques a differents debits.
US5115429A (en) * 1990-08-02 1992-05-19 Codex Corporation Dynamic encoding rate control minimizes traffic congestion in a packet network
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
CA2054849C (en) * 1990-11-02 1996-03-12 Kazunori Ozawa Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
AU671952B2 (en) * 1991-06-11 1996-09-19 Qualcomm Incorporated Variable rate vocoder
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
WO1993006592A1 (en) * 1991-09-20 1993-04-01 Lernout & Hauspie Speechproducts A linear prediction speech coding device
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5617423A (en) * 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US5535204A (en) * 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5864560A (en) * 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5754589A (en) * 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5546395A (en) * 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
US5453986A (en) * 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US6009082A (en) * 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
JPH06250697A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置
WO1994023426A1 (en) * 1993-03-26 1994-10-13 Motorola Inc. Vector quantizer method and apparatus
IT1270439B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la quantizzazione dei parametri spettrali in codificatori numerici della voce
US5452015A (en) * 1994-02-10 1995-09-19 Philips Electronics North America Corporation Method and apparatus for combating co-channel NTSC interference for digital TV transmission
US6134521A (en) * 1994-02-17 2000-10-17 Motorola, Inc. Method and apparatus for mitigating audio degradation in a communication system
US5757801A (en) * 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) * 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
US5546448A (en) * 1994-11-10 1996-08-13 Multi-Tech Systems, Inc. Apparatus and method for a caller ID modem interface
US5508708A (en) * 1995-05-08 1996-04-16 Motorola, Inc. Method and apparatus for location finding in a CDMA system
US5648822A (en) * 1995-05-19 1997-07-15 Philips Electronics North America Corporation Method and apparatus for combating co-channel NTSC interference using a variable-comb filter for digital TV transmission
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US5905794A (en) * 1996-10-15 1999-05-18 Multi-Tech Systems, Inc. Caller identification interface using line reversal detection
US6128506A (en) * 1997-09-24 2000-10-03 Telefonaktiebolaget Lm Ericsson Integrated power control and congestion control in a communication system
US6104998A (en) * 1998-03-12 2000-08-15 International Business Machines Corporation System for coding voice signals to optimize bandwidth occupation in high speed packet switching networks
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
JP5145852B2 (ja) * 2007-10-15 2013-02-20 日本電気株式会社 係数決定装置、無線通信システム、係数決定方法及び係数決定プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251881A (en) * 1978-06-05 1981-02-17 Storage Technology Corporation Centralized automatic gain control circuit
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CH637510A5 (de) * 1978-10-27 1983-07-29 Ibm Verfahren und anordnung zur uebertragung von sprachsignalen sowie anwendung des verfahrens.
EP0064119B1 (fr) * 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
EP0085820B1 (fr) * 1982-02-09 1985-11-21 International Business Machines Corporation Procédé de transmission numérique multi-vitesses et dispositif de mise en oeuvre dudit procédé
JPS60116000A (ja) * 1983-11-28 1985-06-22 ケイディディ株式会社 音声符号化装置
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
US4897855A (en) * 1987-12-01 1990-01-30 General Electric Company DPCM system with adaptive quantizer having unchanging bin number ensemble
US4866510A (en) * 1988-09-30 1989-09-12 American Telephone And Telegraph Company Digital video encoder

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03243998A (ja) * 1990-02-22 1991-10-30 Nec Corp 音声符号化装置
JPH03243999A (ja) * 1990-02-22 1991-10-30 Nec Corp 音声符号化装置
JP2008171017A (ja) * 1994-08-05 2008-07-24 Qualcomm Inc 減少レート、可変レートの音声分析合成を実行する方法及び装置
JP2010044421A (ja) * 1994-08-05 2010-02-25 Qualcomm Inc 減少レート、可変レートの音声分析合成を実行する方法及び装置
JP2002536693A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 可変率音声符号化に基づいた音声合成装置
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization

Also Published As

Publication number Publication date
EP0331858A1 (en) 1989-09-13
DE3883519D1 (de) 1993-09-30
EP0331858B1 (en) 1993-08-25
DE3883519T2 (de) 1994-03-17
JPH0833759B2 (ja) 1996-03-29
US4965789A (en) 1990-10-23

Similar Documents

Publication Publication Date Title
JPH01233500A (ja) 複数レート音声エンコーデイング方法
US5966688A (en) Speech mode based multi-stage vector quantizer
US4677671A (en) Method and device for coding a voice signal
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
KR100427752B1 (ko) 음성부호화방법 및 장치
KR101000345B1 (ko) 음성 부호화 장치, 음성 복호화 장치 및 그 방법
KR100469224B1 (ko) 음성부호화방법및장치
US5371853A (en) Method and system for CELP speech coding and codebook for use therewith
US4933957A (en) Low bit rate voice coding method and system
US5359696A (en) Digital speech coder having improved sub-sample resolution long-term predictor
US7792679B2 (en) Optimized multiple coding method
JP2003512654A (ja) 音声の可変レートコーディングのための方法およびその装置
EP1221694A1 (en) Voice encoder/decoder
EP0966793A1 (en) Audio coding method and apparatus
JPH06149296A (ja) 音声符号化方法及び復号化方法
JP2002202799A (ja) 音声符号変換装置
EP1222659A1 (en) Lpc-harmonic vocoder with superframe structure
EP0364647A1 (en) Improvement to vector quantizing coder
US5926785A (en) Speech encoding method and apparatus including a codebook storing a plurality of code vectors for encoding a speech signal
US5651026A (en) Robust vector quantization of line spectral frequencies
EP0396121B1 (en) A system for coding wide-band audio signals
KR100255533B1 (ko) 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees