JP2000305597A - 音声圧縮のコード化 - Google Patents

音声圧縮のコード化

Info

Publication number
JP2000305597A
JP2000305597A JP2000067301A JP2000067301A JP2000305597A JP 2000305597 A JP2000305597 A JP 2000305597A JP 2000067301 A JP2000067301 A JP 2000067301A JP 2000067301 A JP2000067301 A JP 2000067301A JP 2000305597 A JP2000305597 A JP 2000305597A
Authority
JP
Japan
Prior art keywords
vector
weak
predictor
strong
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000067301A
Other languages
English (en)
Inventor
Jacek Stachurski
スタチャースキイ ジャセク
Alan V Mccree
ブイ、マックリー アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JP2000305597A publication Critical patent/JP2000305597A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Abstract

(57)【要約】 【課題】 剰余のフーリエ係数が重複したクラスに分類
される線形予測符号化を提供する。 【解決手段】 LP剰余フーリエ係数は、2つ又はそれ
より多い重複されたクラスに分類され、各クラスはそれ
自身のベクトル量子化コードブックを持っている。弱い
予測子に続く強い予測子は、弱い予測子で置換され、強
い予測子と弱い予測子の使用が修正され、フレームの消
去により生じる誤差の伝播を確実に減衰させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は電子装置に関し、よ
り詳しくは、音声符号化、伝送、記憶、及び合成回路及
び方法に関する。
【0002】
【従来の技術】低いビット伝送速度を使用するデイジタ
ル音声システムの性能は、現在の及び予見し得るデイジ
タル通信について益々重要になって来た。1つのデイジ
タル音声方法である線形予測符号化(LPC)は人間の
音声を模倣するためパラメトリックモデルを使用する。
このアプローチにおいては、音声モデルのパラメタのみ
が通信チャネルを渡って伝送され(又は記憶され)、シ
ンセサイザが、入力音声波形と同じ知覚特性をもつ音声
を再生する。このモデルパラメタの周期的更新には、音
声信号の直接の表現よりも少ないビットが要求され、そ
のため合理的なLPCボコーダは、2−3Kbps(秒
当たりキロビット)の低いビット伝送速度で動作出来る
が、他方公衆電話システムは64Kbps(秒当たり
8,000サンプルにおいて8ビットPCM符号語)を
使用する。例えば、マックリ等の「新しい米国連邦基準
のための2.4Kbit/sMELP符号器候補」、P
roc.IEEEint.Conf.ASSP200
(1996)及びUSP5,699,477を見よ。
【0003】しかし、この様なLPCボコーダからの音
声出力は、特に背景雑音が存在するときは、常に自然の
人間の音声の様に発声されるとは限らないので、多くの
応用においては受入られない。そして約4Kbpsのビ
ット伝送速度において少なくとも電話の品質の音声を持
つ音声ボコーダに対する要請がある。品質を改善するた
めの種々のアプローチには、混合励起線形予測(MEL
P)システムのパラメタの推定の強化とこれらのより効
率的な量子化が含まれる。イエルデナ等の「4Kb/s
及びこれより低い混合正弦的に励起される線形予測符号
器」、Proc.IEEEInt.Conf.Acou
st,Speech,Signal Processi
ng(1998)及びシエロモット等の「低いビット伝
送速度における音声の組合わされた調波及び波形符号
化」、IEEE...585(1998)を見よ。
【0004】
【発明が解決しようとする課題】各クラスがそれ自身の
ベクトル量子化コードブックを持つ複数の重複するクラ
スに分類された剰余のフーリエ係数を持つ線形予測シス
テム符号化方法を提供する。
【0005】
【課題を解決するための手段】本発明の線形予測システ
ム符号化方法は、(a)LP剰余フーリエ係数を2つ又
はそれより多いベクトルのクラスに分類するステップ
と、(b)各クラスに対して少なくとも1つのベクトル
量子化コードブックを備えるステップと、(c)前記ベ
クトルを前記コードブックにより符号化するステップと
を包含する。
【0006】加えて、強い予測及び弱い予測の両方のコ
ードブックを使用出来、しかしさもなければ弱い予測子
(predictor)の次に来る強い予測子は、弱い
予測子で置換される。このことは、低いビット伝送速度
を維持するが増進した性能を持ち、一連の強い予測子に
よる誤差の伝播を回避する利点がある。
【0007】
【発明の実施の形態】概観 第1の好ましい実施の形態は、線形予測(LP)剰余
(residual)(MELP符号器において)をス
ペクトル(ベクトル)のクラスに分類し、各クラスを別
個にベクトル量子化する。例えば、1つの第1の好まし
い実施の形態は、長いベクトル(典型的に男性の音声の
様な低いピッチ周波数に概略的に対応する多くの調波)
と短いベクトル(典型的に女性の音声の様な高いピッチ
周波数に概略的に対応する少ない調波)に分類する。こ
れらのスペクトルは、次に異なる数の成分(調波)での
ベクトルの符号化を容易にするため別個のコードブック
でベクトル量子化される。図1aは、分類の流れを示
し、またクラスの重複を含む。
【0008】第2の好ましい実施の形態は、スペクトル
(又は代わりに、線スペクトル周波数又はLSFの様な
他のパラメタ)の予測符号化、及びさもなければ弱い予
測子の次に来る最初の強い予測子は弱い予測子で置換さ
れると言う但し書きをもち、最良の近似に基づき強い予
測子か弱い予測子かのいずれかの選択を可能にする。こ
れは一連の強い予測子に先行する一つの弱い予測子にお
ける誤差の一連の強い予測子による誤差伝播を阻止す
る。図1bは予測符号化制御流れを示す。
【0009】MELPモデル 図2a−2bは、好ましい実施の形態のMELP符号化
(分析)及び復号(合成)をブロック形式で示す。特
に、線形予測分析は、デイジタル音声サンプル{y
(n)}の入力フレームに対するLPC係数 a
(j)、j=1、2、... 、M、を次の数式の設定及び
Σe(n)2を最少にすることにより決定する。
【0010】
【数1】
【0011】典型的には、Mは、線形予測フィルタの位
数(order)であり、約10−12であるように取
り、サンプルy(n)を形成するためのサンプリング速
度は8000Hz(デイジタル伝送のための公衆電話網
のサンプリングと同じ)であるように取り、また一つの
フレームにおけるサンプル{y(n)}の数はしばしば
160(20msecフレーム)又は180(22.5
msecフレーム)である。サンプルのフレームは、入
力音声サンプルに適用される種々のウインドウ動作によ
り発生しても良い。名前「線形予測」は、先行するサン
プル
【数2】 の線形和によりy(n)を予測することにおける誤差と
して
【数3】 の翻訳から生じる。従って、Σe(n)2を最少にする
と、最良の線形予測を提供する{a(j)}が得られ
る。係数{a(j)}は、量子化及び伝送のためLSF
に変換しても良い。
【0012】この{e(n)}は、そのフレームのため
のLP剰余を形成し、また理想的には合成フィルタ1/
A(z)のための励起であろうし、そこにA(z)は
[数1]の方程式の伝達関数である。勿論、このLP剰
余は復号器において利用可能ではなく、そのため符号器
のタスクは、復号器が符号化されたパラメタからLP励
起を発生出来る様にLP剰余を表現することである。
【0013】サンプルの周波数帯域のための帯域通過有
声音化(Band−Pass Voicing)(典型
的には、0−500Hz、500−1000Hz、10
00−2000Hz、及び3000−4000Hzの様
な2から5帯域)は、LP剰余{e(n)}から引き出
されるLP励起がある特別の帯域に対して周期的(有声
音化)であるべきか又は白色雑音(未有声音化)である
かを決定する。
【0014】ピッチ分析は、{y(n)}を低域ろ波
し、次に{y(n)}を種々のmに対して{y(n+
m)}と相関させることによりピッチ周期(有声音化さ
れたフレームにおける最少周期)を決定し、ここで補間
は端数のサンプル間隔を準備する。結果としてのピッチ
周期は、pTで示され、そこにpは典型的に20から1
32の範囲に制限される実数であり、Tは1/8ミリ秒
のサンプリング間隔である。従って、pは一つのピッチ
周期におけるサンプルの数である。有声音化された帯域
におけるLP剰余{e(n)}は、複数のピッチ周波数
調波の組合わせであるべきである。
【0015】フーリエ係数推定は、有声音化された(v
oiced)帯域に対するLP剰余の符号化を提供す
る。利得分析は、一つのフレームに対する全般的なエネ
ルギレベルを設定する。この符号化(及び復号)は、テ
キサスインスツルメント社により製造されるTMS32
0C30の様なデイジタル信号処理装置(DSP)によ
り実行出来、これは分析又は合成を実質的に実時間で遂
行するようにプログラムできる。
【0016】剰余のスペクトル 図3aは、一つの有声音化されたフレームに対するLP
剰余{e(n)}を示し、約8個のピッチ周期を含み、
各ピッチ周期は約26個のサンプルを持つ。図3bは、
LP剰余の1つの特別な期間に対する当該{E(j)}
の大きさを示し、図3cは、全部の8個のピッチ周期に
対する{E(j)}の大きさを示す。pTに等しいピッ
チ周期を持つ一つの有声音化されたフレームに対して、
フーリエ係数は、1/pT、2/pT、3/p
T、...、k/pT、...の回りにピークを生じ、
即ち基本周波数1/pT及び複数調波においてである。
勿論、pは整数でなくても良く、またX[1]、X
[2]、...、X[k]、...で示される基本周波
数の調波におけるフーリエ係数の大きさは、推定されな
ければならない。これらの推定値は、量子化され、伝送
され、またLP励起を創作するため復号器において使用
されるであろう。
【0017】この{X[k]}は、種々の方法で推定する
ことが出来、例えば、図3b−3cにおける様なe
(n)の単一の期間(又は少数の期間)のサンプルに離
散的フーリエ変換を適用し、この代わりに{E(j)}
は補間されることが出来る。勿論、1つの補間アプロー
チは、512ポイント離散的フーリエ変換をLP剰余の
一つの拡張されたバージョンに適用し、これは高速フー
リエ変換の使用を可能にする。特に、e512(n)=e
(n)、ここにn=0、1、...、159、及びe
512(n)=0ここにn=160、161、...、5
11を設定することにより160サンプルのLP剰余
{e(n)}を512サンプルに拡張する。それで、離
散的フーリエ変換の大きさは、係数E512(j)を持っ
て図3dにおける様に現れ、これは図3b−3cの係数
E(j)を実質的に補間する。複数周波数k/pTにお
けるピークX[k]を推定する。好ましい実施の形態で
は、位相も使用できるが、フーリエ係数の大きさを使用
するだけである。LP剰余成分{e(n)}は実数であ
るので、離散的フーリエ変換係数{E(j)}は共役対
称(conjugate symmetric)であ
り、即ちNポイント離散的フーリエ変換に対してE
(k)=E*(N−k)である。従って、{E(j)}
の半分だけが大きさの考察に対して使用される必要があ
る。
【0018】フーリエ係数のためのコードブック 基本ピッチ周波数及び調波k/pTに対するフーリエ係
数X[k]の推定された大きさが一旦発見されると、こ
れらは最少数のビットで伝送されなければならない。好
ましい実施の形態では、スペクトルのベクトル量子化を
使用する。即ち、フーリエ係数X[1]、X
[2]、...X[k]、...の組を多次元量子化に
おける一つのベクトルとして取扱い、出力量子化ベクト
ルのインデックスだけを伝送する。注目すべきは、
[p]又は[p]+1個の係数が存在するが、成分の共
役対称に起因してそれら成分の半分だけが有意である。
従って、pT=4ミリ秒(p=32)の様な短いピッチ
周期に対しては、基本周波数1/pT(=250Hz)
は高く、32個の調波が存在するが、16個だけが有意
である(DC成分は数えない)。同様に、pT=12ミ
リ秒(p=96)の様な長いピッチ周期に対しては、基
本周波数(=83Hz)は低く、48個の有意な調波が
存在する。
【0019】一般に、出力量子化ベクトルの組は、一組
の入力連続(training)ベクトルからクラスタ
(cluster)方法を持つ適応選択により創作する
ことが出来る。例えば、種々の話者から不規則に選択し
た多数のベクトル(スペクトル)は、一つのコードブッ
ク(又は多段ベクトル量子化をもつ複数コードブック)
を形成するため使用出来る。従って、量子化され符号化
された入力スペクトルX[1]、X[2]、...X
[k]、...のバージョンは、量子化されたベクトル
のコードブックにおけるインデックスとして伝送するこ
とが出来、これは20ビットであっても良い。
【0020】図1aに示す様に、第1の好ましい実施の
形態は、以下の様にフーリエ係数スペクトルのベクトル
量子化から進行する。第1に、対応するピッチ周期に従
ってフーリエ係数スペクトル(ベクトル)を分類し、も
しそのピッチ周期が55Tより少なければ、そのベクト
ルは「短い」ベクトルであり、又もしそのピッチ周期が
45Tより多ければ、そのベクトルは「長い」ベクトル
である。幾らかのベクトルは短いベクトル及び長いベク
トルの両方とみなされるであろう。短いベクトルは20
成分ベクトルのコードブックでベクトル量子化し、また
長いベクトルは45成分ベクトルのコードブックでベク
トル量子化する。前述の様に、フーリエ係数の共役対称
は、ベクトル成分の最初の半分だけが有意で且つ使用さ
れることを意味する。20個の有意成分より少ない短い
ベクトルに対しては、1に等しい成分を付加することに
より20成分へ拡張する。これに類似して45個の有意
成分より少ない長いベクトルに対しては、1に等しい成
分を付加することにより45成分へ拡張する。各コード
ブックは、220個の出力量子化ベクトルを持ち、そのた
め20ビットが各コードブックにおける出力量子化ベク
トルのインデックスとなる。1ビットをコードブックを
選択するため使用出来るが、ピッチが伝送されて、20
ビットは長いベクトル量子化か又は短いベクトル量子化
かを決定するため使用できる。
【0021】短い及び長いの両方として分類された一つ
のベクトルに対しては、先行するフレームのベクトルと
同じ分類を使用し、これは不連続性を回避し、また分類
の重複によりヒステリシスを与える。更に、もし先行す
るフレームが、有声音化されていなかったなら、もしピ
ッチ周期が50Tより少なければそのベクトルは短いと
し、それ以外は長いとする。
【0022】ベクトル間の距離を定義する計量に重み付
け因子を適用する。この距離は、連続するベクトル(こ
れはコードブックを創作する)のクラスタ化(clus
tering)の為と、最少距離によるフーリエ成分ベ
クトルの量子化の為との両方に使用される。一般に、ベ
クトルX1とX2の間の距離をd(X1,X2)=(X1
2TW(X1−X2)により定義し、Wは重みのマトリ
ックスである。従って、短いベクトルに対してマトリッ
クスWshortを定義し、長いベクトルに対してマトリッ
クスWlongを定義し、更に、この重みは量子化されるべ
きベクトルの長さに依存しても良い。次に、短いベクト
ルに対してWshort[j,k]を、j又はkのいずれか
が20より大きいものに対して極めて小さくし、これは
成分X1[k]及びX2[k]を20より大きいkに対し
て無関係にする。さらに、Wsho rt[j,k]を、j及
びkが1から20へ増加するにつれて減少させ、より低
いベクトル成分を強調する。即ち、量子化は、ピッチ周
波数の基本及び低い調波に対して主としてフーリエ係数
に依存する。類似して、j又はkが45より大きいもの
に対してWlong[j,k]を極めて小さく取る。
【0023】更に、以下に述べる様に、大きさを減少さ
せ、量子化雑音を減少させるため予測符号化の使用を含
めることも出来るであろう。
【0024】予測符号化 差別(予測)アプローチは、量子化雑音を減少させるで
あろう。即ち、一つのスペクトルX[1]、X
[2]、...X[k]、...、をベクトル量子化す
るよりむしろ、最初に、先行する1つ又はそれより多い
フレームの量子化スペクトル(ベクトル)からそのスペ
クトルの予測を発生させ、正に差を量子化する。もし現
在のフレームのベクトルが先行するフレームのベクトル
から良く近似出来れば、そこで「強い」予測が使用出
来、そこでは現在のフレームのベクトルと強い予測子と
の間の差異が小さい。これに反し、もし現在のフレーム
のベクトルが先行するフレームのベクトルから良く近似
出来なければ、そこで「弱い」予測(予測なしを含む)
が使用出来、そこでは現在のフレームのベクトルと予測
子との間の差異が大きい。例えば、現在のフレームのベ
クトルXの簡単な予測は、先行するフレームの量子化さ
れたベクトルYであろうし、又はより一般には倍数αY
であり、αは重み付け因子(0と1の間)である。勿
論、αは、異なるベクトル成分に対して異なる因子を持
つ対角マトリックスであっても良い。0.7−1.0の
範囲のαの値に対して、予測子αYは、Yに近く、また
もしXにも近ければ、量子化されるべき差ベクトルX−
αYは、Xと比較して小さい。これは強い予測子であろ
うし、そして復号器はXに対する推定をQ(X−αY)
+αYにより回復し、ここに第1項は量子化されるべき
差ベクトルX−αYであり、第2項は前のフレームから
であり、おそらく優勢項である。逆に、0.0−0.3
の範囲のαの値に対して、予測子は弱く、そこに量子化
されるべき差ベクトルX−αYはおそらくXと匹敵す
る。事実、α=0は全く予測がなく、また量子化される
べきベクトルはXそれ自身である。
【0025】強い予測子の利点は、同じ大きさのコード
ブックを用いて、小さそうな(強い予測子差)ある物を
量子化すると大きそうな(弱い予測子差)ある物を量子
化するよりも良い平均結果が得られると言う事実から生
じる。
【0026】従って、連続する4つのコードブックは、
(1)短いベクトル及び強い予測、(2)短いベクトル
及び弱い予測、(3)長いベクトル及び強い予測、及び
(4)長いベクトル及び弱い予測である。そこで図1b
の上部部分に示される様なベクトルを処理する。最初
に、ベクトルXは短い又は長いとして分類され、次に強
い及び弱い予測子ベクトルXstrong及びXweakが前のフ
レームの量子化されたベクトルから発生し、そして強い
予測子及び弱い予測子コードブックが、X−Xst rong
びX−Xweakのベクトル量子化のために夫々使用され
る。次に2つの結果(Q(X−Xstrong)+Xstrong
びQ(X−Xweak)+Xweak)が入力ベクトルと比較さ
れ、より良い近似(強い又は弱い予測子)が選択され
る。ベクトルの量子化のための20ビットのコードブッ
クインデックスと共に一つのビットが伝送される(強い
予測子か弱い予測子が使用されたかどうかを示すた
め)。
【0027】予測制御 フレーム消去において、現在のフレームに対応するパラ
メタ(即ち、LSF、フーリエ係数、ピッチ、...)
は失われ又は信頼出来ないと考えられ、そのフレームは
前のフレームからのパラメタに基づいて再構成される。
フレーム消去の存在においては、一組のパラメタの欠如
の結果生じる誤差は、強い予測が使用される一連のフレ
ームを通じて伝播するであろう。もしその誤差が一連の
フレームの中間に発生すると、予測されたパラメタの正
確な展開は傷つけられ、なんらかの知覚上の歪みが通常
導入される。弱い予測子が絶え間なく選択される領域内
でフレーム消去が起こると、誤差の効果は局所に制限さ
れるであろう(それは弱い予測により急速に減少す
る)。再構成されたフレームにおける最大の劣化は、強
い予測子が選択される一連のフレームが後に続く、弱い
予測子を持つ一つのフレームに対してフレーム消去が起
こる時には何時でも観察される。この場合、パラメタの
展開は、その展開を開始すると想像されるパラメタとは
非常に異なるパラメタ上に築かれる。
【0028】従って、第2の好ましい実施の形態では、
一連のフレームにおいて使用される予測子を分析してこ
れらの順番を制御する。特に、弱い予測子を使用したフ
レームの直後の、さもなければ強い予測子を使用するか
も知れない現在のフレームに対しては、1つの好ましい
実施の形態では弱い予測子を使用するように現在のフレ
ームを修正するが、次のフレームの予測子には影響しな
い。図1bはこの決定を示す。
【0029】一つの簡単な例がこの好ましい実施の形態
の効果を示す。一連のフレームがフーリエ係数ベクトル
1、X2、X3、...を持つと仮定し、また第1のフ
レームは弱い予測子を使用し、第2、第3、第
4、...フレームは強い予測子を使用すると仮定す
る、しかしこの好ましい実施の形態では第2のフレーム
の強い予測子を弱い予測子で置換する。従って、第1の
フレームに対する伝送される量子化された差ベクトルは
Q(X1−X1weak)であり、消去なしでは復号器はX1
をQ(X1−X1weak)+X1weakとして回復し、第1項
は弱い予測に起因しておそらく優勢項である。同様に、
通常の復号器はX2をQ(X2−X2strong)+X2st rong
として回復し、第2項は優勢であり、また類似して
3、X4、...に対しても同様である。これに反し、
好ましい実施の形態の復号器はX2をQ(X2
2weak)+X2weakとして回復するが第1項はおそらく
優勢である。
【0030】注目すべきは、その復号器は、X1weak
先行する再構成されたフレームのベクトルX0
-1、...、ら再創作し、また同様にX2strong及び
2weakに対して、再構成されたX1、X0...から再
創作し、また他の予測子に対しても同様である。
【0031】さて、第1フレームパラメタの消去により
ベクトルQ(X1−X1weak)は失われ、その復号器は、
1を、前のフレームから再構成された丁度反復してい
るX0の様ななにかにより再構成する。しかし、これ
は、本来弱い予測子が使用されたので極めて良好な近似
ではないかも知れない、そこで第2のフレームに対し
て、通常の復号器は、X2を、Q(X2−X2strong)+
2strongにより再構成し、Y 2strongは、X1
0、...からよりはむしろX0、X0、...から再
創作された強い予測子であり、何故ならX1は失われ、
おそらく良くない近似X0により置換されたからであ
る。従って、誤差は、概略的にX2strong−Y2strong
あり、これは異なる項Q(X2−X2strong)に較べて強
い予測子が優勢項であるために大きそうである。そして
これはまたX3、X4、...の再構成に適用される。
【0032】逆に、好ましい実施の形態では、X2をQ
(X2−X2weak)+Y2weakにより再構成し、Y2weak
1、X0、...よりはむしろX0、X0、...から再
創作された弱い予測子であり、再び何故ならX1は失わ
れ、おそらく良くない近似X0により置換されたからで
ある。従って、誤差は、概略的にX2weak−Y2weakであ
り、これは異なる項Q(X2−−X2weak)に較べて弱い
予測子がより小さい項であるために小さそうである。そ
してこのより小さな誤差はまたX3、X4、...の再構
成に適用される。
【0033】勿論、予測子がX2strong=αX1、ここに
α=0.8、及びX2weak=αX1、ここにα=0.2、
の場合に対して、通常の復号器の誤差は、X2の再構成
に対して0.8(X1−X0)であり、また好ましい実施
の形態の復号器の誤差は、0.2(X1−X0)であろ
う。
【0034】代替の予測制御 代替の第2の好ましい実施の形態では、一つの弱い予測
子フレームの後の2つ(又はそれより多い)の連続する
フレームの強い予測子を弱い予測子に修正する。即ち、
弱、強、強、強、...の順番は、弱、弱、弱、
強、...に変更される。前述の強い予測子の弱い予測
子による置換は、誤差の強壮さの増加を品質の僅かな減
少との交換により処分する(弱い予測子がより良い強い
予測子の代わりに使用される)。この予測制御は、また
より一般的にビデオ圧縮のような多くの形式の符号化に
適用される。
【0035】修正 好ましい実施の形態は、特許請求の範囲に記載の特徴を
保持しつつ種々の方法で修正出来る。
【0036】以上の説明に関して更に以下の項を開示す
る。 (1)線形予測システム符号化方法であって、(a)L
P剰余フーリエ係数を2つ又はそれより多いベクトルの
クラスに分類するステップと、(b)各クラスに対して
少なくとも1つのベクトル量子化コードブックを備える
ステップと、(c)前記ベクトルを前記コードブックに
より符号化するステップとを包含する。 (2)第1項記載の符号化方法において、(a)前記ク
ラスは重複し、また2つ又はそれより多いクラスにおけ
るベクトルは、先行するフレームにおけるベクトルのク
ラスを使用して符号化される。 (3)線形予測システム復号方法であって、(a)LP
剰余フーリエ係数を2つ又はそれより多い重複するベク
トルのクラスのメンバとして翻訳し、各クラスは少なく
とも1つのベクトル量子化コードブックを持つ、ステッ
プと、(b)前記コードブックを使用して符号化された
ベクトルを復号するステップとを包含する。 (4)強い及び弱い予測子を使用する符号化システム方
法であって、(a)弱い予測子に続く強い予測子を弱い
予測子で置換するステップを包含する。 (5)LP剰余フーリエ係数を2つ又はそれより多い重
複するクラスに分類し、各クラスはそれ自身のベクトル
量子化コードブックを持つ線形予測システム。また、フ
レーム消去から生じる誤差伝播を確実に減衰させるため
弱い予測子に続く強い予測子を弱い予測子で置換し、強
い及び弱い予測子の使用を修正する。
【図面の簡単な説明】
【図1a】好ましい実施の形態の流れ図である。
【図1b】好ましい実施の形態の流れ図である。
【図2a】好ましい実施の形態の符号器及び復号器のブ
ロック図である。
【図2b】好ましい実施の形態の符号器及び復号器のブ
ロック図である。
【図3a】LP剰余及びそのフーリエ変換を示す図であ
る。
【図3b】LP剰余及びそのフーリエ変換を示す図であ
る。
【図3c】LP剰余及びそのフーリエ変換を示す図であ
る。
【図3d】LP剰余及びそのフーリエ変換を示す図であ
る。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 線形予測システム符号化であって、 (a)LP剰余フーリエ係数を2つ又はそれより多いベ
    クトルのクラスに分類するステップと、 (b)各クラスに対して少なくとも1つのベクトル量子
    化コードブックを備えるステップと、 (c)前記ベクトルを前記コードブックにより符号化す
    るステップとを包含する線形予測システム符号化。
JP2000067301A 1999-03-12 2000-03-10 音声圧縮のコード化 Abandoned JP2000305597A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US124089 1980-02-25
US12411299P 1999-03-12 1999-03-12
US12408999P 1999-03-12 1999-03-12
US124112 1999-03-12

Publications (1)

Publication Number Publication Date
JP2000305597A true JP2000305597A (ja) 2000-11-02

Family

ID=26822196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000067301A Abandoned JP2000305597A (ja) 1999-03-12 2000-03-10 音声圧縮のコード化

Country Status (3)

Country Link
EP (1) EP1035538B1 (ja)
JP (1) JP2000305597A (ja)
DE (1) DE60021455T2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20080249767A1 (en) * 2007-04-05 2008-10-09 Ali Erdem Ertan Method and system for reducing frame erasure related error propagation in predictive speech parameter coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法

Also Published As

Publication number Publication date
EP1035538A3 (en) 2003-04-23
DE60021455D1 (de) 2005-09-01
EP1035538B1 (en) 2005-07-27
EP1035538A2 (en) 2000-09-13
DE60021455T2 (de) 2006-05-24

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
JP4843124B2 (ja) 音声信号を符号化及び復号化するためのコーデック及び方法
JP5373217B2 (ja) 可変レートスピーチ符号化
KR100873836B1 (ko) Celp 트랜스코딩
US10431233B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
US20050027517A1 (en) Transcoding method and system between celp-based speech codes
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
KR100389895B1 (ko) 음성 부호화 및 복호화방법 및 그 장치
EP2945158B1 (en) Method and arrangement for smoothing of stationary background noise
JP2005515486A (ja) Celpによる音声符号間のトランスコーディング・スキーム
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP2000305597A (ja) 音声圧縮のコード化
US7295974B1 (en) Encoding in speech compression
Vass et al. Adaptive forward-backward quantizer for low bit rate high-quality speech coding
Papanastasiou et al. Efficient mixed excitation models in LPC based prototype interpolation speech coders
WO2001009880A1 (en) Multimode vselp speech coder
JPH09269798A (ja) 音声符号化方法および音声復号化方法
JPH0981194A (ja) 音声符号化/復号化方法および音声符号化/復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Effective date: 20070112

Free format text: JAPANESE INTERMEDIATE CODE: A621

A762 Written abandonment of application

Effective date: 20081210

Free format text: JAPANESE INTERMEDIATE CODE: A762