JP2001509616A

JP2001509616A - 長期間予測と多重パルス励起信号を用いて音声信号を符号化および／または復号化する方法

Info

Publication number: JP2001509616A
Application number: JP2000502499A
Authority: JP
Inventors: カール・ホルガー
Original assignee: グルンデイッヒ・アクチエンゲゼルシヤフト
Priority date: 1997-07-10
Filing date: 1998-07-04
Publication date: 2001-07-24
Also published as: US6246979B1; DE19729494C2; DE59806874D1; DE19729494A1; EP0993672B1; EP0993672A1; ATE230889T1; WO1999003094A1

Abstract

(57)【要約】この発明は音声信号を符号化および／または復号化する方法に関する。この方法では、デジタル音声信号から予測パラメータを求める音声信号分析が行われる。適応コードブック（３）から励起信号成分（Ｅltp ）を求める。その場合、適応コードブックは遅延された全励起信号（Ｅv ）で形成されている。更に、考慮された励起信号から生じる信号の入力音声信号からの重み付け濾波されたずれの効率を最小化して励起信号の多パルス成分（Ｅmpe ）を（４）内で求める。

Description

【発明の詳細な説明】

【０００１】この発明は、特にデジタル録音装置に対する音声信号を符号化および／または
復号化する方法に関する。

【０００２】音声信号を符号化するため、通常この音声信号を先ず４ kＨz 以下の遮断周波
数で低域濾波し、得られた信号を８ kＨz のサンプリングレートでサンプリング
する。サンプリングされた信号はデジタル音声信号に変換される。この信号は一
連の音声信号サンプリング値で構成されている。この一連の音声信号サンプリン
グ値から音声信号のエンコーダとデコーダ内で必要となる予測パラメータを求め
る。更に、各音声信号サンプリング値に対して前記予測パタメータとその都度予
測された音声信号サンプリング値を使用して予測値を計算する。各信号サンプリ
ング値とその予測値との間の差を量子化し、デジタル符号化し、予測パラメータ
と共に変調して記憶媒体に導入する。この記憶媒体は、例えば磁気テープもしく
はＲＡＭ記憶器である。記憶媒体で再現される信号は個々の部分信号に分割した
後、元の音声信号をできる限り忠実に元に戻すために音声デコーダ内で使用され
る。

【０００３】上記の基本原理に従って動作する従来の技術は、米国特許第 4,133,976号明細
書、米国特許第 3,631,520号明細書および米国特許第 3,502,986号明細書により
周知である。

【０００４】この従来の技術を前提として、この発明の課題はデジタル録音装置で録音され
た音声信号の再生品質をどのように改善するかの道筋を提示することにある。

【０００５】この課題は、請求項１の方法の特徴を前提として解決されている。有利な種々
の構成や改良は従属請求項に開示されている。

【０００６】この発明の利点は、この方法がインターブロック符号化なしに動作するので、
割込挿入や録音した信号の部分消去のような編集機能を可能にする点にある。

【０００７】請求している方法が音声信号の録音と再生に関して最適であるとしても、音楽
あるいは任意の騒音、例えば混合音声、自動車の騒音等のような他の信号も満足
な品質で録音して再生できる。

【０００８】以下、この発明の特徴を一つの実施例について例示的に説明する。この実施例
は、この発明による構成の可能性を徹底的に枚挙するのでなく、例示的な特徴を
有しているにすぎない。複数の請求項の構成を個々にあるいは任意の組み合わせ
で利用できる。

【０００９】この方法は以下のように動作する。つまり、デジタル音声信号は前処理した後
ブロックにして更に処理される。先ず、前処理したデジタル音声信号ｓをＬＰＣ
分析（ＬＰＣ＝ linear-praediktive Codierung ；線形予測符号化）に掛ける、
この分析ではデジタル音声信号からＬＰＣパラメータａを求める。これ等のパラ
メータはデジタル音声信号ｓからＬＰＣ残留信号ｒを発生させるため反転フィル
タ内で使用される。ＬＰＣパラメータａとＬＰＣ残留信号ｒに基づき、ＬＴＰ分
析、所謂長時間予測分析およびパルスパラメータ発生が行われる。代わりの実施
例では、音声信号ｓを濾波しないでも、あるいは前記反転濾波以外の後に、ＬＴ
Ｐ分析および／またはパルスパラメータ発生に導入してもよい。

【００１０】このＬＴＰ分析とパルスパラメータ発生には残留信号ｒとＬＰＣパラメータａ
に加えて、下位ブロックだけ遅らせた全励起信号ｅ_vが導入される。ＬＴＰ分析
の結果として、励起ベクトルｅ_ltpを決めるパラメータが得られ、パルス発生の
結果として励起ベクトルｅ_mpeを決めるパラメータが得られる。

【００１１】励起ベクトルｅ_ltpとｅ_mpeを発生させて加算する。これにより全励起信号ｅ
を得る。次いで、この全励起信号ｅは下位ブロックだけ遅延される。これにより
下位ブロックだけ遅らせた全励起信号ｅ_vが生じる。

【００１２】この入力信号はサンプリングレートが 12 kＨz のデジタル音声信号である。この信号を先ず高域濾波する。この場合、高域フィルタの（下限）遮断周波数は
50 Ｈz である。これにより、デジタル音声信号は次の分析に対して乱れた影響
を与える直流成分と低周波成分が除去される。高域フィルタの伝達関数は、

【外１】である。

【００１３】その外、このデジタル信号は伝達関数

【外２】を有する一次のＦＩＲフィルタを使用するプリエファシスに掛ける。このプリエ
ファシスは約１〜 1.5 dＢのレベルの僅かな上昇を与える。

【００１４】次に、ブロック形成を行う。このブロック形成では、信号をそれぞれ 324のサ
ンプリング値、つまりそれぞれ 27 msの互いに重なった分析ブロックにセグメン
ト化が行われる。隣接するブロックの重なりの各々は 3 ms の期間に相当する。
分析ブロック内の中心にある 24 msの期間の合成ブロックは何れもそれぞれ 6 m
s の期間の四つの下位ブロックで構成されている。この場合、更に以下で説明す
るＬＴＰ分析とパルスパラメータ発生が各下位ブロックに対して行われる。つま
りブロック当たり４回行われる。

【００１５】ＬＰＣ分析は例えば以下の説明に従って行われる。先ず、各分析ブロックを台
形窓処理に掛ける。この窓は、以下のように規定される。つまり、

【外３】

【００１６】次のステップでは、以下の式による自動相関シーケンスを計算する。つまり

【外４】ここで、ｓ_w(n) は窓処理された入力セグメントを表す。自動相関シーケンスの最初の値φ_xx(0) は、次の計算で数値的に望ましくするため、1.0004の係数を乗
算して大きくされる。

【００１７】これにより得られた自動相関シーケンスにより、例えば再帰的なダービン・レ
ビンソン（Durbin-Levinson)アルゴリズムを用い、ａ₀''＝１にして線形方程式の系、

【外５】を解いて、ＬＰＣ予測パラメータを算出する。

【００１８】このＬＰＣ予測パラメータの帯域幅を 20 Ｈz だけ広げる。この場合、ＬＰＣ
予測パラメータに対して関係式、

【外６】を使用する。ここで、

【外７】である。この帯域幅拡張によりＬＰＣスペクトルのフォルマントが広がるので、
復号化された音声信号の再生は柔らかく快適になる。

【００１９】今まで説明した前処理は信号の有効な圧縮を可能にするＬＰＣパラメータを効
果的に求めるためにある。更に信号処理を行うと、音声信号の元に忠実な再生を
与えるＬＰＣパラメータの量子化を改善する。

【００２０】次のステップでは、修正されたＬＰＣ予測パラメータが反射係数に換算され
る。これは再帰則、

【外８】により行われる。

【００２１】結局、反射係数は全体が 52 ビットの 14 のスカラー量子を使用して量子化さ
れる。この場合、係数ｋ₀' 〜ｋ₁₃' に対して５，５，４，４，４，４，４，４，３，３，３，３，３または３ビットを使用する。この量子化は反射係数に対
する値を含む記憶された表を使用して行われる。その場合、この量子化は、例え
ばユークリッド距離を最小化して行える。この量子化は 14 個の量子化された反
射係数ｋ_iの組を与える。ここで、０≦ｉ≦ 13 。

【００２２】この量子化の後、ＬＰＣパラメータは次の再帰公式により計算される。即ち、

【外９】

【００２３】ＬＰＣパラメータａはＬＰＣ分析の結果としてＬＴＰ分析とパルスパラメータ
発生の入力量として使用される。スカラー量子化では、その時の反射係数記憶器

【外１０】された他の量と共に記憶され、再生側で音声復号化を行う時、音声信号を復元す
るために使用される。その場合、ブロック当たり全部で 14 個のＬＰＣパラメー

【外１１】

【００２４】ＬＴＰ分析は以下のように行われる。入力信号として、ＬＴＰ分析にはＬＰＣ
分析で求めたＬＣＰパラメータａの外に、ＬＰＣ残留信号ｒ(n) （０≦ｎ≦ 71
）および遅延させた全励起信号ｅ_vが導入される。このＬＰＣ残留信号ｒ(n) は
それぞれ一つの下位ブロックに付属し、入力したデジタル音声信号ｓがＬＰＣ反
転フィルタ、

【外１２】を通して導入することにより求まる。このため、反転濾波にはＬＰＣ分析の範囲
内で求めたＬＰＣパラメータａも導入される。

【００２５】ＬＰＣパラメータａに重み係数γ_Itp＝ 0.7で重みを付ける。即ち、

【外１３】このようにして重みを付けたＬＰＣパラメータは、フィルタ、

【外１４】のパルス応答の最初の 36 個のサンプリング値、

【外１５】を計算するために使用される。この場合、重み付きＬＰＣパラメータａ_i ^(Itp) とパルス応答ｈ^(Itp)の計算がブロック毎に一回行われるが、各下位ブロックに
対する他の計算は個々に行われる。

【００２６】ＬＰＣ残留信号ｒ(n) からフィルタ

【外１６】により重み付き入力信号、

【外１７】が求まる。

【００２７】適応コードブックの検索に対する目標ベクトル、

【外１８】は信号、

【外１９】を信号ｘ_Itp(n) から引算して得られる。この信号ｙ_Itp(n) も伝達関数、

【外２０】を有するフィルタから得られる。このフィルタには零信号が入力し、更に重みを
付けたＬＰＣパラメータａ_Itpが導入される。この場合、フィルタ状態量は各下
位ブロック濾波の前に、全励起信号ｅが印加するフィルタ、

【外２１】がそれぞれ前の下位ブロックの端部に有する値に設定される。

【００２８】コードブックの検索はそれぞれ 72 のサンプリング値のコード語にわたる長さ
に延びている。これ等の長さは通過した 186の全励起信号サンプリング値ｅ(n)
から以下の関係、

【外２２】により形成される。ここで−186 ≦ｎ≦−１である。この場合、

【外２３】が成立する。

【００２９】適応コードブックの検索では整数の遅延ｍのみを考慮する。適応コードブック
の検索は 151の遅延の全範囲にわたり各ブロックの最初の下位ブロックでのみ行
われる。各ブロックの他の下位ブロックでは 48 の遅延の減少した範囲のみがそ
れぞれ検索される。この範囲は、先の下位ブロックで求めた遅延に依存し、以下
の式で決まる。即ち、

【外２４】この場合、Ｍ_prevはそれぞれ前の下位ブロックをＬＴＰ分析して生じた遅延であ
る。

【００３０】最良の遅延Ｍの選択は、

【外２５】を求めて行われる。この場合、

【外２６】が当てはまり、ｆ_m(n) はパルス応答ｈ^(Itp)(n) で定まるＦＩＲフィルタのコー
ド語ｃ_m(n) への応答であり、このフィルタの消去された状態記憶器に由来する。

【００３１】最適な遅延Ｍを決定した後、付属する最適な増幅率を式、

【外２７】により計算する。次いで、５ビット線形量子化器で、例えば記憶された表を使用
してこの増幅率を量子化する。得られた量子化された増幅率βは次の式により適
応コードブックから得られた実際の下位ブロックに対する励起ベクトルの成分を
計算するために使用される。即ち、

【外２８】四つの下位ブロックで得られた遅延は全部で 24 ビットを使用して次のように符
号化される。即ち、Ｍ_Sが下位ブロックｓ（１≦ｓ≦４）の遅延であることを前
提として、 24 ビットの遅延コードは以下の式で計算される。つまり、

【外２９】この場合、ｍ_min(s) は下位ブロックｓでの遅延に対する検索範囲の下限である。

【００３２】説明した方法によりＬＴＰ分析の範囲内で各下位ブロックに対して、適応コー
ドブックから求めた実際の下位ブロックに対する励起ベクトルの成分である信号
ｅ_Itp(n) を求める。更に、各ブロックに対して遅延コード lagscode および増

【外３０】幅率に対する４つの量子化指数βを求める。これ等の指数はそれぞれ増幅率βの
値を記憶している付属する表記憶器のアドレスに対応する。上記係数 lagscode

【外３１】とβは他の符号化された量と共に記録され、再生側で音声復号化時に音声信号を
復元するために使用される。

【００３３】更に、パルスパラメータ発生を詳しく説明する。パルスパラメータ発生は、ＬＰＣ分析で求めたＬＰＣパラメータａの外に、Ｌ
ＰＣ残留信号ｒ(n) ，遅延された全励起信号ｅ_vおよびＬＴＰ分析で求めた全励
起信号成分ｅ_Itpを使用する。

【００３４】ＬＰＣパラメータａは重み係数γ_mpe＝ 0.9で重み付けされる。即ち、

【外３２】このように重み付けしたＬＰＣパラメータは、フィルタ、

【外３３】のパルス応答の最初の 42 のサンプリング値、

【外３４】を計算するために使用される。ここでもＬＴＰ分析の場合のように、ブロック当
たり一度重み付けされたＬＰＣパラメータａ_i ^(mpe)およびパルス応答ｈ^(mpe)(n
) の計算が行われる。更に、ここでパルス応答ｈ^(mpe)(n) から次の式により自動相関シーケンスを求める。つまり、

【外３５】他の計算はそれぞれ各ブロックについて個々に行われる。

【００３５】目標ベクトル、

【外３６】の計算は、原則的にＬＴＰ分析での目標ベクトルｔ_Itpの計算と同じ計算則を使
用して行われる。ここでも、入力信号の重み付け表示ｘ_mpe(n) が、

【外３７】でＬＰＣ残留信号を濾波して生じる。更に、信号ｙ_mpe(n) は適応コードブックから零信号でなく、励起信号成分をフィルタ、

【外３８】で濾波して得られる。この状態量は各下位ブロック濾波の前に、全励起信号ｅが
入力するフィルタ、

【外３９】が先行する下位ブロックの終わりで有する値にセットされる。

【００３６】パルスパラメータを求めることは、パルス応答ｈ^(mpe)(n) ，自動相関シーケンスｈｈ^(mpe)(n) および目標ベクトルｔ_mpe(n) を使用して行われる。これ等の
パルスパラメータは励起パルスが出力されなければならない各下位ブロックの７
つの位置を与え、更にパルス振幅に関する情報も有する。

【００３７】これに対して、ベクトル th(n)を次の式により求める。つまり、

【外４０】この時、第一のパルス位置は、

【外４１】で与えられる。求めた th 値は、

【外４２】に記憶され、これは長さ７のベクトル変数の第一要素である。第二のパルス位置
は以下のように求める。つまり、

【外４３】

【外４４】

【００３８】残った五つのパルス位置は、一つのループ内で以下のように求められる。つま
り、

【外４５】

【００３９】説明した方法で７つのパルス位置を全て求めると、以下の再帰関係式を使用し
て付属するパルス振幅ｂ_j（１≦ｊ≦７）が得られる。即ち、

【外４６】

【００４０】こうして求めた７つのパラメータの対 [ｐ_j,ｂ_j] ，それぞれパルス位置とパルス振幅は、最後に求めたパルスパラメータの対 [pos_j,amp'_j] のパルス位置に
対する値が減少順となる、つまり、

【外４７】のように再分類される。この再分類は次の位置符号化に必要で、この位置符号化
は 31 ビットの位置コードを与える。この位置コードは二組の係数の和として計
算される。つまり、

【外４８】

【００４１】パスル振幅 amp' は以下のように量子化される。即ち、ブロック最大値、つま
り７つのパルス振幅の値の最大値は、例えば記憶された表を用いて６ビットで非
線形量子化され、次いでパルス振幅を量子化されたブロック最大値で規格化し、
その次に、例えば他の表を用いて３ビットの線形量子化にかける。

【００４２】得られた非規格化された量子化パルス振幅 ampは最後に次の式によりパルス励
起ベクトルを形成するために使用される。即ち、

【外４９】

【００４３】説明した方法により、パルスパラメータ発生の範囲内で信号ｅ_mpe(n) を求め、実際の下位ブロックのパルスパラメータを用いて形成される励起ベクトルを求
める。

【外５０】量子化で生じ、８つの指数から成り、７つの振幅に加えてブロック最大値が量子
化される。これ等の係数は他の符号化された量と共に記録され、再生側で音声デ
コーダー内で音声信号を復元させるために使用される。これ等のパルスパラメー

【外５１】ブロックに対して一回行われる。

【００４４】更に、音声信号の復号化方法を説明する。

【外５２】付属する表を用いて 14 のＬＣＰパラメータａを求める。更に、各下位ブロック
に対して他のパラメータＭ，β，pos と ampが復元される。この場合、一つのブ
ロックの４つの下位ブロックに対するＬＴＰ遅延Ｍ₁〜Ｍ₄は 24 ビット値 lag
scode から以下のように求める。即ち、

【外５３】この場合、ｍ_min(s) は各下位ブロックの遅延に対する検索範囲の下限であり、

【外５４】

【００４５】下位ブロックの５ビットで符号化されたＬＴＰ増幅率の値βは、例えば表記憶
器により求める。

【００４６】下位ブロックの７つのパルス位置 pos_j（１≦ｊ≦７）は以下の計算式を使用
して 31 ビットの長さの位置コード poscodeから得られる。即ち、

【外５５】

【外５６】ビットで符号化されたブロック最大値を、例えば付属する量子化表に基づき復号
化し、その次に規格化された７つの振幅を復号化することにより得られる。最後
に、復号化されたパルス振幅 ampをそれぞれ復号化されたブロック最大値と復号
化された規格化振幅の積として求める。

【００４７】各下位ブロックに対して求めたＭ，β，pos と ampに対する値から、次のステ
ップで励起信号を計算する。この計算は下位ブロックの各々に対して行う。つま
りブロック当たり４回行う。

【００４８】先ず、適応コードブックから得られた成分を以下のように計算する。即ち、

【外５７】ここで、ｃ_M(n) は遅延Ｍに付属する適応コードブックの記入値である。

【００４９】次いで、パルス励起ベクトル、

【外５８】を求める。その結果、励起信号ｅ(n) は、

【外５９】となる。

【００５０】出力音声信号は、ＬＰＣパラメータａで求まるＬＰＣ合成フィルタ、

【外６０】から求まり、これには全励起信号ｅ(n) が入力する。

【００５１】最後に、再処理段でデエンファシスにより録音側で大きくされた音声信号の高
い周波数を低下させることが伝達関数、

【外６１】を有するフィルタで行われる。更に、一定の再濾波あるいは適応濾波により、こ
のように再構築された音声信号の主観的な質の印象が影響を受ける。

【００５２】この発明の有利な構成によれば、上に説明した方法のビットレートは可変でき
るので、一般に周囲の雑音レベルが低い時、有効、つまり平均ビットレートを低
減できる。この構成では、入力信号を音声休止の発生に関して監視する音声活性
度検出器が使用されている。この音声休止の間にある信号は品質を低下させて伝
達されるか、記憶されるので、音声休止の期間中の信号は音声の存在時より相当
低いビットレートで符号化される。

【００５３】音声活性度検出器を実現するため信号エネルギを評価する。各合成ブロックに
対する入力信号の効率が、

【外６２】となる。この効率値は適応しきい値 Thrと比較される。このしきい値は以下のよ
うにして求める。即ち、

【００５４】雑音効率の予測値Ｐ_nは関係式、

【外６３】によりその時のブロックの信号エネルギＰよりも大きくならない限り、ブロック
毎に大きくされる。この条件が満たされないなら、この予測値はリセットされ、

【外６４】となる。Ｐ_nをこのようにした後、場合によって、範囲、

【外６５】の外にある結果は上限もしくは下限にセットされる。雑音効率に対する予測値の
初期化は、しきい値・遷移期間中に低レベルの音声信号を音声休止と解釈するこ
とを避けるため、

【外６６】で行われる。このしきい値・遷移期間を短く保持するため、最初の 50 ブロック
を処理する間に生じる入力信号の最小効率Ｐ_minを求める。この最初の 50 ブロ
ックの後、音声休止が認められない限り、Ｐ_minがＰ_nより大きい時、雑音効率
の予測値を関係式、

【外６７】により高める。

【００５５】雑音効率に対するこの予測値に基づき、判定しきい値が以下のように計算され
る。即ち、

【外６８】次いで、その時のブロックに対して音声休止があるか否か、つまり、

【外６９】に関する暫定的な判定が行われる。

【００５６】音声休止があるか否かに関する最終的な判定は、関係式、

【外７０】により行われる。これは、現在のブロックと最後の５つのブロック内で求めた信
号効率がしきい値以下である時にのみ、現在のブロックを音声信号のないブロッ
クと分類することを意味する。

【００５７】音声信号のないブロックはスペクトラルカラー化された雑音としてモデル化さ
れる。このブロックのために、その時零である音声活性度に加えて、ＬＰＣ係数
と増幅率が下位ブロック毎に記憶される。ＬＰＣ分析と反射係数の符号化／復号
化は音声信号に対するのと同じように行われ、これは一ビット小さい 14 の反射
係数を量子化するためだけに使用される。

【００５８】デコーダ側で音声活性度のないブロックで生じる出力信号はＬＰＣ合成フィル
タの出力信号として現れる。これはそのように量子化されたＬＰＣパラメータで
定まり、ほぼ白色雑音信号が加わる。この信号は、増幅率δで等級付けされる−
１と１の間の振幅領域に均等に分布する乱数ｕ(n) を出力する擬似雑音発生器か
ら取り出せる。

【００５９】エンコーダ中では下位ブロック毎に一度そのような増幅率を求める。これは、
励起信号エネルギがＬＰＣ残留信号ｒ(n) のエネルギレベルより３ dＢ以下にあ
るレベルに合わせることによって行われる。増幅率を同時に５ビット量子化する
ため、これには記憶した表を使用して、式

【外７１】を非線形量子化された雑音増幅率δの全保管量に対して最小化する。音声信号な
しでブロックの期間にわたる全ビットレートは、

【外７２】となる。

【００６０】音声信号を有するブロックを符号化することおよび復号化することは、一定の
ビットレートの場合について上に説明したように大体行われる。ただ次の相違が
ある。即ち、

【００６１】 −各ブロックに対する音声活性度の記憶は、１ビットの 14 の反射係数を上に説明した一定のビットレートの実施例よりも少なく符号化することによりビットレートを変更することなく可能である。

【００６２】 −音声信号エンコーダおよび音声信号デコーダでは、適応コードブックが音声信号を有するブロックに由来する励起ベクトルのみを有することを確認する必要がある。これは、音声信号なしにブロックを符号化するために使用する雑音励起が適応コードブック内に組み入れてない、即ち適応コードブックが音声信号なしにブロックにあると活性化されないもしくは凍結されることを意味する。更に、デコーダ側の計算の範囲内では、重み付けフィルタのフィルタ記憶器と合成フィルタが音声信号なしのブロックから音声信号を有するブロックへ移行する毎にリセットされる必要がある。

【手続補正書】特許協力条約第３４条補正の翻訳文提出書

【提出日】平成１２年１月６日（２０００．１．６）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】０００３

【補正方法】変更

【補正内容】

【０００３】上記の基本原理に従って動作する従来の技術は、米国特許第 4,133,976号明細
書、米国特許第 3,631,520号明細書および米国特許第 3,502,986号明細書により
周知である。欧州特許出願公開第 0 657 874号明細書によりデジタル音声信号から予測パラ
メータを算出する音声エンコーダが知られている。適応コードブックに基づきこ
のエンコーダは励起信号成分を求める。更に、このエンコーダは音声信号から励
起信号の多パルス成分を求める。音声信号を処理する場合、音声信号が異なった
時間領域に分割され個々に処理される。米国特許第 5,327,520号明細書により逆適応性のＡＧＣにより既に記憶されて
いる比較用のコードベクトルが入力音声信号と比較される音声エンコーダが知ら
れている。簡単のため、これは表で管理される。 "Low Complexity Speech Coder for Personal Multimedia Communication",
IKEDO, J. et al, 1995 Fourth IEEE International Conference on Universal
Personal Communications Record, Gateway to the 21 ^st Century, Tokyo, 06
- 10, Nobember 1995 により、遅延された全励起信号から記入のある適応コード
ブックが知られている。このコードブックでは、第一下位ブロックをその都度完
全に調べるが、他の下位ブロックでは特定な部分領域のみしか検索しない。 "Efficient Computation and Encoding of the Multipulse Excitation for L
PC", Berouti, M. et al, ICASSP 84, Proceedings of the IEEE International
Conference on Acoustics, Speech and Signal Processing, San Diego, USA, 1
9 - 23 March 1984, pp. 10.1/1-4 によりパルス位置と付属する振幅に基づき多
パルス励起ベクトルを符号化する符号化方法が知られている。

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】図面の簡単な説明

【補正方法】追加

【補正内容】

【図面の簡単な説明】

【図１】デジタル口述装置用の音声信号エンコーダに対する実施例のブロック回路図、

【図２】ＬＰＣ分析を説明するための図１の回路ブロック１の詳細なブロック回路図、

【図３】ＬＴＰ分析を説明するための図１の回路ブロック３の詳細なブロック回路図、

【図４】パルスパタメータの発生を説明するための図１の回路ブロック４の詳細なブロ
ック回路図、

【図５】デジタル口述装置用の音声信号デコーダに対する実施例のブロック回路図、

【図６】音声信号のないブロックに対するデコーダのブロック回路図である。

【符号の説明】１音声信号分析器１１入力信号ブロックに重みを付ける回路１２自動相関シーケンスを計算する回路１３予測パラメータを計算する回路１４帯域を拡張する回路１５反射係数を求める回路１６量子化器１７予測パラメータを計算する回路２反転フィルタ２１重み付け回路２２合成フィルタ２３回路２４重ね合わせ回路２５合成フィルタ２６回路２７合成フィルタ３励起信号成分を求める回路４多パルス成分を求める回路４１重み付け回路４２合成フィルタ４３自動相関シーケンスを計算する回路４４回路４５重ね合わせ回路４６合成フィルタ４７回路４８合成フィルタ５加算器６遅延回路７パラメータ復号器７１表記憶器７２表記憶器７３計算回路７４回路７５回路７６雑音発生器７７多重化器７８合成フィルタ８励起信号を求める回路９合成フィルタ

【外７２】ａＬＰＣパラメータＡＢ(n) 分析ブロックａ_Itp 遅延された重み付け予測パラメータ amp 予測パラメータａ_mpe 重み付けされた予測パラメータｅ全励起信号ｅ_Itp 励起信号成分ｅ_Itp 励起ベクトルｅ_mpe 励起ベクトルｅ_v 遅延された全励起信号ｈｈ_mpe 自動相関シーケンスｈ_Itp パルス応答ｈ_mpe パルス応答ｒＬＰＣ残留信号ｓ音声信号ＳＢ(n) 合成ブロックｔ_Itp 目標ベクトルｔ_mpe 目標ベクトルＶ前処理回路ｘ_Itp 重み付けされた入力信号ｘ_mpe 出力信号ｙ_Itp 信号ｙ_mpe 出力信号

【手続補正書】特許協力条約第３４条補正の翻訳文提出書

【提出日】平成１２年１月６日（２０００．１．６）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

Claims

【特許請求の範囲】

【請求項１】音声信号を符号化する時、 −デジタル音声信号から予測パラメータを求める音声信号分析を行い、 −励起信号成分を適応コードブックから求め、この適応コードブックを遅延された信号で形成し、 −励起信号の多パルス成分を求め、そして、 −上記した求めることがその都度考慮される励起信号から生じる信号の入力音声信号からの重み付け濾波されたずれの効率を最小化して決定され、および、音声信号を復号化する時、 −量子化された伝達量を回収するためパラメータ復号化を行い、 −適応コードブックにより再生された成分から励起信号を発生することを行い、そして −励起信号と再生された予測パラメータを使用する合成濾波により再生された音声信号を形成することが行われる、特にデジタル口述装置のため音声信号を符号化および／または復号化する方法に
おいて、音声信号を符号化する時、 −一定数のサンプリング値を有する連続して重なり合うブロックにデジタル音声信号を処理し、励起信号パラメータを求めるためにその都度再び一定数のサンプリング値を有する一定数の下位ブロックに前記サンプリング値を分割し、 −予測パラメータを決定するためブロック毎に行われる音声信号の分析から生じる反射係数を個別に合わせた量子化表によりスカラー量子化にかけ、 −遅延された全励起信号から生じる記入事項からＬＴＰ分析時に使用する適応コードブックを形成し、前記全励起信号を各ブロックの最初の下位ブロックで完全に検索し、他方、他の下位ブロックではその都度前の遅延により決まるそれぞれただ一つの一定の部分領域のみを検索し、 −全ての下位ブロックに対する遅延値を符号化して共通に遅延コードにし、付属する増幅率を個々に線形量子化し、 −一つの下位ブロックに対して求めた多パルス励起ベクトルの各々が一定数のパルスの外に零サンプリング値のみを含み、その場合、それぞれ下位ブロックの前記パルス位置を符号化して共通に位置コードにし、振幅値の最大値を非線形量子化し、規格化されパルス振幅を線形量子化するブロックに適応する線形量子化に付属する振幅をかけ、および、音声信号を復号化する時、 −量子化された反射係数を復元するため表記憶器を用いてパラメータの復号化を行い、 −パラメータを復号化する時に適応コードブックから求めた成分に対する遅延を遅延コードから算出し、その場合一つのブロックの最初の下位ブロックに対する遅延が遅延された全励起信号のサンプリング周期の範囲内にあり、他の下位ブロックに対する遅延がそれぞれ先行する遅延により定まる範囲内にあり、 −パラメータを復号化する時に適応コードブックから求めた励起信号の成分に対する線形化された増幅率を算出するか、一つの表から復元し、 −パラメータを復号化する時に一つの下位ブロックの励起ベクトルの多パルス成分に対する各パルス位置を算出し、その場合それぞれ位置コードから下位ブロックの位置値を復元し、 −パラメータを復号化する時に一つの下位ブロックの励起信号の多パルス成分に対するパルス振幅を求め、その場合、それぞれ非線形量子化されたブロック最大値と線形量子化され規格化されたパルス振幅を復元し、その時、下位ブロックの量子化され非規格化されたパスル振幅を乗算により再生する、ことを特徴とする特にデジタル口述装置のため音声信号を符号化および／または
復号化する方法。
【請求項２】デジタル音声信号をサンプリングするため、 11 と 13 kＨz の間のサンプリング周波数を使用し、一つのブロックのサンプリング値の個数は下
位ブロックの個数の複数倍に設定されていることを特徴とする請求項１に記載の
特にデジタル口述装置のため音声信号を符号化および／または復号化する方法。
【請求項３】サンプリング値の個数を 288に設定し、下位ブロックの個数を４
に設定し、下位ブロックのサンプリング値の個数を 72 に設定することを特徴と
する請求項２に記載の特にデジタル口述装置のため音声信号を符号化および／ま
たは復号化する方法。
【請求項４】反射係数の個数を 14 に設定し、その量子化に対して５，５，
４，４，４，４，４，４，３，３，３，３，３または３または２ビットを利用す
ることを特徴とする請求項１に記載の特にデジタル口述装置のため音声信号を符
号化および／または復号化する方法。
【請求項５】適応コードブックを発生させるため、 36 と 186の間のサンプリ
ング周期だけ遅延させた全励起信号値を使用し、第二の下位ブロック以降に検索
すべき部分領域をそれぞれ 48 の遅延値に設定し、遅延コードを 24 ビットの長
さに設定し、５ビットで増幅率の線形量子化を行うことを特徴とする請求項１に
記載の特にデジタル口述装置のため音声信号を符号化および／または復号化する
方法。
【請求項６】他の処理を行う前に、非常に低い低周波成分を抑制し、高い周波
数の成分を軽く強調する前置濾波に符号化すべき音声信号をかけることを特徴と
する請求項１に記載の特にデジタル口述装置のため音声信号を符号化および／ま
たは復号化する方法。
【請求項７】予測パラメータを求めるため音声信号分析を一定の時間範囲に利
用し、前記時間範囲はブロックをそれぞれ一定の時間間隔だけ過去と未来に突出
させるので、隣接する分析部分に生じる重なりにより、音声信号の非一定性を分
析結果に利用することを特徴とする請求項１〜６の何れか１項に記載の特にデジ
タル口述装置のため音声信号を符号化および／または復号化する方法。
【請求項８】分析時間範囲の特定な長さは 27 msであり、その範囲は処理ブロ
ックに対して中心に置かれていることを特徴とする請求項７に記載の特にデジタ
ル口述装置のため音声信号を符号化および／または復号化する方法。
【請求項９】安定化を伴う自動相関方法による 14 次のＬＰＣ分析を行う前に
それぞれ 14 のサンプリング値の窓エッジ長さを持つ台形窓付けに分析部分をか
け、遮断周波数が 50 Ｈz の前置濾波を行い、個々に合わせた代表値の表の記入
から非量子化された値のユークリッド間隔を単純に最小化して反射係数のスカラ
ー量子化を行い、得られたＬＰＣパラメータを係数 0.7の重み付けにかけ、これ
により適応コードブックから励起信号成分を求めるためにＬＴＰ分析を行い、こ
の分析ではそれぞれ当該コードブック記入から得られた信号の入力信号音声信号
からの重み付け濾波したずれの効率を最小化し、そして予測パラメータの決定か
ら得られたＬＰＣパラメータを係数 0.9の重み付けにかけ、これにより励起信号
の多パルス成分を求めることを特徴とする請求項１〜８の何れか１項に記載の特
にデジタル口述装置のため音声信号を符号化および／または復号化する方法。
【請求項１０】音声信号符号化および／または音声信号復号化を可変ビットレ
ートで行い、音声休止の出現に関して入力信号を監視し、音声休止を認識し、音
声休止の監視では入力信号の信号効率を評価し、音声休止の監視では入力信号の
信号効率を適応しきい値と比較し、入力信号の信号効率の評価をブロック毎に行
い、連続する多数のブロック内で求めた信号効率がしきい値以下にある時、音声
休止を検出し、音声休止の存在の識別符号として音声ビットを保管し、音声信号
のないブロックがある時、雑音発生器で励起信号ベクトルを受信側で発生させる
ことを特徴とする請求項１〜９の何れか１項に記載の特にデジタル口述装置のた
め音声信号を符号化および／または復号化する方法。