JP3564144B2 - “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 - Google Patents
“前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 Download PDFInfo
- Publication number
- JP3564144B2 JP3564144B2 JP54355598A JP54355598A JP3564144B2 JP 3564144 B2 JP3564144 B2 JP 3564144B2 JP 54355598 A JP54355598 A JP 54355598A JP 54355598 A JP54355598 A JP 54355598A JP 3564144 B2 JP3564144 B2 JP 3564144B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- lpc
- stationarity
- analysis
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004458 analytical method Methods 0.000 title claims description 197
- 238000000034 method Methods 0.000 title claims description 73
- 238000001914 filtration Methods 0.000 claims description 154
- 238000007670 refining Methods 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 26
- 230000005236 sound signal Effects 0.000 claims description 21
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 14
- 230000007704 transition Effects 0.000 claims description 13
- 230000006978 adaptation Effects 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 2
- 238000012423 maintenance Methods 0.000 claims 3
- 230000006870 function Effects 0.000 description 88
- 238000012360 testing method Methods 0.000 description 24
- 230000005540 biological transmission Effects 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 238000012886 linear function Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Radio Relay Systems (AREA)
Description
現在、音声周波数、特にスピーチ信号のための符号化技術の目的は、ユーザー間の交流のかなりの発展を考慮して、特に、これらの信号を送信するためのネットワークに適応した管理を確実にすべく送信出力を減少させるという条件の範囲内で、これらの信号をディジタル形成で送信することを考慮することである。
用いられている符号化技術の中でも、LPC(線形予測符号化、英語では“Linear Predictive Coding")分析として示される符号化技術は、符号化されるべき音声周波数信号の線形予測を行うことからなり、符号化は、この信号の連続的なブロックに適用された線形フィルタリング予測によって一時的に行われる。
前述の技術の中でも、CELP(Code Excited Linear Prediction)符号化として公知の技術は、最も広まっており、かつ、ある最良の成果をもたらしている。MP−LPC(Multi Pulse Linear Predictive Coding)またはVSELP(Vector Sum Excited Linear Predictive)技術として示される技術のような他の技術は、CELP符号化に比較的類似している。
前述の符号化技術は、“合成による分析(analysis by synthesis")として公知である。これらの技術は、特に電話通信の(telephonic)周波数帯域に属している音声周波数信号に対して、これらの信号の送信出力が、CELP符号化技術によって64kb/s(MIC符号化)から16kb/sまで、さらに、8kb/sまでさえも減少されることを可能にしてきた。この状態で、これらの符号器は、送信および符号化の後に再構成された音声の質においていかなる認識可能な劣化をもさせないという、この符号化技術の最も最近の発展した状態を用いている。
これらの符号化技術のための適用の特に重要な分野は、詳細には、移動電話通信(mobile telepony)の分野である。適用されたこの分野において、各々の移動電話通信の操作者に与えられた周波数帯域と加入者数の非常に急速な増加とに関する必要な制限は、それに対応する符号化出力の減少を必要とし、その一方で、通話品質に関するユーザーの要求は増大し続ける。これらの符号化技術が適用された他の分野は、例えば、これらの信号を表すディジタルデータのメモリへの格納、ビデオまたは音声会議への適用のための高品質な電話通信、マルチメディアまたは衛星経由のディジタル送信に関わっている。
前述の技術において用いられる線形予測フィルタは、連続的なディジタル信号ブロック上で動作する“LPC分析”と称される分析モジュールにより得られる。これらのフィルタは、分析の次数(order)、すなわち、フィルタ係数(filter coefficients)の数に応じて、符号化されるべき信号の周波数スペクトルの輪郭(contour)を、多少なりとも信頼できるものとしてモデリング(modeling)可能である。スピーチ信号の場合、これらの輪郭はフォルマント(formant)と称される。
しかしながら、最新の適用に必要とされる質の良い符号化のためには、このように定義されたフィルタは、信号を完全にモデリングするためには十分ではない。したがって、線形予測の残余(residue)を符号化することは不可欠である。線形予測残余に関連するこのような動作モードの1つは、特に、この記載の中で前述された符号化技術LD−CELP(Low Delay CELP)において用いられる。この場合に、残余信号は、確率的なコードページ(stochastic codepage)からとられ、かつ、ゲイン値(gain value)により増大された波形によりモデリングされる。例えば、MP−LPC符号化技術は、それぞれのゲイン値により変更された可変位置パルス(variable position pulses)によりこの残余をモデリングするのに対し、VSELP符号化技術は、適切なリストからとられたパルスベクトルの線形的な組み合わせによって、このモデリングを行う。
LPC分析および、特に“後方"LPC分析および“前方"LPC分析の動作方法の説明のための要約は、以下に与えられる。
周波数スペクトルの概略的な包絡線は、LPCフィルタを構成している短期の(short−term)合成フィルタによってモデリングされ、前記LPCフィルタの係数は、符号化されるべきスピーチ信号の線形予測によってモデリングされる。このLPCフィルタ、つまり自動回帰(autoregressive)フィルタは、式(1)の形の伝達関数を有している。
ここで、pは係数名を示し、aiはフィルタ名および適用される線形予測の次数を示し、zは、周波数の空間の変換された変数zを示す。
係数aiを評価する1つの方法は、スピーチ信号の分析長さ(analysis length)にわたってのスピーチ信号のエラー予測信号のエネルギーの最小化の基準を適用することからなっている。
連続的なサンプルから形成されたディジタルスピーチ信号の分析長さは、実際の期間においては、符号化フレーム(coding frame)を構成しているこれらのサンプルの数Nである。したがって、エラー予測信号のエネルギーは、式(2)を立証する。
ここで、s(n)は、Nサンプルのフレームにおける列nのサンプルを示す。
ブロック毎の符号化処理において、符号化フレームは、都合良く幾つかのサブフレームまたは隣接するLPCブロックに分けられる。そして、分析長さNは、一定数の過去のサンプルを、またはもし適用可能ならば、今後のサンプルを考慮することを可能にすべく、適切な符号化の遅延によって、かつ、該遅延を犠牲にして各々のブロックの長さを超える。
LPC分析処理が、符号化されるべきスピーチ信号の現在のフレームのブロックに行われるときに、この分析は“前方"LPCと称される。符号化は、符号器のレベルで“リアルタイムで”、すなわち、現在のフレームのブロックの間に生じ、唯一の処理遅延は、フィルタ係数の計算により導入される。この分析は、フィルタ係数の計算された値を復号器へ送信することに関わっている。
16kb/sのLD−CELP符号器において用いられる“後方"LPC分析は、標準UIT−T G728の目的である。この分析技術は、符号化されるべきスピーチ信号の現在のフレームのブロックにではなく、合成信号にLPC分析を行うことからなっている。このLPC分析が、実際には現在のブロックの前のブロックの合成信号に行われることが理解される。その理由は、この信号が、符号器と復号器とのレベルで同時に利用可能であるためである。したがって、この符号器と復号器との同時動作は、LPCフィルタ係数の符号器において得られた値を、符号器から復号器へ送信することを避けることを可能にする。この理由のために、“後方"LPC分析は、送信出力を開放することを可能にし、かつ、このように開放された出力は、例えば、CELP符号化の場合に励起コードページ(excitation codepage)を高めるために用いられ得る。さらに、“後方"LPC分析は、分析の次数の増加を許容する。LPCフィルタ係数の数は、“前方"LPC分析を用いている大部分の符号器の10係数に比べて、LD−CELP符号器の場合には50ほどであってもよい。
したがって、“後方"LPC分析の正確な動作には、以下の条件が必要とされる。
− 符号化されるべきスピーチ信号に非常に近く、現在のCELP符号器の質を考慮して13kb/s以上の十分に高い符号化出力を含む質の良い合成信号。
− 分析された信号と符号化されるべき信号との間の1ブロックの遅延により減少され、それゆえに、符号化されるべきスピーチ信号の平均定常時間(mean stationary time)と比較して短いべきであるフレームとブロックとの長さ。
− 数個の送信エラーの導入により、符号器と復号器との間で送信されるデータの完全性に関する送信および変換の信頼性。合成信号が、符号化されるべき音声信号と著しく異なるとすぐに、符号器および復号器は、同じフィルタの計算を中止し、符号器および復号器において計算されたフィルタのそれとわかるような類似点に戻ることができずに、大きな相違(divergence)が生じ得る。
前述の“後方”および“前方”形式のLPC分析のそれぞれの利点および不都合のために、“後方”および“前方"LPC分析を選択的に結びつけることからなっている1つの技術が、“Dual Rate Low Delay CELP Coding(8kb/s/16kb/s)using a Mixed Backward/Forward Adaptive LPC Prediction"(Published by S.PROUST,C.LAMBLIN,and D.MASSALOUX,Proc.IEEE Workshop Speech Co.Telecomm.,Sept.1995,pp37−38)という題目の論文に提案された。
“後方"LPC分析の正確な機能に関して上述した条件は、明らかに16kb/s以下の送信出力で動作しているときに、この形式の分析が前述の制限を単独で呈することを示している。LPCフィルタの性能を減少させる、合成信号の質の低下に加えて、送信出力を減少させるべく、約10〜30msの、より大きなLPCフレーム長さによって動作することがしばしば必要である。したがって、これらの条件の下では、劣化が、特に周波数スペクトルの移行(transitions)の間に、さらに、より一般的には、それほど定常的(stationary)でない領域においても生じることが理解できる。その理由は、音楽信号のような一般に非常に定常的な信号に対して、“後方"LPC分析は、“前方"LPC分析に対してかなりの利点を有しているためである。
前述の2つの形式のLPC分析の結びつきは、これらの不都合を減少させ、かつ、各々に特有の(以下の)利点を増大させることを目的とする。
− 移行と非定常領域との符号化のための“前方"LPC分析。
− 定常領域の符号化のための、より広い範囲までの“後方"LPC分析。
さらに、“前方"LPC分析により符号化されたLPCフレームを、“後方”(LPC)分析により符号化されたLPCフレームに差し入れることは、送信エラーの場合に符号器および復号器が同一の合成信号に再収束することを可能にし、したがって、“後方"LPC分析単独により符号化するよりも、はるかに優れたエラー防護を提供する。
一般に、上述の混合された“前方”−“後方"LPC分析は、符号化されるべきスピーチ信号または音声周波数の“前方"LPC分析と、合成信号の“後方"LPC分析という2つのLPC分析を行うことからなっている。
2つのフィルタは、各々のLPCブロック用に計算され、これらのフィルタは、それぞれ“前方"LPCフィルタおよび“後方"LPCフィルタとして示される。したがって、信号が定常的か否かに応じて、LPCブロックに適用されるフィルタを選択する手順が適用される。この手順は、(以下の)2つの異なった基準を必要とする。
− フィルタの予測ゲインに基づいた第1の基準。
− 連続的に計算された“前方"LPCフィルタ間のディスタンス・パラメータ(distance parameter)に基づいた第2の基準。
これらの2つの基準の各々に対して、しきい値(threshold value)が設定されている。
第1の基準
“後方”および“前方"LPCフィルタの予測ゲイン間のディスタンスが、第1のしきい値よりも大きい場合に、“後方"LPCフィルタの選択がなされる。
第2の基準
2つの連続した“前方"LPCフィルタを表しているパラメータのベクトルにおいて計算されたディスタンスが第2のしきい値よりも低い場合には、“後方"LPC分析モードにおける現在の分析のために、“後方"LPC分析モードから“前方"LPC分析モードへの切り換えの禁止する。あまりに小さいディスタンスは、多少なりとも定常的な領域を特徴づけており、この理由により、LPC分析モードを変化させるのを避けることは適切である。計算されたディスタンスは、符号化されるべき音声または音声周波数信号のスペクトル線間のユークリッド距離(Euclidean distance)である。
前述の混合されたLPC分析方法のより詳細な記載は、前述のS.プルースト(S.PROUST)、C.ランブリン(C.LAMBLIN)およびD.マッサルー(D.MASSALOUX)により発表された論文中に見出され得る。
前述の混合された分析の動作方法に関する綿密な研究は、以下の重要な不都合を示している。
− ある信号に対し、“前方”および“後方"LPCフィルタの予測ゲイン値は、前記の第1のしきい値以上またはそれ以下に発振し得る。この現象は、“後方"LPCフィルタから“前方"LPCフィルタへの、またはその逆の、突然の、かつ、頻繁な変化につながる。こうして導入されたフィルタリングの不連続性は、合成信号のかなりの劣化のソースを構成し、かつ、大部分の時間に、符号化されるべき音声または音声周波数信号の実際のスペクトルの変更に結びつかない。
− 設定されるべき第1のしきい(値)の最適値は、符号化されるべき信号が定常的は否かに応じてかなり変動し、符号化出力が低いときには、さらに大きく変動する。10〜30msのLPCフレームに対応している符号化の遅延に対し、または、送信出力が落ちるときに、音楽信号とスピーチ信号との符号化モード間において明らかな相違がある。“前方"LPC分析が主に用いられる。
− 音楽信号は全く定常的なので、“後方"LPC分析が、長いLPCフレームに対してさえ用いられる。しかしながら、スピーチ信号の場合には、高度に定常的な領域は、非常に短い持続時間を有しており、したがって、“後方"LPC分析モードにおけるこれらの(領域の)通過は短く、これにより、符号化の質を低下させる望ましくないフィルタ移行につながる。したがって、符号器は、もはやフィルタの切り換えにより導入された不連続性により発生した現象を補正しない。
− 最も優れた本来の質を与え、かつ、それゆえに、符号化されるべき信号の最も優れたスペクトルをモデリングするLPCフィルタが、必ずしも最も優れた予測ゲインを有するフィルタであるとは限らない。したがって、即座の決定と結びついた、一方のLPC分析から他方への切り換えは役に立たない。
本発明の目的は、特定の“前方”および“後方"LPC分析によってディジタル音声周波数信号を符号化するための手順および装置を用いることによる前述の不都合を解決することである。
さらに、本発明の他の目的は、符号化されるべき信号がどのくらい定常的であるかに応じて、“前方"LPC分析と“後方"LPC分析との間における選択の機能を動的に適応させるための処理を用いることである。
本発明のさらなる目的は、“後方"LPC分析および“前方"LPC分析それぞれによる最も適切な符号化処理を可能にするために、音楽または背景の雑音のような高度に定常的な信号と、音声のような他の信号との間の識別に基づいて前述の選択機能を動的に適応させるための処理を用いることである。
本発明のさらなる目的は、いったん前述の最も適切な符号化の選択がなされると、所定の形式の、または所定の特徴を備えた符号化されるべき信号に対して、選択されていないLPC分析モードへのいかなる突然の切り換えをも防ぎ、かつ、それゆえに、再生された合成信号の質を低下させる傾向のある、“前方"LPCフィルタから“後方"LPCフィルタへの、およびその逆の移行の出現を防ぐことである。
本発明のさらなる目的は、前述の選択機能の動的な適応処理を用いることである。前記の選択機能により、LPC分析モードの変化が、信頼できるものとして、符号化されるべき信号の定常性(stationarity)の変化に対応し、したがって、第1および第2のしきい値の単純なクロスオーバー効果(crossover effect)に結びつけられる機会がはるかに少なくなる。
本発明の目的である、ディジタル音声周波数信号を符号化するための方法および装置は、分析決定情報と送信されない符号化残余信号とにより伴われたLPCフィルタリングパラメータからなっている送信された符号化信号を作り出すために、“前方”および“後方"LPC分析それぞれの間の選択の基準に基づいて二重の分析を用いる。このディジタル音声周波数信号は、フレーム、所定数のサンプルのブロックの連続に細分され(subdevided)、また、このディジタル音声周波数信号の符号化は、この信号において、非定常的領域および合成信号それぞれに対して“前方"LPCフィルタを用いて行われる。この合成信号は、定常的な領域に対して“後方"LPCフィルタリングを用いて、符号化残余信号から得られる。
前記の方法および装置(They)が、(以下の事それぞれ)からなっており、かつ、(これらの事を)考慮する限りは重要である。
− 定常的パラメータに応じて、ディジタル音声周波数信号の定常性の程度を決定すること。前記パラメータの値は、最大定常値と最小定常値との間にある。
− 定常的パラメータに基づいて、決定関数(decision function)に基づく分析選択値を設定すること。
− ディジタル音声周波数の非定常的領域においては“前方"LPCフィルタリングによって、かつ、合成信号の定常的領域においては“後方"LPCフィルタリングによって前記ディジタル音声周波数を符号化するために、分析選択値(analysis choice value)をLPCフィルタリングに適用すること。
この動作方法は、ディジタル音声周波数信号の定常性の程度に応じて、“前方”または“後方"LPCフィルタリングモードのいずれかに優先的に留まることと、フィルタリングの一方のモードから他方のモードへの、およびその逆への切り換えの数を制限することとを可能にする。
本発明の目的である方法および装置は、移動電話通信においてのみならず、音標文字(phonogram)の創作および再生、衛星送信、およびマルチメディアビデオまたは音声会議への適用のための高品質な電話通信の領域においても、アプリケーションを有している。
以下の記載を読み、かつ、図面を吟味することにより、理解が容易となる。ここで、
図1は、本発明の目的である符号化の実行を可能にする段階の説明図を、概略的な流れ図の形で示している。
図2aは、各々の現在のLPCブロックのための定常的パラメータを計算する段階の概略的な流れ図を示している。
図2bは、図2aによる定常的パラメータを計算する本質的な段階を実行する特に都合の良い方法を示している。
図2cは、図2bの実行の詳細および、より詳細には、定常的パラメータを得るために中間の定常的パラメータの値を調整する処理の詳細を示している。
図2dおよび図2eは、“前方”および“後方"LPCフィルタゲインの比較値に応じて、中間の定常性関数(stationarity function)のための調整値(tuning value)の計算を考慮している調整関数(tuning function)の適用の第1および第2の例をそれぞれ示している。
図2fは、決定関数と“前方”および“後方"LPC分析の選択値とを用いることを可能にしている段階の流れ図を説明的な例として示している。
図3は、本発明の目的に応じて音声周波数信号を符号化することを可能にする符号器の概略図を、機能ブロックの形で示している。
図4は、図3に示されたような符号器を用いることにより符号化された音声周波数信号を復号化することを可能にする復号器の概略図を、機能ブロックの形で示している。
本発明の目的である方法のより詳細な説明は、図1を伴って、ここで与えられる。該方法は、ディジタル音声周波数信号を符号化するためのものであり、かつ、送信される符号化された信号それぞれの”前方"LPC分析と”後方"LPC分析との間の選択の基準に基づく二重の分析を使用するためのものである。
一般的には、「送信される符号化された信号s_cn(t)は、LPC分析決定情報によって付随されるLPCフィルタリングパラメータの一部にある」ということが示される。さらに、送信されない符号化残余信号resn(t)が、符号化手続きを実行することに対して、利用可能である。
ディジタル音声周波数信号は、LPCフレーム(一連のLPCブロック)に更に分けられる。各ブロックは、説明の便宜のために、Bnとして書かれ、かつ、決められた数のサンプルNを有する。
本発明の目的である符号化手続きの1つの特徴は、前述されたように、非定常エリアに対する”前方"LPCフィルタリングを使用して、ディジタル音声周波数信号の前記符号化を実行することと、定常エリアに対する”後方"LPCフィルタリングを使用して、符号化残余信号から得られる合成信号に対して前述の符号化を実行することとから成る。
本発明の目的である本方法の特に注目に値する特徴は、一連の現在ブロックの各現在ブロックに対して”前方"LPCフィルタ選択基準または”後方"LPCフィルタ選択基準を確立するために、図1に示されるように、現在フレームを形成することからなる。各現在ブロックBnは、定義パラメータSTAT(n)に従ってディジタル音声周波数信号の定常性の度合いを(段階11において)決定するため、初期段階10において利用可能である。この定常性パラメータは、最大定常性値STATMと最小定常性値STATmとの間のディジタル値を与える。
慣例によって、かつ、本発明の目的である符号化手続きの一般性の度合いに対する偏見なしに、定常性パラメータは、最高定常性信号に対する最大値STATMを与え、一方、この定常性パラメータは、高非定常性信号に対する最小値STATmを与える。
前記段階11の後、本発明の目的である符号化方法は、段階12において、定常性パラメータSTAT(n)を使用して、LPC分析選択値を確立することから成る。この分析選択値は、”前方"LPC分析選択または”後方"LPC分析選択のいずれかに、論理的に対応する。分析の選択の値は、dn(n)と書かれ、かつ、特定の決定関数Dnから得られる。
そして、前記段階12は、判断段階13によって続かれる。判断段階13は、ディジタル音声周波数信号の非定常性エリアに対する”前方"LPCフィルタリングによってかつ合成信号の定常エリアに対する”後方"LPCフィルタリングによってディジタル音声周波数信号の符号化を実行するために、分析選択値dn(n)のLPCフィルタリングへの適用Cを許可する。
決定関数Dnと前記分析選択値dn(n)との実行は、本発明の目的である符号化手続きの特に優位な特徴を形成する。なぜならば、決定関数Dnと前記分析選択値dn(n)とは、音声周波数信号の定常性の度合いに従って、LPCフィルタリングモード(即ち、”前方”または”後方”)のうちの1つのモードに残っているものに優位順位をつけることを可能にし、かつ、あるフィルタリングモードから他のフィルタリングモードへの(およびその逆の)切り換えの数を制限することを可能にするからである。
一般的に、「段階12において実行される決定関数Dnは、適応関数であり、定常性パラメータに基づいて各現在ブロックBnに対して更新される」ということが述べられる。
適応関数を更新することは、ディジタル音声周波数信号の定常性の度合いに従って、LPCフィルタリングモード(”前方”または”後方”)のうちの1つにおいて残っているものに優位順位をつけることができ、故に、あるフィルタリングモードから他のフィルタリングモードへの(およびその逆への)切り換えの数を制限することができる。
更に明確には、前記決定関数Dnに従って確立された分析選択値dn(n)は、LPCフィルタリングモード(”前方”または”後方”)の優先値に対応し、かつ、”後方"LPCフィルタリングモードまたは”前方"LPCフィルタリングモードへ戻ることに対する優先の欠如の値を実際に示す他の優先値に対応する。
LPCフィルタリングモードに対する優先値としては、「分析選択値dn(n)は、例えば、論理値に対応することができ、この論理値の真値(値1)は、例えば、”後方"LPCフィルタリングの選択に対応し、一方、この真値の相補値(値0)は、”前方"LPCフィルタリングの選択に対応する」ということが述べられる。故に、「段階13における判断関数は、前記分析選択値の論理値の判断値として要約され、これは、符号化されるべき信号の定常性エリアのための”後方"LPCフィルタリングを(段階14において)保証するため、または、非定常性エリアのための(段階15における)”前方"LPCフィルタリングを保証するためであり、故に、前記段階14,15は、次のブロック(n=n+1に対してBn+1)へ戻る段階14a,15aによって続かれる」ということが分かる。
分析選択値dn(n)は、論理値によって示されるが、「この論理値は、優先の値と決定関数Dnによって明確に確立されるフィルタリングのモードの可能性とに関連してもよい」ということが述べられる。「相補値(論理値0)は、例えば、第1の前記範囲のための(0と1との間の)可能性値の前記範囲の相補に対応してもよい一方、この可能性値は、各現在ブロックBnに対して、”後方"LPCフィルタリングのための(0と1との間の)可能性値の範囲に対する真論理値に対応してもよい」ということが詳細に分かることができる。この可能性は、同じフィルタリングモード内の多数の連続したフィルタリング決定に依存する。
決定関数Dnの動作モードは、論理変数dn(n)と実際に関連することを可能にし、かつ、フィルタリングモード優先度は、各現在ブロックBnに対する時間に適応できる。
一般的に、「決定関数Dnを適応することの目的は、あるフィルタリングモードから他のフィルタリングモードへの不必要な切り換えを可能な限り回避するために、符号化されるべき信号の全体の定常性を考慮して、(どちらがより良く機能しようとも、)”後方"LPCフィルタリングモード、または、対照的には、”前方"LPCフィルタリングモードに、連続的に優先順位をつけることである」ということが述べられる。
より明確には、
− 符号化されるべき信号が定常であればあるほど、決定関数Dnは、”後方"LPC分析により良く優先順位をつけ、”前方"LPCフィルタリングモードへの切り換えを可能な限り制限する。
− 対照的に、符号化されるべき信号が定常でなければないほど、決定関数Dnは、”前方"LPC分析により良く優先順位をつけ、”後方"LPCフィルタリングモードへのいかなる切り換えをも可能な限り制限する。
定常性パラメータSTAT(n)の値に従う(この決定関数を適応することを可能にする)特定の決定関数の実行のより詳細な説明は、本説明において後に与えられる。
各現在LPCブロックBnに関する定常性パラメータSTAT(n)の選択的な計算の方法は、図2を伴って、ここで与えられ、かつ、説明される。
前記図面によると、段階11は、ディジタル音声周波数信号の各現在ブロックBnの定常性の度合いを決定することからなり、図2aの段階110に示されるように、定常性パラメータの任意の初期値STAT(0)で開始して、中間定常性パラメータ値STAT*(n)を、連続した分析選択値の決定された数の関数として、この現在ブロックBnのために段階111において、計算することから成る。これらのLPC分析選択値dn-1(n−1),……,dn-p(n−p)は、一連のLPCブロックの現在ブロックBn以前の異なる連続したブロックと現在ブロックに先行するブロックの定常性パラメータの値STAT(n−1)とに対して得られる。図2aに示される段階111では、先行分析選択値の決定された数の関数が、これらの先行値dn-1(n−1)〜dn-p(n−p)に関して与えられる。定常性パラメータSTAT(0)に対する初期任意値は、例えば、本説明において上述された定常性パラメータの最大値と最小値(STATMとSTATm)との間の中間値と同じものであり得る。
そして、前記段階111は、段階112によって続かれる。段階112は、”前方"LPCフィルタおよび”後方"LPCフィルタの予測ゲインの値に従って、または、現在フレームに先行するフレームの分析モードに従って、中間定常性パラメータ値をチューニングすることからなる。図2aの段階112において、前記関数は、g(STAT*(n),Gpf,Gpb)と書かれる。ここで、現在フレームに先行するフレームに対して、Gpfは、”前方"LPCフィルタの予測ゲインであり、かつ、Gpbは、”後方"LPCフィルタの予測ゲインである。段階112において(即ち、中間定常性パラメータ値のチューニングすることからなる段階において)、現在LPCブロックBnの定常性パラメータ値STAT(n)は、式(3)の値として与えられる。
STAT(n)=g(STAT*(n),Gpf,Gpb)
この式は、チューニングされた中間定常性パラメータ値に対応する。
中間定常性パラメータSTAT*(n)の計算段階111のより詳細な説明と、このパラメータ値をチューニングすることから成る段階112のより詳細な説明とは、図2bを伴ってここで与えられる。
前記図面によると、段階111は、初期化段階1110で開始して、段階1111において実行することからなる。初期化段階1110では、現在ブロックBnに先行するLPCブロックBn-1に関して、定常性パラメータSTAT(n−1)の値と分析選択値dn-1(n−1)とが利用可能である。段階1111は、現在ブロックBnに先行するブロックBn-1の”前方"LPC分析モードまたは”後方"LPC分析モードを識別することから成る。この識別段階1111は、図2bに示されるように、真論理値の相補値に対応するシンボリック値"fwd"(即ち、論理値0)に関する分析選択値dn-1(n−1)のための判断段階から成ってもよい。
前記判断1111に対する否定応答において、即ち、”後方"LPC分析モードにおいて分析された(現在ブロックBnに先行する)如何なるブロックBn-1に対しても、中間定常性パラメータ値を計算する段階は、段階1113において、”後方"LPC分析モードにおいて連続的に分析された先行フレームの数N_BWDを決定することから成り、そして、段階1114において、先行フレームの数のスペリオリティ(superiority)を、”後方"LPCモードにおいて分析された連続したフレームの数を示すイニシャル任意値Naと比較することから成る。
判断1114のスペリオリティ比較に対する肯定応答において、計算段階は、段階1114bにおいて、中間パラメータ値STAT*(n)、即ち、現在ブロックに先行するブロックの定常性パラメータの値STAT(n−1)、に帰することから成る。この値は、決められた値によって減じられる。該決められた値は、第1の任意値に依存する。該第1の任意値は、連続して分析されたフレームの数(即ち、”後方"LPC分析モードにおいて連続的に分析された先行フレームの数N_BWD)を示す。段階1114bにおいて、(第1の任意値に依存する)決定された値は、fn(N_BWD)と書かれる。前記段階の間、「故に、現在LPCブロックBnに対する中間定常性パラメータ値STAT*(n)は、先行ブロックBn-1に対する同じ定常性パラメータに対応する値に関して減少される」ということが分かり得る。
比較判断1114におけるスペリオリティ比較に対する否定応答において、現在ブロックBnに先行するブロックの定常性パラメータSTAT(n−1)の値は、段階1114aにおいて、中間定常性パラメータ値STAT*(n)に帰する。
しかしながら、”前方"LPC分析モードにおいて分析される全ての先行ブロックBn-1に対して(即ち、判断1111に対する肯定応答において)、図2bに示されるように、中間定常性パラメータ111を計算するための段階は、段階1112において、判断基準に基づいて、列n−2の現在ブロックBn-1の前のブロックの前のブロックの間における”後方"LPC分析モードから”前方"LPC分析モードへの移行の発生、即ち、上述されたような、LPC分析選択値dn-2(n−2)=シンボリック値"bwd"(論理値は0)の存在、を判断することからなる。判断1112に対する肯定応答は、現在ブロックBn-1に先行するブロックに先行するLPCブロックBn-2による”後方”分析モードからのそのような移行の存在を示す。一方、前記判断1112に対する否定応答は、そのような移行の欠如を示す。
前記発生判断1112に対する肯定応答において、計算段階111は、インフェリオリティ(inferiority)比較基準を使用して、先行前記N_BWDフレームの数を、第2の任意値Nbと比較することから成る。第2の任意値Nbは、現在ブロックに先行するブロックBn-1に先行する”後方"LPCモードにおいて連続的に分析されるフレームの数を示す。
判断1118において実行される比較に対する否定応答において、この判断は、段階1118aによって続かれる。段階1118aは、(第2の任意値Nbに依存する)決められた値によって減少される現在ブロックに先行するブロックの定常性パラメータ値STAT(n−1)を、中間定常性パラメータ値STAT*(n)に帰することから成る。この決められた値は、f2(N_BWD)と書かれる。「故に、アトリビューション段階1118aでは、中間定常性パラメータ値は、結果として、減少される」ということが分かる。
しかしながら、判断1118で実行されたインフェリオリティ比較に対する否定応答において、段階111は、段階1118bにおいて、現在ブロックに先行するブロックの定常性パラメータの値、即ち、STAT(n−1)を、中間定常性パラメータSTAT*(n)の値に割り当てる。
図2bでは、「そして、割当段階1118a,118bは、”後方"LPC分析モードにおいて処理された連続したブロックの数を0で置き換えることの段階によって続かれ、(0にする)この段階は、参照番号1118cを保ち、かつ、中間定常性パラメータの値の計算処理の全体を更新することを可能にする」ということが注目される。
比較判断1112に対する否定応答において、”前方"LPC移行分析は起こらず、先行ブロックBn-1の定常性パラメータSTAT(n−1)の値は、段階1119における中間定常性パラメータSTAT*(n)の値に帰する。
段階111の終わりにおいて、中間定常性パラメータSTAT*(n)の値は、現在ブロックBnに対してセットされる。
前記中間定常性パラメータの値をチューニングすることにある段階112が関する限り、図2bへの参照によって、「段階112は、段階120の利点に対して、”後方"LPCフィルタリングと”前方"LPCフィルタリングとの予測ゲインを識別することにあり、これらのゲイン値は、それぞれ、GpbおよびGpfと記載される」ということが注目される。「前記識別は、単に、前記”前方”フィルタリングと”後方”フィルタリングとのそれぞれに対して計算されたゲイン値を、記憶しかつ読み出すことにある」ということが理解される。前記ゲイン値と同様に、段階1120は、予測ゲインの比較値DGfbを、前記”前方”予測ゲインと前記”後方”予測ゲインとの間の差または比として、計算することから成る。
図2bに更に示されているように、図2aの段階112は、前記段階1120の後ろに、段階1121を具備する。段階1121は、中間定常性パラメータSTAT*(n)の値を、リファイニング(refining)値ΔSで修正することから成る。本発明の目的である方法の特に注目すべき特徴によるこのリファイニング値は、”前方"LPCフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとの比較値の関数である。
一般的な規則として、リファイニング値ΔSを示す関数は、以下の通りに記載される。
ΔS=fr(Gpf,Gpb)
ここで、GpfとGpbとは、先の通りに、それぞれ、”前方"LPCフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとを示す。
一般的な規則として、「リファイニング値ΔSのセットアップを許可する関数fr(Gpf,Gpb)は、この比較値が考慮される方向に従って、比較値でそれぞれ減少および増加する関数である」ということが示される。”前方"LPCフィルタリングゲインと比較する”後方"LPCフィルタリングゲインの値を比較値が示す場合、この選択は、如何なる損傷なしに、本発明の目的である本方法の一般的な特性において、前記比較値DGfbに任意に維持される。そして、関数frは増加する。逆の場合には、減少する。
言い換えると、増加または減少による修正、即ち、リファイニング値ΔSの中間定常性パラメータの値は、ゲインの比較値に比例する。一般的な規則として、この修正は、STAT(n)=STAT*(n)+kΔSと書かれる。実際には、kは1に等しいとして与えられる。より明確には、「”前方"LPCフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとの間のギャップが増加し、そして、関数fr(Gpf,Gpb)が増加関数である場合、リファイニング値ΔSは代数的な値で増加し、一方、この同じ前記ギャップが減少する場合、このリファイニング値ΔSは代数的な値で減少し、前記ギャップは、LPC"後方”フィルタリングの予測ゲインとLPC"前方”フィルタリングの予測ゲインとの間において定義される」ということが示される。実際、この関数は、このギャップの定義に従って、増加または減少している。
その結果、図2bに示されるように、段階1121に終わりでは、定常性パラメータSTAT(n)の値を計算するために、中間定常性パラメータSTAT*(n)の値が、k=1に対して、前記リファイニング値ΔSの代数値によって、訂正されることができる。
段階1121に続いて、定常性パラメータSTAT(n)の値は、段階1122でセットされる。
図2bの段階1121のより詳細な説明が、図2cを伴って、選択的な説明において、ここで与えられる。該説明では、いくつかの判断基準が、LPC"前方”予測ゲインおよびLPC"後方”予測ゲインの値と同様に、定常性パラメータの計算処理を最適化することを考慮して、リファイニング値に適用される。
前記図2cに示されるように、段階1121は、第1の段階1121aから成ることができる。第1の段階1121aは、先に引用された関数fr(Gpf,Gpb)に基づくリファイニング値ΔSの計算を許可する。使用可能な関数の異なる例は、本説明において、後で与えられる。
第1の段階では、リファイニング値ΔSは、段階1121bにおいて、値0を伴うスペリオリティ比較判断に従う。この比較判断は、実際には、このリファイニング値ΔSの増加を決定することを許可する。
前記判断1121bに対する肯定応答において、リファイニング値ΔSは、正であり、かつ、”前方"LPCフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとの比較値における増加に対応する。中間定常性パラメータの値をリファイニング値ΔSに基づいて増加することの段階は、第1の決定された正値Siと比較される”後方"LPCフィルタリングゲイン値Gpbの値のスペリオリティ比較段階において決定される第1の正値と比較されて、”後方"LPCフィルタリングのゲイン値のスペリオリティ条件にさらに従う。
前記判断1121cに対する否定応答において、中間定常性パラメータSTAT*(n)の値は、段階1121gにおける定常性パラメータSTAT(n)の値に帰する。
前記判断1121cに対する肯定応答において、リファイニング値ΔSの中間定常性パラメータの値の増加は、定常性値の経過を示す第2の決定された正値STATiと比較される中間定常性パラメータの値STAT*(n)インフェリオリティ条件に更に従う。このインフェリオリティ判断条件は、段階1121eにおいて実行される。
前記判断1121eに対する否定応答において、前記段階1121gにおける中間定常性パラメータSTAT*(n)の値は、中間定常性パラメータSTAT(n)の値に帰する。
インフェリオリティ判断条件1121eに対する肯定応答において、段階1121iにおけるリファイニング値の正値ΔSによって増加される中間定常性パラメータSTAT*(n)の値は、中間定常性パラメータSTAT(n)の値に帰する。
対照的に、前記判断1121bに対する否定応答において、リファイニング値ΔSは負であり、リファイニング値ΔS(この値は負である)を伴う中間定常性パラメータの減少段階は、比較段階1121dにおける決定された第3の正値Sdと比較して、”後方"LPCフィルタリングゲイン値Gpbのインフェリオリティ判断条件に更に従う。この第3の決定された正値は、当然のことながら、LPCフィルタリングゲイン値を示す。
前記判断1121dに対する否定応答において、中間定常性パラメータSTAT*(n)の値は、段階1121gにおける定常性パラメータSTAT(n)の値に帰する。
対照的に、前記判断1121dに対する肯定応答において、リファイニング値ΔSを伴う中間定常性パラメータの値の減少段階は、比較判断1121fにおける第4の決定された正値STATdと比較して、中間定常性パラメータSTAT*(n)の値のスペリオリティ条件に更に従う。当然のことながら、第4の決定された正値は、選択された定常性パラメータ値を示す。
前記判断1121fに対する否定応答において、中間定常性パラメータSTAT*(n)の値は、段階1121gにおける中間定常性パラメータSTAT(n)に帰する。
前記判断1121fに対する肯定応答において、リファイニング値ΔS(負)の代数値によって増加する中間定常性パラメータSTAT*(n)の値は、定常性パラメータSTAT(n)に帰する。故に、中間定常性パラメータの値は、段階1121hにおいて定常性パラメータSTAT(n)の値をセットアップするために、減少される。
故に、段階1121g,1121h,1121iの終わりにおいて、定常性パラメータSTAT(n)は、図2bの段階1122においてセットされる。
関数fr(Gpf,Gpb)に関しては、「関数fr(Gpf,Gpb)は、”前方"LPCフィルタリングおよび”後方"LPCフィルタリングの比較値の非線形関数から成ってもよく、ここで、”前方"LPCフィルタリング予測ゲインおよび”後方"LPCフィルタリング予測ゲインの比較値は、それ自身が、”前方"LPCフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとの比または差にある」ということが示される。線形関数のような他の型の関数が使用されてもよい。
非線形関数fr(Gpf,Gpb)の第1の例が、図2dに示される。
図2dのバージョンの例では、縦座標における”後方"LPCフィルタリング予測ゲインGpbと”前方"LPCフィルタリングゲインGpfとは、正のリファイニング値ΔSを割り当てることを許可する。比率ρ=Gpb/Gpfの値に対して、ΔS>0または負のΔS<0は、直線ΔS=0の傾きよりも大きい傾きまたは小さい傾きに、それぞれ対応する。
図2eには、”前方”フィルタリング予測ゲインと”後方”フィルタリング予測ゲインとの相対値がもはやゲインの比率ρには対応せず前記ゲインの差に対応する場合が示されている。この場合、”前方"LCPフィルタリング予測ゲインと”後方"LPCフィルタリング予測ゲインとの相対値は、非線形関数であることもあり得る。該非線形関数は、直線に対応する値のペアGpb,Gpfに対応するこの差の値に対するリファイニング値ΔSに割り当てることを許可する。上記直線に対しては、横座標原点は、それぞれ、直線ΔS=0の横座標原点よりも(代数値において)より小さいかまたはより大きいかである。図22eの場合、リファイニング値ΔSの符号の関数としてゾーンの範囲を定める直線は、互いに平行である。
本発明の目的である手続きの他の詳細な特徴によれば、「例えば音声周波数信号が無音を含む音声信号によって構成される場合、無音フレーム間における現在ブロックBnの定常性インデックスを適応しないことが受け入れられる」ということが更に推奨される。そのような場合、図2bに示される段階111の段階1111は、段階1111aによって処理されることができる。段階1111aは、各連続現在ブロックに対して、音声周波数デジタル信号の平均エネルギーを決定することと、(この同じ段階において、インフェリオリティ比較基準に基づいて、)無音フレームを示す決定されたしきい値とこの平均エネルギーとを比較することとにある。図2bにおいて、このしきい値は、ENER_SILと呼ばれる。前記判断の肯定応答において、図2bに示される割当段階1111bにおける先行ブロックの定常性パラメータの値STAT(n−1)は、現在ブロックの定常性パラメータの値STAT(n)に帰する。段階1111a,1111bは、例えば音声信号の符号化に対して確保されるので、前記図面において、破線で示される。
決定値dn(n)が得られることを可能にする決定関数Dn(n)の実行のより詳細な説明は、図2fを伴って、ここで与えられる。この記載は、選択的な説明において与えられる。この説明では、この決定関数は、S.PROUSTとC.LAMBLINとD.MASSALOUXとによって出版された説明によって、先に述べられた記事において説明された決定関数と比較されることもできる。しかしながら、この決定関数は、連続した選択分析dn(n)値を得るために、本発明の目的に従って一時的に適応される。
段階120で開始し、現在ブロックBnに対して、第1段階では、現在ブロックのLPCフィルタと先行ブロックBn-1のLPCフィルタとの間のディスタンスdLPCが計算される。このディスタンス計算は、例えば、前記記事において説明された手続きに関する説明において先に述べられたLPC周波数パラメータを使用することによって、実行される。
以下のことが注目される。
− しきい値S_PRED(n)とS_TRANSとS_STATとG1との値は、”後方"LPCフィルタの予測ゲインと”前方"LPCフィルタの予測ゲインとに基づいて正当化される基準内に到達される。
− しきい値S_LSP_LとS_LSP_Hとは、2つの連続的なブロックBn-1とBnと比較される2つの”前方"LPCフィルタを示すLSP周波数ベクトル間のディスタンスに基づいて正当化される基準内に到達される。
− ”前方"LPCフィルタの予測ゲインGpf。
− ”後方”フィルタの予測ゲインGpb。
− 本説明において先に述べられた(出版された)記事において説明された方法に従って挿入される”前方”フィルタの予測ゲインGpi。
図2fに関して決定関数を確立するための基準は、以下の方法で確立される。
− もし、連続したLPCフィルタが非常に定常ならば(即ち、dLPC<S_LSP_Lに対して)、”前方"LPCフィルタリングを伴う”後方"LPCフィルタリングの切り換えが実行されない。もし、”後方"LPCフィルタリングモードにあるならば、「”後方"LPCフィルタの予測ゲインは、S_STAT値によって減少される”前方"LPCフィルタの予測ゲインよりも大きい」という条件における。「ディスタンスdLPCによって測定されたスペクトルの大きな定常性の存在において”後方"LPCフィルタの選択を容易にするように、S_STAT値が選択される」ということが述べられる。
− もし、連続したLPCフィルタが重大な移行を有するならば(即ち、dLPC>S_LSP_Hであり、かつ、もし、Gpf>Gpb−S_TRANSならば)、選択されたフィルタリングモードは、”前方"LCPフィルタリング(即ち、d3(n)=0)であり、シンボリック値"fwd"である。さもなければ、dn(n)はほぼ1に等しく、シンボリック値は"bwd"である。「ディスタンスdLPCによって測定されるスペクトル移行の存在において”前方"LPCフィルタの選択を非常に容易にするように、S_TRANSの値が選択される」ということが述べられる。
− さもなければ、他のすべての場合において、もし、Gpb>Gpf−S_PREDかつGpi>Gpf−S_PREDならば、保持されたLPCフィルタは、「挿入された”後方"LPCフィルタのゲインと純粋な”後方"LPCフィルタのゲインとが、先に述べられたしきい値Giを越える」という条件において、挿入された”後方"LPCフィルタである。もし、前記予測ゲインの値における条件が満たされないならば、”前方"LPCフィルタリングが選択される。
送信された”前方"LPCフィルタの数を増加するために、かつ、送信エラーに対する符号化システムの耐力を増加するために、、”前方"LPCフィルタリングモードは、符号化されるべきエネルギー信号En(即ち、対応するブロックBnのエネルギー)が無音フレームENER_SILのエネルギーの値より小さくなるや否や、好結果を伴って選択される。エネルギーのこの値は、最小可聴レベルに対応する。
決定関数Dnの確立と対応する選択された分析値dn(n)の獲得とを可能にする条件の組が、決定関数Dnの一時的な適応を伴って、図2fに図解されている。
一例として、定常性パラメータSTAT(n)は、非定常値STATnに対応する0から、非常に定常的な値STAT(n)に対応する100まで、目盛上において取ることができる。
定常性パラメータSTAT(n)の値に従って、決定関数Dnは、閾値を適合させることにより変更される。
信号の定常性が増加するにつれ、より”後方"LPCフィルタのモードに傾く:つまり、閾値であるS_PRED、S_LSP、S_LSP_Hが増加する。
制限の設けられていない例として、前述した閾値を持つ、現在の各LPCブロックBnに対する変更関数は次の様に示される:
S_PRED(n)=fs_PRED(STA(n)) 同時に関数fs_PREDはSTAT(N)の値に伴って増加する。
S_LSP_L(n)=fs_LPC_L(STAT(n))同時に関数fs_LPC_Lが増加する。
S_LSP_L(n)=fS_LPC_R(STAT(n))同時に関数fS_LPC_Lが増加する。
先述の閾値を適合させて、上で述べた増加関数は、例えば関数fS_LPC_L及びfS_LPC_Hに関係する様な関数である。関数fS_PREDは、可変定常パラメータを改善した関数であり、次のように表される:
S_PRED(n)=α.STAT(n)+β
ここで、αとβは、0と1の間の実数であり、S_PRED(n)の値は、[S_PREDm,S_PREDM]の間に限定されており、S_PREDm,とS_PREDMは2つの実験から決定された値を表している。
さらに再びスイッチングフィルタの危険を制限するために、定常パラメータSTAT(n)が、ある与えられた閾値SFWDよりも小さい時に、”前方"LPCフィルタのモードを要求するように選ぶことができる。
他方、S_TRANS,S_STAT,G1閾値は固定値を保ち、これらの値は、例えば一例として−1dB,5dB,0dBにそれぞれ等しい値を取りうる。
決定関数Dnを確定し、分析選択値dn(n)を得ることについて、図2fに次のように示されている:前述のステージ120に続いて、テストステージ121を実行するが、それは、現在のLPCブロックBnのエネルギーを無音エネルギー値ENER_SILとインフェリオリティ比較するか、定常性パラメータ値STAT(n)をインフェリオリティ比較によって上で引用した値SFWDと比較することにより行われる。先述の121のテスト結果が+の時は、選択分析値dn(n)は0に等しい値が取られる、すなわち、ステージ122のシンボリック値である“fwd"である。
先述のテスト121の結果が−の時は、選択分析値dn-1(n−1)と論理値1すなわちシンボリック値“bwd"とに関する新しいテストが実行される。
先述のテスト123の結果が+の時は、先述のLPCフィルタリングディスタンスdLPCのテストがステージ124で実行されるが、これは閾値S_LSP_H(n)とのスペリオリティ比較によって行われる。
先述のテスト124の結果が+の時は、新しいテスト126aが実行されるが、ここでは、“前方"LPCフィルタ予測利得Gpfを、“後方"LPCフィルタ予測利得Gpbから閾値S_TRANSを減じたものと比較する。
先述のテスト126aの結果が+の時は、論理値0つまりシンボリック値“fwd"が選択分析値dn(n)に帰せられ、上述のテスト126aの結果が−の時は、同じ選択分析値は1、つまりシンボリック値“bwd"に帰せられる。それぞれステージ128と129に対応する。
先述のテスト124の結果が−の時は、新しいテスト125が実行される。テスト125では、LPCフィルタリングのディスタンスdLPCと閾値S_LSP_L(n)とインフェリオリティとの比較が行われる。
上述のテスト125の結果が+の時は、新しいテスト126bが実行されるが、これは、“後方"LPCフィルタリング予測利得と、“前方”フィルタリング予測利得から前述の値S_STATを減じたものとのスペリオリティ比較が行われる。
上述のテスト126bの結果が+の時は、論理値1すなわちシンボリック値“bwd"が、選択分析値dn(n)にステージ129において帰せられる。
上述のテスト126bの結果が−の時は、論理値0すなわちシンボリック値“fwd"が、選択分析値dn(n)にステージ128において帰せられる。
反対に、テスト125の結果が−の時は、新しいテストがステージ127において実行されるが、これには、“後方"LPCフィルタリング利得Gpbと“前方"LPCフィルタリング予測利得から閾値S_PRED(n)を減じたものとの比較と、中間LPC予測利得Gpiと“前方"LPCフィルタリング予測利得から先述の閾値S_PRED(n)を減じたものとのスペリオリティ比較と、“後方”フィルタリング予測利得Gpbと閾値G1とのスペリオリティ比較及び中間フィルタリング予測利得Gpiの値と閾値G1との比較が含まれる。
前述したテスト123の結果が−の時は、先述のテスト127が実行されることが述べられている。
前述のテスト127の結果が+の時は、論理値1すなわち、ステージ129におけるシンボリック値“bwd"が選択分析値dn(n)に帰せられ、一方、前述のテスト127の結果が−の時は、反対に論理値0すなわち、ステージ128におけるシンボリック値“fwd"が選択分析値dn(n)に帰せられる。
決定関数Dnを用いることにより、先述の論理値1あるいは0によって、選択分析値dn(n)は設定されるが、これらの論理値は定常パラメータ値の関数として“前方”あるいは“後方”フィルタリングのモードに戻る優先あるいは非優先の値に関連している。
送信済みの符号化された信号において“前方”あるいは“後方”のそれぞれのLPC選択分析の基準に則った、二重分析による音声周波数ディジタル信号の符号化装置に関する、より詳細な記述は、ここで本発明の対象に従って図3を参照しつつ行われる。
実際には、符号化されるディジタル信号は、標本の連続するブロックから構成されるフレームに細分されるが、各ブロックは、例えば成るN個の標本から成っている。
標本の連続するブロックBnにおいて符号化される音声周波数ディジタル信号の構成モードは、図3において示されていない、と言うのは、この動作モードは当業者には良く知られており、また例えば一定で周期でフレーム周波数やブロック周波数を読みに行く簡単なメモリバッファでもって実行できるからである。
前記の図3でさらに示されている様に、この発明の対象である符号化装置には、符号1Aのついた“前方"LPC分析フィルタが含まれており、また符号1Bの付いた“後方”分析フィルタも含まれており、これはPrパラメータと同様に、調和分析と励起信号CELPに関係する分析決定指標を伴うLPCフィルタリングパラメータから成る送信済み符号化信号を配信するのを可能にするためである。
一般的に、分析決定指標は、本明細書中に既に記述したように、選択分析値dn(n)に対応する。LPCパラメータに関する限り、これらは、本発明の対象であり後に記述されるところの符号化方法として使用されるモードに従って、特別のパラメータに該当すると述べられている。
図3においてさらに示されているのは、本発明の符号化装置によれば、定常性パラメータ値の関数として動作する適応フィルタがあり、これは符号1Eである。当然ながら、この適応フィルタ1Eは、Sn(t)と呼ばれる元のディジタル信号、すなわち現在のブロックBnを受信する。フィルタ1Eは、モジュール1Fで順番に符号化される残差信号を計算するために、フィルタリングLPCパラメータを使用する。これらのLPCパラメータは、フィルタリング決定指標と同様に復号器に送信される符号済み信号の一部を成す。
さらに図3に示されるように、本発明の対象である符号化装置には未送信の残余符号化信号を符号化する符号1Fの符号化手段が含まれ、この残余符号化信号は、resn(t)で表され、適応フィルタ1Eの出力で直接使用可能であり、未送信残余符号化信号の符号化モジュールにおいて音声周波数ディジタル信号と共に入力に配信されるが、これは合成残余信号res_synn(t)を生成するためである。
符号1Gの逆フィルタリングモジュールは、合成残余信号を受信し、s_synn(t)で表される合成信号の配信を可能にする。
記憶モジュール1Hは、前述の合成信号を前のブロックから現在のブロックに運ぶために先述の合成信号s_synn(t)を受信し、こうして合成信号s_synn-1(t)で示されるようになる。この合成信号は、前述の図3中の符号1Bの“後方"LPC分析フィルタに運ばれる。
本発明の対象である符号化装置は、図3に示されるように、非定常領域に対して“前方"LPCフィルタからの先述した音声周波数ディジタル信号と、定常領域に対して“後方"LPCフィルタ1Bからの先述した合成信号s_synn-1(t)とに含まれる音声周波数ディジタル信号の符号化の実行を可能にし、これは以下で述べられる。
前述の図3で分かるように、本発明の対象である装置にはこの目的から現在の各々のLPCブロックBnに計算モジュール1Cが備わり、定常値の最大値と最小値との間にある定常性パラメータに従って音声周波数ディジタル信号の定常度を計算する。もちろん、定常性パラメータは、本発明の対象である符号化手順に従って上述されたパラメータSTAT(n)である。定常性の値の最大値と最小値は、共に既に定義されている。
図3において、さらに示されているように本発明の対象である符号化装置には1Dと名付けられたモジュールがあり、先述の定常パラメータSTAT(n)から決定関数とLPC選択分析値とを確立するが、決定関数は前述したようにDnと呼ばれ、LPC選択分析値は、当然、前述したdn(n)と呼ばれるLPC選択分析値に対応している。思い出していただきたいのは、選択分析値dn(n)は、論理値の0か1を取り得、これはそれぞれ“前方”と“後方”のLPC分析の“fwd"と“bwd"という選択分析の象徴的な値に呼応している。
特に理解して頂きたいのは、決定関数Dnの確立に関して、これは例えば図2fと共に既に記述されたように、ソフトウェアの適用に関連するということである。さらに、図3に示されたような本発明による1D2と名付けられた符号化器にはLPCフィルタリング分析識別モジュールがあり、このモジュールは選択分析値dn(n)を受信し、現在のLPCブロックBnに対して、それぞれ先述した選択分析値の関数であるLPC“後方”と“前方”値を運ぶのを可能とする。明確に理解できることだが、“後方"LPCフィルタリング分析は“前方"LPCフィルタリング分析パラメータと同様に、図3においてそれぞれ1Aと1Bと名付けられたフィルタにおいてディジタル形式でもちろん利用可能である。これらのパラメータはそれぞれ、1Aと名付けられ“前方"LPC分析フィルタに関する“前方"LPCフィルタリング分析パラメータを示すAfn(z)と、1Bと名付けられ“後方"LPC分析フィルタに関する“後方"LPC分析パラメータを示すAbn(z)と呼ばれる。これらのパラメータは、それぞれモジュール1D1と1D2とに運ばれる。
識別モジュール1D1の付属物の生成に関して、無制限のものにおいては一例として2個の識別メモリ領域を持ち得、それぞれフィルタリングパラメータAfn(z)とAbn(z)を記憶できるもので、現在の論理値の関数である選択分析dn(n)の値は0か1であり、例えばモジュール1D2が、記憶されているフィルタリングパラメータの値を読むためにアドレスを出しこれらのフィルタリングパラメータを送信することを可能にする。
最後に、図3に示されるように、本発明の対象である符号化装置は、符号1Eの付いた定常値に基づく適応フィルタの動作時に、フィルタリング要素によって転送関数を実行することが可能であり、この関数はA(z)と呼ばれ、先述した識別モジュール1D2によって運ばれるフィルタリングパラメータ値から決定されるということが示されている。
同様に理解されたいのは、適応フィルタモジュール1Eは、調整可能な係数を持ったフィルタによって達成可能であり、このモジュールの係数の値は、先述した識別モジュール1D2により選ばれる。モジュール1Eにより実行されるフィルタリングは、このようにして、符号化しようとする音声周波数ディジタル信号の定常度の関数として動作する適応型である。モジュール1Eは、このようにして元の音声周波数ディジタル信号sn(t)から、resn(t)により残余符号化モジュール1FへLPCフィルタリング残余信号を運び、その後これはres_synn(t)と名付けられるLPC合成残余信号を運ぶことを可能にする。
最後にモジュール1Gはフィルタリングモジュールであり、その転送関数は後者の記憶されているパラメータから得られるモジュール1Eの転送関数の裏返しである。つまり、モジュール1Fにより与えられる符号化残余の符号化モジュールにより運ばれるLPC合成残余信号res_synn(t)を受信する。こうして理解されることは、音声周波数ディジタル信号sn(t)の符号化はLPC“前方”と“後方”分析、つまりそれぞれLPC“前方”と“後方”分析フィルタ1A,1Bにより実行されるものを通じてモジュール1Eの中で実行されるということであり、符号化された信号s_cn(t)は、選択分析値dn(t)が選択分析の指標と同様に象徴的な値“fwd"となる時、つまり引用された先行する選択分析値の値となる時に、“前方"LPCフィルタリングパラメータの送信中に作られる。この動作モードによって、音声周波数ディジタル信号の符号化を実行し、ディジタル信号の定常度の関数としてそれぞれ“前方”か“後方"LPCフィルタリングモードのいずれかの間、固定しておき、さらに対象となったフィルタリングモードの一つから他のものへ切り替わり回数に制限を設けることが可能になる。
それぞれ“前方”と“後方"LPC分析の基準に則った二重分析による符号化済み音声周波数ディジタル信号の復号化装置において、その信号は本発明の対象である符号化方法により送信された符号化信号であり、その際に例えば図3に示される様な符号化装置を用いて成されるが、これは図4を参照しつつ以下に記述される。
概して、送信された符号化済み信号s_cn(t)は、各LPC分析ブロックに対して先述した選択分析の値から成り、選択分析の値が対象となっているLPC分析ブロックに対して“前方"LPC分析に対応する時は、LPCフィルタリング残余の符号化パラメータと同様に“前方"LPCフィルタリングパラメータであるPrnパラメータから成ることが示されるが、このパラメータはすなわち残余符号化モジュール1Fによる合成残余信号res_synn(t)中の信号resn(t)である。
図4に示されるように、復号化装置には少なくとも、モジュール1Fにより運ばれるLPC残余の符号化パラメータを受信するフィルタリング残余信号の2Aの符号が付く合成モジュールを備えていることが示される。モジュール2Aは、モジュール1Fにより与えられる符号化パラメータを復号化し、図4でres_synn(t)で参照される合成残余信号を順番に運ぶ。
図4に示されるように復号化装置には、また参照番号2Bのモジュールを備え、これは定常度の関数として逆適応フィルタリングを行い、モジュール2Aにより運ばれる、先に引用された合成残余信号を受信し、実際複合化された信号から成る音声周波数ディジタル信号の標本である合成信号s_synn(t)の生成を可能にする。
当然、理解されることは、逆フィルタリングモジュール2Bは送信の事実に基づいて復号化器によって受信されるフィルタリングパラメータを使用し、このパラメータは、送信されて分析決定が“前方"LPC分析に対応する時に“前方"LPC分析パラメータであるか、あるいは反対に、後述するように“後述”フィルタリング分析パラメータである。
この目的で、本発明の対象である復号化装置は、当然ながら参照番号2Dの“後方"LPCフィルタリングモジュールを備え、これは合成信号を受信するが、この信号はすなわち現在のLPCブロックに先んずるLPCブロックに対するs_synn(t)と表される信号であり、この合成信号はこのようにして図4においてs_synn-1(t)と表される。この目的で、理解されるのは、現在のブロックBnに関するs_synn(t)と参照される合成信号は、参照番号2Eの記憶モジュールによって“後方”フィルタリングモジュール2Dへと運ばれ、実際には読み出しの際の適合アドレシングによって、合成信号の読み出しを、先立つブロックに対応する現在のブロックBnへとずらすことを可能にするということである。
最後に、そして先述の動作モードを確か確固とするために、図4に示した様に本発明の対象である復号化装置には、さらに2Cの符号の与えられる識別モジュールを備えており“前方”と“後方"LPC識別分析をそれぞれ実行することを可能にする。片や、モジュール2Cは、識別を制御するために、受信した選択分析値すなわちdn(n)を受信し、片や、モジュール2Dにより得られた“後方"LPCフィルタリングパラメータAbn(z)と同様に、“前方"LPCパラメータすなわち送信されたパラメータAfn(z)を受信する。モジュール2Cは、こうして、選択分析値すなわち値dn(n)の関数として“前方”フィルタリングパラメータAfn(z)か“後方”フィルタリングパラメータAbn(z)を、定常度の関数として適応フィルタリングモジュール2Bへと運ぶ。
モジュール2Cと2Bの実際の具現例に関して、これらのモジュールは単に図3の1D2と1Eさらに特に1Gのモジュールにおおよそ等しいモジュールでできるということを述べておく。
先に記述した手順を用いることを可能にする、本発明の対象による符号化装置の有効な具現例に関して、二つの特別の例が実行された。
・8kb/sにおけるUIT−T規格の高出力版による、電話帯域CELPタイプの符号化器
実際の符号化器は、CELPタイプの12kb/sの出力を持つ300〜3400Hzの電話帯域用符号化器から成る。フレームは、先に述べたACELPと呼ばれる技術に従って、代数コードページにより与えられる励起に対して10ms以上の間に亘って構成されている。
80個の標本ごとに、“前方"LPC分析は、10の単位の分析であり、“後方"LPC分析は、30の単位の分析である。
残余の符号化を、2つの40個の標本から成る小ブロックに分割することが実行された。各Bnブロックには80個の標本があった。
定常パラメータSTAT(n)の適合
先述した定常パラメータは、2つの極端な値である0と100、つまり先述のSTATmとSTATMの間に広がる。
前述した適合関数、特に関数fa(N_BWD)とfb(N_BWD)は、以下の様である。
これらの式において、x=DGfbである。
前述した改良値ΔSを確立することができる関数frに関して、これは変数zの段関数であり、ここでx=Gpb−Gpfであり、ΔS=fr(x)であり、以下の値を持つ。
STAT(n)の調整は、さらに、図2cに関連して前述したところの以下の条件に従う:
図2cの中で1121d、1121c、1121fの番号の付いた他の試験条件はこのバージョンでは使用されなかった。
決定閾値の適応
決定閾値に関して:
S_PREDは以下の方法で適合がなされる。
閾値S_LSP_Lは次の段関数を用いて適合がなされる。
閾値S_LSP_Lを用いて測定されたLPCフィルタの定常性の場合は、閾値S_STATは4.0dBに固定された。
閾値S_LSP_Hは、このバージョンでは使用されなかった。
閾値G1は0dBに固定された。
無音フレームENER_SILに特化したエネルギー値に関しては、この値は現在のブロックBnの80個の標本s(i)に渡って測定された結果40dBに固定された:
前述されたSFWDの値に関して、閾値はSTAT(n)の値がこの閾値よりも小さい時に“前方"LPCフィルタモードを強いることにより、スイッチングしてしまう危険をさらに制限するべく意図されており、このSFWDの値は40.6に設定された。
*2つの副帯域16/24/32kb/sを持つ広帯域CELP符号化器の第2バージョンは次の条件で実行された:
−2つの副帯域における0から7000Hzの広帯域符号化器。主帯域は、CELP法で符号化され、フレームは120個の標本を持ち、励起は代数的コードページにより作られ、送信は或るエネルギーと6000〜7000Hzの間のホスト帯域のスペクトラム特性を備える。
−120個の標本に対して、14個の係数を持つ“前方"LPC分析と、50個の係数を持つ“後方"LPC分析。“前方"LPC分析モードにおいて、60個の標本から成るLPC小ブロックに分割するのに際し、最初の小ブロックに用いられるフィルタは、現在のフィルタと前のフィルタとから改竄される。
定常性パラメータSTAT(n)の計算
このバージョンにおいて、先述した定常性パラメータは、2つの極端な値である0と120の、つまり先述したSTATmとSTATMの間にある。
定常性パラメータ値STAT(n)の適合に関して、fa(N_BWD)とfb(N_BWD)の2つの関数の値は次の様である:
前述した改良値ΔSを設定させる関数frに関して、これは変数xの段関数であり、ここでx=Gpb/GpfかつΔS=fr(x)であり、次の値を取る:
STAT(n)の調整は、さらに、図2cに関連して前述したところの以下の条件に従う:
図2cにおいて、1121h、1121dの符号の付いた、他の試験条件は、このバージョンでは使用されなかった。
決定閾値の適合
決定閾値に関して:
S_PREDは以下の方法で適合される:
[S_PREDm,S_PREDM]という限られた区間において、
S_PRED(n)=0.03STAT(n)−0.5
ここで、S_PREDm=0.5、S_PREDM=2.5である。
S_LSP_L閾値は、次の段関数の補助で適合される。
S_LSP_H閾値は、次の段関数の補助で適合される。
S_LSP_H閾値の補助で測定され、LPCフィルタの遷移の際に使用されるS_TRANS閾値は、0dBに設定された。S_LSP_L閾値の補助で測定され、LPCフィルタの遷移の際に使用されるS_STAT閾値は、2.5dBに設定された。
G閾値は、0dBに設定された。
無音フレームENER_SILに特化したエネルギー値に関しては、この値は現在のブロックBnの120個の標本s(i)に渡って測定された結果、50dBに固定された:
前述されたSFWDの値に関して、閾値は、STAT(n)の値がこの閾値よりも小さい時に“前方"LPCフィルタモードを強いることにより、スイッチングしてしまう危険をさらに制限するべく意図されており、このSFWDの値は60に設定された。
Claims (14)
- 前方LPC分析または後方LPC分析の選択基準に従う二重の分析により、ディジタル音声信号を、分析決定情報を伴うLPCフィルタリングパラメータからなる送信された符号化された信号と、送信されなかった残余符号化信号とに、それぞれ符号化する方法であって、前記ディジタル音声信号が、特定数のサンプルの連続したブロックである複数のフレームに細分され、前記ディジタル音声信号の符号化が、この信号に対しては定常ゾーンのための前方LPCフィルタリングにより、前記残余符号化信号から得られた合成信号に対しては非定常ゾーンのための後方LPCフィルタリングにより、それぞれ実施される方法において、
前記選択基準が、現在フレームを構成する前記連続した現在ブロックの各現在ブロックについて、
− 最大定常性値と最小定常性値との間に配される、定常性パラメータに従って、ディジタル音声信号の定常性の程度を定義し、
− 前記定常性パラメータを用いて決定関数から分析選択値を確定し、
− 前記ディジタル音声信号に対する非定常ゾーンのための前方LPCフィルタリング、および、前記合成信号に対する定常ゾーンのための後方LPCフィルタリングにより、前記ディジタル音声信号の符号化をそれぞれ実行するように、前方LPCフィルタリングに対して前記分析選択値を適用することにあり、
前記定常性の程度による前方および後方の内の一方のフィルタリングモードにおけるディジタル音声信号のメインテナンスをそれぞれ容易にし、かつ、前記フィルタリングモードの一方から他方およびその逆への切替量を制限することを可能にすることを特徴とする方法。 - 前記決定関数が、各現在ブロックについて、前記定常性パラメータから実現された適応関数であり、該適応関数の前記実現が、前記ディジタル音声信号の前記定常性の程度の関数としてそれぞれ前記前方および後方の内の一方のフィルタリングモードにおいて、それぞれ、ディジタル音声信号フィルタリングのメインテナンスを容易にすることを可能にし、それによって、前記フィルタリングモードの一方から他方およびその逆への切替量を制限することを可能にすることを特徴とする請求項1記載の方法。
- 前記分析選択値が、前記LPCフィルタリング先行値および後方LPCフィルタリング先行値のそれぞれに対応する前記決定関数から確定されることを特徴とする請求項1または請求項2記載の方法。
- 前記ディジタル音声信号の各現在ブロックの定常性の程度を特定する段階が、前記定常性パラメータの任意の開始値から開始して、
− 前記連続したブロックの前記現在ブロックに先行する異なる連続したブロックについて得られた特定数の分析選択値、および、前記現在ブロックに先行するブロックの定常性パラメータの値の関数として、中間定常性パラメータ値を前記現在ブロックについて計算し、
− 前記現在フレームに先行するフレームの前方および後方LPCフィルタリングの予測ゲインの値の関数として前記中間定常性パラメータ値を調節することにあることを特徴とする請求項1から請求項3のいずれかに記載の方法。 - 各現在ブロックについて、中間定常性パラメータ値を計算する段階が、
− 前記現在ブロックに先行するブロックの前方LPC分析モードと後方LPC分析モードとを識別し、
− 後方LPC分析モードにより分析された全ての先行ブロックに対して、
* 後方LPC分析モードにおいて連続的に分析された先行フレームの数を特定し、
* 第1の比較基準に従って、前記先行フレームの数が、後方LPCモードにおいて分析された連続したフレームの数を表す第1の任意値より多いか否かを検出し、この第1の比較に対する肯定応答において、
** 前記第1の任意値の関数である特定値だけ増加された、前記現在ブロックに先行するブロックの前記定常性パラメータ値を前記中間定常性パラメータ値とし、この第1の比較に対する否定応答において、
** 前記現在ブロックの先行するブロックの定常性パラメータ値を前記中間定常性パラメータ値とし、
− 前方LPC分析モードにおいて分析された全ての先行ブロックに対して、
* 前記先行ブロックに先行するブロックと前記先行ブロックとの間の後方LPC分析モードから前方LPC分析モードへの移行の発生を判断基準に従って特定し、かつ、前記発生の判断への肯定応答において、
* 第2の比較基準に従って、前記先行フレームの数が、前記先行ブロックに先行する後方LPCモードにおいて分析された連続したフレームの数を表す第2の任意値より少ないか否かを検出し、前記第2の比較に対する肯定応答において、
** 前記第2の任意値の関数である特定値だけ減じられた、前記現在ブロックに先行する前記ブロックの定常性パラメータ値を前記中間定常性パラメータ値とし、かつ、前記第2の比較に対する否定応答において、
** 前記先行ブロックの前記定常性パラメータ値を前記中間定常性パラメータ値とすることを特徴とする請求項4記載の方法。 - 各現在ブロックに対する前記中間定常性パラメータ値を調節する段階が、
− 前方LPCフィルタリングの予測ゲインと後方LPCフィルタリングの予測ゲインとを識別し、
− 前方および後方LPCフィルタリングの予測ゲインの相対的な値の関数であるリファイニング値の中間定常性パラメータ値を変更することからなり、
該中間定常性パラメータ値の変更、すなわち増加または減少が、前記リファイニング値に比例することを特徴とする請求項4または請求項5記載の方法。 - 前記中間定常性パラメータ値の前記リファイニング値に比例する増加段階が、さらに、第1の特定の正値に対する前記後方LPCフィルタリングゲインの値のスペリオリティ条件および第2の特定の正値に対する前記中間定常性パラメータ値の値のインフェリオリティ条件にかけられることを特徴とする請求項6記載の方法。
- 前記中間定常性パラメータ値の前記リファイニング値に比例する減少段階が、さらに、第3の特定の正値に対する前記後方LPCフィルタリングゲインの値のインフェリオリティ条件および第4の特定の正値に対する前記中間定常性パラメータ値の値のスペリオリティ条件にかけられることを特徴とする請求項6または請求項7記載の方法。
- 前記前方および後方LPCフィルタリングゲインの予測ゲインの相対的な値が、前記前方および後方LPCフィルタリングの予測ゲインの間の比または差であることを特徴とする請求項6から請求項8のいずれかに記載の方法。
- さらに、各連続する現在ブロックに対して、
− 前記ディジタル音声信号の平均エネルギーを確定し、
− 第2の比較基準に従って、前記平均エネルギーが、無音フレームを表す特定のしきい値より低いか否かを検出し、前記第2の比較の肯定応答において、
− 前記先行ブロックの定常性パラメータ値を前記現在ブロックの定常性パラメータとすることを特徴とする請求項1から請求項3のいずれかに記載の方法。 - 実質的に非定常ディジタル信号の定常性の程度を表す最小値と、実質的に定常信号の定常性の程度を表す最大値との間の定常性パラメータにより表される定常性の程度に対して、前記決定関数を構成する前記適応関数が、前記ディジタル信号の定常性の増加の程度に従う、前記後方LPCフィルタリングモードの先行値の増加関数であることを特徴とする請求項2から請求項10のいずれかに記載の方法。
- 前方および後方LPC分析の選択基準に従う二重の分析により、ディジタル音声信号を、送信された符号化された信号にそれぞれ符号化する装置であって、前記ディジタル信号が、特定数のサンプルからなる連続したブロックにより構成されるフレームに細分され、
分析決定表示を伴うLPCフィルタリングパラメータからなる送信された符号化された信号の供給を可能にする前方LPC分析フィルタおよび後方LPCフィルタと、合成残余信号の発生を可能にする送信されなかった符号化残余信号を符号化する手段とを具備し、
前記ディジタル音声信号の符号化が、このディジタル音声信号に対しては非定常ゾーンのための前記前方LPCフィルタから、この合成信号に対しては定常ゾーンのための後方LPCフィルタから、それぞれ行われ、
加えて、各LPC現在ブロックに対して、
− 最小定常性値と最大定常性値との間の定常性パラメータに従う、前記ディジタル音声信号の定常性の程度の計算手段と、
− 定常性パラメータからLPC分析選択値が設定されることを可能にする決定関数の設定手段と、
− 前記分析選択値を受け取り、該分析選択値の関数として、前記LPC現在ブロックに対して、前記後方および前記LPCフィルタリングパラメータ値をそれぞれ供給することを可能にするLPC分析の識別手段と、
− 前記ディジタル音声信号および前記前方および後方LPCフィルタリングパラメータをそれぞれ前記分析選択値の関数として受け取り、かつ、前記符号化残余信号の前記符号化手段に前記符号化残余信号を供給する定常性の程度の関数としての適応フィルタリング手段とを具備し、
前記ディジタル音声信号を符号化し、前記前方および後方の内の一方のフィルタリングモードにおいて、それぞれ、前記ディジタル信号の定常性の程度に関して前記ディジタル音声信号のメインテナンスを容易にし、かつ、前記フィルタリングモードの一方から他方およびその逆への切替量を制限することを可能にすることを特徴とする符号化装置。 - 前記送信された符号化された信号が、各LPC分析ブロックに対して、
− 前記分析値をからなり、
前記分析選択値が、考慮されるLPC分析ブロックに一致する場合に、
− 前記前方LPCフィルタリングパラメータをからなることを特徴とする請求項12記載の符号化装置。 - 前方および後方LPC分析に従う二重の分析により符号化されたディジタル音声信号を、それぞれ、分析決定表示を伴うLPCフィルタリングパラメータからなる送信された符号化された信号に復号化する装置であって、前記送信された符号化された信号が、各LPC分析ブロックに対して前記分析選択値からなり、かつ、考慮されるLPC分析ブロックに対して、前方LPCフィルタリングパラメータにおける前方LPC分析に対応し、
少なくとも、
− 前記LPC残余信号の前記符号化パラメータを受け取り、かつ、合成残余信号を供給するフィルタリング残余信号の合成手段と、
− 前記合成残余信号を受け取り、前記ディジタル音声信号を表す合成信号を発生することができ、かつ、復号化信号を構成する、最大定常性値と最小定常性値との間に配される定常性パラメータに従う定常性の程度の関数としての反転フィルタリング適応手段と、
− 前記合成信号を受け取り、後方LPCフィルタリングパラメータを発生することができる後方LPC分析手段と、
− 一方では、識別制御のために前記分析選択値を、他方では、前方LPCフィルタリングパラメータおよび後方フィルタリングパラメータをそれぞれ受け取り、かつ、前記分析選択値の関数として、前方LPCフィルタリングパラメータまたは後方LPCフィルタリングパラメータのいずれかを、前記定常性の程度の関数としての前記反転フィルタリング適応手段に供給することを可能にする、前方LPC分析と後方LPC分析とを識別する手段とを具備することを特徴とする復号化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR97/04684 | 1997-04-16 | ||
FR9704684A FR2762464B1 (fr) | 1997-04-16 | 1997-04-16 | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
PCT/FR1998/000723 WO1998047134A1 (fr) | 1997-04-16 | 1998-04-09 | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc 'avant' et 'arriere' |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000512777A JP2000512777A (ja) | 2000-09-26 |
JP3564144B2 true JP3564144B2 (ja) | 2004-09-08 |
Family
ID=9505979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54355598A Expired - Lifetime JP3564144B2 (ja) | 1997-04-16 | 1998-04-09 | “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6327562B1 (ja) |
EP (1) | EP0906613B1 (ja) |
JP (1) | JP3564144B2 (ja) |
CN (1) | CN1122256C (ja) |
AU (1) | AU729584B2 (ja) |
BR (1) | BR9804852B1 (ja) |
CA (1) | CA2258695C (ja) |
DE (1) | DE69807806T2 (ja) |
ES (1) | ES2183358T3 (ja) |
FR (1) | FR2762464B1 (ja) |
HK (1) | HK1020101A1 (ja) |
WO (1) | WO1998047134A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6377919B1 (en) * | 1996-02-06 | 2002-04-23 | The Regents Of The University Of California | System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech |
US6542857B1 (en) * | 1996-02-06 | 2003-04-01 | The Regents Of The University Of California | System and method for characterizing synthesizing and/or canceling out acoustic signals from inanimate sound sources |
FR2774827B1 (fr) * | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
EP1052622B1 (en) * | 1999-05-11 | 2007-07-11 | Nippon Telegraph and Telephone Corporation | Selection of a synthesis filter for CELP type wideband audio coding |
US6633841B1 (en) * | 1999-07-29 | 2003-10-14 | Mindspeed Technologies, Inc. | Voice activity detection speech coding to accommodate music signals |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
WO2001084536A1 (de) * | 2000-04-28 | 2001-11-08 | Deutsche Telekom Ag | Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector) |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
JP4591939B2 (ja) * | 2001-05-15 | 2010-12-01 | Kddi株式会社 | 適応的符号化伝送装置および受信装置 |
SE521600C2 (sv) * | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
US7685598B1 (en) * | 2003-12-23 | 2010-03-23 | The Weather Channel, Inc. | Desktop application framework |
JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
EP1991986B1 (en) * | 2006-03-07 | 2019-07-31 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for audio coding |
CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
FR2961937A1 (fr) * | 2010-06-29 | 2011-12-30 | France Telecom | Codage/decodage predictif lineaire adaptatif |
EP2980796A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990013112A1 (en) * | 1989-04-25 | 1990-11-01 | Kabushiki Kaisha Toshiba | Voice encoder |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
SE501981C2 (sv) * | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5717823A (en) * | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
US5793980A (en) * | 1994-11-30 | 1998-08-11 | Realnetworks, Inc. | Audio-on-demand communication system |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5812954A (en) * | 1995-11-27 | 1998-09-22 | Nokia Mobile Phones Ltd. | Mobile telephone power key lock function |
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
US5903866A (en) * | 1997-03-10 | 1999-05-11 | Lucent Technologies Inc. | Waveform interpolation speech coding using splines |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
-
1997
- 1997-04-16 FR FR9704684A patent/FR2762464B1/fr not_active Expired - Lifetime
-
1998
- 1998-04-09 EP EP98920601A patent/EP0906613B1/fr not_active Expired - Lifetime
- 1998-04-09 CN CN98800863A patent/CN1122256C/zh not_active Expired - Lifetime
- 1998-04-09 JP JP54355598A patent/JP3564144B2/ja not_active Expired - Lifetime
- 1998-04-09 AU AU73404/98A patent/AU729584B2/en not_active Expired
- 1998-04-09 US US09/202,753 patent/US6327562B1/en not_active Expired - Lifetime
- 1998-04-09 CA CA002258695A patent/CA2258695C/en not_active Expired - Lifetime
- 1998-04-09 WO PCT/FR1998/000723 patent/WO1998047134A1/fr active IP Right Grant
- 1998-04-09 ES ES98920601T patent/ES2183358T3/es not_active Expired - Lifetime
- 1998-04-09 DE DE69807806T patent/DE69807806T2/de not_active Expired - Lifetime
- 1998-04-09 BR BRPI9804852-0A patent/BR9804852B1/pt not_active IP Right Cessation
-
1999
- 1999-11-15 HK HK99105267A patent/HK1020101A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
BR9804852B1 (pt) | 2011-04-19 |
JP2000512777A (ja) | 2000-09-26 |
AU729584B2 (en) | 2001-02-08 |
CN1229501A (zh) | 1999-09-22 |
US6327562B1 (en) | 2001-12-04 |
AU7340498A (en) | 1998-11-11 |
ES2183358T3 (es) | 2003-03-16 |
CN1122256C (zh) | 2003-09-24 |
HK1020101A1 (en) | 2000-03-10 |
CA2258695A1 (en) | 1998-10-22 |
CA2258695C (en) | 2003-02-11 |
BR9804852A (pt) | 1999-08-24 |
WO1998047134A1 (fr) | 1998-10-22 |
EP0906613A1 (fr) | 1999-04-07 |
DE69807806D1 (de) | 2002-10-17 |
DE69807806T2 (de) | 2003-08-07 |
FR2762464A1 (fr) | 1998-10-23 |
EP0906613B1 (fr) | 2002-09-11 |
FR2762464B1 (fr) | 1999-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3564144B2 (ja) | “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 | |
US10249310B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
US10373621B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
JP5173939B2 (ja) | Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置 | |
US7554969B2 (en) | Systems and methods for encoding and decoding speech for lossy transmission networks | |
US6134518A (en) | Digital audio signal coding using a CELP coder and a transform coder | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
JP3378238B2 (ja) | ソフト適応性特性を含む音声コーディング | |
JP3565869B2 (ja) | 伝送エラーの修正を伴う音声信号の復号方法 | |
EP1526507A1 (en) | Method for packet loss and/or frame erasure concealment in a voice communication system | |
JP2006525533A5 (ja) | ||
MXPA04011751A (es) | Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
US7860711B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
JP3416331B2 (ja) | 音声復号化装置 | |
JP5604572B2 (ja) | 複雑さ分散によるデジタル信号の転送誤り偽装 | |
JPH0612095A (ja) | 音声復号化方法 | |
JPH05165500A (ja) | 音声符号化方法 | |
JP5174651B2 (ja) | 低演算量符号励振線形予測符号化 | |
JP3754819B2 (ja) | 音声通信方法及び音声通信装置 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
MXPA98010592A (en) | Method and device for coding an audio signal by"forward"and"backward"lpc analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040607 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080611 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120611 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |