JP4064236B2 - 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 - Google Patents
広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 Download PDFInfo
- Publication number
- JP4064236B2 JP4064236B2 JP2002544711A JP2002544711A JP4064236B2 JP 4064236 B2 JP4064236 B2 JP 4064236B2 JP 2002544711 A JP2002544711 A JP 2002544711A JP 2002544711 A JP2002544711 A JP 2002544711A JP 4064236 B2 JP4064236 B2 JP 4064236B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- zero amplitude
- track section
- amplitude
- pulse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 266
- 230000004044 response Effects 0.000 claims description 38
- 238000004891 communication Methods 0.000 claims description 30
- 230000000873 masking effect Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000010267 cellular communication Effects 0.000 claims description 3
- 230000000452 restraining effect Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 98
- 230000005284 excitation Effects 0.000 description 47
- 238000003786 synthesis reaction Methods 0.000 description 23
- 230000015572 biosynthetic process Effects 0.000 description 22
- 238000013461 design Methods 0.000 description 21
- 239000011159 matrix material Substances 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 13
- 238000012546 transfer Methods 0.000 description 11
- 238000013139 quantization Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 230000007774 longterm Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011045 prefiltration Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 229910015861 MSix Inorganic materials 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Moving Of The Head To Find And Align With The Track (AREA)
- Dc Digital Transmission (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Treatment Of Fiber Materials (AREA)
Description
【技術分野】
本発明は、信号を、限定される訳ではないが特に発話信号を、送信・合成することを考慮して、デジタル方式で符号化する技術に関する。特に、本発明は、限定される訳ではないが特に、代数コード励起線形予測(Algebraic Code Excited Linear Prediction)(ACELP)技術に基づく広帯域信号の高品質コーディングに必要とされる非常に大きな代数コードブックにおいて、非ゼロ振幅パルスのパルス位置と振幅を索引付けする方法に関する。
【0002】
【背景技術】
インターネット、パケットネットワーク用途ばかりでなく、オーディオ/ビデオ遠隔会議、マルチメディア、無線用途などのさまざまな用途において、良好な主観的(subjective)品質/ビットレートトレードオフを有する効率的なデジタル広帯域発話/オーディオエンコーディング技術に対する要求が増加しつつある。最近までは、200〜3400Hzの範囲にフィルタリングされた電話帯域幅が、主に、発話コーディング用途に使用されてきた。しかしながら、発話信号の明瞭さと自然さを向上させるために、広帯域発話用途の要求が増加しつつある。50〜7000Hzの範囲の帯域幅が、対面発話品質を供給するのに十分であることが分かった。オーディオ信号として、この範囲によって与えられるオーディオ品質は、許容されるけれども、20〜20000Hzの範囲で作動するCD(コンパクトディスク)品質より、依然として低いままである。
【0003】
発話エンコーダーは、発話信号をデジタルビットストリームに変換し、このデジタルビットストリームは、通信チャネルを通して伝達され(または、記憶媒体に格納され)る。発話信号は、デジタル化(サンプリングされサンプル毎に通常16ビットで量子化)され、発話エンコーダーは、良好な主観的発話品質を維持しながら、より少数のビットでこれらのデジタルサンプルを表現する役割を果たす。発話デコーダーまたは合成装置は、伝達または格納されたビットストリームに作用し、音響信号に変換して戻す。
【0004】
良好な品質/ビットレートトレードオフを実現できる最良の従来技術の1つに、いわゆるCELP(コード励起された線形予測(Code Excited Linear Prediction))技術がある。この技術によれば、サンプリングされた発話信号は、一般にフレームと呼ばれるL個のサンプルの連続ブロックで処理され、ここで、Lはある所定数(10〜30msの発話に相当する)である。CELPでは、各フレームごとに、LP(線形予測(Linear Prediction))合成フィルターが、計算され伝達される。次に、L個のサンプルのフレームは、サイズがN個のサンプルのサブフレームと呼ばれる、より小さなブロックに分割され、ここで、L=kNであり、kは、フレーム中のサブフレームの数である(Nは一般に4〜10msの発話に相当する)。励起信号が各サブフレームごとに決定され、この励起信号は、一般に2つの成分から構成され、一方は、過去の励起(ピッチ寄与部分または適応コードブックとも呼ばれる)からの成分であり、他方は、革新コードブック(固定コードブックとも呼ばれる)からの成分である。この励起信号は、合成発話を得るために、デコーダーに伝達され、LP合成フィルターの入力として使用される。
【0005】
CELP技術によって発話を合成するために、N個のサンプルの各ブロックは、発話信号のスペクトル特性をモデル化する時間変動フィルターを通して革新コードブックから適切なコードベクトルをフィルタリングすることによって合成される。これらのフィルターは、ピッチ合成フィルター(一般に過去の励起信号を含む適応コードブックとして構築される)とLP合成フィルターとから構成される。エンコーダー端では、合成出力が、コードブックからのコードベクトルの全てまたは一部に対して計算される(コードブックサーチ)。保持されたコードベクトルは、知覚的に(perceptually)重み付けされたひずみ(distortion)方法によって、元の発話信号に最も近い合成出力を生成するコードベクトルである。この知覚的重み付けは、一般にLP合成フィルターから得られるいわゆる知覚的重み付けフィルターを用いて実行される。
【0006】
CELP文脈上の革新コードブックは、Nサンプル長さ列の索引付けされた組であり、N次元コードベクトルと呼ばれることになる。各コードブック列は、1〜Mの範囲の整数kによって索引付けされており、ここで、Mは、ビットbの数として通常示されるコードブックのサイズを表しており、M=2bである。
【0007】
コードブックは、物理記憶装置、例えば、参照テーブル(確率コードブック)に格納されることができ、あるいは、対応するコードベクトルに索引を関係させる機構、例えば、式(代数コードブック)を参照することができる。
【0008】
第一の種類のコードブック、確率コードブックの欠点は、このコードブックが一般にかなりの物理ストレージを含むことである。このコードブックは、索引から関連するコードベクトルへの経路が、大きな発話列の組に適用される確率的技術またはランダムに生成された数の結果である参照テーブルを含むという意味において、確率的すなわちランダムである。確率コードブックのサイズは、ストレージとサーチの複雑さの少なくとも一方によって制限されがちである。
【0009】
第二の種類のコードブックは代数コードブックである。確率コードブックとは対照的に、代数コードブックは、ランダムではなく、大きなストレージを必要としない。代数コードブックは、一組の索引付けされたコードベクトルであり、このコードベクトルの、k番め(kth)のコードベクトルのパルスの位置と振幅は、物理ストレージを全く必要としないか最小限の物理ストレージだけを必要とする規則によって、対応する索引kから得ることができる。従って、代数コードブックのサイズは、ストレージの必要条件によって制限されない。代数コードブックは、効率的なサーチをするように設計することもできる。
【0010】
CELP方式(CELP model)は、電話帯域音響信号をエンコードするのに非常に成功しており、いくつかのCELPに基づく規格が、広範囲の用途において、特にデジタル携帯電話の用途において存在する。電話帯域では、音響信号は、200〜3400Hzに帯域が限定されており、8000サンプル/秒でサンプリングされる。広帯域発話/オーディオ用途では、音響信号は、50〜7000Hzに帯域が限定されており、16000サンプル/秒でサンプリングされる。
【0011】
電話帯域に最適化されたCELP方式を、広帯域信号に適用するときに、いくつかの困難が生じ、高品質の広帯域信号を得るためには、この方式に付加的特徴を追加する必要がある。これらの特徴には、効率的な知覚的重み付けフィルタリング、可変帯域幅ピッチフィルタリング、効率的な利得平滑化およびピッチ向上(enhancement)技術が含まれる。広帯域信号をコーディングするときに生じる別の重要な問題は、非常に大きな励起コードブックを使用する必要があることである。従って、最小限のストレージだけを必要とし、高速にサーチできる効率的なコードブック構造が、非常に重要になっている。代数コードブックは、その効率性によって知られており、さまざまな発話コーディング規格に、現在広く使用されている。代数コードブックと、関連する高速サーチ手順とは、1995年8月22日発行の米国特許第5,444,816号(アドゥラ(Adoul)ら)、アドゥラ(Adoul)らに1997年12月17日に付与された第5,699,482号、アドゥラ(Adoul)らに1998年5月19日に付与された第5,754,976号、1997年12月23日付の第5,701,392号(アドゥラ(Adoul)ら)に、記載されている。
【0012】
【発明の目的】
本発明の目的は、限定される訳ではないが特に広帯域信号を効率的にエンコーディングするために、代数コードブックにおいてパルス位置と振幅を索引付けする新しい手順を提供することである。
【0013】
【発明の開示】
本発明によれば、音響信号の効率的なエンコーディングおよびデコーディングのために、代数コードブックにおいてパルス位置と振幅を索引付けする方法が提供される。コードブックは、一組のパルス振幅/位置組み合わせから成り、各組み合わせは、異なる位置の数を規定し、組み合わせのそれぞれの位置に割り当てられた非ゼロ振幅パルスとゼロ振幅パルスの両方を含む。各非ゼロ振幅パルスは、複数の可能な振幅の1つを取り、索引付けする方法は、
これらのパルス位置の少なくとも1つのトラックの一組を形成し、
パルス位置の少なくとも1つのトラックのこの一組に従って、コードブックの組み合わせの非ゼロ振幅パルスの位置を制限し、
1つの非ゼロ振幅パルスの位置だけが、この一組の1つのトラック内に位置するとき、この1つの非ゼロ振幅パルスの位置と振幅を索引付けする手順1を設定し、
2つの非ゼロ振幅パルスの位置だけが、この一組の1つのトラック内に位置するとき、これら2つの非ゼロ振幅パルスの位置と振幅を索引付けする手順2を設定し、
X≧3である数X個の非ゼロ振幅パルスの位置が、この一組の1つのトラック内に位置するとき、
トラックの位置を2つのセクションに分割し、
X個の非ゼロ振幅パルスの位置と振幅を索引付けする手順Xを使用する、
ことを含み、この手順Xは、
各非ゼロ振幅パルスが位置する、2つのトラックセクションの1つを特定し、
少なくとも1つのトラックセクションとトラック全体において設定された手順1、2を用いてX個の非ゼロ振幅パルスの副索引を計算し、
これらの副索引を組み合わせることにより、X個の非ゼロ振幅パルスの位置・振幅索引を計算する、
ことを含む。
【0014】
好ましくは、X個の非ゼロ振幅パルスの位置・振幅索引を計算することは、
少なくとも2つの副索引を組み合わせることにより、少なくとも1つの中間索引を計算し、
残りの副索引と少なくとも1つの中間索引とを組み合わせることにより、これらのX個の非ゼロ振幅パルスの位置・振幅索引を計算する、
ことを含む。
【0015】
さらに、本発明は、音響信号の効率的なエンコーディングまたはデコーディングのために、代数コードブックにおいてパルス位置と振幅を索引付けする装置に関する。コードブックは、一組のパルス振幅/位置組み合わせから成り、各パルス振幅/位置組み合わせは、異なる位置の数を規定し、組み合わせのそれぞれの位置に割り当てられた非ゼロ振幅パルスとゼロ振幅パルスの両方を含み、各非ゼロ振幅パルスは、複数の可能な振幅の1つを取る。索引付けする装置は、
パルス位置の少なくとも1つのトラックの一組を形成する手段と、
パルス位置の少なくとも1つのトラックのこの一組に従って、コードブックの組み合わせの非ゼロ振幅パルスの位置を制限する手段と、
1つの非ゼロ振幅パルスの位置だけが、この一組の1つのトラック内に位置するとき、この1つの非ゼロ振幅パルスの位置と振幅を索引付けする手順1を設定する手段と、
2つの非ゼロ振幅パルスの位置だけが、この一組の1つのトラック内に位置するとき、これら2つの非ゼロ振幅パルスの位置と振幅を索引付けする手順2を設定する手段と、
X≧3である数X個の非ゼロ振幅パルスの位置が、この一組の1つのトラック内に位置するとき、
トラックの位置を2つのセクションに分割する手段と、
X個の非ゼロ振幅パルスの位置と振幅を索引付けする手順Xを実行する手段と、
を含み、この手順Xを実行する手段は、
各非ゼロ振幅パルスが位置する、2つのトラックセクションの1つを特定する手段と、
少なくとも1つのトラックセクションとトラック全体において設定された手順1、2を用いてX個の非ゼロ振幅パルスの副索引を計算する手段と、
これらの副索引を組み合わせる手段を含みX個の非ゼロ振幅パルスの位置・振幅索引を計算する手段と、
を含む。
【0016】
好ましくは、X個の非ゼロ振幅パルスの位置・振幅索引を計算する手段は、
少なくとも2つの副索引を組み合わせることにより、少なくとも1つの中間索引を計算する手段と、
残りの副索引とこの少なくとも1つの中間索引とを組み合わせることにより、X個の非ゼロ振幅パルスの位置・振幅索引を計算する手段と、
を含む。
【0017】
本発明は、さらに、
音響信号をエンコーディングするエンコーダーに関し、このエンコーダーは、音響信号に応答し発話信号エンコーディングパラメータを生成する音響信号処理手段を含み、この音響信号処理手段は、
少なくとも1つの発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、
この代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、
を含み、
本発明は、さらに、音響信号エンコーディングパラメータに応答して音響信号を合成するデコーダーに関し、このデコーダーは、
音響信号エンコーディングパラメータに応答して励起信号を生成するエンコーディングパラメータ処理手段を含み、このエンコーディングパラメータ処理手段は、
励起信号の一部を生成するために少なくとも1つの音響信号エンコーディングパラメータに応答する代数コードブックと、
代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、
励起信号に応答して音響信号を合成する合成フィルター手段と、
を含み、
本発明は、さらに、複数のセルに分割された大きな地理学的領域でサービスを提供する携帯電話通信システムに関し、このシステムは、
可搬式送信機/受信機ユニットと、
セル内にそれぞれ位置する携帯電話基地局と、
携帯電話基地局間の通信を制御する手段と、
1つのセル内に位置する各可搬式ユニットとこの1つのセルの携帯電話基地局との間の双方向無線通信サブシステムであって、可搬式ユニットと携帯電話基地局の両方内に、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含む、サブシステムと、
を含み、
発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、を含み、発話信号は、音響信号を構成し、
本発明は、さらに、携帯電話ネットワーク要素に関し、このネットワーク要素は、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含み、
発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、を含み、
本発明は、さらに、携帯電話可搬式送信機/受信機ユニットに関し、このユニットは、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含み、
発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、を含み、
本発明は、さらに、複数のセルに分割された大きな地理学的領域でサービスを提供する携帯電話通信システムであって、可搬式送信機/受信機ユニットと、セル内にそれぞれ位置する携帯電話基地局と、携帯電話基地局間の通信を制御する手段と、を含むシステムにおいて、
1つのセル内に位置する各可搬式ユニットとこの1つのセルの携帯電話基地局との間の双方向無線通信サブシステムに関し、この双方向無線通信サブシステムは、可搬式ユニットと携帯電話基地局の両方内に、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含み、
発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする上述したような装置と、を含む。
【0018】
本発明の上述のおよび他の目的、利点、特徴は、添付の図面だけを参照して例示として与えられた本発明の好ましい実施態様の非限定的な以下の説明を読むことで、より明らかになるであろう。
【0019】
【発明を実施するための最良の形態】
当業者にはよく知られているように、401(図4)などの携帯電話通信システムは、数C個の、より小さなセルに大きな地理学的領域を分割することによって、この大きな地理学的領域に亘ってテレコミュニケーションサービスを提供する。C個の小さなセルは、それぞれの携帯電話基地局4021、4022、…、402Cによって、各セルに無線信号、オーディオ、データチャネルを提供するようにサービスが提供される。
【0020】
無線信号チャネルは、携帯電話基地局402の有効範囲の領域(セル)の区域内で、403などの可搬式無線電話機(可搬式送信機/受信機ユニット)に呼び出しをかけ、さらに、基地局のセル内またはセル外に位置する他の無線電話機403または公衆交換電話網(Public Switched Telephone Network)(PSTN)404などの他のネットワークに呼び出しをかける、のに使用される。
【0021】
一旦、無線電話機403が、呼び出しをかけまたは受けるのに成功すると、オーディオまたはデータチャネルが、無線電話機403とこの無線電話機403が位置するセルに対応する携帯電話基地局402との間に確立され、基地局402と無線電話機403との間の通信が、このオーディオまたはデータチャネルを通して実行される。無線電話機403は、呼び出しが進行している間、信号チャネルを通して制御またはタイミング情報を受け取ることもできる。
【0022】
呼び出しが進行している間、無線電話機403が1つのセルを出て隣接する別のセルに入る場合、無線電話機403は、新しいセル基地局402の利用可能なオーディオまたはデータチャネルに呼び出しを引き渡す。呼び出しが進行していない間、無線電話機403が1つのセルを出て隣接する別のセルに入る場合、無線電話機403は、新しいセルの基地局402に接続するように信号チャネルを通して制御メッセージを送信する。このようにして、大きな地理学的領域に亘る移動通信が可能となる。
【0023】
携帯電話通信システム401は、例えば、無線電話機403とPSTN404との間または第1のセル内に位置する無線電話機403と第2のセル内に位置する無線電話機403との間の通信の間に、携帯電話基地局402とPSTN404との間の通信を制御するように、制御端末405をさらに含む。
【0024】
勿論、双方向無線無線通信サブシステムは、1つのセルの基地局402とこのセル内に位置する無線電話機403との間にオーディオまたはデータチャネルを確立する必要がある。図4に非常に簡略化された形態で例示されるように、そのような双方向無線無線通信サブシステムは、通常、無線電話機403内に、
送信機406と受信機410とを含み
送信機406は、
音声信号または送信する他の信号をエンコーディングするエンコーダー407と、
エンコーダー407から409などのアンテナを通して、エンコードされた信号を送信する送信回路408と、を含み、
受信機410は、
通常同じアンテナ409を通して、送信されたエンコードされた音声信号または他の信号を受信する受信回路411と、
受信回路411からの受信されたエンコードされた信号をデコーディングするデコーダー412と、を含む。
【0025】
無線電話機403は、エンコーダー407へ音声信号または他の信号を供給するように、かつ、デコーダー412からの音声信号または他の信号を処理するように、他の従来の無線電話機回路413をさらに含む。これらの無線電話機回路413は、当業者によく知られており、従って、本明細書においてはさらに説明しないこととする。
【0026】
さらに、このような双方向無線無線通信サブシステムは、通常、基地局402内に、
送信機414と受信機418とを含み
送信機414は、
音声信号または送信する他の信号をエンコーディングするエンコーダー415と、
エンコーダー415から417などのアンテナを通して、エンコードされた信号を送信する送信回路416と、を含み、
受信機418は、
同じアンテナ417を通してまたは別の異なるアンテナ(図示せず)を通して、送信されたエンコードされた音声信号または他の信号を受信する受信回路419と、
受信回路419からの受信されたエンコードされた信号をデコーディングするデコーダー420と、を含む。
【0027】
基地局402は、通常さらに、制御端末405と送信機414および受信機418との間の通信を制御する基地局制御装置421を、この基地局制御装置421に関連するデータベース422とともに含む。基地局制御装置421は、基地局402と同じセル内に位置する403などの2つの無線電話機間の通信の場合、受信機418と送信機414との間の通信を制御することにもなる。
【0028】
当業者によく知られているように、エンコーディングは、双方向無線無線通信サブシステムを通して、すなわち無線電話機403と基地局402との間で、信号、例えば、発話などの音声信号、を伝達するのに必要とされる帯域幅を低減するために必要とされる。
【0029】
コード励起線形予測(CELP)エンコーダーなどの13kビット/秒またはそれ未満で通常作動するLP音声エンコーダー(415、407など)は、発話信号の短期スペクトル包絡線をモデリングするのに、LP合成フィルターを一般に使用する。LP情報は、通常10または20msごとに、デコーダー(420、412など)に伝達され、デコーダー端において抜き出される。
【0030】
本明細書に開示される新規な技術は、発話を含む電話帯域信号とともに、発話以外の音響信号とともに、さらには、他の種類の広帯域信号とともに、使用することができる。
【0031】
図1は、広帯域信号に、よりよく対応するように修正された、CELP型発話エンコーディング装置100の概略ブロック図を示す。広帯域信号は、特に、音楽、ビデオ信号などの信号を含むことができる。
【0032】
サンプリングされた入力発話信号114は、「フレーム」と呼ばれる連続するL個のサンプルのブロックに分割される。各フレームでは、フレーム内の発話信号を表す異なるパラメータが計算され、エンコードされ、伝達される。LP合成フィルターを表すLPパラメータが、通常、各フレームごとに一回計算される。フレームは、さらに、N個のサンプルの、より小さなブロック(長さNのブロック)に分割され、このブロック内で、励起パラメータ(ピッチと革新)が決定される。CELP文献内では、これら長さNのブロックは、「サブフレーム」と呼ばれ、サブフレーム内のN個のサンプルの信号は、N次元ベクトルと呼ばれる。この好ましい実施態様では、長さNは、5msに相当し、一方、長さLは、20msに相当するので、これは、1つのフレームが4つのサブフレームを含むことを意味している(16kHzのサンプリングレートで、N=80であり、12.8kHzにダウンサンプリングした後では、64である)。さまざまなN次元ベクトルが、エンコーディング手順に生じる。図1、図2に現れるベクトルの一覧表と、伝達されるパラメータの一覧表を、以下に与える。
【0033】
主なN次元ベクトルの一覧表
s :広帯域信号入力発話ベクトル(ダウンサンプリング、前処理、プリエンファシス後)、
sw :重み付けされた発話ベクトル、
s0 :重み付けされた合成フィルターのゼロ入力応答、
sp :ダウンサンプリングされ前処理された信号、
s∧ :オーバーサンプリングされ合成された発話信号(ここでは、sの真上に∧が付いている記号にs∧を代用する。以下同様。)、
s’ :デエンファシス前の合成信号、
sd :デエンファシスされた合成信号、
sh :デエンファシスと後処理後の合成信号、
x :ピッチサーチ用の目標ベクトル、
x2 :革新サーチ用の目標ベクトル、
h :重み付けされた合成フィルターインパルス応答、
vT :遅延Tにおける適応(ピッチ)コードブックベクトル、
yT :フィルタリングされたピッチコードブックベクトル(hでたたみこみされたvT)、
ck :索引kにおける革新コードブック(革新コードブックのk番めのエントリー)、
cf :向上され変倍された革新コードブック、
u :励起信号(変倍された革新およびピッチコードベクトル)、
u’ :向上された励起、
z :帯域通過ノイズ列、
w’ :白色ノイズ、
w :変倍されたノイズ列。
【0034】
伝達されるパラメータの一覧表
STP :(A(z)を規定する)短期予測パラメータ、
T :ピッチ遅延(またはピッチコードブック索引)、
b :ピッチ利得(またはピッチコードブック利得)、
j :ピッチコードベクトル上に使用される低域通過フィルターの索引、
k :コードベクトル索引(革新コードブックエントリー)、
g :革新コードブック利得。
【0035】
この好ましい実施態様では、STPパラメータは、1つのフレームにつき一回伝達され、残りのパラメータは、各サブフレームに(1つのフレームにつき4回)伝達される。
【0036】
エンコーダー側
サンプリングされた発話信号は、101から111まで番号付けされた11個のモジュールに分解される図1のエンコーディング装置100によって、ブロック単位でエンコードされる。
【0037】
入力発話信号は、フレームと呼ばれる上述したL個のサンプルのブロックで処理される。
【0038】
図1を参照すると、サンプリングされた入力発話信号114は、ダウンサンプリングモジュール101において、ダウンサンプリングされる。例えば、信号は、当業者によく知られた技術を用いて、16kHzから12.8kHzへとダウンサンプリングされる。勿論、別の周波数へのダウンサンプリングを考えることができる。より小さな周波数帯域幅がエンコードされるので、ダウンサンプリングは、コーディング効率を向上させる。1つのフレーム内のサンプルの数が低減するので、これは、アルゴリズムの複雑さも低減させる。ビットレートが16kビット/秒未満に低減されるとき、ダウンサンプリングを用いることは重要になり、16kビット/秒の上では、ダウンサンプリングは、本質的ではない。
【0039】
ダウンサンプリング後、20msの320個のサンプルのフレームが、256個のサンプルのフレームに低減される(4/5のダウンサンプリング比)。
【0040】
次に、入力フレームは、随意の処理ブロック102に供給される。前処理ブロック102は、50Hzカットオフ周波数を有する高域通過フィルターから構成されることができる。高域通過フィルター102は、50Hz未満の不要な音響成分を除去する。
【0041】
ダウンサンプリングされ前処理された信号は、sp(n)、n=0、1、2、…、L−1によって表示され、ここで、Lは、フレームの長さ(12.8kHzのサンプリング周波数では256)である。好ましい実施態様では、信号sp(n)は、以下の伝達関数:
P(z)=1−μz-1、
を有するプリエンファシスフィルター103を用いてプリエンファシスされ、ここで、μは、0と1の間に位置する値(通常の値は、μ=0.7)を有するプリエンファシス係数であり、zは、多項式P(z)の変数を表す。より高次のフィルターを使用することもできるであろう。高域通過フィルター102とプリエンファシスフィルター103とは、より効率的な固定点の実現が得られるように、交換できることが、指摘される必要がある。
【0042】
プリエンファシスフィルター103の関数は、入力信号の高周波数成分を向上させる。それは、さらに、入力発話信号のダイナミックレンジを低減させることで、それを、固定点の実現に、より適するようにさせる。プリエンファシスがないと、単精度計算を用いた固定点内のLP解析は、実現が困難である。
【0043】
プリエンファシスは、音響品質を向上させるのに寄与する、量子化誤差の適切な全体的な知覚的重み付けを達成するのにも、重要な役割を果たす。これは、以下に、より詳細に説明される。
【0044】
プリエンファシスフィルター103の出力は、s(n)で表示される。この信号は、計算機モジュール104においてLP解析を実行するのに使用される。LP解析は、当業者によく知られた技術である。この好ましい実施態様では、自己相関法(Autocorrelation Approach)を用いる。自己相関法では、信号s(n)は、ハミング窓(Hamming Window)(一般に30〜40ms程度の長さを有する)を用いて、最初に窓付けされる。自己相関は、窓付けされた信号から計算され、レヴィンソン−ダービン回帰(Levinson−Durbin Recursion)が、LPフィルター係数、aiを計算するのに使用され、ここで、i=1、…、pであり、pは、LP次数で、広帯域コーディングでは通常16である。パラメータaiは、LPフィルターの伝達関数の係数であり、以下の関係:
A(z)=1+Σp i=1aiz-1、
によって与えられる(ここで、Σp i=1は、i=1からpまでの和を表す。以下同様。)。
【0045】
LP解析は、計算機モジュール104において実行され、この計算機モジュール104は、LPフィルター係数の量子化と補間を実行する。LPフィルター係数は、最初に、量子化と補間の目的に、より適した別の同値変域(Equvalent Domain)に変換される。線スペクトル対(LSP)およびイミッタンススペクトル対(ISP)変域が、量子化と補間を効率的に実行できる2つの変域である。16LPフィルター係数、aiは、分割または多段量子化またはこれらの組み合わせを用いて、30〜50ビット程度で量子化することができる。補間の目的は、各フレームごとに一回LPフィルター係数を伝達する間、各サブフレームごとにLPフィルター係数を更新できるようにすることであり、それによって、ビットレートを増加せずにエンコーダー特性が向上する。LPフィルター係数の量子化と補間は、他の点については、当業者によく知られていると思われるので、本明細書では、さらに説明はしないこととする。
【0046】
以下の段落では、サブフレーム基準で実行される残りのコーディング演算を記載する。以下の記載では、フィルターA(z)は、サブフレームの量子化されていない補間されたLPフィルターを示し、フィルターA∧(z)は、サブフレームの量子化され補間されたLPフィルターを示す。
【0047】
知覚的重み付け:
解析・合成(analysis−by−synthesis)エンコーダーにおいて、最適ピッチおよび革新パラメータは、知覚的に重み付けされた変域における合成された発話と入力発話との間の平均二乗誤差を最小化することによって、サーチされる。これは、重み付けされた入力発話と重み付けされた合成発話との間の誤差を最小化するのに相当する。
【0048】
重み付けされた信号sw(n)は、知覚的重み付けフィルター105において計算される。伝統的には、重み付けされた信号sw(n)は、形式:
W(z)=A(z/γ1)/A(z/γ2)、
ここで、0<γ2<γ1≦1、
となる伝達関数W(z)を有する重み付けフィルターによって計算される。
【0049】
当業者にはよく知られるように、以前の解析・合成(AbS)エンコーダーでは、解析は、量子化誤差が、知覚的重み付け誤差フィルター105の伝達関数の逆関数である伝達関数W-1(z)によって、重み付けされることを示している。この結果は、「発話の予測的コーディングと主観的誤差基準」、IEEE会報(Transaction)ASSP、第27巻、第3号、第247〜254頁、1979年6月、において、アタル(B.S.Atal)とシュレーダー(M.R.Schroeder)によって、詳しく記載されている。伝達関数W-1(z)は、入力発話信号のフォルマント構造のいくつかを示している。従って、量子化誤差を整形することによって、人間の聴覚のマスキング特性が活用され、それによって、人間の聴覚は、フォルマント領域において、よりエネルギーを有し、このフォルマント領域では、人間の聴覚は、この領域に存在する強力な信号エネルギーによって、マスクされることになる。
【0050】
上述した伝統的な知覚的重み付けフィルター105は、電話帯域信号では、よく作用する。しかしながら、この伝統的な知覚的重み付けフィルター105は、広帯域信号の効率的な知覚的重み付けには適していないことが見出された。さらに、伝統的な知覚的重み付けフィルター105は、フォルマント構造と必要とされるスペクトル傾き(tilt)とを同時にモデリングするのに、固有の限界を有することも見出された。スペクトル傾きは、広帯域信号においては、低周波数と高周波数との間の広いダイナミックレンジによって、より顕著である。この問題を解決するために、広帯域入力信号の傾きとフォルマント重み付けを別々に制御するように、W(z)内に傾きフィルターを追加することが提案されている。
【0051】
この問題に対する、よりよい解決は、入力にプリエンファシスフィルター103を導入し、プリエンファシスされた発話s(n)に基づいてLPフィルターA(z)を計算し、その分母を固定することによって修正されたフィルターW(z)を使用することである。
【0052】
LP解析は、モジュール104において、プリエンファシスされた信号s(n)に対して実行され、LPフィルターA(z)が得られる。さらに、固定された分母を有する新しい知覚的重み付けフィルター105も使用される。この伝統的な知覚的重み付けフィルター104のための伝達関数の一例が、以下の関係:
W(z)=A(z/γ1)/(1−γ2z-1)、
ここで、0<γ2<γ1≦1、である、
によって与えられる。
【0053】
より高次を、分母において使用することができる。この構造は、実質的に、傾きからフォルマント重み付けを切り離す。
【0054】
A(z)が、プリエンファシスされた発話信号s(n)に基づいて計算されるので、フィルター1/A(z/γ1)の傾きは、A(z)が元の発話に基づいて計算される場合に比較して、より顕著でないことが、留意される。デエンファシスが、伝達関数:
P-1(z)=1/(1−μz-1)、
を有するフィルターを用いてデコーダー端において実行されるので、量子化誤差スペクトルは、伝達関数W-1(z)P-1(z)を有するフィルターによって整形される。一般的な場合であるが、γ1がμに等しく設定されるとき、量子化誤差のスペクトルは、A(z)がプリエンファシスされた発話信号に基づいて計算され伝達関数が1/A(z/γ1)であるフィルターによって、整形される。主観的リスニングは、プリエンファシスと修正された重み付けフィルタリングとの組み合わせにより誤差整形を実現するためのこの構造が、固定点アルゴリズムの実現が容易であるという利点に加えて、広帯域信号をエンコーディングするのに非常に有効であることを、示している。
【0055】
ピッチ解析:
ピッチ解析を単純化するために、開ループピッチ遅延TOLが、開ループピッチサーチモジュール106において、重み付けされた発話信号sw(n)を用いて最初に推定される。次に、閉ループピッチサーチモジュール107において、サブフレーム基準で実行される閉ループピッチ解析は、LTPパラメータTとb(ピッチ遅延とピッチ利得)のサーチの複雑さを大幅に低減する開ループピッチ遅延TOLのまわりに、限定される。開ループピッチ解析は、当業者によく知られた技術を用いて、通常、モジュール106において、各10ms(2つのサブフレーム)ごとに一回実行される。
【0056】
LTP(長期予測)解析用の目標ベクトルxが、最初に計算される。これは、重み付けされた発話信号sw(n)から、重み付けされた合成フィルターW(z)/A∧(z)のゼロ入力応答s0を差し引きすることによって、通常実行される。このゼロ入力応答s0は、ゼロ入力応答計算機108によって計算される。より詳細には、目標ベクトルxは、以下の関係:
x=sw−s0、
を用いて計算され、ここで、xは、N次元目標ベクトルであり、swは、サブフレーム内の重み付けされた発話ベクトルであり、s0は、その初期状態により組み合わされたフィルターW(z)/A∧(z)の出力であるフィルターW(z)/A∧(z)のゼロ入力応答である。ゼロ入力応答計算機108は、LP解析、量子化、補間計算機104から量子化され補間されたLPフィルターA∧(z)に応答し、さらに、記憶装置モジュール111内に格納された重み付けされた合成フィルターW(z)/A∧(z)の初期状態に応答し、フィルターW(z)/A∧(z)のゼロ入力応答s0(入力をゼロに等しく設定することによって決定された初期状態による応答の部分)を計算する。この演算は、当業者によく知られており、従って、さらに説明しないこととする。
【0057】
勿論、別のしかしながら数学的に同等の方法を、目標ベクトルxを計算するのに用いることができる。
【0058】
重み付けされた合成フィルターW(z)/A∧(z)のN次元インパルス応答ベクトルhが、インパルス応答発生器109において、モジュール104からのLPフィルター係数A(z)とA∧(z)を用いて計算される。さらに、この演算は、当業者によく知られており、従って、本明細書においてはさらに説明しないこととする。
【0059】
閉ループピッチ(またはピッチコードブック)パラメータb、T、jは、閉ループピッチサーチモジュール107において、入力として目標ベクトルx、インパルス応答ベクトルh、開ループピッチ遅延TOLを用いて、計算される。伝統的には、ピッチ予測は、以下の伝達関数:
1/(1−bz-T)、
を有するピッチフィルターによって表され、ここで、bは、ピッチ利得であり、Tは、ピッチ遅延または遅れである。この場合、励起信号u(n)へのピッチ寄与部分は、bu(n−T)によって与えられ、ここで、全励起は、
u(n)=bu(n−T)+gck(n)、
によって与えられ、ここで、gは、革新コードブック利得であり、ck(n)は、索引kにおける革新コードベクトルである。
【0060】
この表現は、ピッチ遅延Tがサブフレーム長さNより短い場合、制限がある。別の表現では、ピッチ寄与は、過去の励起信号を含むピッチコードブックとして見ることができる。一般に、ピッチコードブック内の各ベクトルは、前のベクトルの1つシフトしたバージョン(1つのサンプルを捨てて、新しいサンプルを追加する)である。ピッチ遅延T>Nに対して、ピッチコードブックは、フィルター構造(1/(1−bz-T)と同等であり、ピッチ遅延TにおけるピッチコードブックベクトルvT(n)は、
vT(n)=u(n−T)、
n=0,…,N−1、
によって与えられる。
【0061】
Nより短いピッチ遅延に対して、ベクトルvT(n)は、ベクトルが完成されるまで、過去の励起からの利用可能なサンプルを繰り返すことによって生成される(これは、フィルター構造と同等ではない)。
【0062】
最近のエンコーダーでは、音声化された音響セグメントの質を大幅に向上させる、より高いピッチ分解が使用される。これは、多相補間フィルターを用いて、過去の励起信号をオーバーサンプリングすることによって実現される。この場合、ベクトルvT(n)は、ピッチ遅延Tが非整数遅延(例えば、50.25)である、過去の励起の補間バージョンに通常相当する。
【0063】
ピッチサーチは、目標ベクトルxと変倍されたフィルタリングされた過去の励起との間の平均二乗された重み付けされた誤差Eを最小化するピッチ遅延Tと利得bを見出すことから成る。誤差Eは、
E=‖x−byT‖2、
として表され、ここで、yTは、ピッチ遅延Tにおいてフィルタリングされたピッチコードブックベクトル:
yT(n)=vT(n)*h(n)
=Σn i=0vT(i)h(n−i)、
n=0,…,N−1、
である。
【0064】
誤差Eは、サーチ基準:
C=xtyT(yt TyT)-1/2、
を最大化することによって最小化され、ここで、tは、ベクトル転置を示す。
【0065】
好ましい実施態様では、1/3サブサンプルピッチ分解を使用し、ピッチ(ピッチコードブック)サーチは、三段階から成る。
【0066】
第1段階では、開ループピッチ遅延TOLが、開ループピッチサーチモジュール106において、重み付けされた発話信号sw(n)に応答して推定される。先の説明において示したように、この開ループピッチ解析は、当業者によく知られた技術を用いて、通常、各10ms(2つのサブフレーム)ごとに一回実行される。
【0067】
第2段階では、サーチ基準Cが、サーチ手順を大幅に単純化する推定された開ループピッチ遅延TOL(通常±5)のまわりの整数ピッチ遅延に対して、閉ループピッチサーチモジュール107において、サーチされる。以下の説明では、各ピッチ遅延ごとにたたみこみを計算する必要のない、フィルタリングされたコードベクトルyTを更新する簡単な手順が提案される。
【0068】
一旦、最適な整数ピッチ遅延が、第2段階において見出されると、サーチの第3段階(モジュール107)が、最適な整数ピッチ遅延のまわりの分数を評価する。
【0069】
ピッチ予測器が、ピッチ遅延T>Nに対しては有効な仮定である形式1/(1−bz-T)のフィルターによって示されるとき、ピッチフィルターのスペクトルは、調和周波数が1/Tに関連する調和構造を、全周波数領域に亘って示す。広帯域信号の場合、広帯域信号における調和構造が拡張されたスペクトルの全体には及んでいないので、この構造は、あまり有効ではない。調和構造は、発話セグメントに依存して、特定の周波数にまで存在するだけである。従って、広帯域発話の音声化されたセグメントにおいてピッチ寄与の効率的な表現を実現するために、ピッチ予測フィルターは、広帯域スペクトルに亘って周期性の量を変える柔軟性が必要である。
【0070】
広帯域信号の発話スペクトルの調和構造を効率的にモデリングするのを実現できる改善された方法が、本明細書に開示されており、それによって、いくつかの形式の低域通過フィルターが、過去の励起に適用され、より高い予測利得を有する低域通過フィルターが、選択される。
【0071】
サブサンプルピッチ分解が、使用されるとき、低域通過フィルタを、より高いピッチ分解を得るのに使用される補間フィルター内へ組み込むことができる。この場合、選択された整数ピッチ遅延のまわりの分数が評価されるピッチサーチの第3段階は、異なる低域通過特性を有するいくつかの補間フィルターに対して繰り返され、サーチ基準Cを最大化させる分数とフィルター索引が選択される。
【0072】
より単純な方法は、特定の周波数応答を有する補間フィルターを1つだけ用いて最適な分数のピッチ遅延を決定するように、上述した三段階のサーチを完成すること、選択されたピッチコードブックベクトルvTに異なる所定の低域通過フィルターを適用することにより最終的に最適な低域通過フィルター整形を選択すること、ピッチ予測誤差を最小化する低域通過フィルターを選択すること、である。この方法は、以下に、詳細に説明される。
【0073】
図3は、提案された後者の方法の好ましい実施態様の概略ブロック図が例示する。
【0074】
記憶装置モジュール303内には、過去の励起信号u(n)、n<0、が格納される。ピッチコードブックサーチモジュール301が、記憶装置モジュール303からの目標ベクトルx、開ループピッチ遅延TOL、過去の励起信号u(n)、n<0、に応答し、上に定義されたサーチ基準Cを最小化するピッチコードブック(ピッチコードブック)サーチを実行する。モジュール301において実行されたサーチの結果から、モジュール302が、最適なピッチコードブックベクトルvTを生成する。サブサンプルピッチ分解が使用される(分数ピッチ)ので、過去の励起信号u(n)、n<0は、補間され、ピッチコードブックベクトルvTは、補間された過去の励起信号に相当することが、留意される。この好ましい実施態様では、補間フィルタ(モジュール301にあるが、図示されていない)は、7000Hzを超える周波数成分を除去する低域通過フィルター特性を有する。
【0075】
好ましい実施態様では、K個のフィルター特性が使用され、これらのフィルター特性は、低域通過または帯域通過フィルター特性とすることができるであろう。一旦、最適なコードベクトルvTが、ピッチコードベクトル発生器302によって決定され供給されると、vTのK個のフィルタリングされたバージョンが、305(j)、ここで、j=1,2,…,K、などのK個の異なる周波数整形フィルターを用いて、それぞれ計算される。これらのフィルタリングされたバージョンは、vf (j)で示され、ここで、j=1,2,…,K、である。異なるベクトルvf (j)は、それぞれのモジュール304(j)、ここで、j=0,1,2,…,K、において、インパルス応答hでたたみこみされ、ベクトルy(j)が得られ、ここで、j=0,1,2,…,K、である。各ベクトルy(j)に対して、平均二乗されたピッチ予測誤差を計算するために、値y(j)は、対応する増幅器307(j)によって、利得bが掛けられ、値by(j)は、対応する減算器308(j)によって、目標ベクトルxから差し引かれる。選択器309が、平均二乗されたピッチ予測誤差:
e(j)=‖x−b(j)y(j)‖2、
j=1,2,…,K、
を最小化する周波数整形フィルター305(j)を選択する。
【0076】
各y(j)の値に対して、平均二乗されたピッチ予測誤差e(j)を計算するために、対応する増幅器307(j)によって、利得bが掛けられ、値b(j)y(j)は、減算器308(j)によって、目標ベクトルxから差し引かれる。各利得b(j)は、索引jにおける周波数整形フィルターに関連する、対応する利得計算機306(j)において、以下の関係:
b(j)=xty(j)/‖y(j)‖2、
を用いて計算される。
【0077】
選択器309において、パラメータb、T、jは、平均二乗されたピッチ予測誤差eを最小化するvTまたはvf (j)に基づいて選択される。
【0078】
図1を再度参照すると、ピッチコードブック索引Tは、エンコードされ、マルチプレクサー112に伝達される。ピッチ利得bは、量子化され、マルチプレクサー112に伝達される。この新しい方法では、マルチプレクサー112において、選択された周波数整形フィルターの索引jをエンコードするのに、余分の情報が必要とされる。例えば、3つのフィルターが使用される場合(j=0,1,2,3)、この情報を表示するのに、2ビットが必要とされる。このフィルター索引情報jは、ピッチ利得bと合わせてエンコードすることもできる。
【0079】
革新コードブック:
一旦、ピッチまたはLTP(長期予測)パラメータb、T、jが決定されると、次のステップは、図1のサーチモジュール110によって、最適な革新励起をサーチすることである。最初に、目標ベクトルxが、LTP寄与を差し引く:
x2=x―byT、
ことによって、更新され、ここで、bは、ピッチ利得であり、yTは、フィルタリングされたピッチコードブックベクトル(図3を参照して説明したように、遅延Tにおいて、選択された低域通過フィルターでフィルタリングされ、インパルス応答hでたたみこみされた、過去の励起)である。
【0080】
CELPにおけるサーチ手順は、目標ベクトルと変倍されフィルタリングされたコードベクトルとの間の平均二乗された誤差:
E=‖x2−gHck‖2、
を最小化する最適な励起コードベクトルckと利得gを見出すことによって実行され、ここで、Hは、インパルス応答ベクトルhから導かれる下三角たたみこみ行列である。
【0081】
使用された革新コードブックが、代数コードブックから成る動的コードブックであり、その後に、米国特許第5,444,816号に従って、合成発話品質を改善するために特別なスペクトル成分を向上させる適応プレフィルターF(z)が続くことを留意するだけの価値がある。このプレフィルターを設計するのに異なる方法を使用することができる。ここで、広帯域信号に関連する設計が使用され、それによって、F(z)は、2つの部分、すなわち、周期性向上部分、1/(1−0.85z-T)と、傾き部分、(1−β1z-1)とから成り、ここで、Tは、ピッチ遅延の整数部分であり、β1は、前のサブフレームの音声化に関連し、[0.0,0.5]の範囲にある。コードブックサーチの前に、インパルス応答h(n)は、プレフィルターF(z)を含む必要があることが、留意される。すなわち、
h(n)←h(n)+βh(n−T)、
である。
【0082】
好ましくは、革新コードブックサーチは、1995年8月22日発行の米国特許第5,444,816号(アドゥラ(Adoul)ら)、アドゥラ(Adoul)らに1997年12月17日に付与された第5,699,482号、アドゥラ(Adoul)らに1998年5月19日に付与された第5,754,976号、1997年12月23日付の第5,701,392号(アドゥラ(Adoul)ら)に記載されている代数コードブックを用いて、モジュール110において実行される。
【0083】
代数コードブックを設計する多くの方法がある。本説明の実施態様では、代数コードブックは、Np個の非ゼロ振幅パルス(または略して非ゼロパルス)piを有するコードベクトルから構成される。
【0084】
mi、βiをそれぞれ、i番め(ith)の非ゼロパルスの位置、振幅と呼ぶ。i番め(ith)の振幅が固定されているか、または、コードブックサーチの前にβiを選択する何らかの方法が存在するので、振幅βiは、知られていると仮定するものとする。パルス振幅の前選択(preselection)は、上述した米国特許第5,754,976号に記載されている方法に従って実行される。
【0085】
「トラックi」で表示されたTiを、i番目の非ゼロパルスが、0とN−1の間で占めることができる一組の位置piと呼ぶ。トラックの通常のいくつかの組が、N=64として、以下に与えられる。
【0086】
いくつかの設計例が、米国特許第5,444,816号に導入されており、「インターリーブされた単一パルス置換(Interleaved Single Pulse Permutations)」(ISPP)と呼ばれる。これらの例は、N=40サンプルのコードベクトル長さに基づいていた。
【0087】
ここで、N=64のコードベクトル長さと、表1に与えられた「インターリーブされた単一パルス置換(Interleaved Single Pulse Permutations)」構造ISPP(64,4)とに基づく新しい設計例を与える。
【0088】
【表1】
【0089】
表1:ISPP(64,4)設計。
【0090】
ISPP(64,4)設計では、64個の位置の一組が、それぞれ60/4=16個の有効位置を含む4つのインターリーブされたトラックに分割される。4ビットが、与えられた非ゼロパルスの16=24個の有効位置を特定するのに必要である。パルスまたはコーディングビットの数によって、特定の条件に対応するために、このISPP設計とコードブック構造とを導き出す多くの方法がある。各トラック内に配置することができる非ゼロパルスの数を変更することによって、この構造に基づいて、いくつかのコードブックを設計することができる。
【0091】
単一符号付き非ゼロパルスを、各トラックに配置する場合、パルス位置は、4ビットでエンコードされ、その符号は(各非ゼロパルスを、正または負とすることができる場合)、1ビットでエンコードされる。従って、合計で4×(4+1)=20のコーディングビットが、この特定の代数コードブック構造のためにパルス位置と符号を特定するのに必要となる。
【0092】
2つの符号付き非ゼロパルスを、各トラックに配置する場合、2つのパルス位置は、8ビットでエンコードされ、それらの対応する符号は、パルス順序(これは、本明細書において、以下に詳述するものとする)を活用することによって、1ビットでエンコードすることができる。従って、合計で4×(4+4+1)=36のコーディングビットが、この特定の代数コードブック構造のためにパルス位置と符号を特定するのに必要となる。
【0093】
各トラックに、3、4、5、または6つの非ゼロパルスを配置することによって、他のコードブック構造を設計することができる。そのような構造において、パルス位置と符号を効率的に効率的にコーディングする方法は、以下に開示することとする。
【0094】
さらに、異なるトラックに等しくない数の非ゼロパルスを配置することによって、または、特定のトラックを無視することによって、あるいは、特定のトラックを結合することによって、他のコードブックを設計することができる。例えば、トラックT0とT2に、3つの非ゼロパルスを配置し、トラックT1とT3に、2つの非ゼロパルスを配置することによっって、コードブックを設計することができる(13+9+13+9=42ビットコードブック)。トラックT2とT3とを結合することを考慮し、トラックT0、T1、T2−T3に、非ゼロパルスを配置することによって、他のコードブックを設計することができる。
【0095】
理解できるように、ISPP設計の一般的主題のまわりに非常にさまざまなコードブックを構成することができる。
【0096】
パルス位置と符号の効率的コーディング(コードブック索引付け):
ここで、1つのトラックにつき1つから6つの符号付き非ゼロパルスを配置するいくつかの場合を検討するものとし、与えられたトラックにパルス位置と符号を合わせて効率的にコーディングする方法を開示する。
【0097】
最初に、1つのトラックにつき1つの非ゼロパルスと2つの非ゼロパルスをコーディングする例を与えることにする。1つのトラックにつき1つの符号付き非ゼロパルスをコーディングすることは、直進的であり、1つのトラックにつき2つの符号付き非ゼロパルスをコーディングすることは、文献に、EFR発話コーディング基準(EFR Speech Coding Standard)(可搬式通信用全地球システム(Global System For Mobile Communications)、GSM 06.60、「デジタル携帯電話遠距離通信システム;拡張正規速度(EFR)発話トランスコーディング(Digital Cellular Telecommuniations System;Enhance Full Rate (EFR) Speech Transcoding)」、欧州遠隔通信基準機関(European Telecommunication Standard Institute)、1996)に、記載されている。
【0098】
2つの符号付き非ゼロパルスをコーディングする方法を示した後で、1つのトラックにつき3、4、5、6つの符号付き非ゼロパルスを効率的にコーディングする方法を開示することとする。
【0099】
1つのトラックにつき1つの符号付きパルスのコーディング
長さKのトラックにおいて、1つの符号付き非ゼロパルスは、符号に対して1ビット、位置に対してlog2(K)ビットを必要とする。ここで、パルス位置をエンコードするのにMビットが必要であることを意味する、K=2Mとなる特別な場合を検討することとする。従って、長さK=2Mのトラックにおいて、1つの符号付き非ゼロパルスに対して、合計でM+1ビットが必要である。この好ましい実施態様では、符号(符号索引)を示すビットは、非ゼロパルスが正の場合、0に、非ゼロパルスが負の場合、1に設定されている。勿論、逆の表記を使用することもできる。
【0100】
特定のトラック内のパルスの位置索引は、トラック内のパルス間隔によって分割(整数除法(Integer Division))されたサブフレーム内のパルス位置によって、与えられる。トラック索引は、この整数除法の剰余によって、見出される。表1のISPP(64,4)を例にとれば、サブフレームサイズは、64(0〜63)であり、パルス間隔は、4である。サブフレーム位置25におけるパルスは、25DIV4=6の位置索引と、25MOD4=1のトラック索引を有し、ここで、DIVは、整数除法を表し、MODは、除法の剰余を示す。同様に、40のサブフレーム位置におけるパルスは、位置索引10、トラック索引0を有する。
【0101】
長さ2Mのトラックにおいて、位置索引p、符号索引sを有する1つの符号付き非ゼロパルスは、
I1p=p+s×2M、
によって、与えられる。
【0102】
K=16(M=4ビット)の場合は、符号付きパルスの5ビット索引は、以下の表2のように表される。
【0103】
【表2】
【0104】
手順(porcudure)code_1pulse(p,s,M)は、長さ2Mのトラックにおいて、位置索引p、符号索引sにおけるパルスをどのようにエンコードするかを示す。
【0105】
【表3】
【0106】
(表3)手順1:M+1ビットを用いた、長さK=2Mのトラックにおける、1つの符号付き非ゼロパルスのコーディング。
【0107】
1つのトラックにつき2つの符号付きパルスのコーディング
K=2Mの可能な位置の1つのトラックにつき2つの非ゼロパルスの場合、各パルスは、符号に対して1ビット、位置に対してMビットを必要とし、合計で2M+2ビットが必要となる。しかしながら、重要でないパルス順序によって、いくつかの重複が存在する。例えば、第1のパルスを位置pに、第2のパルスを位置qに配置するのは、第1のパルスを位置qに、第2のパルスを位置pに配置するのと、同等である。1つの符号だけをエンコーディングし、さらに、索引内の位置の順序から第2の符号を導き出すことによって、1ビットを節約することができる。この好ましい実施態様では、索引は、
I2p=p1+p0×2M+s×22M、
によって、与えられ、ここで、sは、位置索引p0における非ゼロパルスの符号索引である。
【0108】
エンコーダーにおいては、2つの符号が等しい場合、より小さな位置が、p0に設定され、より大きな位置が、p1に設定される。一方、2つの符号が等しくない場合、より大きな位置が、p0に設定され、より小さな位置が、p1に設定される。
【0109】
デコーダーにおいては、位置p0における非ゼロパルスの符号は、容易に利用できる。第2の符号は、パルス順序から導き出される。位置p1が位置p0より小さい場合、位置p1における非ゼロパルスの符号は、位置p0における非ゼロパルスの符号の逆である。位置p1が位置p0より大きい場合、位置p1における非ゼロパルスの符号は、位置p0における非ゼロパルスの符号と同じである。
【0110】
この好ましい実施態様では、索引内のビットの順序は、以下の表4に示される。sは、非ゼロパルスp0の符号に相当する。
【0111】
【表4】
【0112】
位置索引p0、p1、符号索引σ0、σ1を有する2つの非ゼロパルスをエンコーディングする手順が、図5に示される。これは、以下の手順2においてさらに説明される。
【0113】
【表5】
【0114】
(表5)手順2:2M+1ビットを用いた、長さK=2Mのトラックにおける、2つの符号付き非ゼロパルスのコーディング。
【0115】
1つのトラックにつき3つの符号付きパルスのコーディング
1つのトラックにつき3つの非ゼロパルスの場合、2つの非ゼロパルスの場合と同様の論理を使用することができる。2M個の位置を有するトラックに対しては、3M+3ビットの代わりに、3M+1ビットが必要となる。本明細書に開示されている、非ゼロパルスを索引付けする簡単な方法は、トラック位置を、半分に分割して2つのハーフ部分(セクション)に分割し、少なくとも2つの非ゼロパルスを含むハーフ部分を特定することである。各セクションにおける位置の数は、K/2=2M/2=2M-1であり、これは、M−1ビットで表示することができる。少なくとも2つの非ゼロパルスを含むセクションにおける2つの非ゼロパルスは、2(M−1)+1ビットを必要とする、手順code_2pulse([p0p1],[s0s1],M−1)でエンコードされ、トラック内のどこにも(どちらのセクションにも)含まれることができる残りのパルスは、M+1ビットを必要とする、手順code_1pulse(p,s,M)でエンコードされる。最終的に、2つの非ゼロパルスを含むセクションの索引は、1ビットでエンコードされる。従って、必要なビットの全数は、2(M−1)+1+M+1+1=3M+1、である。
【0116】
2つの非ゼロパルスが、トラックの同じハーフ部分に位置するかチェックする簡単な方法は、それらの位置索引の最上位ビット(MSB)が、同じかどうかをチェックすることによって、行われる。これは、MSBが等しければ0を与え、等しくなければ1を与える、排他的論理和論理演算によって、簡単に行うことができる。MSB=0は、位置がトラックの下位ハーフ部分(0〜(K/2−1))に属すことを意味し、MSB=1は、それが、上位ハーフ部分(K/2〜(K−1))に属すことを意味する、ことが留意される。2つの非ゼロパルスが、上位ハーフ部分に属す場合、2(M−1)+1ビットを用いてそれらをエンコーディングする前に、それらを範囲(0〜(K/2−1))にシフトする必要がある。これは、M−1個の1(M−1の1’s)から成るマスク(数2M-1−1に相当する)を用いて、M−1最下位ビット(LSB)をマスキングすることによって、行うことができる。
【0117】
位置索引p0、p1、p2、符号索引σ0、σ1、σ2における3つのパルスをエンコーディングする手順が、以下の手順3に記載される。
【0118】
【表6】
【0119】
(表6)手順3:3M+1ビットを用いた、長さK=2Mのトラックにおける、3つの符号付きパルスのコーディング。
【0120】
以下の表7は、M=4(K=16)の場合に対するこの好ましい実施態様による13ビット索引における、ビットの配分を示している。
【0121】
【表7】
【0122】
1つのトラックにつき4つの符号付きパルスのコーディング
長さK=2Mのトラック内の4つの符号付き非ゼロパルスは、4Mビットを用いてエンコードすることができる。
【0123】
3つのパルスの場合と同様に、トラック内のK個の位置は、各セクションがK/2個のパルス位置を含む2つのセクション(2つのハーフ部分)に分割する。ここで、これらのセクションを、位置0からK/2−1までを有するセクションA、位置K/2からK−1までを有するセクションBと表示する。各セクションは、0から4つの非ゼロパルスを含むことができる。以下の表8は、各セクションにおいて可能なパルスの数を表示する5つの場合(case)を示している。
【0124】
【表8】
【0125】
場合0または4において、長さK/2=2M-1のセクションにおける4つのパルスは、4(M−1)+1=4M−3ビットを用いてエンコードすることができる(これは、後ほど説明するものとする)。
【0126】
場合1または3において、長さK/2=2M-1のセクションにおける1つのパルスは、M−1+1=Mビットで、エンコードすることができ、他のセクションにおける3つのパルスは、3(M−1)+1=3M−2ビットでエンコードすることができる。これは、合計でM+3M−2=4M−2ビットを与える。
【0127】
場合2において、長さK/2=2M-1のセクションにおけるパルスは、2(M−1)+1=2M−1ビットでエンコードすることができる。従って、両方のセクションでは、2(2M−1)=4M−2ビットが必要である。
【0128】
ここで、場合0と4を結合すると仮定するならば、場合索引は、2ビット(4つの可能な場合)でエンコードすることができる。また、場合1、2、3のいずれも、必要なビット数は、4M−2である。これは、合計で4M−2+2=4Mビットを与える。場合0または4では、いずれの場合も特定するのに1ビットが必要であり、セクションにおいて4つのパルスをエンコーディングするのに4M−3ビットが必要である。全体の場合に必要な2ビットを追加すると、これは、合計で1+4M−3+2=4Mビットを与える。
【0129】
従って、上述した説明から理解できるように、4つのパルスは、合計4Mビットでエンコードすることができる。
【0130】
4Mビットを用いて、長さK=2Mのトラックにおいて、4つの符号付き非ゼロパルスをエンコーディングする手順が、以下の手順4に示される。
【0131】
以下の4つの表は、M=4(K=16)の好ましい実施態様による上述した異なる場合に対する索引におけるビットの配分を示す。1つのトラックにつき4つの符号付きパルスをエンコーディングするには、この場合、16ビットが必要である。
【0132】
(表9)場合0または4。
【0133】
【表9】
【0134】
(表10)場合1。
【0135】
【表10】
【0136】
(表11)場合2。
【0137】
【表11】
【0138】
(表12)場合3。
【0139】
【表12】
【0140】
【表13】
【0141】
(表13)手順4:4Mビットを用いた、長さK=2Mのトラックにおける、4つの符号付き非ゼロパルスのコーディング。
【0142】
4つの非ゼロパルスが同じセクション内にある、場合0または1では、4(M−1)+1=4M−3ビットが必要であることが、留意される。これは、長さK/2=2M-1のセクションにおいて、4つの非ゼロパルスをエンコーディングする簡単な方法を用いて行われる。これは、さらに、長さK/4=2M-2のサブセクションにセクションを分割すること、少なくとも2つの非ゼロパルスを含むサブセクションを特定すること、2(M−2)+1=2M−3ビットを用いてサブセクションにおいて2つの非ゼロパルスをコーディングすること、1ビットを用いて少なくとも2つの非ゼロパルスを含むサブセクションの索引をコーディングすること、2(M−1)+1=2M−1ビットを用いて、残りの2つの非ゼロパルスがセクション内のどこにも含まれることができると仮定して、残りの2つの非ゼロパルスをコーディングすること、によって、行われる。これは、合計で(2M−3)+(1)+(2M−1)=4M−3を与える。
【0143】
4M−3ビットを用いた、長さK/2=2M-1のセクションにおける4つの符号付き非ゼロパルスのエンコーディングは、手順4_セクションにおいて示される。
【0144】
【表14】
【0145】
(表14)手順4_セクション:4M−3ビットを用いた、長さK/2=2M-1のセクションにおける4つの符号付きパルスのコーディング。
【0146】
1つのトラックにつき5つの符号付きパルスのコーディング
長さK=2Mのトラック内の5つの符号付き非ゼロパルスは、5Mビットを用いてエンコードすることができる。
【0147】
4つの非ゼロパルスの場合と同様に、トラック内のK個の位置は、各セクションがK/2個の位置を含む2つのセクション(2つのハーフ部分)に分割される。ここで、これらのセクションを、位置0からK/2−1までを有するセクションA、位置K/2からK−1までを有するセクションBと表示する。各セクションは、0から5つのパルスを含むことができる。以下の表15は、各セクションにおいて可能なパルスの数を表示する6つの場合を示している。
【0148】
【表15】
【0149】
場合0、1、2では、セクションB内に少なくとも3つの非ゼロパルスがある。一方、場合3、4、5では、セクションA内に少なくとも3つのパルスがある。従って、5つの非ゼロパルスをエンコードする簡単な方法は、3(M−1)+1=3M−2ビットを必要とする手順3を用いて、同じセクション内で3つの非ゼロパルスをエンコードし、さらに、2M+1ビットを必要とする手順を用いて、残りの2つのパルスをエンコードすることである。これは、5M−1ビットを与える。少なくとも3つの非ゼロパルスを含むセクション(場合(0,1,2)または場合(3,4,5))を特定するのに、余分のビットが必要である。従って、5つの符号付き非ゼロパルスをエンコードするのに、合計で5Mビットが必要である。
【0150】
5Mビットを用いて、長さK=2Mのトラックにおいて、5つの符号付きパルスをエンコーディングする手順が、以下の手順5に示される。
【0151】
以下の2つの表は、M=4(K=16)の好ましい実施態様による上述した異なる場合に対する索引におけるビットの配分を示す。1つのトラックにつき5つの符号付き非ゼロパルスをエンコーディングするには、この場合、20ビットが必要である。
【0152】
(表16)場合0、1および2。
【0153】
【表16】
【0154】
(表17)場合3、4および5。
【0155】
【表17】
【0156】
【表18】
【0157】
(表18)手順5:5Mビットを用いた、長さK=2Mのトラックにおける、5つの符号付きパルスのコーディング。
【0158】
1つのトラックにつき6つの符号付きパルスのコーディング
長さK=2Mのトラック内の6つの符号付きパルスは、この好ましい実施態様において6M−2ビットを用いてエンコードすることができる。
【0159】
5つのパルスの場合と同様に、トラック内のK個の位置は、各セクションがK/2個の位置を含む2つのセクション(2つのハーフ部分)に分割される。ここで、これらのセクションを、位置0からK/2−1までを有するセクションA、位置K/2からK−1までを有するセクションBと表示する。各セクションは、0から6つのパルスを含むことができる。以下の表19は、各セクションにおいて可能なパルスの数を表示する7つの場合を示している。
【0160】
【表19】
【0161】
場合0、6は、6つの非ゼロパルスが異なるセクションにあることを除き、同様であることが、留意される。同様に、場合1と5の間の相違、場合2と4の間の相違は、より多くのパルスを含むセクションである。従って、これらの場合は、結合することができ、より多くのパルスを含むセクションを特定するために、余分のビットを割り当てることができる。これらの場合は、最初に6M−5ビットを必要とするので、結合された場合は、セクションビットを考慮して6M−4ビットを必要とする。
【0162】
従って、ここで、状態が2つの余分のビットを必要とする、結合された場合の4つの状態を有する。これは、6つの符号付き非ゼロパルスに対して、合計で6M−4+2=6M−2ビットを与える。結合された場合は、以下の表20に示される。
【0163】
【表20】
【0164】
場合0または6では、6つの非ゼロパルスを含むセクションを特定するのに、1ビットが必要である。このセクション内の5つの非ゼロパルスは、(パルスはこのセクションに限定されるので)5(M−1)ビットを必要とする手順5を用いてエンコードされ、残りのパルスは、1+(M−1)を必要とする手順1を用いてエンコードされる。従って、この結合された場合には、合計で1+5(M−1)+M=6M−4ビットが必要である。結合された場合の状態をエンコードするのに、余分の2ビットが必要であり、合計で6M−2ビットを与える。
【0165】
場合1または5では、5つのパルスを含むセクションを特定するのに、1ビットが必要である。このセクション内の5つのパルスは、5(M−1)ビットを必要とする手順5を用いてエンコードされ、他のセクション内のパルスは、1+(M−1)ビットを必要とする手順1を用いてエンコードされる。従って、これらの結合された場合には、合計で1+5(M−1)+M=6M−4ビットが必要である。結合された場合の状態をエンコードするのに、余分の2ビットが必要であり、合計で6M−2ビットを与える。
【0166】
場合2または4では、4つの非ゼロパルスを含むセクションを特定するのに、1ビットが必要である。このセクション内の4つのパルスは、4(M−1)ビットを必要とする手順4を用いてエンコードされ、他のセクション内の2つのパルスは、1+2(M−1)ビットを必要とする手順2を用いてエンコードされる。従って、これらの結合された場合には、合計で1+4(M−1)+1+2(M−1)=6M−4ビットが必要である。場合の状態をエンコードするのに、余分の2ビットが必要であり、合計で6M−2ビットを与える。
【0167】
場合3では、各セクション内の3つの非ゼロパルスは、各セクション内において3(M−1)+1ビットを必要とする手順3を用いてエンコードされる。これは、両方のセクションに対して6M−4ビットを与える。場合の状態をエンコードするのに、余分の2ビットが必要であり、合計で6M−2ビットを与える。
【0168】
6M−2ビットを用いて、長さK=2Mのトラックにおいて、6つの符号付き非ゼロパルスをエンコーディングする手順が、以下の手順6に示される。
【0169】
以下の2つの表は、M=4(K=16)の好ましい実施態様による上述した異なる場合に対する索引におけるビットの配分を示す。1つのトラックにつき6つの符号付き非ゼロパルスをエンコーディングするには、この場合、22ビットが必要である。
【0170】
(表21)場合0および6。
【0171】
【表21】
【0172】
(表22)場合1および5。
【0173】
【表22】
【0174】
(表23)場合2および4。
【0175】
【表23】
【0176】
(表24)場合3。
【0177】
【表24】
【0178】
【表25】
【0179】
(表25)手順6:6M−2ビットを用いた、長さK=2Mのトラックにおける、6つの符号付きパルスのコーディング。
【0180】
ISPP(64,4)に基づくコードブック構造例
ここで、上に説明したISPP(64,4)設計に基づいて、異なるコードブック設計例を示す。トラックサイズは、1つのトラックにつきM=4ビットを必要とするK=16である。異なる設計例は、1つのトラックにつき非ゼロパルスの数を変更することによって、得られる。8つの可能な設計を、以下に記載する。1つのトラックにつき非ゼロパルスの異なる組み合わせを選択することによって、他のコードブック構造を容易に得ることができる。
【0181】
設計1:1つのトラックにつき1つのパルス(20ビットコードブック)
この例では、各非ゼロパルスが、(4+1)ビット(手順1)を必要とし、4つのトラック内の4つのパルスに対して、合計で20ビットを与える。
【0182】
設計2:1つのトラックにつき2つのパルス(36ビットコードブック)
この例では、各トラック内の2つの非ゼロパルスが、(4+4+1)=9ビット(手順2)を必要とし、4つのトラック内の8つの非ゼロパルスに対して、合計で36ビットを与える。
【0183】
設計3:1つのトラックにつき3つのパルス(52ビットコードブック)
この例では、各トラック内の3つの非ゼロパルスが、(3×4+1)=13ビット(手順3)を必要とし、4つのトラック内の12の非ゼロパルスに対して、合計で52ビットを与える。
【0184】
設計4:1つのトラックにつき4つのパルス(64ビットコードブック)
この例では、各トラック内の4つの非ゼロパルスが、(4×4)=16ビット(手順4)を必要とし、4つのトラック内の16のパルスに対して、合計で64ビットを与える。
【0185】
設計5:1つのトラックにつき5つのパルス(80ビットコードブック)
この例では、各トラック内の5つの非ゼロパルスが、(5×4)=20ビット(手順5)を必要とし、4つのトラック内の20の非ゼロパルスに対して、合計で80ビットを与える。
【0186】
設計6:1つのトラックにつき6つのパルス(88ビットコードブック)
この例では、各トラック内の6つの非ゼロパルスが、(6×4−2)=22ビット(手順6)を必要とし、4つのトラック内の24の非ゼロパルスに対して、合計で88ビットを与える。
【0187】
設計7:トラックT0、T2内の3つのパルスおよびトラックT1、T3内の2つのパルス(44ビットコードブック)
この例では、3つの非ゼロパルストラックT0、T2が、1つのトラックにつき(3×4+1)=13ビット(手順3)を必要とし、トラックT1、T3内の2つの非ゼロパルスが、1つのトラックにつき(1+4+4)=9ビット(手順2)を必要とする。これは、4つのトラック内の10の非ゼロパルスに対して、合計で(13+9+13+9)=44ビットを与える。
【0188】
設計8:トラックT0、T2内の5つのパルスおよびトラックT1、T3内の4つのパルス(72ビットコードブック)
この例では、5つの非ゼロパルストラックT0、T2が、1つのトラックにつき(5×4)=20ビット(手順5)を必要とし、トラックT1、T3内の4つの非ゼロパルスが、1つのトラックにつき(4×4)=16ビット(手順4)を必要とする。これは、4つのトラック内の18の非ゼロパルスに対して、合計で(20+16+20+16)=72ビットを与える。
【0189】
コードブックサーチ:
この好ましい実施態様では、米国特許第5,701,392号に記載されている、深さ第一(depth−first)サーチを実行する特別な方法を使用し、それによって、行列HtH(以下に定義するものとする)の成分を格納するのに必要とされる記憶装置が、大幅に低減される。この行列は、インパルス応答h(n)の自己相関を含み、それは、サーチ手順を実行するのに必要とされる。この好ましい実施態様では、この行列の一部分だけが計算され格納され、他の部分は、サーチ手順内でオンラインで計算される。
【0190】
代数コードブックは、目標ベクトルと変倍されフィルタリングされたコードベクトルとの間の平均二乗された誤差:
E=‖x2−gHck‖2、
を最小化する最適な励起コードベクトルckと利得gを見出すことによってサーチされ、ここで、Hは、インパルス応答ベクトルhから導かれる下三角たたみこみ行列である。行列Hは、対角h(0)および、より下の対角h(1)、…、h(N−1)を有する下三角トープリッツ(Toeplitz)たたみこみ行列と定義される。
【0191】
平均二乗された重み付けされた誤差Eは、サーチ基準:
Qk=(xt 2Hck)2/(ct kHtHck)
=(dtck)2/(ct kΦck)
=(Rk)2/Ek、
を最大化することによって最小化され、ここで、d=Htx2、は、目標信号x2(n)とインパルス応答h(n)との間の相関(後退(backward)フィルタリングされた目標ベクトルとしても知られる)であり、Φ=HtH、は、h(n)の相関の行列である。
【0192】
ベクトルdの成分は、
d(n)=ΣN-1 i=nx2(i)h(i−n)、
n=0,…,N−1、
によって計算され、対称行列Φの成分は、
φ(i,j)=ΣN-1 n=jh(n−i)h(n−j)、
i=0,…,N−1、
j=i,…,N−1、
によって計算される。
【0193】
ベクトルd、行列Φは、コードブックサーチの前に計算される。
【0194】
革新ベクトルckが、ほんの少しの非ゼロパルスを含むだけなので、コードブックの代数構造は、非常に高速のサーチ手順を可能とする。サーチ基準Qkの分子における相関は、
R=Σ(Np)-1 i=0βid(mi)、
によって与えられ、ここで、miは、i番めのパルスの位置であり、βiは、その振幅であり、Npは、パルスの数である。サーチ基準Qkの分母におけるエネルギーは、
E=Σ(Np)-1 i=0φ(mi,mi)+2Σ(Np)-2 i=0Σ(Np)-1 j=i+1βiβjφ(mi,mj)、
によって与えられる。
【0195】
サーチ手順を単純化するために、パルス振幅は、特定の基準信号b(n)を量子化することによって予め設定される。この基準信号を定義するのに、いくつかの方法を使用することができる。この好ましい実施態様では、b(n)は、
b(n)=(Ed/Er)1/2rLTP(n)+αd(n)、
によって与えられ、ここで、Ed=dtdは、信号d(n)のエネルギーであり、Er=rt LTPrLTPは、長期予測後の残留信号(Residual Signal)であるrLTP(n)のエネルギーである。変倍係数(Scaling Factor)αは、基準信号のd(n)への依存量を制御する。
【0196】
米国特許第5,754,976号に開示された信号選択化パルス振幅方法では、位置iにおけるパルスの符号は、その位置における基準信号の符号に等しく設定される。サーチを単純化するために、信号d(n)、行列Φは、前もって選択された符号を組み込むように修正される。
【0197】
sb(n)が、b(n)の符号を含むベクトルを示すとする。修正された信号d’(n)は、
d’(n)=sb(n)d(n)、
n=0,…,N−1、
によって与えられ、修正された自己相関行列Φ’は、
φ’(i,j)=sb(i)sb(j)φ(i,j)、
i=0,…,N−1;
j=i,…,N−1、
によって与えられる。
【0198】
ここで、サーチ基準Qkの分子における相関は、
R=Σ(Np)-1 i=0d’(i)、
によって与えられ、サーチ基準Qkの分母におけるエネルギーは、
E=Σ(Np)-1 i=0φ’(mi,mi)+2Σ(Np)-2 i=0Σ(Np)-1 j=i+1φ’(mi,mj)、
によって与えられる。
【0199】
ここで、サーチの目標は、パルスの振幅が上述したように選択されていると仮定して、Np個のパルス位置の最良の組を有するコードベクトルを決定することである。基本選択基準は、上述した比Qkの最大化である。
【0200】
米国特許第5,701,392号によれば、サーチの複雑さを低減するために、パルス位置は、一度に決定されたNm個のパルスである。より正確には、Np個の利用可能なパルスを、N1+N2…+Nm…+NM=Npとなるように、それぞれNm個のパルスのM個の空でない部分集合に分割する。考慮される最初のJ=N1+N2…+Nm-1個のパルスのための位置の特定の選択は、水準m経路または長さJの経路と呼ばれる。J個のパルス位置の経路のための基本基準は、J関連パルスだけが考慮されるときの比Qk(J)である。
【0201】
サーチは、部分集合#1から始まり、部分集合mがツリーのm番めの水準においてサーチされるツリー構造に従って次の部分集合に進む。
【0202】
水準1におけるサーチの目的は、水準1におけるツリーノードである長さN1の1つまたは複数の候補経路を決定するために、部分集合#1のN1個のパルスとそれらの有効位置とを考慮することである。
【0203】
水準m−1の各末端ノードにおける経路は、Nm個の新しいパルスとそれらの有効位置とを考慮することによって、水準mにおける長さN1+N2…+Nmに拡張される。1つまたは複数の拡張された候補経路は、水準mノードを構成するように決定される。
【0204】
最良のコードベクトルは、全ての水準Mノードについて、与えられた基準、例えば基準Qk(Np)を、最大化する長さNpの経路に相当する。
【0205】
この好ましい実施態様では、2つのパルスが、通常、サーチ手順において一度に考慮され、すなわち、Nm=2である。しかしながら、N×Nワード(この好ましい実施態様では、64×64=4kワード)の記憶装置を必要とする、行列Φを計算し格納する代わりに、必要な記憶装置を大幅に低減する、記憶装置効率の良い方法を用いる。この新しい方法では、サーチ手順は、相関行列の必要な成分の部分だけを前もって計算し格納するように実行する。この部分は、連続するトラック内の可能性のあるパルス位置に相当するパルス応答の相関ばかりでなく、φ(j,j)、j=0,…,N−1、(行列Φの主対角の成分)に相当する相関に、関連する。
【0206】
記憶装置節約の例として、この好ましい実施態様では、サブフレームサイズは、N=64であり、これは、相関行列が、サイズ64×64=4096であることを意味する。パルスは、連続するトラック、すなわち、トラックT0−T1、T1−T2、T2−T3、またはT3−T0、において、一度にサーチされた2つのパルスなので、必要な相関成分は、隣接するトラック内のパルスに相当する成分である。各トラックは、16個の可能性のある位置を含むので、2つの隣接するトラックに相当する16×16=256個の相関成分が存在する。従って、記憶装置の効率の良い方法では、必要な成分は、隣接するトラック(T0−T1、T1−T2、T2−T3、T3−T0)の4つの可能性に対して、4×256=1024である。さらに、行列の対角における64個の相関が必要である。4096ワードの代わりに、1088の格納の必要性がある。
【0207】
連続する2つのトラック内の2つのパルスを一度にサーチするこの好ましい実施態様では、深さ第一ツリーサーチ手順の特別な形式を用いる。複雑さを低減するために、制限された数の、第1のパルスの可能性のある位置を、評価する。さらに、多くのパルスを有する代数コードブックでは、サーチツリーの、より高い水準におけるいくつかのパルスを固定することができる。
【0208】
どの可能性のあるパルス位置を第1のパルスのために考慮するか聡明に推測するために、または、いくつかのパルス位置を固定するために、発話に関連する信号に基づく、「パルス位置可能性推定ベクトル」bを用いる。この推定ベクトルbのp番めの成分b(p)は、サーチしている最良のコードベクトルにおける位置p(p=0,1,…N−1)を占めるパルスの確率を特徴づける。
【0209】
与えられたトラックに対して、推定ベクトルbは、各有効位置の相対確率を示す。有効位置を選択する際に信頼できる実行を与えるには少なすぎるパルスに基づいて、最初のわずかな水準においてとにかく作動する、基本選択基準Qk(j)の代わりに、ツリー構造の最初のわずかな水準における選択基準として、この特性は、有利に使用することができる。
【0210】
この好ましい実施態様では、推定ベクトルbは、上述したパルス振幅を前もって選択する際に使用されるのと同じ基準信号である。すなわち、
b(n)=(Ed/Er)1/2rLTP(n)+αd(n)、
であり、ここで、Ed=dtdは、信号d(n)のエネルギーであり、Er=rt LTPrLTPは、長期予測後の残留信号(Residual Signal)であるrLTP(n)のエネルギーである。
【0211】
一旦、最適な励起コードベクトルckとその利得gが、モジュール110によって選択されると、コードブック索引kと利得gは、エンコードされ、マルチプレクサー112に伝達される。
【0212】
図1を参照すると、パラメータb、T、j、A∧(z)、k、gは、通信チャネルを通して伝達される前に、マルチプレクサー112を通して多重化される。
【0213】
記憶装置更新:
記憶装置モジュール111(図1)において、重み付けされた合成フィルターW(z)/A∧(z)の状態は、重み付けされた合成フィルターを通して励起信号u=gck+bvTをフィルタリングすることによって、更新する。このフィルタリング後に、フィルターの状態は、記憶され、計算機モジュール108においてゼロ入力応答を計算するための初期状態として、次のサブフレームにおいて使用される。
【0214】
フィルターの状態を更新するために、目標ベクトルxの場合のように、当業者によく知られた他の代替のしかしながら数学的に同等の方法を用いることができる。
【0215】
デコーダー側
図2の発話デコーディング装置200は、デジタル入力222(デマルチプレクサー217への入力ストリーム)と出力サンプリングされた発話223(加算器221からのsout)との間で実行されるさまざまなステップを例示する。
【0216】
デマルチプレクサー217は、デジタル入力チャネルから受け取られた二進情報から、合成モデルパラメータを抜き出す。受け取られた各二進フレームから、抜き出されたパラメータは、
ライン225上の短期予測パラメータ(STP)A∧(z)(1つのフレームにつき一回)と、
長期予測(LTP)パラメータT、b、j(各サブフレームに対して)と、
革新コードブック索引kと利得g(各サブフレームに対して)と、
である。
【0217】
現在の発話信号は、これらのパラメータに基づいて、以下に説明するように合成される。
【0218】
革新コードブック218は、索引kに応答して、革新コードベクトルckを生成し、この革新コードベクトルckは、増幅器224を通して、デコードされた利得gによって変倍される。好ましい実施態様では、革新コードベクトルckを表示するために、上述した米国特許第5,444,816号、第5,699,482号,第5,754,976号、第5,701,392号において記載されたような革新コードブック218を用いる。
【0219】
増幅器224の出力における生成された変倍されたコードベクトルgckは、革新フィルター205を通して処理される。
【0220】
周期性向上:
さらに、増幅器224の出力における生成された変倍されたコードベクトルgckは、周波数依存ピッチ向上装置(enhancer)、すなわち、革新フィルター205を通して処理される。
【0221】
励起信号uの周期性を向上させることで、音声化されたセグメントの場合の品質を向上させる。これは、以前は、革新コードブック(固定されたコードブック)218からの革新ベクトルを、形式1/(1−εbz-T)のフィルターを通してフィルタリングすることによって、行われており、ここで、εは、0.5未満の係数であり、導入された周期性の量を制御する。この方法は、スペクトル全体に亘って周期性を導入するので、広帯域信号の場合、より効率的でない。本発明の一部である新しい代替の方法が開示され、それによって、より低い周波数に比較してより高い周波数を周波数応答が強調する革新フィルター205(F(z))を通して、革新(固定された)コードブックからの革新コードベクトルckをフィルタリングすることにより、周期性の向上が実現される。F(z)の係数は、励起信号uにおける周期性の量に関連する。
【0222】
有効周期性係数を得るために、当業者に知られている多くの方法を利用できる。例えば、利得bの値は、周期性の表示を提供する。すなわち、利得bが1に近い場合、励起信号uの周期性は高く、利得bが0.5未満の場合、周期性は低い。
【0223】
フィルターF(z)係数を導き出す別の効率的な方法は、これらの係数を、全体の励起信号uにおけるピッチ寄与の量に関連づけることである。この結果、周波数応答がサブフレーム周期性に依存することになり、より高い周波数が、より高いピッチ利得に対して、より強力に強調される(より強力な全体の傾きとなる)。革新フィルター205は、励起信号uがより周期的であるとき低い周波数における革新コードベクトルckのエネルギーを低下させる効果を有し、これは、より高い周波数に比較してより低い周波数における励起信号uの周期性を向上させる。革新フィルター205のための提案された形式は、
(1) F(z)=1−σz-1、
または、
(2) F(z)=−αz+1−αz-1、
であり、ここで、σまたはαは、励起信号uの周期性の水準から導かれた周期性係数である。
【0224】
第2の三項形式のF(z)は、好ましい実施態様において使用する。周期性係数αは、音声化係数発生器204において計算される。励起信号uの周期性に基づいて周期性係数αを導き出すのに、いくつかの方法を用いることができる。2つの方法を、以下に示す。
【0225】
方法1:
全体の励起信号uに対するピッチ寄与の比は、音声化係数発生器204において、
Rp=(b2vT tvT)/(utu)
=b2ΣN-1 n=0vT 2(n)/ΣN-1 n=0u2(n)、
によって、最初に計算され、ここで、vTは、ピッチコードブックベクトルであり、bは、ピッチ利得であり、uは、加算器219の出力において、
u=gck+bvT、
によって与えられる励起信号uである。
【0226】
項bvTは、記憶装置203内に格納されるuの過去の値とピッチ遅延Tとに応答するピッチコードブック(ピッチコードブック)201内に、その供給源を有することが、留意される。次に、ピッチコードブック201からのピッチコードベクトルvTは、デマルチプレクサー217からの索引jによってカットオフ周波数が調整される低域通過フィルター202を通して、処理される。結果として得られるコードベクトルvTは、次に、増幅器226を通して、デマルチプレクサー217からの利得bが掛けられ、信号bvTが得られる。
【0227】
係数αは、音声化係数発生器204において、
α=qRp、ただし、α<qによって制限されている、
によって計算され、ここで、qは、向上の量を制御する係数である(この好ましい実施態様では、qは、0.25に設定される)。
【0228】
方法2:
周期性係数αを計算する別の方法を、以下に説明する。
【0229】
最初に、音声化係数rvが、音声化係数発生器204において、
rv=(Ev−Ec)/(Ev+Ec)、
によって計算され、ここで、Evは、変倍されたピッチコードベクトルbvTのエネルギーであり、Ecは、変倍された革新コードベクトルgckのエネルギーである。すなわち、
Ev=b2vT tvT
=b2ΣN-1 n=0vT 2(n)、
であり、
Ec=g2ck tck
=g2ΣN-1 n=0ck 2(n)、
である。
【0230】
rvの値は、−1と1の間にある(1は、純粋に音声化された信号に相当し、−1は、純粋に音声化されていない信号に相当する)ことが、留意される。
【0231】
この実施態様では、次に、係数αは、音声化係数発生器204において、
α=0.125(1+rv)、
によって、計算され、これは、純粋に音声化されない信号に対して0の値に一致し、純粋に音声化された信号に対して0.25に一致する。
【0232】
第1の二項形式のF(z)では、上述した方法1、2において、σ=2αを用いることによって周期性係数σを近似することができる。そのような場合、周期性係数σは、上述した方法1では、以下のように、
σ=2qRp、ただし、σ<2qによって制限されている、
と計算される。
【0233】
方法2では、周期性係数σは、以下のように、
σ=0.25(1+rv)、
と計算される。
【0234】
従って、向上された信号cfは、変倍された革新コードベクトルgckを、革新フィルター205(F(z))を通してフィルタリングすることによって、計算される。
【0235】
向上された励起信号u’は、加算器220によって、
u’=cf+bvT、
と計算される。
【0236】
この処理は、エンコーダー100において実行されないことが、留意される。従って、エンコーダー100とデコーダー200との間の同期を維持するように、向上されていない励起信号uを用いて、ピッチコードブック201の内容を更新するのが、本質的である。従って、励起信号uは、ピッチコードブック201の記憶装置203を更新するのに使用され、向上された励起信号u’は、LP合成フィルター206の入力において使用される。
【0237】
合成およびデエンファシス
合成された信号s’は、向上された励起信号u’を、形式1/A∧(z)を有するLP合成フィルター206を通してフィルタリングすることによって計算され、ここで、A∧(z)は、現在のサブフレームにおいて補間されたLPフィルターである。図2において理解できるように、デマルチプレクサー217からのライン225上の量子化されたLP係数A∧(z)は、それに従ってLP合成フィルター206のパラメータを調整するように、LP合成フィルター206へ供給される。デエンファシスフィルター207は、図1のプリエンファシスフィルター103の逆である。デエンファシスフィルター207bの伝達関数は、
D(z)=1/(1−μz-1)、
によって与えられ、ここで、μは、0と1の間に位置する値(通常の値は、μ=0.7)を有するプリエンファシス係数を表す。より高次のフィルターを使用することもできるであろう。
【0238】
ベクトルs’は、デエンファシスフィルターD(z)(モジュール207)を通してフィルタリングされて、ベクトルsdが得られ、このベクトルsdは、50Hz未満の不要な周波数を除去するために、高域通過フィルター208を通されて、さらに、shが得られる。
【0239】
オーバーサンプリングおよび高周波再生
オーバーサンプリングモジュール209は、図1のダウンサンプリングモジュール101の逆の処理を行う。この好ましい実施態様では、オーバーサンプリングは、当業者によく知られた技術を用いて、12.8kHzサンプリングレートから元の16kHzサンプリングレートに変換する。オーバーサンプリングされた合成信号は、s∧と表示する。信号s∧は、合成された広帯域中間信号とも呼ばれる。
【0240】
オーバーサンプリングされた合成信号s∧は、エンコーダー100におけるダウンサンプリング処理(図1のモジュール101)によって失われた、より高い周波数成分を含まない。これは、合成された発話信号に低域通過知覚を与える。元の信号の全帯域を再生するために、高周波数生成手順が、開示される。この手順は、モジュール210から216、加算器221において実行され、音声化係数発生器204(図2)からの入力を必要とする。
【0241】
この新しい方法では、励起変域において適切に変倍され次いで発話変域に変換された白色ノイズで、スペクトルの上部を満たすことによって、好ましくは、ダウンサンプリングされた信号s∧を合成するのに用いたのと同じLP合成フィルターで、それを整形することによって、高周波数成分が生成される。
【0242】
本発明に従う高周波数生成手順を、以下に記載する。
【0243】
ランダムノイズ発生器213は、当業者によく知られた技術を用いて、全周波数帯域幅に亘って平坦なスペクトルを有する白色ノイズ列w’を生成する。生成された列は、元の変域におけるサブフレーム長さである長さN’である。Nは、ダウンサンプリングされた変域におけるサブフレーム長さであることが、留意される。この好ましい実施態様では、5msに相当する、N=64、N’=80である。
【0244】
白色ノイズ列は、利得調整モジュール214において、適切に変倍される。利得調整は、以下のステップから成る。第一に、生成されたノイズ列w’のエネルギーは、エネルギー計算モジュール210によって計算された向上された励起信号u’のエネルギーに等しく設定され、結果として得られた変倍されたノイズ列は、
w(n)=w’(n)(ΣN-1 n=0u’2(n)/ΣN'-1 n=0w’2(n))1/2、
n=0,…,N’−1、
によって与えられる。
【0245】
利得変倍における第二のステップは、音声化係数発生器204の出力における合成された信号の高周波数成分を考慮して、音声化されたセグメント(音声化されていないセグメントに比較して高周波数では、より低いエネルギーが存在する)の場合に生成されたノイズのエネルギーを低減することである。好ましくは、スペクトル傾き計算機212を通して合成信号の傾きを測定し、それに応じてエネルギーを低減することによって、高周波数成分を測定することを実行する。零交差(Zero Crossing)測定などの他の測定を、同様に用いることができる。音声化されたセグメントに相当して、傾きが非常に強いとき、ノイズエネルギーは、されに低減される。傾き係数は、モジュール212において、合成信号shの第一相関係数として計算され、それは、
tilt=ΣN-1 n=1sh(n)sh(n−1)/ΣN-1 n=0sh 2(n)、
ただし、tilt≧0、かつ、tilt≧rv、によって条件付けられる、
によって与えられ、ここで音声化係数rvは、
rv=(Ev−Ec)/(Ev+Ec)、
によって、与えられ、先に記載したように、ここで、Evは、変倍されたピッチコードベクトルbvTのエネルギーであり、Ecは、変倍された革新コードベクトルgckのエネルギーである。音声化係数rvは、ほとんどの場合、tilt未満であるが、この条件は、傾き(tilt)値が負でかつその値がrvより高い場合の高周波音に対する予防措置として導入されたものである。従って、この条件は、そのような音信号に対するノイズエネルギーを低減する。
【0246】
傾き値は、平坦なスペクトルの場合、0であり、強く音声化された信号の場合は、1であり、高周波数において、より高いエネルギーが存在する音声化されていない信号の場合は、負である。
【0247】
高周波数成分の量から変倍係数をgtを導き出すのに、異なる方法を用いることができる。この発明では、上述した信号のtiltに基づいて、2つの方法を与える。
【0248】
方法1:
変倍係数gtは、tiltから、
gt=1−tilt、ただし、0.2≦gt≦1.0によって制限されている、によって導き出される。
【0249】
tiltが1に近づく強く音声化された信号では、gtは、0.2であり、強く音声化されていない信号では、gtは、1.0となる。
【0250】
方法2:
傾き係数gtは、最初に、ゼロより大きいかまたは等しくなるように制限され、次に、変倍係数が、tiltから、
gt=10-0.6tilt、
によって導き出される。
【0251】
従って、利得調整モジュール214において生成された変倍されたノイズ列wgは、
wg=gtw’、
によって与えられる。
【0252】
tiltがゼロに近い場合、変倍係数gtは、1に近く、エネルギーの低減にはならない。tilt値が1の場合、変倍係数gtは、生成されたノイズのエネルギーの12dBの低減になる。
【0253】
一旦、ノイズが適正に変倍されると(wg)、それは、スペクトル整形器215を用いて、発話変域に入れられる。好ましい実施態様では、これは、ダウンサンプリングされた変域において使用されたのと同じLP合成フィルターの帯域幅拡張化バージョン(1/A∧(z/0.8))を通して、ノイズwgをフィルタリングすることによって、実現される。対応する帯域幅拡張化LPフィルター係数は、スペクトル整形器215において計算される。
【0254】
次に、フィルタリングされ変倍されたノイズ列wfは、帯域通過フィルター216を用いて、再生するのに必要とされる周波数範囲に、帯域通過フィルタリングされる。好ましい実施態様では、帯域通過フィルター216は、ノイズ列を、周波数範囲5.6〜7.2kHzに制限する。結果として得られた帯域通過フィルタリングされたノイズ列zは、加算器221において、オーバーサンプリングされた合成された発話信号s∧に追加され、出力223において、最終の再現された音響信号soutが得られる。
【0255】
本発明は、その好ましい実施態様によって、上述してきたが、この実施態様は、主題の発明の精神、性質から逸脱することなく、特許請求の範囲内において、随意に変更することができる。たとえ好ましい実施態様が広帯域発話信号の使用を説明しているとしても、主題の発明が、一般に広帯域信号を用いる他の実施態様も含むこと、必ずしも発話用途に限定されないことは、当業者には明らかであろう。
【図面の簡単な説明】
【図1】 広帯域エンコーディング装置の好ましい実施態様の概略ブロック図。
【図2】 広帯域デコーディング装置の好ましい実施態様の概略ブロック図。
【図3】 ピッチ解析装置の好ましい実施態様の概略ブロック図。
【図4】 図1の広帯域エンコーディング装置と図2の広帯域デコーディング装置とが構築できる携帯電話通信システムの簡略概略ブロック図。
【図5】 パルス位置と符号を索引付けすることを含む、長さk=2Mのトラック内で2つの符号付きパルスをエンコーディングする手順に対する好ましい実施態様のフローチャート。
Claims (57)
- 音響信号の効率的なエンコーディングとデコーディングのために、代数コードブックにおいてパルス位置と振幅を索引付けする方法であって、
コードブックは、複数のパルス振幅/位置組み合わせから成る一つの集合であり、
各組み合わせは、多数の異なる位置を規定し、組み合わせのそれぞれの位置に割り当てられた非ゼロ振幅パルスとゼロ振幅パルスの両方を含み、
各非ゼロ振幅パルスは、正の振幅および負の振幅から成る群より選択される振幅を取り、
索引付けする方法は、
少なくとも1つのトラックから成る一つのトラック集合であって、各トラックが、前記パルス位置から成り、かつ、2 M (Mは整数)に等しいパルス位置数を有し、各パルス振幅/位置組み合わせの各非ゼロ振幅パルスの位置が、このトラック集合の1つのトラックのパルス位置に配置される、一つのトラック集合を形成し、
1つの非ゼロ振幅パルスの位置だけが、前記トラック集合の1つのトラック内に位置するとき、この1つの非ゼロ振幅パルスの位置と振幅を第1の手順(以下、手順1と呼ぶ)に従って索引付けし、
2つの非ゼロ振幅パルスの位置だけが、前記トラック集合の1つのトラック内に位置するとき、これら2つの非ゼロ振幅パルスの位置と振幅を第2の手順(以下、手順2と呼ぶ)に従って索引付けし、
X≧3である数X個の非ゼロ振幅パルスの位置が、前記トラック集合の1つのトラック内に位置するとき、
この1つのトラックのパルス位置を2つの等しい下部および上部トラックセクションに分割し、
前記X個の非ゼロ振幅パルスの位置と振幅を索引付けする前記数Xに関連するさらなる手順(以下、手順Xと呼ぶ)を使用する、
ことを含み、この手順Xは、
X=3であるとき(以下、手順3と呼ぶ)、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックセクションの一方を特定し、
前記1つのトラックセクションのパルス位置に適用される手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順1を用いて、残りの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、3つの非ゼロ振幅パルスの位置・振幅索引を生成する、
ことを含み、
X≧4であるとき、
各非ゼロ振幅パルスが位置する、2つの等しいトラックセクションの1つを特定し、
少なくとも1つの前記トラックセクションとトラック全体において手順1、2および3のうちの少なくとも1つの手順を用いて前記X個の非ゼロ振幅パルスの副索引を計算し、
これらの副索引を組み合わせることにより、前記X個の非ゼロ振幅パルスの位置・振幅索引を計算する、
ことを含むことを特徴とする方法。 - 各トラックのパルス位置を、他のトラックのパルス位置と、インターリーブすること含むことを特徴とする請求項1記載の方法。
- 前記X個の非ゼロ振幅パルスの位置・振幅索引を計算することは、
少なくとも2つの前記副索引を組み合わせることにより、少なくとも1つの中間索引を計算し、
残りの副索引と少なくとも1つの中間索引とを組み合わせることにより、前記X個の非ゼロ振幅パルスの位置・振幅索引を計算する、
ことを含むことを特徴とする請求項1記載の方法。 - 前記手順1は、前記1つのトラック内における前記1つの非ゼロ振幅パルスの位置を示す位置索引と、前記1つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成すること含むことを特徴とする請求項1記載の方法。
- 位置索引は、第1の群のビットを含み、振幅索引は、少なくとも1つのビットを含む、ことを特徴とする請求項4記載の方法。
- 振幅索引の前記少なくとも1つのビットは、より高いランクのビットであることを特徴とする請求項5記載の方法。
- 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、前記振幅索引の前記少なくとも1つのビットは、符号ビットであることを特徴とする請求項5記載の方法。
- 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、
手順1は、形式:
I1p=p+s×2M、
を有する、前記1つの非ゼロ振幅パルスの位置・振幅符号を生成することを含み、ここで、pは、前記1つのトラックにおける前記1つの非ゼロ振幅パルスの位置索引であり、sは、前記1つの非ゼロ振幅パルスの符号索引であり、2Mは、前記1つのトラック内のパルス位置数であることを特徴とする請求項1記載の方法。 - 手順2は、
前記1つのトラック内における2つの非ゼロ振幅パルスの位置をそれぞれ示す第1および第2の位置索引と、
前記2つの非ゼロ振幅パルスの振幅を示す振幅索引と、
を含む位置・振幅索引を生成することを含むことを特徴とする請求項1記載の方法。 - 位置・振幅索引において、
振幅索引は、少なくとも1つのビットを含み、
第1の位置索引は、第1の群のビットを含み、
第2の位置索引は、第2の群のビットを含むことを特徴とする請求項10記載の方法。 - 位置・振幅索引において、
振幅索引の前記少なくとも1つのビットは、より高いランクのビットであり、
第1の群のビットは、中間のランクのビットであり、
第2の群のビットは、より低いランクのビットであることを特徴とする請求項11記載の方法。 - 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、前記振幅索引の前記少なくとも1つのビットは、符号ビットであることを特徴とする請求項11記載の方法。
- 手順2は、
前記2つのパルスが、同じ振幅を有するとき、第1の位置索引によって位置が示される非ゼロ振幅パルスの振幅を示す振幅索引を生成すること、前記1つのトラック内における2つの非ゼロ振幅パルスのより小さな位置を示す第1の位置索引を生成すること、前記1つのトラック内における2つの非ゼロ振幅パルスのより大きな位置を示す第2の位置索引を生成することと、
前記2つのパルスが、異なる振幅を有するとき、第1の位置索引によって位置が示される非ゼロ振幅パルスの振幅を示す振幅索引を生成すること、前記1つのトラック内における2つの非ゼロ振幅パルスのより大きな位置を示す第1の位置索引を生成すること、前記1つのトラック内における2つの非ゼロ振幅パルスのより小さな位置を示す第2の位置索引を生成することと、
を含むことを特徴とする請求項10記載の方法。 - X=3であるとき、
手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算することは、前記少なくとも2つの非ゼロ振幅パルスの位置が上部セクションに位置するとき、前記少なくとも2つの非ゼロ振幅パルスの位置を、上部セクションから下部セクションにシフトすることを含むことを特徴とする請求項1記載の方法。 - 前記少なくとも2つの非ゼロ振幅パルスの位置を、上部セクションから下部セクションにシフトすることは、前記少なくとも2つの非ゼロ振幅パルスの位置索引の最下位ビットの数を、この数の個数の1から成るマスクを用いて、マスキングすることを含むことを特徴とする請求項17記載の方法。
- X=3であるとき、
手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算することは、前記少なくとも2つの非ゼロ振幅パルスが位置する、前記下部および上部トラックセクションの一方を示すセクション索引を差し込むことを含むことを特徴とする請求項1記載の方法。 - 前記手順1は、前記1つのトラック内における前記1つの非ゼロ振幅パルスの位置を示す位置索引と、前記1つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成することを含み、位置索引は、第1の群のビットを含み、位置索引は、少なくとも1つのビットを含み、
前記手順2は、前記1つのトラック内における2つの非ゼロ振幅パルスの位置をそれぞれ示す第1および第2の位置索引と、前記2つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成することを含み、振幅索引は、少なくとも1つのビットを含み、第1の位置索引は、第1の群のビットを含み、第2の位置索引は、第2の群のビットを含むことを特徴とする請求項1記載の方法。 - X=4であるとき、
手順4は、
上部トラックセクションが、4つの非ゼロ振幅パルスの位置を含むとき、
さらに、前記上部トラックセクション位置を、等しい下部および上部トラックサブセクションに分割し、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックサブセクションの一方を特定し、
前記1つのトラックサブセクションのパルス位置に適用される手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する前記1つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する残りの3つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する前記2つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションのパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションのパルス位置に適用される手順1を用いて、上部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含むとき、
さらに、前記下部トラックセクション位置を、下部および上部トラックサブセクションに分割し、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックサブセクションの一方を特定し、
前記1つのトラックサブセクションのパルス位置に適用される手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算し、
下部トラックセクションの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成する、
ことを含むことを特徴とする請求項21記載の方法。 - 手順4は、
前記1つのトラックサブセクションが、上部サブセクションであるとき、
手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算することが、前記少なくとも2つの非ゼロ振幅パルスの位置を、上部トラックサブセクションから下部トラックサブセクションにシフトすることを含む、
ことを含むことを特徴とする請求項22記載の方法。 - 前記少なくとも2つの非ゼロ振幅パルスの位置を、上部サブセクションから下部サブセクションにシフトすることは、前記少なくとも2つの非ゼロ振幅パルスの位置索引の最下位ビットの数を、この数の個数の1から成るマスクを用いて、マスキングすることを含むことを特徴とする請求項23記載の方法。
- X=5であるとき、
手順5は、
少なくとも3つの非ゼロ振幅パルスが位置する、下部および上部トラックセクションの一方を検出し、
前記1つのトラックセクションのパルス位置に適用される手順3を用いて、前記1つのトラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成する、
ことを含むことを特徴とする請求項22記載の方法。 - X=5であるとき、
手順5は、
上部トラックセクションが、5つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、前記上部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の4つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、5つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算し、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、5つの非ゼロ振幅パルスの位置・振幅索引を生成する、
ことを含むことを特徴とする請求項22記載の方法。 - X=6であるとき、
手順6は、
上部トラックセクションが、6つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順5を用いて、前記上部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションのパルス位置に適用される手順1を用いて、残りの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の5つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順5を用いて、上部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算し、
前記下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の4つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順4を用いて、上部トラックセクション内に位置する4つの非ゼロ振幅パルスの第1の副索引を計算し、
前記下部トラックセクションのパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算し、
上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する残りの3つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順4を用いて、下部トラックセクション内に位置する4つの非ゼロ振幅パルスの第1の副索引を計算し、
前記上部トラックセクションのパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、5つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、残りの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順5を用いて、下部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算し、
前記上部トラックセクションのパルス位置に適用される手順1を用いて、上部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成し、
下部トラックセクションが、6つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順5を用いて、下部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算し、
下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算し、
前記第1および第2の副索引を結合することによって、6つの非ゼロ振幅パルスの位置・振幅索引を生成する、
ことを含むことを特徴とする請求項26記載の方法。 - 音響信号の効率的なエンコーディングとデコーディングのために、代数コードブックにおいてパルス位置と振幅を索引付けする装置であって、
コードブックは、複数のパルス振幅/位置組み合わせから成る一つの集合であり、
各組み合わせは、多数の異なる位置を規定し、組み合わせのそれぞれの位置に割り当てられた非ゼロ振幅パルスとゼロ振幅パルスの両方を含み、
各非ゼロ振幅パルスは、正の振幅および負の振幅から成る群より選択される振幅を取り、
索引付けする装置は、
少なくとも1つのトラックから成る一つのトラック集合であって、各トラックが、前記パルス位置から成り、かつ、2 M (Mは整数)に等しいパルス位置数を有し、各パルス振幅/位置組み合わせの各非ゼロ振幅パルスの位置が、このトラック集合の1つのトラックのパルス位置に配置される、一つのトラック集合と、
1つの非ゼロ振幅パルスの位置だけが、前記トラック集合の1つのトラック内に位置するとき、この1つの非ゼロ振幅パルスの位置と振幅を第1の手順(以下、手順1と呼ぶ)に従って索引付けする手段と、
2つの非ゼロ振幅パルスの位置だけが、前記トラック集合の1つのトラック内に位置するとき、これら2つの非ゼロ振幅パルスの位置と振幅を第2の手順(以下、手順2と呼ぶ)に従って索引付けする手段と、
X≧3である数X個の非ゼロ振幅パルスの位置が、前記トラック集合の1つのトラック内に位置するとき、
この1つのトラックのパルス位置を2つの等しい下部および上部トラックセクションに分割する手段と、
前記X個の非ゼロ振幅パルスの位置と振幅を索引付けする前記数Xに関連するさらなる手順(以下、手順Xと呼ぶ)を行う手段と、
を含み、
X=3であるとき、手順X(以下、手順3と呼ぶ)は、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックセクションの一方を特定する手段と、
前記1つのトラックセクションのパルス位置に適用される手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順1を用いて、残りの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、3つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
を含み、
X≧4であるとき、手順Xは、
各非ゼロ振幅パルスが位置する、2つの等しいトラックセクションの1つを特定する手段と、
少なくとも1つの前記トラックセクションとトラック全体において手順1、2および3のうちの少なくとも1つの手順を用いて前記X個の非ゼロ振幅パルスの副索引を計算する手段と、
これらの副索引を組み合わせる手段を含み前記X個の非ゼロ振幅パルスの位置・振幅索引を計算する手段と、
を含むことを特徴とする装置。 - 各トラックのパルス位置を、他のトラックのパルス位置と、インターリーブする手段を含むことを特徴とする請求項28記載の装置。
- 前記X個の非ゼロ振幅パルスの位置・振幅索引を計算する手段は、
少なくとも2つの前記副索引を組み合わせることにより、少なくとも1つの中間索引を計算する手段と、
残りの副索引と少なくとも1つの中間索引とを組み合わせることにより、前記X個の非ゼロ振幅パルスの位置・振幅索引を計算することと、
を含むことを特徴とする請求項28記載の装置。 - 前記手順1は、前記1つのトラック内における前記1つの非ゼロ振幅パルスの位置を示す位置索引と、前記1つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成する手段を含むことを特徴とする請求項28記載の装置。
- 位置索引は、第1の群のビットを含み、振幅索引は、少なくとも1つのビットを含む、ことを特徴とする請求項31記載の装置。
- 振幅索引の前記少なくとも1つのビットは、より高いランクのビットであることを特徴とする請求項32記載の装置。
- 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、振幅索引の前記少なくとも1つのビットは、符号ビットであることを特徴とする請求項32記載の装置。
- 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、
手順1は、形式:
I1p=p+s×2M、
を有する、前記1つの非ゼロ振幅パルスの位置・振幅符号を生成する手段を含み、ここで、pは、前記1つのトラックにおける前記1つの非ゼロ振幅パルスの位置索引であり、sは、前記1つの非ゼロ振幅パルスの符号索引であり、2Mは、前記1つのトラック内のパルス位置数であることを特徴とする請求項28記載の装置。 - 手順2は、
前記1つのトラック内における2つの非ゼロ振幅パルスの位置をそれぞれ示す第1および第2の位置索引と、
前記2つの非ゼロ振幅パルスの振幅を示す振幅索引と、
を含む位置・振幅索引を生成する手段を含むことを特徴とする請求項28記載の装置。 - 位置・振幅索引において、
振幅索引は、少なくとも1つのビットを含み、
第1の位置索引は、第1の群のビットを含み、
第2の位置索引は、第2の群のビットを含むことを特徴とする請求項37記載の装置。 - 位置・振幅索引において、
振幅索引の前記少なくとも1つのビットは、より高いランクのビットであり、
第1の群のビットは、中間のランクのビットであり、
第2の群のビットは、より低いランクのビットであることを特徴とする請求項38記載の装置。 - 前記正の振幅は、+1を含み、前記負の振幅は、−1を含み、振幅索引の前記少なくとも1つのビットは、符号ビットであることを特徴とする請求項38記載の装置。
- 手順2は、
前記2つのパルスが、同じ振幅を有するとき、
第1の位置索引によって位置が示される非ゼロ振幅パルスの振幅を示す振幅索引を生成する手段と、
前記1つのトラック内における2つの非ゼロ振幅パルスのより小さな位置を示す第1の位置索引を生成する手段と、
前記1つのトラック内における2つの非ゼロ振幅パルスのより大きな位置を示す第2の位置索引を生成する手段と、
前記2つのパルスが、異なる振幅を有するとき、
第1の位置索引によって位置が示される非ゼロ振幅パルスの振幅を示す振幅索引を生成する手段と、
前記1つのトラック内における2つの非ゼロ振幅パルスのより大きな位置を示す第1の位置索引を生成する手段と、
前記1つのトラック内における2つの非ゼロ振幅パルスのより小さな位置を示す第2の位置索引を生成する手段と、
を含むことを特徴とする請求項38記載の装置。 - X=3であるとき、
手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段は、前記少なくとも2つの非ゼロ振幅パルスの位置が上部セクションに位置するとき、前記少なくとも2つの非ゼロ振幅パルスの位置を、上部セクションから下部セクションにシフトする手段を含むことを特徴とする請求項28記載の装置。 - 前記少なくとも2つの非ゼロ振幅パルスの位置を、上部セクションから下部セクションにシフトする手段は、前記少なくとも2つの非ゼロ振幅パルスの位置索引の最下位ビットの数を、この数の個数の1から成るマスクを用いて、マスキングする手段を含むことを特徴とする請求項44記載の装置。
- X=3であるとき、
手順2を用いて、前記1つのトラックセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段は、前記少なくとも2つの非ゼロ振幅パルスが位置する、前記下部および上部トラックセクションの一方を示すセクション索引を差し込む手段を含むことを特徴とする請求項28記載の装置。 - 前記手順1は、前記1つのトラック内における前記1つの非ゼロ振幅パルスの位置を示す位置索引と、前記1つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成する手段を含み、位置索引は、第1の群のビットを含み、位置索引は、少なくとも1つのビットを含み、
前記手順2は、前記1つのトラック内における2つの非ゼロ振幅パルスの位置をそれぞれ示す第1および第2の位置索引と、前記2つの非ゼロ振幅パルスの振幅を示す振幅索引と、を含む位置・振幅索引を生成する手段を含み、振幅索引は、少なくとも1つのビットを含み、第1の位置索引は、第1の群のビットを含み、第2の位置索引は、第2の群のビットを含むことを特徴とする請求項28記載の装置。 - X=4であるとき、
手順4は、
上部トラックセクションが、4つの非ゼロ振幅パルスの位置を含むとき、
さらに、前記上部トラックセクション位置を、等しい下部および上部トラックサブセクションに分割する手段と、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックサブセクションの一方を特定する手段と、
前記1つのトラックサブセクションのパルス位置に適用される手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合することによって、4つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する前記1つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する残りの3つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、4つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する前記2つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションのパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、4つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションのパルス位置に適用される手順1を用いて、上部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、4つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含むとき、
さらに、前記下部トラックセクション位置を、下部および上部トラックサブセクションに分割する手段と、
少なくとも2つの非ゼロ振幅パルスの位置を含む、上部および下部トラックサブセクションの一方を特定する手段と、
前記1つのトラックサブセクションのパルス位置に適用される手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
下部トラックセクションの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算することと、
前記第1および第2の副索引を結合する手段を含み、4つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
を含むことを特徴とする請求項48記載の装置。 - 手順4は、
前記1つのトラックサブセクションが、上部サブセクションであるとき、
手順2を用いて、前記1つのトラックサブセクション内に位置する前記少なくとも2つの非ゼロ振幅パルスの第1の副索引を計算する手段が、前記少なくとも2つの非ゼロ振幅パルスの位置を、上部トラックサブセクションから下部トラックサブセクションにシフトする手段を含む、
ことを含むことを特徴とする請求項49記載の装置。 - 前記少なくとも2つの非ゼロ振幅パルスの位置を、上部サブセクションから下部サブセクションにシフトする手段は、前記少なくとも2つの非ゼロ振幅パルスの位置索引の最下位ビットの数を、この数の個数の1から成るマスクを用いて、マスキングする手段を含むことを特徴とする請求項50記載の装置。
- X=5であるとき、
手順5は、
少なくとも3つの非ゼロ振幅パルスが位置する、下部および上部トラックセクションの一方を検出する手段と、
前記1つのトラックセクションのパルス位置に適用される手順3を用いて、前記1つのトラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
を含むことを特徴とする請求項49記載の装置。 - X=5であるとき、
手順5は、
上部トラックセクションが、5つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、前記上部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の4つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算することと、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、5つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記1つのトラックの全体のパルス位置に適用される手順2を用いて、残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、5つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
を含むことを特徴とする請求項49記載の装置。 - X=6であるとき、
手順6は、
上部トラックセクションが、6つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順5を用いて、前記上部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションのパルス位置に適用される手順1を用いて、残りの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、1つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の5つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順5を用いて、上部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、2つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の4つの非ゼロ振幅パルスの位置を含むとき、
前記上部トラックセクションのパルス位置に適用される手順4を用いて、上部トラックセクション内に位置する4つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記下部トラックセクションのパルス位置に適用される手順2を用いて、下部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、3つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の3つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順3を用いて、下部トラックセクション内に位置する前記3つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
上部トラックセクションのパルス位置に適用される手順3を用いて、上部トラックセクション内に位置する残りの3つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、4つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、他の2つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順4を用いて、下部トラックセクション内に位置する4つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記上部トラックセクションのパルス位置に適用される手順2を用いて、上部トラックセクション内に位置する残りの2つの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、5つの非ゼロ振幅パルスの位置を含み、上部トラックセクションが、残りの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順5を用いて、下部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
前記上部トラックセクションのパルス位置に適用される手順1を用いて、上部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
下部トラックセクションが、6つの非ゼロ振幅パルスの位置を含むとき、
前記下部トラックセクションのパルス位置に適用される手順5を用いて、下部トラックセクション内に位置する5つの非ゼロ振幅パルスの第1の副索引を計算する手段と、
下部トラックセクションのパルス位置に適用される手順1を用いて、下部トラックセクション内に位置する残りの非ゼロ振幅パルスの第2の副索引を計算する手段と、
前記第1および第2の副索引を結合する手段を含み、6つの非ゼロ振幅パルスの位置・振幅索引を生成する手段と、
を含むことを特徴とする請求項53記載の装置。 - 複数のセルに分割された大きな地理学的領域でサービスを提供する携帯電話通信システムであって、
可搬式送信機/受信機ユニットと、
前記セル内にそれぞれ位置する携帯電話基地局と、
携帯電話基地局間の通信を制御する手段と、
1つのセル内に位置する各可搬式ユニットとこの1つのセルの携帯電話基地局との間の双方向無線通信サブシステムであって、可搬式ユニットと携帯電話基地局の両方内に、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含む、サブシステムと、
を含み、
前記発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの前記発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする、請求項28〜54のいずれかに記載の装置と、を含み、前記発話信号は、前記音響信号を構成することを特徴とする携帯電話通信システム。 - 携帯電話可搬式送信機/受信機ユニットであって、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含み、
前記発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの前記発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする、請求項28〜54のいずれかに記載の装置と、を含み、前記発話信号は、前記音響信号を構成することを特徴とする携帯電話可搬式送信機/受信機ユニット。 - 携帯電話通信システム用の双方向無線通信サブシステムであって、携帯電話通信システムは、複数のセルに分割された地理学的領域でサービスを提供するように構成されており、かつ、可搬式送信機/受信機ユニットと、前記セル内にそれぞれ位置する携帯電話基地局と、携帯電話基地局間の通信を制御する手段と、を含み、
双方向無線通信サブシステムは、1つのセル内に位置する各可搬式ユニットとこの1つのセルの携帯電話基地局との間で作動するように構成されており、双方向無線通信サブシステムはさらに、可搬式ユニットと携帯電話基地局の両方内に、(a) 発話信号をエンコーディングする手段とエンコードされた発話信号を送信する手段とを含む送信機と、(b) 送信されたエンコードされた発話信号を受信する手段と受信されたエンコードされた発話信号をデコーディングする手段とを含む受信機と、を含み、
前記発話信号エンコーディング手段は、発話信号に応答して発話信号エンコーディングパラメータを生成する手段を含み、この発話信号エンコーディングパラメータ生成手段は、少なくとも1つの前記発話信号エンコーディングパラメータを生成することを考慮して代数コードブックをサーチする手段と、この代数コードブックにおいて、パルス位置と振幅を索引付けする、請求項28〜54のいずれかに記載の装置と、を含み、前記発話信号は、前記音響信号を構成することを特徴とする双方向無線通信サブシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002327041A CA2327041A1 (en) | 2000-11-22 | 2000-11-22 | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
PCT/CA2001/001675 WO2002043053A1 (en) | 2000-11-22 | 2001-11-22 | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004514182A JP2004514182A (ja) | 2004-05-13 |
JP4064236B2 true JP4064236B2 (ja) | 2008-03-19 |
Family
ID=4167763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002544711A Expired - Lifetime JP4064236B2 (ja) | 2000-11-22 | 2001-11-22 | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 |
Country Status (19)
Country | Link |
---|---|
US (1) | US7280959B2 (ja) |
EP (1) | EP1354315B1 (ja) |
JP (1) | JP4064236B2 (ja) |
KR (1) | KR20020077389A (ja) |
CN (1) | CN1205603C (ja) |
AT (1) | ATE330310T1 (ja) |
AU (2) | AU2138902A (ja) |
BR (1) | BR0107760A (ja) |
CA (1) | CA2327041A1 (ja) |
DE (1) | DE60120766T2 (ja) |
DK (1) | DK1354315T3 (ja) |
ES (1) | ES2266312T3 (ja) |
HK (1) | HK1050262A1 (ja) |
MX (1) | MXPA03004513A (ja) |
NO (1) | NO20023252L (ja) |
PT (1) | PT1354315E (ja) |
RU (1) | RU2003118444A (ja) |
WO (1) | WO2002043053A1 (ja) |
ZA (1) | ZA200205695B (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004084180A2 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Voicing index controls for celp speech coding |
JP4047296B2 (ja) * | 2004-03-12 | 2008-02-13 | 株式会社東芝 | 音声復号化方法及び音声復号化装置 |
JP4580622B2 (ja) * | 2003-04-04 | 2010-11-17 | 株式会社東芝 | 広帯域音声符号化方法及び広帯域音声符号化装置 |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
US20050050119A1 (en) * | 2003-08-26 | 2005-03-03 | Vandanapu Naveen Kumar | Method for reducing data dependency in codebook searches for multi-ALU DSP architectures |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
US7571094B2 (en) * | 2005-09-21 | 2009-08-04 | Texas Instruments Incorporated | Circuits, processes, devices and systems for codebook search reduction in speech coders |
US7602745B2 (en) * | 2005-12-05 | 2009-10-13 | Intel Corporation | Multiple input, multiple output wireless communication system, associated methods and data structures |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
KR101414341B1 (ko) * | 2007-03-02 | 2014-07-22 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치 및 부호화 방법 |
ES2529292T3 (es) | 2007-04-29 | 2015-02-18 | Huawei Technologies Co., Ltd. | Método de codificación y de decodificación |
CN100530357C (zh) | 2007-07-11 | 2009-08-19 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
JP5388849B2 (ja) * | 2007-07-27 | 2014-01-15 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
FR2934598B1 (fr) | 2008-07-30 | 2012-11-30 | Rhodia Poliamida E Especialidades Ltda | Procede de fabrication de matrice polymerique thermoplastique |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
JP5002642B2 (ja) * | 2009-11-09 | 2012-08-15 | 株式会社東芝 | 広帯域音声符号化方法及び広帯域音声符号化装置 |
US8280729B2 (en) * | 2010-01-22 | 2012-10-02 | Research In Motion Limited | System and method for encoding and decoding pulse indices |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN102623012B (zh) | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US9767822B2 (en) * | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
PT2676270T (pt) | 2011-02-14 | 2017-05-02 | Fraunhofer Ges Forschung | Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade |
TR201908598T4 (tr) | 2011-02-14 | 2019-07-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. |
PT3239978T (pt) | 2011-02-14 | 2019-04-02 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
WO2012110478A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Information signal representation using lapped transform |
KR101551046B1 (ko) | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
ES2535609T3 (es) | 2011-02-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio con estimación de ruido de fondo durante fases activas |
AU2012217156B2 (en) | 2011-02-14 | 2015-03-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
WO2012111512A1 (ja) * | 2011-02-16 | 2012-08-23 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
JP5969614B2 (ja) * | 2011-09-28 | 2016-08-17 | エルジー エレクトロニクス インコーポレイティド | 音声信号符号化方法及び音声信号復号方法 |
US9020818B2 (en) * | 2012-03-05 | 2015-04-28 | Malaspina Labs (Barbados) Inc. | Format based speech reconstruction from noisy signals |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
PT3121813T (pt) | 2013-01-29 | 2020-06-17 | Fraunhofer Ges Forschung | Preenchimento de ruído sem informação lateral para codificadores do tipo celp |
RU2712814C2 (ru) * | 2013-04-05 | 2020-01-31 | Долби Лабораторис Лайсэнзин Корпорейшн | Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения |
US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
CN110247714B (zh) * | 2019-05-16 | 2021-06-04 | 天津大学 | 集伪装与加密于一体的仿生隐蔽水声通信编码方法及装置 |
CN117040663B (zh) * | 2023-10-10 | 2023-12-22 | 北京海格神舟通信科技有限公司 | 一种用于估计宽带频谱噪底的方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
SE504397C2 (sv) * | 1995-05-03 | 1997-01-27 | Ericsson Telefon Ab L M | Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
-
2000
- 2000-11-22 CA CA002327041A patent/CA2327041A1/en not_active Abandoned
-
2001
- 2001-11-22 BR BR0107760-0A patent/BR0107760A/pt not_active IP Right Cessation
- 2001-11-22 KR KR1020027009378A patent/KR20020077389A/ko not_active Application Discontinuation
- 2001-11-22 PT PT01997803T patent/PT1354315E/pt unknown
- 2001-11-22 US US10/415,456 patent/US7280959B2/en not_active Expired - Lifetime
- 2001-11-22 JP JP2002544711A patent/JP4064236B2/ja not_active Expired - Lifetime
- 2001-11-22 EP EP01997803A patent/EP1354315B1/en not_active Expired - Lifetime
- 2001-11-22 WO PCT/CA2001/001675 patent/WO2002043053A1/en active IP Right Grant
- 2001-11-22 RU RU2003118444/09A patent/RU2003118444A/ru not_active Application Discontinuation
- 2001-11-22 DE DE60120766T patent/DE60120766T2/de not_active Expired - Lifetime
- 2001-11-22 AU AU2138902A patent/AU2138902A/xx active Pending
- 2001-11-22 AU AU2002221389A patent/AU2002221389B2/en not_active Expired - Fee Related
- 2001-11-22 CN CNB018039545A patent/CN1205603C/zh not_active Expired - Lifetime
- 2001-11-22 AT AT01997803T patent/ATE330310T1/de active
- 2001-11-22 MX MXPA03004513A patent/MXPA03004513A/es unknown
- 2001-11-22 ES ES01997803T patent/ES2266312T3/es not_active Expired - Lifetime
- 2001-11-22 DK DK01997803T patent/DK1354315T3/da active
-
2002
- 2002-07-04 NO NO20023252A patent/NO20023252L/no unknown
- 2002-07-17 ZA ZA200205695A patent/ZA200205695B/en unknown
-
2003
- 2003-04-03 HK HK03102392A patent/HK1050262A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
RU2003118444A (ru) | 2004-12-10 |
ES2266312T3 (es) | 2007-03-01 |
EP1354315A1 (en) | 2003-10-22 |
US20050065785A1 (en) | 2005-03-24 |
ZA200205695B (en) | 2003-04-04 |
MXPA03004513A (es) | 2004-12-03 |
US7280959B2 (en) | 2007-10-09 |
EP1354315B1 (en) | 2006-06-14 |
JP2004514182A (ja) | 2004-05-13 |
CN1205603C (zh) | 2005-06-08 |
AU2002221389B2 (en) | 2006-07-20 |
CA2327041A1 (en) | 2002-05-22 |
BR0107760A (pt) | 2002-11-12 |
NO20023252D0 (no) | 2002-07-04 |
PT1354315E (pt) | 2006-10-31 |
HK1050262A1 (en) | 2003-06-13 |
DK1354315T3 (da) | 2006-10-16 |
DE60120766D1 (de) | 2006-07-27 |
AU2138902A (en) | 2002-06-03 |
KR20020077389A (ko) | 2002-10-11 |
DE60120766T2 (de) | 2007-06-14 |
ATE330310T1 (de) | 2006-07-15 |
CN1395724A (zh) | 2003-02-05 |
NO20023252L (no) | 2002-09-12 |
WO2002043053A1 (en) | 2002-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4064236B2 (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
JP5519334B2 (ja) | 音声符号化用開ループピッチ処理 | |
US7778827B2 (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
AU2002221389A1 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
JPH10513571A (ja) | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 | |
EP1212750A1 (en) | Multimode vselp speech coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070413 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070420 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070515 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071226 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4064236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140111 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |