JP2002528775A - 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 - Google Patents
広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置Info
- Publication number
- JP2002528775A JP2002528775A JP2000578808A JP2000578808A JP2002528775A JP 2002528775 A JP2002528775 A JP 2002528775A JP 2000578808 A JP2000578808 A JP 2000578808A JP 2000578808 A JP2000578808 A JP 2000578808A JP 2002528775 A JP2002528775 A JP 2002528775A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- code vector
- prediction error
- signal
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000003044 adaptive effect Effects 0.000 title description 3
- 239000013598 vector Substances 0.000 claims description 203
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 230000001413 cellular effect Effects 0.000 claims description 31
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 27
- 238000001914 filtration Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000010267 cellular communication Effects 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000010295 mobile communication Methods 0.000 claims description 2
- 230000002457 bidirectional effect Effects 0.000 claims 1
- 230000005236 sound signal Effects 0.000 abstract description 30
- 238000001228 spectrum Methods 0.000 abstract description 15
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 230000005284 excitation Effects 0.000 description 37
- 238000013139 quantization Methods 0.000 description 13
- 238000012546 transfer Methods 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 241001000161 Mago Species 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 101001062854 Rattus norvegicus Fatty acid-binding protein 5 Proteins 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Optical Recording Or Reproduction (AREA)
- Error Detection And Correction (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Dc Digital Transmission (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Networks Using Active Elements (AREA)
- Television Systems (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Mobile Radio Communication Systems (AREA)
- Optical Communication System (AREA)
- Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
- Radar Systems Or Details Thereof (AREA)
- Preliminary Treatment Of Fibers (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Image Processing (AREA)
- Stereo-Broadcasting Methods (AREA)
- Package Frames And Binding Bands (AREA)
- Installation Of Indoor Wiring (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Inorganic Insulating Materials (AREA)
- Parts Printed On Printed Circuit Boards (AREA)
- Coils Or Transformers For Communication (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
Description
号を、この広帯域音響信号の送信または記憶および合成のためにディジタル符号
化するための効率的な方法に関する。さらに特に、本発明は、改良されたピッチ
探索装置および方法に関する。 2. 従来技術の簡単な説明 例えば音声/映像電子会議システム、マルチメディア、ワイヤレスアプリケー
ション、並びに、インターネットおよびパケットネットワークアプリケーション
のような様々な用途において、主観的品質/ビットレートの良好なトレードオフ
を有する効率的なディジタル広帯域音声/オーディオ符号化技術に対する要求が
ますます高まっている。最近になるまで、主として200−3400Hz帯域内
のフィルタリングされた電話帯域幅が音声符号化アプリケーションで使用されて
いた。しかし、音声信号の了解性と自然さを向上させるために、広帯域音声アプ
リケーションに対する要求がますます高まっている。50−7000Hz帯域の
帯域幅が、対面音声品質を実現するのに十分であることが発見された。オーディ
オ信号に関しては、この帯域は許容可能なオーディオ品質をもたらすが、この品
質は20−20000Hz帯域を使用するCD品質よりは依然として低い。
ジタルビットストリームが通信チャネルを経由して伝送される(または、記憶媒
体内に記憶される)。音声信号はディジタル化され(すなわち、通常は16ビッ
トサンプリングによって量子化され)、音声エンコーダは、より少ないビット数
でこれらのディジタルサンプルを表現すると同時に良好な主観的音声品質を維持
するという役割を有する。この音声デコーダ或いはシンセサイザは、伝送または
記憶されたビットストリームに演算を施し、このビットストリームを変換して音
声信号に戻す。
技術の1つが、いわゆる符号励起線形予測(CELP)方式である。この方式で
は、サンプリングされた音声信号を、一般にフレームと呼ばれる、1個のブロッ
クがL個のサンプルから成る連続したブロックの形で処理し、ここでLは(10
−30ミリ秒の音声に対応する)何らかの予め決められた数である。CELPで
は、各フレーム毎に線形予測(LP)合成フィルタを計算して伝送する。その次
に、L個のサンプルから成るフレームを、N個のサンプルから成るサブフレーム
と呼ばれるより小さいブロックに分割し、ここではL=kNでありかつkは1フ
レーム内のサブフレームの個数である(Nは一般に4−10ミリ秒の音声に対応
する)。励起信号を各サブフレーム内で求め、この励起信号は、一般に、2つの
成分、すなわち、直前の励起(ピッチ寄与(pitch contributi
on)または適応コードブックとも呼ばれる)からの一方の成分と、イノベーテ
ィブコードブック(innovative codebook)(固定コードブ
ックとも呼ばれる)からの他方の成分とから成る。この励起信号が伝送され、合
成音声を得るためにLP合成フィルタの入力としてデコーダで使用される。
呼ばれるサンプルN個分の長さのシーケンスの索引付きセットである。各々のコ
ードブックシーケンスは、1からMの範囲内の整数kによる索引を付けられ、こ
こでMはビット数bとして表現されることが多いコードブックのサイズを表し、
ここでM=2bである。
ードベクトルを音声信号のスペクトル特徴をモデル化する時変フィルタに通して
フィルタリングすることによって、N個のサンプルから成るブロックの各々を合
成する。エンコーダ側では、コードブックからのコードベクトルの全てまたはそ
のサブセットに関して合成出力を計算する(コードブック探索)。こうして得ら
れたコードベクトルは、聴覚的に重み付けされた歪み測度にしたがってオリジナ
ルの音声信号に最も近い合成出力を生成するコードベクトルである。この聴覚重
み付けを、いわゆる聴覚重み付けフィルタを使用して行い、この聴覚重み付けフ
ィルタは一般的にLP合成フィルタから得られる。
を基礎とする幾つかの規格が、広範囲のアプリケーション、特にディジタル移動
電話アプリケーションにおいて存在している。電話帯域では、音声信号は200
−3400Hzに帯域制限され、8000サンプル/秒でサンプリングされる。
広帯域音声/オーディオアプリケーションでは、音声信号は50−7000Hz
に帯域制限され、16000サンプル/秒でサンプリングされる。
の問題が生じ、高品質の広帯域信号を得るためにはこのモデルに追加の特徴を加
えることが必要である。広帯域信号は、電話帯域信号に比較してはるかに広いダ
イナミックレンジを示し、このことが、(ワイヤレスアプリケーションでは必須
である)このアルゴリズムの固定小数点処理系が必要とされる時に、精度上の問
題を生じさせる。さらに、CELPモデルは、通常はより高いエネルギー成分を
有する低周波数領域にその符号化ビットの大半を費やすことが多く、この結果と
してローパスの出力信号が生じる。この問題を克服するために、聴覚重み付けフ
ィルタを広帯域信号に適合するように改変しなければならず、かつ、高周波数領
域を強調するプリエンファシス方式が、ダイナミックレンジを低減させてより単
純な固定小数点処理系を実現するために、および、信号のより高い周波数の成分
をより適切に符号化することを確実にするために重要になる。さらに、広帯域信
号中の有声音セグメントのスペクトルのピッチ成分はスペクトル全体にわたらず
、有声音の量は狭帯域信号に比較して、より狭いばらつきを見せる。したがって
、広帯域信号の場合には、既存のピッチ探索構造はあまり効率的ではない。した
がって、有声音レベルのばらつきによりうまく対応するように、閉ループピッチ
分析を改良することが重要である。 発明の目的 したがって、本発明の目的は、高音質の再生音響信号を得るために改良された
ピッチ分析を使用する、CELPタイプの符号化技術を使用して広帯域(700
0Hz)の音響信号を効率的に符号化する方法および装置を提供することである
。 発明の概要 さらに明確に述べると、本発明によって、少なくとも2つの信号経路から、最
小の計算ピッチ予測誤差を有する信号経路に関連しているピッチコードブックパ
ラメータの最適なセットを選択する方法が提供される。ピッチ予測誤差は、ピッ
チコードブック探索装置からのピッチコードベクトルに応答して計算される。2
つの信号経路のうちの少なくとも1つの信号経路では、その1つの信号経路のピ
ッチ予測誤差の計算のためにピッチコードベクトルを供給する前に、ピッチ予測
誤差がフィルタリングされる。最後に、少なくとも2つの信号経路で計算された
ピッチ予測誤差が互いに比較され、最小の計算ピッチ予測誤差を有する信号経路
が選択され、この選択された信号経路に関連しているピッチコードブックパラメ
ータのセットが選択される。
チ分析装置は、 a)ピッチコードブックパラメータのそれぞれのセットに関連している少なく
とも2つの信号経路であって、 i)各信号経路は、ピッチコードブック探索装置からのピッチコードベク
トルのピッチ予測誤差を計算するピッチ予測誤差計算装置を含み、 ii)2つの信号経路のうちの少なくとも1つの信号経路は、ピッチコー
ドベクトルをその経路のピッチ予測誤差計算装置に供給する前にピッチコードベ
クトルをフィルタリングするフィルタを含む 信号経路と、 b)信号経路において計算されたピッチ予測誤差を互いに比較し、最小の計算
ピッチ予測誤差を有する信号経路を選択し、その選択された信号経路に関連して
いるピッチコードブックパラメータのセットを選択するセレクタ とを含む。
装置は、直前の励起に適用される幾つかの形のローパスフィルタを使用し、より
高い予測ゲインを生じさせるローパスフィルタが選択される。サブサンプルピッ
チ分解能が使用される時には、これらのローパスフィルタは、より高いピッチ分
解能を得るために使用される補間フィルタの中に組み込まれることが可能である
。
装置の各々が、 a)ピッチコードベクトルを重み付けされた合成フィルタインパルス応答信号
と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算する
畳み込みユニットと、 b)畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトルとに
応答してピッチゲインを計算するピッチゲイン計算器と、 c)畳み込まれたピッチコードベクトルにピッチゲインを乗算して、増幅され
た畳み込みピッチコードベクトルを生成する増幅器と、 d)増幅された畳み込みピッチコードベクトルをピッチ探索ターゲットベクト
ルと組み合わせてピッチ予測誤差を生成するコンバイナー回路 とを含む。
してピッチゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxはピッチ探索ターゲットベクトルであり、y(j)は畳み込みピ
ッチコードベクトルである。
するためのエンコーダにも関し、このエンコーダは、 a)広帯域信号に応答して線形予測合成フィルタ係数を生成する線形予測合成
フィルタ計算器と、 b)広帯域信号と線形予測合成フィルタ係数とに応答して、聴覚的に重み付け
された信号を生成する聴覚重み付けフィルタと、 c)線形予測合成フィルタ係数に応答して、重み付けされた合成フィルタイン
パルス応答信号を生成するインパルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探索ユニットであって、 i)聴覚重み付けされた信号と線形予測合成フィルタ係数とに応答して、
ピッチコードベクトルとイノベーティブ探索ターゲットベクトルとを生成するピ
ッチコードブック探索装置と、 ii)ピッチコードベクトルに応答して、ピッチコードブックパラメータ
のセットから、最小の計算ピッチ予測誤差を有する経路に関連しているピッチコ
ードブックパラメータのセットを選択するピッチ分析装置 とを含むピッチ探索ユニットと、 d)重み付けされた合成フィルタインパルス応答信号とイノベーティブ探索タ
ーゲットベクトルとに応答して、イノベーティブコードブックパラメータを生成
するイノベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する経路に関連しているピッチコードブックパ
ラメータのセットと、イノベーティブコードブックパラメータと、線形予測合成
フィルタ係数とを含む、符号化された広帯域信号を生成する信号形成装置 とを含む。
ー移動送信機/受信機ユニットと、セルラーネットワーク要素と、双方向無線通
信サブシステムとに関する。 本発明の単なる例示を行う下記の本発明の好ましい実施形態の非限定的な説明
を添付図面を参照しながら理解することによって、本発明の目的と利点と他の特
徴とがより明確になるだろう。 好ましい実施形態の詳細な説明 当業者に周知であるように、401(図4を参照されたい)のようなセルラー
通信システムが、広い地理的区域をC個のより小さいセルに分割することによっ
てその広い地理的区域全体にわたって通信サービスを提供する。C個の小さいセ
ルは、その各セルに無線信号チャネルとオーディオチャネルとデータチャネルと
を提供するべつべつのセルラー基地局4021、4022、...、402Cによ
って通信サービスを提供される。
内の403のような移動無線電話(移動送信機/受信機ユニット)の呼出と、基
地局のセルの内側もしくは外側に位置する他の無線電話403に対して、または
、公衆交換電話網(PSTN)404のような別のネットワークに対して呼出を
行うために使用される。
功すると、オーディオチャネルまたはデータチャネルが、この無線電話403と
、この無線電話403が中に位置しているセルに対応するセルラー基地局402
との間に確立され、基地局402と無線電話403との間の通信がオーディオチ
ャネルまたはデータチャネルを通して行われる。さらに、無線電話403は、通
話が進行している最中に無線信号チャネルを通して制御情報またはタイミング情
報を受信することもできる。
に入る場合には、無線電話403は、その新たなセル基地局402の使用可能な
オーディオまたはデータチャネルに通話をハンドオーバーする。通話が進行して
いない時に無線電話403がセルの外に出て別の隣接セルの中に入る場合には、
無線電話403は、新たなセルの基地局402にログインするために無線信号送
信チャネルを通して制御メッセージを送る。このようにして、広い地理的区域全
体にわたっての移動通信が可能である。
404との間の通信、または、第1のセル内に位置した無線電話403と第2の
セル内に位置した無線電話403との間の通信の最中に、セルラー基地局402
とPSTN 404との間の通信を制御するための制御端末装置405を含む。 もちろん、1つのセルの基地局402とそのセル内に位置した無線電話403
との間にオーディオチャネルまたはデータチャネルを確立するためには、双方向
無線通信サブシステムが必要である。図4に非常に単純化して示しているように
、こうした双方向無線通信サブシステムは、一般に、無線電話403内に、 音声信号を符号化するエンコーダ407と、エンコーダ407からの符号化音
声信号を409のようなアンテナを通して送信する送信回路408とを含む送信
機406と、 一般には同一のアンテナ409を通して、送信された符号化音声信号を受信す
る受信回路411と、受信回路411からの受信した符号化音声信号を復号する
デコーダ412とを含む受信機410 とを含む。
かつこれらからの信号を処理するための他の従来通りの無線電話回路413も含
み、この回路413は当業者に公知であり、したがって本明細書ではさらに詳細
には説明しない。 さらに、こうした双方向無線通信サブシステムは、一般に、その基地局402
内に、 音声信号を符号化するエンコーダ415と、エンコーダ415からの符号化音
声信号を417のようなアンテナを通して送信する送信回路416とを含む送信
機414と、 同一のアンテナ409または別のアンテナ(図示していない)を通して、送信
された符号化音声信号を受信する受信回路419と、受信回路419からの受信
した符号化音声信号を復号するデコーダ420とを含む受信機418 とを含む。
機418の間の通信を制御するための、基地局制御装置421とこれに関連した
データベース422とを含む。 当業者には周知であるように、双方向無線通信サブシステムにおいて、すなわ
ち、無線電話403と基地局402との間で、例えば音声といった有声音信号の
ような音響信号を送信するのに必要な帯域幅を縮小するために、音声符号化が必
要とされている。
以下で動作する(415および407のような)LPボイスエンコーダは、音声
信号の短期スペクトル包絡線をモデル化するためにLP合成フィルタを使用する
ことが一般的である。一般には10ミリ秒毎または20ミリ秒毎にLP情報がデ
コーダ(例えば、420、412)に伝送され、デコーダ側で抽出される。
てもよい。しかし、CELPタイプの符号化システムを、本発明の方法を非限定
的に例示するための好ましい実施形態で使用する。同様に、こうした方式を、有
声音および音声以外の音響信号と共に使用することも、他のタイプの広帯域信号
と共に使用することも可能である。
音声符号化装置100の略ブロック図を示す。 サンプリングされた入力音声信号114が、ブロック1個当たりL個のサンプ
ルから成る連続した「フレーム」と呼ばれるブロックに分割される。各フレーム
において、そのフレーム内の音声信号を表す異なったパラメータが計算され、符
号化され、伝送される。一般的に、LP合成フィルタを表現するLPパラメータ
が各フレーム毎に1回計算される。各フレームは、N個のサンプルから成るより
小さいブロック(長さNのブロック)にさらに分割され、このブロックでは励起
パラメータ(ピッチおよびイノベーション)が求められる。CELPの文献では
、こうした長さNのブロックは「サブフレーム」と呼ばれ、このサブフレーム中
のN個のサンプル信号は「N次元ベクトル」と呼ばれている。この好ましい実施
形態では、長さNは5ミリ秒に相当し、一方、長さLは20ミリ秒に相当し、こ
のことは、1個のフレームが4個のサブフレームを含むことを意味する(16k
HzのサンプリングレートではN=80であり、12.8kHzへのダウンサン
プリング後では、N=64である)。様々なN次元ベクトルが符号化手順中に生
じる。図1と図2に現れるベクトルのリストと、伝送されるパラメータのリスト
とを次に示す。 主要なN次元ベクトルのリスト s 広帯域信号入力音声ベクトル(ダウンサンプリングと前処理とプリエンフ
ァシスとの後)、 sw 重み付けされた音声ベクトル、 so 重み付けされた合成フィルタのゼロ入力応答、 sp ダウンサンプリングされ前処理された信号、 オーバサンプリングされた合成音声信号、 s′ デエンファシス前の合成信号、 sd デエンファシスされた合成信号、 sh デエンファシスおよび後処理後の合成信号、 x ピッチ探索のためのターゲットベクトル、 x′ イノベーション探索のためのターゲットベクトル、 h 重み付けされた合成フィルタインパルス応答、 vT 遅延Tにおける適応(ピッチ)コードブック、 yT フィルタリングされたピッチコードブックベクトル(hと畳み込み演算
されたvT)、 ck 索引kにおけるイノベーティブコードベクトル(イノベーションコード
ブックからのk番目のエントリ)、 cf 強調されたスケーリング済みイノベーションコードベクトル、 u 励起信号(スケーリングされたイノベーションコードベクトルおよびピッ
チコードベクトル)、 u′ 強調された励起、 z 帯域通過ノイズシーケンス、 w′ ホワイトノイズシーケンス、 w スケーリングされたノイズシーケンス。 伝送されるパラメータのリスト STP 短期予測パラメータ(A(z)を定義する)、 T ピッチ遅れ(すなわち、ピッチコードブック索引)、 b ピッチゲイン(すなわち、ピッチコードブックゲイン)、 j ピッチコードベクトルで使用されるローパスフィルタの索引、 k コードベクトル索引(イノベーションコードブックエントリ)、 g イノベーションコードブックゲイン。
され、その他のパラメータはフレーム1個当たり4回(すなわち各サブフレーム
毎に1回)伝送される。 エンコーダ側 サンプリングされた音声信号を、101から111の番号が付いた11個のモ
ジュールに分けた図1の符号化装置100によって各ブロック単位で符号化する
。
に処理する。 図1を参照すると、サンプリングされた入力音声信号114をダウンサンプリ
ングモジュール101においてダウンサンプリングする。例えば、当業者に周知
の方法を使用して、この信号を16kHzから12.8kHzにダウンサンプリ
ングする。もちろん、別の周波数へのダウンサンプリングも想定可能である。ダ
ウンサンプリングは、より小さい周波数帯域幅が符号化されるので、符号化効率
を向上させる。さらに、これは、1フレーム中のサンプルの数が減少させられる
ので、アルゴリズムの複雑性を低減させる。ビットレートを16キロビット/秒
未満に低下させる時には、ダウンサンプリングの使用が重要になるが、16キロ
ビット/秒を越える場合にはダウンサンプリングは不可欠ではない。
サンプルフレームに縮小される(ダウンサンプリング率は4/5である)。 その次に、入力フレームを随意採用の前処理ブロック102に送る。前処理ブ
ロック102は、50Hzのカットオフ周波数を有するハイパスフィルタから成
ってもよい。ハイパスフィルタ102は、50Hz未満の不要な音響成分を除去
する。
...、L−1で表し、ここでLはフレームの長さである(12.8kHzのサ
ンプリング周波数では256)。プリエンファシスフィルタ103の好ましい具
体例では、信号sp(n)は、次の伝達関数を有するフィルタを使用してプリエ
ンファシスされる。
μ=0.7である)。より高次のフィルタを使用してもよい。より効率的な固定
小数点処理系を得るために、ハイパスフィルタ102とプリエンファシスフィル
タ103とを互いに交換することが可能であることを指摘しておかなければなら
ない。
ることである。さらに、このプリエンファシスフィルタ103は入力音声信号の
ダイナミックレンジを縮小し、このことが入力音声信号を固定小数点処理系によ
り一層適したものにする。プリエンファシスを行わない場合には、固定小数点を
使用する単精度演算の形でのLP分析は実行が困難である。
する上で重要な役割を果たし、音質の改善に寄与する。これについては、さらに
詳細に後述する。 プリエンファシスフィルタ103の出力をs(n)で表す。この信号は、計算
器モジュール104でLP分析を行うために使用される。LP分析は当業者に周
知の方法である。この好ましい実施形態では、自己相関アプローチを使用する。
この自己相関アプローチでは、最初に、(約30−40ミリ秒の長さを有するこ
とが一般的である)ハミング窓を使用して信号s(n)をウィンドウ処理する。
このウィンドウ処理された信号から自己相関を計算し、LPフィルタ係数aiを
計算するためにレヴィンソン−ダービンの再帰計算を使用し、ここでi=1,.
..,pであり、pはLP次数であり、広帯域符号化の場合には16であること
が一般的である。パラメータaiは、LPフィルタの伝達関数の係数であり、次
の関係式で示される。
らに、LPフィルタ係数の量子化と補間も行う。最初に、LPフィルタ係数を、
量子化と補間により適している別の同等のドメインに変換する。線スペクトル対
(LSP)ドメインとイミタンス(immitance)スペクトル対(ISP
)ドメインとが、量子化と補間を効率的に行うことができる2つのドメインであ
る。16個のLPフィルタ係数aiを、分割量子化または多段量子化またはこれ
らの組合せを使用して約30ビットから50ビットに量子化することが可能であ
る。補間の目的は、各フレーム毎に1回ずつLPフィルタ係数を伝送しつつ各サ
ブフレーム毎にLPフィルタ係数を更新することを可能にすることであり、この
ことがビットレートを増加させることなしにエンコーダの性能を向上させる。L
Pフィルタ係数の量子化と補間は、他の点では当業者に周知であると考えられ、
したがって本明細書ではさらに詳細には説明しない。
て入力音声と合成音声の間の平均2乗誤差を最小化することによって、最適のピ
ッチおよびイノベーションパラメータを探索する。これは、重み付けされた入力
音声と重み付けされた合成音声との間の誤差を最小化することと同等である。
従来通りに、重み付けされた信号sw(n)を、次式の伝達関数W(z)を有す
る重み付けフィルタによって計算する。 W(z)=A(z/γ1)/A(z/γ2)ここで0<γ2<γ1≦1 当業者には周知であるように、従来技術の「合成による分析」(AbS)エンコ
ーダでは、聴覚重み付けフィルタ105の伝達関数の逆関数である伝達関数W-1 (z)によって量子化誤差が重み付けされるということが分析によって示されて
いる。この結果は、B.S.AtalおよびM.R.Schroeder,“P
redictive coding of speech and subje
ctive error criteria”,IEEE Transacti
on ASSP,vol.27,no.3,pp.247−254,June
1979に詳細に説明されている。伝達関数W-1(z)は入力音声信号のフォル
マント構造の一部分を示す。したがって、量子化誤差がフォルマント領域内によ
り大きいエネルギーを有し、それによってこのフォルマント領域内に存在する強
い信号エネルギーによって量子化誤差がマスキングされるように量子化誤差を整
形することによって、人間の耳のマスキング特性が利用される。重み付けの量を
係数γ1、γ2で制御する。
機能する。しかし、この従来の聴覚重み付けフィルタ105が広帯域信号の効率
的な聴覚重み付けには適していないことが明らかになった。さらに、従来の聴覚
重み付けフィルタ105がフォルマント構造とそれに必要なスペクトル傾斜とを
同時にモデル化する上で固有の制限を有することも明らかになった。スペクトル
傾斜は、広帯域信号においては、低周波数と高周波数の間の広いダイナミックレ
ンジのためにより一層顕著である。従来技術は、広帯域入力信号の傾斜およびフ
ォルマント重み付けを制御するために、傾斜フィルタをW(z)に加えることを
提案している。
タ103を入力に導入することと、プリエンファシスされた音声s(n)に基づ
いてLPフィルタA(z)を計算することと、フィルタW(z)の分母を固定す
ることによって改変されたフィルタW(z)を使用することである。 LPフィルタA(z)を得るために、プリエンファシスされた信号s(n)に
対してモジュール104においてLP分析を行う。さらに、固定された分母を有
する新たな聴覚重み付けフィルタ105を使用する。聴覚重み付けフィルタ10
4のための伝達関数の一例を次の関係式で示す。
み付けを傾斜から実質的に切り離す。 A(z)はプリエンファシスされた音声信号s(n)に基づいて計算されるの
で、フィルタの傾斜1/A(z/γ1)は、A(z)がオリジナルの音声に基づ
いて計算される場合よりは顕著ではないということに留意されたい。次の伝達関
数を有するフィルタを使用して、デコーダ側でデエンファシスが行われるので、 P-1(z)=1/(1−μz-1)1 量子化誤差のスペクトルは、伝達関数W-1(z)P-1(z)を有するフィルタに
よって整形される。通常はそうであるように、γ2がμに等しく設定されている
時には、量子化誤差のスペクトルは、伝達関数が1/A(z/γ1)であるフィ
ルタによって整形され、A(z)はプリエンファシスされた音声信号に基づいて
計算される。プリエンファシスと改変された重み付けフィルタリングとの組合せ
によって誤差の整形を実現するこの構造は、固定小数点アルゴリズムの実現が容
易であるという利点に加えて、広帯域信号の符号化に関して非常に効率的である
ということが、主観的な聴取によって明らかになった。 ピッチ分析 ピッチ分析を簡略化するために、重み付けされた音声信号sw(n)を使用し
て、開ループピッチ探索モジュール106において開ループピッチ遅れTOLを最
初に推定する。その次に、サブフレーム単位で閉ループピッチ探索モジュール1
07において行われる閉ループピッチ分析を、開ループピッチ遅れTOLの付近に
制限し、このことがLTPパラメータT、b(ピッチ遅れとピッチゲイン)の探
索の複雑性を著しく低減させる。通常は、当業者に周知の方法を使用して、開ル
ープピッチ分析を10ミリ秒(2個のサブフレーム)毎に1回ずつモジュール1
06で行う。
ープピッチ探索モジュール107において計算し、この閉ループピッチ探索モジ
ュール107は、入力としてターゲットベクトルxとインパルス応答ベクトルh
と開ループピッチ遅れTOLとを使用する。従来においては、ピッチ予測は、次の
伝達関数を有するピッチフィルタによって表現されており、 1/(1−bz-T) ここでbはピッチゲインであり、Tはピッチ遅延すなわち遅れである。この場合
に、励起信号u(n)に対するピッチの寄与はbu(n−T)によって与えられ
、この場合に全励起が、 u(n)=bu(n−T)+gck(n) で与えられ、ここでgはイノベーティブコードブックゲインであり、ck(n)
は索引kにおけるイノベーティブコードベクトルである。
る。別の表現では、ピッチ寄与を、直前の励起信号を含むピッチコードブックと
見なすことが可能である。一般的に、ピッチコードブック中の各ベクトルは先行
のベクトルの(1つのサンプルを捨てて新たなサンプルを加えた)「1つ分ずれ
た」変型である。ピッチ遅れT>Nである場合には、ピッチコードブックはフィ
ルタ構造(1/(1−bz-1)と同等であり、ピッチ遅れTにおけるピッチコー
ドブックベクトルvT(n)は次式で与えられる。
成するまで、直前の励起からの使用可能なサンプルを反復することによって構築
される(これはフィルタ構造と同等ではない)。 最近のエンコーダでは、より高いピッチ分解能が使用され、このことは有声音
音響セグメントの品質を著しく向上させる。これは、多相補間フィルタを使用し
て直前の励起信号をオーバサンプリングすることによって行われる。この場合に
は、ベクトルvT(n)は、一般的に、直前の励起の補間変型に相当し、ピッチ
遅れTは非整数の遅延(例えば、50.25)である。
みの直前の励起との間の平均2乗重み付け誤差Eを最小化する最適のピッチ遅れ
Tとゲインbとを発見することから成る。誤差Eは次のように表現され、 E=‖x−byT‖2 ここでyTはピッチ遅れTにおけるフィルタリングされたピッチコードブックベ
クトルであり、
用され、ピッチ(ピッチコードブック)探索が3つの段階によって構成されてい
る。
n)に応答して開ループピッチ探索モジュール106で推定される。上述の説明
で示したように、この開ループピッチ分析は、当業者に周知の方法を使用して1
0ミリ秒(2つのサブフレーム)毎に1回ずつ行われるのが一般的である。 第2の段階では、探索基準Cが、推定された開ループピッチ遅れTOL(一般に
±5)に近い整数ピッチ遅れに関して、閉ループピッチ探索モジュール107で
探索され、このことが探索手順を著しく単純化する。各ピッチ遅れ毎に畳み込み
を計算する必要なしに、フィルタリングされたコードベクトルyTを更新するた
めに、単純な手順を使用する。
ール107)においてその最適の整数ピッチ遅れの付近の端数がテストされる。 ピッチ予測器が、ピッチ遅れT>Nの場合の妥当な想定である形式1/(1−
bz-1)のフィルタによって表現される時には、ピッチフィルタのスペクトルが
、周波数範囲全体にわたって高調波構造を示し、この高調波周波数は1/Tに関
係している。広帯域信号の場合には、広帯域信号における高調波構造がその拡張
されたスペクトルの全体を含むわけではないので、この高調波構造はあまり効率
的ではない。この高調波構造は、音声セグメントに応じて特定の周波数までにだ
け存在するにすぎない。したがって、広帯域音声の有声音セグメントにおけるピ
ッチ寄与の効率的な表現を得るためには、ピッチ予測フィルタは、広帯域スペク
トル全体にわたって周期性の量を変化させるという柔軟性を有する必要がある。
方法を本明細書で開示し、この方法では、幾つかの形態のローパスフィルタが直
前の励起に適用され、より高い予測ゲインを有するローパスフィルタが選択され
る。 サブサンプルピッチ分解能を使用する時には、ローパスフィルタを、より高い
ピッチ分解能を得るために使用される補間フィルタの中に組み込むことが可能で
ある。この場合には、選択された整数ピッチ遅れの付近の端数をテストするピッ
チ探索の第3の段階を、互いに異なったローパス特性を有する幾つかの補間フィ
ルタに対して繰り返し、探索基準Cを最小にする端数とフィルタ索引とを選択す
る。
応答を有する1つだけの補間フィルタを使用して最適の端数ピッチ遅れを求め、
異なった予め決められたローパスフィルタを選択されたピッチコードブックベク
トルvTに適用することによって最適のローパスフィルタ形状を最終的に選択し
、ピッチ予測誤差を最小にするローパスフィルタを選択することである。このア
プローチを詳細に後述する。
。ピッチコードブック探索モジュール301が、ターゲットベクトルxと、開ル
ープピッチ遅れTOLと、記憶装置モジュール303からの直前の励起信号u(n
)、n<0とに対して応答し、上述の探索基準Cを最小にするピッチコードブッ
ク(ピッチコードブック)検索を行う。モジュール301で行った探索の結果か
ら、モジュール302が最適のピッチコードブックベクトルvTを生成する。サ
ブサンプルピッチ分解能(端数ピッチ)を使用するので、直前の励起信号u(n
)、n<0が補間され、ピッチコードブックベクトルvTは、補間された直前の
励起信号に対応するということに留意されたい。この好ましい実施形態では、補
間フィルタ(モジュール301内、図示していない)が、7000Hzを越える
周波数成分を除去するローパスフィルタ特性を有する。
特性はローパスフィルタ特性であることも帯域通過フィルタ特性であることも可
能である。最適のコードベクトルvTがピッチコードベクトル発生器302によ
って決定されて供給されると、vTのK個のフィルタリングされた変型が、30
5(j)のようなK個の異なった周波数整形フィルタを使用してそれぞれに計算さ
れ、ここでj=1,2,...,Kである。これらのフィルタリングされた変型
をvf (j)と表現し、ここでj=1,2,...,Kである。これらの異なったベ
クトルvf (j)を、それぞれのモジュール304(j)(ここでj=1,2,...
,Kである)においてインパルス応答hと畳み込み演算し、ベクトルy(j)(こ
こでj=1,2,...,Kである)を得る。各ベクトルy(j)に関して平均2
乗ピッチ予測誤差を計算するために、対応する増幅器307(j)によって値y(j) にゲインbを乗算し、さらに、対応する減算器308(j)によって値by(j)をタ
ーゲットベクトルxから減算する。セレクタ309が、平均2乗ピッチ予測誤差 e(j)=‖x−b(j)y(j)‖2, j=1,2,...,K を最小にする周波数整形フィルタ305(j)を選択する。y(j)の各値に関して平
均2乗ピッチ予測誤差e(j)を計算するために、対応する増幅器307(j)によっ
て値y(j)にゲインbを乗算し、さらに、減算器308(j)によって値b(j)y(j) をターゲットベクトルxから減算する。次の関係式を使用して、索引jにおける
周波数整形フィルタに関連した対応するゲイン計算器306(j)によって、各々
のゲインb(j)を計算する。
最小にするvTまたはvf (j)に基づいて選択される。 再び図1を参照すると、ピッチコードブック索引Tは符号化されてマルチプレ
クサ112に送られる。ピッチゲインbは量子化されてマルチプレクサ112に
送られる。この新たなアプローチを使用する場合には、選択された周波数整形フ
ィルタの索引jをマルチプレクサ112で符号化するために、追加の情報が必要
である。例えば、3つのフィルタを使用する場合(j=1,2,3)には、この
情報を表現するために2ビットが必要である。フィルタ索引情報jをピッチゲイ
ンbと共に符号化することも可能である。 イノベーティブコードブック探索 ピッチ、または、LTP(長期予測)パラメータb、T、jを求めた後に、次
のステップは、図1の探索モジュール110によって最適のイノベーティブ励起
を探索することである。最初に、ターゲットベクトルxを、LTP寄与 x’=x−byT を減算することによって更新し、ここでbはピッチゲインであり、yTはフィル
タリングされたピッチコードブックベクトル(選択されたローパスフィルタでフ
ィルタリングされ、図3を参照して説明したようにインパルス応答hと畳み込み
演算された、遅延Tにおける直前の励起)である。
ルタリング済みコードベクトルとの間の平均2乗誤差 E=‖x’−gHck‖2 を最小にする最適の励起コードベクトルckとゲインgとを発見することによっ
て行なわれる。ここでHは、インパルス応答ベクトルhから得られた下三角畳み
込み行列である。
995年8月22日付で発行された米国特許第5,444,816号(Adou
l他)と、1997年12月17日付でAduol他に発行された米国特許第5
,699,482号と、1998年5月19日付でAduol他に発行された米
国特許第5,754,976号と、1997年12月23日付の米国特許第5,
701,392号(Adoul他)とに説明されている通りの代数的コードブッ
クによってモジュール110で行う。
選択され終わると、コードブック索引kとゲインgとが符号化されてマルチプレ
クサ112に送られる。 図1を参照すると、パラメータb、T、j、 、k、gがマルチプレクサ1
12を通して多重化され、その後で通信チャネルを通して送られる。 記憶装置の更新 記憶装置モジュール111(図1)では、重み付けされた合成フィルタ
bvTをフィルタリングすることによって更新される。このフィルタリングの後
に、このフィルタの状態が記憶され、計算器モジュール108でゼロ入力応答を
計算するための初期状態として、その次のサブフレームで使用される。 ターゲットベクトルxの場合と同様に、当業者に周知の数学的には同等である
別のアプローチを、このフィルタの状態を更新するために使用することが可能で
ある。 デコーダ側 図2の音声復号装置200が、ディジタル入力222(デマルチプレクサ21
7に対する入力ストリーム)とサンプリングされた出力音声223(加算器22
1の出力)との間で行われる様々なステップを示す。
情報から合成モデルパラメータを抽出する。受け取ったバイナリフレームの各々
から抽出されるパラメータは、 短期予測パラメータ(STP) (フレーム毎に1回)、 長期予測(LTP)パラメータT、b、j(各サブフレーム毎)、および、 イノベーションコードブック索引kとゲインg(各サブフレーム毎) である。
る。 イノベーティブコードブック218が索引kに応答してイノベーションコード
ベクトルckを生じさせ、このイノベーションコードベクトルは、復号されたゲ
イン係数gによって増幅器224を通してスケーリングされる。この好ましい実
施形態では、上記の米国特許第5,444,816号、同第5,699,482
号、同第5,754,976号、同第5,701,392号に説明されている通
りのイノベーティブコードブック218を、イノベーティブコードベクトルck
を表現するために使用する。
gckを、イノベーションフィルタ205を通して処理する。 周期性の強調 増幅器224の出力における、生成されたスケーリングされたコードベクトル
を、周波数依存性のピッチエンハンサ205を通して処理する。
する。これは、過去においては、導入される周期性の量を制御する式1/(1−
εbz-1)(ただし、εは0.5未満の係数である)のフィルタを通して、イノ
ベーティブコードブック(固定コードブック)218からのイノベーションベク
トルをフィルタリングすることによって行われた。このアプローチは、スペクト
ル全体にわたって周期性を導入するので、広帯域信号の場合には効果的でない。
本発明の一部分である新たな代案のアプローチを説明すると、このアプローチで
は、より低い周波数よりもより高い周波数を強調する周波数応答のイノベーショ
ンフィルタ205(F(z))を通して、イノベーティブ(固定)コードブック
からのイノベーティブコードベクトルckをフィルタリングすることによって、
周期性の強調を行う。F(z)の係数は励起信号uの周期性の量に関係する。
。例えば、ゲインbの値が周期性の表示を与える。すなわち、ゲインbが1に近
い場合には、励起信号uの周期性は高く、ゲインbが0.5未満である場合には
、周期性は低い。 好ましい実施形態で使用するフィルタF(z)の係数を得るための別の効果的
な方法は、励起信号u全体におけるピッチ寄与の量をこの係数に関係付けること
である。この結果として、周波数応答がサブフレームの周期性に依存することに
なり、この場合に、より高い周波数が、ピッチゲインが高ければ高いほど強く強
調される(より強い全体的勾配が得られる)。イノベーションフィルタ205は
、励起信号uの周期性がより大きい時に、低周波数におけるイノベーティブコー
ドベクトルckのエネルギーを低下させる効果を有し、このことが、より高い周
波数よりもより低い周波数における励起信号uの周期性を強調する。イノベーシ
ョンフィルタ205に関して提案する式は、 (1)F(z)=1−σz-1,または(2)F(z)=−αz+1−αz-1 であり、ここでσまたはαは、励起信号uの周期性のレベルから導き出される周
期性係数である。
有声音化係数発生器204で計算する。励起信号uの周期性に基づいて周期性係
数αを導き出すために、幾つかの方法を使用することが可能である。次にその方
法を2つ示す。 方法1: 最初に、全励起信号uに対するピッチ寄与の割合を、次式によって有声音化係
数発生器204で計算し、
は次式によって加算器219の出力で与えられる励起信号uである。 u=gck+bvT 項bvTが、ピッチ遅れTと、記憶装置203内に記憶されているuの直前の
値とに応答して、ピッチコードブック(ピッチコードブック)201から得られ
るということに留意されたい。その次に、ピッチコードブック201からのピッ
チコードベクトルvTを、デマルチプレクサ217からの索引jによってカット
オフ周波数が調整されるローパスフィルタ202を通して処理する。その次に、
得られたコードベクトルvTにデマルチプレクサ217からのゲインbを増幅器
226を通して乗算し、信号bvTを得る。
25に設定される。) 方法2: 周期性係数αを計算するために本発明の好ましい実施形態で使用する別の方法
を次に説明する。
し、 rv=(Ev−Ec)/(Ev+Ec) ここでEvはスケーリングされたピッチコードベクトルbvTのエネルギーであり
、Ecはスケーリングされたイノベーティブコードベクトルgckのエネルギーで
ある。すなわち、
の信号に相当し、−1は純粋に無声音の信号に相当する)。 その次に、この好ましい実施形態では、係数αを次式によって有声音化係数発
生器204で計算し、 α=0.125(1+rv) この係数αは、純粋に無声音の信号の場合には0の値に相当し、純粋に有声音の
信号の場合には0.25に相当する。
2においてσ=2αを使用することによって近似的に求めることが可能である。
この場合には、周期性係数σを上述の方法1で次のように計算する。 σ=2qRp bounded by σ<2q. 方法2では、周期性係数σを次のように計算する。
ドベクトルgckをイノベーションフィルタ205(F(z))を通してフィル
タリングすることによって計算される。 強調された励起信号u′を次のように加算器220で計算する。
って、エンコーダ100とデコーダ200の間の同期を維持するために、強調な
しに励起信号uを使用してピッチコードブック201の内容を更新することが不
可欠である。したがって、励起信号uをピッチコードブック201の記憶装置2
03を更新するために使用し、強調された励起信号u′をLP合成フィルタ20
6の入力で使用する。 合成とデエンファシス
=0.7である)。より高次のフィルタも使用可能である。 このベクトルs′は、デエンファシスフィルタD(z)(モジュール207)
を通過させられてベクトルsdが得られ、ベクトルsdはハイパスフィルタ208
を通過させられて50Hz未満の不要な周波数が除去されてshが得られる。 オーバサンプリングと高周波数再生
全体にわたって一様なスペクトルを有するホワイトノイズシーケンスw′を生成
する。生成されたシーケンスは、オリジナルのドメインにおけるサブフレーム長
さである長さN′である。Nがダウンサンプリングされたドメインにおけるサブ
フレーム長さであることに留意されたい。この好ましい実施形態では、N=64
でN′=80であり、これらは5ミリ秒に相当する。
グする。ゲイン調整は次のステップを含む。最初に、生成されたノイズシーケン
スw′のエネルギーを、エネルギー計算モジュール210によって計算された強
調された励起信号u′のエネルギーに等しいように設定し、この結果として得ら
れたスケーリングされたノイズシーケンスが次式で与えられる。
波数のエネルギが小さい)有声音セグメントの場合には、生成されるノイズのエ
ネルギーを減少させるように、有声音化係数発生器204の出力において合成信
号の高周波数成分を計算に入れることである。この好ましい実施形態では、高周
波数成分の測定を、スペクトル傾斜計算器212によって合成信号の傾斜を測定
することと、それにしたがってエネルギを減少させることとによって実現する。
零交叉測定のような他の測定を同様に使用することが可能である。傾斜が非常に
強い場合は、これは有声音セグメントに対応し、ノイズのエネルギーをさらに減
少させる。傾斜係数tiltをモジュール202で合成信号shの第1の相関係
数として計算し、これは次式で与えられ、
、Ecは上述の通りのスケーリングされたイノベーティブコードベクトルgckの
エネルギーである。有声音化係数rvはtiltよりも小さい場合が殆どである
が、この条件は、tilt値が負でありかつrvの値がHIGHである場合に高
周波数トーンに対する予防策として導入されている。したがって、この条件は、
こうしたトーン信号の場合のノイズエネルギーを減少させる。
の場合にはtilt値は1であり、高周波数により多くのエネルギーが存在する
無声音信号の場合にはtilt値は負である。 高周波数成分の量からスケーリング係数glを得るために様々な方法を使用す
ることが可能である。本発明では、上述の信号の傾斜に基づいて2つの方法を提
示する。 方法1: スケーリング係数glを次式によってtiltから得る。
強く無声音化された信号の場合にはglは1.0になる。 方法2: tilt係数glを最初にゼロ以上に制限し、その次にこのスケーリング係数
を次式によってtiltから得る。
シーケンスwgは次式で与えられる。 Wg=g1W. tiltがゼロに近い時には、スケーリング係数glは1に近く、このことは
エネルギーの減少を生じさせない。tilt値が1である時は、スケーリング係
数glは、生成されるノイズのエネルギーの12dBの減少をもたらす。
を、本発明の着想と本質から逸脱することなしに、添付の特許請求項の範囲内で
自由に改変することが可能である。好ましい実施形態では広帯域音声信号の使用
を説明したが、広帯域信号一般を使用する他の具体例にも本発明が適用されるこ
とと、本発明が必ずしも音声用途だけには限定されないということとが、当業者
には明らかだろう。
システムの単純化した略ブロック図である。
Claims (63)
- 【請求項1】 ピッチコードブックパラメータの最適なセットを生成するた
めの本発明のピッチ分析装置であって、 a)ピッチコードブックパラメータのそれぞれのセットに関連している少なく
とも2つの信号経路であって、 i)前記信号経路の各々は、ピッチコードブック探索装置からのピッチコ
ードベクトルのピッチ予測誤差を計算するピッチ予測誤差計算装置を含み、 ii)前記2つの信号経路のうちの少なくとも1つの信号経路は、前記ピ
ッチコードベクトルを前記1つの信号経路の前記ピッチ予測誤差計算装置に供給
する前に前記ピッチコードベクトルをフィルタリングするフィルタを含む 信号経路と、 b)前記少なくとも2つの信号経路において計算された前記ピッチ予測誤差を
互いに比較し、最小の計算ピッチ予測誤差を有する前記信号経路を選択し、前記
選択された信号経路に関連しているピッチコードブックパラメータのセットを選
択するセレクタ とを含むピッチ分析装置。 - 【請求項2】 前記2つの信号経路のうちの1つの信号経路は、前記ピッチ
コードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記ピッチコード
ベクトルをフィルタリングするフィルタを含まない請求項1に記載のピッチ分析
装置。 - 【請求項3】 前記信号経路は、前記ピッチコードベクトルを前記信号経路
の前記ピッチ予測誤差計算装置に供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタをそれぞれに備えている複数の信号経路を含む請求項1
に記載のピッチ分析装置。 - 【請求項4】 前記複数の信号経路の前記フィルタは、ローパスフィルタと
帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異なっ
た周波数応答を有する請求項3に記載のピッチ分析装置。 - 【請求項5】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトル
とに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項1に記載のピッチ分析装置。 - 【請求項6】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッチ
ゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項5に記載のピッチ分析装置。 - 【請求項7】 前記信号経路各々の前記ピッチ予測誤差計算装置は、対応す
る前記ピッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前
記様々な信号経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、
および、前記ピッチ予測誤差の最小の計算エネルギーを有する前記信号経路を、
最小の計算ピッチ予測誤差を有する前記信号経路として選択する手段を含む請求
項1にピッチ分析装置。 - 【請求項8】 a)前記複数の信号経路の前記フィルタの各々はフィルタ索
引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項5に記載のピッチ分析装置。 - 【請求項9】 前記フィルタは前記ピッチコードブック探索装置の補間フィ
ルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルのサ
ブサンプル変型を生成するために使用される請求項1に記載のピッチ分析装置。 - 【請求項10】 ピッチコードブックパラメタの最適のセットを生成するピ
ッチ分析方法であって、 a)ピッチコードブックパラメタのそれぞれのセットに関連している少なくと
も2つの信号経路において、ピッチコードブック探索装置からのピッチコードベ
クトルのピッチ予測誤差を各信号経路毎に計算することと、 b)前記2つの信号経路のうちの少なくとも1つの信号経路において、前記1
つの信号経路の前記ピッチ予測誤差の計算のために前記ピッチコードベクトルを
供給する前に、前記ピッチコードベクトルをフィルタリングすることと、 c)前記少なくとも2つの信号経路において計算された前記ピッチ予測誤差を
互いに比較し、最小の計算ピッチ予測誤差を有する信号経路を選択し、その選択
された信号経路に関連しているピッチコードブックパラメータのセットを選択す
ること とを含むピッチ分析方法。 - 【請求項11】 前記少なくとも2つの信号経路のうちの1つの信号経路に
おいて、前記ピッチ予測誤差計算装置に前記ピッチコードベクトルを供給する前
に、前記ピッチコードベクトルをフィルタリングしない請求項10に記載のピッ
チ分析方法。 - 【請求項12】 前記信号経路は複数の信号経路を含み、前記複数の信号経
路の各々の前記ピッチ予測誤差計算装置に前記ピッチコードベクトルを供給する
前に前記複数の信号経路の各々において前記ピッチコードベクトルをフィルタリ
ングする請求項10に記載のピッチ分析方法。 - 【請求項13】 前記複数の信号経路の前記フィルタを、ローパスフィルタ
と帯域通過フィルタから成るグループから選択することをさらに含み、前記フィ
ルタは互いに異なった周波数応答を有する請求項12に記載のピッチ分析方法。 - 【請求項14】 各信号経路毎にピッチ予測誤差を計算することは、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
することと、 b)前記畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトル
とに応答してピッチゲインを計算することと、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成することと、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成すること とを含む請求項10に記載のピッチ分析方法。 - 【請求項15】 前記ピッチゲイン計算は、次の関係を使用して前記ピッチ
ゲインb(j)を計算することを含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項14に記載のピッチ分析方法。 - 【請求項16】 前記信号経路各々において前記ピッチ予測誤差を計算する
ことは、対応するピッチ予測誤差のエネルギーを計算することを含み、前記ピッ
チ予測誤差を互いに比較することは、前記各信号経路の前記ピッチ予測誤差のエ
ネルギーを互いに比較することと、前記ピッチ予想誤差の最小の計算エネルギー
を有する前記信号経路を、最小の計算ピッチ予測誤差を有する前記信号経路とし
て選択することとを含む請求項10に記載のピッチ分析方法。 - 【請求項17】 a)前記複数の信号経路の前記フィルタの各々をフィルタ
索引で識別することと、 b)前記ピッチコードベクトルをピッチコードブック索引で識別することと c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項14に記載のピッチ分析方法。 - 【請求項18】 前記ピッチコードベクトルをフィルタリングすることは、
前記ピッチコードブック探索装置の補間フィルタに一体化されており、前記補間
フィルタを、前記ピッチコードベクトルのサブサンプル変型を生成するために使
用する請求項10に記載のピッチ分析方法。 - 【請求項19】 広帯域入力信号を符号化するための請求項1に記載のピッ
チ分析装置を有するエンコーダであって、 a)前記広帯域信号に応答して、線形予測合成フィルタ係数を生成する線形予
測合成フィルタ計算器と、 b)前記広帯域信号と前記線形予測合成フィルタ係数とに応答して、聴覚的に
重み付けされた信号を生成する聴覚重み付けフィルタと、 c)前記線形予測合成フィルタ係数に応答して、重み付けされた合成フィルタ
インパルス応答信号を生成するインパルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探索ユニットであって、 i)前記聴覚的に重み付けされた信号と前記線形予測合成フィルタ係数と
に応答して、前記ピッチコードベクトルとイノベーティブ探索ターゲットベクト
ルとを生成する前記ピッチコードブック探索装置と、 ii)前記ピッチコードベクトルに応答して、前記ピッチコードブックパ
ラメータのセットから、最小の計算ピッチ予測誤差を有する信号経路に関連して
いるピッチコードブックパラメータのセットを選択する前記ピッチ分析装置 とを含むピッチ探索ユニットと、 d)前記重み付けされた合成フィルタインパルス応答信号と前記イノベーティ
ブ探索ターゲットベクトルとに応答して、イノベーティブコードブックパラメー
タを生成するイノベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する信号経路に関連している前記ピッチコード
ブックパラメータのセットと、前記イノベーティブコードブックパラメータと、
前記線形予測合成フィルタ係数とを含む、符号化された広帯域信号を生成する信
号形成装置 とを含むエンコーダ。 - 【請求項20】 前記少なくとも2つの信号経路のうちの1つの信号経路は
、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを含まない請求項19に記
載のエンコーダ。 - 【請求項21】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項19に
記載のエンコーダ。 - 【請求項22】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
った周波数応答を有する請求項21に記載のエンコーダ。 - 【請求項23】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項19に記載のエンコーダ。 - 【請求項24】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
チゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項23に記載のエンコーダ。 - 【請求項25】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピ
ッチ予測誤差を有する前記信号経路として選択するための手段を含む請求項19
に記載のエンコーダ。 - 【請求項26】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項23に記載のエンコーダ。 - 【請求項27】 前記フィルタは前記ピッチコードブック探索装置の補間フ
ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
サブサンプル変型を生成するために使用される請求項19に記載のエンコーダ。 - 【請求項28】 複数のセルに分割されている広い地理的区域に通信サービ
スを提供するセルラー通信システムであって、 a)移動送信機/受信機ユニットと、 b)それぞれに前記セル内に配置されているセルラー基地局と、 c)前記セルラー基地局間の通信を制御する制御端末装置と、 d)1つのセル内に位置した各移動ユニットと前記1つのセルの前記セルラー
基地局との間の双方向無線通信サブシステムであって、前記移動ユニットと前記
セルラー基地局との両方において、 i)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化
された広帯域信号を送信する送信回路とを含む送信機と、 ii)前記送信された符号化広帯域信号を受信する受信回路と、前記受信さ
れた符号化広帯域信号を復号するデコーダとを含む受信機 とを含む双方向無線通信サブシステム とを含むセルラー通信システム。 - 【請求項29】 前記少なくとも2つの信号経路のうちの1つの信号経路は
、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを含まない請求項28に記
載のセルラー通信システム。 - 【請求項30】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項28に
記載のセルラー通信システム。 - 【請求項31】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
った周波数応答を有する請求項30に記載のセルラー通信システム。 - 【請求項32】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項28に記載のセルラー通信システム。 - 【請求項33】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
チゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項32に記載のセルラー通信システム。 - 【請求項34】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピ
ッチ予測誤差を有する前記信号経路として選択するための手段を含む請求項28
に記載のセルラー通信システム。 - 【請求項35】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項32に記載のセルラー通信システム。 - 【請求項36】 前記フィルタは前記ピッチコードブック探索装置の補間フ
ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
サブサンプル変型を生成するために使用される請求項28に記載のセルラー通信
システム。 - 【請求項37】 セルラー移動送信機/受信機ユニットであって、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
符号化広帯域信号を復号するデコーダとを含む受信機 とを含むセルラー移動送信機/受信機ユニット。 - 【請求項38】 前記少なくとも2つの信号経路のうちの1つの信号経路は
、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを含まない請求項37に記
載のセルラー移動送信機/受信機ユニット。 - 【請求項39】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項37に
記載のセルラー移動送信機/受信機ユニット。 - 【請求項40】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
った周波数応答を有する請求項39に記載のセルラー移動送信機/受信機ユニッ
ト。 - 【請求項41】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタのインパル
ス応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトル
を計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項37に記載のセルラー移動送信機/受信機ユニット。 - 【請求項42】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
チゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項41に記載のセルラー移動送信機/受信機ユニット。 - 【請求項43】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を最小の計算ピッ
チ予測誤差を有する前記信号経路として選択するための手段を含む請求項37に
記載のセルラー移動送信機/受信機ユニット。 - 【請求項44】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項41に記載のセルラー移動送信機/受信機ユニット。 - 【請求項45】 前記フィルタは前記ピッチコードブック探索装置の補間フ
ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
サブサンプル変型を生成するために使用される請求項37に記載のセルラー移動
送信機/受信機ユニット。 - 【請求項46】 セルラーネットワーク要素であって、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
符号化広帯域信号を復号するデコーダとを含む受信機 とを含むセルラーネットワーク要素。 - 【請求項47】 前記少なくとも2つの信号経路のうちの1つの信号経路は
、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを含まない請求項46に記
載のセルラーネットワーク要素。 - 【請求項48】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項46に
記載のセルラーネットワーク要素。 - 【請求項49】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
った周波数応答を有する請求項48に記載のセルラーネットワーク要素。 - 【請求項50】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項46に記載のセルラーネットワーク要素。 - 【請求項51】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
チゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである 請求項50に記載のセルラーネットワーク要素。 - 【請求項52】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
経路の前記ピッチ予測誤差のエネルギーを比較するための、および、前記ピッチ
予想誤差の最小の計算エネルギーを有する前記信号経路を最小の計算ピッチ予測
誤差を有する前記信号経路として選択するための手段を含む請求項46に記載の
セルラーネットワーク要素。 - 【請求項53】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項50に記載のセルラーネットワーク要素。 - 【請求項54】 前記フィルタは前記ピッチコードブック探索装置の補間フ
ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
サブサンプル変型を生成するために使用される請求項46に記載のセルラーネッ
トワーク要素。 - 【請求項55】 移動送信機/受信機ユニットと、それぞれにセル内に位置
したセルラー基地局と、前記セルラー基地局間の通信を制御する制御端末装置と
を含む、複数のセルに分割されている広い地理的区域に通信サービスを提供する
セルラー通信システムにおける、 1つのセル内に位置した各移動ユニットと前記1つのセルの前記セルラー基地
局との間の双方向無線通信サブシステムであって、前記移動ユニットと前記セル
ラー基地局の両方において、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
符号化広帯域信号を復号するデコーダとを含む受信機 とを含む双方向無線通信サブシステム。 - 【請求項56】 前記少なくとも2つの信号経路のうちの1つの信号経路は
、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを含まない請求項55に記
載の双方向無線通信サブシステム。 - 【請求項57】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項55に
記載の双方向無線通信サブシステム。 - 【請求項58】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
った周波数応答を有する請求項57に記載の双方向無線通信サブシステム。 - 【請求項59】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項55に記載の双方向無線通信サブシステム。 - 【請求項60】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
チゲインb(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
み込みピッチコードベクトルである請求項59に記載の双方向無線通信サブシス
テム。 - 【請求項61】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
経路の前記ピッチ予測誤差のエネルギーを比較するための、および、前記ピッチ
予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピッチ予
測誤差を有する前記信号経路として選択するための手段を含む請求項55に記載
の双方向無線通信サブシステム。 - 【請求項62】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
ドブック索引と前記ピッチゲインとを含む 請求項59に記載の双方向無線通信サブシステム。 - 【請求項63】 前記フィルタは前記ピッチコードブック探索装置の補間フ
ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
サブサンプル変型を生成するために使用される請求項55に記載の双方向無線通
信サブシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002252170A CA2252170A1 (en) | 1998-10-27 | 1998-10-27 | A method and device for high quality coding of wideband speech and audio signals |
CA2,252,170 | 1998-10-27 | ||
PCT/CA1999/001008 WO2000025298A1 (en) | 1998-10-27 | 1999-10-27 | A method and device for adaptive bandwidth pitch search in coding wideband signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002528775A true JP2002528775A (ja) | 2002-09-03 |
JP3490685B2 JP3490685B2 (ja) | 2004-01-26 |
Family
ID=4162966
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000578808A Expired - Lifetime JP3490685B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 |
JP2000578812A Expired - Lifetime JP3936139B2 (ja) | 1998-10-27 | 1999-10-27 | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 |
JP2000578811A Expired - Lifetime JP3566652B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 |
JP2000578810A Expired - Lifetime JP3869211B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の復号における周期性の強調 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000578812A Expired - Lifetime JP3936139B2 (ja) | 1998-10-27 | 1999-10-27 | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 |
JP2000578811A Expired - Lifetime JP3566652B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 |
JP2000578810A Expired - Lifetime JP3869211B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の復号における周期性の強調 |
Country Status (20)
Country | Link |
---|---|
US (8) | US6795805B1 (ja) |
EP (4) | EP1125276B1 (ja) |
JP (4) | JP3490685B2 (ja) |
KR (3) | KR100417634B1 (ja) |
CN (4) | CN1127055C (ja) |
AT (4) | ATE246389T1 (ja) |
AU (4) | AU763471B2 (ja) |
BR (2) | BR9914889B1 (ja) |
CA (5) | CA2252170A1 (ja) |
DE (4) | DE69910058T2 (ja) |
DK (4) | DK1125276T3 (ja) |
ES (4) | ES2205891T3 (ja) |
HK (1) | HK1043234B (ja) |
MX (2) | MXPA01004181A (ja) |
NO (4) | NO318627B1 (ja) |
NZ (1) | NZ511163A (ja) |
PT (4) | PT1125285E (ja) |
RU (2) | RU2217718C2 (ja) |
WO (4) | WO2000025304A1 (ja) |
ZA (2) | ZA200103366B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218360A (ja) * | 2003-12-19 | 2013-10-24 | Motorola Mobility Inc | 音声符号化のための方法と装置 |
Families Citing this family (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6704701B1 (en) * | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
EP1796083B1 (en) * | 2000-04-24 | 2009-01-07 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
US7010480B2 (en) * | 2000-09-15 | 2006-03-07 | Mindspeed Technologies, Inc. | Controlling a weighting filter based on the spectral content of a speech signal |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
KR100393899B1 (ko) * | 2001-07-27 | 2003-08-09 | 어뮤즈텍(주) | 2-단계 피치 판단 방법 및 장치 |
US7680665B2 (en) * | 2001-08-24 | 2010-03-16 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal adaptively |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
US8463334B2 (en) * | 2002-03-13 | 2013-06-11 | Qualcomm Incorporated | Apparatus and system for providing wideband voice quality in a wireless telephone |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2392640A1 (en) | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
CN100531259C (zh) * | 2002-12-27 | 2009-08-19 | 冲电气工业株式会社 | 语音通信设备 |
US7039222B2 (en) * | 2003-02-28 | 2006-05-02 | Eastman Kodak Company | Method and system for enhancing portrait images that are processed in a batch mode |
US6947449B2 (en) * | 2003-06-20 | 2005-09-20 | Nokia Corporation | Apparatus, and associated method, for communication system exhibiting time-varying communication conditions |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
BRPI0414444B1 (pt) * | 2003-09-16 | 2020-05-05 | Matsushita Electric Ind Co Ltd | aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN1954363B (zh) * | 2004-05-19 | 2011-10-12 | 松下电器产业株式会社 | 编码装置和编码方法 |
US8024181B2 (en) * | 2004-09-06 | 2011-09-20 | Panasonic Corporation | Scalable encoding device and scalable encoding method |
DE102005000828A1 (de) * | 2005-01-05 | 2006-07-13 | Siemens Ag | Verfahren zum Codieren eines analogen Signals |
CN102592604A (zh) * | 2005-01-14 | 2012-07-18 | 松下电器产业株式会社 | 可扩展性解码装置及可扩展性解码方法 |
CN100592389C (zh) * | 2008-01-18 | 2010-02-24 | 华为技术有限公司 | 合成滤波器状态更新方法及装置 |
DE602006019723D1 (de) * | 2005-06-08 | 2011-03-03 | Panasonic Corp | Vorrichtung und verfahren zur verbreiterung eines audiosignalbands |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
FR2889017A1 (fr) * | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US8417185B2 (en) | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
DK1869669T3 (da) * | 2006-04-24 | 2008-12-01 | Nero Ag | Avanceret audiokodningsapparat |
EP2038884A2 (en) * | 2006-06-29 | 2009-03-25 | Nxp B.V. | Noise synthesis |
US8358987B2 (en) * | 2006-09-28 | 2013-01-22 | Mediatek Inc. | Re-quantization in downlink receiver bit rate processor |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
CN101192410B (zh) * | 2006-12-01 | 2010-05-19 | 华为技术有限公司 | 一种在编解码中调整量化质量的方法和装置 |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
WO2008114075A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | An encoder |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101369064B1 (ko) * | 2007-07-27 | 2014-02-28 | 파나소닉 주식회사 | 음성 부호화 장치 및 음성 부호화 방법 |
TWI346465B (en) * | 2007-09-04 | 2011-08-01 | Univ Nat Central | Configurable common filterbank processor applicable for various audio video standards and processing method thereof |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8300849B2 (en) * | 2007-11-06 | 2012-10-30 | Microsoft Corporation | Perceptually weighted digital audio level compression |
JP5326311B2 (ja) * | 2008-03-19 | 2013-10-30 | 沖電気工業株式会社 | 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置 |
CA2699316C (en) * | 2008-07-11 | 2014-03-18 | Max Neuendorf | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
KR20100057307A (ko) * | 2008-11-21 | 2010-05-31 | 삼성전자주식회사 | 노래점수 평가방법 및 이를 이용한 가라오케 장치 |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101770778B (zh) * | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 一种预加重滤波器、感知加权滤波方法及系统 |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
BRPI1008484A2 (pt) * | 2009-02-26 | 2018-01-16 | Panasonic Corp | codificador, decodificador e método para os mesmos |
US20110301946A1 (en) * | 2009-02-27 | 2011-12-08 | Panasonic Corporation | Tone determination device and tone determination method |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
WO2011048810A1 (ja) * | 2009-10-20 | 2011-04-28 | パナソニック株式会社 | ベクトル量子化装置及びベクトル量子化方法 |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
US9812141B2 (en) | 2010-01-08 | 2017-11-07 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
CN101854236B (zh) | 2010-04-05 | 2015-04-01 | 中兴通讯股份有限公司 | 一种信道信息反馈方法和系统 |
DK2559028T3 (en) * | 2010-04-14 | 2015-11-09 | Voiceage Corp | FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder |
JP5749136B2 (ja) | 2011-10-21 | 2015-07-15 | 矢崎総業株式会社 | 端子圧着電線 |
KR102138320B1 (ko) | 2011-10-28 | 2020-08-11 | 한국전자통신연구원 | 통신 시스템에서 신호 코덱 장치 및 방법 |
CN105761724B (zh) * | 2012-03-01 | 2021-02-09 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN105469805B (zh) | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CA2899059C (en) * | 2013-01-29 | 2018-05-15 | Guillaume Fuchs | Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
BR112016008662B1 (pt) * | 2013-10-18 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala |
MX355258B (es) | 2013-10-18 | 2018-04-11 | Fraunhofer Ges Forschung | Concepto para codificar una señal de audio y decodificar una señal de audio usando información determinista y de tipo ruido. |
WO2015079946A1 (ja) * | 2013-11-29 | 2015-06-04 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
KR102251833B1 (ko) * | 2013-12-16 | 2021-05-13 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN105336339B (zh) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
CN105047201A (zh) * | 2015-06-15 | 2015-11-11 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于分段扩展的宽带激励信号合成方法 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
CN106601267B (zh) * | 2016-11-30 | 2019-12-06 | 武汉船舶通信研究所 | 一种基于超短波fm调制的语音增强方法 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
CN113324546B (zh) * | 2021-05-24 | 2022-12-13 | 哈尔滨工程大学 | 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法 |
US20230318881A1 (en) * | 2022-04-05 | 2023-10-05 | Qualcomm Incorporated | Beam selection using oversampled beamforming codebooks and channel estimates |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8500843A (nl) | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
JPH0738118B2 (ja) * | 1987-02-04 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
EP0331858B1 (en) | 1988-03-08 | 1993-08-25 | International Business Machines Corporation | Multi-rate voice encoding method and device |
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
JP2621376B2 (ja) | 1988-06-30 | 1997-06-18 | 日本電気株式会社 | マルチパルス符号化装置 |
JP2900431B2 (ja) | 1989-09-29 | 1999-06-02 | 日本電気株式会社 | 音声信号符号化装置 |
JPH03123113A (ja) | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US6134373A (en) * | 1990-08-17 | 2000-10-17 | Samsung Electronics Co., Ltd. | System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium |
US5113262A (en) * | 1990-08-17 | 1992-05-12 | Samsung Electronics Co., Ltd. | Video signal recording system enabling limited bandwidth recording and playback |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
US5392284A (en) * | 1990-09-20 | 1995-02-21 | Canon Kabushiki Kaisha | Multi-media communication device |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
JP3089769B2 (ja) | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
GB9218864D0 (en) * | 1992-09-05 | 1992-10-21 | Philips Electronics Uk Ltd | A method of,and system for,transmitting data over a communications channel |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
IT1257431B (it) | 1992-12-04 | 1996-01-16 | Sip | Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
DE4343366C2 (de) * | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5956624A (en) * | 1994-07-12 | 1999-09-21 | Usa Digital Radio Partners Lp | Method and system for simultaneously broadcasting and receiving digital and analog signals |
JP3483958B2 (ja) | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
FR2729247A1 (fr) | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
AU696092B2 (en) | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
US5819213A (en) * | 1996-01-31 | 1998-10-06 | Kabushiki Kaisha Toshiba | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP3063668B2 (ja) | 1997-04-04 | 2000-07-12 | 日本電気株式会社 | 音声符号化装置及び復号装置 |
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
-
1998
- 1998-10-27 CA CA002252170A patent/CA2252170A1/en not_active Abandoned
-
1999
- 1999-10-27 AT AT99952200T patent/ATE246389T1/de active
- 1999-10-27 JP JP2000578808A patent/JP3490685B2/ja not_active Expired - Lifetime
- 1999-10-27 DE DE69910058T patent/DE69910058T2/de not_active Expired - Lifetime
- 1999-10-27 JP JP2000578812A patent/JP3936139B2/ja not_active Expired - Lifetime
- 1999-10-27 ES ES99952199T patent/ES2205891T3/es not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914889-7B1A patent/BR9914889B1/pt not_active IP Right Cessation
- 1999-10-27 DK DK99952199T patent/DK1125276T3/da active
- 1999-10-27 PT PT99952200T patent/PT1125285E/pt unknown
- 1999-10-27 CN CN99813602A patent/CN1127055C/zh not_active Expired - Lifetime
- 1999-10-27 AU AU64569/99A patent/AU763471B2/en not_active Expired
- 1999-10-27 EP EP99952199A patent/EP1125276B1/en not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001010 patent/WO2000025304A1/en active IP Right Grant
- 1999-10-27 DE DE69913724T patent/DE69913724T2/de not_active Expired - Lifetime
- 1999-10-27 RU RU2001114193/09A patent/RU2217718C2/ru active
- 1999-10-27 CA CA002347667A patent/CA2347667C/en not_active Expired - Lifetime
- 1999-10-27 CN CNB998136018A patent/CN1172292C/zh not_active Expired - Lifetime
- 1999-10-27 KR KR10-2001-7005325A patent/KR100417634B1/ko active IP Right Grant
- 1999-10-27 AU AU64570/99A patent/AU6457099A/en not_active Abandoned
- 1999-10-27 ES ES99952201T patent/ES2212642T3/es not_active Expired - Lifetime
- 1999-10-27 AU AU64571/99A patent/AU752229B2/en not_active Expired
- 1999-10-27 AT AT99952183T patent/ATE246836T1/de active
- 1999-10-27 DE DE69910240T patent/DE69910240T2/de not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914890-0B1A patent/BR9914890B1/pt not_active IP Right Cessation
- 1999-10-27 NZ NZ511163A patent/NZ511163A/en not_active IP Right Cessation
- 1999-10-27 MX MXPA01004181A patent/MXPA01004181A/es active IP Right Grant
- 1999-10-27 PT PT99952201T patent/PT1125286E/pt unknown
- 1999-10-27 CN CNB998136417A patent/CN1165892C/zh not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001008 patent/WO2000025298A1/en active IP Right Grant
- 1999-10-27 EP EP99952183A patent/EP1125284B1/en not_active Expired - Lifetime
- 1999-10-27 AT AT99952199T patent/ATE246834T1/de active
- 1999-10-27 AU AU64555/99A patent/AU6455599A/en not_active Abandoned
- 1999-10-27 AT AT99952201T patent/ATE256910T1/de active
- 1999-10-27 WO PCT/CA1999/001009 patent/WO2000025303A1/en active IP Right Grant
- 1999-10-27 ES ES99952183T patent/ES2207968T3/es not_active Expired - Lifetime
- 1999-10-27 US US09/830,331 patent/US6795805B1/en not_active Expired - Lifetime
- 1999-10-27 CA CA002347743A patent/CA2347743C/en not_active Expired - Lifetime
- 1999-10-27 PT PT99952199T patent/PT1125276E/pt unknown
- 1999-10-27 DK DK99952183T patent/DK1125284T3/da active
- 1999-10-27 JP JP2000578811A patent/JP3566652B2/ja not_active Expired - Lifetime
- 1999-10-27 RU RU2001114194/09A patent/RU2219507C2/ru active
- 1999-10-27 CN CNB998136409A patent/CN1165891C/zh not_active Expired - Lifetime
- 1999-10-27 CA CA002347668A patent/CA2347668C/en not_active Expired - Lifetime
- 1999-10-27 PT PT99952183T patent/PT1125284E/pt unknown
- 1999-10-27 US US09/830,114 patent/US7260521B1/en not_active Expired - Lifetime
- 1999-10-27 US US09/830,332 patent/US7151802B1/en not_active Expired - Lifetime
- 1999-10-27 DK DK99952200T patent/DK1125285T3/da active
- 1999-10-27 EP EP99952200A patent/EP1125285B1/en not_active Expired - Lifetime
- 1999-10-27 KR KR10-2001-7005326A patent/KR100417635B1/ko active IP Right Grant
- 1999-10-27 KR KR10-2001-7005324A patent/KR100417836B1/ko active IP Right Grant
- 1999-10-27 JP JP2000578810A patent/JP3869211B2/ja not_active Expired - Lifetime
- 1999-10-27 CA CA002347735A patent/CA2347735C/en not_active Expired - Lifetime
- 1999-10-27 EP EP99952201A patent/EP1125286B1/en not_active Expired - Lifetime
- 1999-10-27 DE DE69910239T patent/DE69910239T2/de not_active Expired - Lifetime
- 1999-10-27 US US09/830,276 patent/US6807524B1/en not_active Expired - Lifetime
- 1999-10-27 MX MXPA01004137A patent/MXPA01004137A/es active IP Right Grant
- 1999-10-27 WO PCT/CA1999/000990 patent/WO2000025305A1/en active IP Right Grant
- 1999-10-27 ES ES99952200T patent/ES2205892T3/es not_active Expired - Lifetime
- 1999-10-27 DK DK99952201T patent/DK1125286T3/da active
-
2001
- 2001-04-25 ZA ZA200103366A patent/ZA200103366B/en unknown
- 2001-04-25 ZA ZA200103367A patent/ZA200103367B/en unknown
- 2001-04-26 NO NO20012067A patent/NO318627B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012068A patent/NO317603B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012066A patent/NO319181B1/no not_active IP Right Cessation
-
2002
- 2002-06-20 HK HK02104592.2A patent/HK1043234B/zh not_active IP Right Cessation
-
2004
- 2004-10-15 US US10/964,752 patent/US20050108005A1/en not_active Abandoned
- 2004-10-18 US US10/965,795 patent/US20050108007A1/en not_active Abandoned
- 2004-12-01 NO NO20045257A patent/NO20045257L/no unknown
-
2006
- 2006-08-04 US US11/498,771 patent/US7672837B2/en not_active Expired - Fee Related
-
2009
- 2009-11-17 US US12/620,394 patent/US8036885B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218360A (ja) * | 2003-12-19 | 2013-10-24 | Motorola Mobility Inc | 音声符号化のための方法と装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
R150 | Certificate of patent or registration of utility model |
Ref document number: 3490685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071107 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101107 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131107 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |