JP2002528775A - 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 - Google Patents

広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置

Info

Publication number
JP2002528775A
JP2002528775A JP2000578808A JP2000578808A JP2002528775A JP 2002528775 A JP2002528775 A JP 2002528775A JP 2000578808 A JP2000578808 A JP 2000578808A JP 2000578808 A JP2000578808 A JP 2000578808A JP 2002528775 A JP2002528775 A JP 2002528775A
Authority
JP
Japan
Prior art keywords
pitch
code vector
prediction error
signal
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000578808A
Other languages
English (en)
Other versions
JP3490685B2 (ja
Inventor
ベセット,ブルーノ
サラミ,レッドワン
レフェブル,ロシュ
Original Assignee
ボイスエイジ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4162966&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2002528775(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ボイスエイジ コーポレイション filed Critical ボイスエイジ コーポレイション
Publication of JP2002528775A publication Critical patent/JP2002528775A/ja
Application granted granted Critical
Publication of JP3490685B2 publication Critical patent/JP3490685B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Error Detection And Correction (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Dc Digital Transmission (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Networks Using Active Elements (AREA)
  • Television Systems (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Optical Communication System (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Image Processing (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Package Frames And Binding Bands (AREA)
  • Installation Of Indoor Wiring (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Inorganic Insulating Materials (AREA)
  • Parts Printed On Printed Circuit Boards (AREA)
  • Coils Or Transformers For Communication (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

(57)【要約】 広帯域信号、特に、しかしそれに限定されるものではないが音声信号を、この広帯域音響信号の送信または記憶および合成のためにディジタル符号化するための改良された方法および装置。音声スペクトルの高調波構造の効率的なモデル化を行うこの新たな方法と装置は、ピッチコードベクトルに適用される幾つかの形のローパスフィルタを使用し、より高い予測ゲイン(すなわち、最小のピッチ予測誤差)を得るローパスフィルタが選択され、それに関連したピッチコードブックパラメータが送出される。

Description

【発明の詳細な説明】
【0001】 発明の背景 1. 発明の分野 本発明は、広帯域信号、特に、しかしそれに限定されるものではないが音声信
号を、この広帯域音響信号の送信または記憶および合成のためにディジタル符号
化するための効率的な方法に関する。さらに特に、本発明は、改良されたピッチ
探索装置および方法に関する。 2. 従来技術の簡単な説明 例えば音声/映像電子会議システム、マルチメディア、ワイヤレスアプリケー
ション、並びに、インターネットおよびパケットネットワークアプリケーション
のような様々な用途において、主観的品質/ビットレートの良好なトレードオフ
を有する効率的なディジタル広帯域音声/オーディオ符号化技術に対する要求が
ますます高まっている。最近になるまで、主として200−3400Hz帯域内
のフィルタリングされた電話帯域幅が音声符号化アプリケーションで使用されて
いた。しかし、音声信号の了解性と自然さを向上させるために、広帯域音声アプ
リケーションに対する要求がますます高まっている。50−7000Hz帯域の
帯域幅が、対面音声品質を実現するのに十分であることが発見された。オーディ
オ信号に関しては、この帯域は許容可能なオーディオ品質をもたらすが、この品
質は20−20000Hz帯域を使用するCD品質よりは依然として低い。
【0002】 音声エンコーダが音声信号をディジタルビットストリームに変換し、このディ
ジタルビットストリームが通信チャネルを経由して伝送される(または、記憶媒
体内に記憶される)。音声信号はディジタル化され(すなわち、通常は16ビッ
トサンプリングによって量子化され)、音声エンコーダは、より少ないビット数
でこれらのディジタルサンプルを表現すると同時に良好な主観的音声品質を維持
するという役割を有する。この音声デコーダ或いはシンセサイザは、伝送または
記憶されたビットストリームに演算を施し、このビットストリームを変換して音
声信号に戻す。
【0003】 優れた品質/ビットレートのトレードオフを実現することが可能な最良の従来
技術の1つが、いわゆる符号励起線形予測(CELP)方式である。この方式で
は、サンプリングされた音声信号を、一般にフレームと呼ばれる、1個のブロッ
クがL個のサンプルから成る連続したブロックの形で処理し、ここでLは(10
−30ミリ秒の音声に対応する)何らかの予め決められた数である。CELPで
は、各フレーム毎に線形予測(LP)合成フィルタを計算して伝送する。その次
に、L個のサンプルから成るフレームを、N個のサンプルから成るサブフレーム
と呼ばれるより小さいブロックに分割し、ここではL=kNでありかつkは1フ
レーム内のサブフレームの個数である(Nは一般に4−10ミリ秒の音声に対応
する)。励起信号を各サブフレーム内で求め、この励起信号は、一般に、2つの
成分、すなわち、直前の励起(ピッチ寄与(pitch contributi
on)または適応コードブックとも呼ばれる)からの一方の成分と、イノベーテ
ィブコードブック(innovative codebook)(固定コードブ
ックとも呼ばれる)からの他方の成分とから成る。この励起信号が伝送され、合
成音声を得るためにLP合成フィルタの入力としてデコーダで使用される。
【0004】 CELPにおけるイノベーティブコードブックは、N次元のコードベクトルと
呼ばれるサンプルN個分の長さのシーケンスの索引付きセットである。各々のコ
ードブックシーケンスは、1からMの範囲内の整数kによる索引を付けられ、こ
こでMはビット数bとして表現されることが多いコードブックのサイズを表し、
ここでM=2bである。
【0005】 CELP方式によって音声を合成するためには、コードブックからの適切なコ
ードベクトルを音声信号のスペクトル特徴をモデル化する時変フィルタに通して
フィルタリングすることによって、N個のサンプルから成るブロックの各々を合
成する。エンコーダ側では、コードブックからのコードベクトルの全てまたはそ
のサブセットに関して合成出力を計算する(コードブック探索)。こうして得ら
れたコードベクトルは、聴覚的に重み付けされた歪み測度にしたがってオリジナ
ルの音声信号に最も近い合成出力を生成するコードベクトルである。この聴覚重
み付けを、いわゆる聴覚重み付けフィルタを使用して行い、この聴覚重み付けフ
ィルタは一般的にLP合成フィルタから得られる。
【0006】 CELPモデルは電話帯域の音声信号の符号化に非常に有効であり、CELP
を基礎とする幾つかの規格が、広範囲のアプリケーション、特にディジタル移動
電話アプリケーションにおいて存在している。電話帯域では、音声信号は200
−3400Hzに帯域制限され、8000サンプル/秒でサンプリングされる。
広帯域音声/オーディオアプリケーションでは、音声信号は50−7000Hz
に帯域制限され、16000サンプル/秒でサンプリングされる。
【0007】 電話帯域に最適化されたCELPモデルを広帯域信号に適用する時には幾つか
の問題が生じ、高品質の広帯域信号を得るためにはこのモデルに追加の特徴を加
えることが必要である。広帯域信号は、電話帯域信号に比較してはるかに広いダ
イナミックレンジを示し、このことが、(ワイヤレスアプリケーションでは必須
である)このアルゴリズムの固定小数点処理系が必要とされる時に、精度上の問
題を生じさせる。さらに、CELPモデルは、通常はより高いエネルギー成分を
有する低周波数領域にその符号化ビットの大半を費やすことが多く、この結果と
してローパスの出力信号が生じる。この問題を克服するために、聴覚重み付けフ
ィルタを広帯域信号に適合するように改変しなければならず、かつ、高周波数領
域を強調するプリエンファシス方式が、ダイナミックレンジを低減させてより単
純な固定小数点処理系を実現するために、および、信号のより高い周波数の成分
をより適切に符号化することを確実にするために重要になる。さらに、広帯域信
号中の有声音セグメントのスペクトルのピッチ成分はスペクトル全体にわたらず
、有声音の量は狭帯域信号に比較して、より狭いばらつきを見せる。したがって
、広帯域信号の場合には、既存のピッチ探索構造はあまり効率的ではない。した
がって、有声音レベルのばらつきによりうまく対応するように、閉ループピッチ
分析を改良することが重要である。 発明の目的 したがって、本発明の目的は、高音質の再生音響信号を得るために改良された
ピッチ分析を使用する、CELPタイプの符号化技術を使用して広帯域(700
0Hz)の音響信号を効率的に符号化する方法および装置を提供することである
。 発明の概要 さらに明確に述べると、本発明によって、少なくとも2つの信号経路から、最
小の計算ピッチ予測誤差を有する信号経路に関連しているピッチコードブックパ
ラメータの最適なセットを選択する方法が提供される。ピッチ予測誤差は、ピッ
チコードブック探索装置からのピッチコードベクトルに応答して計算される。2
つの信号経路のうちの少なくとも1つの信号経路では、その1つの信号経路のピ
ッチ予測誤差の計算のためにピッチコードベクトルを供給する前に、ピッチ予測
誤差がフィルタリングされる。最後に、少なくとも2つの信号経路で計算された
ピッチ予測誤差が互いに比較され、最小の計算ピッチ予測誤差を有する信号経路
が選択され、この選択された信号経路に関連しているピッチコードブックパラメ
ータのセットが選択される。
【0008】 ピッチコードブックパラメータの最適なセットを生成するための本発明のピッ
チ分析装置は、 a)ピッチコードブックパラメータのそれぞれのセットに関連している少なく
とも2つの信号経路であって、 i)各信号経路は、ピッチコードブック探索装置からのピッチコードベク
トルのピッチ予測誤差を計算するピッチ予測誤差計算装置を含み、 ii)2つの信号経路のうちの少なくとも1つの信号経路は、ピッチコー
ドベクトルをその経路のピッチ予測誤差計算装置に供給する前にピッチコードベ
クトルをフィルタリングするフィルタを含む 信号経路と、 b)信号経路において計算されたピッチ予測誤差を互いに比較し、最小の計算
ピッチ予測誤差を有する信号経路を選択し、その選択された信号経路に関連して
いるピッチコードブックパラメータのセットを選択するセレクタ とを含む。
【0009】 音声スペクトルの高調波構造の効率的なモデル化を行うこの新たな方法および
装置は、直前の励起に適用される幾つかの形のローパスフィルタを使用し、より
高い予測ゲインを生じさせるローパスフィルタが選択される。サブサンプルピッ
チ分解能が使用される時には、これらのローパスフィルタは、より高いピッチ分
解能を得るために使用される補間フィルタの中に組み込まれることが可能である
【0010】 本発明の好ましい実施様態では、上述のピッチ分析装置のピッチ予測誤差計算
装置の各々が、 a)ピッチコードベクトルを重み付けされた合成フィルタインパルス応答信号
と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算する
畳み込みユニットと、 b)畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトルとに
応答してピッチゲインを計算するピッチゲイン計算器と、 c)畳み込まれたピッチコードベクトルにピッチゲインを乗算して、増幅され
た畳み込みピッチコードベクトルを生成する増幅器と、 d)増幅された畳み込みピッチコードベクトルをピッチ探索ターゲットベクト
ルと組み合わせてピッチ予測誤差を生成するコンバイナー回路 とを含む。
【0011】 本発明の別の好ましい実施態様では、ピッチゲイン計算器は、次の関係を使用
してピッチゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxはピッチ探索ターゲットベクトルであり、y(j)は畳み込みピ
ッチコードベクトルである。
【0012】 さらに、本発明は、上述のピッチ分析装置を有する、広帯域入力信号を符号化
するためのエンコーダにも関し、このエンコーダは、 a)広帯域信号に応答して線形予測合成フィルタ係数を生成する線形予測合成
フィルタ計算器と、 b)広帯域信号と線形予測合成フィルタ係数とに応答して、聴覚的に重み付け
された信号を生成する聴覚重み付けフィルタと、 c)線形予測合成フィルタ係数に応答して、重み付けされた合成フィルタイン
パルス応答信号を生成するインパルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探索ユニットであって、 i)聴覚重み付けされた信号と線形予測合成フィルタ係数とに応答して、
ピッチコードベクトルとイノベーティブ探索ターゲットベクトルとを生成するピ
ッチコードブック探索装置と、 ii)ピッチコードベクトルに応答して、ピッチコードブックパラメータ
のセットから、最小の計算ピッチ予測誤差を有する経路に関連しているピッチコ
ードブックパラメータのセットを選択するピッチ分析装置 とを含むピッチ探索ユニットと、 d)重み付けされた合成フィルタインパルス応答信号とイノベーティブ探索タ
ーゲットベクトルとに応答して、イノベーティブコードブックパラメータを生成
するイノベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する経路に関連しているピッチコードブックパ
ラメータのセットと、イノベーティブコードブックパラメータと、線形予測合成
フィルタ係数とを含む、符号化された広帯域信号を生成する信号形成装置 とを含む。
【0013】 さらに、本発明は、上述のデコーダを含む、セルラー通信システムと、セルラ
ー移動送信機/受信機ユニットと、セルラーネットワーク要素と、双方向無線通
信サブシステムとに関する。 本発明の単なる例示を行う下記の本発明の好ましい実施形態の非限定的な説明
を添付図面を参照しながら理解することによって、本発明の目的と利点と他の特
徴とがより明確になるだろう。 好ましい実施形態の詳細な説明 当業者に周知であるように、401(図4を参照されたい)のようなセルラー
通信システムが、広い地理的区域をC個のより小さいセルに分割することによっ
てその広い地理的区域全体にわたって通信サービスを提供する。C個の小さいセ
ルは、その各セルに無線信号チャネルとオーディオチャネルとデータチャネルと
を提供するべつべつのセルラー基地局4021、4022、...、402Cによ
って通信サービスを提供される。
【0014】 無線信号チャネルは、セルラー基地局402のサービスエリア(セル)の限界
内の403のような移動無線電話(移動送信機/受信機ユニット)の呼出と、基
地局のセルの内側もしくは外側に位置する他の無線電話403に対して、または
、公衆交換電話網(PSTN)404のような別のネットワークに対して呼出を
行うために使用される。
【0015】 無線電話403が呼出を行うことに成功するかまたは呼出を受信することに成
功すると、オーディオチャネルまたはデータチャネルが、この無線電話403と
、この無線電話403が中に位置しているセルに対応するセルラー基地局402
との間に確立され、基地局402と無線電話403との間の通信がオーディオチ
ャネルまたはデータチャネルを通して行われる。さらに、無線電話403は、通
話が進行している最中に無線信号チャネルを通して制御情報またはタイミング情
報を受信することもできる。
【0016】 通話が進行している最中に無線電話403がセルの外に出て別の隣接セルの中
に入る場合には、無線電話403は、その新たなセル基地局402の使用可能な
オーディオまたはデータチャネルに通話をハンドオーバーする。通話が進行して
いない時に無線電話403がセルの外に出て別の隣接セルの中に入る場合には、
無線電話403は、新たなセルの基地局402にログインするために無線信号送
信チャネルを通して制御メッセージを送る。このようにして、広い地理的区域全
体にわたっての移動通信が可能である。
【0017】 さらに、セルラー通信システム401は、例えば無線電話403とPSTN
404との間の通信、または、第1のセル内に位置した無線電話403と第2の
セル内に位置した無線電話403との間の通信の最中に、セルラー基地局402
とPSTN 404との間の通信を制御するための制御端末装置405を含む。 もちろん、1つのセルの基地局402とそのセル内に位置した無線電話403
との間にオーディオチャネルまたはデータチャネルを確立するためには、双方向
無線通信サブシステムが必要である。図4に非常に単純化して示しているように
、こうした双方向無線通信サブシステムは、一般に、無線電話403内に、 音声信号を符号化するエンコーダ407と、エンコーダ407からの符号化音
声信号を409のようなアンテナを通して送信する送信回路408とを含む送信
機406と、 一般には同一のアンテナ409を通して、送信された符号化音声信号を受信す
る受信回路411と、受信回路411からの受信した符号化音声信号を復号する
デコーダ412とを含む受信機410 とを含む。
【0018】 さらに、無線電話は、エンコーダ407とデコーダ412とが接続されており
かつこれらからの信号を処理するための他の従来通りの無線電話回路413も含
み、この回路413は当業者に公知であり、したがって本明細書ではさらに詳細
には説明しない。 さらに、こうした双方向無線通信サブシステムは、一般に、その基地局402
内に、 音声信号を符号化するエンコーダ415と、エンコーダ415からの符号化音
声信号を417のようなアンテナを通して送信する送信回路416とを含む送信
機414と、 同一のアンテナ409または別のアンテナ(図示していない)を通して、送信
された符号化音声信号を受信する受信回路419と、受信回路419からの受信
した符号化音声信号を復号するデコーダ420とを含む受信機418 とを含む。
【0019】 さらに、基地局402は、一般に、制御端末装置405と送信機414と受信
機418の間の通信を制御するための、基地局制御装置421とこれに関連した
データベース422とを含む。 当業者には周知であるように、双方向無線通信サブシステムにおいて、すなわ
ち、無線電話403と基地局402との間で、例えば音声といった有声音信号の
ような音響信号を送信するのに必要な帯域幅を縮小するために、音声符号化が必
要とされている。
【0020】 符号励起線形予測(CELP)エンコーダのように一般に13キロビット/秒
以下で動作する(415および407のような)LPボイスエンコーダは、音声
信号の短期スペクトル包絡線をモデル化するためにLP合成フィルタを使用する
ことが一般的である。一般には10ミリ秒毎または20ミリ秒毎にLP情報がデ
コーダ(例えば、420、412)に伝送され、デコーダ側で抽出される。
【0021】 本明細書で開示する新規の方法は、LPに基づく別の符号化システムを使用し
てもよい。しかし、CELPタイプの符号化システムを、本発明の方法を非限定
的に例示するための好ましい実施形態で使用する。同様に、こうした方式を、有
声音および音声以外の音響信号と共に使用することも、他のタイプの広帯域信号
と共に使用することも可能である。
【0022】 図1は、広帯域信号により適切に適合するように改変されたCELPタイプの
音声符号化装置100の略ブロック図を示す。 サンプリングされた入力音声信号114が、ブロック1個当たりL個のサンプ
ルから成る連続した「フレーム」と呼ばれるブロックに分割される。各フレーム
において、そのフレーム内の音声信号を表す異なったパラメータが計算され、符
号化され、伝送される。一般的に、LP合成フィルタを表現するLPパラメータ
が各フレーム毎に1回計算される。各フレームは、N個のサンプルから成るより
小さいブロック(長さNのブロック)にさらに分割され、このブロックでは励起
パラメータ(ピッチおよびイノベーション)が求められる。CELPの文献では
、こうした長さNのブロックは「サブフレーム」と呼ばれ、このサブフレーム中
のN個のサンプル信号は「N次元ベクトル」と呼ばれている。この好ましい実施
形態では、長さNは5ミリ秒に相当し、一方、長さLは20ミリ秒に相当し、こ
のことは、1個のフレームが4個のサブフレームを含むことを意味する(16k
HzのサンプリングレートではN=80であり、12.8kHzへのダウンサン
プリング後では、N=64である)。様々なN次元ベクトルが符号化手順中に生
じる。図1と図2に現れるベクトルのリストと、伝送されるパラメータのリスト
とを次に示す。 主要なN次元ベクトルのリスト s 広帯域信号入力音声ベクトル(ダウンサンプリングと前処理とプリエンフ
ァシスとの後)、 sw 重み付けされた音声ベクトル、 so 重み付けされた合成フィルタのゼロ入力応答、 sp ダウンサンプリングされ前処理された信号、 オーバサンプリングされた合成音声信号、 s′ デエンファシス前の合成信号、 sd デエンファシスされた合成信号、 sh デエンファシスおよび後処理後の合成信号、 x ピッチ探索のためのターゲットベクトル、 x′ イノベーション探索のためのターゲットベクトル、 h 重み付けされた合成フィルタインパルス応答、 vT 遅延Tにおける適応(ピッチ)コードブック、 yT フィルタリングされたピッチコードブックベクトル(hと畳み込み演算
されたvT)、 ck 索引kにおけるイノベーティブコードベクトル(イノベーションコード
ブックからのk番目のエントリ)、 cf 強調されたスケーリング済みイノベーションコードベクトル、 u 励起信号(スケーリングされたイノベーションコードベクトルおよびピッ
チコードベクトル)、 u′ 強調された励起、 z 帯域通過ノイズシーケンス、 w′ ホワイトノイズシーケンス、 w スケーリングされたノイズシーケンス。 伝送されるパラメータのリスト STP 短期予測パラメータ(A(z)を定義する)、 T ピッチ遅れ(すなわち、ピッチコードブック索引)、 b ピッチゲイン(すなわち、ピッチコードブックゲイン)、 j ピッチコードベクトルで使用されるローパスフィルタの索引、 k コードベクトル索引(イノベーションコードブックエントリ)、 g イノベーションコードブックゲイン。
【0023】 この好ましい実施形態では、STPパラメータはフレーム1個当たり1回伝送
され、その他のパラメータはフレーム1個当たり4回(すなわち各サブフレーム
毎に1回)伝送される。 エンコーダ側 サンプリングされた音声信号を、101から111の番号が付いた11個のモ
ジュールに分けた図1の符号化装置100によって各ブロック単位で符号化する
【0024】 入力音声を、フレームと呼ばれる上述のL個のサンプルから成るブロックの形
に処理する。 図1を参照すると、サンプリングされた入力音声信号114をダウンサンプリ
ングモジュール101においてダウンサンプリングする。例えば、当業者に周知
の方法を使用して、この信号を16kHzから12.8kHzにダウンサンプリ
ングする。もちろん、別の周波数へのダウンサンプリングも想定可能である。ダ
ウンサンプリングは、より小さい周波数帯域幅が符号化されるので、符号化効率
を向上させる。さらに、これは、1フレーム中のサンプルの数が減少させられる
ので、アルゴリズムの複雑性を低減させる。ビットレートを16キロビット/秒
未満に低下させる時には、ダウンサンプリングの使用が重要になるが、16キロ
ビット/秒を越える場合にはダウンサンプリングは不可欠ではない。
【0025】 ダウンサンプリング後に、20ミリ秒あたり320サンプルフレームが245
サンプルフレームに縮小される(ダウンサンプリング率は4/5である)。 その次に、入力フレームを随意採用の前処理ブロック102に送る。前処理ブ
ロック102は、50Hzのカットオフ周波数を有するハイパスフィルタから成
ってもよい。ハイパスフィルタ102は、50Hz未満の不要な音響成分を除去
する。
【0026】 ダウンサンプリングされ前処理された信号を、sp(n)、n=0,1,2,
...、L−1で表し、ここでLはフレームの長さである(12.8kHzのサ
ンプリング周波数では256)。プリエンファシスフィルタ103の好ましい具
体例では、信号sp(n)は、次の伝達関数を有するフィルタを使用してプリエ
ンファシスされる。
【0027】 P(z)=1−μz-1 ここでμは、0から1の値を有するプリエンファシス係数である(典型的な値は
μ=0.7である)。より高次のフィルタを使用してもよい。より効率的な固定
小数点処理系を得るために、ハイパスフィルタ102とプリエンファシスフィル
タ103とを互いに交換することが可能であることを指摘しておかなければなら
ない。
【0028】 プリエンファシスフィルタ103の機能は、入力信号の高周波数成分を強調す
ることである。さらに、このプリエンファシスフィルタ103は入力音声信号の
ダイナミックレンジを縮小し、このことが入力音声信号を固定小数点処理系によ
り一層適したものにする。プリエンファシスを行わない場合には、固定小数点を
使用する単精度演算の形でのLP分析は実行が困難である。
【0029】 プリエンファシスはさらに、量子化誤差の適正な包括的な聴覚重み付けを実現
する上で重要な役割を果たし、音質の改善に寄与する。これについては、さらに
詳細に後述する。 プリエンファシスフィルタ103の出力をs(n)で表す。この信号は、計算
器モジュール104でLP分析を行うために使用される。LP分析は当業者に周
知の方法である。この好ましい実施形態では、自己相関アプローチを使用する。
この自己相関アプローチでは、最初に、(約30−40ミリ秒の長さを有するこ
とが一般的である)ハミング窓を使用して信号s(n)をウィンドウ処理する。
このウィンドウ処理された信号から自己相関を計算し、LPフィルタ係数ai
計算するためにレヴィンソン−ダービンの再帰計算を使用し、ここでi=1,.
..,pであり、pはLP次数であり、広帯域符号化の場合には16であること
が一般的である。パラメータaiは、LPフィルタの伝達関数の係数であり、次
の関係式で示される。
【0030】
【数1】
【0031】 LP分析を計算器モジュール104で行い、この計算器モジュール104はさ
らに、LPフィルタ係数の量子化と補間も行う。最初に、LPフィルタ係数を、
量子化と補間により適している別の同等のドメインに変換する。線スペクトル対
(LSP)ドメインとイミタンス(immitance)スペクトル対(ISP
)ドメインとが、量子化と補間を効率的に行うことができる2つのドメインであ
る。16個のLPフィルタ係数aiを、分割量子化または多段量子化またはこれ
らの組合せを使用して約30ビットから50ビットに量子化することが可能であ
る。補間の目的は、各フレーム毎に1回ずつLPフィルタ係数を伝送しつつ各サ
ブフレーム毎にLPフィルタ係数を更新することを可能にすることであり、この
ことがビットレートを増加させることなしにエンコーダの性能を向上させる。L
Pフィルタ係数の量子化と補間は、他の点では当業者に周知であると考えられ、
したがって本明細書ではさらに詳細には説明しない。
【0032】
【数2】
【0033】 聴覚重み付け 「合成による分析」エンコーダでは、聴覚的に重み付けされたドメインにおい
て入力音声と合成音声の間の平均2乗誤差を最小化することによって、最適のピ
ッチおよびイノベーションパラメータを探索する。これは、重み付けされた入力
音声と重み付けされた合成音声との間の誤差を最小化することと同等である。
【0034】 重み付けされた信号sw(n)を、聴覚重み付けフィルタ105で計算する。
従来通りに、重み付けされた信号sw(n)を、次式の伝達関数W(z)を有す
る重み付けフィルタによって計算する。 W(z)=A(z/γ1)/A(z/γ2)ここで0<γ2<γ1≦1 当業者には周知であるように、従来技術の「合成による分析」(AbS)エンコ
ーダでは、聴覚重み付けフィルタ105の伝達関数の逆関数である伝達関数W-1 (z)によって量子化誤差が重み付けされるということが分析によって示されて
いる。この結果は、B.S.AtalおよびM.R.Schroeder,“P
redictive coding of speech and subje
ctive error criteria”,IEEE Transacti
on ASSP,vol.27,no.3,pp.247−254,June
1979に詳細に説明されている。伝達関数W-1(z)は入力音声信号のフォル
マント構造の一部分を示す。したがって、量子化誤差がフォルマント領域内によ
り大きいエネルギーを有し、それによってこのフォルマント領域内に存在する強
い信号エネルギーによって量子化誤差がマスキングされるように量子化誤差を整
形することによって、人間の耳のマスキング特性が利用される。重み付けの量を
係数γ1、γ2で制御する。
【0035】 上述の従来の聴覚重み付けフィルタ105は、電話帯域信号には十分に有効に
機能する。しかし、この従来の聴覚重み付けフィルタ105が広帯域信号の効率
的な聴覚重み付けには適していないことが明らかになった。さらに、従来の聴覚
重み付けフィルタ105がフォルマント構造とそれに必要なスペクトル傾斜とを
同時にモデル化する上で固有の制限を有することも明らかになった。スペクトル
傾斜は、広帯域信号においては、低周波数と高周波数の間の広いダイナミックレ
ンジのためにより一層顕著である。従来技術は、広帯域入力信号の傾斜およびフ
ォルマント重み付けを制御するために、傾斜フィルタをW(z)に加えることを
提案している。
【0036】 この問題に対する新規の解決策は、本発明によれば、プリエンファシスフィル
タ103を入力に導入することと、プリエンファシスされた音声s(n)に基づ
いてLPフィルタA(z)を計算することと、フィルタW(z)の分母を固定す
ることによって改変されたフィルタW(z)を使用することである。 LPフィルタA(z)を得るために、プリエンファシスされた信号s(n)に
対してモジュール104においてLP分析を行う。さらに、固定された分母を有
する新たな聴覚重み付けフィルタ105を使用する。聴覚重み付けフィルタ10
4のための伝達関数の一例を次の関係式で示す。
【0037】 W(z)=A(z/γ1)/(1−γ2-1)ここで0<γ2<γ1≦1 より高い次数を分母で使用することが可能である。この構造が、フォルマント重
み付けを傾斜から実質的に切り離す。 A(z)はプリエンファシスされた音声信号s(n)に基づいて計算されるの
で、フィルタの傾斜1/A(z/γ1)は、A(z)がオリジナルの音声に基づ
いて計算される場合よりは顕著ではないということに留意されたい。次の伝達関
数を有するフィルタを使用して、デコーダ側でデエンファシスが行われるので、 P-1(z)=1/(1−μz-11 量子化誤差のスペクトルは、伝達関数W-1(z)P-1(z)を有するフィルタに
よって整形される。通常はそうであるように、γ2がμに等しく設定されている
時には、量子化誤差のスペクトルは、伝達関数が1/A(z/γ1)であるフィ
ルタによって整形され、A(z)はプリエンファシスされた音声信号に基づいて
計算される。プリエンファシスと改変された重み付けフィルタリングとの組合せ
によって誤差の整形を実現するこの構造は、固定小数点アルゴリズムの実現が容
易であるという利点に加えて、広帯域信号の符号化に関して非常に効率的である
ということが、主観的な聴取によって明らかになった。 ピッチ分析 ピッチ分析を簡略化するために、重み付けされた音声信号sw(n)を使用し
て、開ループピッチ探索モジュール106において開ループピッチ遅れTOLを最
初に推定する。その次に、サブフレーム単位で閉ループピッチ探索モジュール1
07において行われる閉ループピッチ分析を、開ループピッチ遅れTOLの付近に
制限し、このことがLTPパラメータT、b(ピッチ遅れとピッチゲイン)の探
索の複雑性を著しく低減させる。通常は、当業者に周知の方法を使用して、開ル
ープピッチ分析を10ミリ秒(2個のサブフレーム)毎に1回ずつモジュール1
06で行う。
【0038】
【数3】
【0039】 閉ループピッチ(すなわちピッチコードブック)パラメータb、T、jを閉ル
ープピッチ探索モジュール107において計算し、この閉ループピッチ探索モジ
ュール107は、入力としてターゲットベクトルxとインパルス応答ベクトルh
と開ループピッチ遅れTOLとを使用する。従来においては、ピッチ予測は、次の
伝達関数を有するピッチフィルタによって表現されており、 1/(1−bz-T) ここでbはピッチゲインであり、Tはピッチ遅延すなわち遅れである。この場合
に、励起信号u(n)に対するピッチの寄与はbu(n−T)によって与えられ
、この場合に全励起が、 u(n)=bu(n−T)+gck(n) で与えられ、ここでgはイノベーティブコードブックゲインであり、ck(n)
は索引kにおけるイノベーティブコードベクトルである。
【0040】 ピッチ遅れTがサブフレーム長さNよりも短い場合に、この表現は制限を有す
る。別の表現では、ピッチ寄与を、直前の励起信号を含むピッチコードブックと
見なすことが可能である。一般的に、ピッチコードブック中の各ベクトルは先行
のベクトルの(1つのサンプルを捨てて新たなサンプルを加えた)「1つ分ずれ
た」変型である。ピッチ遅れT>Nである場合には、ピッチコードブックはフィ
ルタ構造(1/(1−bz-1)と同等であり、ピッチ遅れTにおけるピッチコー
ドブックベクトルvT(n)は次式で与えられる。
【0041】 VT(n)=u(n−T), n=0,...,N−1. Nより短いピッチ遅れTの場合には、ベクトルvT(n)は、そのベクトルが完
成するまで、直前の励起からの使用可能なサンプルを反復することによって構築
される(これはフィルタ構造と同等ではない)。 最近のエンコーダでは、より高いピッチ分解能が使用され、このことは有声音
音響セグメントの品質を著しく向上させる。これは、多相補間フィルタを使用し
て直前の励起信号をオーバサンプリングすることによって行われる。この場合に
は、ベクトルvT(n)は、一般的に、直前の励起の補間変型に相当し、ピッチ
遅れTは非整数の遅延(例えば、50.25)である。
【0042】 ピッチ探索は、ターゲットベクトルxとスケーリングされたフィルタリング済
みの直前の励起との間の平均2乗重み付け誤差Eを最小化する最適のピッチ遅れ
Tとゲインbとを発見することから成る。誤差Eは次のように表現され、 E=‖x−byT2 ここでyTはピッチ遅れTにおけるフィルタリングされたピッチコードブックベ
クトルであり、
【0043】
【数4】
【0044】 である。 探索基準
【0045】
【数5】
【0046】 ここでtはベクトル転置を表す。 を最大化することにより誤差Eを最小化することができる。 本発明のこの好ましい実施形態では、1/3のサブサンプルピッチ分解能が使
用され、ピッチ(ピッチコードブック)探索が3つの段階によって構成されてい
る。
【0047】 第1の段階では、開ループピッチ遅れTOLが、重み付けされた音声信号sw
n)に応答して開ループピッチ探索モジュール106で推定される。上述の説明
で示したように、この開ループピッチ分析は、当業者に周知の方法を使用して1
0ミリ秒(2つのサブフレーム)毎に1回ずつ行われるのが一般的である。 第2の段階では、探索基準Cが、推定された開ループピッチ遅れTOL(一般に
±5)に近い整数ピッチ遅れに関して、閉ループピッチ探索モジュール107で
探索され、このことが探索手順を著しく単純化する。各ピッチ遅れ毎に畳み込み
を計算する必要なしに、フィルタリングされたコードベクトルyTを更新するた
めに、単純な手順を使用する。
【0048】 最適の整数ピッチ遅れを第2の段階で発見すると、探索の第3の段階(モジュ
ール107)においてその最適の整数ピッチ遅れの付近の端数がテストされる。 ピッチ予測器が、ピッチ遅れT>Nの場合の妥当な想定である形式1/(1−
bz-1)のフィルタによって表現される時には、ピッチフィルタのスペクトルが
、周波数範囲全体にわたって高調波構造を示し、この高調波周波数は1/Tに関
係している。広帯域信号の場合には、広帯域信号における高調波構造がその拡張
されたスペクトルの全体を含むわけではないので、この高調波構造はあまり効率
的ではない。この高調波構造は、音声セグメントに応じて特定の周波数までにだ
け存在するにすぎない。したがって、広帯域音声の有声音セグメントにおけるピ
ッチ寄与の効率的な表現を得るためには、ピッチ予測フィルタは、広帯域スペク
トル全体にわたって周期性の量を変化させるという柔軟性を有する必要がある。
【0049】 広帯域信号の音声スペクトルの高調波構造の効率的なモデリングを行う新たな
方法を本明細書で開示し、この方法では、幾つかの形態のローパスフィルタが直
前の励起に適用され、より高い予測ゲインを有するローパスフィルタが選択され
る。 サブサンプルピッチ分解能を使用する時には、ローパスフィルタを、より高い
ピッチ分解能を得るために使用される補間フィルタの中に組み込むことが可能で
ある。この場合には、選択された整数ピッチ遅れの付近の端数をテストするピッ
チ探索の第3の段階を、互いに異なったローパス特性を有する幾つかの補間フィ
ルタに対して繰り返し、探索基準Cを最小にする端数とフィルタ索引とを選択す
る。
【0050】 より単純なアプローチは、上述の3つの段階での探索を行って、特定の周波数
応答を有する1つだけの補間フィルタを使用して最適の端数ピッチ遅れを求め、
異なった予め決められたローパスフィルタを選択されたピッチコードブックベク
トルvTに適用することによって最適のローパスフィルタ形状を最終的に選択し
、ピッチ予測誤差を最小にするローパスフィルタを選択することである。このア
プローチを詳細に後述する。
【0051】 図3は、この提案のアプローチの好ましい具体例の略ブロック図を示す。 記憶装置モジュール303では、直前の励起信号u(n)、n<0を記憶する
。ピッチコードブック探索モジュール301が、ターゲットベクトルxと、開ル
ープピッチ遅れTOLと、記憶装置モジュール303からの直前の励起信号u(n
)、n<0とに対して応答し、上述の探索基準Cを最小にするピッチコードブッ
ク(ピッチコードブック)検索を行う。モジュール301で行った探索の結果か
ら、モジュール302が最適のピッチコードブックベクトルvTを生成する。サ
ブサンプルピッチ分解能(端数ピッチ)を使用するので、直前の励起信号u(n
)、n<0が補間され、ピッチコードブックベクトルvTは、補間された直前の
励起信号に対応するということに留意されたい。この好ましい実施形態では、補
間フィルタ(モジュール301内、図示していない)が、7000Hzを越える
周波数成分を除去するローパスフィルタ特性を有する。
【0052】 好ましい一実施形態では、K個のフィルタ特性を使用する。これらのフィルタ
特性はローパスフィルタ特性であることも帯域通過フィルタ特性であることも可
能である。最適のコードベクトルvTがピッチコードベクトル発生器302によ
って決定されて供給されると、vTのK個のフィルタリングされた変型が、30
(j)のようなK個の異なった周波数整形フィルタを使用してそれぞれに計算さ
れ、ここでj=1,2,...,Kである。これらのフィルタリングされた変型
をvf (j)と表現し、ここでj=1,2,...,Kである。これらの異なったベ
クトルvf (j)を、それぞれのモジュール304(j)(ここでj=1,2,...
,Kである)においてインパルス応答hと畳み込み演算し、ベクトルy(j)(こ
こでj=1,2,...,Kである)を得る。各ベクトルy(j)に関して平均2
乗ピッチ予測誤差を計算するために、対応する増幅器307(j)によって値y(j) にゲインbを乗算し、さらに、対応する減算器308(j)によって値by(j)をタ
ーゲットベクトルxから減算する。セレクタ309が、平均2乗ピッチ予測誤差 e(j)=‖x−b(j)(j)2, j=1,2,...,K を最小にする周波数整形フィルタ305(j)を選択する。y(j)の各値に関して平
均2乗ピッチ予測誤差e(j)を計算するために、対応する増幅器307(j)によっ
て値y(j)にゲインbを乗算し、さらに、減算器308(j)によって値b(j)(j) をターゲットベクトルxから減算する。次の関係式を使用して、索引jにおける
周波数整形フィルタに関連した対応するゲイン計算器306(j)によって、各々
のゲインb(j)を計算する。
【0053】 b(j)=xt(j)/‖y(j)2 セレクタ309では、パラメータb、T、jは、平均2乗ピッチ予測誤差eを
最小にするvTまたはvf (j)に基づいて選択される。 再び図1を参照すると、ピッチコードブック索引Tは符号化されてマルチプレ
クサ112に送られる。ピッチゲインbは量子化されてマルチプレクサ112に
送られる。この新たなアプローチを使用する場合には、選択された周波数整形フ
ィルタの索引jをマルチプレクサ112で符号化するために、追加の情報が必要
である。例えば、3つのフィルタを使用する場合(j=1,2,3)には、この
情報を表現するために2ビットが必要である。フィルタ索引情報jをピッチゲイ
ンbと共に符号化することも可能である。 イノベーティブコードブック探索 ピッチ、または、LTP(長期予測)パラメータb、T、jを求めた後に、次
のステップは、図1の探索モジュール110によって最適のイノベーティブ励起
を探索することである。最初に、ターゲットベクトルxを、LTP寄与 x’=x−byT を減算することによって更新し、ここでbはピッチゲインであり、yTはフィル
タリングされたピッチコードブックベクトル(選択されたローパスフィルタでフ
ィルタリングされ、図3を参照して説明したようにインパルス応答hと畳み込み
演算された、遅延Tにおける直前の励起)である。
【0054】 CELPにおける探索手順は、ターゲットベクトルとスケーリングされたフィ
ルタリング済みコードベクトルとの間の平均2乗誤差 E=‖x’−gHck2 を最小にする最適の励起コードベクトルckとゲインgとを発見することによっ
て行なわれる。ここでHは、インパルス応答ベクトルhから得られた下三角畳み
込み行列である。
【0055】 本発明のこの好ましい実施形態では、イノベーティブコードブック探索を、1
995年8月22日付で発行された米国特許第5,444,816号(Adou
l他)と、1997年12月17日付でAduol他に発行された米国特許第5
,699,482号と、1998年5月19日付でAduol他に発行された米
国特許第5,754,976号と、1997年12月23日付の米国特許第5,
701,392号(Adoul他)とに説明されている通りの代数的コードブッ
クによってモジュール110で行う。
【0056】 最適の励起コードベクトルckとそのゲインgとがモジュール110によって
選択され終わると、コードブック索引kとゲインgとが符号化されてマルチプレ
クサ112に送られる。 図1を参照すると、パラメータb、T、j、 、k、gがマルチプレクサ1
12を通して多重化され、その後で通信チャネルを通して送られる。 記憶装置の更新 記憶装置モジュール111(図1)では、重み付けされた合成フィルタ
【0057】
【数13】
【0058】 の状態が、この重み付けされた合成フィルタを通して励起信号u=gck
bvTをフィルタリングすることによって更新される。このフィルタリングの後
に、このフィルタの状態が記憶され、計算器モジュール108でゼロ入力応答を
計算するための初期状態として、その次のサブフレームで使用される。 ターゲットベクトルxの場合と同様に、当業者に周知の数学的には同等である
別のアプローチを、このフィルタの状態を更新するために使用することが可能で
ある。 デコーダ側 図2の音声復号装置200が、ディジタル入力222(デマルチプレクサ21
7に対する入力ストリーム)とサンプリングされた出力音声223(加算器22
1の出力)との間で行われる様々なステップを示す。
【0059】 デマルチプレクサ217は、ディジタル入力チャネルから受け取ったバイナリ
情報から合成モデルパラメータを抽出する。受け取ったバイナリフレームの各々
から抽出されるパラメータは、 短期予測パラメータ(STP) (フレーム毎に1回)、 長期予測(LTP)パラメータT、b、j(各サブフレーム毎)、および、 イノベーションコードブック索引kとゲインg(各サブフレーム毎) である。
【0060】 後述するように、現在の音声信号が、これらのパラメータに基づいて合成され
る。 イノベーティブコードブック218が索引kに応答してイノベーションコード
ベクトルckを生じさせ、このイノベーションコードベクトルは、復号されたゲ
イン係数gによって増幅器224を通してスケーリングされる。この好ましい実
施形態では、上記の米国特許第5,444,816号、同第5,699,482
号、同第5,754,976号、同第5,701,392号に説明されている通
りのイノベーティブコードブック218を、イノベーティブコードベクトルck
を表現するために使用する。
【0061】 増幅器224の出力における、生成されたスケーリングされたコードベクトル
gckを、イノベーションフィルタ205を通して処理する。 周期性の強調 増幅器224の出力における、生成されたスケーリングされたコードベクトル
を、周波数依存性のピッチエンハンサ205を通して処理する。
【0062】 励起信号uの周期性を強調することが、有声音セグメントの場合に品質を改善
する。これは、過去においては、導入される周期性の量を制御する式1/(1−
εbz-1)(ただし、εは0.5未満の係数である)のフィルタを通して、イノ
ベーティブコードブック(固定コードブック)218からのイノベーションベク
トルをフィルタリングすることによって行われた。このアプローチは、スペクト
ル全体にわたって周期性を導入するので、広帯域信号の場合には効果的でない。
本発明の一部分である新たな代案のアプローチを説明すると、このアプローチで
は、より低い周波数よりもより高い周波数を強調する周波数応答のイノベーショ
ンフィルタ205(F(z))を通して、イノベーティブ(固定)コードブック
からのイノベーティブコードベクトルckをフィルタリングすることによって、
周期性の強調を行う。F(z)の係数は励起信号uの周期性の量に関係する。
【0063】 当業者に周知の様々な方法が、有効な周期性係数を得るために使用可能である
。例えば、ゲインbの値が周期性の表示を与える。すなわち、ゲインbが1に近
い場合には、励起信号uの周期性は高く、ゲインbが0.5未満である場合には
、周期性は低い。 好ましい実施形態で使用するフィルタF(z)の係数を得るための別の効果的
な方法は、励起信号u全体におけるピッチ寄与の量をこの係数に関係付けること
である。この結果として、周波数応答がサブフレームの周期性に依存することに
なり、この場合に、より高い周波数が、ピッチゲインが高ければ高いほど強く強
調される(より強い全体的勾配が得られる)。イノベーションフィルタ205は
、励起信号uの周期性がより大きい時に、低周波数におけるイノベーティブコー
ドベクトルckのエネルギーを低下させる効果を有し、このことが、より高い周
波数よりもより低い周波数における励起信号uの周期性を強調する。イノベーシ
ョンフィルタ205に関して提案する式は、 (1)F(z)=1−σz-1,または(2)F(z)=−αz+1−αz-1 であり、ここでσまたはαは、励起信号uの周期性のレベルから導き出される周
期性係数である。
【0064】 F(z)の第2の3項形式を、好ましい実施形態で使用する。周期性係数αは
有声音化係数発生器204で計算する。励起信号uの周期性に基づいて周期性係
数αを導き出すために、幾つかの方法を使用することが可能である。次にその方
法を2つ示す。 方法1: 最初に、全励起信号uに対するピッチ寄与の割合を、次式によって有声音化係
数発生器204で計算し、
【0065】
【数6】
【0066】 ここでvTはピッチコードブックベクトルであり、bはピッチゲインであり、u
は次式によって加算器219の出力で与えられる励起信号uである。 u=gck+bvT 項bvTが、ピッチ遅れTと、記憶装置203内に記憶されているuの直前の
値とに応答して、ピッチコードブック(ピッチコードブック)201から得られ
るということに留意されたい。その次に、ピッチコードブック201からのピッ
チコードベクトルvTを、デマルチプレクサ217からの索引jによってカット
オフ周波数が調整されるローパスフィルタ202を通して処理する。その次に、
得られたコードベクトルvTにデマルチプレクサ217からのゲインbを増幅器
226を通して乗算し、信号bvTを得る。
【0067】 係数αを、次式によって有声音化係数発生器204で計算し、 α=qRp ただし α<q ここでqは強調の量を制御する係数である(この好ましい実施形態ではqは0.
25に設定される。) 方法2: 周期性係数αを計算するために本発明の好ましい実施形態で使用する別の方法
を次に説明する。
【0068】 最初に、有声音化係数rvを、次式によって有声音化係数発生器204で計算
し、 rv=(Ev−Ec)/(Ev+Ec) ここでEvはスケーリングされたピッチコードベクトルbvTのエネルギーであり
、Ecはスケーリングされたイノベーティブコードベクトルgckのエネルギーで
ある。すなわち、
【0069】
【数7】
【0070】 rvの値は−1から1までの値であることに留意されたい(1は純粋に有声音
の信号に相当し、−1は純粋に無声音の信号に相当する)。 その次に、この好ましい実施形態では、係数αを次式によって有声音化係数発
生器204で計算し、 α=0.125(1+rv) この係数αは、純粋に無声音の信号の場合には0の値に相当し、純粋に有声音の
信号の場合には0.25に相当する。
【0071】 上記の第1のF(z)の2項形式では、周期性係数αを、上述の方法1と方法
2においてσ=2αを使用することによって近似的に求めることが可能である。
この場合には、周期性係数σを上述の方法1で次のように計算する。 σ=2qRp bounded by σ<2q. 方法2では、周期性係数σを次のように計算する。
【0072】 σ=0.25(1+rv). したがって、強調された信号cfは、スケーリングされたイノベーティブコー
ドベクトルgckをイノベーションフィルタ205(F(z))を通してフィル
タリングすることによって計算される。 強調された励起信号u′を次のように加算器220で計算する。
【0073】 u′=cf+bvT このプロセスがエンコーダ100では行われないことに留意されたい。したが
って、エンコーダ100とデコーダ200の間の同期を維持するために、強調な
しに励起信号uを使用してピッチコードブック201の内容を更新することが不
可欠である。したがって、励起信号uをピッチコードブック201の記憶装置2
03を更新するために使用し、強調された励起信号u′をLP合成フィルタ20
6の入力で使用する。 合成とデエンファシス
【0074】
【数8】
【0075】 D(z)=1/(1−μz-1) ここでμは0から1の値を有するプリエンファシス係数である(典型的な値はμ
=0.7である)。より高次のフィルタも使用可能である。 このベクトルs′は、デエンファシスフィルタD(z)(モジュール207)
を通過させられてベクトルsdが得られ、ベクトルsdはハイパスフィルタ208
を通過させられて50Hz未満の不要な周波数が除去されてshが得られる。 オーバサンプリングと高周波数再生
【0076】
【数9】
【0077】 本発明による高周波数生成手順を次で説明する。 ランダムノイズ発生器213が、当業者に周知の方法を使用して、周波数帯域
全体にわたって一様なスペクトルを有するホワイトノイズシーケンスw′を生成
する。生成されたシーケンスは、オリジナルのドメインにおけるサブフレーム長
さである長さN′である。Nがダウンサンプリングされたドメインにおけるサブ
フレーム長さであることに留意されたい。この好ましい実施形態では、N=64
でN′=80であり、これらは5ミリ秒に相当する。
【0078】 ホワイトノイズシーケンスをゲイン調整モジュール214で適正にスケーリン
グする。ゲイン調整は次のステップを含む。最初に、生成されたノイズシーケン
スw′のエネルギーを、エネルギー計算モジュール210によって計算された強
調された励起信号u′のエネルギーに等しいように設定し、この結果として得ら
れたスケーリングされたノイズシーケンスが次式で与えられる。
【0079】
【数10】
【0080】 ゲインスケーリングの第2のステップは、(無声音セグメントに比較して高周
波数のエネルギが小さい)有声音セグメントの場合には、生成されるノイズのエ
ネルギーを減少させるように、有声音化係数発生器204の出力において合成信
号の高周波数成分を計算に入れることである。この好ましい実施形態では、高周
波数成分の測定を、スペクトル傾斜計算器212によって合成信号の傾斜を測定
することと、それにしたがってエネルギを減少させることとによって実現する。
零交叉測定のような他の測定を同様に使用することが可能である。傾斜が非常に
強い場合は、これは有声音セグメントに対応し、ノイズのエネルギーをさらに減
少させる。傾斜係数tiltをモジュール202で合成信号shの第1の相関係
数として計算し、これは次式で与えられ、
【0081】
【数11】
【0082】 ここで有声音化係数rvは次式で与えられ、 rv=(Ev−Ec)/(Ev+Ec) ここでEvはスケーリングされたピッチコードベクトルbvTのエネルギーであり
、Ecは上述の通りのスケーリングされたイノベーティブコードベクトルgck
エネルギーである。有声音化係数rvはtiltよりも小さい場合が殆どである
が、この条件は、tilt値が負でありかつrvの値がHIGHである場合に高
周波数トーンに対する予防策として導入されている。したがって、この条件は、
こうしたトーン信号の場合のノイズエネルギーを減少させる。
【0083】 一様なスペクトルの場合にはtilt値は0であり、強く有声音化された信号
の場合にはtilt値は1であり、高周波数により多くのエネルギーが存在する
無声音信号の場合にはtilt値は負である。 高周波数成分の量からスケーリング係数glを得るために様々な方法を使用す
ることが可能である。本発明では、上述の信号の傾斜に基づいて2つの方法を提
示する。 方法1: スケーリング係数glを次式によってtiltから得る。
【0084】 g1=1−tilt bounded by 0.2≦g1≦1.0 tiltが1に近い場合の強く有声音化された信号では、glは0.2であり、
強く無声音化された信号の場合にはglは1.0になる。 方法2: tilt係数glを最初にゼロ以上に制限し、その次にこのスケーリング係数
を次式によってtiltから得る。
【0085】 g1=10-0.8tilt 従って、ゲイン調整モジュール214で生成されたスケーリングされたノイズ
シーケンスwgは次式で与えられる。 Wg=g1W. tiltがゼロに近い時には、スケーリング係数glは1に近く、このことは
エネルギーの減少を生じさせない。tilt値が1である時は、スケーリング係
数glは、生成されるノイズのエネルギーの12dBの減少をもたらす。
【0086】
【数12】
【0087】 本発明をその好ましい実施形態によって上記で説明してきたが、この実施形態
を、本発明の着想と本質から逸脱することなしに、添付の特許請求項の範囲内で
自由に改変することが可能である。好ましい実施形態では広帯域音声信号の使用
を説明したが、広帯域信号一般を使用する他の具体例にも本発明が適用されるこ
とと、本発明が必ずしも音声用途だけには限定されないということとが、当業者
には明らかだろう。
【図面の簡単な説明】
【図1】 広帯域符号化装置の好ましい実施形態の略ブロック図である。
【図2】 広帯域復号装置の好ましい実施形態の略ブロック図である。
【図3】 ピッチ分析装置の好ましい実施形態の略ブロック図である。
【図4】 図1の広帯域符号化装置と図2の広帯域復号装置とが使用可能なセルラー通信
システムの単純化した略ブロック図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,US,UZ,VN,YU,ZA,ZW (72)発明者 レフェブル,ロシュ カナダ国,ケベック ジェイ1ケー 5ア ール9,カントン ドゥ マゴ,アブニュ ドゥ ラ ブールガード,259 Fターム(参考) 5D045 CA01 DA11 5J064 AA02 BB03 BB04 BB12 BC02 BC08 BC12 BC18 BC25 BD02 BD03

Claims (63)

    【特許請求の範囲】
  1. 【請求項1】 ピッチコードブックパラメータの最適なセットを生成するた
    めの本発明のピッチ分析装置であって、 a)ピッチコードブックパラメータのそれぞれのセットに関連している少なく
    とも2つの信号経路であって、 i)前記信号経路の各々は、ピッチコードブック探索装置からのピッチコ
    ードベクトルのピッチ予測誤差を計算するピッチ予測誤差計算装置を含み、 ii)前記2つの信号経路のうちの少なくとも1つの信号経路は、前記ピ
    ッチコードベクトルを前記1つの信号経路の前記ピッチ予測誤差計算装置に供給
    する前に前記ピッチコードベクトルをフィルタリングするフィルタを含む 信号経路と、 b)前記少なくとも2つの信号経路において計算された前記ピッチ予測誤差を
    互いに比較し、最小の計算ピッチ予測誤差を有する前記信号経路を選択し、前記
    選択された信号経路に関連しているピッチコードブックパラメータのセットを選
    択するセレクタ とを含むピッチ分析装置。
  2. 【請求項2】 前記2つの信号経路のうちの1つの信号経路は、前記ピッチ
    コードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記ピッチコード
    ベクトルをフィルタリングするフィルタを含まない請求項1に記載のピッチ分析
    装置。
  3. 【請求項3】 前記信号経路は、前記ピッチコードベクトルを前記信号経路
    の前記ピッチ予測誤差計算装置に供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタをそれぞれに備えている複数の信号経路を含む請求項1
    に記載のピッチ分析装置。
  4. 【請求項4】 前記複数の信号経路の前記フィルタは、ローパスフィルタと
    帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異なっ
    た周波数応答を有する請求項3に記載のピッチ分析装置。
  5. 【請求項5】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
    信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
    する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトル
    とに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項1に記載のピッチ分析装置。
  6. 【請求項6】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッチ
    ゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項5に記載のピッチ分析装置。
  7. 【請求項7】 前記信号経路各々の前記ピッチ予測誤差計算装置は、対応す
    る前記ピッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前
    記様々な信号経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、
    および、前記ピッチ予測誤差の最小の計算エネルギーを有する前記信号経路を、
    最小の計算ピッチ予測誤差を有する前記信号経路として選択する手段を含む請求
    項1にピッチ分析装置。
  8. 【請求項8】 a)前記複数の信号経路の前記フィルタの各々はフィルタ索
    引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項5に記載のピッチ分析装置。
  9. 【請求項9】 前記フィルタは前記ピッチコードブック探索装置の補間フィ
    ルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルのサ
    ブサンプル変型を生成するために使用される請求項1に記載のピッチ分析装置。
  10. 【請求項10】 ピッチコードブックパラメタの最適のセットを生成するピ
    ッチ分析方法であって、 a)ピッチコードブックパラメタのそれぞれのセットに関連している少なくと
    も2つの信号経路において、ピッチコードブック探索装置からのピッチコードベ
    クトルのピッチ予測誤差を各信号経路毎に計算することと、 b)前記2つの信号経路のうちの少なくとも1つの信号経路において、前記1
    つの信号経路の前記ピッチ予測誤差の計算のために前記ピッチコードベクトルを
    供給する前に、前記ピッチコードベクトルをフィルタリングすることと、 c)前記少なくとも2つの信号経路において計算された前記ピッチ予測誤差を
    互いに比較し、最小の計算ピッチ予測誤差を有する信号経路を選択し、その選択
    された信号経路に関連しているピッチコードブックパラメータのセットを選択す
    ること とを含むピッチ分析方法。
  11. 【請求項11】 前記少なくとも2つの信号経路のうちの1つの信号経路に
    おいて、前記ピッチ予測誤差計算装置に前記ピッチコードベクトルを供給する前
    に、前記ピッチコードベクトルをフィルタリングしない請求項10に記載のピッ
    チ分析方法。
  12. 【請求項12】 前記信号経路は複数の信号経路を含み、前記複数の信号経
    路の各々の前記ピッチ予測誤差計算装置に前記ピッチコードベクトルを供給する
    前に前記複数の信号経路の各々において前記ピッチコードベクトルをフィルタリ
    ングする請求項10に記載のピッチ分析方法。
  13. 【請求項13】 前記複数の信号経路の前記フィルタを、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択することをさらに含み、前記フィ
    ルタは互いに異なった周波数応答を有する請求項12に記載のピッチ分析方法。
  14. 【請求項14】 各信号経路毎にピッチ予測誤差を計算することは、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
    信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
    することと、 b)前記畳み込まれたピッチコードベクトルとピッチ探索ターゲットベクトル
    とに応答してピッチゲインを計算することと、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成することと、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成すること とを含む請求項10に記載のピッチ分析方法。
  15. 【請求項15】 前記ピッチゲイン計算は、次の関係を使用して前記ピッチ
    ゲインb(j)を計算することを含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項14に記載のピッチ分析方法。
  16. 【請求項16】 前記信号経路各々において前記ピッチ予測誤差を計算する
    ことは、対応するピッチ予測誤差のエネルギーを計算することを含み、前記ピッ
    チ予測誤差を互いに比較することは、前記各信号経路の前記ピッチ予測誤差のエ
    ネルギーを互いに比較することと、前記ピッチ予想誤差の最小の計算エネルギー
    を有する前記信号経路を、最小の計算ピッチ予測誤差を有する前記信号経路とし
    て選択することとを含む請求項10に記載のピッチ分析方法。
  17. 【請求項17】 a)前記複数の信号経路の前記フィルタの各々をフィルタ
    索引で識別することと、 b)前記ピッチコードベクトルをピッチコードブック索引で識別することと c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項14に記載のピッチ分析方法。
  18. 【請求項18】 前記ピッチコードベクトルをフィルタリングすることは、
    前記ピッチコードブック探索装置の補間フィルタに一体化されており、前記補間
    フィルタを、前記ピッチコードベクトルのサブサンプル変型を生成するために使
    用する請求項10に記載のピッチ分析方法。
  19. 【請求項19】 広帯域入力信号を符号化するための請求項1に記載のピッ
    チ分析装置を有するエンコーダであって、 a)前記広帯域信号に応答して、線形予測合成フィルタ係数を生成する線形予
    測合成フィルタ計算器と、 b)前記広帯域信号と前記線形予測合成フィルタ係数とに応答して、聴覚的に
    重み付けされた信号を生成する聴覚重み付けフィルタと、 c)前記線形予測合成フィルタ係数に応答して、重み付けされた合成フィルタ
    インパルス応答信号を生成するインパルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探索ユニットであって、 i)前記聴覚的に重み付けされた信号と前記線形予測合成フィルタ係数と
    に応答して、前記ピッチコードベクトルとイノベーティブ探索ターゲットベクト
    ルとを生成する前記ピッチコードブック探索装置と、 ii)前記ピッチコードベクトルに応答して、前記ピッチコードブックパ
    ラメータのセットから、最小の計算ピッチ予測誤差を有する信号経路に関連して
    いるピッチコードブックパラメータのセットを選択する前記ピッチ分析装置 とを含むピッチ探索ユニットと、 d)前記重み付けされた合成フィルタインパルス応答信号と前記イノベーティ
    ブ探索ターゲットベクトルとに応答して、イノベーティブコードブックパラメー
    タを生成するイノベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する信号経路に関連している前記ピッチコード
    ブックパラメータのセットと、前記イノベーティブコードブックパラメータと、
    前記線形予測合成フィルタ係数とを含む、符号化された広帯域信号を生成する信
    号形成装置 とを含むエンコーダ。
  20. 【請求項20】 前記少なくとも2つの信号経路のうちの1つの信号経路は
    、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
    ピッチコードベクトルをフィルタリングするフィルタを含まない請求項19に記
    載のエンコーダ。
  21. 【請求項21】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
    置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項19に
    記載のエンコーダ。
  22. 【請求項22】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
    った周波数応答を有する請求項21に記載のエンコーダ。
  23. 【請求項23】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを重み付けされた合成フィルタインパルス応答
    信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを計算
    する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
    トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項19に記載のエンコーダ。
  24. 【請求項24】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
    チゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項23に記載のエンコーダ。
  25. 【請求項25】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
    ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
    経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
    ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピ
    ッチ予測誤差を有する前記信号経路として選択するための手段を含む請求項19
    に記載のエンコーダ。
  26. 【請求項26】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
    索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項23に記載のエンコーダ。
  27. 【請求項27】 前記フィルタは前記ピッチコードブック探索装置の補間フ
    ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
    サブサンプル変型を生成するために使用される請求項19に記載のエンコーダ。
  28. 【請求項28】 複数のセルに分割されている広い地理的区域に通信サービ
    スを提供するセルラー通信システムであって、 a)移動送信機/受信機ユニットと、 b)それぞれに前記セル内に配置されているセルラー基地局と、 c)前記セルラー基地局間の通信を制御する制御端末装置と、 d)1つのセル内に位置した各移動ユニットと前記1つのセルの前記セルラー
    基地局との間の双方向無線通信サブシステムであって、前記移動ユニットと前記
    セルラー基地局との両方において、 i)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化
    された広帯域信号を送信する送信回路とを含む送信機と、 ii)前記送信された符号化広帯域信号を受信する受信回路と、前記受信さ
    れた符号化広帯域信号を復号するデコーダとを含む受信機 とを含む双方向無線通信サブシステム とを含むセルラー通信システム。
  29. 【請求項29】 前記少なくとも2つの信号経路のうちの1つの信号経路は
    、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
    ピッチコードベクトルをフィルタリングするフィルタを含まない請求項28に記
    載のセルラー通信システム。
  30. 【請求項30】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
    置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項28に
    記載のセルラー通信システム。
  31. 【請求項31】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
    った周波数応答を有する請求項30に記載のセルラー通信システム。
  32. 【請求項32】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
    応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
    計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
    トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項28に記載のセルラー通信システム。
  33. 【請求項33】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
    チゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項32に記載のセルラー通信システム。
  34. 【請求項34】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
    ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
    経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
    ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピ
    ッチ予測誤差を有する前記信号経路として選択するための手段を含む請求項28
    に記載のセルラー通信システム。
  35. 【請求項35】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
    索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項32に記載のセルラー通信システム。
  36. 【請求項36】 前記フィルタは前記ピッチコードブック探索装置の補間フ
    ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
    サブサンプル変型を生成するために使用される請求項28に記載のセルラー通信
    システム。
  37. 【請求項37】 セルラー移動送信機/受信機ユニットであって、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
    れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
    符号化広帯域信号を復号するデコーダとを含む受信機 とを含むセルラー移動送信機/受信機ユニット。
  38. 【請求項38】 前記少なくとも2つの信号経路のうちの1つの信号経路は
    、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
    ピッチコードベクトルをフィルタリングするフィルタを含まない請求項37に記
    載のセルラー移動送信機/受信機ユニット。
  39. 【請求項39】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
    置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項37に
    記載のセルラー移動送信機/受信機ユニット。
  40. 【請求項40】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
    った周波数応答を有する請求項39に記載のセルラー移動送信機/受信機ユニッ
    ト。
  41. 【請求項41】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタのインパル
    ス応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトル
    を計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
    トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項37に記載のセルラー移動送信機/受信機ユニット。
  42. 【請求項42】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
    チゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項41に記載のセルラー移動送信機/受信機ユニット。
  43. 【請求項43】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
    ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
    経路の前記ピッチ予測誤差のエネルギーを互いに比較するための、および、前記
    ピッチ予想誤差の最小の計算エネルギーを有する前記信号経路を最小の計算ピッ
    チ予測誤差を有する前記信号経路として選択するための手段を含む請求項37に
    記載のセルラー移動送信機/受信機ユニット。
  44. 【請求項44】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
    索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項41に記載のセルラー移動送信機/受信機ユニット。
  45. 【請求項45】 前記フィルタは前記ピッチコードブック探索装置の補間フ
    ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
    サブサンプル変型を生成するために使用される請求項37に記載のセルラー移動
    送信機/受信機ユニット。
  46. 【請求項46】 セルラーネットワーク要素であって、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
    れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
    符号化広帯域信号を復号するデコーダとを含む受信機 とを含むセルラーネットワーク要素。
  47. 【請求項47】 前記少なくとも2つの信号経路のうちの1つの信号経路は
    、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
    ピッチコードベクトルをフィルタリングするフィルタを含まない請求項46に記
    載のセルラーネットワーク要素。
  48. 【請求項48】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
    置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項46に
    記載のセルラーネットワーク要素。
  49. 【請求項49】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
    った周波数応答を有する請求項48に記載のセルラーネットワーク要素。
  50. 【請求項50】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
    応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
    計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
    トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項46に記載のセルラーネットワーク要素。
  51. 【請求項51】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
    チゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである 請求項50に記載のセルラーネットワーク要素。
  52. 【請求項52】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
    ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
    経路の前記ピッチ予測誤差のエネルギーを比較するための、および、前記ピッチ
    予想誤差の最小の計算エネルギーを有する前記信号経路を最小の計算ピッチ予測
    誤差を有する前記信号経路として選択するための手段を含む請求項46に記載の
    セルラーネットワーク要素。
  53. 【請求項53】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
    索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項50に記載のセルラーネットワーク要素。
  54. 【請求項54】 前記フィルタは前記ピッチコードブック探索装置の補間フ
    ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
    サブサンプル変型を生成するために使用される請求項46に記載のセルラーネッ
    トワーク要素。
  55. 【請求項55】 移動送信機/受信機ユニットと、それぞれにセル内に位置
    したセルラー基地局と、前記セルラー基地局間の通信を制御する制御端末装置と
    を含む、複数のセルに分割されている広い地理的区域に通信サービスを提供する
    セルラー通信システムにおける、 1つのセル内に位置した各移動ユニットと前記1つのセルの前記セルラー基地
    局との間の双方向無線通信サブシステムであって、前記移動ユニットと前記セル
    ラー基地局の両方において、 a)請求項19に記載の広帯域信号を符号化するエンコーダと、前記符号化さ
    れた広帯域信号を送信する送信回路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回路と、前記受信された
    符号化広帯域信号を復号するデコーダとを含む受信機 とを含む双方向無線通信サブシステム。
  56. 【請求項56】 前記少なくとも2つの信号経路のうちの1つの信号経路は
    、前記ピッチコードベクトルを前記ピッチ予測誤差計算装置に供給する前に前記
    ピッチコードベクトルをフィルタリングするフィルタを含まない請求項55に記
    載の双方向無線通信サブシステム。
  57. 【請求項57】 前記信号経路は、各信号経路の前記ピッチ予測誤差計算装
    置に前記ピッチコードベクトルを供給する前に前記ピッチコードベクトルをフィ
    ルタリングするフィルタを各々に備えている複数の信号経路を含む請求項55に
    記載の双方向無線通信サブシステム。
  58. 【請求項58】 前記複数の信号経路の前記フィルタは、ローパスフィルタ
    と帯域通過フィルタから成るグループから選択され、前記フィルタは互いに異な
    った周波数応答を有する請求項57に記載の双方向無線通信サブシステム。
  59. 【請求項59】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを前記重み付けされた合成フィルタインパルス
    応答信号と畳み込み演算し、それによって畳み込まれたピッチコードベクトルを
    計算する畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッチ探索ターゲットベク
    トルとに応答してピッチゲインを計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッチゲインを乗算して、
    増幅された畳み込みピッチコードベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前記ピッチ探索ターゲッ
    トベクトルと組み合わせて前記ピッチ予測誤差を生成するコンバイナー回路 とを含む請求項55に記載の双方向無線通信サブシステム。
  60. 【請求項60】 前記ピッチゲイン計算器は、次の関係を使用して前記ピッ
    チゲインb(j)を計算する手段を含み、 b(j)=xt(j)/‖y(j)2 ここでj=0,1,2,...,Kであり、Kは信号経路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトルであり、y(j)は前記畳
    み込みピッチコードベクトルである請求項59に記載の双方向無線通信サブシス
    テム。
  61. 【請求項61】 各信号経路の前記ピッチ予測誤差計算装置は、対応するピ
    ッチ予測誤差のエネルギーを計算する手段を含み、前記セレクタは、前記各信号
    経路の前記ピッチ予測誤差のエネルギーを比較するための、および、前記ピッチ
    予想誤差の最小の計算エネルギーを有する前記信号経路を、最小の計算ピッチ予
    測誤差を有する前記信号経路として選択するための手段を含む請求項55に記載
    の双方向無線通信サブシステム。
  62. 【請求項62】 a)前記複数の信号経路の前記フィルタの各々はフィルタ
    索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ索引と前記ピッチコー
    ドブック索引と前記ピッチゲインとを含む 請求項59に記載の双方向無線通信サブシステム。
  63. 【請求項63】 前記フィルタは前記ピッチコードブック探索装置の補間フ
    ィルタに一体化されており、前記補間フィルタは、前記ピッチコードベクトルの
    サブサンプル変型を生成するために使用される請求項55に記載の双方向無線通
    信サブシステム。
JP2000578808A 1998-10-27 1999-10-27 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 Expired - Lifetime JP3490685B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA002252170A CA2252170A1 (en) 1998-10-27 1998-10-27 A method and device for high quality coding of wideband speech and audio signals
CA2,252,170 1998-10-27
PCT/CA1999/001008 WO2000025298A1 (en) 1998-10-27 1999-10-27 A method and device for adaptive bandwidth pitch search in coding wideband signals

Publications (2)

Publication Number Publication Date
JP2002528775A true JP2002528775A (ja) 2002-09-03
JP3490685B2 JP3490685B2 (ja) 2004-01-26

Family

ID=4162966

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2000578808A Expired - Lifetime JP3490685B2 (ja) 1998-10-27 1999-10-27 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
JP2000578812A Expired - Lifetime JP3936139B2 (ja) 1998-10-27 1999-10-27 オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2000578811A Expired - Lifetime JP3566652B2 (ja) 1998-10-27 1999-10-27 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
JP2000578810A Expired - Lifetime JP3869211B2 (ja) 1998-10-27 1999-10-27 広帯域信号の復号における周期性の強調

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2000578812A Expired - Lifetime JP3936139B2 (ja) 1998-10-27 1999-10-27 オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2000578811A Expired - Lifetime JP3566652B2 (ja) 1998-10-27 1999-10-27 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
JP2000578810A Expired - Lifetime JP3869211B2 (ja) 1998-10-27 1999-10-27 広帯域信号の復号における周期性の強調

Country Status (20)

Country Link
US (8) US6795805B1 (ja)
EP (4) EP1125276B1 (ja)
JP (4) JP3490685B2 (ja)
KR (3) KR100417634B1 (ja)
CN (4) CN1127055C (ja)
AT (4) ATE246389T1 (ja)
AU (4) AU763471B2 (ja)
BR (2) BR9914889B1 (ja)
CA (5) CA2252170A1 (ja)
DE (4) DE69910058T2 (ja)
DK (4) DK1125276T3 (ja)
ES (4) ES2205891T3 (ja)
HK (1) HK1043234B (ja)
MX (2) MXPA01004181A (ja)
NO (4) NO318627B1 (ja)
NZ (1) NZ511163A (ja)
PT (4) PT1125285E (ja)
RU (2) RU2217718C2 (ja)
WO (4) WO2000025304A1 (ja)
ZA (2) ZA200103366B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013218360A (ja) * 2003-12-19 2013-10-24 Motorola Mobility Inc 音声符号化のための方法と装置

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
EP1796083B1 (en) * 2000-04-24 2009-01-07 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR100393899B1 (ko) * 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
US7680665B2 (en) * 2001-08-24 2010-03-16 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal adaptively
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN100531259C (zh) * 2002-12-27 2009-08-19 冲电气工业株式会社 语音通信设备
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US6947449B2 (en) * 2003-06-20 2005-09-20 Nokia Corporation Apparatus, and associated method, for communication system exhibiting time-varying communication conditions
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
BRPI0414444B1 (pt) * 2003-09-16 2020-05-05 Matsushita Electric Ind Co Ltd aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
CN1954363B (zh) * 2004-05-19 2011-10-12 松下电器产业株式会社 编码装置和编码方法
US8024181B2 (en) * 2004-09-06 2011-09-20 Panasonic Corporation Scalable encoding device and scalable encoding method
DE102005000828A1 (de) * 2005-01-05 2006-07-13 Siemens Ag Verfahren zum Codieren eines analogen Signals
CN102592604A (zh) * 2005-01-14 2012-07-18 松下电器产业株式会社 可扩展性解码装置及可扩展性解码方法
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
DE602006019723D1 (de) * 2005-06-08 2011-03-03 Panasonic Corp Vorrichtung und verfahren zur verbreiterung eines audiosignalbands
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
DK1869669T3 (da) * 2006-04-24 2008-12-01 Nero Ag Avanceret audiokodningsapparat
EP2038884A2 (en) * 2006-06-29 2009-03-25 Nxp B.V. Noise synthesis
US8358987B2 (en) * 2006-09-28 2013-01-22 Mediatek Inc. Re-quantization in downlink receiver bit rate processor
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101369064B1 (ko) * 2007-07-27 2014-02-28 파나소닉 주식회사 음성 부호화 장치 및 음성 부호화 방법
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
CA2699316C (en) * 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101770778B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 一种预加重滤波器、感知加权滤波方法及系统
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
BRPI1008484A2 (pt) * 2009-02-26 2018-01-16 Panasonic Corp codificador, decodificador e método para os mesmos
US20110301946A1 (en) * 2009-02-27 2011-12-08 Panasonic Corporation Tone determination device and tone determination method
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
WO2011048810A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
US9812141B2 (en) 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
CN101854236B (zh) 2010-04-05 2015-04-01 中兴通讯股份有限公司 一种信道信息反馈方法和系统
DK2559028T3 (en) * 2010-04-14 2015-11-09 Voiceage Corp FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder
JP5749136B2 (ja) 2011-10-21 2015-07-15 矢崎総業株式会社 端子圧着電線
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CA2899059C (en) * 2013-01-29 2018-05-15 Guillaume Fuchs Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
MX355258B (es) 2013-10-18 2018-04-11 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información determinista y de tipo ruido.
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN105047201A (zh) * 2015-06-15 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于分段扩展的宽带激励信号合成方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法
US20230318881A1 (en) * 2022-04-05 2023-10-05 Qualcomm Incorporated Beam selection using oversampled beamforming codebooks and channel estimates

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
EP0331858B1 (en) 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2621376B2 (ja) 1988-06-30 1997-06-18 日本電気株式会社 マルチパルス符号化装置
JP2900431B2 (ja) 1989-09-29 1999-06-02 日本電気株式会社 音声信号符号化装置
JPH03123113A (ja) 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US6134373A (en) * 1990-08-17 2000-10-17 Samsung Electronics Co., Ltd. System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium
US5113262A (en) * 1990-08-17 1992-05-12 Samsung Electronics Co., Ltd. Video signal recording system enabling limited bandwidth recording and playback
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5392284A (en) * 1990-09-20 1995-02-21 Canon Kabushiki Kaisha Multi-media communication device
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
GB9218864D0 (en) * 1992-09-05 1992-10-21 Philips Electronics Uk Ltd A method of,and system for,transmitting data over a communications channel
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
IT1257431B (it) 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
DE4343366C2 (de) * 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5956624A (en) * 1994-07-12 1999-09-21 Usa Digital Radio Partners Lp Method and system for simultaneously broadcasting and receiving digital and analog signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013218360A (ja) * 2003-12-19 2013-10-24 Motorola Mobility Inc 音声符号化のための方法と装置

Also Published As

Publication number Publication date
DE69910239T2 (de) 2004-06-24
EP1125276A1 (en) 2001-08-22
ES2205892T3 (es) 2004-05-01
CN1328684A (zh) 2001-12-26
JP2002528983A (ja) 2002-09-03
CN1328681A (zh) 2001-12-26
DK1125285T3 (da) 2003-11-10
PT1125276E (pt) 2003-12-31
ES2205891T3 (es) 2004-05-01
ATE246836T1 (de) 2003-08-15
EP1125276B1 (en) 2003-08-06
BR9914889A (pt) 2001-07-17
WO2000025298A1 (en) 2000-05-04
RU2219507C2 (ru) 2003-12-20
DK1125286T3 (da) 2004-04-19
EP1125286A1 (en) 2001-08-22
AU6457199A (en) 2000-05-15
EP1125284B1 (en) 2003-08-06
HK1043234B (zh) 2004-07-16
CA2347735C (en) 2008-01-08
WO2000025304A1 (en) 2000-05-04
JP2002528777A (ja) 2002-09-03
EP1125286B1 (en) 2003-12-17
PT1125284E (pt) 2003-12-31
KR100417634B1 (ko) 2004-02-05
EP1125285A1 (en) 2001-08-22
CN1328683A (zh) 2001-12-26
KR20010099763A (ko) 2001-11-09
NO319181B1 (no) 2005-06-27
NO318627B1 (no) 2005-04-18
JP2002528776A (ja) 2002-09-03
NO20012067D0 (no) 2001-04-26
AU752229B2 (en) 2002-09-12
CA2347667A1 (en) 2000-05-04
NO20012068L (no) 2001-06-27
NO317603B1 (no) 2004-11-22
EP1125284A1 (en) 2001-08-22
US6807524B1 (en) 2004-10-19
US6795805B1 (en) 2004-09-21
DK1125276T3 (da) 2003-11-17
CN1127055C (zh) 2003-11-05
DE69913724D1 (de) 2004-01-29
BR9914890B1 (pt) 2013-09-24
US20050108005A1 (en) 2005-05-19
ZA200103367B (en) 2002-05-27
PT1125285E (pt) 2003-12-31
CA2347667C (en) 2006-02-14
CN1165891C (zh) 2004-09-08
WO2000025303A1 (en) 2000-05-04
DE69910058D1 (de) 2003-09-04
ATE246834T1 (de) 2003-08-15
JP3936139B2 (ja) 2007-06-27
WO2000025305A1 (en) 2000-05-04
CA2252170A1 (en) 2000-04-27
ZA200103366B (en) 2002-05-27
JP3869211B2 (ja) 2007-01-17
HK1043234A1 (en) 2002-09-06
ATE256910T1 (de) 2004-01-15
US7260521B1 (en) 2007-08-21
NO20012067L (no) 2001-06-27
AU6456999A (en) 2000-05-15
CA2347668C (en) 2006-02-14
CA2347735A1 (en) 2000-05-04
BR9914890A (pt) 2001-07-17
AU6455599A (en) 2000-05-15
RU2217718C2 (ru) 2003-11-27
ES2207968T3 (es) 2004-06-01
CN1328682A (zh) 2001-12-26
NZ511163A (en) 2003-07-25
MXPA01004181A (es) 2003-06-06
CA2347743A1 (en) 2000-05-04
AU6457099A (en) 2000-05-15
US20050108007A1 (en) 2005-05-19
CA2347743C (en) 2005-09-27
BR9914889B1 (pt) 2013-07-30
JP3490685B2 (ja) 2004-01-26
KR100417836B1 (ko) 2004-02-05
US8036885B2 (en) 2011-10-11
KR20010090803A (ko) 2001-10-19
NO20012066L (no) 2001-06-27
DK1125284T3 (da) 2003-12-01
DE69913724T2 (de) 2004-10-07
CN1165892C (zh) 2004-09-08
KR20010099764A (ko) 2001-11-09
PT1125286E (pt) 2004-05-31
NO20012066D0 (no) 2001-04-26
ES2212642T3 (es) 2004-07-16
EP1125285B1 (en) 2003-07-30
AU763471B2 (en) 2003-07-24
DE69910058T2 (de) 2004-05-19
DE69910240D1 (de) 2003-09-11
US20060277036A1 (en) 2006-12-07
MXPA01004137A (es) 2002-06-04
JP3566652B2 (ja) 2004-09-15
US7151802B1 (en) 2006-12-19
NO20012068D0 (no) 2001-04-26
ATE246389T1 (de) 2003-08-15
CA2347668A1 (en) 2000-05-04
US20100174536A1 (en) 2010-07-08
US7672837B2 (en) 2010-03-02
CN1172292C (zh) 2004-10-20
DE69910239D1 (de) 2003-09-11
NO20045257L (no) 2001-06-27
KR100417635B1 (ko) 2004-02-05
DE69910240T2 (de) 2004-06-24

Similar Documents

Publication Publication Date Title
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R150 Certificate of patent or registration of utility model

Ref document number: 3490685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term