JP2002542648A - 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 - Google Patents

合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化

Info

Publication number
JP2002542648A
JP2002542648A JP2000611392A JP2000611392A JP2002542648A JP 2002542648 A JP2002542648 A JP 2002542648A JP 2000611392 A JP2000611392 A JP 2000611392A JP 2000611392 A JP2000611392 A JP 2000611392A JP 2002542648 A JP2002542648 A JP 2002542648A
Authority
JP
Japan
Prior art keywords
noise
synthesis filter
signal
quantization
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000611392A
Other languages
English (en)
Other versions
JP2002542648A5 (ja
JP4643019B2 (ja
Inventor
ユーベル、アニル・ワマンラオ
デビッドソン、グラント・アレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2002542648A publication Critical patent/JP2002542648A/ja
Publication of JP2002542648A5 publication Critical patent/JP2002542648A5/ja
Application granted granted Critical
Publication of JP4643019B2 publication Critical patent/JP4643019B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 分析及び合成フィルタを用いる多くの知覚分割帯域符号化システムは、分割帯域信号を量子化することによって導入される量子化雑音が合成フィルタを量子化分割帯域信号に適用することによって得られる出力信号を結果として生じる雑音として実質的に同一であると想定する。一般に、この想定は正しくない。なぜならば、合成フィルタは、量子化雑音を変更するか、又は広げるからである。合成フィルタ雑音の広がりを説明する最適なビット割当てを得るための理論的な枠組みが開示される。概念では、最適なビット割当てを見出すことの問題が多次元座標空間で線形最適化問題として表現され得る。適度の計算リソースを用いてほとんど最適な解を得ることができるこの理論的枠組みから得られる単純化処理が開示される。

Description

【発明の詳細な説明】
【0001】 発明の技術分野 本発明は、一般的に、符号化のための分析フィルタと複合化のための合成フィ
ルタを用いるデジタル音声信号の知覚符号化に関する。本発明は、より詳細には
、合成フィルタによって量子化雑音の広がりを考慮する知覚コーダにおけるサブ
バンド信号の量子化に関する。
【0002】 発明の背景技術 伝送チャネルで低い情報能力所要量を負わせる形式でデジタル音声信号を符号
化するための継続する関心がある。記憶媒体は、もう高レベルの主観的品質で符
号化音声信号を伝達することができる。知覚符号化システムは、結果として生じ
る量子化雑音をマスクあるいは聞こえないようにするための音声信号内のより大
きいスペクトル成分を用いる方法で音声信号を符号化及び量子化する処理を用い
ることによって、これらの矛盾する目的を達成しようと試みる。一般に、符号化
される信号の音響心理学的マスク閾値以下にあるように、量子化雑音スペクトル
の形状及び振幅を制御することが有利である。
【0003】 知覚符号化処理は、人の聴覚システムの臨界帯域と釣り合う帯域幅を有するサ
ブバンド信号を得るために、分析フィルタのバンクを音声信号に適用するいわゆ
る分割帯域符号器によって実行されてもよく、サブバンド信号に、あるいは音声
信号スペクトル内容の何か他の測定に各モデルを適用することによって音声信号
のマスク閾値を評価し、結果として生じる量子化雑音がちょうど音声信号の評価
されたマスク閾値以下になるように十分小さい各サブバンド信号を量子化するた
めの量子化解像度を確立して、量子化サブバンド信号を伝送又は記憶に適した形
式にアセンブルすることによって符号化信号を生成する。補足的知覚復号化処理
は、符号化信号から量子化サブバンド信号を抽出する分割帯域デコーダによって
実行されてもよく、量子化サブバンド信号の非量子化表現を得て、オリジナル音
声信号から理想的に、知覚的に識別できない音声信号を生成するために、非量子
化表現に合成フィルタのバンクを適用する。
【0004】 量子化解像度を決定するためにしばしば用いられる知覚モデルは、一般に、量
子化サブバンド信号に導入される量子化雑音が量子化サブバンド信号に合成フィ
ルタのバンクを適用することによって得られる出力信号を結果として生じる雑音
と実質的に同一であると想定する。一般に、この仮定は正しくない。なぜならば
、合成フィルタは、量子化雑音スペクトルを変更し、あるいは広げるからである
。結果として、これらの知覚モデルを適用することによって得られる量子化解像
度に従って厳密に実行される量子化は、通常、合成フィルタから得られる出力信
号に可聴雑音を結果として生じる。
【0005】 この雑音伸長現象は、分析及び合成フィルタの多種多様な実施のために本質的
である。これらの実施は、多層フィルタ、格子フィルタ、直交鏡フィルタ、多種
多様なフーリエ級数型変換を含む種々の時間領域から周波数領域へのブロック変
換、コサイン変調フィルタバンク変換及びウェーブレット変換を含む。利便性の
ため、本発明での使用に適した信号分析及び信号合成技術は、それぞれ、分析フ
ィルタ及び合成フィルタの適用としてここではすべて言及される。変換実施では
、サブバンド信号は、それぞれ、1以上の周波数領域変換係数のグループを包含
する。
【0006】 上述の合成フィルタ雑音伸長特性は、これらの符号化システムで使用される補
足的分析及び合成フィルタが、通過帯域にフラットなユニタリー利得、阻止帯に
ゼロ利得、及び阻止帯と通過帯域の間に非常に急な遷移を有する理想的フィルタ
を実施しない事実と関係がある。結果として、分析フィルタは、入力音声信号の
スペクトル内容のゆがんだ測定のみを提供する。さらに、直交鏡フィルタ(QM
F)や時間領域エイリアシング相殺(TDAC)変換のようなフィルタは、入力
信号のスペクトル測定を更にゆがめる重要なエイリアシングアーティファクトを
生成する。原則として、これらのアーティファクト及び完全なフィルタからのず
れは無視され得る。なぜならば、合成フィルタが分析フィルタの歪曲を反転し、
オリジナルの入力信号を完全に復元することができる補足的な分析及び合成フィ
ルタの対が用いられ得るからである。
【0007】 完全な復元は、原則として可能であるけれども、それは実用的な符号化システ
ムで達成されない。なぜならば、完全な復元は、合成フィルタによって生成され
るサブバンド信号の正確な表現を受け取るために、合成フィルタを必要とする。
その代わりに、合成フィルタは、上述の量子化処理によって導入される重要なエ
ラーを持つ表現を受け取る。結果として、サブバンド信号量子化は、合成フィル
タによって復元される信号に雑音として現れるエラーを導入する。そっくりその
まま参照によってここに組み込まれる米国特許第5,623,577号に開示さ
れるように、サブバンド信号の量子化エラーは、量子化サブバンド信号の周波数
サブバンドよりも広くあり得る周波数の範囲に合成フィルタによって広げられる
【0008】 残念ながら、上述のような知覚符号化処理は、最適な方法でサブバンド信号を
量子化しない。なぜならば、量子化処理は、合成フィルタで起こる雑音伸長処理
に対する適切な考察を含まない。米国特許第5,301,255号に開示の符号
化技術は、分析フィルタの出力の多くを破壊することによって生成されるエイリ
アシングのある許容値を含むが、これらの技術は、合成フィルタに広がる雑音の
許容値を提供しない。結果として、これらの処理は、量子化雑音を聞き取れなく
する量子化解像度を過大評価する。この欠乏は、正確な知覚モデルが示すよりも
低い評価されたマスク閾値のレベルを強要するか、正確な知覚モデルが示すもの
が量子化雑音を聞き取れなくするのに十分である以下の量子化解像度を一様に減
少することのいずれかによって、ある程度補償され得る。いずれの補償の形式も
最適ではない。なぜならば、それらは、欠乏の原因を適切に説明しないからであ
る。
【0009】 米国特許第5,623,577号は、合成フィルタの雑音伸長効果を補償する
いくつかの技術を開示する。開示技術の理論的基準は、雑音伸長の程度が合成フ
ィルタ周波数応答を持つ量子化雑音スペクトルをからみつけることによって決定
され得ると想定する。技術の開示された実施例は、合成フィルタ雑音伸長の補償
が評価マスク閾値の周波数領域を経験的に決定される閾値と比較することによっ
て要求されるか否かを決定する。残念ながら、これらの技術は最適ではない。な
ぜならば、補償が必要とされるか否かを決定する精度は、最適状態に及ばず、必
要な経験的閾値を得るために要求されるステップは、高価で時間がかかり、開示
技術は、QMF及びTDAC変換のような合成フィルタに含まれる重なり加える
処理の効果を考慮に入れないからである。それに加えて、開示技術は、実施の形
態を実行するのに要求される計算リソースに対しての補償の精度を優雅にトレー
ドオフする特定の実施の形態のための能力を提供しない。
【0010】 発明の開示 本発明の目的は、合成フィルタに広がる雑音を正確に補償する量子化処理を提
供することによって分析及び合成フィルタを用いる知覚符号化システム及び方法
の能力を改善することである。
【0011】 本発明の有利な実施の形態は、他の既知の方法よりも正確な方法で雑音伸長補
償の必要性を決定し、補償の精度と補償を提供するのに必要な計算リソースのレ
ベルとの間の優雅なトレードオフを提供することができる。
【0012】 本発明の一態様によれば、方法又は装置は、合成フィルタから得られる出力信
号のサブバンドにおける評価雑音レベルを得るために、入力信号に応答して望ま
しい雑音スペクトルを生成し、合成フィルタ雑音伸長モデルを適用することによ
って、入力信号に適用される分析フィルタから得られるサブバンド信号のための
量子化解像度を決定する。合成フィルタ雑音解析モデルは、合成フィルタの雑音
伸長特性を表し、量子化解像度は、評価雑音レベルを持つ望ましい雑音スペクト
ルの比較が1以上の比較基準を満足するように決定される。その方法は、装置に
よる実行のために装置によって読取可能な媒体の命令のプログラムとして具体化
されてもよい。
【0013】 本発明のもう一つの態様によれば、媒体は、分析フィルタを入力信号に適用す
ることによって生成されるサブバンド信号の量子化成分を表す符号化情報、及び
量子化サブバンド信号成分の量子化解像度を表す制御情報を伝送する。量子化解
像度は、上記に要約されるように決定される。
【0014】 本発明の更にもう一つの態様によれば、装置は、上記で要約された符号化情報
を伝送する信号を受信し、復号化する。受信器は、符号化情報を伝送する信号に
接続される入力と、信号情報及び制御情報を抽出し、そこから量子化サブバンド
信号成分及び量子化サブバンド信号成分の量子化解像度を得て、非量子化サブバ
ンド信号を得るための量子化解像度に従って量子化サブバンド信号成分を非量子
化し、出力信号を生成するために、非量子化サブバンド信号に合成フィルタを適
用する入力に接続される1以上の処理回路とを備える。サブバンド信号の量子化
雑音は、望ましい雑音スペクトルを持つ1以上の比較基準を概ね満足する出力信
号のサブバンドの雑音レベルを作り出すために、合成フィルタによって広げられ
る。出力は、出力信号を伝送する1以上の処理回路に接続される。
【0015】 本発明の種々の機能及びその好ましい実施の形態は、以下の議論及び同様な参
照数字がいくつかの図に同様な要素に言及する添付図面を参照することによって
より良く理解され得る。以下の議論及び図面の内容は、単に例として示されるの
みであり、本発明の範囲の制限を表すと理解すべきではない。
【0016】 発明を実行するモード A.概要 1.符号器 図1Aは、分析フィルタ12のバンクが経路13に沿って周波数サブバンド信
号を生成するために経路11から受信したデジタル音声信号に適用される、本発
明の種々の態様を具体化する分割帯域符号器の一実施の形態を示す。分析フィル
タのバンクは、多種多様の方法で実行されてもよい。好ましい実施の形態では、
フィルタのバンクは、分析ウィンドウ関数を持つデジタル音声サンプルの重畳ブ
ロックに重み付けをするか又は変調することによって、及び特定の修正された離
散コサイン変換(MDCT)をウィンドウ重み付けブロックに適用することによ
って実行される。このMDCTは、時間領域エイリアシング相殺(TDAC)変
換として言及され、1987年5月のProc. Int. Conf. Acoust., Speech, and
Signal Proc.の2161〜2164頁におけるPrincen、Johnson及びBradleyの
「時間領域エイリアシング相殺に基づくフィルタバンク設計を用いるサブバンド
/変換符号化」に開示される。
【0017】 示される好ましい実施の形態では、望ましい雑音レベル計算機14は、音声信
号の音響心理学的マスク閾値を評価し、これに応答して望ましい雑音レベルを得
るために、経路11から受信されるデジタル音声信号を分析する。好ましい実施
の形態では、望ましい雑音レベルは、1979年12月の1647〜1652頁
におけるJ. Acoust. Soc. Am.のSchroeder、Atal及びHallの「人の耳のマスク特
性を開発することによる最適化デジタルスピーチコーダ」及び米国特許5,62
3,577号に開示されるような良い知覚モデルを用いて得られる音響心理学的
マスク閾値に概ね等しいレベルで確立される。本発明を実施するために原則とし
て決定的な特定の技術はないけれども、実際の実行の性能は、一般に、マスク閾
値の正確な評価を提供できる高性能の知覚モデルを用いることによって拡張され
る。
【0018】 望ましい雑音レベル計算機14から受信した望ましい雑音レベルに応じて、量
子化解像度計算機15は、サブバンド信号を量子化するために用いる量子化解像
度を決定するために雑音伸長モデルを用い、経路16に沿ってこれらの量子化解
像度の指示を渡す。雑音伸長モデルは、合成フィルタのバンクの雑音伸長特性を
表し、量子化解像度に従って量子化されるサブバンド信号に合成フィルタを適用
することによって得られる出力信号内の雑音を評価するために用いられる。量子
化解像度計算機15は、雑音伸長モデルに従って、合成フィルタから得られる出
力信号が望ましい雑音レベルに概ね等しい量子化から生じる雑音レベルを有する
ように、量子化解像度を決定する。
【0019】 量子化器17は、経路18に沿って量子化信号を生成するために、経路16か
ら受信される量子化解像度情報に従って、経路13から受信されるサブバンド信
号を量子化する。量子化17は、線形量子化、対数量子化、ロイド−マックス(
Lloyd-Max)量子化及びベクトル量子化を含む一様な又は不均一の増分を用いる
種々の量子化関数によって実行されてもよい。量子化17によって供給される量
子化の解像度は、量子化ステップ数を変え、所定のステップ数によって表される
動的範囲を変え、及び/又は各量子化ステップによって表される値を変えること
によって制御されてもよい。いくつかの実施の形態では、量子化ステップ数は、
多くのビットを割当て、対応するステップ数を持つ量子化器を選択することによ
って変更される。特定の実施の形態で用いられる特定の量子化の形式が性能面で
十分な効果を有し得るけれども、特定の量子化関数が本発明の実行に原則として
重要ではない。
【0020】 フォーマッタ19は、量子化信号を符号化信号にアセンブルし、ベースバンド
や超音波から紫外周波数までを含むスペクトル中の変調通信経路のような伝送媒
体、あるいは、磁気テープ、磁気ディスク及び光学式ディスクを含むあらゆる磁
気又は光学記録技術を品質的に用いて情報を運ぶものを含む記憶媒体によって伝
送される経路20に沿って符号化信号を渡す。
【0021】 後方適応性のある実施の形態では、望ましい雑音レベル計算機14によって用
いられる信号特性の指示は、経路21に沿って渡され、符号化信号にアセンブル
される。前方適応性のある実施の形態では、経路21と経路21に沿って渡され
る情報のどちらも必要でない。なぜならば、量子化信号を生成するために用いら
れる量子化解像度の指示は、符号化信号にアセンブルされる。フォーマッタ19
は、また、符号化信号の情報容量要求を減らすために、エントロピ符号器又は他
の形式の損失のない符号器を用いてもよい。
【0022】 図1Bは、上述の実施の形態に類似する本発明の種々の態様を具体化する分割
帯域符号器のもう一つの実施の形態を示す。これら2つの実施の形態間の少しの
相違がここで論じられる。
【0023】 分析フィルタ12のバンクは、経路13に沿って周波数サブバンド信号を生成
し、経路22に沿って入力信号スペクトル包路を表す情報を生成するために、経
路11から受信されるデジタル音声信号に適用される。例えば、サブバンド信号
成分は、ブロック浮動小数点(BFP)形式で表されてもよい。ここで、BFP
指数は、本質的に、各サブバンドのピーク成分値を表す対数換算係数である。B
FP指数は、入力信号スペクトル包路情報として用いられてもよい。合成フィル
タのバンクは、上述のような多種多様な方法で実行されてもよい。
【0024】 望ましい雑音レベル計算機14は、音声信号の音響心理学的マスク閾値を評価
し、それに対する応答で望ましい雑音レベルを得るために、経路22から受信さ
れるスペクトル包路情報を分析する。望ましい雑音レベル計算機14から受信さ
れる望ましい雑音レベルに応じて、量子化解像度計算機15は、サブバンド信号
を量子化するために使用する量子化解像度を決定するために、上記で説明される
ような雑音伸長モデルを用い、経路16に沿ってこれらの解像度の指示を渡す。
【0025】 量子化器17は、経路18に沿って量子化信号を生成するために、経路16か
ら受信される量子化解像度情報に従って経路13から受信されるサブバンド信号
を量子化する。量子化器17は、上述のように実行し、制御されてもよい。フォ
ーマッタ19は、経路18から受信される量子化信号及び経路22から受信され
るスペクトル包路情報を符号化信号にアセンブルし、上記で説明されるように経
路20に沿ってその符号化信号を渡す。フォーマッタ19は、また、上述のよう
に、エントロピ符号器又は損失のない他の形式の符号器を用いてもよい。
【0026】 図1Bに示される実施の形態は、後方適応性のある符号化システムで用いられ
得る。なぜならば、望ましい雑音レベル計算機によって必要とされる情報は、ス
ペクトル包路情報によって符号化信号で伝送されるからである。望ましい雑音レ
ベル計算機14及び量子化解像度計算機15に相対成分を組み合わす補足的な復
号器による追加の情報は必要でない。もう一つの実施の形態では、望ましい雑音
レベル計算機14は、一組の初期の量子化解像度を供給し、量子化解像度計算機
15は、上述の合成フィルタ雑音伸長モデルに従って雑音伸長補償を実行するの
に必要な、1以上のこれらの初期の解像度を変更する。これらの変更の指示は、
経路23に沿って渡され、フォーマッタ19によって符号化信号にアセンブルさ
れる。この追加の情報を含むことによって、符号化信号は、合成フィルタ雑音伸
長モデルを使用することなく復号され得る。
【0027】 2.復号器 図2Aは、本発明の種々の態様を具体化する分割帯域復号器の一実施の形態を
示す。ここでは、デフォーマッタ32は、経路31から受信される符号化信号か
ら量子化信号を抽出し、経路33に沿って量子化信号を渡す。デフォーマッタ3
2は、また、量子化信号を得るために必要な、エントロピ復号器又は損失のない
他の形式の復号器を用いてもよい。
【0028】 示される実施の形態では、デフォーマッタ32は、また、比較符号器で望まし
い雑音レベル計算機によって用いられる信号特性の指示を符号化信号から抽出し
、それに対する応答で望ましい雑音レベルを得る望ましい雑音レベル計算機34
にこの指示を渡す。望ましい雑音レベル計算機34から受信される望ましい雑音
レベルに応じて、量子化解像度計算機35は、量子化信号を生成するために用い
られた量子化解像度を決定するために、上記で説明されるような雑音伸長モデル
を用い、経路36に沿ってこれらの解像度の指示を渡す。
【0029】 非量子化器37は、経路36から受信される量子化解像度情報に従って経路3
3に沿って受信される量子化信号を非量子化し、経路38に沿って非量子化サブ
バンド信号を生成する。非量子化器37は、量子化のために上述されるような種
々の方法で実行及び制御されてもよい。特定の非量子化関数は、本発明の実施の
ために原則として重要ではないが、量子化サブバンド信号を生成するために用い
られる量子化処理に補足的であるべきではない。
【0030】 合成フィルタ39のバンクは、経路40に沿って出力信号を生成するために、
これらの非量子化サブバンド信号に適用される。合成フィルタのバンクは、多種
多様な方法で実行され得る。好ましい実施の形態では、合成フィルタのバンクは
、逆TDAC変換として言及される、逆MDCTを変換係数のブロックに適用し
、合成ウィンドウ関数でその変換から得られる信号サンプルを重み付けし、直前
のウィンドウ重み付けブロックにサンプルを重畳して加えることによって実行さ
れる。
【0031】 図示しない前方適応性のあるシステムでは、望ましい雑音レベル計算機34と
量子化解像度計算機35のいずれも必要ではない。なぜならば、デフォーマッタ
32は、符号化信号から量子化解像度情報を抽出し、この情報を量子化器37に
供給できるからである。
【0032】 図2Bは、上述の実施の形態に類似する本発明の種々の態様を具体化する分割
帯域復号器のもう一つの実施の形態を示す。これらの2つの実施の形態のいくつ
かの相違がここで論じられる。
【0033】 デフォーマッタ32は、経路31から受信される符号化信号から量子化信号を
抽出して経路33に沿ってその量子化信号を渡し、符号化信号スペクトル包路を
表す情報を抽出してこの情報を経路42に沿って渡す。デフォーマッタ32は、
また、符号化信号を生成するために用いられるあらゆる損失のない符号化を反転
するのに必要な、エントロピ復号器又は損失のない他の形式の復号器を用いる。
望ましい雑音レベル計算機34は、それに対する応答で望ましい雑音レベルを得
る、経路42から受信されるスペクトル包路情報を分析する。
【0034】 望ましい雑音レベル計算機34から受信される望ましい雑音レベルに応じて、
量子化解像度計算機35は、量子化信号を生成するために用いられた量子化解像
度を決定するために、上記で説明されるような雑音伸長モデルを用い、経路36
に沿ってこれらの解像度の指示を渡す。非量子化器37は、経路36から受信さ
れる量子化解像度情報に従って経路33から受信される量子化信号を非量子化し
、経路38に沿って非量子化サブバンド信号を生成する。非量子化器37は、上
述のように実行及び制御されてもよい。合成フィルタ39のバンクは、経路40
に沿って出力信号を生成するために、非量子化サブバンド信号及びスペクトル包
路情報に適用される。
【0035】 図2Bに示される実施の形態は、後方適応性のある符号化システムに用いられ
てもよい。なぜならば、望ましい雑音レベル計算機によって必要とされる情報は
、スペクトル包路情報によって符号化信号に運ばれるからである。追加の情報は
必要とされない。図示しないもう一つの実施の形態では、望ましい雑音レベル計
算機34は、一組の初期の量子化解像度を供給し、これらの初期の解像度への1
以上の変更は、デフォーマッタ32によって符号化信号から得られる。これらの
変更は、雑音伸長補償を提供するために初期の量子化解像度に適用されてもよい
【0036】 B.フィルタ特性 上記のように、本発明の原理は、知覚符号化システムの実施の形態及び種々の
方法で分析及び合成を実行する方法に組み込まれてもよい。しかしながら、議論
の容易さのために、以下の記述は、TDAC変換実施例のより特定な説明を挙げ
る。TDAC変換の効率的な手段は、米国特許第5,297,236号及び第5
,890,106号に開示される。
【0037】 多くの知覚符号化システムの量子化処理は、サブバンド信号の振幅と、そのサ
ブバンド内の評価音響心理学的マスク閾値のレベルとの間の相違からサブバンド
信号を量子化するために使用する量子化解像度を決定する。この処理の暗黙の仮
定は、一変換係数の量子化雑音が他の隣接する変換係数の量子化雑音から独立し
ているということである。一般に、この仮定は、合成フィルタの雑音伸長特性の
ために、真実ではない。
【0038】 雑音伸長の程度は、合成フィルタのスペクトル選択性によって影響を受ける。
上記で説明したように、符号化システムに用いられる分析及び合成フィルタは、
理想的な通過帯域を提供しない。仮想合成フィルタの周波数応答の例示が図3に
示される。その図に示される応答は、周波数fで一つのスペクトル成分を有す
る入力信号に応答して合成フィルタから得られる仮想出力信号を示す周波数領域
である。周波数fを中心とする周波数応答の主ローブ23は、フィルタ通過帯
域である。その応答のより小さいサイドローブは、フィルタ阻止帯にある。
【0039】 このスペクトル選択性は、逆変換の長さと合成ウィンドウ関数の形状を含む多
くの因子を変えることによって制御されてもよい。合成ウィンドウ関数の形状を
変えることによって、通過帯域の幅は、阻止帯で供給される減衰のレベルに対し
てしばしば交換され得る。主ローブの幅がより高いスペクトル選択性を供給する
ことを減らされるので、阻止帯の減衰も同じく減らされる。スペクトル選択性は
、また、変換の長さを増加することによって増加され得る。しかしながら、より
長い変換の使用が常に可能ではない。例えば、復号された信号のリアルタイム再
生を必要とする放送及び他の製品用途では、短い長さ変換が、符号化遅延制限を
満足するために用いられなければならない。合成フィルタの雑音伸長特性は、そ
のような符号化システムで特に重大である。低遅延符号化システムのための追加
の考察は、米国特許第5,222,189号で論じられる。
【0040】 雑音伸長の重要性は、通常、低周波数の媒体でより重大である。なぜならば、
人の聴覚システムの臨界帯域は、周波数が低いほど狭いからである。各臨界帯域
は、その帯域内のスペクトル成分のためのマスク閾値に対応し、主要なスペクト
ル成分が量子化雑音のような他のより小さいスペクトル成分をおそらくマスクで
きる周波数の範囲を表す。より低い周波数において、マスク閾値は、合成フィル
タの周波数選択性よりも狭くなり得る。これは、合成フィルタが、そのスペクト
ル成分のマスク閾値外のスペクトル成分の量子化から生じる雑音を広げる見込み
があることを意味する。
【0041】 図4Aは、図3に示されるフィルタ周波数応答に比較されるように、周波数f における高周波数スペクトル成分の知覚マスク閾値25の概略図を提供する。
示されるように、周波数fにおける高周波数スペクトル成分のマスク閾値25
は、合成フィルタ応答を完全にカバーするのに十分広い。これは、合成フィルタ
によって広げられる周波数fにおける高周波数スペクトル成分の量子化から生
じる比較的大きい雑音がそのスペクトル成分によってマスクされる可能性が高い
ことを暗示する。
【0042】 図4Bは、図3に示されるフィルタ周波数応答に比較されるように、周波数f における中から低周波数スペクトルまでの知覚マスク閾値27の概略図を提供
する。示されるように、周波数fにおけるより低い周波数スペクトル成分のマ
スク閾値27の低周波数側は、合成フィルタ応答をカバーしない。これは、合成
フィルタによって広げられる周波数fにおけるより低い周波数スペクトル成分
の量子化から生じる比較的小さい雑音が、そのスペクトル成分によってマスクさ
れる可能性が高いことを暗示する。
【0043】 C.分析的概念 本発明における量子化処理は、量子化雑音を聞き取れなくするのにちょうど申
し分ない十分な量子化解像度を確立するために、合成フィルタの雑音伸長特性を
考慮に入れる。この処理の分析的基礎の説明が以下のパラグラフで提供される。
【0044】 1.イントロダクション 図5において、分析フィルタ52は、経路51から受信される音声信号の周波
数領域指示を構成する変換係数を生成する分割帯域符号器内における分析フィル
タのバンクを表す。量子化雑音53は、分析フィルタ52から得られる周波数領
域指示に量子化雑音を注入する処理を表す。合成変換54と重畳加重(overlap-
add)55は、分割帯域復号器の合成フィルタのバンクを集合的に表す。合成変
換54は、音声信号の量子化周波数領域指示から時間領域支持を得る。重畳加重
55によって実行される処理は、合成変換54から得られる時間領域指示のサン
プルの隣接するブロックを重畳し、重畳されたブロックの対応するサンプルを加
重する。分析フィルタ56は、本発明のいくつかの原理を説明するために用いら
れる理論的構成である。
【0045】 分析フィルタ52のバンクは、適当な分析ウィンドウ関数及びTDACのMD
CTによって実行され、変換係数の一連のブロックの形状におけるサブバンド信
号を生成するために、経路51から受信される音声信号サンプルの一連のブロッ
クに適用される。これは、以下のように表現され得る:
【式1】 ここで、X(k)=変換係数ブロックm内の変換係数k; w(n)=ポイントnにおける分析ウィンドウ関数; x(n)=信号サンプルブロックm内の信号サンプルn; n=エイリアシング相殺に要求される変換位相項; k=この特定のTDAC変換のための1/2に等しい項; 2M=変換の長さである。
【0046】 量子化雑音53は、指定された量子化解像度に従って変換係数を量子化するこ
とによって、各変換係数に雑音を加える処理を表す。これは、量子化変換係数の
一連のブロックを含む量子化信号を結果として生じる。これは、以下のように表
現され得る:
【式2】
【0047】 合成変換54は、TDAC逆MDCT及び適当な合成ウィンドウ関数によって
実行され、時間領域サンプルの一連のブロックを生成するために、量子化変換係
数の一連のブロックに適用される。これは、以下のように表現され得る:
【式3】
【0048】 重畳加重55は、合成変換54から得られる合成ウィンドウ関数を時間領域サ
ンプルの各ブロックに適用し、ウィンドウ化されたブロックを重畳し、重畳ブロ
ック内の対応する時間領域サンプルを加えることによって、経路51から受信さ
れる音声信号サンプルの複製を回復する。一連の重畳ウィンドウかブロックの利
得プロフィールが図6に示される。曲線41は、直線44と同一の広がりを持つ
時間領域サンプルのブロックを変調するために用いられる合成ウィンドウ関数の
利得プロフィールを示す。同様に、曲線42及び43は、それぞれ、曲線45及
び46と同一の広がりを持つ時間領域サンプルのブロックを変調するために用い
られる合成ウィンドウ関数の利得プロフィールを示す。直線45によって示され
る間隔内のオリジナル音声信号サンプルの複製を表す信号サンプルは、重畳ウィ
ンドウ化ブロック41、42及び43の対応する時間領域サンプルを加えること
によって、重畳加重処理から得られる。これは、以下のように表現され得る:
【式4】 TDAC変換を用いる実施の形態では、分析及び合成ウィンドウ関数は、エイリ
アシング相殺を提供するのに必要な制約を満足するために選択されるべきである
。上記で引用したPrincen論文を見よ。分析及び合成ウィンドウ関数に関する追
加の情報は、米国特許第5,222,189号及び1998年10月17日に出
願された国際特許出願番号PCT/US第98/20751号から得られること
ができる。
【0049】 分析フィルタ56のバンクは、本質的にあらゆるタイプの分析フィルタによっ
て実行されてもよい。説明の目的のため、分析フィルタのこのバンクは、直交分
析ウィンドウ関数及び分析フィルタ52のために上述されたTDACのMDCT
によって実行される。分析フィルタ56のバンクは、経路57に沿って渡される
複製信号の仮想周波数領域指示を得るために、複製信号サンプルに適用される。
周波数領域指示は、合成フィルタの雑音伸長特性の分析的表現のための基礎とし
て用いられる。その指示は、以下のように表現され得る:
【式5】
【0050】 量子化雑音が合成変換54に適用される入力信号に存在しないならば、式3か
ら得られる時間領域サンプルのブロックは、オリジナル入力信号内の信号サンプ
ルの完全な再構成を得るために、式4に示されるように重畳され加重され得る。
これは、以下のように表現され得る:
【式6】
【0051】 2.量子化問題の新たな陳述 分析フィルタ56から得られるこれら2つの仮想周波数領域指示を用いて、分
析フィルタ52から得られる周波数領域指示を量子化するための最適な量子化解
像度は、以下のような量子化雑音53によって注入される雑音の振幅を制御する
処理に関して表現され得る。
【0052】
【式7】 ここで、N(k)=変換係数kのための望ましい雑音レベル。
【0053】 以下の仮定は、量子化雑音のためになされる: 1.種々の変換係数kのための量子化雑音I(k)は、統計的に独立である。
2.種々の係数ブロックmのための量子化雑音I(k)は、統計的に独立であ
る。 3.それぞれの係数ブロックmの量子化雑音I(k)は、ゼロと等しい平均を
有し、連続的な係数ブロックと等しい分散を有する。 最初の2つの仮定は、音声符号化システムで一般に用いられる変換から得られる
係数にとって正しい。第3の仮定は、定常信号を表す変換係数のブロックにとっ
て正しく、周知の知覚符号化システム及び方法によってうまく量子化されない音
楽の準定常移動のために正当化される。第3の仮定が正当化されない大いに非定
常移動では、この仮定によって引き起こされるエラーは、一般に良性であり、無
視され得る。
【0054】 3.伸長行列 合成フィルタ雑音伸長を適切に考慮に入れる量子化のための処理は、合成フィ
ルタから得られる出力信号の雑音スペクトルと合成フィルタに供給される量子化
入力信号の雑音スペクトルとの間の関係の分析的表現から開発されてもよい。こ
の分析的表現又は「伸長行列」の導出がここで記述される。
【0055】
【式8】
【0056】 類似の式は、式7に同様に代入することによって、非量子化変換係数に関する
合成フィルタ出力信号の仮想周波数領域指示のために得られてもよい。その式は
以下のようになる:
【式9】 式9aから式9bを引くことによって、これら2つの出力信号間の相違の仮想
周波数領域指示が、得られることができる。それは、以下のように表現され得る
ここで、O(k)=周波数kにおける合成フィルタ出力信号の量子化雑音; 式2から分かるように、 式10の式は、以下のように、式8を書き直すために用いられ得る: 行列A、B及びCは、奇数対称性を有する。これらの特性は、以下のように示
すために用いられ得る、 それゆえ、式10が以下のように書き直され得る: ここで、A’(k,q)=2A(k,q); B’(k,q)=2B(k,q);及び C’(k,q)=2C(k,q)。
【0057】 量子化雑音の成分がゼロ平均を有する上述の3つの仮定が統計的に独立であっ
て、同様に分配される下で、合成フィルタの出力における雑音パワースペクトル
は、以下のように式13から得られることができる:
【式10】 ここで、E(z)=zの期待値; NO,m(k)=合成フィルタの出力における周波数kでの雑音パワー
【0058】 量子化雑音分散が連続的係数ブロックで等しいという上述の第3の仮定の下で
、式14は以下のように簡約され得る:
【式11】 ここで、W(k,q)=A”(k,q)+B”(k,q)+C”(k,q)。W
行列は、上記で言及される伸長行列である。
【0059】 4.最適量子化解像度 式8、11、14及び15において、最適量子化解像度が以下のような0≦q
<Mの量子化雑音スペクトル{Nl、m(q)}を結果として生じることが分か
【式12】 望ましい雑音と等しいために、直接解は、 残念ながら、この直接解は、1以上の変換係数kのための負解をもたらす。それ
は、望ましい雑音レベルN(k)の傾きがあまりに急なので、雑音の否定的量が
望ましい雑音のスペクトル形状を達成するために量子化処理に注入されなければ
ならないことを意味する。実用的に実施の形態において、雑音の否定的量を量子
化処理に注入することができない。幸いにも、式16は、同一性のために解決さ
れる必要がない。それが不等式を満足するならば、許容できる量子化解像度が理
解され得る。
【0060】 解決を達成するために、量子化雑音スペクトルは、以下のように、望ましい雑
音スペクトルに関して書き直され得る、 Nl,m(k)=g(k)・N(k) 0≦k<M (18) ここで、g(k)=利得率。雑音スペクトル及び利得率の仮想例のグラフはず8
に示される。そこでは、曲線71は、変換係数X(k)のブロックのためのス
ペクトルパワーのなめらかにされた基準であり、曲線72は、望ましい雑音スペ
クトルN(k)であり、曲線73は、利得率g(k)だけ望ましい雑音スペクト
ルを増やすことによって得られるブロックmの変換係数のための量子化雑音スペ
クトルNl,m(k)である。図に示されるように、利得率が通常0から1の範
囲にあることが予想される。
【0061】 a)2次元の例 図の容易さのため、2次元の例(M=2)は、利得率がどのように使用され得
るかを説明するために用いられる。式18を式16に代入することによって、以
下のように分かり得る: N(0)≧W(0,0)・g(0)・N(0)+W(0,1)・G(1)・N(1) (19b) N(1)≧W(1,0)・g(0)・N(0)+W(1,1)・g(1)・N(1) (19c) ここで、0<g(0)≦1及び0<g(1)≦1。
【0062】 g(0)=g(1)=0が常に2つの不等式を満足するけれども、この特定解
は許容できない。なぜならば、利得率の各ゼロ値は、それぞれの変換係数が無限
精度で量子化されなければならないことを意味するからである。好ましい解は、
可能な限り1に近い利得率の値をもたらす。実際に、ある解が1の値を有するす
べての利得率で実現され得るならば、合成フィルタ雑音伸長のための補償は必要
ない。
【0063】 最適な解を提供する利得率値の探索は、補償のコストを最小にしようと努める
線形的に制限される最適化問題として組み立てられ得る。多くの実施の形態では
、量子化雑音スペクトルが減らされる量の対数として、補償のコストを増加する
ことは都合がよい。量子化解像度を制御するためにビット割当てを用いる好まし
い実施の形態では、コストは、量子化雑音スペクトルが変化される各−6.02
dBの変換係数毎に1ビットと等しい。例えば、利得率g(1)が0.25に等
しく設定されるならば、量子化雑音スペクトルのNl,m(1)は、望ましい雑
音スペクトルのN(1)に関して−12.04dBによって変化される。変換係
数X(1)のこの雑音伸長補償のためのコストは、−12.04dB/−6.0
2dB=2ビットである。
【0064】 対数コスト関数を有するちょうど記述されるもののような実施の形態のために
、式18に示される望ましい量子化雑音スペクトルは、以下のように便利に表現
され得る: logNl,m(k)=log g(k)+logN(k) 0≦k<M (2
0) 補償のコストは、各利得率の対数で逆に変換する。したがって、この2次元の例
での補償のトータルコストは、−log g(0)−log g(1)に比例する
。議論の容易さにため、比例定数は、ここでは1に等しいものと想定される。最
適化問題の目的は、式19a、19b及び19cによって強制される条件下で補
償のコストを最小にすることである。
【0065】 線形最適化問題として量子化を構成する最初のステップは、式19a及び19
bの各N(j)・W(i,j)項を行列Dの要素D(i,j)に置き換えること
である。行列Dのすべての要素は、正であることが知られる。なぜならば、各要
素は、2つの正数の積で表すからである。この置換の結果は、以下のように表現
され得る: N(0)≧D(0,0)・g(0)+D(0,1)・g(1) (21a) N(1)≧D(1,0)・g(0)+D(1,1)・g(1) (21b)
ここで、0<g(0)≦1及び0<g(1)≦1 (21c)
【0066】 この方法で表現される最適化問題は、図7に示されるように、g(0)−g(
1)座標空間で幾何学的に示され得る。最適化問題に可能な解決の領域60は、
式21cに示されるように、2つの利得率のために認められた最小及び最大値に
対応する側面を有する座標空間の第I象限内の単位正方形に制限される。示され
る例では、原点を含む直線61の側面の領域は、式21aの不等号を満足する空
間の一部を表し、原点を含む直線62の側面上の領域は、式21bの不等号を満
足する空間の一部を表す。これらの3つの領域の共通部分によって表される解空
間66は、g(0)−g(1)座標空間の一部である。ここでは、最適化問題の
ための解は、式21a、21b及び21cによって強制されるすべての条件を満
たすことが見出され得る。解空間66の境界は、この例では、g(0)とg(1
)軸の一部、線61、及び領域60の単位正方形の上部と一致する側面を持つ不
規則な四辺形を形成する幅広線で示される。
【0067】 解空間が(1,1)座標を含むならば、最適量子化解像度は、1に等しいすべ
ての利得率を設定することによって得られる。なぜならば、補償は、合成フィル
タ雑音伸長のために必要とされないからである。図8において、これは、k=0
からk=(M−1)の変換係数の範囲を通して、望ましい雑音スペクトル72に
等しい量子化雑音スペクトルを設定することと同等である。(1,1)座標が解
空間に含まれないならば、処理は、1以上の利得率が1以下の値を有する解空間
内の利得率の最適なセットを見出すことによって最適な量子化解像度を見出すた
めに用いられ得る。これは、1以上の変換係数のための望ましい雑音スペクトル
72より小さい量子化雑音スペクトル73を得ることと同等である。
【0068】 利得率の最適なセットは、以下の式から計算される補償のコストKを最小にす
る: K=−log g(0)−log g(1) (22) この式は、g(0)−g(1)座標空間内の双曲線を画定し、雑音伸長補償の一
定コストKに対応する2つの利得率のための値の軌跡を表す。例えば、双曲線6
3は、補償のあるコストKのための曲線を表し、双曲線64は、Kより高い
もう一つの補償のコストのための曲線を表す。
【0069】 補償のコストが無限大に接近するにつれて、対応する一定コストの曲線は、2
つの座標軸に接近する。上述のように、最適化問題の目的は、式21a、21b
及び21cを満足する最小コスト解を見出すことである。最適解は、解空間を二
分する最低コスト双曲線を見出すことによって得られることができる。図7に示
される例では、最適解は、双曲線64と解空間66の境界の間の接線位置におい
て起こる。
【0070】 b)より高い次元 実用的知覚符号化システム及び方法は、2以上の次元を有する最適化問題を解
決するために、量子化処理を必要とするフィルタを利用する。この問題は、以下
の不等号を満足する解空間内の利得率のセット{g(k)}を見出すこととして
述べられ得る:
【式13】 ここで補償コストKが のように、0<g(k)≦1,0≦k<Mによって画定される単位超立方体。
【0071】 例えば、長さ256のTDAC変換が用いられるならば、最適化問題はM=1
28の次元を有する。この例では、可能な解の領域は、0又は1のいずれかに等
しい値を有する利得率に対応する座標を持つ頂点を有する超立方体に制限される
。最適化問題の解空間は、座標軸と原点に最も近い超平面の間にある超立方体の
一部である。最適化最小コストの解は、双曲線一定コスト超曲面と解空間の境界
の間の接線において見出される。
【0072】 量子化解像度の実質的に最適なセットは、図9に示されるような反復処理で得
られてもよい。ステップ81は、最初の量子化解像度のセットを得て、ステップ
82は、結果として生ずる雑音レベルを計算するために、合成フィルタ伸長モデ
ルをその最初の解像度に適用する。ステップ83は、計算された結果の雑音レベ
ルを望ましい雑音レベルと比較する。比較結果が許容できないならば、ステップ
84は、適切に量子化解像度を変更し、ステップ82は、雑音伸長モデルを変更
された解像度に適用する。例えば、信号成分の計算された結果の雑音レベルがあ
まりに低いならば、1以上の信号成分の量子化解像度は、より粗くされる。信号
成分のための計算された結果の雑音レベルがあまりに高いならば、1以上の信号
成分の量子化解像度は、より緻密になされる。この処理は、ステップ83で実行
される比較の結果が許容できるまで続けられる。その後、ステップ85は、許容
できる比較を提供した量子化解像度に従って信号成分を量子化する。
【0073】 本質的に、最初の量子化解像度のあらゆるセットが用いられ得る;しかしなが
ら、処理効率は、一般に、最適値に近い最初の解像度を選択することによって改
善される。最初のための一つの都合の良い選択は、望ましい雑音レベルに対応す
る解像度である。
【0074】 量子化処理は、以下のステップを実行するビット割当て処理によって実行され
てもよい: 1.式17を用いて各変換係数のための望ましい雑音パワーを計算することによ
って仮のビット割当てを決定する。各変換係数X(k)のための仮のビット割当
てQ(k)は、信号パワーの対数及びそれぞれの望ましい雑音パワーレベルの対
数に負号を付けたものから得られる。例えば、一実施の形態では、ビット割当て
は、以下のようになる:
【式14】 2.すべての係数の仮のビット割当てが正ならば、ビット割当て処理が完了し、
変換係数は、仮のビット割当てに従って量子化される。なぜならば、合成フィル
タ雑音伸長のための補償は必要ないからである。 3.ステップ1から得られる仮のビット割当てがあらゆる変換係数で負ならば、
雑音伸長補償が要求される。ビット割当て処理は、式24に従って単位超立方体
を画定することによって継続する。 4.式23の不等号を満足する超空間内の領域の共通部分を見出す。これは、原
点に最も近い行列Dの列によって画定される超平面だけを含むことによって一層
効率的に達成されてもよい。各超平面の距離dは、次式から決定され得る:
【式15】 一つの超平面は、その超平面の一部で原点に最も近くてもよく、1以上の他の超
平面は、超平面の他の部分で原点に最も近くてもよい。 5.ステップ3で画定された超立方体の共通部分とステップ4で見出された領域
の共通部分から解超空間を決定する。 6.最初の補償コストKを選択する。 7.コストKのための一定コストの双曲線の超曲面がステップ5で決定された解
超空間と交わるか否かを決定する。 8.コストKのための双曲線の超曲面が解超空間の境界に接するならば、ビット
割当てが完了する。雑音伸長のための最適な補償を提供する各変換係数X(k)
のための追加のビット数は、それぞれの利得率の対数に負号をつけたものから得
られる。例えば、一実施の形態では、各係数のためのビット割当ては、以下のよ
うになる:
【式16】 9.双曲線の超曲面が解超空間と交わらないならば、現在のコストKより高いコ
ストを選択し、ステップ7に続く。 10.双曲線の帳票面が解超空間と交わるならば、現在のコストKより低いコス
トを選択し、ステップ7に続く。
【0075】 D.単純化処理 かなりの計算リソースが、上述の最適化処理を実行するために要求される。あ
る適用では、これらの計算リソースを提供するのに必要とされるコストはあまり
にも大きい;それゆえ、最適解への近似を提供する単純化処理が、これらの適用
に望ましい。量子化解像度を制御するためにビット割当てを用いる単純化処理の
いくつかの実施の形態は、以下に示される。これらの処理のそれぞれは、最初の
ビット割当てが、望ましい雑音スペクトルに概ね等しい量子化雑音スペクトルを
得るために、ある試みで合成フィルタ雑音伸長のための補償に関係なく、各変換
係数のために決定されることを想定する。これが最初のビット割当てだとすれば
、各処理は、ビット割当てが望ましい雑音レベルを得るために増加されるべき変
換係数を識別する。
【0076】 1.第1の単純化処理 第1の単純化処理は、各変換係数X(k)のためのトータル雑音レベルを同時
に評価するために、最も低い周波数変換係数X(0)で始まる距離関数(metric
function)を用い、雑音伸長がその係数のトータル雑音に望ましい雑音レベル
N(k)を越えさせるか否かを決定する。その評価が、現在の係数X(k)のト
ータル雑音レベルが望ましい雑音レベルを越えないことを示すならば、その処理
は、次に高い周波数変換係数で継続する。
【0077】 その評価が、現在の係数X(k)のトータル雑音レベルが望ましい雑音レベル
N(k)を越えないことを示すならば、係数X(k)の雑音レベルに最大の貢献
をする係数が識別され、その係数の利得率g(k)は、規定値、すなわち、一実
施の形態において24ビットの補償を表す−144dBに設定される。距離関数
は、調整されたビット割当てで結果として生じる係数X(k)のためのトータル
雑音レベルを評価するために用いられる。評価された雑音レベルがまだ望ましい
雑音レベルN(k)を越えるならば、係数X(k)の雑音レベルに次の最大の貢
献をなす系巣が識別され、その利得率は、規定値に設定され、距離関数は、新し
い雑音レベルを評価するために再び用いられる。これは、評価された雑音レベル
が望ましい雑音レベルにおいて、あるいはそれ以下にレベルを減らされるまで継
続する。
【0078】 この時点で、係数X(k)の評価雑音レベルを減らすために規定値に設定され
た利得率を有する係数のセット{S}が存在する。セット{S}の係数の利得率
は、雑音伸長のためにちょうど十分な補償であると予測されるものを提供するた
めに、公式に従って調整される。ビット割当て処理は、それから、次のより高い
周波数変換係数で継続する。
【0079】 この第1の単純化処理を実行するある実施の形態は、次のプログラム片に示さ
れる。このプログラム片は、C、FORTRAN(フォートラン)及びBASI
C(ベーシック)プログラミング言語のある構文の機能を含む構文を用いて疑似
コードで表現される。このプログラム片及びここで記述される他のプログラム片
は、コンパイルに適したソースコード片であると意図されないが、実行可能ない
くつかの態様を伝えるために提供される。 Compensate ( W, N ) { for ( k=0 to MaxC ) g[k] = 1.0; //最初の利得率 for ( k=0 to MaxC ) { //各係数kのために . . . S = Null; //Sを空に設定 //雑音レベルを計算 metric = N[k] - Sum ( W[k, i] * g[i] * N[i]; for ( i=k-L1 to k+L2
) ); if ( metric <0 ) { //あまりに大きい雑音ならば. . . while ( metric <0 ) { //雑音レベルがOKまで . . . //雑音への最大一因を見出す k_max =Max ( W[k, i] * g[i] * N[i]; for ( i=0 to M2-1 ) ); g[k_max] = max_correction; //規定を修正 S = Union ( S, k_max ); //最大一因を設定に加える //新しい雑音レベルの計算 metric = N[k] + Sum ( W[k, i] * g[i] * n[i]; for ( i=k-L1 to k
+L2 ) ); } g_new = Adjust ( W, N[k], S, g ); //adJust gam factors by form
ula for each i in S g[i] = min ( g[i], g_new ); } } }
【0080】 ルーチンCompensateは、合成フィルタのバンクのための伸長行列であるアレイ
W、及び望ましい雑音スペクトルを指定するアレイNで提供される。アレイgの
利得率は、k=0からk=MaxCまでの利益の低周波数係数のための1.0の
値に初期化される。補償は、多くの実施の形態では最も高い周波数係数のために
必要とされない。
【0081】 主なfor-loopは、Compensateルーチンの残りを構成し、利益の低周波数係数の
それぞれのために補償処理を実行する。Null関数は、空又は空の状態にアレイS
を初期化するために呼び出される。可変距離は、以下の合計を計算するために、
以下のような関数Sumを呼び出し、この合成を係数kの望ましい雑音レベルN[k]
から減ずることによって現在の係数kのための雑音レベルの評価を割り当てる:
【式17】 ここで、M2=合成フィルタ変換の長さである。
【0082】 合計の限界L1及びL2は、この処理の計算の複雑さに極めて影響を与える;
ルーチンCompensateの複雑さのオーダーは(L1+L2)である。計算効率は
、その計算に含まれる係数の範囲を制限するために、L1及びL2の値を調整す
ることによって改善され得る。これらの制限の値は、経験的に決定され得る。以
下に論じられる代わりの単純化処理では、これらの制限は、アレイWの散在する
バージョンにおける非ゼロ要素の範囲に適合させる。
【0083】 評価雑音レベルが望ましい雑音レベルよりも小さいならば、metricは正であり
、雑音伸長のための補償が必要とされない。それゆえ、metricが正ならば、for-
loopの残りは省略され、処理は次の係数のために継続する。
【0084】 Metricが負ならば、処理は、metricが正になるまでwhile-loopで継続する。こ
のwhile-loop内で、関数Maxは、係数kのための雑音への最大の寄与をなす係数k
_maxを決定するために呼び出される。これは、0からM2−1までのiのための
積W[k,i] * g[i] * N[i]の最大値に対応するインデックスiを見出すことによっ
て達成される。インデックスiのこの範囲は、システムのためにすべての変換係
数を含む。望まれるならば、処理効率は、係数のより狭い範囲に最大積のための
探索を制限することによって改良され得る。この範囲は、経験的に決定され得る
。最大一因が見出されると、k_maxの利得率は、補償のある最大量に対応する規
定値max_correctionを割り当てられる。一実施の形態では、補償の最大量は、2
4ビットに対応する−144dBである。k_maxにアレイSを加える関数Unionを
呼び出した後、雑音レベルの評価は、k_maxの修正された利得率を用いて再び計
算され、可変metricに割り当てられる。while-loopは、metricの値が正になるま
で継続する。
【0085】 補償が最大一因に十分に適用されたとき、係数kの評価雑音レベルは、望まし
い雑音レベルN[k]より小さいか又はそれに等しい値に減らされ、可変metricは、
正となる。これが起こるとき、while-loopが終わり、処理は、上述のセット{S
}内の係数に対応するアレイSで表される係数の利得率のための仮の新しい値g_
newを計算するために、関数Adjustを呼び出すことによって継続する。これらの
新しい値は、評価雑音レベルが望ましい雑音レベルに概ね等しいように、補償の
レベルを最適化するように意図される。これは、次の計算を実行することによっ
て達成され得る:
【式18】 仮の値がそれぞれの利得率の現在の値よりも小さいならば、アレイSに表される
係数のための各利得率は、仮の値g_newに設定される。
【0086】 補償処理の主なfor-loopは、利益のすべての補償が処理されるまで次の変換係
数で継続する。
【0087】 2.第1の単純化処理の変化 上述の第1の単純化処理は、処理効率を改善するための種々の方法で変更され
得る。いくつかの方法が簡単に上記で言及される。
【0088】 一つの変化は、典型的な伸長行列アレイWの2,3の要素がすべての他の要素
よりも極めて大きく、多くのこれらのより小さい要素が0に設定されるときでさ
え、優良な性能が実現され得ることを認識することによって、計算の複雑さの重
要な削減を達成する。
【0089】 図10は、仮想伸長行列の中心列における要素の値を示す。中心の主要な値は
、行列の主対角線上の要素に対応する。主対角線上及びその近くの要素は、その
主対角線から離れた要素より極めて大きい値を有する。この特性は、伸長行列が
散在する対角線バンドのアレイによってうまく合理的に表されることを可能にし
、上述のプログラム片のL1及びL2のための値は、アレイの非ゼロ要素のみを
カバーするために減らされ得る。この特性は、また、探索が最大一因のためにな
される範囲を減らす。
【0090】 もう一つの変化は、上述の実施の形態においてwhile-loopを削除することによ
って処理効率を改善する。効率は、最大雑音一因が決定される反復処理を削除す
ることによって改良され、利得率の仮の新しい値が計算される。この変化の一実
施の形態は、次のプログラム片に示される: Compensate ( W, N ) { for ( k=0 to MaxC ) g[k] = 1.0; //利得率を初期化 for ( k=0 to MaxC ) { //各係数kのために . . . //雑音レベルを計算 metric = N[k] - Sum ( W[k, i] * g[i] * N[i], for ( i=k-L1 to k+L2
) ), if ( metric <0 ) { //あまりにも大きい雑音ならば . .
. //雑音への最大一因を見出す k_max =Max ( W[k,i] * g[i] * N[i], for ( i=0 to M2-1 ) ); for ( i=-LI to L2 ) g[k_max+i] = g[k_max+i] * comp[i], } } }
【0091】 この変化では、ルーチンCompensateは、上述のように、アレイW及びアレイN
で提供される。アレイgの利得率は、k=0からk=MaxCまでの利益の低周波数
係数のために、1.0の値に初期化される。補償は、多くの実施の形態では、最
も高い周波数係数のために必要ではない。
【0092】 主for-loopは、そのルーチンの残りを構成し、利益の低周波数係数のそれぞれ
のために補償処理を実行する。可変metricは、上述のように、現在の係数kの雑
音レベルを評価する値を割り当てられる。
【0093】 評価雑音レベルが望ましい雑音レベルよりも小さいならば、metricは正であり
、雑音伸長のための補償は必要とされない。それゆえ、metricが正ならば、for-
loopの残りは省略され、処理は、次の係数のために継続する。
【0094】 metricが負ならば、1以上の変換係数のためのビット割当ては、評価雑音への
最も大きい一因k_maxを見出し、予め決めされた修正量を変換係数k_maxといくつ
かの隣接する係数に適用することによって、雑音伸長を説明するために増やされ
る。最大一因は、上述のように、関数Maxを呼び出すことによって決定され、予
め決められた修正は、アレイcompのそれぞれの値と各利得率とをかけることによ
って−L1〜L2までの係数のための利得率の値を減らすことによって適用され
る。例えば、利得率g[k_max]は、割当てで2ビットの増加を示すために減らされ
てもよく、利得率g[k_max-1]及びg[k_max+1]は、割当てで1.5ビット増加する
ために用いられてもよく、そして、利得率g[k_max-2]及びg[k_max+2]は、割当て
で1ビットの増加を示すために減らされてもよい。予め定義された修正の程度は
、各適用のために経験的に決められ得る。
【0095】 補償処理の主for-loopは、利益のすべての係数が処理されるまで次の変換係数
で継続する。
【0096】 この変化の位置実施の形態は、次のプログラム片に示される。 Compensate ( w, n ) { for ( k=0; k<16; k++ ) g[k] = 0; //利得率を修正がないことを意味する0dBに初期化 for ( k=0, k<1 1, k++ ) { //利益の各係数のために //そうならば、どの係数が補償を必要とするかチェック //どの係数が最大雑音一因か est_noise = w[k][k] + n[k]; //kのために評価雑音レベルを初期化 contrib[L] = est_noise; //係数kのそれ自身への寄与 k_max = L; //インデックス初期化及び. . . max_contrib = est_noise; //最大一因への寄与 for (j=k-L; j<=k+L; j++ ) { //他の係数の寄与をチェック j if ( ( j>=0 ) &&( j<>k ) ) { //負の係数と係数kを削除 contrib[j-k+L] = w[k][j] + n[j]; //係数jからの寄与 if ( contrib[j-k+L] >max_contrib ) { //これがここでは最大なら
ば. . . k_max = j-k+L; //インデックスを更新し. . . maxcontrib = contrib[j-k+L]; //最大一因の寄与 } est_noise = LogAdd( est_noise, contrib[j-k+L] ); //ログ値加
える } } //望ましい雑音が評価雑音より低い場合のみ修正を適用 if ( n[k] <est_noise ) { for ( j = -L; j<=L; j++ ) if (k_max+k-j >0 ) //負の係数を省略 glk_max+k-jl += comp[j]; //補償を適用 } for ( k=0; k<16; k++ ) { alloc[k] = max( 0, n[k]+g[k] ); //割当てアレイを準備 } }
【0097】 それゆえ、上述の例、伸長行列、利得率及び雑音レベルがデシベルで表現され
るのと異なり、関数LogAddは、2つの対数値の和を提供するために用いられる。
係数kに対する係数jの雑音寄与は、伸長行列のそれぞれの要素を持つ係数jの
ための望ましい雑音レベルの積を表す表現w[k][j] + n[j]によって表される。ア
レイallocの各要素kは、係数kのための望ましい量子化雑音をデシベルで表す
【0098】 3.第2の単純化処理 第2の単純化処理は、2つのステップで雑音伸長補償を提供する。第1のステ
ップは、それぞれの変換係数X(k)を同時にとり、最も小さい周波数係数X(
0)で始め、その係数のための望ましい雑音レベルN(k)を越えるそれぞれの
係数の評価雑音レベルに個別に寄与する隣接する係数X(j)を識別し、それぞ
れの個別の寄与が望ましい雑音レベルに減らされるように、隣接する係数X(j
)のための補償の初期量を決定することによって補償の初期量を決定する。第2
のステップは、それぞれの変換係数のためのトータル雑音寄与を望ましい雑音レ
ベルにもたらすために、補償を反復して精練する。
【0099】 この第2の単純化処理を実行する一実施の形態は、次のプログラム片で示され
る。 Compensate ( W, N ) { for ( i=0 to M-1 ) compN[i] = N[i]; //補償アレイを初期化 compOK = False; //while loopのために初期化 while (compOK = False) { compOK = True; //補償が十分であると仮定 for ( i=0 to M-1 ) //STEP l . . . tempN[i] = compN[i]; //tempアレイを初期化 for ( k=0 to M-1 ) { // それぞれの係数のために . . . k_max = 0; //インデックスを初期化 . . . max_contrib = W[k, 0] * tempN[0]; //最大一因のための寄与 for (j=1 toM-1 ) { //各隣接係数のために if ( max_contrib <W[k, j] * tempN[j] ) { //もし新しい最
大 . . . k_max = j; //インデックスと値を更新 . . . max_contrib = W[k, j] * tempN[j]; //最大一因 } } if ( max_contrib >tempN[k] ) //もし最大寄与が . . . //同量によってtemp雑音、変化補償を超過 compN[k_max] = compN[k_max] * tempN[k_max] / max_contrib; } for ( k=0 to M-1 ) { //それぞれの係数のためのSTEP2 totalN = Sum ( W[k, j] * compN[j]; for ( j=0 to M-1 ) ); if ( N[k] <totalN ) { //トータル寄与があまりに高いならば
. . . compN[k] = compN[k] * N[k] / totalN, //補償を変化 compOK = False; //処理を繰り返す } } } }
【0100】 ルーチンCompensateは、上述のように、アレイWとアレイNで提供される。補
償値のアレイcompNは、望ましい雑音のアレイNから初期化され、可変compOKは
、次のwhile-loopが少なくとも一度実行するように初期化される。while-loopは
、Compensateルーチンの残りを構成し、2つのステップで補償処理を実行する。
そのループは、最初、過度レベルの雑音が第2のステップで計算されないならば
、while-loopが終わるように、変数を初期化する。
【0101】 第1のステップを実行するルーチンの一部は、一時的な計算のアレイtempNを
初期化し、各係数kへの雑音寄与が同時に調査されるfor-loopを実行する。変数
k_maxとmax_contribを係数j=0に初期化した後に、繰り込まれたfor-loopは、
評価雑音寄与W[k,j] * tempN[j]を計算し、それがこれまで計算された最大寄与
であるか否かを決定するために用いられる。そうでなければ、繰り込まれたルー
プは、次の係数jで継続する。この評価雑音寄与がこれまで計算された最も大き
いレベルであれば、変数k_maxとmax_contribは、現在の係数jを参照して変更さ
れる。繰り込まれたループがすべての係数の寄与を調査した後、最大雑音寄与ma
x_contribが望ましい雑音レベルN[k]を越えるならば、補償アレイcompN[K]のそ
れぞれの数は、最大寄与が望ましい雑音レベルを超えるのと同量によって変更さ
れる。第1のステップの処理は、すべての係数が処理されるまで次の係数で継続
する。
【0102】 第2のステップを実行するルーチンの一部は、各係数kのトータル雑音の評価
を計算し、この評価をのぞましい雑音レベルN[k]と比較する。その評価がのぞま
しい雑音レベルを超えるならば、それぞれの係数kの補償compNは、雑音レベル
が評価トータル雑音によって超えられるのと同量だけ減らされる。変数compOKは
、第1及び第2のステップが再び実行されるように設定される。
【0103】 主while-loopは、第1及び第2のステップがcompOK変数がFalseに設定される
ことなく実行され得るまで、継続する。
【0104】 第2の単純化処理を実行する代わりの実施の形態は、次のプログラム片に示さ
れる。 Compensate ( W, N ) { for ( i=0 to M-1 ) compN[i] =N[i]; //補償アレイを初期化 compOK = False, //while loopのために初期化 while (compOK = False) { compOK = True; //補償が十分であると仮定 for ( i=0 to M-1 ) //STEP1 . . . tempN[i] = compN[i]; //tempアレイを初期化 for ( k=0 to M-1 ) { //それぞれの係数のために k_max = k, //インデックスを初期化 //最大一因のための寄与 max_contrib = W[k, k_max] * tempN[k_max]; for ( j=k-LI to k+L2 ) { //各隣接する係数のために . . . if (j<>k) { if ( max_contrib <W[k, j] * tempN[j] ) { //もし新しい
最大 . . . k_max = j; //インデックスと値を更新 . . . max_contrib = W[k, j] * tempN[j]; //最大一因 } } } if ( max_contrib >tempN[k] ) //もし最大寄与が . . . //同量によってtemp雑音、変化補償を越える compN[k_max] = compN[k_max] * tempN[k_max] / max_contrib; } for ( k=0 to M-1 ) { //それぞれの係数のためのSTEP2 totalN =Sum ( W[k j] CompN[j]; for ( j=0 to M-1 ) ); if ( N[k] <totalN ) { //トータル寄与があまりに高いなら
ば . . . compN[k] = compN[k] N[k] / totalN; //補償を変化する compOK = False; //処理を繰り返す } } } }
【0105】 このルーチンの実行は、より低い計算リソースを要求する。なぜならば、所定
の係数jのための雑音への最大一因max_contribを識別するfor-loopは、上述の
プログラム片でなされるような全スペクトルを調べるよりもむしろ、係数jその
ものを除くj-L1からj+L2への係数jのいずれかの側面で隣接する係数の狭帯域を
調べるからである。
【0106】 E.実行 本発明は、汎用コンピュータシステムや、汎用コンピュータで見出されるもの
と類似する構成に接続されるデジタル信号プロセッサ(DSP)回路のようなよ
り専門的構成を含む何か他の装置におけるソフトウェアを含む多種多様な方法で
実行されてもよい。図11は、本発明の種々の態様を実行するために用いられ得
る装置90のブロック図である。DSP92は計算リソースを提供する。RAM
93はシステムランダムアクセスメモリ(RAM)である。ROM94は、装置
90を操作し、本発明の種々の態様を実行するために必要なプログラムを格納す
るリードオンリーメモリ(ROM)のような固定記憶装置のいくつかの形式を表
す。I/O制御95は、通信チャネル96を経由して音声信号を送受信するため
のインターフェース回路を表す。アナログ/デジタル変換器及びデジタル/アナ
ログ変換器は、アナログ音声信号を受信及び/又は送信するために望まれるよう
に、I/O制御95に含まれてもよい。示される実施の形態では、すべての主要
な構成要素は、1つの物理的バスを表し得るバス91に接続する。しかしながら
、バス方式は、本発明を実行するために要求されない。
【0107】 汎用コンピュータシステムで実行される実施の形態では、キーボードやマウス
及びディスプレイのような装置に相互作用し、磁気テープやディスク、あるいは
光学式媒体のような記憶媒体を有する記憶装置を制御するための追加の構成要素
が含まれてもよい。記憶媒体は、オペレーティングシステム、ユーティリティ及
びアプリケーションのための指令のプログラムを記録するために用いられてもよ
く、本発明の種々の態様を実行するプログラムの実施の形態を含んでもよい。
【0108】 本発明の種々の態様を実行するために要求される機能は、独立の論理要素、1
以上のASIC及び/又はプログラム制御プロセッサを含む多種多様な方法で実
行される構成要素によって実行され得る。これらの構成要素が実行される方法は
、本発明ではあまり重要でない。
【0109】 本発明のソフトウェア実行は、超音波から紫外線周波数までを含むスペクトル
を通して、バースバンド又は変調通信経路のような種々の機械に読取可能な媒体
、あるいは、磁気テープ、磁気ディスク及び光学的ディスクを含むあらゆる磁気
又は光学記録技術を本質的に用いて情報を伝達するものを含む記憶媒体によって
伝送され得る。種々の態様は、同様に、ASIC、汎用集積回路、リードオンリ
ーメモリ(ROM)又はRAMの種々の形態で実施されるプログラムによって制
御されるマイクロプロセッサ、及び他の技術のような処理回路によってコンピュ
ータシステム90の種々の構成要素で実行され得る。
【図面の簡単な説明】
【図1】 図1A及び1Bは、分割帯域符号器のブロック図である。
【図2】 図2A及び2Bは、分割帯域復号器のブロック図である。
【図3】 図3は、仮想フィルタの周波数応答の概略図である。
【図4】 図4Aは、図3の周波数応答に比較されるように、高周波数スペクトル成分の
ための知覚マスク閾値の概略図である。 図4Bは、図3の周波数応答に比較されるように、中周波数から低周波数スペ
クトル成分のための知覚マスク閾値の概略図である。
【図5】 図5は、本発明のいくつかの態様の基礎をなす成分例証概念のブロック図であ
る。
【図6】 図6は、逆ブロック変換によって回復され、合成ウィンドウ関数によって重み
付けされる時間領域サンプルの重畳ブロックの概略図である。
【図7】 図7は、最適な量子化解像度を捜す最適化問題の幾何学的図である。
【図8】 図8は、平坦な電力スペクトル、望ましい雑音スペクトル、及び仮想音声信号
の量子化雑音スペクトルの図である。
【図9】 図9は、量子化解像度を決定するための反復処理におけるステップを示すフロ
ーチャートである。
【図10】 図10は、伸長行列の中央列における要素の値の図である。
【図11】 図11は、本発明の種々の態様を実行するために用いられ得る装置のブロック
図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,UZ,VN,YU,ZA,ZW (72)発明者 デビッドソン、グラント・アレン アメリカ合衆国、カリフォルニア州 94103、サンフランシスコ、ポトレロ・ア ベニュー 100 Fターム(参考) 5D045 DA20 5J064 AA01 BB07 BC11 BC14 BC16 BC18 BD04

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 入力信号に適用される分析フィルタから得られる量子化サブ
    バンド信号のために量子化解像度を確立する方法であって、該入力信号の複製で
    ある出力信号は、合成フィルタを該量子化サブバンド信号の量子化指示に適用す
    ることによって得られ、該方法は、 前記入力信号に応じて望ましい雑音スペクトルを生成するステップと、 前記合成フィルタから得られる出力信号のサブバンドにおける評価雑音を得る
    ために、合成フィルタ雑音伸長モデルを適用することによってサブバンド信号の
    ための前記量子化解像度を決定するステップであって、該合成フィルタ雑音伸長
    モデルは、前記合成フィルタ及び前記量子化解像度の雑音伸長特性が、前記望ま
    しい雑音スペクトルと該評価雑音レベルの比較が1以上の比較基準を満足するよ
    うに決定されることを表す、決定ステップと、 を有することを特徴とする方法。
  2. 【請求項2】 前記1以上の比較基準は、前記出力信号のサブバンドの雑音
    レベルが概ね一定の量によって前記望ましい雑音スペクトルからオフセットされ
    ることであることを特徴とする請求項1記載の方法。
  3. 【請求項3】 前記合成フィルタ雑音伸長モデルを提案された量子化解像度
    に適用し、該提案された量子化解像度を調整し、前記1以上の比較基準が満足さ
    れるまで繰り返す反復処理によってサブバンド信号のための該量子化解像度を決
    定することを特徴とする請求項1又は2記載の方法。
  4. 【請求項4】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上の
    サブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のためのそれぞれの提案された量子化解像
    度を調整するステップと、 を有することを特徴とする請求項3記載の方法。
  5. 【請求項5】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑
    音スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上
    のサブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のための提案された量子化解像度を第1の
    量だけ増加し、該選択されたサブバンド信号成分に隣り合うものである1以上の
    他のサブバンド信号成分のための提案された量子化解像度を該第1の量より小さ
    い第2の量だけ増加するステップと、 を有することを特徴とする請求項3記載の方法。
  6. 【請求項6】 前記反復処理は、 個々のサブバンド信号成分のための評価された個々の雑音寄与を得るために、
    前記合成フィルタ雑音伸長モデルを適用するステップと、 前記望ましい雑音スペクトルを越える評価された個々の雑音寄与をなす個々の
    サブバンド信号成分のための提案された量子化解像度を増加するステップと、 を有することを特徴とする請求項3記載の方法。
  7. 【請求項7】 前記合成フィルタ雑音伸長モデルは、複数の周波数における
    合成フィルタ入力雑音の関数として、それぞれの周波数において合成フィルタ出
    力雑音を表現する関数であることを特徴とする請求項1乃至6記載の方法。
  8. 【請求項8】 前記決定された量子化解像度に従って前記サブバンド信号を
    量子化し、該量子化サブバンド信号を符号化信号にアセンブルするステップを有
    することを特徴とする請求項1乃至7記載の方法。
  9. 【請求項9】 符号化信号から前記量子化サブバンド信号を得て、前記決定
    された量子化解像度に従って該量子化サブバンド信号を非量子化するステップを
    有することを特徴とする請求項1乃至7記載の方法。
  10. 【請求項10】 入力信号に適用される分析フィルタから得られる量子化サ
    ブバンド信号のための量子化解像度を確立する装置であって、入力信号の複製で
    ある出力信号は、合成フィルタに該量子化サブバンド信号の非量子化指示を適用
    することによって得られ、該装置は、 前記入力信号を受信する入力端子と、 前記入力信号に応じて望ましい雑音スペクトルを生成し、前記合成フィルタか
    ら得られる前記出力信号のサブバンド内の評価雑音レベルを得るために、合成フ
    ィルタ雑音伸長モデルを適用することによってサブバンド信号の前記量子化解像
    度を決定するための前記入力端子に接続される1以上の処理回路であって、前記
    合成フィルタ雑音伸長モデルは、前記合成フィルタと前記量子化解像度の雑音伸
    長特性が、前記望ましい雑音スペクトルと評価雑音レベルとの比較が1以上の比
    較基準を満足するように決定されることを表す、1以上の処理回路と、 を備えることを特徴とする装置。
  11. 【請求項11】 前記1以上の比較基準は、前記出力信号のサブバンドの雑
    音レベルが概ね一定の量によって前記望ましい雑音スペクトルからオフセットさ
    れることであることを特徴とする請求項10記載の装置。
  12. 【請求項12】 前記1以上の処理回路は、前記合成フィルタ雑音伸長モデ
    ルを提案された量子化解像度に適用し、該提案された量子化解像度を調整し、前
    記1以上の比較基準が満足されるまで繰り返す反復処理を実行することによって
    サブバンド信号のための該量子化解像度を決定することを特徴とする請求項10
    又は11記載の装置。
  13. 【請求項13】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上の
    サブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のためのそれぞれの提案された量子化解像
    度を調整するステップと、 を有することを特徴とする請求項12記載の装置。
  14. 【請求項14】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑
    音スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上
    のサブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のための提案された量子化解像度を第1の
    量だけ増加し、該選択されたサブバンド信号成分に隣り合うものである1以上の
    他のサブバンド信号成分のための提案された量子化解像度を該第1の量より小さ
    い第2の量だけ増加するステップと、 を有することを特徴とする請求項12記載の装置。
  15. 【請求項15】 前記反復処理は、 個々のサブバンド信号成分のための評価された個々の雑音寄与を得るために、
    前記合成フィルタ雑音伸長モデルを適用するステップと、 前記望ましい雑音スペクトルを越える評価された個々の雑音寄与をなす個々の
    サブバンド信号成分のための提案された量子化解像度を増加するステップと、 を有することを特徴とする請求項12記載の装置。
  16. 【請求項16】 前記1以上の処理回路は、複数の周波数における合成フィ
    ルタ入力雑音の関数として、それぞれの周波数において合成フィルタ出力雑音を
    表現する関数である前記合成フィルタ雑音伸長モデルを適用することを特徴とす
    る請求項10乃至15記載の装置。
  17. 【請求項17】 前記1以上の処理回路は、前記決定された量子化解像度に
    従って前記サブバンド信号を量子化し、該量子化サブバンド信号を符号化信号に
    アセンブルすることによって、前記入力信号の符号化指示を生成することを特徴
    とする請求項10乃至16記載の装置。
  18. 【請求項18】 前記1以上の処理回路は、符号化信号から前記量子化サブ
    バンド信号を抽出し、前記決定された量子化解像度に従って該量子化サブバンド
    信号を非量子化することによって、該量子化サブバンド信号を伝送する符号化信
    号を復号することを特徴とする請求項10乃至16記載の装置。
  19. 【請求項19】 符号化情報を伝送する信号を受信し、復号する受信器であ
    って、該符号化情報は、 (1)分析フィルタに入力信号を適用する符号器によって生成されるサブバン
    ド信号の量子化成分を表す信号情報と、 (2)前記量子化サブバンド信号成分の量子化解像度を表す制御情報であって
    、該量子化解像度が(a)前記入力信号に応じて望ましい雑音スペクトルを生成
    し、(b)合成フィルタから得られる出力信号のサブバンドにおける評価雑音を
    得るために、該合成フィルタ及び前記量子化解像度の雑音伸長特性が、前記望ま
    しい雑音スペクトルと該評価雑音レベルの比較が1以上の比較基準を満足するよ
    うに決定されることを表す合成フィルタ雑音伸長モデルを適用することによって
    符号器で決定される制御情報とを備え、 前記受信器は、 (1)前記符号化情報を伝送する信号に接続される入力と、 (2)前記入力に接続される1以上の処理回路であって、(a)前記符号化情
    報から前記信号情報と前記制御情報を抽出し、それから前記量子化サブバンド信
    号成分と前記量子化サブバンド信号成分の量子化解像度を得て、(b)非量子化
    サブバンド信号を得るために、量子化解像度に従って前記量子化サブバンド信号
    成分を非量子化し、(c)出力信号を生成するために合成フィルタを前記非量子
    化サブバンド信号に適用する、ここで、サブバンド信号の量子化雑音は、前記望
    ましい雑音スペクトルで1以上の比較基準を実質的に満足する前記出力信号のサ
    ブバンド内の雑音レベルを作り出すために、前記合成フィルタによって広げられ
    る、1以上の処理回路と、 (3)前記出力信号を伝送する前記1以上の処理回路に接続される出力と、 を備えることを特徴とする受信器。
  20. 【請求項20】 前記1以上の比較基準は、前記出力信号のサブバンドの雑
    音レベルが概ね一定の量によって前記望ましい雑音スペクトルからオフセットさ
    れることであることを特徴とする請求項19記載の受信器。
  21. 【請求項21】 機械に読取可能な媒体で実施されるコンピュータプログラ
    ムプロダクトであって、該コンピュータプログラムプロダクトは、入力信号に適
    用される分析フィルタから得られる量子化サブバンド信号のために量子化解像度
    を確立する方法を実行するために、該機械によって実行可能なプログラム指令を
    含み、該入力信号の複製である出力信号は、合成フィルタを該量子化サブバンド
    信号の量子化指示に適用することによって得られ、該方法は、 前記入力信号に応じて望ましい雑音スペクトルを生成するステップと、 前記合成フィルタから得られる出力信号のサブバンドにおける評価雑音を得る
    ために、合成フィルタ雑音伸長モデルを適用することによってサブバンド信号の
    ための前記量子化解像度を決定するステップであって、該合成フィルタ雑音伸長
    モデルは、前記合成フィルタ及び前記量子化解像度の雑音伸長特性が、前記望ま
    しい雑音スペクトルと該評価雑音レベルの比較が1以上の比較基準を満足するよ
    うに決定されることを表す、決定ステップと、 を有することを特徴とするコンピュータプログラムプロダクト。
  22. 【請求項22】 前記1以上の比較基準は、前記出力信号のサブバンドの雑
    音レベルが概ね一定の量によって前記望ましい雑音スペクトルからオフセットさ
    れることであることを特徴とする請求項21記載のコンピュータプログラムプロ
    ダクト。
  23. 【請求項23】 前記合成フィルタ雑音伸長モデルを提案された量子化解像
    度に適用し、該提案された量子化解像度を調整し、前記1以上の比較基準が満足
    されるまで繰り返す反復処理によってサブバンド信号のための該量子化解像度を
    決定することを特徴とする請求項21又は22記載のコンピュータプログラムプ
    ロダクト。
  24. 【請求項24】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上の
    サブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のためのそれぞれの提案された量子化解像
    度を調整するステップと、 を有することを特徴とする請求項23記載のコンピュータプログラムプロダク
    ト。
  25. 【請求項25】 前記反復処理は、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑
    音スペクトルの対応する部分を超える評価雑音レベルの一部に寄与する、1以上
    のサブバンド信号成分を識別するステップと、 その量子化が、前記合成フィルタ雑音伸長モデルに従って、前記望ましい雑音
    スペクトルの前記対応する部分を超える前記評価雑音レベルの一部への最も大き
    い寄与をなす前記サブバンド信号成分を選択するステップと、 前記選択されたサブバンド信号成分のための提案された量子化解像度を第1の
    量だけ増加し、該選択されたサブバンド信号成分に隣り合うものである1以上の
    他のサブバンド信号成分のための提案された量子化解像度を該第1の量より小さ
    い第2の量だけ増加するステップと、 を有することを特徴とする請求項23記載のコンピュータプログラムプロダク
    ト。
  26. 【請求項26】 前記反復処理は、 個々のサブバンド信号成分のための評価された個々の雑音寄与を得るために、
    前記合成フィルタ雑音伸長モデルを適用するステップと、 前記望ましい雑音スペクトルを越える評価された個々の雑音寄与をなす個々の
    サブバンド信号成分のための提案された量子化解像度を増加するステップと、 を有することを特徴とする請求項23記載のコンピュータプログラムプロダク
    ト。
  27. 【請求項27】 前記合成フィルタ雑音伸長モデルは、複数の周波数におけ
    る合成フィルタ入力雑音の関数として、それぞれの周波数において合成フィルタ
    出力雑音を表現する関数であることを特徴とする請求項21乃至26記載のコン
    ピュータプログラムプロダクト。
  28. 【請求項28】 前記方法は、前記決定された量子化解像度に従って前記サ
    ブバンド信号を量子化し、該量子化サブバンド信号を符号化信号にアセンブルす
    るステップを有することを特徴とする請求項21乃至27記載のコンピュータプ
    ログラムプロダクト。
  29. 【請求項29】 前記方法は、符号化信号から前記量子化サブバンド信号を
    得て、前記決定された量子化解像度に従って該量子化サブバンド信号を非量子化
    するステップを有することを特徴とする請求項乃至7記載のコンピュータプログ
    ラムプロダクト。
JP2000611392A 1999-04-12 2000-04-10 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 Expired - Lifetime JP4643019B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/289,865 US6363338B1 (en) 1999-04-12 1999-04-12 Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US09/289,865 1999-04-12
PCT/US2000/009557 WO2000062434A1 (en) 1999-04-12 2000-04-10 Quantization in perceptual audio coders with compensation for synthesis filter noise spreading

Publications (3)

Publication Number Publication Date
JP2002542648A true JP2002542648A (ja) 2002-12-10
JP2002542648A5 JP2002542648A5 (ja) 2007-06-07
JP4643019B2 JP4643019B2 (ja) 2011-03-02

Family

ID=23113455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000611392A Expired - Lifetime JP4643019B2 (ja) 1999-04-12 2000-04-10 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化

Country Status (13)

Country Link
US (1) US6363338B1 (ja)
EP (1) EP1177639B1 (ja)
JP (1) JP4643019B2 (ja)
KR (1) KR100758215B1 (ja)
AR (1) AR024858A1 (ja)
AT (1) ATE248463T1 (ja)
AU (1) AU771869B2 (ja)
CA (1) CA2366560C (ja)
DE (1) DE60004814T2 (ja)
HK (1) HK1044235B (ja)
MY (1) MY120387A (ja)
TW (1) TW531986B (ja)
WO (1) WO2000062434A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
JP2009511966A (ja) * 2005-10-12 2009-03-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル音声信号の時間的および空間的整形
JP2010500631A (ja) * 2006-08-15 2010-01-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション サイド情報なしの時間的ノイズエンベロープの自由な整形
JP2012504373A (ja) * 2008-09-26 2012-02-16 クゥアルコム・インコーポレイテッド 変換領域ログコンパンディングを使用する信号処理のための方法および装置

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US7734448B2 (en) * 2000-01-10 2010-06-08 Canning Francis X Sparse and efficient block factorization for interaction data
US7720651B2 (en) * 2000-09-29 2010-05-18 Canning Francis X Compression of interaction data using directional sources and/or testers
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
EP1297646B1 (en) * 2000-06-12 2006-04-19 BRITISH TELECOMMUNICATIONS public limited company In-service measurement of perceived speech quality by measuring objective error parameters
US7945430B2 (en) 2000-09-29 2011-05-17 Canning Francis X Compression and compressed inversion of interaction data
US7031955B1 (en) * 2001-04-27 2006-04-18 I2 Technologies Us, Inc. Optimization using a multi-dimensional data model
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US6987889B1 (en) 2001-08-10 2006-01-17 Polycom, Inc. System and method for dynamic perceptual coding of macroblocks in a video frame
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20040030555A1 (en) * 2002-08-12 2004-02-12 Oregon Health & Science University System and method for concatenating acoustic contours for speech synthesis
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7376553B2 (en) * 2003-07-08 2008-05-20 Robert Patel Quinn Fractal harmonic overtone mapping of speech and musical sounds
US7539614B2 (en) * 2003-11-14 2009-05-26 Nxp B.V. System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes
JP2007520748A (ja) * 2004-01-28 2007-07-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複素値データを用いたオーディオ信号の復号
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7593539B2 (en) * 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
CN102132494B (zh) * 2008-04-16 2013-10-02 华为技术有限公司 通信方法和通信装置
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
EP2489041B1 (en) * 2009-10-15 2020-05-20 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
KR101309671B1 (ko) 2009-10-21 2013-09-23 돌비 인터네셔널 에이비 결합된 트랜스포저 필터 뱅크에서의 오버샘플링
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
US8924222B2 (en) * 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9225310B1 (en) * 2012-11-08 2015-12-29 iZotope, Inc. Audio limiter system and method
US10325584B2 (en) 2014-12-10 2019-06-18 Stmicroelectronics S.R.L. Active noise cancelling device and method of actively cancelling acoustic noise
EP3616197A4 (en) * 2017-04-28 2021-01-27 DTS, Inc. AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS
US10886943B2 (en) * 2019-03-18 2021-01-05 Samsung Electronics Co., Ltd Method and apparatus for variable rate compression with a conditional autoencoder

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123828A (ja) * 1988-09-30 1990-05-11 American Teleph & Telegr Co <Att> サブバンドコーディング方法および装置
JPH0651795A (ja) * 1992-03-02 1994-02-25 American Teleph & Telegr Co <Att> 信号量子化装置及びその方法
JPH08275931A (ja) * 1994-11-17 1996-10-22 Deutsche Thomson Brandt Gmbh 短期スペクトラム及び音響心理モデルによるオーディオ信号の符号化方法及び装置
JPH09500502A (ja) * 1993-07-16 1997-01-14 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123828A (ja) * 1988-09-30 1990-05-11 American Teleph & Telegr Co <Att> サブバンドコーディング方法および装置
JPH0651795A (ja) * 1992-03-02 1994-02-25 American Teleph & Telegr Co <Att> 信号量子化装置及びその方法
JPH09500502A (ja) * 1993-07-16 1997-01-14 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション デコーダスペクトル歪み対応電算式適応ビット配分符号化方法及び装置
JPH08275931A (ja) * 1994-11-17 1996-10-22 Deutsche Thomson Brandt Gmbh 短期スペクトラム及び音響心理モデルによるオーディオ信号の符号化方法及び装置
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
JP2009511966A (ja) * 2005-10-12 2009-03-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル音声信号の時間的および空間的整形
JP2010500631A (ja) * 2006-08-15 2010-01-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション サイド情報なしの時間的ノイズエンベロープの自由な整形
JP2012504373A (ja) * 2008-09-26 2012-02-16 クゥアルコム・インコーポレイテッド 変換領域ログコンパンディングを使用する信号処理のための方法および装置
JP2013081229A (ja) * 2008-09-26 2013-05-02 Qualcomm Inc 変換領域ログコンパンディングを使用する信号処理のための方法および装置

Also Published As

Publication number Publication date
MY120387A (en) 2005-10-31
HK1044235B (zh) 2003-12-24
DE60004814T2 (de) 2004-07-01
US6363338B1 (en) 2002-03-26
WO2000062434A1 (en) 2000-10-19
HK1044235A1 (en) 2002-10-11
JP4643019B2 (ja) 2011-03-02
CA2366560C (en) 2008-07-29
AU4338200A (en) 2000-11-14
KR100758215B1 (ko) 2007-09-12
AR024858A1 (es) 2002-10-30
AU771869B2 (en) 2004-04-01
EP1177639A1 (en) 2002-02-06
KR20010112423A (ko) 2001-12-20
CA2366560A1 (en) 2000-10-19
TW531986B (en) 2003-05-11
EP1177639B1 (en) 2003-08-27
DE60004814D1 (de) 2003-10-02
ATE248463T1 (de) 2003-09-15

Similar Documents

Publication Publication Date Title
JP4643019B2 (ja) 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化
US6704705B1 (en) Perceptual audio coding
US6064954A (en) Digital audio signal coding
KR100991450B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
JP3297051B2 (ja) 適応ビット配分符号化装置及び方法
US7752052B2 (en) Scalable coder and decoder performing amplitude flattening for error spectrum estimation
JP3093179B2 (ja) 高品質オーディオ用短時間遅延変換エンコーダ及びデコーダ
US7181404B2 (en) Method and apparatus for audio compression
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
EP0446037B1 (en) Hybrid perceptual audio coding
US20050270195A1 (en) Method and apparatus for encoding/decoding digital signal
US20090198500A1 (en) Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
JP2001053617A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP4843142B2 (ja) 音声符号化のための利得−適応性量子化及び不均一符号長の使用
EP0612160A2 (en) A bit allocation method for transform coder
US9691398B2 (en) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
Ordentlich Low delay-code excited linear predictive (LD-CELP) coding of wide band speech at 32kbits/sec
JP2000137497A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
Bhaskar Low rate coding of audio by a predictive transform coder for efficient satellite transmission
JP2000276198A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JPH06291679A (ja) オーディオ信号のためのしきい値制御量子化決定法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070405

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070405

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100903

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101004

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101202

R150 Certificate of patent or registration of utility model

Ref document number: 4643019

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term