JP2007501441A - スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム - Google Patents

スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム Download PDF

Info

Publication number
JP2007501441A
JP2007501441A JP2006532502A JP2006532502A JP2007501441A JP 2007501441 A JP2007501441 A JP 2007501441A JP 2006532502 A JP2006532502 A JP 2006532502A JP 2006532502 A JP2006532502 A JP 2006532502A JP 2007501441 A JP2007501441 A JP 2007501441A
Authority
JP
Japan
Prior art keywords
signal
spectral components
spectral
signals
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006532502A
Other languages
English (en)
Other versions
JP4782685B2 (ja
Inventor
アンデルセン、ロバート・ローリン
トルーマン、マイケル・ミード
ウィリアムズ、フィリップ・アンソニー
バーナン、ステファン・デカー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2007501441A publication Critical patent/JP2007501441A/ja
Application granted granted Critical
Publication of JP4782685B2 publication Critical patent/JP4782685B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Abstract

【課題】本発明は、再生出力信号の認識品質の水準を維持しながら、必要な情報量を効果的に減らす方法を提供する。
【解決手段】オーディオエンコーダーは入力信号のスペクトル成分を切り捨て、チャネル結合を使い、符号化信号の必要な情報容量を減らす。チャネル結合は複合形式の信号の複数チャネルの選択されたスペクトル成分を表す。オーディオデコーダーは、スペクトル成分を合成し、切り捨てられたスペクトル成分を置き換え、結合チャネル信号から個々のチャネル信号に関するスペクトル成分を発生させる。エンコーダーは、デコーダーの効率を改善する符号化信号のスケールファクターを提供し、元の入力信号のスペクトルエネルギーを実質的に保持する出力信号を発生させる。
【選択図】図5

Description

本発明はオーディオ(可聴周波または音声)の符号化と解読デバイスおよび伝送方法、オーディオ信号の記録と再生に関する。特に、本発明は、再生出力信号の認識品質の所望のレベルを維持しながら、所望のオーディオ信号を伝送または記録するために、必要な情報を減らすことに関して提供する。
多くのコミュニケーションシステムは、情報伝達の需要や記録容量がしばしば利用可能な容量を超えるという問題に直面する。その結果、放送やレコーディングの分野における人々の間では、その認識品質を落とさずに人間が認知するオーディオ信号を伝送または記録するために必要な情報量を減少させることにかなりの関心がある。所望のバンド幅または記憶容量に関して出力信号の認識品質を改良することにもまた関心がある。
必要な情報容量を減らすための従来の方法は、入力信号の選択された部分だけを伝送したり記録したりすることを含む。残りの部分は切り捨てられる。知覚できる符号化として知られた技術は典型的には、元のオーディオ信号をスペクトル成分または周波数サブバンド信号に変換し、その結果冗長的または無意味な信号のそれらの部分をさらに容易に同一視でき切捨てることができる。ある信号部分は、それが信号の他の部分から再生できれば、冗長的であると考えられる。ある信号部分は、それが知覚的に重要でないか聞こえなければ、無意味であると考えられる。知覚力のあるデコーダーは符号化信号から消失した冗長的部分を再生できるが、冗長的でもなかった消失した無意味な信号を何も再生することはできない。しかし、無意味な情報の消失は許容できる。なぜならその消失は解読された信号に関して何の知覚的効果を持たないからである。
信号の符号化技術は、冗長的であるか知覚的に無意味であるかのどちらかの信号のそれらの部分だけをそれが切り捨てる場合は、知覚的に透過である。もし、知覚的に透過な技術によって必要な情報容量を充分に減少させることができないなら、知覚的に非透過な技術が、冗長的でなく知覚的に意味がある付加的な信号部分を切り捨てるために必要とされる。必然的な結果として、伝送され記録された信号の知覚的忠実度が低下する。好適には、知覚的に非透過な技術は、最も知覚的に無意味なものを持つと考えられる信号のそれらの部分だけを切り捨てる。
知覚的に非透過な技術としばしばみなされる「結合(カップリング)」として関係する符号化技術を、必要な情報容量を減らすために使っても良い。この技術に従って、二つ以上の入力オーディオ信号のスペクトル成分を結合し、これらのスペクトル成分の合成表示を用いて結合(coupled)チャネル信号を形成する。合成表示を形成するために結合される入力オーディオ信号の各々においてスペクトル成分のスペクトルエンベロープ(包絡)を表す副情報も生まれる。結合チャネル信号と副情報とを含む符号化信号は伝送されるかまたはレシーバーによってその後の解読のために記録される。そのレシーバーは、複製した信号のスペクトル成分を測るために結合チャネル信号を複製し副情報を使うことによって、元の入力信号の不正確なレプリカである減結合信号を発生する。その結果元の入力信号のスペクトルエンベロープが実質的に再生される。2チャンネルステレオシステムに関する典型的な結合技術は左右のチャネル信号の高周波数成分を結合し、その結果、合成高周波成分の一つの信号を形成し、元の左右のチャネル信号における高周波成分のスペクトルエンベロープを表示する副情報を発生する。結合技術の一つの例は、「デジタルオーディオ圧縮(AC-3)」、高度テレビシステム委員会(ASTC)標準書A/52(それはそっくりそのまままレファレンスによって組み込まれている)において述べられている。
副情報の必要な情報容量と結合チャネル信号とは、2つの競合するニーズの間のトレードオフを最適化するために、選択されるべきである。もし副情報に関して必要な情報容量が高すぎて設定されるなら、その結合チャネルは、低い正確度でそのスペクトル成分を伝達することを余儀なくされるだろう。結合チャネルスペクトル成分において正確度がもっと下がると、コード化ノイズまたは量子化ノイズの聴覚可能なレベルは減結合信号に注入される。逆に、もし結合チャネル信号の必要な情報容量が高すぎて設定されるなら、副情報は、スペクトルの細部の低いレベルでスペクトルエンベロープを伝送することを余儀なくされるだろう。スペクトルエンベロープにおいて細部がもっと低いレベルになると、各々の減結合信号のスペクトルレベルと形状とにおいて聴覚可能な相違を生じる。
一般的に、もし副情報が人間の聴覚システムの臨界バンドと比例したバンド幅を持つ周波数サブバンドのスペクトルレベルを伝達するなら、良好なトレードオフを達成できる。減結合信号は元の入力信号の元のスペクトル成分のスペクトルレベルを保つことが可能であるが、それらは一般に元のスペクトル成分の位相を保持しない、ということを注目しても良い。もし結合が高周波スペクトル成分に制限されているなら、この位相情報の消失はわずかである。なぜなら人間の聴覚システムは、特に高周波で、位相の変化に対して相対的に鈍感であるからである。
従来の結合技術によって発生する副情報は典型的にスペクトルの振幅の測定であった。その結果、典型的なシステムにおけるデコーダーは、スペクトル振幅から導かれるエネルギー測度に基づくスケールファクターを計算する。これらの計算は一般に、副情報から得られる値の2乗の合計の平方根を計算することを要求し、それは実質的なコンピューター資源を必要とする。
「高周波再生(HFR)」として関係する符号化技術は、必要な情報容量を減少させるために使うことができる知覚的に非透過な技術である。この技術に従って、入力オーディオ信号の低周波成分だけを含むベースバンド信号が伝送されるかまたは記憶される。元の高周波成分のスペクトルエンベロープを表す副情報も提供される。ベースバンド信号と副情報とを含む符号化信号は、伝送されるか又はレシーバーによってその後のデコード化(解読または復号)のために記録される。そのレシーバーは、省いた高周波成分を副情報に基づいたスペクトルレベルで再生し、出力信号を発生するためにベースバンド信号をその再生した高周波成分と結合する。マコール(Makhoul)とベルーチ(Berouti)の「音声符号化システムにおける高周波再生」(Proc.of the International Conf. On Acoust., Speech and Signal Proc., April 1979)において、HFRに関する既知の方法の説明を見つけることができる。符号化した高品質音楽に適切な改良HFR技術はU.S特許出願(シリアル番号、10/113858、タイトル「高周波再生に関するブロードバンド周波数変換」、出願March 28, 2002)で開示されていて、それはそっくりそのままでレファレンスによって組み込まれていて、HFR応用として以下に関係する。
副情報の必要な情報容量とベースバンド信号とは2つの競合するニーズの間のトレードオフを最適化するように選択されるべきである。副情報に関する必要な情報容量が高すぎて設定される場合は、符号化信号は低い正確度でベースバンド信号におけるスペクトル成分を伝送することを余儀なくされるだろう。ベースバンド信号スペクトル成分においてさらに正確度が低くなると、コード化ノイズまたは量子化ノイズの可聴レベルが、ベースバンド信号とそれから合成される他の信号とに注入される可能性がある。逆に、ベースバンド信号の必要な情報容量が高すぎて設定されると、副情報はスペクトルの細部の低いレベルでスペクトルエンベロープを伝送することを余儀なくされるだろう。スペクトルエンベロープにおける細部がさらに低いレベルになると、スペクトルレベルと各々の合成信号の形状とにおいて可聴レベルの相違が生じる可能性がある。
一般には、副情報が人間の聴覚システムの臨界バンドと比例したバンド幅を持つ周波数サブバンドのスペクトルレベルを伝送する場合は、良好なトレードオフを達成できる。
まさに上で議論した結合技術に関して、従来のHFR技術によって発生した副情報は典型的にスペクトル振幅の測定であった。その結果、典型的なシステムにおけるデコーダーはスペクトル振幅から導かれるエネルギー測度に基づくスケールファクターを計算する。これらの計算は一般に、副情報から得られる値の2乗の合計の平方根を計算することを要求し、それは実質的なコンピューター資源を必要とする。
従来のシステムは結合技術か又はHFR技術かのどちらかを使ってきたが、両方ではなかった。多くの応用において、結合技術はHFR技術より信号の低下が少ないが、HFR技術は必要な情報容量の大きな縮減を達成できる。HFR技術は多重チャネルおよび単チャネルの応用において有利に使うことができるが、結合技術は単チャネルの応用においては何の利点も提供しない。
オーディオコード化システムにおいて結合化とHFRとを実現するような信号処理技術において改良方法を提供することが本発明の目的である。
本発明の一つの観点に従って、一つ以上の入力オーディオ信号を符号化する方法は、一つ以上のベースバンド信号と一つ以上の残余信号とを入力オーディオ信号から得るステップを含む。ここでベースバンド信号のスペクトル成分は、ベースバンド信号によって表現される第一の組の周波数サブバンドに存在する。さらにデコード化の間に第二の組の周波数サブバンド内で発生する一つ以上の合成信号のスペクトル成分のエネルギー測度を達成し、残余信号のスペクトル成分のエネルギー測度を達成し、残余信号と合成信号とにおいてスペクトル成分のエネルギー測度の平方根および割合を得ることによってスケールファクターを計算し、さらにベースバンド信号におけるスペクトル成分を表すスケールファクターと信号情報とを表現する符号化信号のスケーリング情報へアセンブルする。
本発明の別の観点に従って、一つ以上のオーディオ信号を表す符号化信号をデコード化する方法はスケーリング情報と信号情報とを符号化信号から得るステップを含む。ここで前記スケーリング情報はスペクトル成分のエネルギー測度の平方根と割合とを得ることにより計算したスケールファクターを表し、前記信号情報は一つ以上のベースバンド信号のスペクトル成分を表す。またベースバンド信号のスペクトル成分は第一の組の周波数サブバンドにおける入力オーディオ信号のスペクトル成分を表し、ベースバンド信号によって表されない第二の組の周波数サブバンドのスペクトル成分を持つ結合合成信号を前記ベースバンド信号に関して発生する。ここで、前記合成信号におけるスペクトル成分は1つ以上の前記スケールファクターに従って乗法または除法によってスケール(増減)され、入力オーディオ信号を表すとともにベースバンド信号とその結合合成信号とにおけるスペクトル成分から生じる、一つ以上の出力オーディオ信号を発生する。
本発明のもう1つの観点に従って、複数の入力オーディオ信号を符号化する方法は、入力オーディオ信号から複数のベースバンド信号、複数の残余信号および結合チャネル信号を得るステップを含む。ここで、ベースバンド信号のスペクトル成分は第一の組の周波数サブバンドにおける入力オーディオ信号のスペクトル成分を表し、残余信号のスペクトル成分は、ベースバンド信号によって表現されない第二の組の周波数サブバンドにおける入力オーディオ信号のスペクトル信号を表す。またここで前記結合チャネル信号のスペクトル成分は第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分の合成を表し、残差信号のスペクトル成分のエネルギー測度および前記結合チャネル信号によって表される二つ以上の入力オーディオ信号を得るとともに、ベースバンド信号と結合チャネル信号とにおけるスペクトル成分を表すエネルギー測度と信号情報とから導かれる符号化した信号のスケーリング情報へアセンブリする。
本発明のさらに別の観点に従って、複数の入力オーディオ信号を表す符号化信号をデコード化する方法は制御情報と信号情報とを符号化信号から得るステップを含む。ここで、前記制御信号はスペクトル成分から導かれ、前記信号情報は複数のベースバンド信号と1つの結合チャネル信号とのスペクトル成分を表し、ベースバンド信号におけるスペクトル成分は第一の組の周波数サブバンドにおける入力オーディオ信号のスペクトル成分を表し、また前記結合チャネル信号のスペクトル成分は二つ以上の入力オーディオ信号の第三の組の周波数サブバンドにおけるスペクトル成分の合成を表す。ベースバンド信号によって表されない第二の組の周波数サブバンドにおけるスペクトル成分を持つ結合合成信号を、ベースバンド信号に関して発生する。ここで、結合合成信号におけるスペクトル成分は制御情報に従ってスケールされ、前記結合チャネル信号によって表される二つ以上の入力信号に関して、前記結合チャネル信号から減結合信号を発生する。ここで、前記減結合信号は制御信号に従ってスケールされた第三の組の周波数サブバンドにおけるスペクトル成分を持ち、ベースバンド信号および結合合成信号におけるスペクトル成分から入力オーディオ信号を表す複数の出力オーディオ信号を発生する。ここで、二つ以上のオーディオ信号を表す出力オーディオ信号は、個々の減結合信号におけるスペクトル成分からも生じる。
本発明の他の観点は処理回路を持つデバイスを含み、そのデバイスは、種々の符号化方法とデコード化方法、前記デバイスに種々の符号化方法とデコード化方法とを実行させるデバイスによって実行可能な命令のプログラムを伝送する媒体、および種々の符号化方法によって発生する入力オーディオ信号を表す符号化された情報を伝送する媒体を実行する。
本発明の種々の特徴およびその好適な実施形態は、以下の議論および付随の図を参照することによってもっと良く理解でき、そこでは同じレファレンス番号はその幾つかの図において同じ要素を参照する。以下の議論と図との内容は、実施例だけとして説明されるのであり、本発明の範囲に関して制限を表すと理解されるべきではない。
(発明を達成する方法)
(概説)
本発明は、元の入力オーディオ信号の「残余または残差」部分を切り捨て、元の入力オーディオ信号のベースバンド部分だけを符号化し、さらに消失した残差部分に置き換えるための合成信号を発生することによって上記の符号化信号をデコード化することにより、符号化信号の必要な情報容量を減少させるオーディオ符号化システムに関する。
前記符号化信号は、合成信号が元の入力オーディオ信号の残差部分のスペクトル部分をある程度まで保存するように、制御信号の合成に対するデコード化処理によって用いられるスケーリング情報を含む。
この符号化技術はここでは高周波再生(HFR)と呼ばれる。なぜなら多くの実施形態において残差信号は高周波信号成分を含むということが予想されるからである。しかし、原則として、この技術は高周波スペクトル成分だけの合成に制限されない。ベースバンド信号は、より高い周波数スペクトル成分の幾つか又は全部を含むことができるか、または入力信号の全バンド幅に渡って分散された周波数サブバンドにおけるスペクトル成分を含むことができる。
(エンコーダー)
図1は、入力オーディオ信号を受けて、入力オーディオ信号を表す符号化信号を発生するオーディオエンコーダーを示す。解析フィルターバンク10は、パス(経路)9からの入力オーディオ信号を受け、それに応じて、オーディオ信号のスペクトル成分を表す周波数サブバンド情報を提供する。ベースバンド信号のスペクトル成分を表現する情報はパス12に沿って生じ、また残差信号のスペクトル成分を表す情報はパス11に沿って生じる。ベースバンド信号のスペクトル成分は第一の組の周波数サブバンドの1つ以上のサブバンドにおいて入力オーディオ信号のスペクトル成分を表し、それは符号化信号において伝送された信号情報によって表現される。好適な実施形態において、第一の組の周波数サブバンドはより低い周波数サブバンドである。残差信号のスペクトル成分は第二の組の周波数サブバンドの1つ以上のサブバンドにおいて入力オーディオ信号のスペクトル内容を表し、それはベースバンド信号において表現されないし、符号化させた信号によって伝送されない。一つの実施形態において、第一と第二の組との周波数サブバンドの結合は入力オーディオ信号の全体のバンド幅を構成する。
エネルギー計算機31は残差信号の1つ以上の周波数サブバンドにおいて1つ以上のスペクトルエネルギーの測度を計算する。好適な実施形態において、パス11から受け取ったスペクトル成分は人間の音声システムの臨界バンドと比例するバンド幅を持つ周波数サブバンドにおいて配列され、またエネルギー計算機31はこれらの周波数サブバンドの各々に関してエネルギー測度を提供する。
合成モデル21は、パス51に沿って生じる符号化信号をデコード化するために用いられるデコード化プロセスにおいて生じる信号合成プロセスを表す。合成モデル21はそれ自体で合成処理を成し遂げても良いし、或いはそれは合成処理を実際には行わずに合成信号のスペクトルエネルギーを評価できるある他の処理を実行しても良い。エネルギー計算機32は合成モデル21の出力を受けて、合成信号のスペクトルエネルギーの1つ以上の測度を計算する。好適な実施形態において、合成信号のスペクトル成分は人間の音声システムの臨界バンドと比例するバンド幅を持つ周波数サブバンドにおいて配列され、またエネルギー計算機32はこれらの周波数サブバンドの各々に関してエネルギー測度を提供する。
図5、6および8における引例と同様に図1における引例は、解析フィルターバンクと、合成モデルがベースバンド信号に対して少なくとも部分的に応答することを示す合成モデルとの間の結合を示す。しかし、この結合はオプションである。合成モデルの幾つかの実施形態が以下に議論される。これらの実施形態の幾つかはベースバンド信号とは独立して機能する。
スケールファクター計算機40は二つのエネルギー計算機の各々から1つ以上のエネルギー測度を受けて、以下でさらに詳細に説明されるスケールファクターを計算する。計算されたスケールファクターを表現するスケーリング情報はパス41に沿って伝送される。
フォーマッタ50は、パス41からスケーリング情報を受けて、またパス12からベースバンド信号のスペクトル成分を表す情報を受け取る。この情報は符号化信号にアセンブリされ、それは伝送用または記録用のパス51に沿って伝送される。符号化信号はベースバンドまたは超音波から紫外線周波数までを含むスペクトルに及ぶ変調された伝達パスによって伝送されても良い。或いはそれは、磁気テープ、カードまたはディスク、光学カードまたはディスク、および紙のようなメディア上で検出可能なマーキングを含む本質的にどんな記録技術をも用いて、メディア上で記録されても良い。
好適な実施形態において、ベースバンド信号のスペクトル成分は、冗長的であるか無意味であるかのどちらかの部分を切り捨てることによって、必要な情報容量を減少させる知覚的符号化処理を用いて符号化される。これらの符号化処理は本発明には本質的ではない。
(デコーダー)
図2はオーディオ信号を表現する符号化信号を受けて、オーディオ信号のデコード化された表現を発生するオーディオデコーダーを示す。デフォーマッタ60は、パス59から符号化信号を受けて、その符号化信号からスケーリング情報と信号情報とを得る。そのスケーリング情報はスケールファクターを表し、その信号情報は第一の組の周波数サブバンドにおいて一つ以上のサブバンドのスペクトル成分を持つベースバンド信号のスペクトル成分を表す。信号合成成分23は、合成処理を実行し、符号化信号によって伝送されなかった残差信号のスペクトル成分を表す第二の組の周波数サブバンドにおいて、一つ以上のサブバンドのスペクトル成分を持つ信号を発生する。
図2および7の図は、デフォーマッタと、前記合成信号が少なくとも部分的にベースバンド信号に応答するということを示唆する信号合成成分23との間の連結を示す。しかし、この連結はオプションである。信号合成の幾つかの実施形態は以下で議論される。これらの実施形態の幾つかはベースバンド信号と独立して働く。
信号スケーリング成分70は、パス61から受けるスケーリング情報からスケールファクターを得る。スケールファクターは信号合成成分23によって生じる合成信号のスペクトル成分をスケール化するために使われる。合成フィルターバンク80はパス71からスケール化した合成信号を受け、パス62からベースバンド信号のスペクトル成分を受け、さらに応答して元の入力オーディオ信号のデコード化された表現である出力オーディオ信号をパス89に沿って発生する。その出力信号は元の入力信号と同一ではないけれど、その出力信号は出力オーディオ信号と知覚的に区別がつかないか、あるいは所望の応用に関して知覚的に満足し許容できる方法において少なくとも見分けがつかない。
好適な実施形態において、信号情報は、エンコーダーで用いられる符号化処理と反対のデコード化処理を用いてデコード化しなければならない符号化形式の、ベースバンド信号のスペクトル成分を表す。上述したように、これらの処理は本発明にとって本質的ではない。
(3.フィルターバンク)
解析および合成フィルターバンクは、デジタルフィルター技術、ブロック変換およびウエイブレット変換を好適に含んでいる本質的にどんな方法においても実行できる。図1と2とに示されるようなエンコーダーとデコーダーとを持つあるオーディオコード化システムにおいて、解析フィルターバンク10は修正離散コサイン変換(MDCT)によって実行され、合成フィルターバンク80はプリンセン(Princen)らの「時間領域エイリアス解消に基づくフィルターバンク設計を用いてコード化するサブバンド/変換」(Proc. of the International Conf. on Acoust., Speech and Signal Proc., May 1987, pp.2161-64)において述べられている修正逆離散コサイン変換によって実行される。どんな特殊なフィルターバンクの実行も原理的には重要でない。
ブロック変換によって実行される解析フィルターバンクは、入力信号のブロックまたは間隔を信号のその間隔のスペクトル内容を表す一組の変換係数へ分割する。一群の一つ以上の近接した変換係数は、その群の係数の数と比例するバンド幅を持つ特別な周波数サブバンド内でスペクトル成分を表す。
多位相フィルターのようなあるタイプのデジタルフィルターによって実行された解析フィルターバンクは、ブロック変換よりもむしろ、入力信号を一組のサブバンド信号へ分割する。各々のサブバンド信号は、特別の周波数サブバンド内で入力信号のスペクトル成分の時間ベース表現である。好適には、サブバンド信号は、各々のサブバンド信号が時間の単位間隔に関するサブバンド信号におけるサンプルの数と比例するバンド幅を持つように、10分の1が除かれる。
次の議論が上述の時間領域エイリアス解消(TDAC)変換のようなブロック変換を使う実施形態に特に関係する。この議論において、用語「スペクトル成分」は変換係数に関係し、用語「周波数サブバンド」及び「サブバンド信号」は1つ以上の近接した変換係数に関係する。本発明の原理は他のタイプの実施例に応用もできるが、用語「周波数サブバンド」と「サブバンド信号」とは信号の全バンド幅の一部のスペクトル成分を表す信号にも関係し、また用語「スペクトル成分」はサブバンド信号のサンプルまたは要素に関係すると一般に理解することも可能である。
(B.スケールファクター)
TDAC変換のような変換を使うコード化システムにおいて、たとえば、変換係数X(k)は元の入力オーディオ信号x(t)のスペクトル成分を表す。その変換係数はベースバンド信号と残差信号とを表す異なる組に分けられる。以下に述べるものの1つのような合成処理を用いるデコード化処理の間に合成信号の変換係数Y(k)を発生する。
(1.計算)
好適な実施形態において、符号化処理は、合成信号のエネルギー測度に対する残差信号のスペクトルエネルギー測度の割合の平方根から計算したスケールファクターを伝送するスケーリング情報を提供する。残差信号と合成信号とに関するスペクトルエネルギー測度は次の式から計算することもできる。
Figure 2007501441
ここで、
X(k)=残差信号の変換係数k
E(k)=スペクトル成分X(k) のエネルギー測度
Y(k)=合成信号の変換係数k、および
ES(k)=スペクトル成分Y(k) のエネルギー測度
各々のスペクトル成分に関するエネルギー測度に基づく副情報に関して必要な情報容量は大抵の応用にとって高すぎる。その結果スケールファクターは次の式によるスペクトル成分の群または周波数サブバンドのエネルギー測度から計算される。
Figure 2007501441
ここで、
E(m)=残差信号の周波数サブバンドmに関するエネルギー測度
ES(m)=合成信号の周波数サブバンドmに関するエネルギー測度
m1とm2との合計の範囲はサブバンドmの最低と最高との周波数スペクトル成分を特定する。好適な実施形態では、周波数サブバンドは人間の音声システムの臨界バンドと比例するバンド幅を持つ。
合計の範囲はk∈{M}のような集合表示を使って表しても良い。ここで{M}はエネルギー計算に含まれるすべてのスペクトル成分の集合を表す。この表示は以下で説明する理由で、この説明の残りの所で使われる。この表現を使って、式2aと2bとは式2cと2dとにおいて示されるように記載することもできる。
Figure 2007501441
ここで、
{M}=サブバンドmのすべてのスペクトル成分の集合
サブバンドmに関してスケールファクターSF(m)は次の式のどちらかから計算することもできる。
Figure 2007501441
しかし、第一の式に基づいた計算が通常はもっと有効である。
(2.スケールファクターの表現)
好適には、符号化処理は、これらのスケールファクター自体より低い情報容量を必要とする形式で計算された、スケールファクターを伝送する符号化信号におけるスケーリング情報を提供する。スケーリング情報の必要な情報容量を減らすために、種々の方法を使うこともできる。
ある方法は、結合したスケーリング値を有するスケールされた数値として各々のスケールファクター自体を表す。これを行うこともできるある方法とは、仮数がスケールされた数値であり、結合した指数はスケーリング値を表す浮動小数点の数として各々のスケールファクターを表すことである。充分な正確さを持つスケールファクターを伝送するために、仮数またはスケーリング値の精度を選択することができる。指数またはスケーリング値の許容範囲は、スケールファクターに関して充分なダイナミックレンジを提供するために選択できる。スケーリング情報を発生する処理は、二つ以上の浮動小数点仮数またはスケールされた数に、常用指数またはスケーリング値を分配させることもできる。
別の方法はある基準値または正規化値に関してスケールファクターを正規化することによって必要な情報容量を減少させる。基準値はスケーリング情報の符号化およびデコード化処理に先立って特定することもできし、或いは適応するようにそれを決定することもできる。たとえば、ある間隔のオーディオ信号の最長のスケールファクターに関して、オーディオ信号のすべての周波数サブバンドのスケールファクターを正規化することもできるし、或いは特定の値の集合から選ばれた値に関してそれらを正規化することもできる。その基準値のある表示がスケーリング情報と共に含まれ、その結果デコード化処理は正規化の効果を反転できる。
もしスケールファクターが0から1までの範囲内にある値によって表すことができるなら、多くの実施形態においてスケーリング情報を符号化しデコード化するために必要な処理を促進できる。もしスケールファクターがすべての可能なスケールファクターに等しいかそれより大きい、ある基準値に関して正規化されるなら、この範囲を保証できる。代わりに、合理的に予期できるどんなスケールファクターよりも大きい、ある基準値に関してスケールファクターを正規化でき、またもしある予期しないか又はまれな事象のためにスケールファクターがこの値を超えるなら、スケールファクターは1に等しくなる。もし基準値が2の累乗となるように制限されたら、2進整数演算関数または2進けた送り操作により、スケールファクターを正規化しその正規化を反転させる処理を効率的に実行できる。
これらの方法は1つより多くを一緒に使うことも可能である。たとえば、スケーリング情報は正規化したスケールファクターの浮動小数点表示を含んでも良い。
(C.信号の合成)
合成信号を種々の方法で発生できる。
(1. 周波数変換)
ある技術が、線形変換スペクトル成分X(k)によって合成信号のスペクトル成分Y(k)を発生する。この変換は次の式で表現できる。
Figure 2007501441
ここで、差(j−k)はスペクトル成分kに関して周波数変換の量である。
サブバンドmが周波数サブバンドpに変換されるとき、符号化処理は、次の式に従って周波数サブバンドmにおけるスペクトル成分のエネルギー測度から周波数サブバンドpに関してスケールファクターを計算することもできる。
Figure 2007501441
ここで、
{P}=周波数サブバンドpにおけるすべての周波数サブバンドの集合、および
{M}=変換される周波数サブバンドmにおけるスペクトル成分の集合
集合{M}は、周波数サブバンドmにおけるすべてのスペクトル成分を含むことは要求されないし、また周波数サブバンドmにおける幾つかのスペクトル成分は、その集合において一回より多く表現されても良い。周波数変換処理は周波数サブバンドmにおける幾つかのスペクトル成分を変換しなくても良いし、また毎回異なる量で一回より多く周波数サブバンドmにおける他のスペクトル成分を変換しても良い。周波数サブバンドpが周波数サブバンドmと同じ数のスペクトル成分を持たない時、これらの場合のどちらか又は両方が起こるだろう。
次の実施例は、周波数サブバンドmにおける幾つかのスペクトル成分が省かれ、また他は一回より多く表される場合を示す。周波数サブバンドmの周波数範囲は200Hzから3.5kHzで、周波数サブバンドpの周波数範囲は10kHzから14kHzである。500Hzから3.5kHzまでのスペクトル成分を10kHzから13kHzまでの範囲に変換することによって、周波数サブバンドpにおいて信号が合成される。ここで、各々のスペクトル成分に関して変換量は9.5kHzである。また500Hzから1.5kHzまでのスペクトル成分を13kHzから14kHzまでの範囲へ変換することによって、周波数サブバンドpにおいて信号が合成される。ここで、各々のスペクトル成分に関して変換量は12.5kHzである。この例における集合{M}は、200Hzから500Hzまでのスペクトル成分を何も含まないが、1.5kHzから3.5kHzまでのスペクトル成分を含み、また各々のスペクトル成分が500Hzから1.5kHzである2つの発生を含む。
上述のHFR応用は、合成信号の知覚される質を改良するために符号化システムに組み込むことができる他の検討を説明する。一つの検討は、可干渉性位相が変換信号において維持されることを保証するために必要な、変換されたスペクトル成分を修正する機能である。本発明の好適な実施形態において、周波数変換量は、その変換された成分が他のどんな修正もなく可干渉性位相を維持するように、抑制される。TDAC変換を使う実施形態に関して、たとえば、変換量が偶数であることを保証することによってこれを達成できる。
別の検討は、オーディオ信号のノイズ様またはトーン様特性である。多くの場合において、オーディオ信号の高周波部分は低周波部分よりもノイズ様である。もし低周波ベースバンド信号がトーン様であり、かつ高周波残差信号がノイズ様であるなら、周波数変換は元の残差信号よりトーン様である高周波合成信号を発生するだろう。信号の高周波部分の特性の変化は可聴低下を起こすことが可能であるが、高周波部分のノイズ様特性を保つために、周波数変換とノイズ発生とを使う以下で述べる合成技術によって、その可聴度の低下を減少できるかまたは回避することができる。
他の場合において、信号の低周波および高周波部分とが両方ともトーン様である時、周波数変換はそれでも可聴低下を起こすかも知れない。なぜなら、変換された信号成分は元の残差信号のハーモニック構造を保持しないからである。周波数変換によって合成される残差信号の最低周波数を制限することによって、この可聴効果の低下を減少できるかまたは避けることができる。HFR応用は、変換の最低周波数が約5kHzより低くはないということを示唆する。
(2.ノイズ発生)
合成信号を発生するために用いることができる第二の技術は、時間領域信号のサンプルを表す擬似乱数列を発生することによるようなノイズ様信号を合成することである。この特殊な技術は、解析フィルターバンクを、その後の信号合成に関して発生した信号のスペクトル成分を得るために使わなければならないという欠点を持つ。代わりに、スペクトル成分を直接に発生するために擬似乱数発生器を使うことによって、ノイズ様信号を発生することができる。次の式によって、どちらの方法でも図式的に表すことができる。
Figure 2007501441
ここで、
N(j)=ノイズ様信号のスペクトル成分j
しかし、どちらの方法に関しても、符号化処理はノイズ様信号を合成する。この信号を発生するために必要な付加的な計算用資源は符号化処理の複雑さと実行コストとを増加させる。
(3.変換とノイズ)
信号合成の第三の技術は、ベースバンド信号の周波数変換を合成化されたノイズ様信号のスペクトル成分と結合することである。好適な実施形態において、変換された信号とノイズ様信号との相対的な部分は、符号化信号において伝送されるノイズ混成制御情報に従って、HFR応用において述べたように適応する。この技術は次の式で表現される。
Figure 2007501441
ここで、
a=変換されたスペクトル成分の混成パラメーター
b=ノイズ様スペクトル成分の混成パラメーター
一つの実施形態において、混成パラメーターbは、スペクトル成分値の算術平均に対する幾何学的平均の割合の対数に等しいスペクトルフラットニス測度(SFM)の平方根を取ることによって計算され、それは0から1までの範囲内で変化するようにスケールされ、また束縛される。この特別な実施形態に関して、b=1はノイズ様信号を示す。好適には、混成パラメーターaはbから導かれ、次の式で示される。
Figure 2007501441
ここで、cは定数である。
好適な実施形態において、式8の定数cは1に等しい。また、そのスペクトル成分N(j)が、0と、それらを結合する変換されたスペクトル成分のエネルギー測度に統計的に等価であるエネルギー測度と、の平均値を持つように、ノイズ様信号を発生する。合成処理は、式7において上で示されるように、ノイズ様信号のスペクトル成分を変換されたスペクトル成分と混成することができる。この合成信号において周波数サブバンドpのエネルギーは次の式から計算することもできる。
Figure 2007501441
代替の実施形態において、混成パラメーターは周波数の特定関数を表す。或いはそれらは明らかに、元の入力オーディオ信号のノイズ様特性がどのように周波数と共に変化するかを示す周波数a(j)とb(j)との関数を伝送する。もう1つの実施形態において、混成パラメーターは個々の周波数サブバンドに関して提供され、それは各々のサブバンドに関して計算できるノイズ測定に基づく。
合成信号のエネルギー測度の計算は、符号化およびデコード化処理によって行われる。ノイズ様信号のスペクトル成分を含む計算は望ましくはない。なぜなら、符号化処理は、これらのエネルギー計算を実行するという目的のためにだけノイズ様信号を合成するために付加的な計算用資源を使わなければならないからである。合成信号それ自体は符号化処理による他のどんな目的に関しても必要とされない。
上で述べた好適な実施形態により、符号化処理は、ノイズ様信号を合成しないで式7に示される合成信号のスペクトル成分のエネルギー測度を得ることができる。なぜなら、合成信号のスペクトル成分の周波数サブバンドのエネルギーは、ノイズ様信号のスペクトルエネルギーと十分に独立しているからである。符号化処理は変換されたスペクトル成分にだけ基づくエネルギー測度を計算できる。この方法で計算したエネルギー測度は、概して、実際のエネルギーの正確な測度であるだろう。その結果、符号化処理は、式5に従ってベースバンド信号の周波数サブバンドmのエネルギー測度だけから周波数サブバンドpのスケールファクターを計算できる。
代替の実施形態において、スペクトルエネルギー測度がスケールファクターよりむしろ符号化信号によって伝送される。この代替の実施形態において、そのスペクトル成分が0に等しい平均と1に等しい分散とを持つように、ノイズ様信号を発生する。式7で示される成分を結合することによって得られる合成信号のスペクトルエネルギーは、概して、定数cに等しい。符号化処理は、元の残差信号と同じエネルギーを持つように、この合成信号をスケールすることができる。定数cが1に等しくない場合は、スケーリング処理はこの定数も説明するはずである。
(D.結合(カップリング))
二つ以上のチャネルのオーディオ信号を表す符号化信号を発生させるコード化システムにおいて結合を使うことによって、デコード化された信号の知覚される所望のレベルの信号品質に関して、符号化信号の必要な情報を減少させることができる。
(1. エンコーダー)
図5と6とは、パス9aと9bとから2チャネルの入力オーディオ信号を受けて、2チャネルの入力オーディオ信号を表す符号化信号を、パス51に沿って発生するオーディオエンコーダーを示す。解析フィルターバンク10a及び10b、エネルギー計算機31a、32a、31b及び32b、合成モデル21a及び21b、スケールファクター計算機40a及び40b、並びにフォーマッタ50の詳細及び特徴は、図1で示された信号チャネルエンコーダーの成分に関して上で述べたものと本質的に同じである。
(a)共通の特徴)
図5と6とにおいて示したエンコーダーは類似している。二つの実施形態に共通の特徴はその相違が議論される前に説明される。
図5および6を参照すると、解析フィルターバンク10a及び10bは、第三の組の周波数サブバンドにおいて1つ以上のサブバンドの個々の入力オーディオ信号のスペクトル成分を表すパス13aおよび13bそれぞれに沿ってスペクトル成分を発生する。好適な実施形態において、第三の周波数サブバンドは、第一の組の周波数サブバンドの低周波数サブバンドより大きく、第二の組の周波数サブバンドの高周波数サブバンドより小さい1つ以上の中間周波数サブバンドである。エネルギー計算機35aおよび35bは、各々1つ以上の周波数サブバンドにおいて1つ以上のスペクトルエネルギー測度を計算する。好適には、これらの周波数サブバンドは人間の音声システムの臨界バンドと比例するバンド幅を持ち、エネルギー計算機35aおよび35bはこれらの周波数サブバンドの各々にエネルギー測度を提供する。
カプラー(結合器)26は、パス13aおよび13bから受け取られるスペクトル成分の混成を表すスペクトル成分を持つ結合チャネル信号を、パス27に沿って発生する。この混成表現を種々の方法で形成できる。たとえば、パス13aおよび13bから受け取られる対応のスペクトル成分値の合計または平均から混成表現の各々のスペクトル成分を計算することもできる。エネルギー計算機37は結合チャネル信号の1つ以上の周波数サブバンドにおいて1つ以上のスペクトルエネルギー測度を計算する。好適な実施形態において、これらの周波数サブバンドは人間の音声システムの臨界バンドと比例するバンド幅を持ち、エネルギー計算機37はこれらの周波数サブバンドの各々にエネルギー測度を提供する。
スケールファクター計算機44はエネルギー計算機35a、35bおよび37の各々から1つ以上のエネルギー測度を受けとり、上で説明したようにスケールファクターを計算する。結合チャネル信号において表される各々の入力オーディオ信号に関してスケールファクターを表すスケーリング情報は、パス45aおよび45bそれぞれに沿って通る。このスケーリング情報は上で説明したように符号化も可能である。好適な実施形態において、スケールファクターは、次の式のどちらかによって表される各々の周波数サブバンドにおける各々の入力チャネル信号に関して計算される。
Figure 2007501441
ここで、
SFi(m)=信号チャネルiの周波数サブバンドmに関するスケールファクター
Ei(m)=入力信号チャネルiの周波数サブバンドmに関するエネルギー測度
EC(m)=結合チャネルの周波数サブバンドmに関するエネルギー測度
フォーマッタ50は41a、41b、45aおよび45bからスケーリング情報を受け、パス12aおよび12bからベースバンド信号のスペクトル成分を表す信号を受け、さらにパス27から結合チャネル信号のスペクトル成分を表す信号を受ける。この情報は伝送または記録するために上で説明したように符号化信号にアセンブリされる。
図7で示されるデコーダーと同様に、図5および6で示されるエンコーダーは2チャネルデバイスである。しかし、本発明の色々な観点は、多数のチャネルのコード化システムにおいて応用可能である。その説明と図とは、単に説明と引例との便宜のために2チャネルの実施形態を参照する。
b)異なる特徴
HFRのデコード化処理において、結合チャネル信号のスペクトル成分を使うこともできる。そのような実施形態において、エンコーダーは、結合チャネル信号から合成信号を発生する時に使うデコード化処理のために、符号化信号の制御情報を提供すべきである。この制御情報を幾つかの方法において発生することもできる。
一つの方法が図5で示されている。この実施形態に従って、合成モデル21aはパス12aから受け取るベースバンドスペクトル成分に応答し、またカップラー26によって結合することになるパス13aから受けるスペクトル成分に応答する。合成モデル21a、結合したエネルギー計算機31aおよび32a、並びにスケールファクター40aは上で議論した計算と同様の方法で計算を実行する。これらのスケールファクターを表すスケーリング情報はフォーマッタ50へのパス41aに沿って通る。そのフォーマッタはまた、パス12bおよび13bからスペクトル成分に関して、同様の方法で計算されたスケールファクターを表すパス41bからスケーリング情報を受ける。
図5において示されるエンコーダーの代替の実施形態において、上で議論したように、合成モデル21aはパス12aと13aのどちらか1つまたは両方からスペクトル成分と独立に作用し、また合成モデル21bはパス12bと13bのどちらか1つまたは両方からスペクトル成分と独立に作用する。
さらに別の実施形態において、HFRのスケールファクターは、結合チャネル信号またはベースバンド信号またはその双方に関して計算されない。代わりに、スペクトルエネルギー測度の表現が、フォーマータへ通り、対応するスケールファクターの表現よりもむしろ符号化信号に含まれる。この実施形態はデコード化処理の計算の複雑さを増加させる。なぜならそのデコード化処理は少なくとも幾つかのスケールファクターを計算しなければならないからである。しかし、それは符号化処理の計算の複雑さを減らす。
制御情報を発生させる別の方法が図6に示されている。この実施形態に従って、スケーリング成分91aおよび91bはパス27から結合チャネル信号を、スケールファクター計算機44からスケールファクターを受けて、上で議論したデコード化処理において実行されたものに等しい処理を実行し、結合チャネル信号から減結合(デカップル)信号を発生する。その減結合信号は合成モデル21aおよび21bへ通り、スケールファクターが、図5と関連して上で議論したものと同様の方法で計算される。
図6で示されるエンコーダーの代替実施形態において、これらのスペクトル成分がスペクトルエネルギー測度およびスケールファクターの計算に関して必要とされない場合には、合成モデル21aおよび21bは、ベースバンド信号または結合チャネル信号またはその双方のスペクトル成分と独立して作用しても良い。さらに、結合チャネル信号のスペクトル成分がHFRに関して使われない場合には、合成モデルは結合チャネル信号と独立して作用しても良い。
(2.デコーダー)
図7は、パス59から2チャネルの入力オーディオ信号を表す符号化信号を受けて、パス89aおよび89bに沿ってデコード化された信号表現を発生するオーディオデコーダーを示す。デフォーマッタ60の詳細および特徴、信号の合成成分23aおよび23b、信号のスケーリング成分70aおよび70b、並びに合成フィルターバンク80aおよび80bは、図2で示された信号チャネルデコーダーの成分に関して上述したものと本質的に同一である。
デフォーマッタ60は、符号化信号から結合チャネル信号と一組の結合スケールファクターとを得る。結合チャネル信号は、それは2つの入力オーディオ信号のスペクトル成分の混成を表すスペクトル成分を持つが、パス64に沿って通る。2つの入力オーディオ信号の各々に関して、結合スケールファクターがパス63aと63bに沿って通る。
信号のスケーリング成分92aは、パス93aに沿って元の入力オーディオ信号の1つにおいて対応するスペクトル成分のスペクトルエネルギーレベルに近い減結合信号のスペクトル成分を発生する。減結合スペクトル成分は、適切な結合スケールファクターによる結合チャネル信号の各々のスペクトル成分を掛け合わせることによって発生することができる。結合チャネル信号のスペクトル成分を周波数サブバンドに配列し、スケールファクターを各々のサブバンドに提供する実施形態において、減結合信号のスペクトル成分を次の式に従って発生する。
Figure 2007501441
ここで、
XC(k)=結合チャネル信号のサブバンドmにおけるスペクトル成分k
SFi(m)=信号チャネルiの周波数サブバンドmに関するスケールファクター
XD(k)=信号チャネルiの減結合スペクトル成分k
各々の減結合信号はそれぞれの合成フィルターバンクへ通る。上述の好適な実施形態において、各々の減結合信号のスペクトル成分は、第一および第二の組の周波数サブバンドの周波数サブバンドに対して中間的な第三の組の周波数サブバンドの1つ以上のサブバンドに存在する。
減結合スペクトル成分はまた、それらが信号合成に関して必要とされる場合には、それぞれの信号の合成成分へ通る。
(E.適応帯域化)
上で議論したように2つまたは3つの組のどちらかの周波数サブバンドへスペクトル成分を配列するコード化システムは、各々の組に含まれるサブバンドの周波数レンジまたは範囲を適応させることもできる。たとえば、ノイズ様であると考えられる高周波スペクトル成分を持つ入力オーディオ信号の間隔の間に、残差信号に関して第二の組の周波数サブバンドの周波数範囲の低いほうを減らすことは利点となりうる。その周波数範囲はまた、一組の周波数サブバンドにおいて、すべてのサブバンドを取り除くように適応することもできる。たとえば、第二の組の周波数サブバンドからすべてのサブバンドを取り除くことによって、大きさが大きく急に変化する入力オーディオ信号に関して、HFR処理を禁止することもできる。
図3および4は、ベースバンドの周波数範囲、残差または結合チャネルまたはその双方の信号が入力オーディオ信号の1つ以上の特性に対する応答を含むいずれの理由に関しても適応できる方法を示す。この特徴を実行するために、図1,5,6および8で示される各々の解析フィルターバンクを図3で示されるデバイスによって置き換えることも可能であり、図2で示される各々の合成フィルターバンクを図4で示されるデバイスによって置き換えることも可能である。これらの図は、周波数サブバンドがどのように3つの組の周波数サブバンドに関して適応することができるかを示す。しかし異なった数の組のサブバンドを適応させるために同じ実行原理を使うこともできる。
図3を参照すると、解析フィルターバンク14はパス9から入力オーディオ信号を受けて、応答して、適応帯域化(バンディング)成分15へ通る一組の周波数サブバンドを発生する。信号の解析成分17は入力オーディオ信号から直接に引き出されるか又はサブバンド信号から引き出されるか又はその双方の情報を解析し、この解析に応答してバンド制御情報を発生する。バンド制御情報は適応帯域化成分15へ通され、それはフォーマッタ50へパス18に沿ってバンド制御情報を通す。フォーマッタ50は符号化信号におけるこのバンド制御情報の表現を含む。
適応帯域化成分15は、サブバンド信号のスペクトル成分を周波数サブバンドの組へ割り当てることによって、バンド制御情報へ応答する。第一の組のサブバンドへ割り当てられたスペクトル成分はパス12に沿って通される。第二の組のサブバンドへ割り当てられたスペクトル成分はパス11に沿って通される。第三の組のサブバンドへ割り当てられたスペクトル成分はパス13に沿って通される。いずれの組にも含まれない周波数範囲またはギャップがある場合には、この範囲またはギャップのスペクトル成分をいずれの組にも割り当てないことによって、これを達成することもできる。
信号の解析成分17はまたバンド制御情報を発生し、入力オーディオ信号と無関係な条件に応答して周波数範囲を適応させることもできる。たとえば、信号の品質の望ましいレベル又は符号化信号を伝送または記録するための利用可能な容量を表す信号に応答して範囲を適応させることもできる。
多くの方式においてバンド制御情報を発生することもできる。一つの実施形態において、バンド制御情報は、スペクトル成分が割り当てられることになる各々の組に関して、最低または最高またはその双方の周波数を特定する。別の実施形態において、バンド制御情報は、周波数範囲のうちの複数の前もって決められた配列の1つを特定する。
図4を参照して、適応帯域化成分81はパス71、93および62からスペクトル成分の組を受け取る。また、それはパス68からバンド制御情報を受ける。バンド制御情報はデフォーマッタ60によって符号化信号から得られる。適応帯域化成分81は、一組の周波数サブバンド信号へスペクトル成分を受けた組におけるスペクトル成分を配分することによってバンド制御情報へ応答し、それは合成フィルターバンク82へ通される。合成フィルターバンク82は、パス89に沿って、周波数サブバンドに応答して出力オーディオ信号を発生する。
(F.第二の解析フィルターバンク)
上述のTDAC変換のような変換を用いて解析フィルターバンク10を実行するオーディオエンコーダーにおける式(1a)から計算されるスペクトルエネルギーの測度は、たとえば、入力オーディオ信号の真のスペクトルエネルギーより低い傾向にある。なぜなら解析フィルターバンクは実数値の変換係数のみを提供するからである。離散フーリエ変換(DFT)のような変換を用いる実施形態はもっと正確なエネルギー計算を提供できる。なぜなら各々の変換係数は、各々のスペクトル成分の真の大きさをもっと正確に伝送する複合値によって表されるからである。
TDAC変換のような変換から実数値のみを持つ変換係数に基づいたエネルギー計算の固有の不正確さは、解析フィルターバンク10の基礎関数に直交する基礎関数を持つ第二の解析フィルターバンクを用いることによって、克服することができる。図8は、図1に示されるエンコーダーと同様であるが、第二の解析フィルターバンク19を含むオーディオエンコーダーを示す。エンコーダーがTDAC変換のMDCTを使い解析フィルターバンク10を実行する場合には、対応する修正離散的サイン変換(MDST)を使い、第二の解析フィルターバンク19を実行することができる。
エネルギー計算機39は次の式からスペクトルエネルギーE’(k)のもっと正確な測度を計算する。
Figure 2007501441
ここで、
X1(k)=第一の解析フィルターバンクからの変換係数k
X2(k)=第二の解析フィルターバンクからの変換係数k
周波数サブバンドに関してエネルギー測度を計算する実施形態において、エネルギー計算機39は、次の式から周波数サブバンドmに関してその測度を計算する。
Figure 2007501441
スケールファクター19は、式(3a)または(3b)と同様の方法でこれらのもっと正確なエネルギー測度からスケールファクターSF’(m)を計算する。式(3a)と同様の計算が式(14)に示される。
Figure 2007501441
これらのもっと正確なエネルギー測度から計算されるスケールファクターSF’(m)を用いる時、ある注意をすべきである。もっと正確なエネルギー測度に従ってスケールされた合成信号のスペクトル成分は、信号のベースバンドと再生された合成部分との相対的なスペクトルバランスをまず確実にゆがめるだろう。なぜならもっと正確なエネルギー測度は常に、実数値変換係数のみから計算されるエネルギー測度以上に大きいからである。この違いを補正できる一つの方法は、もっと正確なエネルギー測度を半分だけ減らすことである。なぜなら、概して、もっと正確な測度はもっと小さい正確な速度の2倍となるからである。この減少は、スペクトルエネルギーのもっと正確な測度の利点を保ちながら、信号のベースバンドと合成部分とにおける統計的に矛盾のないエネルギーレベルを提供するだろう。
たとえ付加的係数が第二の解析フィルターバンク19から利用できるとしても、式(14)における割合の分母を、解析フィルターバンク10から実数値変換係数のみから計算すべきであるということを指摘することは有用であるかも知れない。スケールファクターの計算をこの方法で行うべきである。なぜならデコード化処理の間に実行されるスケーリングは、解析フィルターバンク10から得られる変換係数のみと同様の合成スペクトル成分に基づいているからである。デコード化処理は、第二の解析フィルターバンク19から得られるスペクトル成分に対応するか、あるいは導かれうる、どんな係数にもアクセスを持たないだろう。
(G.実施形態)
汎用コンピューターシステム、または汎用コンピューターシステムにおいて見つけられるものと同様の部品に連結されたデジタルシグナルプロセッサー(DSP)のようなもっと特殊な部品を含む幾つかの他の装置のソフトウエアを含む広範な種類の方法において、本発明の種々の観点を実行することもできる。図9はオーディオエンコーダーまたはオーディオデコーダーにおいて本発明の種々の観点を実施するために用いることもできるデバイス70のブロック図である。DSP72はコンピューター資源を示す。RAM73はシグナル処理用のDSP72によって使われるシステム・ランダムアクセスメモリ(RAM)である。ROM74は、デバイス70を動かし、本発明の種々の観点を実行するために必要なプログラムの記憶用のリードオンリメモリ(ROM)のような、ある形式の永久記憶装置を表す。I/O制御75は、伝達チャネル76、77の経路で信号を受けて運ぶためのインターフェース回路を表す。アナログオーディオ信号を受けるか又は伝送するか又はその双方を行うのに望ましいように、アナログ・デジタル変換器およびデジタル・アナログ変換器がI/O制御75に含まれても良い。示される実施形態において、すべての主要なシステムの部品は、バス71(それは一つより多くの物理的なバスを表しても良い)に連結する。しかし、バス構造は本発明を実施するには必要とされない。
汎用コンピュータシステムにおいて実行される実施形態において、キーボードまたはマウスおよびディスプレイのようなデバイスにインターフェースしたり、また磁気テープまたはディスクまたは光学媒体のような記録媒体を持つ記憶デバイスを制御するために付加的な部品を含むこともできる。その記録媒体は、システム、ユーティリティおよびアプリケーションを動作させるための命令プログラムを記録するために、用いられても良いし、さらに本発明の種々の観点を実行するプログラムの具体的表現を含んでも良い。
個別の論理部品、集積回路、一つ以上のASICまたはプログラム制御プロセッサーまたはその双方を含む広範な種類の方法で実施される部品によって、本発明の種々の観点を実施するために必要な機能を実行することができる。これらの部品を実行する方法は本発明には重要ではない。
超音波から紫外線周波数までを含むスペクトルに渡るベースバンドまたは変調伝達パス、または磁気テープ、カードまたはディスク、光学カードまたはディスク、および紙のような媒体上の検出可能なマーキングを含む本質的にどんな記録技術を使って情報を運ぶ記憶媒体、のような種々の機械読取り可能媒体によって、本発明のソフトウエアの実行を伝送することもできる。
図1は、高周波再生を用いるデバイスによって後でデコード化するために、オーディオ信号を符号化するデバイスのブロック構成図である。 図2は、高周波再生を用いて、符号化されたオーディオ信号をデコード化するデバイスのブロック構成図である。 図3は、オーディオ信号の1つ以上の特性に対応して適用される範囲を持つ周波数サブバンド信号にオーディオ信号を分けるデバイスのブロック構成図である。 図4は、適用される範囲を持つ周波数サブバンド信号からオーディオ信号を合成するデバイスのブロック構成図である。 図5は、高周波再生とデカップリング(減結合)とを使うデバイスによって後にデコード化するためにカップリング(結合)を用いてオーディオ信号を符号化するデバイスのブロック構成図である。 図6は、高周波再生とデカップリングとを使うデバイスによって後にデコード化するために、カップリングを用いてオーディオ信号を符号化するデバイスのブロック構成図である。 図7は、高周波再生とデカップリングとを用いて符号化されたオーディオ信号をデコード化するデバイスのブロック構成図である。 図8は、エネルギー計算のために付加的なスペクトル成分を提供するために、第二のフィルターバンクを使うオーディオ信号を符号化するためのデバイスのブロック構成図である。 図9は、本発明の種々の観点を実行できる装置のブロック構成図である。

Claims (44)

  1. 一つ以上の入力オーディオ信号を符号化するための方法であって、前記方法は、
    一つ以上の入力オーディオ信号を受けることおよびそれから一つ以上のベースバンド信号と一つ以上の残差信号とを得ることであって、ベースバンド信号のスペクトル成分は第一の組の周波数サブバンドにおいてそれぞれの入力オーディオ信号のスペクトル成分を表し、結合残差信号のスペクトル成分はベースバンド信号によって表されない第二の組の周波数サブバンドにおいてそれぞれの入力オーディオ信号のスペクトル成分を表すこと、
    デコード化の間に発生する一つ以上の合成信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ることであって、一つ以上の合成信号は第二の組の周波数サブバンド内にスペクトル成分を持つこと、
    各々の残差信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、
    一つ以上の合成信号のスペクトル成分のエネルギー測度に対する残差信号のスペクトル成分のエネルギー測度の割合、残差信号のスペクトル成分のエネルギー測度に対する一つ以上の合成信号のスペクトル成分のエネルギー測度の割合の平方根、残差信号のスペクトル成分のエネルギー測度に対する一つ以上の合成信号のスペクトル成分のエネルギー測度の平方根の割合、または残差信号のスペクトル成分のエネルギー測度の平方根に対する一つ以上の合成信号のスペクトル成分のエネルギー測度の平方根の割合、の平方根を得ることによってスケールファクターを計算すること、および
    信号情報とスケーリング情報とを符号化信号にアセンブルすることであって、前記信号情報は一つ以上のベースバンド信号のスペクトル成分を表し、前記スケーリング情報はスケールファクターを表すこと、
    を含むことを特徴とする方法。
  2. 一つ以上の合成信号は、一つ以上のベースバンド信号の少なくとも幾つかのスペクトル成分の周波数変換によって、少なくとも一部において発生することを特徴とする、請求項1記載の方法。
  3. 合成信号のスペクトル成分は位相のコヒーレンスを維持する周波数変換によって発生することを特徴とする、請求項2記載の方法。
  4. 一つ以上の合成信号は、一つ以上のベースバンド信号の少なくとも幾つかのスペクトル成分の周波数変換と、一つ以上のベースバンド信号のスペクトルレベルに従って適応するスペクトルレベルを有する一つ以上のノイズ様信号の発生との結合、によって少なくとも一部分で発生することを特徴とするとともに、一つ以上の合成信号のスペクトル成分のエネルギー測度はノイズ様信号のスペクトルレベルに無関係に得られることを特徴とする、請求項1記載の方法。
  5. 一つ以上の合成信号は一つ以上のノイズ様信号の発生によって、少なくとも一部分で発生することを特徴とする、請求項1記載の方法。
  6. 残差信号のスペクトル成分のエネルギー測度はスペクトル成分の大きさを表す値から得られることを特徴とする、請求項1記載の方法。
  7. 第一の解析フィルターバンクを一つ以上の入力オーディオ信号へ応用し、一つ以上のベースバンド信号と一つ以上の残差信号とを得ること、および
    第二の解析フィルターバンクを一つ以上の入力オーディオ信号へ応用し、付加的なスペクトル成分を得ること、
    を含み、前記残差信号のスペクトル成分のエネルギー測度は、前記残差信号のスペクトル成分と前記の一つ以上の付加的なスペクトル成分とから計算されることを特徴とする、請求項6記載の方法。
  8. スケーリング情報は一つ以上の正規化値に関して正規化されたスケールファクターを表し、および前記スケーリング情報は一つ以上の正規化値の表現を含むことを特徴とする、請求項1記載の方法。
  9. 一つ以上の正規化値は一組の値から選択されることを特徴とする、請求項8記載の方法。
  10. 一つ以上の正規化値はスケールファクターに関して最大の許容可能な値を含むことを特徴とする、請求項8記載の方法。
  11. それぞれの残差信号に関する一つ以上の周波数サブバンドのスケールファクターを計算することを特徴とする、請求項1記載の方法。
  12. 一つ以上の組の周波数サブバンドの周波数範囲が適応する方法であって、前記方法は前記の適応する周波数範囲の指示を符号化信号へアセンブリすることを特徴とする、請求項11記載の方法。
  13. 周波数範囲は、一組の範囲から選択することによって適応することを特徴とする、請求項12記載の方法。
  14. 複数の入力オーディオ信号から、第三の組の周波数サブバンドにおいて二つ以上の入力オーディオ信号のスペクトル成分の混成を表すスペクトル成分を有する結合チャネル信号を得ること、
    前記結合チャネル信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、
    前記第三の組の周波数サブバンドにおける前記結合チャネル信号によって表される前記二つ以上の入力オーディオ信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、および
    結合チャネル信号におけるスペクトルエネルギーのエネルギー測度に対して二つ以上の入力オーディオ信号におけるスペクトル成分のエネルギー測度の割合の平方根、二つ以上の入力オーディオ信号におけるスペクトル成分のエネルギー測度に対して結合チャネル信号におけるスペクトルエネルギーのエネルギー測度の割合の平方根、結合チャネル信号におけるスペクトルエネルギーのエネルギー測度の平方根に対して二つ以上の入力オーディオ信号におけるスペクトル成分のエネルギー測度の平方根の割合、あるいは二つ以上の入力オーディオ信号におけるスペクトル成分のエネルギー測度の平方根に対して結合チャネル信号におけるスペクトル成分のエネルギー測度の平方根の割合を得ることによって結合スケールファクターを計算すること、
    を含む方法であって、
    前記スケーリング情報は結合スケールファクターも表し、前記信号情報は結合チャネル信号におけるスペクトル成分も表すことを特徴とする、複数の入力オーディオ信号に関する請求項1記載の方法。
  15. 一つ以上の合成信号は、第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号の少なくとも幾つかのスペクトル成分の周波数変換によって、少なくとも一部において発生することを特徴とする、請求項14記載の方法。
  16. 複数の入力オーディオ信号の一つ以上の特性を検出すること、
    前記検出された特性に応答して、第一の組の周波数サブバンド、第二の組の周波数サブバンド、または第三の組の周波数サブバンドの周波数範囲を適応させること、および
    適応する周波数範囲の指示を符号化信号へアセンブルすること、
    を含むことを特徴とする、請求項14記載の方法。
  17. 一つ以上の入力オーディオ信号の一つ以上の特性を検出すること、
    前記検出された特性に応答して第一の組の周波数サブバンドまたは第二の組の周波数サブバンドの周波数範囲を適応させること、および
    前記の適応する周波数範囲の指示を符号化信号へアセンブルすること、
    を含むことを特徴とする、請求項14記載の方法。
  18. 一つ以上の入力オーディオ信号を表す符号化信号をデコード化するための方法であって、前記方法は、
    符号化信号からスケーリング情報と信号情報とを得ることであって、前記スケーリング情報はスペクトル成分のエネルギー測度の割合の平方根またはスペクトル成分のエネルギー測度の平方根の割合から計算されるスケールファクターを表すとともに、前記信号情報は一つ以上のサブバンド信号に関するスペクトル成分を表し、さらに各々のベースバンド信号におけるスペクトル成分は第一の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表すこと、
    それぞれのベースバンド信号によって表されない第二の組の周波数サブバンドにおけるスペクトル成分を有する結合合成信号を、各々のそれぞれのベースバンド信号に関して発生することであって、前記結合合成信号における前記スペクトル成分は一つ以上のスケールファクターに従って乗算または除算によってスケールされること、および
    一つ以上の出力オーディオ信号を発生することであって、各々の出力オーディオ信号はそれぞれの入力オーディオ信号を表し、またそれぞれのベースバンド信号およびその結合合成信号におけるスペクトル成分から生じること、
    を含むこと、を特徴とする方法。
  19. 結合合成信号は、それぞれのベースバンド信号の少なくとも幾つかのスペクトル成分の周波数変換によって、少なくとも一部分において発生することを特徴とする、請求項18記載の方法。
  20. 前記周波数変換は位相のコヒーレンスを維持することを特徴とする、請求項19記載の方法。
  21. 結合合成信号は一つ以上のスケールファクターに従って適応するスペクトル成分を持つノイズ様信号の発生によって、少なくとも一部分において発生することを特徴とする、請求項18記載の方法。
  22. 一つ以上の正規化値を符号化信号から得て、一つ以上の正規化値に関してスケールファクターの正規化を逆変換することを特徴とする、請求項18記載の方法。
  23. 一つ以上の正規化値は一組の値において選択された値を表すスケーリング情報によって、前記符号化信号において伝送されることを特徴とする、請求項22記載の方法。
  24. 一つ以上の正規化値はスケールファクターに関して最大の許容可能な値を含むことを特徴とする、請求項22記載の方法。
  25. 結合合成信号の周波数サブバンドはそれぞれのスケールファクターと組み合わされることを特徴とする、請求項18記載の方法。
  26. 周波数サブバンドの周波数範囲を特定する符号化信号において伝送されるサブバンド情報に応答して、結合合成信号の発生を適応させることを特徴とする、請求項25記載の方法。
  27. 前記サブバンド情報は一組の範囲において選択された周波数範囲を表すことを特徴とする、請求項26記載の方法。
  28. 第三の組の周波数サブバンドにおける複数の入力オーディオ信号の二つ以上の混成を表すスペクトル成分を持つ結合チャネル信号を符号化信号から得ることであって、前記スケーリング情報はまた、結合チャネル信号におけるスペクトルエネルギーのエネルギー測度に対する第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分のエネルギー測度の割合の平方根、第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分のエネルギー測度に対する結合チャネル信号におけるスペクトルエネルギーのエネルギー測度の割合の平方根、結合チャネル信号におけるスペクトルエネルギーのエネルギー測度の平方根に対する第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分のエネルギー測度の平方根の割合、または第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分のエネルギー測度の平方根に対する結合チャネル信号におけるスペクトルエネルギーのエネルギー測度の平方根の割合から、計算される結合スケールファクターを表すこと、および
    結合チャネル信号によって表される二つ以上の入力オーディオ信号の各々に関して、それぞれの減結合信号を結合チャネル信号から発生することであって、前記減結合信号は、一つ以上の結合スケールファクターに従って乗算または除算によってスケールされる第三の組の周波数サブバンドにおけるスペクトル成分を持つこと、
    を含む方法であって、
    前記二つ以上の入力オーディオ信号を表す出力オーディオ信号はまた、それぞれの減結合信号におけるスペクトル成分から発生することを特徴とする、複数の入力オーディオ信号を表す信号をデコード化するための請求項18記載の方法。
  29. 結合合成信号は、第三の組の周波数サブバンドにおける少なくとも幾つかのスペクトル成分の周波数変換によって、少なくとも一部において発生することを特徴とする、請求項28記載の方法。
  30. 第一、第二、または第三の組の周波数サブバンドの周波数範囲の指示を符号化信号から得ること、および
    前記指示に応答して合成信号と減結合信号との発生を適応させること、
    を含むことを特徴とする、請求項28記載の方法。
  31. 第一または第三の組の周波数サブバンドの周波数範囲の指示を符号化信号から得ること、および
    前記指示に応答して合成信号と減結合信号との発生をて適応させること、
    を含むことを特徴とする、請求項18記載の方法。
  32. 複数の入力オーディオ信号を受けること及び複数のベースバンド信号、複数の残差信号および結合チャネル信号をそれから得ることであって、ベースバンド信号のスペクトル成分は第一の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表すとともに、結合残差信号のスペクトル成分は前記ベースバンド信号によって表されない第二の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表すことであって、前記結合チャネル信号のスペクトル成分は第二の組の周波数サブバンドにおける二つ以上のスペクトル成分の混成を表すこと、
    各々の残差信号と、前記結合チャネル信号によって表される二つ以上の入力オーディオ信号との少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、および
    符号化信号へ制御情報と信号情報とをアセンブルすること、
    を含む方法であって、
    前記制御情報はエネルギー測度から導かれ、前記信号情報は複数のベースバンド信号と結合チャネル信号とにおけるスペクトル成分を表すことを特徴とする、複数の入力オーディオ信号を符号化するための方法。
  33. デコード化する間に発生する一つ以上の合成信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ることであって、前記一つ以上の合成信号は第二の組の周波数サブバンド内にスペクトル成分を持つこと、および
    エネルギー測度の割合の平方根またはエネルギー測度の平方根の割合を計算することによって少なくとも幾つかの前記制御情報を導くこと、
    を含むことを特徴とする、請求項32記載の方法。
  34. 前記一つ以上の合成信号の少なくとも幾つかのスペクトル成分は第三の組の周波数サブバンドにおけるスペクトル成分から合成されることを特徴とする、請求項33記載の方法。
  35. 前記周波数サブバンドの組の周波数範囲が適応することであって、前記方法は前記の適応する周波数範囲の指示を符号化信号へアセンブルすることを特徴とする、請求項32記載の方法。
  36. 複数の入力オーディオ信号を表す符号化信号をデコード化するための方法であって、前記方法は、
    符号化信号から制御情報と信号情報とを得ることであって、前記制御情報はスペクトル成分のエネルギー測度から導かれ、前記信号情報は複数のベースバンド信号と結合チャネル信号とのスペクトル成分を表し、さらに各々のベースバンド信号における前記スペクトル成分は第一の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表し、前記結合チャネル信号のスペクトル成分は複数の入力オーディオ信号の二つ以上の第三の組の周波数サブバンドにおけるスペクトル成分の混成を表すこと、
    前記のそれぞれのベースバンド信号によって表されない第二の組の周波数サブバンドにおけるスペクトル成分を持つ結合合成信号を、各々のそれぞれのベースバンド信号に関して発生することであって、前記の結合合成信号におけるスペクトル成分は前記制御情報に従ってスケールされること、
    前記結合チャネル信号によって表される二つ以上の入力オーディオ信号の各々に関してそれぞれの減結合信号を前記結合チャネル信号から発生することであって、前記減結合信号は、前記制御情報に従ってスケールされる第三の組の周波数サブバンドにおけるスペクトル成分を持つこと、および
    複数の出力オーディオ信号を発生することであって、各々の出力オーディオ信号はそれぞれの入力オーディオ信号を表すとともにそれぞれのベースバンド信号とその結合合成信号とにおけるスペクトル成分から発生し、さらに二つ以上のオーディオ信号を表す出力オーディオ信号はまた、それぞれの減結合信号におけるスペクトル成分から発生すること、
    を含むこと、を特徴とする方法。
  37. 前記制御情報はエネルギー測度の割合の平方根またはエネルギー測度の平方根の割合から計算されるスケールファクターの表現を伝送すること、および前記割合における幾つかのエネルギー測度は前記合成信号の少なくとも幾つかのスペクトル成分のエネルギーを表わすことを特徴とする、請求項36記載の方法。
  38. 一つ以上の合成信号の少なくとも幾つかのスペクトル成分は第三の組の周波数サブバンドにおけるスペクトル成分から合成されることを特徴とする、請求項37記載の方法。
  39. 一つ以上の周波数サブバンドの組の周波数範囲は前記制御情報に応答して適応することを特徴とする、請求項36記載の方法。
  40. 一つ以上の入力オーディオ信号を符号化するためのエンコーダーであって、前記エンコーダーは信号処理をする方法を実行する処理回路を持ち、前記方法は、
    一つ以上の入力オーディオ信号を受けること、およびそれから一つ以上のベースバンド信号と一つ以上の残差信号とを受けることであって、ベスバンド信号のスペクトル成分は第一の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表し、結合残差信号におけるスペクトル成分は前記ベースバンド信号によって表されない第二の組の周波数サブバンド周波数における前記のそれぞれの入力オーディオ信号のスペクトル成分を表すこと、
    デコード化の間に発生する一つ以上の合成信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ることであって、前記一つ以上の合成信号は第二の組の周波数サブバンド内にスペクトル成分を持つこと、
    各々の残差信号の少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、
    一つ以上の合成信号におけるスペクトル成分のエネルギー測度に対する残差信号におけるスペクトル成分のエネルギー測度の割合の平方根、残差信号におけるスペクトル成分のエネルギー測度に対する一つ以上の合成信号におけるスペクトル成分のエネルギー測度の割合の平方根、一つ以上の合成信号におけるスペクトル成分のエネルギー測度の平方根に対する残差信号におけるスペクトル成分のエネルギー測度の平方根の割合、あるいは残差信号におけるスペクトル成分のエネルギー測度の平方根に対する一つ以上の合成信号におけるスペクトル成分のエネルギー測度の平方根の割合、を得ることによってスケールファクターを計算すること、および
    信号情報とスケーリング情報とを符号化信号へアセンブルすることであって、前記信号情報は一つ以上のベースバンド信号におけるスペクトル成分を表し、前記スケーリング情報はスケールファクターを表すこと、
    を含むこと、を特徴とするエンコーダー。
  41. 一つ以上の入力オーディオ信号を表す符号化信号をデコード化するためのデコーダーであって、前記デコーダーは信号処理をする方法を実行する処理回路を持ち、前記方法は、
    スケーリング情報と信号情報とを符号化信号から得ることであって、前記スケーリング情報はスペクトル成分のエネルギー測度の割合の平方根、またはスペクトル成分のエネルギー測度の平方根の割合から計算されるスケールファクターを表し、前記信号情報は一つ以上のベースバンド信号に関するスペクトル成分を表すことであって、各々のベースバンド信号におけるスペクトル成分は第一の組の周波数サブバンドにおけるそれぞれの入力オーディオ信号のスペクトル成分を表すこと、
    各々の個々のベースバンド信号に関して、その個々のベースバンド信号によって表されない第二の組の周波数サブバンドにおけるスペクトル成分を持つ結合合成信号を発生することであって、前記結合合成信号におけるスペクトル成分は一つ以上のスケールファクターに従って乗算または除算によってスケールされること、および
    一つ以上の出力オーディオ信号を発生することであって、各々の出力オーディオ信号は、個々の入力オーディオ信号を表し、個々のベースバンド信号とその結合合成信号とにおけるスペクトル成分から発生すること、
    を含むこと、を特徴とするデコーダー。
  42. 複数の入力オーディオ信号を符号化するためのエンコーダーであって、前記エンコーダーは信号処理をする方法を実行する処理回路を持ち、前記方法は、
    前記複数の入力オーディオ信号を受けて、それから複数のベースバンド信号、複数の残差信号および結合チャネル信号を得ることであって、ベースバンド信号のスペクトル成分は第一の組の周波数サブバンドにおける個々の入力オーディオ信号のスペクトル成分を表し、結合残差信号のスペクトル成分は前記ベースバンド信号によって表されない第二の組の周波数サブバンドにおける個々の入力オーディオ信号のスペクトル成分を表し、前記結合チャネル信号のスペクトル成分は第三の組の周波数サブバンドにおける二つ以上の入力オーディオ信号のスペクトル成分の混成を表すこと、
    各々の残差信号と、前記結合チャネル信号によって表された二つ以上の入力オーディオ信号との少なくとも幾つかのスペクトル成分のエネルギー測度を得ること、および
    制御情報と信号情報とを符号化信号へアセンブルすることであって、前記制御情報はエネルギー測度から導かれ、前記信号情報は複数のベースバンド信号と結合チャネル信号とにおけるスペクトル成分を表すこと、
    を含むこと、を特徴とするエンコーダー。
  43. 複数の入力オーディオ信号を表す符号化信号をデコード化するためのデコーダーであって、前記デコーダーは信号処理をする方法を実行する処理回路を持ち、前記方法は、
    符号化信号から制御情報と信号情報とを得ることであって、前記制御情報はスペクトル成分のエネルギー測度から導かれ、前記信号情報は複数のベースバンド信号と結合チャネル信号とのスペクトル成分を表し、各々のベースバンド信号におけるスペクトル成分は第一の組の周波数サブバンドにおける個々の入力オーディオ信号のスペクトル成分を表し、前記結合チャネル信号のスペクトル成分は二つ以上の入力オーディオ信号の第三の組の周波数サブバンドにおけるスペクトル成分の混成を表すこと、
    各々の個々のベースバンド信号に関して、前記個々のベースバンド信号によって表されない第二の組の周波数サブバンドにおけるスペクトル成分を持つ結合合成信号を発生することであって、前記結合合成信号におけるスペクトル成分は前記制御情報に従ってスケールされる第三の組の周波数サブバンドにおけるスペクトル成分を持つこと、および
    複数の出力オーディオ信号を発生することであって、各々の出力オーディオ信号は個々の入力オーディオ信号を表し、個々のベースバンド信号とその結合合成信号とにおけるスペクトル成分から生じることであって、二つ以上のオーディオ信号を表す出力オーディオ信号はまた個々の減結合信号におけるスペクトル成分から生じること、
    を含むこと、を特徴とするデコーダー。
  44. デバイスによって実行可能な命令のプログラムを伝送する媒体であって、前記命令プログラムは前記デバイスに請求項1から39までのいずれか一つの方法を実行させることを特徴とする媒体。
JP2006532502A 2003-05-08 2004-04-30 スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム Expired - Lifetime JP4782685B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/434,449 2003-05-08
US10/434,449 US7318035B2 (en) 2003-05-08 2003-05-08 Audio coding systems and methods using spectral component coupling and spectral component regeneration
PCT/US2004/013217 WO2004102532A1 (en) 2003-05-08 2004-04-30 Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Publications (2)

Publication Number Publication Date
JP2007501441A true JP2007501441A (ja) 2007-01-25
JP4782685B2 JP4782685B2 (ja) 2011-09-28

Family

ID=33416693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006532502A Expired - Lifetime JP4782685B2 (ja) 2003-05-08 2004-04-30 スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム

Country Status (19)

Country Link
US (1) US7318035B2 (ja)
EP (5) EP4057282B1 (ja)
JP (1) JP4782685B2 (ja)
KR (1) KR101085477B1 (ja)
CN (1) CN100394476C (ja)
AU (1) AU2004239655B2 (ja)
BR (1) BRPI0410130B1 (ja)
CA (1) CA2521601C (ja)
DK (1) DK1620845T3 (ja)
ES (2) ES2832606T3 (ja)
HU (1) HUE045759T2 (ja)
IL (1) IL171287A (ja)
MX (1) MXPA05011979A (ja)
MY (1) MY138877A (ja)
PL (1) PL1620845T3 (ja)
PT (1) PT2535895T (ja)
SI (1) SI2535895T1 (ja)
TW (1) TWI324762B (ja)
WO (1) WO2004102532A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009501948A (ja) * 2005-07-19 2009-01-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
JP2012208514A (ja) * 2006-06-21 2012-10-25 Samsung Electronics Co Ltd 符号化方法及び復号化方法
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2016500839A (ja) * 2012-10-10 2016-01-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CN1279512C (zh) 2001-11-29 2006-10-11 编码技术股份公司 用于改善高频重建的方法和装置
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100537517B1 (ko) * 2004-01-13 2005-12-19 삼성전자주식회사 오디오 데이타 변환 방법 및 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
JP4810422B2 (ja) * 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
BRPI0510400A (pt) * 2004-05-19 2007-10-23 Matsushita Electric Ind Co Ltd dispositivo de codificação, dispositivo de decodificação e método dos mesmos
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7676360B2 (en) * 2005-12-01 2010-03-09 Sasken Communication Technologies Ltd. Method for scale-factor estimation in an audio encoder
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
CN101501761B (zh) * 2006-08-15 2012-02-08 杜比实验室特许公司 无需边信息对时域噪声包络的任意整形
US8675771B2 (en) * 2006-09-29 2014-03-18 Nec Corporation Log likelihood ratio arithmetic circuit, transmission apparatus, log likelihood ratio arithmetic method, and program
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009057329A1 (ja) * 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2237269B1 (en) 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2836756T3 (es) 2010-01-19 2021-06-28 Dolby Int Ab Transposición armónica basada en bloque de sub bandas mejorada
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CA3203400C (en) 2010-07-19 2023-09-26 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
RU2585999C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование шума в аудиокодеках
CN103503062B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
ES2568640T3 (es) * 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
BR112015017632B1 (pt) 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
BR122020020698B1 (pt) * 2013-04-05 2022-05-31 Dolby International Ab Método para decodificação, meio legível por computador não transitório para decodificação, decodificador, e método de codificação de áudio para codificação em forma de onda intercalada
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
US10521657B2 (en) 2016-06-17 2019-12-31 Li-Cor, Inc. Adaptive asymmetrical signal detection and synthesis methods and systems
CN110945519A (zh) * 2017-07-17 2020-03-31 立科有限公司 追踪数据上的光谱响应合成
WO2019081089A1 (en) * 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MITIGATION OF NOISE AT THE LEVEL OF A DECODER
CN114708874A (zh) * 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
WO2020092955A1 (en) * 2018-11-02 2020-05-07 Li-Cor, Inc. Adaptive asymmetrical signal detection and synthesis methods and systems
US10958485B1 (en) * 2019-12-11 2021-03-23 Viavi Solutions Inc. Methods and systems for performing analysis and correlation of DOCSIS 3.1 pre-equalization coefficients

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6413200A (en) * 1987-04-06 1989-01-18 Boisukurafuto Inc Improvement in method for compression of speech digitally coded
JPH056197A (ja) * 1991-06-28 1993-01-14 Sharp Corp 音声合成装置用ポストフイルタ
JPH07248798A (ja) * 1994-03-10 1995-09-26 Oki Electric Ind Co Ltd 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置
WO1995032499A1 (fr) * 1994-05-25 1995-11-30 Sony Corporation Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur
JP2001500640A (ja) * 1997-07-14 2001-01-16 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. オーディオ信号の符号化方法
WO2002073601A1 (en) * 2001-03-13 2002-09-19 Koninklijke Kpn N.V. Method and device for determining the quality of a speech signal

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3995115A (en) 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
WO1986003873A1 (en) 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (en) 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5937000A (en) * 1995-09-06 1999-08-10 Solana Technology Development Corporation Method and apparatus for embedding auxiliary data in a primary data signal
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6341164B1 (en) * 1998-07-22 2002-01-22 Entrust Technologies Limited Method and apparatus for correcting improper encryption and/or for reducing memory storage
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US10113858B2 (en) 2015-08-19 2018-10-30 Medlumics S.L. Distributed delay-line for low-coherence interferometry
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6413200A (en) * 1987-04-06 1989-01-18 Boisukurafuto Inc Improvement in method for compression of speech digitally coded
JPH056197A (ja) * 1991-06-28 1993-01-14 Sharp Corp 音声合成装置用ポストフイルタ
JPH07248798A (ja) * 1994-03-10 1995-09-26 Oki Electric Ind Co Ltd 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置
WO1995032499A1 (fr) * 1994-05-25 1995-11-30 Sony Corporation Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur
JP2001500640A (ja) * 1997-07-14 2001-01-16 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. オーディオ信号の符号化方法
WO2002073601A1 (en) * 2001-03-13 2002-09-19 Koninklijke Kpn N.V. Method and device for determining the quality of a speech signal
JP2004524753A (ja) * 2001-03-13 2004-08-12 コニンクリジケ ケーピーエヌ エヌブィー スピーチ信号の品質を決定するための方法及び装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009501948A (ja) * 2005-07-19 2009-01-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
US8180061B2 (en) 2005-07-19 2012-05-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
JP2012208514A (ja) * 2006-06-21 2012-10-25 Samsung Electronics Co Ltd 符号化方法及び復号化方法
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US9847095B2 (en) 2006-06-21 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2016500839A (ja) * 2012-10-10 2016-01-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法
US9570085B2 (en) 2012-10-10 2017-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
JP2018036668A (ja) * 2012-10-10 2018-03-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法

Also Published As

Publication number Publication date
PT2535895T (pt) 2019-10-24
KR101085477B1 (ko) 2011-11-21
PL1620845T3 (pl) 2018-06-29
AU2004239655A1 (en) 2004-11-25
MY138877A (en) 2009-08-28
DK1620845T3 (en) 2018-05-07
US7318035B2 (en) 2008-01-08
BRPI0410130A (pt) 2006-05-16
EP2535895B1 (en) 2019-09-11
EP4057282B1 (en) 2023-08-09
EP3757994A1 (en) 2020-12-30
EP3093844B1 (en) 2020-10-21
CN1781141A (zh) 2006-05-31
US20040225505A1 (en) 2004-11-11
TW200504683A (en) 2005-02-01
ES2832606T3 (es) 2021-06-10
CN100394476C (zh) 2008-06-11
CA2521601A1 (en) 2004-11-25
EP3757994B1 (en) 2022-04-27
EP4057282A1 (en) 2022-09-14
HUE045759T2 (hu) 2020-01-28
MXPA05011979A (es) 2006-02-02
EP2535895A1 (en) 2012-12-19
TWI324762B (en) 2010-05-11
SI2535895T1 (sl) 2019-12-31
ES2664397T3 (es) 2018-04-19
CA2521601C (en) 2013-08-20
BRPI0410130B1 (pt) 2018-06-05
AU2004239655B2 (en) 2009-06-25
JP4782685B2 (ja) 2011-09-28
EP1620845B1 (en) 2018-02-28
EP3093844A1 (en) 2016-11-16
EP1620845A1 (en) 2006-02-01
KR20060014386A (ko) 2006-02-15
WO2004102532A1 (en) 2004-11-25
IL171287A (en) 2009-09-22

Similar Documents

Publication Publication Date Title
JP4782685B2 (ja) スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム
JP5253565B2 (ja) 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
CN103765509B (zh) 编码装置及方法、解码装置及方法
JP5164834B2 (ja) スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック
RU2376654C2 (ru) Параметрическое совместное кодирование аудиоисточников
US7469206B2 (en) Methods for improving high frequency reconstruction
KR100550399B1 (ko) 다중 오디오 채널을 저 비트율로 부호화 및 복호화하기위한 장치와 그 방법
WO2005036925A2 (en) Compatible multi-channel coding/decoding
TW200415922A (en) Conversion of synthesized spectral components for encoding and low-complexity transcoding
TWI288915B (en) Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP2006201785A (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110707

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4782685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250