JP2008536183A - 無相関信号の包絡線整形 - Google Patents

無相関信号の包絡線整形 Download PDF

Info

Publication number
JP2008536183A
JP2008536183A JP2008505776A JP2008505776A JP2008536183A JP 2008536183 A JP2008536183 A JP 2008536183A JP 2008505776 A JP2008505776 A JP 2008505776A JP 2008505776 A JP2008505776 A JP 2008505776A JP 2008536183 A JP2008536183 A JP 2008536183A
Authority
JP
Japan
Prior art keywords
signal
uncorrelated
smoothed
derived
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008505776A
Other languages
English (en)
Other versions
JP4804532B2 (ja
Inventor
クリストファー クジュルリング
ラルス ヴィレモエス
ユールゲン ヘレ
サッシャ ディスヒ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2008536183A publication Critical patent/JP2008536183A/ja
Application granted granted Critical
Publication of JP4804532B2 publication Critical patent/JP4804532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

スペクトル平滑化器を用いて無相関信号及び元の信号のスペクトルをスペクトル的に平滑化した後、平滑化スペクトルを用いて平滑化スペクトルの間のエネルギー配分を表すゲイン・ファクタを導き出し、包絡線整形器が、このようにして得られたゲイン・ファクタを使って無相関信号の包絡線を時間的に整形すれば、元の信号から導き出された無相関信号の包絡線を余計な歪みを持ち込むことなく整形することができる。
【選択図】図1a

Description

本発明は信号の時間包絡線の整形に関し、具体的には、ステレオ又はマルチチャンネル音声信号の復元において、ダウンミックス信号及び付加制御データから得られる無相関信号(decorrelated signal)の時間包絡線整形に関する。
近年の音声符号化の発展によって、ステレオ(又はモノ)信号と対応する制御データとに基づいて、音声信号をマルチチャンネルによる表現で再生することができるようになった。これらの方法は、ドルビー・プロロジック(Dolby Prologic)のような旧方式のマトリックス・ベースの処理技術とは大きく異なる。というのは、送信されたモノ又はステレオ・チャンネルに基づきサラウンド・チャンネルの再生を制御するために追加の制御データが送信され、アップミックスとも言われる。こういったパラメトリック型マルチチャンネル音声デコーダは、N>Mにおいて、M個の送信チャンネルと追加制御データとに基づいてN個のチャンネルを復元する。追加制御データを用いることによって、Nチャンネルすべてを送信するよりも大幅に低いデータ率が得られ、符号化が非常に効率化され、同時にMチャンネル装置及びNチャンネル装置の両方の互換性を確実にする。Mチャンネルを、単一モノチャンネル、ステレオ・チャンネル又は5.1チャンネル表現のいずれとすることもできる。従って、7.2チャンネルの元の信号を、5.1チャンネルの下位互換性のある信号と空間音声パラメータとにダウンミックスし、少々の追加ビット率増加で、空間音声デコーダに元の7.2チャンネルにそっくりのバージョンを再生させるようにすることができる。
これらのパラメトリック・サラウンド符号化方法は、通常、時間及び周波数のバリアントILD(チャンネル間レベル差)及びICC(チャンネル間コヒーレンス)の量に基づいたサラウンド信号のパラメータ化を含む。これらのパラメータは、例えば、元のマルチチャンネル信号のチャンネル・ペア間のパワー比及び相関を表現する。デコーダでの処理において、再生マルチチャンネル信号は、受信したダウンミックスチャンネルのエネルギーを、送信されたILDパラメータによって表現される全チャンネル・ペアの間に配分することによって得られる。しかしながら、マルチチャンネル信号は、すべてのチャンネルの間で等しいパワー配分を取ることがあり、一方違ったチャンネルにおける信号は大きく異なり、これにより非常に広がりのある音を聴いている印象を与えるので、ICCパラメータによって表現されているように、信号を該信号の無相関バージョンと混合して、正しい広がりが得られる。
信号の無相関バージョンは、しばしばウェット信号といわれ、信号(ドライ信号とも呼ばれる)を、全域通過フィルタのようなリバーブレータを通過させて得られる。無相関器からの出力は、通常、極めて平滑な時間応答性を有する。従って、直接入力信号は減衰するノイズ・バーストを出力する。無相関信号と元の信号を混合する際、拍手音信号のような一部の過渡信号については、無相関信号の時間包絡線をドライ信号のものとより良く合致するよう整形することが重要である。これを行わないと、プレエコー・タイプのアーチファクトに起因する大サイズの部屋での聴感と不自然な過渡音響とを生ずることになる。
低い時間分解能を有する周波数変換領域においてマルチチャンネル復元が行われるシステムでは、MPEG−4 AACなどの知覚的音声コーデックの時間ノイズ整形[J.Herre(ヘレ)及びJ.D.Johnston(ジョンストン)、「Enhancing the performance of perceptual audio coding by using temporal noise shaping(時間領域ノイズ整形(TNS)を使った知覚的音声符号化のパフォーマンス向上)」、第101回AES大会、ロサンゼルス、1996年11月]のような、量子化ノイズ整形に使われるのと同様な時間包絡線整形技法を用いることができる。これは周波数ビン全体を通した予測によって行われ、時間包絡線がドライ信号の周波数方向の線形予測により見積られ、得られたフィルタは、同様に周波数方向にウェット信号に適用される。
例えば、無相関器としての遅延線と、アップミックス対象信号として拍手音又は銃声のような強い過渡信号とを考えてみる。包絡線整形が行われない場合、信号の遅延されたバージョンが、元の信号と組み合わされてステレオ又はマルチチャンネル信号を復元することになる。これでは、アップミックスされた信号に、遅延時間分離れて過渡信号が2つ存在し、望ましからざるエコー・タイプの影響が生ずることになろう。
高度にクリティカルな信号に対し好ましい結果を得るために、無相関信号の時間包絡線を非常に高精度な時間分解能で整形し、過渡信号の遅延エコーをキャンセルするか、又は、そのエネルギーを、その時点で搬送チャンネルに包含されるエネルギーまで低減してエコーをマスクする必要がある。
無相関信号の、この広帯域のゲインの調整を、1msのような短いウィンドウを介して実施することができる[米国特許出願、「Diffuse Sound Shaping for BCC Schemes and the Like(BCCスキームなどに対する拡散音響整形)」、第11/006492号、2004年12月7日]。無相関信号に対するゲイン調整のこのような高い時間分解能は、必然的に付加的な歪みを招く。信号に加わる歪みを最小化するため、すなわち、無相関信号の時間整形が重要でない場合に、エンコーダ又はデコーダに検知メカニズムが組み込まれ、これに、何らかの所定基準に従って時間整形アルゴリズムのオン、オフを切り替えさせる。システムが検知機能の調整に過敏に反応することがあるのがこれの欠点である。
以降の記述全体を通して、無相関信号又はウェット信号という用語は、(ILD及びICCパラメータに従って)おそらくはゲイン調整されている、ダウンミックス信号の無相関バージョンに対し用いられ、ダウンミックス信号、直接信号又はドライ信号という用語は、おそらくはゲイン調整された、ダウンミックス信号に対し用いられる。
J.Herre(ヘレ)及びJ.D.Johnston(ジョンストン)、「Enhancing the performance of perceptual audio coding by using temporal noise shaping(時間領域ノイズ整形(TNS)を使った知覚的音声符号化のパフォーマンス向上)」、第101回AES大会、ロサンゼルス、1996年11月 米国特許出願、「Diffuse Sound Shaping for BCC Schemes and the Like(BCCスキームなどに対する拡散音響整形)」、第11/006492号、2004年12月7日
従来技術の実施においては、高い時間分解能によるゲイン調整、すなわち、ミリ秒レベルのような短いドライ信号のサンプルに基づいたゲイン調整は、クリティカルでない信号に対するかなりの付加的な歪みをもたらす。これらは、例えば音楽信号などの円滑な時間的展開を持つ非過渡信号である。こういったクリティカルでない信号に対してゲイン調整をスイッチオフする従来技術のアプローチは、検知メカニズムに対する、音声知覚品質の新しく強い依存性を持ち込むことになり、当然、殆どの場合不利益であり、検知に失敗すれば余計な歪みをもたらすことにもなりかねない。
本発明の目的は、余計な信号歪みを持ち込むことなく、無相関信号の包絡線をもっと効率的に整形するためのコンセプトを提供することである。
本発明の第1の態様によれば、この目的は、元の信号から得られる無相関信号又は元の信号と無相関信号とを組み合わせて得られた合成信号を処理するための装置によって達成され、該装置は:無相関信号、無相関信号から導き出される信号、元の信号、元の信号から導き出される信号、又は合成信号のスペクトルを平滑化して、平滑化された信号を得るためのスペクトル平滑化器であって、平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動するスペクトル平滑化器と;平滑化された信号に関する情報を使って、無相関信号又は合成信号の時間包絡線を整形するための時間包絡線整形器とを含む。
本発明の第2の態様によれば、この目的は、空間音声デコーダによって達成され、該デコーダは、少なくとも2つのチャンネルを有するマルチチャンネル信号から導き出される元の信号と、該マルチチャンネル信号の第1チャンネルと第2チャンネルとの間の相互関係を表現する空間パラメータとを受信するための入力インタフェースと;該空間パラメータを使って元の信号から無相関信号を導き出すための無相関器と;無相関信号、無相関信号から導き出される信号、元の信号、元の信号から導き出される信号、又は元の信号と無相関信号とを組合せて得られた合成信号のスペクトルを平滑化して平滑化された信号を得るためのスペクトル平滑化器であって、平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動する平滑化器と;平滑化された信号に関する情報を使って、無相関信号又は合成信号の時間包絡線を整形するための時間包絡線整形器とを含む。
本発明の第3の態様によれば、この目的は、元の信号から導き出される無相関信号、又は元の信号と無相関信号とを組合せて得られる合成信号を処理するための装置を備えた受信機又はオーディオ・プレーヤによって達成され、該装置は、無相関信号、無相関信号から導き出される信号、元の信号、元の信号から導き出される信号、又は合成信号のスペクトルを平滑化して平滑化された信号を得るためのスペクトル平滑化器であって、平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動する平滑化器と;平滑化された信号に関する情報を使って、無相関信号又は合成信号の時間包絡線を整形するための時間包絡線整形器とを含む。
本発明の第4の態様によれば、この目的は、元の信号から導き出される無相関信号又は元の信号と無相関信号とを組合せて得られる合成信号を処理する方法によって達成され、該方法は、無相関信号、無相関信号から導き出される信号、元の信号、元の信号から導き出される信号、又は合成信号をスペクトル的に平滑化して平滑化された信号を取得し、平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有する工程と;平滑化された信号に関する情報を使って、無相関信号又は合成信号の時間包絡線を整形する工程とを含む。
本発明の第5の態様によれば、この目的は、受信又はオーディオ再生の方法によって達成され、該方法は、元の信号から導き出される無相関信号又は元の信号と無相関信号とを組合せて得られる合成信号を処理する方法を含み、該処理方法は、無相関信号、無相関信号から導き出される信号、元の信号、元の信号から導き出される信号、又は合成信号をスペクトル的に平滑化して平滑化された信号を取得し、平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有する工程と;平滑化された信号に関する情報を使って、無相関信号又は合成信号の時間包絡線を整形する工程とを含む。
本発明の第6の態様によれば、この目的は、コンピュータ上で実行されると、前述の特許請求方法のいずれかによる方法を実施するコンピュータ・プログラムによって達成される。
本発明は、スペクトル平滑化器を使って、無相関信号又は合成信号と元の信号とをスペクトル的に平滑化し、平滑化されたスペクトルを、これら平滑されたスペクトル間のエネルギー配分を表すゲイン・ファクタを導き出すために用い、次いで、包絡線整形器が、導き出されたゲイン・ファクタを使って無相関信号又は合成信号の時間包絡線を整形すれば、余計な歪みを持ち込むことなく、元の信号から導き出される無相関信号又は元の信号と無相関信号とを組み合わせて得られた合成信号の包絡線を整形することができる、という発見に基づいている。
スペクトルの平滑化には、過渡信号は元々どちらかといえば平滑なスペクトルを有するので、これらの信号が平滑化による影響を受けにくいという利点がある。さらに、非過渡信号に対し導き出されたゲイン・ファクタは、1に近く設定される。従って、復号処理において包絡線整形のスイッチをオンオフすることなく、過渡信号を整形すること及び非過渡信号を変化させないこと双方の要求を同時に満たすことができる。
元の信号と、前記元の信号から導き出される無相関信号との組合せである合成信号の整形に対しても同様な利点が得られる。このような組合せは、まず、元の信号から無相関信号を導き出し、次いで、単に2つの信号を加えることによって得ることができる。例えば、合成信号の平滑化スペクトルと元の信号の平滑化スペクトルとを使い整形のため用いるゲイン・ファクタを導き出し、合成信号を整形することによって、該合成信号中においてあり得るアーチファクトなプリエコー・タイプを都合よく抑制することができる。
本発明は、マルチチャンネル音声信号の復元にしばしば用いられる、無相関信号の時間包絡線整形の問題に関する。本発明は、拍手音の信号に対する高い時間分解能を保持しつつ、他の種類の信号に与える歪みを最小化する新しい方法を提起する。本発明は、持ち込まれる歪量を大幅に削減する短時間エネルギー調整を実施し、アルゴリズムをずっと頑強にし、時間包絡線アルゴリズムの作動を制御するための非常に高精度の検知器への依存を少なくする新しいやり方を教示する。
本発明は以下の特徴を含む:
− 直接音声信号又は直接音声信号から導き出された信号のスペクトル平滑化を、時間包絡線整形に用いられる時間区分よりも大幅に長い時間区分に亘って実施する。
− 無相関信号のスペクトルの平滑化を、時間包絡線整形に用いられる時間区分よりも大幅に長い時間区分に亘って実施する。
− 長時間のスペクトル的に平滑化された信号に基づき、包絡線整形に用いられる短時間区分に対するゲイン・ファクタを計算する。
− LPC(線形予測符号化)を使って、時間領域におけるスペクトル平滑化を実施する。
− フィルタバンクのサブバンド領域におけるスペクトル平滑化を実施する。
− 時間包絡線の周波数方向ベース予測に先立ってスペクトル平滑化を実施する。
− 時間包絡線の周波数方向ベース予測に対しエネルギー補正を実施する。
本発明は、非常に短い時間で広帯域に亘り無相関信号のエネルギー補正を行おうとすると生ずる可能性のある次のような問題を、完全に又は大幅に低減する:
− 特に、時間的整形が必要でない信号区分に対しかなりの量の歪みがもたらされる問題。
− 不特定な信号に生ずる歪みに起因して、短時間エネルギー補正を作動すべき時を指示する検知器への高い依存がもたらされる問題。
本発明は、高い時間分解能を保持しながら加わる歪みを最小化するために必要なゲイン調整を計算する新規な方法を明らかにする。すなわち、本発明を用いた空間音声システムは、時間的整形が必要でないアイテムに加わる歪みが最小に保たれているので、クリティカルでないアイテムに対して時間整形アルゴリズムをスイッチオフする検知メカニズムにそれほど依存しない、ということである。
また、この新規発明は、変換領域内で、周波数方向の線形予測を使って、ウェット信号に適用されるドライ信号の時間包絡線を見積もる際に、どのようにより向上された見積りを得るかについても明らかにする。
本発明の1つの実施形態において、ドライ信号からウェット信号を導出した後、無相関信号を処理するために用いられる本発明の装置は1対2アップミキサの信号処理経路の中で用いられる。
まず、多数の連続した時間領域サンプル(フレーム)に対して、ウェット信号及びドライ信号のスペクトル的に平滑化された表現が計算される。次いで、これらウェット信号及びドライ信号のスペクトル平滑化表現に基づいて、もっと少数のウェット信号サンプルのエネルギーを調整するためのゲイン・ファクタが計算される。スペクトル的に平滑化することによって、本来どちらかといえば平滑な過渡信号のスペクトルは殆ど変わらないが、周期的信号のスペクトルは大きく変形される。従って、平滑化スペクトルによる信号表現を使えば、過度信号が優勢なときは無相関ウェット信号の包絡線を大きく整形し、円滑で周期的な信号がドライ・チャンネルの殆どのエネルギーを搬送しているときにはウェット信号をわずかに整形することの両方が達成できる。このように、本発明は、特に時間包絡線の整形が基本的に必要でない信号区分域に対し、信号に加わる歪み量を大幅に削減する。さらに、短時間エネルギー補正を適用すべき時を指示する従来のような検知器への高い依存が避けられる。
本発明のさらなる実施形態において、本発明の装置がアップミックスされた(組み合わされた)モノラル信号に対し作動し、該信号は、元の信号と元の信号から得られる無相関信号とを組合せてアップミックスされたモノラル信号を計算するアップミキサによって導き出される。このようなアップミキシングは、マルチチャンネル信号の対応する元チャンネルの音響的特性を有する個別チャンネルを導き出すための、マルチチャンネル信号復元における標準的方式である。このようなアップミキシングの後で本発明装置を用いることができるので、既存の機器設定を簡単に拡張することができる。
本発明のさらなる実施形態において、無相関信号の時間包絡線整形は、フィルタバンクのサブバンド領域で実施される。ここで、各サブバンドごと個別に多数の連続サンプルに対してさまざまなサブバンド信号の平滑化スペクトル表現が導き出される。スペクトル的に平滑化されたこの長期間スペクトルに基づき、元の信号のずっと短い期間を表すサンプルに対し、ドライ信号に基づき、ウェット信号の包絡線を整形するためのゲイン・ファクタが計算される。復元された音声信号の知覚的品質に関し得られる利点は前述の例によるものと同様である。さらに、フィルタバンク表現内で本発明概念の実施が可能なことにより、フィルタバンク表現を使っている既存のマルチチャンネル音声デコーダを変更し、構造上及び計算上の大きな改造の必要なく本発明概念を実施することができるという利点がある。
本発明のさらなる実施形態において、ウェット信号の時間包絡線整形は、線形予測を使ってサブバンド領域内で実施される。従って、線形予測はフィルタバンクの周波数方向に適用され、フィルタバンクで元々得られるよりも高い時間分解能による信号整形が可能になる。これも同様にフィルタバンクのいくつかの連続するサブバンド・サンプルに対するゲイン・カーブを見積もることによって、最終的エネルギー補正が計算される。
前述した本発明の実施形態の変形において、スペクトルの白色化を表現するパラメータの見積りは、フィルタバンクの隣接するいくつかの時間サンプルを均して得られる。従って、過渡信号が存在するときに、誤って導出された逆フィルタを適用しスペクトル白色化するリスクはさらに低減される。
図1は、提供されたモノ・チャンネル105を、空間パラメータを追加して使い、2つのステレオ・チャンネル107及び108にアップミックスする、1対2チャンネルのパラメトリック・アップミキシング・デバイス100を示している。該パラメトリック・アップミキシング・デバイス100は、パラメトリック・ステレオ・アップミキサ110、無相関器112、及び無相関信号を処理するための本発明の装置114を備えている。
送信されたモノラル信号105は、パラメトリック・アップミキサ110及び無相関器112に入力され、無相関器は、送信信号105から無相関ルールを用いて無相関信号を導き出し、これを、例えば、単に信号を所定の時間遅延させることによって実施することができる。無相関器112によって生成された無相関信号は、本発明の装置(整形器)114に入力され、該装置はこれに加え送信モノラル信号を入力として受信する。以降の段で詳細を説明するように、無相関信号の包絡線を整形するのに用いる整形ルールを導き出すために送信状態のモノラル信号が必要となる。
最後に、無相関信号の包絡線整形された表現がパラメトリック・ステレオ・アップミキサに入力され、該ミキサは、送信モノラル信号105及び無相関信号の包絡線整形された表現から、ステレオ信号の左チャンネル107及び右チャンネル108を導き出す。
本発明概念及び本発明の提示された各種実施形態をよりよく理解するため、以下の段において、送信モノラル信号を、追加して提供された特殊パラメータを使ってステレオ信号にアップミックスする処理を説明する。
従来技術から、ダウンミックスされたチャンネルと、ダウンミックスが行われた2つの元チャンネルのエネルギー分配に関する情報及び2つの元チャンネルの間の相関に関する情報を携える空間パラメータのセットとに基づいて2つの音声チャンネルを復元できることが分かっている。図1の実施形態は、本発明に対する枠組みを例示したものである。
図1において、ダウンミックスされたモノ信号105は、無相関ユニット112とアップミックス・モジュール110とに供給される。無相関ユニット112は、同一の周波数特性及び同一の長期間エネルギーを有する入力信号105の無相関バージョンを生成する。アップミックス・モジュールは、空間パラメータに基づいてアップミックス・マトリックス計算し、出力チャンネル107及び108が合成される。アップミックス・モジュール110は、次式によって説明することができる。
Figure 2008536183
パラメータcl、cr、α及びβは、ビットストリーム中で送信されるILDパラメータ及びICCパラメータから導き出される。信号X[k]は受信したダウンミックス信号105であり、信号Q[k]は、入力信号105の無相関バージョンである無相関信号である。出力信号107及び108はY1[k]とY2[k]とで表されている。
新しいモジュール114は、無相関モジュール112から出力される信号の時間包絡線を、該時間包絡線が入力信号105のものと一致するように整形するよう設定されている。モジュール100の詳細については、後記のセクションにおいて、さらに詳細に説明する。
前記及び図1から、アップミックス・モジュールが、ダウンミックス信号とその無相関バージョンとの線形合成を生成することは明らかである。それ故に、無相関信号とダウンミックス信号との加算を、上記で概説したアップミックス又はその後のステージにおいて実施できることは明らかである。従って、上記2つの出力チャンネル107及び108を4つの出力チャンネルで置換えることができ、そのうちの2つは第1チャンネルの無相関バージョンと直接信号バージョンとを保持し、他の2つは第2チャンネルの無相関バージョンと直接信号バージョンとを保持する。これは、前式のアップミックス式を次式で置換えることによって達成される。
Figure 2008536183
Figure 2008536183
続いて、復元された出力チャンネルは、次式で求められる。
Figure 2008536183
上記より、図1に示されるような最終のアップミキシングの前、又はアップミキシングの後において、復号スキーム中に本発明の装置を実装できることは明らかである。さらに、本発明の装置を使って、時間領域、又はQMFサブバンド領域において無相関信号の包絡線を整形することができる。
図1bは、本発明のさらなる好適な実施形態を示しており、ここでは、本発明の整形器114を使って、送信されたモノラル信号105と、送信モノラル信号105から導き出された無相関信号116とから得られた合成信号118が整形される。図1bの実施形態は図1の実施形態に基づいている。従って、同一の機能を備えた構成要素は、同一の識別番号を有する。
無相関器112は、送信されたモノラル信号105から無相関信号116を導き出す。ミキサ117は、無相関信号116及び送信モノラル信号105を入力として受信し、送信モノラル信号105と無相関信号116とを組合せて合成信号118を導き出す。
この状況において合成とは、2つ以上の入力信号から1つの信号を導き出すための任意の適切な方法を意味するものとする。最も簡単な例として、送信モノラル信号105と無相関信号116とを単に加え合わせることで、合成信号118が得られる。
整形器114は、入力として整形対象の合成信号118を受信する。整形のためのゲイン・ファクタを導き出すため、送信されてきたモノラル信号105も整形器114に入力される。整形器114の出力部には、部分的に無相関化された信号119が導き出され、該信号は、無相関信号成分と、元の信号成分とを有し、可聴の余計なアーチファクトを持ち込んでいない。
図2は、ウェット信号部分の包絡線整形をアップミックスの後で適用することが可能な配置構成を示す。
図2は、本発明のパラメトリック・ステレオ・アップミキサ120及び無相関器112を示す。モノラル信号105は、無相関器112及びパラメトリック・ステレオ・アップミキサ120に入力される。無相関器112はモノラル信号105から無相関信号を導き出し、該無相関信号をパラメトリック・ステレオ・アップミキサ120に入力する。パラメトリック・ステレオ・アップミキサ120は、図1で既に説明したパラメトリック・ステレオ・アップミキサ110に基づいている。パラメトリック・ステレオ・アップミキサ120は、パラメトリック・ステレオ・アップミキサ120が、左チャンネルのドライ部分122a及びウェット部分122bと、右チャンネルのドライ部分124a及びウェット部分124bとを導き出すという点で、パラメトリック・ステレオ・アップミキサ110とは違っている。すなわち、パラメトリック・ステレオ・アップミキサ120は、両方のチャンネルに対するドライ部分とウェット部分を別々にアップミックスする。これは前に示した数式に従って実施することができよう。
ウェット信号部分122a及び124aは、アップミックスはされているが整形されていないので、図2に示された本発明のアップミキシング・セットには、第1整形器126a及び第2整形器126bが追加配置されている。第1整形器126aは、その入力端に、整形対象のウェット信号122b、及び参照信号として左信号122aのコピーを受信する。第1整形器126aの出力端からは整形されたドライ信号128aが出力される。第2整形器126bは、その入力端に、右ドライ信号124b及び右ウェット信号124aを受信し、出力として、右チャンネルの整形されたウェット信号128bを導き出す。最終的に所望の左チャンネル107及び右チャンネル108を得るため、本発明のこの構成には、第1ミキサ129a及び第2ミキサ129bが配置されている。第1ミキサ129aは、その入力端に、左のアップミックスされた信号122aのコピー及び整形されたウェット信号128bを受信し、(その出力端に)左信号107を導き出す。第2ミキサ129bは、その入力端に、ドライ右信号124a及び整形されたウェット右信号128bを受信し、同様なやり方で右チャンネル108を導き出す。図2から分かるように、この構成を、図1に示す実施形態と置換えて動作させることができる。
図2bは、前の図2に示した実施形態を変形した、本発明の好適な実施形態を示し、従って同一の構成要素は同一の識別番号を共有する。
図2bに示される実施形態において、まず、ウェット信号122bがそのドライ対応部分122aと混合されて左中間チャンネルL*が導き出され、ウェット信号124bがそのドライ対応部分124aと混合され、右中間チャンネルR*が得られる。従って、左側の情報を含むチャンネルと右側の情報を含むチャンネルが生成される。しかしながら、まだ、ウェット信号成分122b及び124bによる可聴なアーチファクトが持ち込まれている可能性がある。そこで、中間信号L*及びR*は、ドライ信号部分122a及び124aを追加入力として受信する対応整形器126a及び126bによって整形される。こうして、最終的に所望の空間特性を有する左チャンネル107及び右チャンネル108を導き出すことができる。
要約して言えば、図2bに示された実施形態は、最初にウェット及びドライ信号をアップミックスして、得られた合成信号(L*及びR*)の整形を行うという点で、図2aに示された実施形態と違っている。従って、図2bは、使われた無相関信号部分による可聴な歪みを持ち込むことなく、2つの導出チャンネルを得るという共通問題を解決するための別の構成を示している。また、例えば、信号の相乗又は畳み込みといった、2つの信号部分を組合せて整形対象の合成信号を導き出す他のやり方も、スペクトル的に平滑化された信号の表現を用いて整形を行うという本発明のコンセプトに適している。
図3aに示すように、2つのチャンネルを再形成するモジュールをツリー状構造システムに縦続配置して、モノ・ダウンミックス・チャンネル130から、例えば5.1チャンネルを繰り返して再生することができる。この概要が図3aに示され、ここでは、いくつかの本発明のアップミキシング・モジュール100が縦続配置され、モノラル・ダウンミックス・チャンネル130から5.1チャンネルが再生される。
図3aに示された5.1チャンネル音声デコーダ132は、いくつかの1対2アップミキサ100を含み、これらはツリー状構造に配置されている。アップミックスは、既存技術で知られているように、モノ・チャンネルからステレオ・チャンネルへの引き続くアップミキシングによって繰り返し行われるが、ここでは、無相関信号を処理して、復元された5.1音声信号の知覚品質を向上するための本発明の装置を含む1対2アップミックス・ブロック100が用いられている。
本発明は、無相関器からの信号は、該信号がドライ対応部分と混合された時望ましくないアーチファクトを生じさせないため、高精度の時間包絡線整形を受けなければならない、ということを教示する。時間包絡線の整形については、図1に示すように無相関器の後にそのまま行うこともでき、これに換えて、図2に描かれたように、無相関器の後、ドライ信号及びウェット信号双方に別々にアップミキシングを行い、この2つの加算を、合成フィルタリングの後、時間領域で行うことができる。また、これに換えてフィルタバンク領域の中でこれを行うこともできる。
前述したドライ信号とウェット信号との別々の生成をサポートするために、本発明のさらなる実施形態において、図3bに示されるような階層構造が用いられる。図3bは、縦続配置されたいくつかの変形アップミキシング・モジュール152を含む第1階層型デコーダ150、及び縦続配置されたいくつかの変形アップミキシング・モジュール156を含む第2階層型デコーダ154を示している。
ドライ及びウェット信号経路の別々の生成を達成するため、モノラル・ダウンミックス信号130は分割され、第1階層型デコーダ150と第2階層型デコーダ154とに入力される。第1階層型デコーダ150の変形アップミキシング・モジュール152は、これらがその出力端にドライ信号部分だけを供給するという点で、5.1チャンネル音声デコーダ132のアップミキシング・モジュール100と違っている。対応的に、第2階層型デコーダ154の変形アップミキシング・モジュール156は、その出力端にウェット信号部分だけを供給する。従って、図3aで既に示したと同様な階層構造を使用することにより、第1階層型デコーダ150によって5.1チャンネル信号のドライ信号部分が生成され、第2階層型デコーダ154によって5.1チャンネル信号のウェット信号部分は生成される。こうして、ウェット及びドライ信号の生成を、例えばフィルタバンク領域内で実施し、2つの信号部分の合成を時間領域で実施することができる。
本発明は、非常に短い時間区分すなわち1ms範囲の時間区分を使って無相関信号を修正する際に生ずる歪みを最小化するため、後にウェット信号の時間包絡線の整形に用いられる見積り包絡線を抽出するため使われる信号は、見積りに先立って、長期間に亘るスペクトル平滑化又は白色化処理を受ける必要があることを、さらに教示する。無相関信号の時間包絡線の整形は、サブバンド領域又は時間領域における短時間区分のエネルギー調整を使って行うことができる。本発明が採用する白色化ステップは、エネルギー見積りを、できるだけ大きな時間周波数タイルで計算することを確実にする。違った言い方をすれば、前記信号区分の継続時間が極度に短いので、エネルギー計算に使われる「データ・ポイントの数」を最大化するために、できるだけ広い周波数範囲に亘って、短期間エネルギーを見積もることが重要となる。さもなければ、周波数範囲の一部が残りの部分に対して非常に優勢な場合、すなわち急傾斜のスペクトル勾配がある場合は、有効なデータ・ポイントの数が過少になり、得られた見積りが見積り毎に変わりがちになり、適用するゲイン値の不必要な変動が生ずることになる。
本発明は、周波数方向の予測を使って無相関信号の時間包絡線を整形する場合[J.Herre(ヘレ)及びJ.D.Johnston(ジョンストン)、「Enhancing the performance of perceptual audio coding by using temporal noise shaping(時間領域ノイズ整形(TNS)を使った知覚的音声符号化のパフォーマンス向上)」、第101回AES大会、ロサンゼルス、1996年11月]、無相関信号に適用さるべき時間包絡線の良好な見積りを達成するために、予測の判断材料を見積もるのに使われる周波数スペクトルは白色化ステージを経るべきことを、さらに教示する。再述するが、スペクトル白色化なしの急勾配のスペクトルの場合などを考えれば、スペクトルの小部分に基づく見積りは望ましくない。
図4aは、時間領域で作動する、本発明の好適な実施形態を示す。無相関信号200を処理するための該本発明装置は、入力として、整形対象のウェット信号202とドライ信号204とを受信し、ウェット信号202は前のステップでドライ信号204から導き出されるが、そのステップは図4には示されていない。
無相関信号202を処理するための装置200は、第1ハイパスフィルタ206、第1線形予測デバイス208、第1逆フィルタ210、及びドライ信号の1つの経路中の第1遅延素子212、ならびに、第2ハイパスフィルタ220、第2線形予測デバイス222、第2逆フィルタ224、ローパスフィルタ226、及びウェット信号の1つの経路中の第2遅延素子228を備えている。該装置は、ゲイン計算器230、乗算器(包絡線整形器)232、及び加算器(アップミキサ)234をさらに含む。
ドライ信号側では、ドライ信号の入力は分割され、第1ハイパスフィルタ206と第1遅延素子212とに入力される。ハイパスフィルタ206の出力端は、第1線形予測デバイス208の入力端と、第1逆フィルタ210の第1入力端とに接続されている。第1線形予測デバイス208の出力端は、逆フィルタ210の第2入力端に接続され、逆フィルタ210の出力端は、ゲイン計算器230の第1入力端に接続されている。ウェット信号経路では、ウェット信号202は分割され、第2ハイパスフィルタ220の入力端とローパスフィルタ226の入力端とに入力される。ローパスフィルタ226の出力端は、第2遅延素子228に接続されている。第2ハイパスフィルタ220の出力端は、第2線形予測デバイス222の入力端と第2逆フィルタ224の第1入力端とに接続されている。第2線形予測デバイス222の出力端は、第2逆フィルタ224の第2入力端に接続され、該フィルタの出力端は、ゲイン計算器230の第2入力端に接続されている。包絡線整形器232は、第1入力端に、第2ハイパスフィルタ220の出力端から供給されるハイパスフィルタリングされたウェット信号202を受信する。包絡線整形器232の第2入力端は、ゲイン計算器230の出力端と接続されている。包絡線整形器232の出力端は、加算器234の第1入力端と接続されており、該加算器は第2入力端に、第1遅延素子212の出力端から供給される遅延されたドライ信号を受信し、第3入力端には、第2遅延素子228の出力端から供給される、ウェット信号の遅延された低周波部分をさらに受信する。加算器232の出力端には、処理の完了した信号が出力される。
図4aに示す本発明の好適な実施形態において、無相関器から到来する信号(ウェット信号202)及び対応するドライ信号204は、それぞれ、第2ハイパスフィルタ220及び第1ハイパスフィルタ206に入力され、双方の信号は、約2kHzのカットオフ周波数でハイパスフィルタリングされる。また、ウェット信号202は、ローパスフィルタ226によってローパスフィルタリングされ、該フィルタは第2ハイパスフィルタ220の阻止域と同じような通過域を有している。かくして、無相関(ウェット)信号202の時間包絡線整形は、2kHzを上回る周波数範囲に対してだけ行われる。ウェット信号202のローパス部分(時間包絡線整形の対象でない)は第2遅延素子208で遅延されて、無相関信号202のハイパス部分の時間包絡線を整形する際に生じた遅延に対する補償が行われる。同じように、加算器234において、ウェット信号202の処理されたハイパスフィルタリング部分と、ウェット信号202の遅延ローパス部分と、遅延ドライ信号204とが加算又はアップミックスされて、最終的に処理されたアップミックス信号が生成できるように、ドライ信号部分204にも第1遅延素子212による同一の遅延時間が加えられる。
本発明によれば、ハイパスフィルタリングの後、長期間のスペクトル包絡線が見積もられることになる。この長期間スペクトル包絡線見積りに用いられる時間区分は、実際の時間包絡線整形を実施するのに使われる時間区分よりもかなり長いことに留意するのが重要である。スペクトル包絡線の見積り及びその後の逆フィルタリングは、通常、20msの範囲の時間区分で処理され、一方、時間包絡線整形は、1ms範囲の精度を持つ時間包絡線を形成することを狙いとしている。図4aに示す本発明の好適な実施形態において、スペクトルの白色化は、ドライ信号を処理する第1逆フィルタ210とウェット信号202を処理する第2逆フィルタ224とを使った逆フィルタリングによって行われる。第1逆フィルタ210及び第2逆フィルタ224に必要なフィルタ係数を得るために、第1線形予測デバイス208及び第2線形予測デバイス222による線形予測を使って、信号のスペクトル包絡線が見積もられる。信号のスペクトル包絡線H(z)は、以下の式で表される線形予測を使って求めることができる。
Figure 2008536183
Figure 2008536183
ここで、前式は、自己相関法又は共分散法を使って得られた多項式であり[Digital Processing of Speech Signals(音声信号のデジタル処理)の第8章、Rabiner(ラビナー)及びSchafer(シェーファー)著、ニュージャージー07632、エングルウッド・クリフス、Prentice Hall,Inc.社、ISBN 0−13−213603−1]、Gはゲイン・ファクタである。前記多項式の次数pは、予測次数と呼ばれる。
図4aに示されるように、信号のスペクトル包絡線の線形予測は、ドライ信号部分204及びウェット信号部分202に対して並行して行われる。信号のスペクトル包絡線のこれらの見積りを使って、ハイパスフィルタリングされたドライ信号204及びウェット信号202の逆フィルタリングを行うことができる、すなわち、信号内のエネルギーを保存しながら、スペクトルの平滑化(スペクトル白色化)を行うことができる。スペクトル白色化の度合い、すなわち平滑化されたスペクトルの平滑さの程度は、予測次数pを変化させることによって、すなわち、多項式A(z)の次数を制限し、これにより、H(z)で表現可能な微細構造の量を制限することによって制御することができる。これに換えて、多項式A(z)に帯域幅拡張ファクタを適用することもできる。帯域幅拡張ファクタは、多項式A(z)に基づき、次の式によって定義される。
Figure 2008536183
時間包絡線整形、及び帯域幅拡張ファクタρの効果が図4c及び4dに示されている。
図4cは、第1線形予測デバイス208及び第2線形予測デバイス222によって行うことができる信号のスペクトル包絡線の見積りの例を示す。図4cのスペクトル表現では、x軸のHz単位の周波数に対し、所定の周波数で伝送されたエネルギーがdB単位でy軸にプロットされている。
実線240は処理された信号の元のスペクトル包絡線を表し、点線242はマークされた等間隔の周波数値におけるスペクトル包絡線の値を使って、線形予測符号化(LPC)によって得られた結果を示す。図4cに示す例で、予測次数pは30であり、予測スペクトル包絡線242と実際のスペクトル包絡線240との一致性を明確にしている比較的高い予測次数である。これは、予測次数が高いほど、予測デバイスはより微細な構造を表現できるという事実によるものである。
図4dは、予測次数pを下げた場合、又は帯域幅拡張ファクタρを適用した場合の効果を示す。図4dは、図4cと同一な表現、すなわちx軸に周波数、y軸にエネルギーを表した見積り包絡線の2つの例を示す。見積り包絡線244は、所定の予測次数を使った線形予測符号化により得られたスペクトル包絡線を表している。フィルタリングされた包絡線246は、より低い予測次数pを使った、又はそれに換えて帯域幅拡張ファクタ行を適用した同じ信号の線形予測符号化の結果を示す。見て分かるように、フィルタリングされた包絡線246は、見積り包絡線244よりもずっとスムースである。このことは、見積り包絡線244とフィルタリングされた包絡線246が大きく異なる周波数では、フィルタリングされた包絡線246が、実際の包絡線を見積り包絡線244よりも低い精度で表していることを意味する。従って、フィルタリングされた包絡線246に基づく逆フィルタリングは、平滑化されたスペクトルを生成し、これは、逆フィルタリング処理において見積り包絡線244からのパラメータを用いた場合のように弱い平滑化となる。逆フィルタリングについては、以下の段で説明する。
逆フィルタ210及び224は、線形予測デバイスにより見積もられたパラメータ又は係数αkを使い、以下の逆フィルタ関数を用いて、信号のスペクトル平滑化すなわち逆フィルタリングを実施する。
Figure 2008536183
上式のpは予測次数であり、ρは任意の帯域幅拡張ファクタである。
係数αkについては、例えば、自己相関法又は共分散法などいろいろな方法によって求めることができる。システムの安定性を確実にするため、見積りにある種の緩和を加えることが慣行となっている。自己相関法を用いる場合、相関ベクトルのゼロラグ値をオフセットすることによって、簡単にこれを行うことができる。これは、A(z)を見積もるために使う信号に、一定レベルのホワイトノイズを加えることに等しい。
ゲイン計算器230は、短期間のターゲット・エネルギー、すなわち、ウェット信号の包絡線を、ドライ信号の包絡線に合わせるための要求条件を満たすため、ウェット信号の単一のサンプル内で必要なエネルギーを計算する。これらのエネルギーは、スペクトル的に平滑化されたドライ信号とスペクトル的に平滑化されたウェット信号とに基づいて計算される。次いで、導き出されたゲイン調整値を包絡線整形器232がウェット信号に適用することができる。
ゲイン計算器230のさらなる詳細を説明する前に、逆フィルタリング中における、逆フィルタ210及び224のゲイン・ファクタGに注意を払う必要があることに留意する。操作されるドライ及びウェット信号は、あらゆるチャンネルについて2つの出力信号を生成するアップミックス処理からの出力信号であり、その第1チャンネルは、第2チャンネルに対し、アップミックス処理に使われたILD及びICCパラメータに従った特定のエネルギー比率を有するので、時間包絡線整形の過程において、ILD及びICCパラメータが有効となっている時間区分の平均において、この関係を維持していることが不可欠となる。違った言い方をすれば、無相関信号を処理するための装置200は、処理の行われる区分に亘って同一の信号平均エネルギーを維持しつつ、無相関信号の時間包絡線を修正するだけである。
ゲイン計算器230は、スペクトル的に平滑化された2つの信号を操作し、逆フィルタリングに用いられる区分よりもはるかに短い時間区分の、ウェット信号に適用される短時間ゲイン関数を計算する。例えば、逆フィルタリングのための区分の長さが2048サンプルの場合に、64の長さのサンプルに対して短期間ゲイン・ファクタを計算することができる。このことは、2084サンプルの長さに亘って平滑化されたスペクトルに基づいて、例えば64といった、はるかに短い信号の区分を使い時間エネルギー整形のためのゲイン・ファクタが導き出されることを意味する。
計算されたゲイン・ファクタのウェット信号への適用は、包絡線整形器232が、計算されたゲイン・ファクタをサンプル・パラメータに乗ずることによって行われる。最後にハイパスフィルタリングされ、包絡線整形されたウェット信号は、加算器(アップミキサ)234によってその低周波部分に加えられ、最終的に処理され、包絡線整形されたウェット信号が、包絡線整形器234の出力端に生成される。
異なったゲイン・ファクタの間でのエネルギーの保存と円滑な移行とは、ゲイン・ファクタの適用におけると同様、逆フィルタリングでも問題となるので、計算されたゲイン・ファクタに、窓処理関数を加えて適用し、隣り合ったサンプルのゲイン・ファクタの間での円滑な移行を保証することができる。そこで、逆フィルタリングに対しては2048の区分長さを使い、短期間ゲイン・ファクタの計算に対しては64の区分長さを使う前述の例を想定しながら、逆フィルタリング・ステップと、計算された短期間ゲイン・ファクタのウェット信号への適用とに関し図5a、5b、及び6においてさらに詳細に説明する。
図4bは、無相関信号を処理するための本発明の装置240の変形装置を示し、包絡線整形後、包絡線整形されたウェット信号はハイパスフィルタ224に供給されている。ある好適な実施形態において、ハイパスフィルタ224は、フィルタリングされたウェット信号202の部分を導き出すハイパスフィルタ220と同じ特性を有する。従って、ハイパスフィルタ240は、無相関信号中に持ち込まれたどのような歪みも信号のハイパス特質を変えないことを確実にし、これにより無相関信号の処理されていないローパス部分と、信号の処理されたハイパス部分との加算においてミスマッチを生じさせる。
上記に要点を述べた本発明実施のいくつかの重要な特徴を再度強調しておく。
− スペクトル平滑化は、短時間のエネルギー調整に適用される時間区分よりもずっと長い時間区分のスペクトル包絡線表現を(この特定の例ではLPCを使って)計算することにより行われる。
− スペクトル平滑化された信号は、エネルギー見積りの計算にだけ用いられ、そのために、無相関(ウェット)信号の正確な時間包絡線を予測、適用するために使われるゲイン・ファクタが計算される。
− 平均エネルギー比率は、ウェット信号とドライ信号との間で維持され、変形されるのは時間包絡線だけである。従って、処理される信号区分(典型的には1024又は2048のサンプルを含むフレーム)のゲイン値Gの平均は、信号の大部分に対するものにほぼ等しい。
図5aは、無相関信号を処理するための本発明の装置200の中の第1逆フィルタ210及び第2逆フィルタ224として使われている逆フィルタのさらなる詳細な内容を示す。逆フィルタ300は、逆変換器302、第1エネルギー計算器304、第2エネルギー計算器306、ゲイン計算器308、及びゲイン適用器310を含む。逆変換器302は、入力として、フィルタ係数312(線形予測符号化により導き出されたもの)及び信号X(k)314を受信する。信号314のコピーが第1エネルギー計算器304に入力される。逆変換器は、信号314の長さ2048の信号区分に対し、フィルタ係数312に基づき逆変換を適用する。ゲイン・ファクタGは1にセットされ、従って、平滑化された信号316(Xflat(z))は、次式により入力信号314から導かれる。
Figure 2008536183
この逆フィルタリングは必ずしもエネルギーを保存しないので、長期的ゲイン・ファクタglongを使って、平滑化された信号の長期的エネルギーを保存しなければならない。従って、信号214は第1エネルギー計算器304に入力され、平滑化された信号316は第2エネルギー計算器306に入力され、信号E及び信号Eflatのエネルギーが以下により計算される。
Figure 2008536183
Figure 2008536183
上式での、スペクトル・包絡線見積り及び逆フィルタリングに対する現状の区分長さは2048サンプルである。
上記から、次式を使いゲイン計算器308によってゲイン・ファクタglongを計算することができる。
Figure 2008536183
平滑化された信号316に得られたゲイン・ファクタglongを乗じて、ゲイン適用器310によりエネルギー保存を確保することができる。ある好適な実施形態では、隣り合った信号区分間の円滑な移行を確実にするために、窓関数を使ってゲイン・ファクタglongを平滑化された信号316に適用する。こうして、音声信号の知覚品質を大きく損なう、信号の音の強さにおけるジャンプを避けることができる。
長期間ゲイン・ファクタglongを、例えば図5bに従って適用することができる。図5は、グラフによって、あり得る窓関数を示しており、x軸にはサンプルの数が示され、y軸にはゲイン・ファクタgがプロットされている。2048サンプルの全フレーム範囲を持つ窓が使われ、前のフレームのゲイン値319がフェードアウトし、現在のフレームのゲイン値320がフェードインしている。
無相関信号を処理するための本発明の装置200内で、逆フィルタ300を適用して、入力信号のエネルギーを引き続き保存しつつ該逆フィルタ後の信号がスペクトル的に平滑化されることを確実にする。
平滑化されたウェット及びドライ信号に基づき、ゲイン計算器230によってゲイン・ファクタの計算を行うことができる。これについては、以降の段でさらに詳細を説明することとし、これでは、窓関数が加えて導入され、隣り合う信号区分をスケールするため使われるゲイン・ファクタの円滑な移行が確保される。図6に示された例において、隣り合う区分に対して計算されたゲイン・ファクタは、各々、64サンプルに対して有効であり、これらは、窓関数win(k)によって追加してスケールされる。単一の区分の中のエネルギーは、以下の式に従って計算され、式中のNは、スペクトル平滑化に使われた長期間区分、すなわち2048のサンプルを有する区分内の区分の数を表す。
Figure 2008536183
Figure 2008536183
ここで、win(k)は、図6に示すような、ここの例では64サンプルの長さを持つ窓関数322である。言い換えれば、短時間ゲイン関数が、もっと短い時間区分に対してではあるが、長期間ゲイン・ファクタglongのゲイン計算と同様に計算される。次いで、ゲイン計算器230により、次式に従って各1つの短時間区分に適用される1つのゲイン値GNが計算される。
Figure 2008536183
上記により計算されたゲイン値は、図6に示された、窓化されオーバーラップが加えられた区分を使ってウェット信号に適用される。本発明の一つの好適な実施形態において、オーバーラップを加えた窓は、44.1kHzのサンプリング・レートで32サンプルの長さである。別の実施形態では、64サンプルの窓が使われる。前述したように、本発明を時間領域において実施することによる利点の一つは、時間包絡線整形の分解度を自由に選択できることである。また、図6に示された窓をモジュール230中で使い、ゲイン値gn-1、gn…gNを計算することができる。
なお、ILD及びICCパラメータに基づくアップミックスによって計算された処理済み区分全体を通してウェット信号とドライ信号との間でエネルギー関係が維持されるべきとの要求をかんがみれば、ゲイン値gn-1、gn…gN全体を平均した平均ゲイン値は、信号の大部分に対するものとほぼ等しくなければならないのは明白である。そこで、長期的なゲイン調整の計算に戻って、本発明の他の実施形態では、ゲイン・ファクタを次式として計算することができる。
Figure 2008536183
これにより、ウェット及びドライ信号は正規化され、2つの間の長期間エネルギー比率はほぼ維持される。
前段で詳述した本発明の各例は、時間領域で無相関信号の時間包絡線整形を行っているが、無相関器信号に最終アップミックス・ステージを適用する前に、無相関器ユニットのQMFサブバンド信号出力に対して作動するよう時間整形モジュールを製作することもできることは、前記のウェット及びドライ信号の導出から明らかである。
このことは図7aに描かれている。この図では、入来したモノ信号400はQMFフィルタバンク402に入力され、モノラル信号400のサブバンド表現が導き出される。次いで、信号処理ブロック404において、各サブバンドに対し個別にアップミックスが実施される。その後、QMF合成ブロック408により最終的に復元された左信号406を得ることができ、QMF合成ブロック412により最終的に復元された右チャンネル410を得ることができる。
信号処理ブロック404の例が図7bに示されている。信号処理ブロック404は、無相関器413、無相関信号を処理するための本発明の装置414、及びアップミキサ415を備えている。
単一のサブバンド・サンプル416が信号処理ブロック404に入力される。無相関器413は、サブバンド・サンプル416から無相関サンプルを導き出し、それが無相関信号414を処理するための装置414(整形器)に入力される。整形器414は、第2入力としてサブバンド・サンプル416のコピーを受信する。本発明の整形器414は、本発明による時間包絡線整形を実施し、整形された無相関信号をアップミキサ415の第1入力端に供給し、該ミキサは、これに加えて第2入力端にサブバンド・サンプル416を受信する。アップミキサ415は、サブバンド・サンプル416及び整形された無相関サンプルの両方から左サブバンド・サンプル417と右サブバンド・サンプル418とを導き出す。
異なるサブバンド・サンプルに対する複数の信号処理ブロック404を結合して、フィルタバンク領域の各サブバンドに対し、左と右とのサブバンド・サンプルを計算することができる。
マルチチャンネルの実装では、信号処理は通常QMF領域で行われる。これを前提にすれば、無相関信号と信号の直接バージョンとの最終加算を、実際の復元出力信号を形成する直前の最終ステージでも実施できることは明らかである。従って、整形モジュールが、ICC及びILDパラメータにより定められた無相関信号のエネルギーを変化させることなく、直接信号に密接に合致する時間包絡線を無相関信号に付与し短期間エネルギーを修正するだけであれば、2つの信号成分の加算の直前に整形を実施するよう整形モジュールを移動することも可能である。
アップミックス及び合成に先立ってQMFサブバンド領域において本発明を作動すること、又は、アップミックス及び合成の後に時間領域において本発明を作動することのいずれにも明確な利点と不利点がある。前者は、最も簡単で最小の計算量しか必要としないが、それが作動するフィルタバンクの時間分解能の制限を受ける。後者は、さらなる合成フィルタバンク、従ってさらなる計算複雑性が必要となるが、時間分解能の選択については完全な自由度を有する。
既に述べたように、マルチチャンネル・デコーダは、図8に示すように、通常、サブバンド領域で信号処理を行う。図において、元の5.1チャンネル音声信号をダウンミックスしたモノラル・ダウンミックス信号420は、QMFフィルタバンク421に入力され、該フィルタバンクはモノラル信号420のサブバンド表現を導き出す。次いで、サブバンド領域において、信号処理ブロック422によって実際のアップミックスと信号復元が行われる。最後のステップとして、左前面チャンネル424a、右前面チャンネル424b、左サラウンド・チャンネル424c、右サラウンド・チャンネル424d、中央チャンネル424e、及び低域増強チャンネル424fがQMF合成によって導き出される。
図9は本発明のさらなる実施形態を示しており、同図では、信号整形は、サブバンド領域でのステレオ信号の処理及びアップミキシングを行った後の、時間領域に移されている。
モノラル入力信号430は、フィルタバンク432に入力され、モノラル信号430の複数のサブバンド表現が導き出される。信号処理ブロック434によって、モノラル信号の処理及び4つの信号へのアップミックスが行われ、左ドライ信号436a、左ウェット信号436b、右ドライ信号438a、及び右ウェット信号438bのサブバンド表現が導き出される。QMF合成440の後、時間領域で作動する、無相関信号を処理するための本発明の装置200を使って、左ドライ信号436aと左ウェット信号436bとから最終的な左信号442を導き出すことができる。同様な方法で、右ドライ信号438aと右ウェット信号438bとから最終的な右信号444を導き出すことができる。
前述したように、本発明は時間領域信号での作動に限定されない。本発明の特徴である、短期間のエネルギー見積り及び調整と長期間のスペクトル平滑化との組み合わせは、サブバンド・フィルタバンクでも実施することができる。前記で示した例では、QMFフィルタバンクが使われているが、本発明は、この特定のフィルタバンク表現に決して限定されないことを理解すべきである。本発明の時間領域実装によれば、低周波範囲におけるQMFサブバンドを0にセットすることによるQMFフィルタバンク表現の場合は、時間包絡線の見積りに使われる信号、すなわち処理ユニットに入力されるドライ信号及び無相関信号はハイパスフィルタリングされる。以下の段で、QMFサブバンド領域における本発明コンセプトの使用を例示するが、この中のmは、サブバンド、すなわち元の信号のある周波数範囲を表し、Nは、該サブバンド表現の中のサンプル数を表しており、長期間スペクトル平滑化に使われる信号サブバンドはN個のサンプルを含む。
次式を仮定する。
Figure 2008536183
Figure 2008536183
上式のQdry(m,n)及びQwet(m,n)は、ドライ及びウェット信号を保持するQMFサブバンド・マトリックスであり、Edry(m,n)及びEwet(m,n)は、サブバンドのすべてに対する対応エネルギーである。ここでmは、mstartから始まる、約2kHzに合致するように選択されたサブバンドを表し、nは、0からNまで続くサブバンド・サンプル指標で、Nはフレーム内のサブバンド・サンプルの数で、一つの好適な実施形態では32であり、約20msに相当する。
上記両方のエネルギー・マトリックスに対し、フレーム内の全サブバンド・サンプルを通した平均として、スペクトル・包絡線が計算される。これは長期的なスペクトル包絡線に相当する。
Figure 2008536183
Figure 2008536183
さらに、次式により、フレームを通した合計エネルギーの平均が計算される。
Figure 2008536183
Figure 2008536183
前式に基づき、2つのマトリックスに対する平滑化ゲイン・カーブを計算することができる。
Figure 2008536183
Figure 2008536183
前式により計算されたゲイン・カーブを、ウェット及びドライ信号に対するマトリックスに適用して、次式により、長期間のスペクトル的に平滑なエネルギー・マトリックスが得られる。
Figure 2008536183
Figure 2008536183
前式のエネルギー・マトリックスを用い、QMF領域において利用可能な最高度の時間分解能を使って、ウェット信号の時間包絡線を計算し適用する。
Figure 2008536183
サブバンド領域における本発明の実施に関する前記説明から、短期間の時間包絡線見積り又は短時間エネルギー見積り/調整と組み合わされた長期間のスペクトル白色化を実施する本発明のステップが、時間領域におけるLPCの使用に限定されないことは明らかである。
本発明のさらなる実施形態において、時間包絡線整形をウェット信号に適用する前に、サブバンド領域において時間包絡線整形が周波数方向に用いられ、本発明のスペクトル平滑化が実施される。
従来技術から、低い時間分解能で周波数領域に表現された信号は、該信号の周波数表現の周波数方向にフィルタリングすることによって時間包絡線整形ができることが知られている。これは、長い変換で表現された信号に持ち込まれる量子化ノイズを整形するために、知覚的音声コーデックにおいて使われている[J.Herre(ヘレ)及びJ.D.Johnston(ジョンソン)、「Enhancing the performance of perceptual audio coding by using temporal noise shaping(時間領域ノイズ整形(TNS)を使った知覚的音声符号化のパフォーマンス向上)」、第101回AES大会、ロサンゼルス、1996年11月]。
64チャンネルを持つQMFフィルタバンク及び640サンプルのプロトタイプ・フィルタを想定した場合、QMFサブバンド表現の時間分解能は、ms範囲内の窓を使った時間領域で行う時間整形ほどには高くない。QMFで元来利用可能なよりも高い時間分解能を使って、QMF領域で信号を整形する一つのやり方は、周波数方向に線形予測を行うことである。前記のQMF領域において、ある特定のQMFスロット、すなわちサブバンド・サンプルnに対するドライ信号を見ると、
dry(m,n), mstart≦m<M,0≦n<N
となり、線形予測子を、次式で見積もることができる。
Figure 2008536183
Figure 2008536183
数29に示す式は、自己相関法又は共分散法を使って得られた多項式である。前に述べたように、時間領域におけるLPCと違って、ここで見積られた線形予測子は、周波数方向に複合QMFサブバンド・サンプルを予測するよう設定されていることを留意しておくのが重ねて重要である。
図10には、QMFの時間/周波数マトリックスが示されている。各々の列が、QMF時間スロットすなわちサブバンド・サンプルに対応している。行はサブバンドに対応している。図に示されているように、線形予測子の見積り及び適用は各々の列内で独立して行われる。さらに、図10中に示された1つの列が処理される1つのフレームに対応する。白色化ゲイン・カーブgwet(m)とgdry(m)とが見積もられるフレーム・サイズも図の中に示されている。例えば、12のフレーム・サイズであれば、12の列を同時に処理することになる。
上記の本発明の実施形態において、周波数方向の線形予測は、信号の複合QMF表現で行われる。前と同様に、64チャンネルを持つQMFフィルタバンク及び640サンプルのプロトタイプ・フィルタを想定し、予測子が複合信号に作用することに留意すれば、予測子が適用されるQMFスロット内の信号の時間包絡線を追跡するのに、非常に低い次数の複合予測子で十分である。望ましい選択は次元1の予測子である。
見積られたフィルタHnは、特定のサブバンド・サンプルに対するQMF信号の時間包絡線、すなわち当該サブバンド・サンプルを観測するだけでは(一つのサンプルが利用できるだけなので)得られない時間包絡線に対応する。このサブサンプルの時間包絡線を、次式により、見積られたフィルタを通し信号を周波数方向にフィルタリングすることによってQwet信号に適用することができる。
Figure 2008536183
上式のmは、予測子の見積りに使われ、時間整形を受けるQMFスロット又はサブバンド・サンプルである。
無相関器により生成されたウェット信号は非常に平滑な時間包絡線を有するが、ドライ信号の時間包絡線を適用する前に、まずウェット信号上の一切の時間包絡線を除去するのが望ましい。これについては、対象はウェット信号であるが、前述の周波数方向の線形予測を使い同じ時間包絡線見積りを行い、得られたフィルタを使いウェット信号を逆フィルタリングして、これによりドライ信号の時間包絡線を適用する前に一切の時間包絡線を除去することによって達成することができる。
できるだけ密接に合致するウェット信号の時間包絡線を得るために、ドライ信号の周波数方向線形予測を使って導き出される時間包絡線の見積りをできるだけ適正にすることが重要である。本発明は、線形予測を使った時間包絡線の見積りに先立って、ドライ信号に長期的スペクトル平滑化を施すべきだと教示する。従って、前に計算されたゲイン・カーブ
dry(m), mstart≦m<M
は、次式に従って時間包絡線見積りに使われるドライ信号に適用されるべきである。
Figure 2008536183
Figure 2008536183
LPCフィルタリングによって提供される追加的時間分解能は、過渡ドライ信号に対しウェット信号を整形することを狙いとしている。しかしながら、LPC見積りに対する一つのQMFスロットの限られたデータセットを使っているために、まだ、細かな時間整形が無秩序なやり方で適用されるリスクがある。過渡ドライ信号に対するパフォーマンスを維持しつつ、このリスクを低減するため、いくつかの時間スロットに亘ってLPC見積りを均すことができる。この均しには、孤立した一時的事象に対し適用されたフィルタバンクの解析の周波数方向共分散構造の時間的展開を考慮に入れなければならない。具体的には、一次項予測で、奇数にスタックされた、全オーバーサンプリング係数2を持つ複合変調フィルタバンクの場合、本発明が教示する均し操作は、時間スロットnに用いられる予測係数anに対する次式の修正から成る。
Figure 2008536183
上式のd(≧1)は時間方向の予測ブロックのサイズを定義する。
図11は、5.1チャンネルのエンコーダ600を備える5.1入力チャンネル構成のための送信システムを示しており、該エンコーダは、6つの元チャンネルを、モノラル又はいくつか別々のチャンネルにもできるダウンミックス602と、追加空間パラメータ604とにダウンミックスする。ダウンミックス602は、空間パラメータ604と共に音声デコーダ610に送信される。
デコーダ610は、1つ以上の、無相関信号を処理するための本発明の装置を備え、無相関信号の本発明による整形を含めてダウンミックス信号602のアップミックスを行う。従って、このような送信システムにおいて、デコーダ側に本発明のコンセプトを適用することによって、復元された5.1チャンネル信号の向上された知覚品質がもたらされる。
前述の本発明の実施形態は、本発明の原理及び無相関信号の改善された時間整形を説明するためだけのものである。当業者には、本明細書に記載された配置及び細部の変更及びアレンジは自明のことであろうと理解される。従って、本発明は添付の特許請求の範囲によってだけ限定され、本明細書中の実施形態の記述及び説明を通して提示された特定の詳細内容に限定されないと意図されている。また、2チャンネル及び5.1チャンネルの例を使って本発明の説明を行ったが、同じ原理は任意のチャンネル構成に適用でき、従って、本発明が特定のチャンネル構成又は特定の数の入/出力チャンネルに限定されないことは、当業者にとって自明であると理解される。本発明は、信号の無相関バージョンを用いる任意のマルチチャンネル復元に適用可能であり、従って、本発明が、前記の例示のため用いたマルチチャンネル復元を行う特定の方法に限定されないのは、当業者にとってさらに自明であろう。
簡潔に言えば、本発明は、主として、利用可能なダウンミックス信号と追加の制御データに基づくマルチチャンネル音声信号の復元に関する。元のチャンネルのダウンミックスに関し、マルチチャンネル特性を表す空間パラメータがエンコーダ側で抽出される。デコーダにおいて、ダウンミックス信号と空間表現とを使い、ダウンミックス信号と同信号の無相関バージョンとの組み合わせを復元されるチャンネルに配信することによって、元のマルチチャンネル信号とそっくりの表現を再生する。本発明は、ステレオ・デジタル無線送信(DAB、XM衛星無線など)のような下位互換性ダウンミックス信号が望まれるシステムのみならず、マルチチャンネル信号の非常にコンパクトな表現が必要なシステムにも適用可能である。
スペクトルの平滑化は、前述の例の中のLPC解析により導き出されたフィルタ係数に基づき逆フィルタリングすることによって行われる。平滑化されたスペクトルを持つ信号を生成する任意の追加操作を適切に実施することによって本発明のさらなる実施形態が構築されることが理解されよう。このようなアプリケーションは、同じ有益な特性を有する復元された信号をもたらすことになろう。
マルチチャンネル音声デコーダ内の信号経路中で本発明を適用する場所は、無相関信号を処理するための本発明の装置を使って、復元された音声信号の知覚品質を向上するという本発明のコンセプトには関係がない。
本発明による好適な実施形態では、ウェット信号のハイパスフィルタリングされた部分だけが包絡線整形されたが、本発明を、全スペクトルを有するウェット信号に適用することもできる。
長期間のスペクトル的に平滑化された信号及び短期間包絡線整形ゲイン・ファクタにゲイン補正を適用する際に使った窓関数は、単なる例として理解される。処理対象の隣り合う信号区分の間でゲイン関数の円滑な移行を可能にする他の窓関数を使うことができるのは明らかである。
本発明の方法の特定の実施の必要性に応じて、本発明の方法をハードウエア又はソフトウエアに実装することができる。該実装を、デジタル記憶媒体、具体的には、電子的に可読の制御信号を備えたディスク、DVD又はCDを使って行い、これらを、プログラム可能なコンピュータシステムと協働させ本発明の方法を実行させることができる。従って、一般に、本発明はマシン可読の媒体に格納されたプログラム・コードを備え、コンピュータ・プログラム製品をコンピュータで実行するとプログラム・コードが本発明の方法を実施するよう作動するコンピュータ・プログラム製品である。従って、言い換えれば、本発明の方法は、コンピュータ・プログラムをコンピュータで実行すると、本発明の方法の少なくとも一つを実施するプログラム・コードを備えたコンピュータ・プログラムである。
以上の記述は、特定の実施形態を参照して具体的に示され記載されているが、当業者は、本発明の精神及び範囲から逸脱することなく、さまざまなな他の形態及び細部の変更が可能なことを理解しているであろう。本明細書で開示され、添付の請求範囲に包含される広範なコンセプトから逸脱することなく、異なった実施形態に適応させてさまざまな変更を加えられることが理解されよう。
図1aは、1対2アップミキサ・ステージにおける本発明の装置のアプリケーションを示す。 図1bは、本発明の装置のアプリケーションのさらなる例を示す。 図2aは、本発明装置の別の配置の可能性を示す。 図2bは、本発明装置の配置のさらなる例を示す。 図3aは、マルチチャンネル音声デコーダ中の本発明装置の使用を示す。 図3bは、さらなるマルチチャンネル音声デコーダ中の本発明装置を示す。 図4aは、本発明装置の好適な実施形態を示す。 図4bは、図4aの本発明装置の変形を示す。 図4cは、線形予測符号化の例を示す。 図4dは、線形予測符号化における帯域幅拡大ファクタの適用を示す。 図5aは、本発明のスペクトル平滑器を示す。 図5bは、長期間エネルギー補正の適用スキームを示す。 図6は、短期間エネルギー補正の適用スキームを示す。 図7aは、QMFフィルタバンク設計の中の本発明の装置を示す。 図7bは、図7aの本発明装置の詳細を示す。 図8は、マルチチャンネル音声デコーダ中の本発明装置の使用を示す。 図9は、QMFベースの設計における、逆フィルタ後の本発明装置の使用を示す。 図10は、フィルタバンク表現による信号の時間対周波数表現を示す。 図11は、本発明のデコーダを備えた通信システムを示す。

Claims (18)

  1. 元の信号から導き出される無相関信号、又は前記元の信号と前記無相関信号とを組み合わせて得られる合成信号を処理するための装置であって、
    前記無相関信号、前記無相関信号から導き出される信号、前記元の信号、前記元の信号から導き出される信号、又は前記合成信号をスペクトル平滑化し、平滑化された信号を得るためのスペクトル平滑化器であって、平滑化された信号が平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動するスペクトル平滑化器と、
    前記平滑化された信号に関する情報を用いて、前記無相関信号又は前記合成信号を時間包絡線整形するための時間包絡線整形器とを含む、装置。
  2. 前記時間包絡線整形器は、ゲイン・ファクタを使って、前記無相関信号又は前記合成信号の前記時間包絡線を整形するよう作動する、請求項1に記載の装置。
  3. 前記スペクトル平滑化器は、前記無相関信号、前記無相関信号から導き出される信号、又は前記合成信号を平滑化して、平滑化された信号を取得し、さらに前記元の信号、又は前記元の信号から導き出される信号を平滑化して平滑化されたマスタ信号を得るよう作動する、請求項1に記載の装置。
  4. 前記時間包絡線整形器は、前記平滑化された信号と前記平滑化されたマスタ信号との対応部分内に含まれるエネルギーを比較することにより導き出されるゲイン・ファクタを使って、前記無相関信号又は前記合成信号の前記時間包絡線を整形するよう作動する、請求項3に記載の装置。
  5. 前記スペクトル平滑化器は、前記元の信号から前記平滑化されたマスタ信号を導き出すよう作動する、請求項4に記載の装置。
  6. 前記スペクトル平滑化器は、前記元の信号から導き出される信号から前記平滑化されたマスタ信号を導き出すよう作動する、請求項4に記載の装置。
  7. 前記スペクトル平滑化器が、前記無相関信号又は前記合成信号の第1部分を平滑化するよう動作し、
    前記時間包絡線整形器は、前記無相関信号又は前記合成信号の第2部分を整形するよう動作し、前記第2部分は前記第1部分に含まれる、請求項1に記載の装置。
  8. 前記第1部分のサイズは、前記第2部分のサイズの10倍より大きい、請求項7に記載の装置。
  9. 前記スペクトル平滑化器は、線形予測符号化により導き出されるフィルタ係数を用いたフィルタリングによってスペクトルを平滑化するよう作動する、請求項1に記載の装置。
  10. 前記スペクトル平滑化器は、時間方向の線形予測を使って導き出されるフィルタ係数を用いたフィルタリングによって、前記スペクトルを平滑化するよう作動する、請求項9に記載の装置。
  11. 前記スペクトル平滑化器は、時間領域において、信号のスペクトル的に平滑化された表示を得るよう作動する、請求項1に記載の装置。
  12. 前記スペクトル平滑化器は、サブバンド領域において、信号のスペクトル的に平滑化された表示を得るよう作動する、請求項1に記載の装置。
  13. 前記スペクトル平滑化器及び前記時間包絡線整形器が、全スペクトル無相関信号の、一定の周波数閾値を上回る周波数すべてを処理するよう作動する、請求項1に記載の装置。
  14. 元の信号から導き出される無相関信号、又は前記元の信号と前記無相関信号とを組み合わせて得られた合成信号を処理する方法であって、
    前記無相関信号、前記無相関信号から導き出される信号、前記元の信号、前記元の信号から導き出される信号、又は前記合成信号をスペクトル的に平滑化し、平滑化された信号を得る工程であって、前記平滑化された信号は平滑化前の対応する信号よりも平滑なスペクトルを有する工程と、
    前記平滑化された信号に関する情報を用いて、前記無相関信号又は前記合成信号を時間包絡線整形する工程とを含む、方法。
  15. 空間音声デコーダであって、
    少なくとも2つのチャンネルを有するマルチチャンネル信号から導き出された元の信号を受信し、前記マルチチャンネル信号の第1チャンネルと第2チャンネルとの間の相互関係を表現する空間パラメータを受信するための入力インタフェースと、
    前記空間パラメータを使って前記元の信号から無相関信号を導き出すための無相関器と、
    前記無相関信号、前記無相関信号から導き出される信号、前記元の信号、前記元の信号から導き出される信号、又は前記元の信号と前記無相関信号とを組み合わせて得られた合成信号をスペクトル平滑化し、平滑化された信号を得るためのスペクトル平滑化器であって、前記平滑化された信号が平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動するスペクトル平滑化器と、
    前記平滑化された信号に関する情報を用いて、前記無相関信号又は前記合成信号を時間包絡線整形するための時間包絡線整形器とを含む、空間音声デコーダ。
  16. 元の信号から導き出された無相関信号、又は前記元の信号と前記無相関信号とを組み合わせて得られる合成信号を処理するための装置を備えた受信機又はオーディオプレーヤであって、
    前記無相関信号、前記無相関信号から導き出される信号、前記元の信号、前記元の信号から導き出される信号、又は前記合成信号をスペクトル平滑化し、平滑化された信号を得るためのスペクトル平滑化器であって、前記平滑化された信号が平滑化前の対応する信号よりも平滑なスペクトルを有するよう作動する平滑化器と、
    前記平滑化された信号に関する情報を用いて、前記無相関信号又は前記合成信号を時間包絡線整形するための時間包絡線整形器とを含む、受信機又はオーディオプレーヤ。
  17. 受信又は音声再生の方法であって、元の信号から導き出される無相関信号、又は前記元の信号と前記無相関信号とを組み合わせて得られる合成信号を処理する方法を含み、該処理方法は、
    前記無相関信号、前記無相関信号から導き出される信号、前記元の信号、前記元の信号から導き出される信号、又は前記合成信号をスペクトル的に平滑化し、平滑化された信号を得る工程であって、前記平滑化された信号が平滑化前の対応する信号よりも平滑なスペクトルを有する工程と、
    前記平滑化された信号に関する情報を用いて、前記無相関信号又は前記合成信号を時間包絡線整形する工程とを含む、方法。
  18. コンピュータで実行されると、請求項14又は17に記載の方法を実施する、コンピュータ・プログラム。
JP2008505776A 2005-04-15 2006-04-05 無相関信号の包絡線整形 Active JP4804532B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67158305P 2005-04-15 2005-04-15
US60/671,583 2005-04-15
PCT/EP2006/003097 WO2006108543A1 (en) 2005-04-15 2006-04-05 Temporal envelope shaping of decorrelated signal

Publications (2)

Publication Number Publication Date
JP2008536183A true JP2008536183A (ja) 2008-09-04
JP4804532B2 JP4804532B2 (ja) 2011-11-02

Family

ID=36636920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008505776A Active JP4804532B2 (ja) 2005-04-15 2006-04-05 無相関信号の包絡線整形

Country Status (11)

Country Link
US (1) US7983424B2 (ja)
EP (1) EP1829424B1 (ja)
JP (1) JP4804532B2 (ja)
KR (1) KR100933548B1 (ja)
CN (2) CN102163429B (ja)
AT (1) ATE421845T1 (ja)
DE (1) DE602006004959D1 (ja)
HK (2) HK1118168A1 (ja)
MY (1) MY144377A (ja)
TW (1) TWI338446B (ja)
WO (1) WO2006108543A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010114123A1 (ja) * 2009-04-03 2010-10-07 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
JP2011509591A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509589A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2012053493A (ja) * 2009-04-03 2012-03-15 Ntt Docomo Inc 音声復号装置、音声復号方法、及び音声復号プログラム
JP2013511053A (ja) * 2009-10-20 2013-03-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミックス信号表現に基づいてアップミックス信号表現を生成するための装置、マルチチャネルオーディオ信号を表現するビットストリームを生成するための装置、歪制御信号化を用いる方法、コンピュータプログラム及びビットストリーム
JP2013536461A (ja) * 2010-07-20 2013-09-19 ファーウェイ テクノロジーズ カンパニー リミテッド オーディオ信号合成器
JP2013541275A (ja) * 2010-09-08 2013-11-07 ディーティーエス・インコーポレイテッド 拡散音の空間的オーディオの符号化及び再生
JP5372142B2 (ja) * 2009-04-17 2013-12-18 パイオニア株式会社 サラウンド信号生成装置、サラウンド信号生成方法、及びサラウンド信号生成プログラム
WO2017188141A1 (ja) * 2016-04-27 2017-11-02 国立大学法人富山大学 オーディオ信号処理装置、オーディオ信号処理方法、およびオーディオ信号処理プログラム

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1794744A1 (en) * 2004-09-23 2007-06-13 Koninklijke Philips Electronics N.V. A system and a method of processing audio data, a program element and a computer-readable medium
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8073702B2 (en) * 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US8160888B2 (en) * 2005-07-19 2012-04-17 Koninklijke Philips Electronics N.V Generation of multi-channel audio signals
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR100880643B1 (ko) * 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
CN101273404B (zh) * 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
JP4801174B2 (ja) * 2006-01-19 2011-10-26 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
EP1982326A4 (en) * 2006-02-07 2010-05-19 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US8116459B2 (en) * 2006-03-28 2012-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
DE102007018032B4 (de) 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP5133401B2 (ja) 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
US8180062B2 (en) 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011061174A1 (en) 2009-11-20 2011-05-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
PL2545553T3 (pl) 2010-03-09 2015-01-30 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio z użyciem zrównania granicy obszaru
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
JP5649084B2 (ja) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
CA3076786C (en) * 2010-04-09 2021-04-13 Dolby International Ab Mdct-based complex prediction stereo coding
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2011127832A1 (en) 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CA3147525A1 (en) * 2011-02-18 2012-08-23 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
WO2012152764A1 (en) * 2011-05-09 2012-11-15 Dolby International Ab Method and encoder for processing a digital stereo audio signal
CN104160442B (zh) * 2012-02-24 2016-10-12 杜比国际公司 音频处理
US20130282372A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9294855B2 (en) * 2013-01-02 2016-03-22 Samsung Electronics Co., Ltd. Apparatus and method for processing audio signal
WO2014168777A1 (en) * 2013-04-10 2014-10-16 Dolby Laboratories Licensing Corporation Speech dereverberation methods, devices and systems
AU2014280256B2 (en) 2013-06-10 2016-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
RU2662921C2 (ru) 2013-06-10 2018-07-31 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
EP2830059A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
WO2015017223A1 (en) 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
ES2660778T3 (es) * 2013-10-21 2018-03-26 Dolby International Ab Reconstrucción paramétrica de señales de audio
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
CN105706166B (zh) * 2013-10-31 2020-07-14 弗劳恩霍夫应用研究促进协会 对比特流进行解码的音频解码器设备和方法
JP6319753B2 (ja) 2013-12-02 2018-05-09 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法および装置
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
CN110491401B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
WO2015173423A1 (en) * 2014-05-16 2015-11-19 Stormingswiss Sàrl Upmixing of audio signals with exact time delays
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
KR102486338B1 (ko) * 2014-10-31 2023-01-10 돌비 인터네셔널 에이비 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
MX371223B (es) 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN109841223B (zh) * 2019-03-06 2020-11-24 深圳大学 一种音频信号处理方法、智能终端及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
JP2001510953A (ja) * 1997-07-16 2001-08-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置
JP2002032100A (ja) * 2000-05-26 2002-01-31 Lucent Technol Inc オーディオ信号を符号化する方法
JP2002536679A (ja) * 1999-01-27 2002-10-29 コーディング テクノロジーズ スウェーデン アクチボラゲット 情報源符号化システムの性能向上方法と装置
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US8782254B2 (en) 2001-06-28 2014-07-15 Oracle America, Inc. Differentiated quality of service context assignment and propagation
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP2004072507A (ja) * 2002-08-07 2004-03-04 Rohm Co Ltd ステレオ信号処理用ノイズシェーパ
JP2006521577A (ja) 2003-03-24 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャネル信号を表す主信号と副信号の符号化
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510953A (ja) * 1997-07-16 2001-08-07 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置
JP2002536679A (ja) * 1999-01-27 2002-10-29 コーディング テクノロジーズ スウェーデン アクチボラゲット 情報源符号化システムの性能向上方法と装置
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
JP2002032100A (ja) * 2000-05-26 2002-01-31 Lucent Technol Inc オーディオ信号を符号化する方法
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509589A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509590A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509591A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US10366696B2 (en) 2009-04-03 2019-07-30 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping
JP2011034046A (ja) * 2009-04-03 2011-02-17 Ntt Docomo Inc 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
JP2012053493A (ja) * 2009-04-03 2012-03-15 Ntt Docomo Inc 音声復号装置、音声復号方法、及び音声復号プログラム
JP2012093794A (ja) * 2009-04-03 2012-05-17 Ntt Docomo Inc 音声復号装置、音声復号方法、及び音声復号プログラム
US9460734B2 (en) 2009-04-03 2016-10-04 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping
JP2013225152A (ja) * 2009-04-03 2013-10-31 Ntt Docomo Inc 音声復号装置、音声復号方法、及び音声復号プログラム
US9779744B2 (en) 2009-04-03 2017-10-03 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping
US8655649B2 (en) 2009-04-03 2014-02-18 Ntt Docomo, Inc. Speech encoding/decoding device
US9064500B2 (en) 2009-04-03 2015-06-23 Ntt Docomo, Inc. Speech decoding system with temporal envelop shaping and high-band generation
WO2010114123A1 (ja) * 2009-04-03 2010-10-07 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
JP5372142B2 (ja) * 2009-04-17 2013-12-18 パイオニア株式会社 サラウンド信号生成装置、サラウンド信号生成方法、及びサラウンド信号生成プログラム
JP2013511053A (ja) * 2009-10-20 2013-03-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミックス信号表現に基づいてアップミックス信号表現を生成するための装置、マルチチャネルオーディオ信号を表現するビットストリームを生成するための装置、歪制御信号化を用いる方法、コンピュータプログラム及びビットストリーム
US9060236B2 (en) 2009-10-20 2015-06-16 Dolby International Ab Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer program and bitstream using a distortion control signaling
US9082396B2 (en) 2010-07-20 2015-07-14 Huawei Technologies Co., Ltd. Audio signal synthesizer
JP2013536461A (ja) * 2010-07-20 2013-09-19 ファーウェイ テクノロジーズ カンパニー リミテッド オーディオ信号合成器
JP2013541275A (ja) * 2010-09-08 2013-11-07 ディーティーエス・インコーポレイテッド 拡散音の空間的オーディオの符号化及び再生
WO2017188141A1 (ja) * 2016-04-27 2017-11-02 国立大学法人富山大学 オーディオ信号処理装置、オーディオ信号処理方法、およびオーディオ信号処理プログラム

Also Published As

Publication number Publication date
WO2006108543A9 (en) 2007-09-13
KR20070102738A (ko) 2007-10-19
HK1160980A1 (en) 2012-08-17
CN101138274B (zh) 2011-07-06
DE602006004959D1 (de) 2009-03-12
CN102163429B (zh) 2013-04-10
TW200705804A (en) 2007-02-01
MY144377A (en) 2011-09-15
EP1829424B1 (en) 2009-01-21
US7983424B2 (en) 2011-07-19
HK1118168A1 (en) 2009-01-30
KR100933548B1 (ko) 2009-12-23
CN101138274A (zh) 2008-03-05
CN102163429A (zh) 2011-08-24
EP1829424A1 (en) 2007-09-05
JP4804532B2 (ja) 2011-11-02
WO2006108543A1 (en) 2006-10-19
TWI338446B (en) 2011-03-01
ATE421845T1 (de) 2009-02-15
US20060239473A1 (en) 2006-10-26

Similar Documents

Publication Publication Date Title
JP4804532B2 (ja) 無相関信号の包絡線整形
US8116459B2 (en) Enhanced method for signal shaping in multi-channel audio reconstruction
JP4809370B2 (ja) マルチチャネル音声符号化における適応ビット割り当て
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
RU2329548C2 (ru) Устройство и способ создания многоканального выходного сигнала или формирования низведенного сигнала
CA2582485C (en) Individual channel shaping for bcc schemes and the like
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
KR100947013B1 (ko) 멀티채널 오디오 신호의 시간적 및 공간적 정형
US8081764B2 (en) Audio decoder
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
US20090222272A1 (en) Controlling Spatial Audio Coding Parameters as a Function of Auditory Events
KR20140042928A (ko) Mdct-기반의 복소수 예측 스테레오 코딩
JP2011522472A (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
US11942098B2 (en) Method and apparatus for adaptive control of decorrelation filters
CN108369810B (zh) 用于对多声道音频信号进行编码的自适应声道缩减处理
JP2009533910A (ja) アンビエンス信号を生成するための装置および方法
TW202004735A (zh) 用以解碼經編碼多聲道信號之裝置、方法及電腦程式(二)
RU2799737C2 (ru) Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110809

R150 Certificate of patent or registration of utility model

Ref document number: 4804532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250