JP2008517333A - バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 - Google Patents
バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 Download PDFInfo
- Publication number
- JP2008517333A JP2008517333A JP2007537133A JP2007537133A JP2008517333A JP 2008517333 A JP2008517333 A JP 2008517333A JP 2007537133 A JP2007537133 A JP 2007537133A JP 2007537133 A JP2007537133 A JP 2007537133A JP 2008517333 A JP2008517333 A JP 2008517333A
- Authority
- JP
- Japan
- Prior art keywords
- channels
- envelope
- channel
- cue
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 43
- 238000007493 shaping process Methods 0.000 title claims description 29
- 230000002123 temporal effect Effects 0.000 claims abstract description 12
- 230000005540 biological transmission Effects 0.000 claims description 67
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 238000003786 synthesis reaction Methods 0.000 claims description 26
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims 1
- 238000012545 processing Methods 0.000 description 61
- 238000010586 diagram Methods 0.000 description 48
- 230000005236 sound signal Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 210000005069 ears Anatomy 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Abstract
【選択図】図1
Description
本出願は、2004年10月20日出願の米国特許仮出願第60/620,480号(代理人整理番号第Allamanche2−3−18−4)の優先権を主張するものである。この要旨は、ここに引例として組み込まれている。
・米国出願第09/848,877号2001年5月4日出願(代理人整理番号第Faller5)
・米国出願第10/045,458号2001年11月7日出願(代理人整理番号第Baumgarte1−6−8)。これは、2001年8月10日出願の米国仮出願第60/311,565号の優先権を主張するものである。
・米国出願第10/155,437号2002年5月24日出願(代理人整理番号第Baumgarte2−10)
・米国出願第10/246,570号2002年9月18日出願(代理人整理番号第Baumgarte3−11)
・米国出願第10/815,591号2004年4月1日出願(代理人整理番号第Baumgarte7−12)
・米国出願第10/936,464号2004年9月8日出願(代理人整理番号第Baumgarte8−7−15)
・米国出願第10/762,100号2004年1月20日出願(Faller13−1)
・米国出願第10/xxx,xxx号は、本出願(代理人整理番号第Allamanche1−2−17−3)と同日に出願したものである。
・C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)著、「バイノーラルキュー符号化パートI:心理音響学基礎および設計原理(Binaural Cue Coding − Part I: Psychoacoustic fundamentals and design principles)」(IEEE会報、スピーチおよび音声学会紀要第11巻第6号、2003年11月)
・C.フォーラおよびF.バウムガルテ著「バイノーラル用キュー符号化パートII:方法および応用例(Binaural Cue Coding − Part II: Schemes and applications)」(IEEE会報、オーディオおよびスピーチ学会紀要、11巻、第6号、2003年11月)
・C.フォーラ著、「異なる再生フォーマットと互換性のある空間音声符号化(Coding of spatial audio compatible with different playback formats)」(音声工学学会第117回大会予稿、2004年10月))
図1は、従来のバイノーラル信号合成器の上位ブロック図を示す。
図2は、一般バイノーラルキュー符号化(BCC)音声処理システムを示すブロック図である。
図3は、図2のダウンミキサに用いることができるダウンミキサのブロック図を示す。
図4は、図2のデコーダに用いることができるBCC合成器のブロック図を示す。
図5は、本発明の一実施の形態による、図2のBCC推定器のブロック図を示す。
図6は、5チャネル音声用ICTDおよびICLDデータ生成を説明する図である。
図7Aは、5チャネル音声用ICCデータを説明する図である。
図7Bは、5チャネル音声用ICCデータを説明する図である。
図8は、BCCデコーダに用いることができ、1つの送信した和信号s(n)プラス空間キューが与えられたステレオ音声信号またはマルチチャネル音声信号を生成する、図4のBCC合成器の一実施例のブロック図を示す。
図9は、周波数関数として、サブバンド内でICTDおよびICLDがどのように変化するかを説明する図である。
図10Aは、本発明の一実施の形態による、図2のエンコーダ等の、BCCエンコーダに加えられる時間領域処理を示すブロック図である。
図10Bは、本発明の一実施の形態による、図2のエンコーダ等の、BCCエンコーダに加えられる時間領域処理を示すブロック図である。
図11Aは、図4のBCC合成器の条件でのTP処理の一例の時間領域適用例を説明する図である。
図11Bは、図4のBCC合成器の条件でのTP処理の一例の時間領域適用例を説明する図である。
図12Aは、カットオフ周波数fTPより高い周波数にだけをエンベロープ整形が行われる、図10のTPAおよび図11のTPそれぞれの、考えられる実施例を示す。
図12Bは、カットオフ周波数fTPより高い周波数にだけエンベロープ整形が行われる、図10のTPAおよび図11のTPそれぞれの、考えられる実施例を示す。
図13Aは、本発明の別の実施の形態による、図2のエンコーダ等の、BCCエンコーダに加えられる周波数領域処理のブロック図を示す。
図13Bは、本発明の別の実施の形態による、図2のエンコーダ等の、BCCエンコーダに加えられる周波数領域処理のブロック図を示す。
図14Aは、図4のBCC合成器の条件でのTP処理の一例の周波数領域適用例を説明する図である。
図14Bは、図4のBCC合成器の条件でのTP処理の一例の周波数領域適用例を説明する図である。
図15は、本発明のさらに別の実施の形態による、図2のエンコーダ等の、BCCエンコーダに加えられる周波数領域処理のブロック図を示す。
図16は、図4のBCC合成器の条件でのTP処理の別の一例の周波数領域適用例を説明する図である。
図17Aは、図15および図16のTPAと、図16のITPおよびTPとの考えられる実施例のブロック図を示す。
図17Bは、図15および図16のTPAと、図16のITPおよびTPとの考えられる実施例のブロック図を示す。
図17Cは、図15および図16のTPAと、図16のITPおよびTPとの考えられる実施例のブロック図を示す。
図18Aは、図16の制御ブロックを動作させる2つの一例のモードを説明する図である。
図18Bは、図16の制御ブロックを動作させる2つの一例のモードを説明する図である。
図2は、エンコーダ202とデコーダ204とを備える一般バイノーラルキュー符号化(BCC)音声処理システム200を示すブロック図である。エンコーダ202は、ダウンミキサ206とBCC推定器208とを含んでいる。
好適な実施例では、送信した和信号は、入力音声信号の全信号成分を含んでいる。目的は、各信号成分を完全に維持することである。音声入力チャネルを単純に加算することは、信号成分が増幅したり、減衰したりすることがよくある。言い換えれば、“単純に”加算した信号成分のパワーが、各チャネルの対応する信号成分のパワーの合計よりも大きかったり、小さかったりすることがよくある。和信号の信号成分のパワーが全入力チャネルの対応するパワーとほぼ同じになるように、和信号を等しくするダウンミキシング技術を用いることができる。
1つの和信号を仮定し、ICTD、ICLD、およびICCが元の音声信号の対応するキューを近似するように、BCCは、ステレオ音声信号またはマルチチャネル音声信号を合成する。以下では、聴覚空間イメージ属性に関連したICTD、ICLD、およびICCの役割が説明される。
以下では、ICTD、ICLD、およびICCをどのように推定するか、説明する。これらの(量子化および符号化)空間キューを伝送するビットレートは、わずか数キロビット/秒なので、BCCにより、1つの音声チャネルに必要なものに近いビットレートで、ステレオ音声信号およびマルチチャネル音声信号を送信することが可能である。
入力チャネルが3つ以上ある場合は、通常、基準チャネル(例えば、チャネルナンバー1)と他のチャネルとの間でICTDおよびICLDを定義することで十分である。図6には、C=5チャネルの場合を示している。τ1c(k)およびΔ12(k)はそれぞれ、基準チャネル1とチャネルcとの間のICTDおよびICLDを表す。
次の式(12)により、ICTDτ1c(k)から遅延dcを求める。遅延dcの最大大きさを最小にするように、基準チャネルd1の遅延が算出される。変更するサブバンド信号が少なくなるほど、アーティファクトが発生する危険性がより少なくなる。サブバンドのサンプリングレートが、ICTD合成に対する時間分解能が十分高くならない場合は、適したオールパスフィルタを用いることにより、より正確に遅延を行うようにする。
チャネルcおよび基準チャネル1の間で出力サブバンド信号が所望のICLDΔ12(k)を有するようにするために、利得係数acは、次の式(13)を満たす必要がある。
また、好ましくは、全出力チャネルのパワーの合計が、入力和信号のパワーと等しくなるように、出力サブバンドを正規化する。各サブバンドの元の信号パワーのすべてが和信号に保たれているので、この正規化は、各出力チャネルの絶対サブバンドパワーにおいて、元のエンコーダ入力音声信号の対応するパワーを近似することになる。これらの制約条件から、次の式(14)により、倍率acが得られる。
ある実施の形態では、ICC合成の目的は、ICTDおよびICLDに影響を与えることなく、遅延およびスケーリングを行った後で、サブバンド間の相関を低減することである。平均変動が各サブバンド(聴覚的に重要な帯域)でゼロになるように、周波数の関数としてICTDおよびICLDが効果的に変化するように、図8のフィルタhcを設計することにより、このことを行うことが可能である。
前述のように、2つ以上の伝送チャネルでBCCを行うことができる。BCCのバリエーションが、1つの(送信した)チャネルだけでなく、E個のチャネルとしてもC個の音声チャネルを表すことについて、説明してきたが、これを、CチャネルからEチャネルへのBCCと記載する。CチャネルからEチャネルへのBCCを行う、(少なくとも)2つの目的がある。
・1つの伝送チャネルで、BCCは、既存のモノラルシステムをグレードアップして、ステレオ音声再生またはマルチチャネル音声再生を行う後方互換性経路を提供する。グレードアップしたシステムは、既存のモノラルインフラを介してBCCダウンミキシング和信号を送信し、さらにBCCサイド情報を送信する。CチャネルからEチャネルへのBCCを、Cチャネル音声のEチャネル後方互換性符号化に適用することができる。
・CチャネルからEチャネルへのBCCは、送信チャネルの数を異なる度合いで低減するという意味で、拡張性を導入する。送信する音声チャネルの音声品質がさらに向上することが期待できる。
ICTD、ICLD、およびICCキューをどのように定義するかというような、CチャネルからEチャネルへのBCCの信号処理の詳細は、米国出願第10/762,100号01/20/042004年1月20日出願(Faller13−1)に記載されている。
ある実施の形態では、1つの伝送チャネルでのBCCと、CチャネルからEチャネルへのBCCとは両方とも、ICTD、ICLD、および/またはICC合成のアルゴリズムが必要である。通常、約4〜30ミリ秒毎にICTD、ICLD、および/またはICCキューの合成を行うことで十分である。しかしながら、先行音効果の知覚現象では、人間の聴覚システムが高い時間分解能(例えば、1〜10ミリ秒毎)でキューを評価する、特定の時刻があることを意味している。
・TP処理、例えば、時間可変振幅変更関数とともに、信号の時間領域サンプルを操作することによって、信号のエンベロープを操作することにより、このことを行うことができる。サブバンドの時間分解能が十分高い(粗い周波数分解能を犠牲にして)場合は、同様の処理をスペクトル/サブバンドサンプルに適用することができる。
・あるいは、低ビットレート音声コーダの量子化ノイズを整形するために、または、インテンシティステレオ符号化信号を向上させるために、従来技術で用いられるのと類似のやり方で、周波数に対する信号のスペクトル表現の畳み込み/フィルタを用いることができる。低い時間分解能ではなく、フィルタバンクが高い周波数分解能を有する場合は、このことは好適である。畳み込み/フィルタアプローチについては、
・エンベロープ整形方法は、インテンシティステレオから、C個からE個へのマルチチャネル符号化に拡張する。
・この技術は、エンコーダにより生成されたパラメトリック情報(例えば、バイナリフラグ)により、エンベロープ整形が制御されるセットアップを含んでいるが、実際には、デコーダから導出したフィルタ係数セットを用いて実行する。
・別のセットアップでは、例えば、知覚的に必要および/または利点がある場合に限って、フィルタ係数のセットがエンコーダから送信される。
・BCCエンコーダ入力信号または送信したBCC和信号の時間エンベロープを観察すること。パワーが急激に増加すると、次に、一時的現象が発生する。
・エンコーダまたはデコーダで推定したような線形予測符号化(LPC)利得を検証すること。LPC予測利得がある閾値を上回る場合、次に、信号が一時的現象であるか、または非常に変動していると仮定されることができる。LPC分析は、スペクトルの自己相関により算出する。
図10は、本発明の一実施の形態による、図2のエンコーダ202等のBCCエンコーダに加えられる時間領域処理を示すブロック図である。図10(a)に示すように、一般に、任意の1つ以上の入力チャネルを分析することができるが、各時間処理分析器(TPA)1002は、異なる元の入力チャネルxc(n)の時間エンベロープを推定する。
1つの和信号があるBCC符号化方法の条件で、本発明について説明してきたが、2つ以上の和信号があるBCC符号化方法の条件で、本発明を実施することもできる。この場合は、BCC合成を行う前に、各異なる“ベース”和信号の時間エンベロープを推定することができ、異なる出力チャネルの合成に用いた和信号により、異なる時間エンベロープに基づいて、異なるBCC出力チャネルを生成することもできる。(例えば、加重平均算出を介して)成分和チャネルの相対効果を考慮した、効果的な時間エンベロープに基づいて、2つ以上の異なる和チャネルから合成した出力チャネルを生成することもできる。
Claims (50)
- 音声チャネルを符号化する方法であって、
少なくとも1つのキューコードが、1つ以上の前記音声チャネルのうちの1つの時間エンベロープの特徴を調べることにより、生成したエンベロープキューコードである、1つ以上のキューコードを1つ以上の音声チャネルに対し生成するステップと、
1つ以上の前記キューコードを送信するステップとを含む方法。 - E・・1である、1つ以上の前記音声チャネルに対応するE個の送信音声チャネルをさらに含む、請求項1に記載の発明。
- 1つ以上の前記音声チャネルが、C>Eである、C個の入力音声チャネルを含み、
前記E個の送信チャネルを生成するために、前記C個の入力チャネルをダウンミキシングする、請求項2に記載の発明。 - 1つ以上の前記キューコードに基づいて、E個の送信チャネルの復号化を行う間に、エンベロープ整形を行うために、デコーダを有効にするように、1つ以上の前記キューコードは送信され、E・・1である、E個の送信チャネルは、1つ以上の音声チャネルに対応する、請求項1に記載の発明。
- 前記エンベロープ整形は、前記特徴を調べた時間エンベロープと基本的に整合させるために、前記デコーダが生成した合成した信号の時間エンベロープを調整する、請求項4に記載の発明。
- 1つ以上の前記キューコードがさらに、1つ以上のチャネル間相関(ICC)コード、チャネル間レベル差(ICLD)コード、およびチャネル間時間差(ICTD)コードを含む、請求項1に記載の発明。
- 前記エンベロープキューコードに対応付けられた第1の時間分解能が、前記他のキューコードに対応付けられた第2の時間分解能よりも細かい、請求項6に記載の発明。
- 前記対応する音声チャネルの指定の周波数に対してだけ、前記時間エンベロープの特徴を調べる、請求項1に記載の発明。
- 指定のカットオフ周波数を超える前記対応する音声チャネルの周波数に対してだけ、前記時間エンベロープの特徴を調べる、請求項8に記載の発明。
- 周波数領域における前記対応する音声チャネルに対して、前記時間エンベロープの特徴を調べる、請求項1に記載の発明。
- 前記対応する音声チャネルの異なる信号サブバンドに対して、個別に時間エンベロープの特徴を調べる、請求項10に記載の発明。
- 前記周波数領域が、高速フーリエ変換(FFT)に対応している、請求項10に記載の発明。
- 前記周波数領域が、直交ミラーフィルタ(QMF)に対応している、請求項10に記載の発明。
- 時間領域における前記対応する音声チャネルに対して、前記時間エンベロープの特徴を調べる、請求項1に記載の発明。
- 前記特徴を調べることが、有効なのか、無効なのか判定するステップをさらに含む、請求項1に記載の発明。
- E・・1である、1つ以上の前記音声チャネルに対応するE個の送信チャネルを復号化する間に、エンベロープ整形を行うか否か、デコーダに指示することを判定する前記ステップに基づいて、有効/無効のフラグを生成して、送信するステップをさらに含む、請求項15に記載の発明。
- 前記判定ステップが、一時的現象の発生を検出した場合は、特徴を調べる前記ステップを有効にするように、音声チャネルにおける一時的現象を検出するための前記音声チャネルの分析に基づいている、請求項15に記載の発明。
- 音声チャネルを符号化する装置であって、
少なくとも1つのキューコードが、1つ以上の前記音声チャネルのうちの1つの時間エンベロープの特徴を調べることにより、生成したエンベロープキューコードである、1つ以上のキューコードを1つ以上の音声チャネルに対し生成する手段と、
1つ以上の前記キューコードを送信する手段とを備える装置。 - E個の送信音声チャネルを生成するために、C個の入力音声チャネルを符号化する装置であって、
少なくとも1つの前記C個の入力チャネルの入力時間エンベロープの特徴を調べるエンベロープ分析器と、
2つ以上の前記C個の入力チャネルに対してキューコードを生成するコード推定器と、
C>E・・1である、前記E個の送信チャネルを生成するための前記C個の入力チャネルをダウンミキシングするダウンミキサとを備え、前記E個の送信チャネルの復号化を行う間に、前記装置が、前記キューコードおよび前記特徴を調べた入力時間エンベロープの情報を送信し、デコーダを有効にして、合成およびエンベロープ整形を行う、装置。 - 前記装置が、デジタルビデオレコーダ、デジタル音声レコーダ、コンピュータ、衛星送信機、ケーブル送信機、地上波放送送信機、ホームエンターテインメントシステム、および映画館システムからなるグループから選択されるシステムであって、
前記システムが、前記エンベロープ分析器、前記コード推定器、および前記ダウンミキサを備える、請求項19に記載の装置。 - 符号化したプログラムコードを有する機械読み取り可能媒体であって、前記プログラムコードを機械で実行する場合は、前記機械は、音声チャネルを符号化する方法を実行し、前記方法が、
少なくとも1つのキューコードが、1つ以上の前記音声チャネルのうちの1つにおける時間エンベロープの特徴を調べることにより、生成したエンベロープキューコードである、1つ以上のキューコードを1つ以上の音声チャネルに対し生成するステップと、
1つ以上の前記キューコードを送信するステップとを含む、機械読み取り可能媒体。 - 音声チャネルを符号化することにより生成した、符号化音声ビットストリームであって、
少なくとも1つのキューコードが、1つ以上の前記音声チャネルのうちの1つの時間エンベロープの特徴を調べることにより、生成したエンベロープキューコードである、1つ以上のキューコードを1つ以上の音声チャネルに対して生成し、
1つ以上の前記キューコードと、1つ以上の前記音声チャネルに対応する、E・・1である、E個の送信音声チャネルとが、前記符号化音声ビットストリームに符号化される、符号化音声ビットストリーム。 - 1つ以上のキューコードおよびE個の送信音声チャネルを含む符号化音声ビットストリームであって、
少なくとも1つのキューコードが、1つ以上の前記音声チャネルのうちの1つの時間エンベロープの特徴を調べることにより、生成したエンベロープキューコードである、1つ以上の前記キューコードを1つ以上の音声チャネルに対して生成し、
前記E個の送信音声チャネルが、1つ以上の前記音声チャネルに対応している、符号化音声ビットストリーム。 - C>E・・1である、C個の再生音声チャネルを生成するために、E個の送信音声チャネルを復号化する方法であって、
キューコードが、前記E個の送信チャネルに対応する音声チャネルの特徴を調べた時間エンベロープに対応するエンベロープキューコードである、前記E個の送信チャネルに対応する前記キューコードを受信するステップと、
1つ以上のアップミキシングチャネルを生成するために、1つ以上の前記E個の送信チャネルをアップミキシングするステップと
前記キューコードを前記1つ以上のアップミキシングチャネルに適用することにより、1つ以上の前記C個の再生チャネルを合成するステップとを含み、前記調整した時間エンベロープが基本的に前記特徴を調べた時間エンベロープと整合するように、前記特徴を調べた時間エンベロープに基づいて、前記エンベロープキューコードが、前記合成した信号の時間エンベロープを調整するために、アップミキシングチャネルまたは合成した信号に適用する方法。 - 前記E個の送信チャネルを生成するために、元の入力チャネルにおいて、前記エンベロープキューコードに対応している特徴を調べた時間エンベロープを用いる、請求項24に記載の発明。
- 前記キューコードがさらに、1つ以上のICC、ICLD、およびICTDコードを含む、請求項24に記載の発明。
- 前記エンベロープキューコードに対応付けられた第1の時間分解能が、前記他のキューコードに対応付けられた第2の時間分解能よりも細かい、請求項26に記載の発明。
- 前記合成が、後期残響ICC合成を含む、請求項26に記載の発明。
- ICLD合成を行う前に、前記合成した信号の前記時間エンベロープを調整する、請求項26に記載の発明。
- 前記合成した信号の前記時間エンベロープの特徴を調べ、
前記エンベロープキューコードに対応する前記特徴を調べた時間エンベロープおよび前記合成した信号の前記特徴を調べた時間エンベロープの両方に基づいて、前記合成した信号の前記時間エンベロープを調整する、請求項24に記載の発明。 - 前記エンベロープキューコードに対応する前記特徴を調べた時間エンベロープと、前記合成した信号の前記特徴を調べた時間エンベロープとに基づいて、スケール関数を生成し、
前記スケール関数を前記合成した信号に適用する、請求項30に記載の発明。 - 平坦化チャネルを生成するために、前記特徴を調べた時間エンベロープに基づいて、送信チャネルを調整するステップをさらに含み、対応する再生チャネルを生成するために、前記アップミキシングおよび合成を前記平坦化チャネルに適用する、請求項24に記載の発明。
- 平坦化チャネルを生成するために、前記特徴を調べた時間エンベロープに基づいて、アップミキシングチャネルを調整するステップをさらに含み、前記合成を前記平坦化チャネルに行って、対応する再生チャネルを生成する、請求項24に記載の発明。
- 指定の周波数に対してだけ、前記合成した信号の前記時間エンベロープを調整する、請求項24に記載の方法。
- 指定のカットオフ周波数を超える周波数に対してだけ、前記合成した信号の前記時間エンベロープを調整する、請求項34に記載の発明。
- 周波数領域で、前記合成した信号の前記時間エンベロープを調整する、請求項24に記載の発明。
- 前記合成した信号において異なる信号サブバンドに対して、個別に時間エンベロープを調整する、請求項36に記載の発明。
- 前記周波数領域がFFTに対応している、請求項36に記載の発明。
- 前記周波数領域がQMFに対応している、請求項36に記載の発明。
- 時間領域において、前記合成した信号の前記時間エンベロープを調整する、請求項24に記載の発明。
- 前記合成した信号の前記時間エンベロープを調整する前記ステップを有効にするか、無効にするか判定するステップをさらに含む、請求項24に記載の発明。
- 前記判定ステップが、前記E個の送信チャネルを生成した音声エンコーダが生成した有効/無効のフラグに基づいている、請求項41に記載の発明。
- 一時的現象の発生を検出した場合は、前記調整ステップを有効にするように、前記判定ステップが、一時的現象を検出するように、前記E個の送信チャネルを分析するステップに基づいている、請求項41に記載の発明。
- 送信チャネルの時間エンベロープの特徴を調べるステップと、
(1)前記エンベロープキューコードに対応する前記特徴を調べた時間エンベロープを用いるか、または(2)前記合成した信号の前記時間エンベロープを調整するために、前記送信チャネルの前記特徴を調べた時間エンベロープを用いるかどうか、判定するステップとをさらに含む、請求項24に記載の発明。 - 前記時間エンベロープを調整した後の、前記合成した信号の指定のウィンドウ内のパワーが、前記調整ステップを行う前の、前記合成した信号の対応するウィンドウ内のパワーと、実質的に等しい、請求項24に記載の発明。
- 前記指定のウィンドウが、1つ以上の非エンベロープキューコードに対応付けられている合成窓に対応している、請求項45に記載の発明。
- C>E・・1である、C個の再生音声チャネルを生成するために、E個の送信音声チャネルを復号化する装置であって、
キューコードが前記E個の送信チャネルに対応する音声チャネルの特徴を調べた時間エンベロープに対応するエンベロープキューコードである、前記E個の送信チャネルに対応するキューコードを受信する手段と、
1つ以上のアップミキシングチャネルを生成するために、1つ以上の前記E個の送信チャネルをアップミキシングする手段と、
前記キューコードを前記1つ以上のアップミキシングチャネルに適用することにより、1つ以上の前記C個の再生チャネルを合成する手段とを備え、前記調整した時間エンベロープが基本的に前記特徴を調べた時間エンベロープと整合するように、前記特徴を調べた時間エンベロープに基づいて、前記エンベロープキューコードを、アップミキシングチャネルまたは合成した信号に適用して、前記合成した信号の時間エンベロープを調整する、装置。 - C個の再生音声チャネルを生成するために、C>E・・1である、E個の送信音声チャネルを復号化する装置であって、
キューコードが前記E個の送信チャネルに対応する音声チャネルの特徴を調べた時間エンベロープに対応するエンベロープキューコードである、前記E個の送信チャネルに対応するキューコードを受信する受信機と、
1つ以上のアップミキシングチャネルを生成するために、1つ以上の前記E個の送信チャネルをアップミキシングするアップミキサと、
前記キューコードを前記1つ以上のアップミキシングチャネルに適用することにより、1つ以上の前記C個の再生チャネルを合成する合成器とを備え、前記調整した時間エンベロープが基本的に前記特徴を調べた時間エンベロープと整合するように、前記特徴を調べた時間エンベロープに基づいて、前記エンベロープキューコードを、アップミキシングチャネルまたは合成した信号に適用して、前記合成した信号の時間エンベロープを調整する、装置。 - 前記装置が、デジタルビデオプレーヤ、デジタル音声プレーヤ、コンピュータ、衛星受信機、ケーブル受信機、地上波放送受信機、ホームエンターテインメントシステム、および映画館システムからなるグループから選択したシステムであって、
前記システムが、前記受信機、前記アップミキサ、前記合成器、および前記エンベロープ調整器を備える、請求項48に記載の発明。 - 符号化したプログラムコードを有する機械読み取り可能媒体であって、前記プログラムコードを機械で実行する場合は、前記マシンC>E・・1である、E個の送信音声チャネルを復号化してC個の再生音声チャネルを生成する方法を実行し、前記方法が、
キューコードが前記E個の送信チャネルに対応する音声チャネルの特徴を調べた時間エンベロープに対応するエンベロープキューコードである、前記E個の送信チャネルに対応するキューコードを受信するステップと、
1つ以上のアップミキシングチャネルを生成するために、1つ以上の前記E個の送信チャネルをアップミキシングするステップと、
前記キューコードを前記1つ以上のアップミキシングチャネルに適用することにより、1つ以上の前記C個の再生チャネルを合成するステップとを備え、前記調整した時間エンベロープが基本的に前記特徴を調べた時間エンベロープと整合するように、前記特徴を調べた時間エンベロープに基づいて、前記エンベロープキューコードを、アップミキシングチャネルまたは合成した信号に適用して、前記合成した信号の時間エンベロープを調整する、機械読み取り可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62048004P | 2004-10-20 | 2004-10-20 | |
US11/006,482 US7720230B2 (en) | 2004-10-20 | 2004-12-07 | Individual channel shaping for BCC schemes and the like |
PCT/EP2005/009618 WO2006045371A1 (en) | 2004-10-20 | 2005-09-07 | Individual channel temporal envelope shaping for binaural cue coding schemes and the like |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008517333A true JP2008517333A (ja) | 2008-05-22 |
JP4664371B2 JP4664371B2 (ja) | 2011-04-06 |
Family
ID=36180779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007537133A Active JP4664371B2 (ja) | 2004-10-20 | 2005-09-07 | バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 |
Country Status (21)
Country | Link |
---|---|
US (1) | US7720230B2 (ja) |
EP (1) | EP1803117B1 (ja) |
JP (1) | JP4664371B2 (ja) |
KR (1) | KR100924576B1 (ja) |
CN (1) | CN101044551B (ja) |
AT (1) | ATE424606T1 (ja) |
AU (1) | AU2005299068B2 (ja) |
BR (1) | BRPI0516405B1 (ja) |
CA (1) | CA2582485C (ja) |
DE (1) | DE602005013103D1 (ja) |
DK (1) | DK1803117T3 (ja) |
ES (1) | ES2323275T3 (ja) |
HK (1) | HK1106861A1 (ja) |
IL (1) | IL182236A (ja) |
MX (1) | MX2007004726A (ja) |
NO (1) | NO338919B1 (ja) |
PL (1) | PL1803117T3 (ja) |
PT (1) | PT1803117E (ja) |
RU (1) | RU2339088C1 (ja) |
TW (1) | TWI318079B (ja) |
WO (1) | WO2006045371A1 (ja) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
KR20070056081A (ko) * | 2004-08-31 | 2007-05-31 | 마츠시타 덴끼 산교 가부시키가이샤 | 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 |
US20060106620A1 (en) * | 2004-10-28 | 2006-05-18 | Thompson Jeffrey K | Audio spatial environment down-mixer |
KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
ES2623551T3 (es) * | 2005-03-25 | 2017-07-11 | Iii Holdings 12, Llc | Dispositivo de codificación de sonido y procedimiento de codificación de sonido |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
US8111830B2 (en) * | 2005-12-19 | 2012-02-07 | Samsung Electronics Co., Ltd. | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener |
KR100644715B1 (ko) * | 2005-12-19 | 2006-11-10 | 삼성전자주식회사 | 능동적 오디오 매트릭스 디코딩 방법 및 장치 |
US8208641B2 (en) * | 2006-01-19 | 2012-06-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
CN101410891A (zh) * | 2006-02-03 | 2009-04-15 | 韩国电子通信研究院 | 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置 |
US8285556B2 (en) * | 2006-02-07 | 2012-10-09 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
EP1989920B1 (en) * | 2006-02-21 | 2010-01-20 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
EP2005424A2 (fr) * | 2006-03-20 | 2008-12-24 | France Télécom | Procede de post-traitement d'un signal dans un decodeur audio |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
EP2122613B1 (en) | 2006-12-07 | 2019-01-30 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
FR2911426A1 (fr) * | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
PL2118889T3 (pl) | 2007-03-05 | 2013-03-29 | Ericsson Telefon Ab L M | Sposób i sterownik do wygładzania stacjonarnego szumu tła |
US8527282B2 (en) * | 2007-11-21 | 2013-09-03 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
WO2009106147A1 (en) * | 2008-02-29 | 2009-09-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Channel power estimation means |
WO2009125046A1 (en) * | 2008-04-11 | 2009-10-15 | Nokia Corporation | Processing of signals |
KR101499785B1 (ko) | 2008-10-23 | 2015-03-09 | 삼성전자주식회사 | 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법 |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
MX2012004621A (es) * | 2009-10-20 | 2012-05-08 | Fraunhofer Ges Forschung | Aparato para proporcionar una representacion de una señal de conversion ascendente sobre la base de una representacion de una señal de conversion descendente, aparato para proporcionar una corriente de bits que representa una señal de audio de canales multiples, metodos, programa de computacion y corriente de bits que utiliza una señalizacion de control de distorsion. |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
SG10201604880YA (en) | 2010-07-02 | 2016-08-30 | Dolby Int Ab | Selective bass post filter |
CN103339670B (zh) * | 2011-02-03 | 2015-09-09 | 瑞典爱立信有限公司 | 确定多通道音频信号的通道间时间差 |
KR101662681B1 (ko) * | 2012-04-05 | 2016-10-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법 |
CN110223701B (zh) | 2012-08-03 | 2024-04-09 | 弗劳恩霍夫应用研究促进协会 | 用于从缩混信号产生音频输出信号的解码器和方法 |
CN110223702B (zh) * | 2013-05-24 | 2023-04-11 | 杜比国际公司 | 音频解码系统和重构方法 |
EP2830333A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830045A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
EP3806498B1 (en) | 2013-09-17 | 2023-08-30 | Wilus Institute of Standards and Technology Inc. | Method and apparatus for processing audio signal |
CN105874819B (zh) | 2013-10-22 | 2018-04-10 | 韩国电子通信研究院 | 生成用于音频信号的滤波器的方法及其参数化装置 |
KR101627661B1 (ko) | 2013-12-23 | 2016-06-07 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
CN106105269B (zh) | 2014-03-19 | 2018-06-19 | 韦勒斯标准与技术协会公司 | 音频信号处理方法和设备 |
CN108307272B (zh) | 2014-04-02 | 2021-02-02 | 韦勒斯标准与技术协会公司 | 音频信号处理方法和设备 |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
TWI587286B (zh) * | 2014-10-31 | 2017-06-11 | 杜比國際公司 | 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 |
KR102517867B1 (ko) | 2015-08-25 | 2023-04-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 디코더 및 디코딩 방법 |
CA2985019C (en) | 2016-02-17 | 2022-05-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
CN107818790B (zh) * | 2017-11-16 | 2020-08-11 | 苏州麦迪斯顿医疗科技股份有限公司 | 一种多路音频混音方法及装置 |
CN112262433B (zh) * | 2018-04-05 | 2024-03-01 | 弗劳恩霍夫应用研究促进协会 | 用于估计通道间时间差的装置、方法或计算机程序 |
GB2584630A (en) * | 2019-05-29 | 2020-12-16 | Nokia Technologies Oy | Audio processing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1051313A (ja) * | 1996-03-22 | 1998-02-20 | Lucent Technol Inc | マルチチャネルオーディオ信号のジョイントステレオ符号化方法 |
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
WO2004072956A1 (en) * | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
JP2004535145A (ja) * | 2001-07-10 | 2004-11-18 | コーディング テクノロジーズ アクチボラゲット | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
US4815132A (en) * | 1985-08-30 | 1989-03-21 | Kabushiki Kaisha Toshiba | Stereophonic voice signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
EP0520068B1 (en) * | 1991-01-08 | 1996-05-15 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5771295A (en) * | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
WO1997029555A1 (en) * | 1996-02-08 | 1997-08-14 | Philips Electronics N.V. | N-channel transmission, compatible with 2-channel transmission and 1-channel transmission |
US5825776A (en) * | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
US5889843A (en) * | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
US5860060A (en) * | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6021389A (en) * | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
JP3657120B2 (ja) * | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000152399A (ja) * | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
US6408327B1 (en) * | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6823018B1 (en) * | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
US6434191B1 (en) * | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6498852B2 (en) * | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
US6845163B1 (en) * | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US6850496B1 (en) * | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7236838B2 (en) * | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
KR20040080003A (ko) | 2002-02-18 | 2004-09-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 오디오 코딩 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
BRPI0304542B1 (pt) * | 2002-04-22 | 2018-05-08 | Koninklijke Philips Nv | Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado |
JP4187719B2 (ja) | 2002-05-03 | 2008-11-26 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | マルチチャネル・ダウンミキシング装置 |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
KR100981699B1 (ko) * | 2002-07-12 | 2010-09-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US7644001B2 (en) | 2002-11-28 | 2010-01-05 | Koninklijke Philips Electronics N.V. | Differentially coding an audio signal |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
KR20050116828A (ko) | 2003-03-24 | 2005-12-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 신호를 나타내는 주 및 부 신호의 코딩 |
US20050069143A1 (en) * | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
DE602004030594D1 (de) * | 2003-10-07 | 2011-01-27 | Panasonic Corp | Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7716043B2 (en) * | 2005-10-24 | 2010-05-11 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2004
- 2004-12-07 US US11/006,482 patent/US7720230B2/en active Active
-
2005
- 2005-09-07 AT AT05792350T patent/ATE424606T1/de active
- 2005-09-07 KR KR1020077008410A patent/KR100924576B1/ko active IP Right Grant
- 2005-09-07 CA CA2582485A patent/CA2582485C/en active Active
- 2005-09-07 EP EP05792350A patent/EP1803117B1/en active Active
- 2005-09-07 AU AU2005299068A patent/AU2005299068B2/en active Active
- 2005-09-07 BR BRPI0516405-2A patent/BRPI0516405B1/pt active IP Right Grant
- 2005-09-07 CN CN2005800357018A patent/CN101044551B/zh active Active
- 2005-09-07 MX MX2007004726A patent/MX2007004726A/es active IP Right Grant
- 2005-09-07 DE DE602005013103T patent/DE602005013103D1/de active Active
- 2005-09-07 ES ES05792350T patent/ES2323275T3/es active Active
- 2005-09-07 RU RU2007118679/09A patent/RU2339088C1/ru active
- 2005-09-07 JP JP2007537133A patent/JP4664371B2/ja active Active
- 2005-09-07 PT PT05792350T patent/PT1803117E/pt unknown
- 2005-09-07 DK DK05792350T patent/DK1803117T3/da active
- 2005-09-07 PL PL05792350T patent/PL1803117T3/pl unknown
- 2005-09-07 WO PCT/EP2005/009618 patent/WO2006045371A1/en active Application Filing
- 2005-10-19 TW TW094136500A patent/TWI318079B/zh active
-
2007
- 2007-03-21 NO NO20071493A patent/NO338919B1/no unknown
- 2007-03-27 IL IL182236A patent/IL182236A/en active IP Right Grant
- 2007-12-28 HK HK07114229.7A patent/HK1106861A1/xx unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1051313A (ja) * | 1996-03-22 | 1998-02-20 | Lucent Technol Inc | マルチチャネルオーディオ信号のジョイントステレオ符号化方法 |
JP2004535145A (ja) * | 2001-07-10 | 2004-11-18 | コーディング テクノロジーズ アクチボラゲット | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 |
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
WO2004072956A1 (en) * | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
Also Published As
Publication number | Publication date |
---|---|
WO2006045371A1 (en) | 2006-05-04 |
NO20071493L (no) | 2007-05-22 |
BRPI0516405A8 (pt) | 2018-07-31 |
TW200628001A (en) | 2006-08-01 |
EP1803117A1 (en) | 2007-07-04 |
CN101044551A (zh) | 2007-09-26 |
CN101044551B (zh) | 2012-02-08 |
PL1803117T3 (pl) | 2009-08-31 |
AU2005299068B2 (en) | 2008-10-30 |
JP4664371B2 (ja) | 2011-04-06 |
ATE424606T1 (de) | 2009-03-15 |
PT1803117E (pt) | 2009-06-15 |
KR20070061872A (ko) | 2007-06-14 |
CA2582485A1 (en) | 2006-05-04 |
DE602005013103D1 (de) | 2009-04-16 |
AU2005299068A1 (en) | 2006-05-04 |
US7720230B2 (en) | 2010-05-18 |
HK1106861A1 (en) | 2008-03-20 |
EP1803117B1 (en) | 2009-03-04 |
IL182236A (en) | 2011-08-31 |
ES2323275T3 (es) | 2009-07-10 |
NO338919B1 (no) | 2016-10-31 |
BRPI0516405A (pt) | 2008-09-02 |
BRPI0516405B1 (pt) | 2019-09-17 |
MX2007004726A (es) | 2007-09-07 |
US20060083385A1 (en) | 2006-04-20 |
TWI318079B (en) | 2009-12-01 |
KR100924576B1 (ko) | 2009-11-02 |
RU2339088C1 (ru) | 2008-11-20 |
DK1803117T3 (da) | 2009-06-22 |
IL182236A0 (en) | 2007-09-20 |
CA2582485C (en) | 2012-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4664371B2 (ja) | バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 | |
JP4625084B2 (ja) | バイノーラルキュー符号化方法等のための拡散音の整形 | |
KR101215868B1 (ko) | 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치 | |
JP5017121B2 (ja) | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 | |
US7903824B2 (en) | Compact side information for parametric coding of spatial audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100521 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101013 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4664371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140114 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |