JP2019012279A - デコーダシステム、復号方法及びコンピュータプログラム - Google Patents
デコーダシステム、復号方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2019012279A JP2019012279A JP2018171542A JP2018171542A JP2019012279A JP 2019012279 A JP2019012279 A JP 2019012279A JP 2018171542 A JP2018171542 A JP 2018171542A JP 2018171542 A JP2018171542 A JP 2018171542A JP 2019012279 A JP2019012279 A JP 2019012279A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency domain
- domain representation
- downmix
- stereo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000004590 computer program Methods 0.000 title claims description 7
- 230000003595 spectral effect Effects 0.000 claims abstract description 66
- 238000011144 upstream manufacturing Methods 0.000 claims description 30
- 238000013139 quantization Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 20
- 238000012937 correction Methods 0.000 claims description 18
- 238000012986 modification Methods 0.000 claims description 14
- 230000004048 modification Effects 0.000 claims description 14
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000007493 shaping process Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 abstract description 18
- 238000001914 filtration Methods 0.000 abstract description 11
- 230000009466 transformation Effects 0.000 description 33
- 230000006870 function Effects 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 19
- 238000001228 spectrum Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 239000003607 modifier Substances 0.000 description 11
- 238000013459 approach Methods 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 5
- 238000007792 addition Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L19/00—Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Description
ダウンミックス信号(M)と残差信号(D)の第1の周波数領域表示に基づいて、前記ステレオ信号を生成するように構成されたアップミックス段階であって、各第1の周波数領域表示は多次元空間の第1の副空間で表された対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を有するアップミックス段階を有し、前記アップミックス段階は、
前記ダウンミックス信号の第1の周波数領域表示に基づき、前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールであって、前記第2の周波数領域表示は、前記第1の副空間に含まれない多次元空間の一部を含む、前記多次元空間の第2の副空間で表された信号のスペクトルコンテンツを表す第2のスペクトル成分を有する、モジュールと、
前記ビットストリーム信号にエンコードされた前記ダウンミックス信号の第1と第2の周波数領域表示と、前記残差信号の第1の周波数領域表示と、複素予測係数(α)とに基づいてサイド信号(S)を計算する重み付け加算器とを有するアップミックス段階と、
前記ダウンミックス信号と前記サイド信号の第1の周波数領域表示に基づいて、前記ステレオ信号を計算する和・差段階を有し、
前記アップミックス段階は、さらに、前記ダウンミックス信号と残差信号が前記和・差段階に直接供給されるパススルーモードで動作可能である。
複素予測ステレオ符号化によりビットストリーム信号によりステレオ信号をエンコードするエンコーダシステムであって、
複素予測係数を推定する推定器と、
(a)前記ステレオ信号を、前記複素予測係数の値により決定される関係を有するダウンミックス信号と残差信号の周波数領域表示に変換するように動作可能な符号化段階と、
前記符号化段階と推定器から出力を受け取り、これを前記ビットストリーム信号にエンコードするマルチプレクサとを有する。
・前記第1のスペクトル成分から第1の中間成分を求め、
・インパルス応答の少なくとも一部により前記第1のスペクトル成分の結合を構成して第2の中間成分を求め、
・前記第2の中間成分から第2のスペクトル成分を求めるように構成されている。
この手順により、米国特許第6,980,933B2号に、特にコラム8乃至28に、特に式41に詳細に記載されているように、第1の周波数領域表示から直接第2の周波数領域表示を計算することができる。当業者は気づくように、例えば、異なる変換が続く逆変換とは反対に、計算は、時間領域によっては実行されない。
・(信号を変化させない)パススルー段階として、または和・差変換として選択的に動作可能なスイッチ;
・周波数・時間変換を行う逆変換段階;及び
・直接(または同時)符号化した信号を、または複素予測により符号化された信号を、逆変換段階に入力するセレクタ装置。
当業者が気づくように、デコーダの側にこのようなフレキシビリティがあるので、エンコーダは、従来の直接または同時符号化と、複素予測符号化とを選択する自由度を有する。よって、この実施形態は、従来の直接L/Rステレオ符号化や同時M/Sステレオ符号化の音質レベルを越えられない場合には、少なくとも、同じレベルを維持することを保証できる。よって、本実施形態によるデコーダは、関連技術に対して上位集合(superset)であるとみなすことができる。
・パススルー段階として、または和・差段階として動作できるスイッチ;
・サイド信号の時間領域表示を計算するさらなる逆変換段階;
・逆変換段階を、(好ましくは、複素予測符号化により生成されたステレオ信号を復号する場合のように、スイッチがアクティブ化されパスフィルタとして機能するときに、)アップミックスの上流にあり、かつスイッチの下流にあるポイントに接続されたさらなる和・差段階に、または(好ましくは、直接符号化されたステレオ信号を復号する場合のように、スイッチがアクティブ化され、和・差段階として機能するときに、)スイッチからのダウンミックス信号と、重み付け加算器からのサイド信号との組み合わせに、接続するセレクタ装置。
当業者は気づくように、これはエンコーダに、従来の直接又は同時符号化と、複素予測符号化との間を選択する自由度を与え、すなわち直接又は同時ステレオ符号化と少なくとも等しい音質レベルを保証できる。
・ステレオ信号をミッドチャンネルとサイドチャンネルに変換する和・差段階;
・サイドチャンネルの周波数領域表示と、ミッドチャンネルの複素値(すなわち、オーバーサンプリングされた)周波数領域表示とを提供する変換段階;及び
・複素予測係数を重みとして用いる、残差信号を計算する重み付け加算器。
ここで、推定器は、残差信号を受け取り、場合によってはフィードバック制御形式で、残差信号のパワーまたは平均パワーを低減または最小化する複素予測係数を決定する。しかし、好ましくは、推定器は、符号化するステレオ信号を受け取り、それに基づいて予測係数を決定する。サイドチャンネルのクリティカルサンプリングされた周波数領域表示を用いることは、計算の経済性の観点から有利である。この実施形態では、サイドチャンネルは複素数との乗算をされないからである。好適にも、変換段階は、並列に構成されたMDCT段階とMDST段階とを含み得る。両者は、ミッドチャンネルの時間領域表示を入力として有する。このように、ミッドチャンネルのオーバーサンプリングされた周波数領域表示と、サイドチャンネルのクリティカルサンプリングされた周波数領域表示とを生成する。
図2は、概略的なブロック図の形式で、少なくとも1つの複素予測係数値α=αR+iαIを有するビットストリームを復号する復号システムを示す。ステレオ信号のMDCT表現はダウンミックスMチャンネルと残差Dチャンネルを有する。予測係数の実部とαRと虚部αIは量子化され、及び/または同時符号化(coded jointly)されている。しかし、好ましくは、実部と虚部は独立かつ均一に、一般的にはステップサイズ0.1(無次元数)で、量子化される。MPEG標準によると、複素予測係数に用いる周波数帯域の解像度は、スケールファクタ帯域(sfb、すなわち同じMDCT量子化ステップサイズと量子化範囲を用いる一群のMDCTライン)の解像度と同じである必要はない。特に、予測係数の周波数帯域解像度は、バークスケール(Bark scale)のように音響心理学的に妥当なものである。デマルチプレクサ201は、供給されるビットストリームから、これらのMDCT表現と予測係数(図示した制御情報の一部)を取り出すように構成されている。実際、ビットストリームには、それを予測モードと非予測モードのどちらで復号するかという命令やTNS情報などの、複素予測係数以上の制御情報がエンコードされているTNS情報は、デコーダシステムのTNS(合成)フィルタにより使われるTNSパラメータの値を含む。両チャンネルなどの複数のTNSフィルタに同じ一組のTNSパラメータを用いる場合、パラメータの組のアイデンティティを示すビットの形式でこの情報を受け取る方が、二組のパラメータを別々に受け取るよりも、経済的である。例えば、2つのオプションの音響心理学的評価に基づき、TNSをアップミックス段階の前または後に適用するかの情報も含まれうる。さらに、制御情報はダウンミックス信号と残差信号の個別に制限された帯域幅を示す。各チャンネルに対して、帯域幅制限より上の周波数帯域は復号されず、ゼロに設定される。場合によっては、最も高い周波数帯域のエネルギーコンテンツは小さいので、量子化されたときにすでにゼロになっている。通常のプラクティス(MPEG標準のmax_sfbパラメータを参照)では、ダウンミックス信号と残差信号の両方に、同じ帯域幅制限を用いなければならない。しかし、残差信号は、ダウンミックス信号よりも大幅に、低周波数帯域に局限されたエネルギーコンテンツを有する。そのため、残差信号に専用の帯域幅上限を課すことにより、音質を大幅に損なわずに、ビットレートの削減が可能である。例えば、これは、ビットストリームにエンコードされた、ダウンミックス信号用と残差信号用の2つの独立なmax_sfbパラメータにより調節される。
次のパラグラフでさらに説明するように、デコーダシステムは第2のスイッチングアセンブリ205を含む。両スイッチングアセンブリ203、205は、この実施形態及びこれから説明する実施形態におけるその他のほとんどのスイッチやスイッチングアセンブリのように、周波数選択的に動作可能である。これにより、例えば、関連技術として知られているように、周波数依存のL/RまたはM/S復号などの非常に様々な復号モードの復号が可能になる。よって、本発明によるデコーダは、関連技術に対して上位集合(superset)であるとみなすことができる。
本発明によるエンコーダシステムを、図5を参照して説明する。図5は、複素予測符号化により、出力ビットストリームとして、左/右(L/R)ステレオ信号を符号化するエンコーダシステムを示すブロック図である。このエンコーダシステムは、信号の時間領域または周波数領域の表示を受け取り、これをダウンミックス段階と予測係数推定器の両方に供給する。予測係数の実部と虚部は、左右チャンネルのダウンミックス及び残差チャンネルへの変換を制御するために、ダウンミックス段階に供給される。次に、ダウンミックス及び残差チャンネルは、最終的マルチプレクサMUXに供給される。信号は、周波数領域表示としてエンコーダに供給されなかった場合、ダウンミックス段階またはマルチプレクサで、かかる表示に変換される。
本発明の第3と第4の態様の実施形態を図15と16に示す。図15は、ビットストリームをステレオ信号に復号する方法を示し、次のステップを有する:
1.ビットストリームを入力する。
2.ビットストリームを逆量子化し、それによりステレオ信号のダウンミックスチャンネルと残差チャンネルの第1の周波数領域表示を求める。
3.ダウンミックスチャンネルの第2の周波数領域表示を計算する。
4.チャンネルの3つの周波数領域表示に基づき、サイドチャンネル信号を計算する。
5.ステレオ信号を、好ましくは左/右形式のものを、サイドチャンネルとダウンミックスチャンネルに基づき計算する。
6.こうして求めたステレオ信号を出力する。
ステップ3乃至ステップ5は、アップミキシングのプロセスと考えてもよい。ステップ1から6はそれぞれ、本書類の前出の部分で開示したいずれかのデコーダシステムの対応する機能と同様であり、実装に関する詳細事項は同部分から読み取ることができる。
1.ステレオ信号を入力する。
2.ステレオ信号を第1周波数領域表示に変換する。
3.複素予測係数を決定する。
4.周波数領域表示をダウンミックスする。
5.ダウンミックスチャンネルと残差チャンネルを、複素予測係数とともにビットストリームとしてエンコードする。
6.ビットストリームを出力する。
ステップ1から5はそれぞれ、本書類の前出の部分で開示したいずれかのエンコーダシステムの対応する機能と同様であり、実装に関する詳細事項は同部分から読み取ることができる。
ここに開示した実施形態を実験的に評価した。このプロセスで得られた実験的資料の最も重要な部分を以下にまとめる。
(i)(時間フレームの)各MDSTスペクトルを、現在の、前の、及び次のMDCTスペクトルから2次元有限インパルス応答フィルタリングにより計算した。
(ii)USACステレオエンコーダからの音響心理学的モデルを用いた。
(iii)PSパラメータICC、CLD及びIPDの代わりに、複素予測係数αの実部と虚部が送信を送信した。実部と虚部は、別々に処理され、[−3.0, 3.0]の範囲に制限され、0.1のステップサイズを用いて量子化される。時間微分符号化し、最終的にUSACのスケールファクタコードブックを用いてハフマン符号化する。予測係数は1スケールファクタ帯域おきに更新され、周波数解像度がMPEGサラウンド(例えば、ISO/IEC23003−1参照)と同様になった。この量子化および符号化スキームにより、目標ビットレートが96kb/sの一般的な構成において、ステレオサイド情報の平均ビットレートが約2kb/sになった。
(iv)2ビットのms_mask_presentビットストリーム要素の取り得る値は3つしかないので、現在のUSACビットストリームを壊すことなく、ビットストリームフォーマットを修正した。複素予測を示す第4の値を用いることにより、ビットを無駄にせずに、基本的なミッド/サイド符号化のフォールバックモードを許した(これについては、本開示の前のサブセクションを参照されたい)。
本発明のさらなる実施形態は、上記の説明を読めば、当業者には明らかになるだろう。本明細書と図面は実施形態と実施例を開示しているが、本発明はこれらの具体的な例に制約されない。添付した特許請求の範囲で規定した本発明の範囲から逸脱することなく、多数の修正や変形をすることができる。
実施形態について付記する。
(付記1) 複素予測ステレオ符号化によりステレオ信号を提供するデコーダシステムであって、
ダウンミックス信号と残差信号の第1の周波数領域表示に基づいて、前記ステレオ信号を生成するように構成されたアップミックス段階であって、各第1の周波数領域表示は多次元空間の第1の副空間で表された対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を有するアップミックス段階を有し、前記アップミックス段階は、
前記ダウンミックス信号の第1の周波数領域表示に基づき、前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールであって、前記第2の周波数領域表示は、前記第1の副空間に含まれない多次元空間の一部を含む、前記多次元空間の第2の副空間で表された信号のスペクトルコンテンツを表す第2のスペクトル成分を有する、モジュールと、
前記ビットストリーム信号にエンコードされた前記ダウンミックス信号の第1と第2の周波数領域表示と、前記残差信号の第1の周波数領域表示と、複素予測係数とに基づいてサイド信号を計算する重み付け加算器と、
前記ダウンミックス信号と前記サイド信号の第1の周波数領域表示に基づいて、前記ステレオ信号を計算する和・差段階と、
前記アップミックス段階の上流に配置され、少なくとも一信号の周波数領域表示を処理するアクティブモードと、パススルーとして機能するパッシブモードとで動作可能である第1の周波数領域修正段階と、
前記アップミックス段階の下流に配置され、少なくとも一信号の周波数領域表示を処理するアクティブモードと、パススルーとして機能するパッシブモードとで動作可能である第2の周波数領域修正段階と、を有するデコーダシステム。
(付記2) 前記周波数領域修正段階の少なくとも一方は、時間的ノイズシェーピング(TNS)段階である、付記1に記載のデコーダシステム。
(付記3) さらに、各時間フレームについて、そのフレームに関連するデータフィールドを受け取り、前記データフィールドの値に応じて、アクティブモード又はパススルーモードにおいて前記第1の周波数領域修正段階を行い、アクティブモード又はパススルーモードにおいて前記第2の周波数領域修正段階を行うように構成された、付記2に記載のデコーダシステム。
(付記4) ビットストリーム信号に基づいて、前記ダウンミックス信号と残差信号の前記第1の周波数領域表示を提供する、前記アップミックス段階の上流に配置された逆量子化段階をさらに有する、付記1ないし3いずれか一項に記載のデコーダシステム。
(付記5) 前記第1のスペクトル成分は前記第1の副空間で表された実数値を有し、
前記第2のスペクトル成分は前記第2の副空間で表された虚数値を有し、
任意的に、前記第1のスペクトル成分は、離散余弦変換DCT又は修正離散余弦変換MDCTのうち一方により求められ、
任意的に、前記第2のスペクトル成分は、離散正弦変換DST又は修正離散正弦変換MDSTのうち一方により求められる、
付記1ないし4いずれか一項に記載のデコーダシステム。
(付記6) 前記ダウンミックス信号は連続した時間フレームにパーティションされ、各時間フレームは複素予測係数の値に関連し、
前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールは、前記複素予測係数の虚部の絶対値が時間フレームの所定の許容値より小さいことに応じて、自身を非アクティブ化して、その時間フレームに対して出力を生成しないようにするように構成された、
付記5に記載のデコーダシステム。
(付記7) 前記第1のスペクトル成分は変換係数の時間フレームに配置された変換係数であり、各ブロックは時間領域信号の時間セグメントへの変換の適用により生成され、
前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールは、
前記第1のスペクトル成分から第1の中間成分を求め、
インパルス応答の少なくとも一部分により前記第1のスペクトル成分の組み合わせを構成して、第2の中間成分を求め、
前記第2の中間成分から前記第2のスペクトル成分を求めるように構成された、
付記1ないし6いずれか一項に記載のデコーダシステム。
(付記8) インパルス応答の一部は、前記変換の周波数応答特性に基づき、
任意的に、前記変換の周波数応答特性は、前記信号の時間セグメントへの変換に適用された分析窓関数の特性に応じる、
付記7に記載のデコーダシステム。
(付記9) 前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールは、(a)第1のスペクトル成分の同時時間フレームと、
(b)第1のスペクトル成分の同時時間フレーム及び先行時間フレームと、
(c)第1のスペクトル成分の同時時間フレーム、先行時間フレーム、及び後続時間フレームとのうちの1つに基づいて第2のスペクトル成分の各時間フレームを求めるように構成された、
付記7または8に記載のデコーダシステム。
(付記10) 前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールは、少なくとも2つの時間的に隣接した、及び/又は周波数的に隣接した第1のスペクトル成分の組み合わせにより決定された近似的な第2のスペクトル成分を有する近似的第2のスペクトル表示を計算するように構成されている、
付記1ないし9いずれか一項に記載のデコーダシステム。
(付記11) 前記ステレオ信号は時間領域で表され、デコーダシステムはさらに、
(a)パススルー段階、又は(b)和・差段階のいずれかとして機能でき、それにより直接及び同時符号化ステレオ入力信号の間を切り替えられる、前記逆量子化段階と前記アップミックス段階の間に配置されたスイッチングアセンブリと、
前記ステレオ信号の時間領域表示を計算するように構成された逆変換段階と、
前記逆変換段階の上流に配置され、これを、(a)複素予測により求めたステレオ信号が前記逆変換段階に供給される、前記アップミックス段階の下流のポイントに、又は(b)直接ステレオ符号化により求めたステレオ信号が前記逆変換段階に供給される、前記スイッチングアセンブリの下流であり、かつ前記アップミックス段階の上流であるポイントのいずれかに選択的に接続するように構成されたセレクタ装置とを有する、
付記1ないし9いずれか一項に記載のデコーダシステム。
(付記12) 前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールは、
前記多次元空間の第1の副空間における各信号の第1の周波数領域表示に基づき、前記ダウンミックス信号及び/又は彩度信号の時間領域の表示を計算する逆変換段階と、
前記信号の時間領域表示に基づき各信号の第2の周波数領域表示を計算する変換段階とを有し、
好ましくは、前記逆変換段階は逆修正離散余弦変換MDCTを行い、前記変換段階は修正離散余弦変換MDSTを行う、
付記1ないし11いずれか一項に記載のデコーダシステム。
(付記13) 前記ステレオ信号は時間領域で表され、デコーダシステムはさらに、
(a)同時ステレオ符号化に用いるパススルー段階、又は(b)直接ステレオ符号化に用いる和・差段階のいずれかとして機能できる、前記逆量子化段階と前記アップミックス段階の間に配置されたスイッチングアセンブリと、
前記サイド信号の時間領域表示を計算する、前記アップミックス段階に配置されたさらなる逆変換段階と、
(a)前記スイッチングアセンブリの下流かつ前記アップミックス段階の上流のポイントに接続されたさらなる和・差段階、または(b)前記スイッチングアセンブリから得られるダウンミックス信号と前記重み付け加算器から得られるサイド信号のいずれかに選択的に接続されるように構成された、前記逆変換段階の上流に配置されたセレクタ装置とを有する、
付記12に記載のデコーダシステム。
(付記14) 複素予測ステレオ符号化により入力ステレオ信号を出力ステレオ信号にアップミックスする復号方法であって、
前記入力ステレオ信号は、ダウンミックスチャンネルと残差チャンネルの第1の周波数領域表示と、複素予測係数とを含み、
前記第1の周波数領域表示の各々は、多次元空間の第1の副空間で表された対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を有し、
前記方法は、アップミックス段階により実行され、
前記ダウンミックスチャンネルの第1の周波数領域表示に基づき、前記ダウンミックス信号の第2の周波数領域表示を計算するサブステップであって、前記第2の周波数領域表示は、前記第1の副空間に含まれない多次元空間の一部を含む、前記多次元空間の第2の副空間で表された信号のスペクトルコンテンツを表す第2のスペクトル成分を有する、ステップと、
前記ダウンミックス信号の第1と第2の周波数領域表示と、前記残差チャンネルの第1の周波数領域表示と、前記複素予測係数とに基づいて、サイドチャンネルを計算するステップとを有し、
さらに、アップミックスする段階の前に、前記ダウンミックス信号の第1の周波数領域表示、及び/又は前記残差信号の第1の周波数領域表示に、時間的ノイズシェーピングTNSを適用するステップ、又は
アップミックスするステップの後に、前記ステレオ信号の少なくとも1つのチャンネルにTNSを適用するステップとを有する、復号方法。
(付記15) 汎用コンピュータにより実行されたとき、付記14に記載の方法を実行する命令を格納したコンピュータ読み取り可能媒体を有するコンピュータプログラム製品。
Claims (6)
- 複素予測ステレオ符号化によりステレオ信号を提供するデコーダシステムであって、
ダウンミックス信号と残差信号の第1の周波数領域表示に基づいて、前記ステレオ信号を生成するように構成されたアップミックス段階であって、各第1の周波数領域表示は多次元空間の第1の副空間で表された対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を有するアップミックス段階を有し、前記アップミックス段階は、
前記ダウンミックス信号の第1の周波数領域表示に基づき、前記ダウンミックス信号の第2の周波数領域表示を計算するモジュールであって、前記第2の周波数領域表示は、前記第1の副空間に含まれない多次元空間の一部を含む、前記多次元空間の第2の副空間で表された信号のスペクトルコンテンツを表す第2のスペクトル成分を有する、モジュールと、
前記残差信号の第1の周波数領域表示と、ビットストリーム信号中にエンコードされた複素予測係数の実部により加重されたダウンミックス信号の第1の周波数領域表示と、前記複素予測係数の虚部により加重されたダウンミックス信号の第2の周波数領域表示とを合成することによりサイド信号を計算する加重加算器と、
前記ダウンミックス信号と前記サイド信号の第1の周波数領域表示に基づいて、前記ステレオ信号を計算する和・差段階と、
前記アップミックス段階の上流に配置され、少なくとも一信号の周波数領域表示を処理するアクティブモードと、パススルーとして機能するパッシブモードとで動作可能である第1の周波数領域修正段階と、
前記アップミックス段階の下流に配置され、少なくとも一信号の周波数領域表示を処理するアクティブモードと、パススルーとして機能するパッシブモードとで動作可能である第2の周波数領域修正段階と、を有する
デコーダシステム。 - 前記第1と第2の周波数領域修正段階の少なくとも一方は、時間的ノイズシェーピング(TNS)段階である、請求項1に記載のデコーダシステム。
- さらに、各時間フレームについて、そのフレームに関連するデータフィールドを受け取り、前記データフィールドの値に応じて、アクティブモード又はパススルーモードにおいて前記第1の周波数領域修正段階を行い、アクティブモード又はパススルーモードにおいて前記第2の周波数領域修正段階を行うように構成された、請求項2に記載のデコーダシステム。
- ビットストリーム信号に基づいて、前記ダウンミックス信号と残差信号の前記第1の周波数領域表示を提供する、前記アップミックス段階の上流に配置された逆量子化段階をさらに有する、請求項1ないし3いずれか一項に記載のデコーダシステム。
- 複素予測ステレオ符号化により入力ステレオ信号を出力ステレオ信号にアップミックスする復号方法であって、
前記入力ステレオ信号は、ダウンミックスチャネルと残差チャネルの第1の周波数領域表示と、複素予測係数とを含み、
前記第1の周波数領域表示の各々は、多次元空間の第1の副空間で表された対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を有し、
前記復号方法は、アップミックス段階により実行され、
前記ダウンミックスチャネルの第1の周波数領域表示に基づき、前記ダウンミックスチャネルの第2の周波数領域表示を計算するサブステップであって、前記第2の周波数領域表示は、前記第1の副空間に含まれない多次元空間の一部を含む、前記多次元空間の第2の副空間で表された信号のスペクトルコンテンツを表す第2のスペクトル成分を有する、サブステップと、
残差チャネルの第1の周波数領域表示と、複素予測係数の実部により加重されたダウンミックスチャネルの第1の周波数領域表示と、前記複素予測係数の虚部により加重されたダウンミックスチャネルの第2の周波数領域表示とを合成することによりサイドチャネルを計算するサブステップと、を含み、
さらに、アップミックスする段階の前に実行される、前記ダウンミックスチャネルの前記第1の周波数領域表示に、及び/又は前記残差チャネルの第1の周波数領域表示に、時間的ノイズシェーピング(TNS)を適用するステップ、又は
アップミックスするステップの後に実行される、前記出力ステレオ信号の少なくとも1つのチャネルにTNSを適用するステップを有する、
復号方法。 - 汎用コンピュータにより実行されたとき、前記汎用コンピュータに、請求項5に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32245810P | 2010-04-09 | 2010-04-09 | |
US61/322,458 | 2010-04-09 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017158657A Division JP6405008B2 (ja) | 2010-04-09 | 2017-08-21 | デコーダシステム、復号方法及びコンピュータプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019224406A Division JP6833961B2 (ja) | 2010-04-09 | 2019-12-12 | デコーダシステム、復号方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019012279A true JP2019012279A (ja) | 2019-01-24 |
JP6633706B2 JP6633706B2 (ja) | 2020-01-22 |
Family
ID=43952840
Family Applications (22)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013503096A Active JP5813094B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2013503104A Active JP5814341B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2013503101A Active JP5814340B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2015040746A Active JP6062467B2 (ja) | 2010-04-09 | 2015-03-02 | Mdctベース複素予測ステレオ符号化 |
JP2015184492A Active JP6197011B2 (ja) | 2010-04-09 | 2015-09-17 | Mdctベース複素予測ステレオ符号化 |
JP2015184493A Active JP6203799B2 (ja) | 2010-04-09 | 2015-09-17 | Mdctベース複素予測ステレオ符号化 |
JP2016242097A Active JP6437990B2 (ja) | 2010-04-09 | 2016-12-14 | Mdctベース複素予測ステレオ符号化 |
JP2017158657A Active JP6405008B2 (ja) | 2010-04-09 | 2017-08-21 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2017165152A Active JP6405010B2 (ja) | 2010-04-09 | 2017-08-30 | デコーダシステム及び復号方法 |
JP2018171632A Active JP6633707B2 (ja) | 2010-04-09 | 2018-09-13 | デコーダシステム及び復号方法 |
JP2018171542A Active JP6633706B2 (ja) | 2010-04-09 | 2018-09-13 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2018214489A Active JP6665260B2 (ja) | 2010-04-09 | 2018-11-15 | 複素予測ステレオ符号化によりステレオ信号を提供するデコーダシステム及び復号方法 |
JP2019117104A Active JP6677846B2 (ja) | 2010-04-09 | 2019-06-25 | ステレオオーディオ信号を出力する装置及び方法 |
JP2019224406A Active JP6833961B2 (ja) | 2010-04-09 | 2019-12-12 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2019224408A Active JP6833962B2 (ja) | 2010-04-09 | 2019-12-12 | デコーダシステム及び復号方法 |
JP2020043882A Active JP6740496B2 (ja) | 2010-04-09 | 2020-03-13 | ステレオオーディオ信号を出力する装置及び方法 |
JP2020125072A Active JP6817486B2 (ja) | 2010-04-09 | 2020-07-22 | ステレオオーディオ信号を出力する装置及び方法 |
JP2020215098A Active JP6886069B2 (ja) | 2010-04-09 | 2020-12-24 | ステレオオーディオ信号を出力する装置及び方法 |
JP2021081465A Active JP6961854B2 (ja) | 2010-04-09 | 2021-05-13 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2021167954A Active JP7193603B2 (ja) | 2010-04-09 | 2021-10-13 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2022196162A Active JP7451659B2 (ja) | 2010-04-09 | 2022-12-08 | デコーダシステム、デコーディング方法及びコンピュータプログラム |
JP2024033809A Pending JP2024056001A (ja) | 2010-04-09 | 2024-03-06 | デコーダシステム、デコーディング方法及びコンピュータプログラム |
Family Applications Before (10)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013503096A Active JP5813094B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2013503104A Active JP5814341B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2013503101A Active JP5814340B2 (ja) | 2010-04-09 | 2011-04-06 | Mdctベース複素予測ステレオ符号化 |
JP2015040746A Active JP6062467B2 (ja) | 2010-04-09 | 2015-03-02 | Mdctベース複素予測ステレオ符号化 |
JP2015184492A Active JP6197011B2 (ja) | 2010-04-09 | 2015-09-17 | Mdctベース複素予測ステレオ符号化 |
JP2015184493A Active JP6203799B2 (ja) | 2010-04-09 | 2015-09-17 | Mdctベース複素予測ステレオ符号化 |
JP2016242097A Active JP6437990B2 (ja) | 2010-04-09 | 2016-12-14 | Mdctベース複素予測ステレオ符号化 |
JP2017158657A Active JP6405008B2 (ja) | 2010-04-09 | 2017-08-21 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2017165152A Active JP6405010B2 (ja) | 2010-04-09 | 2017-08-30 | デコーダシステム及び復号方法 |
JP2018171632A Active JP6633707B2 (ja) | 2010-04-09 | 2018-09-13 | デコーダシステム及び復号方法 |
Family Applications After (11)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018214489A Active JP6665260B2 (ja) | 2010-04-09 | 2018-11-15 | 複素予測ステレオ符号化によりステレオ信号を提供するデコーダシステム及び復号方法 |
JP2019117104A Active JP6677846B2 (ja) | 2010-04-09 | 2019-06-25 | ステレオオーディオ信号を出力する装置及び方法 |
JP2019224406A Active JP6833961B2 (ja) | 2010-04-09 | 2019-12-12 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2019224408A Active JP6833962B2 (ja) | 2010-04-09 | 2019-12-12 | デコーダシステム及び復号方法 |
JP2020043882A Active JP6740496B2 (ja) | 2010-04-09 | 2020-03-13 | ステレオオーディオ信号を出力する装置及び方法 |
JP2020125072A Active JP6817486B2 (ja) | 2010-04-09 | 2020-07-22 | ステレオオーディオ信号を出力する装置及び方法 |
JP2020215098A Active JP6886069B2 (ja) | 2010-04-09 | 2020-12-24 | ステレオオーディオ信号を出力する装置及び方法 |
JP2021081465A Active JP6961854B2 (ja) | 2010-04-09 | 2021-05-13 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2021167954A Active JP7193603B2 (ja) | 2010-04-09 | 2021-10-13 | デコーダシステム、復号方法及びコンピュータプログラム |
JP2022196162A Active JP7451659B2 (ja) | 2010-04-09 | 2022-12-08 | デコーダシステム、デコーディング方法及びコンピュータプログラム |
JP2024033809A Pending JP2024056001A (ja) | 2010-04-09 | 2024-03-06 | デコーダシステム、デコーディング方法及びコンピュータプログラム |
Country Status (18)
Country | Link |
---|---|
US (19) | US9111530B2 (ja) |
EP (12) | EP3474278B1 (ja) |
JP (22) | JP5813094B2 (ja) |
KR (14) | KR101586198B1 (ja) |
CN (6) | CN102947880B (ja) |
AU (3) | AU2011237877B2 (ja) |
BR (6) | BR112012025863B1 (ja) |
CA (15) | CA2793140C (ja) |
DK (2) | DK2556504T3 (ja) |
ES (8) | ES2935962T3 (ja) |
IL (21) | IL303558B1 (ja) |
MX (3) | MX2012011530A (ja) |
MY (2) | MY184661A (ja) |
PL (2) | PL2556502T3 (ja) |
RU (6) | RU2559899C2 (ja) |
SG (4) | SG10201502597QA (ja) |
TR (2) | TR201901375T4 (ja) |
WO (3) | WO2011124616A1 (ja) |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
BR112012026324B1 (pt) * | 2010-04-13 | 2021-08-17 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V | Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável |
EP2705516B1 (en) * | 2011-05-04 | 2016-07-06 | Nokia Technologies Oy | Encoding of stereophonic signals |
US8798180B1 (en) * | 2011-11-16 | 2014-08-05 | Marvell International Ltd. | Method and apparatus for transmitting time domain signals over a network |
JP5949270B2 (ja) * | 2012-07-24 | 2016-07-06 | 富士通株式会社 | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム |
JP6113282B2 (ja) * | 2012-08-10 | 2017-04-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | パラメトリックオーディオオブジェクトコーディングのための残差コンセプトを採用するエンコーダ、デコーダ、システム、および方法 |
US9378748B2 (en) * | 2012-11-07 | 2016-06-28 | Dolby Laboratories Licensing Corp. | Reduced complexity converter SNR calculation |
RU2621003C2 (ru) | 2013-01-29 | 2017-05-30 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Адаптивное к тональности квантование низкой сложности аудиосигналов |
KR101729930B1 (ko) | 2013-02-14 | 2017-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법 |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
EP4300488A3 (en) | 2013-04-05 | 2024-02-28 | Dolby International AB | Stereo audio encoder and decoder |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US9666198B2 (en) | 2013-05-24 | 2017-05-30 | Dolby International Ab | Reconstruction of audio scenes from a downmix |
KR101895198B1 (ko) | 2013-05-24 | 2018-09-07 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
CN117012210A (zh) | 2013-05-24 | 2023-11-07 | 杜比国际公司 | 对音频场景进行解码的方法、装置及计算机可读介质 |
US9892737B2 (en) | 2013-05-24 | 2018-02-13 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
EP3712889A1 (en) | 2013-05-24 | 2020-09-23 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
WO2015008783A1 (ja) * | 2013-07-18 | 2015-01-22 | 日本電信電話株式会社 | 線形予測分析装置、方法、プログラム及び記録媒体 |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
BR112016004299B1 (pt) * | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
RU2665281C2 (ru) | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
CN110634494B (zh) * | 2013-09-12 | 2023-09-01 | 杜比国际公司 | 多声道音频内容的编码 |
KR20160072131A (ko) * | 2013-10-02 | 2016-06-22 | 슈트로밍스위스 게엠베하 | 다채널 신호의 다운믹스 및 다운믹스 신호의 업믹스 방법 및 장치 |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
JP6250073B2 (ja) * | 2014-01-24 | 2017-12-20 | 日本電信電話株式会社 | 線形予測分析装置、方法、プログラム及び記録媒体 |
EP2916319A1 (en) | 2014-03-07 | 2015-09-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for encoding of information |
MX353200B (es) * | 2014-03-14 | 2018-01-05 | Ericsson Telefon Ab L M | Método y aparato de codificación de audio. |
CN109036441B (zh) | 2014-03-24 | 2023-06-06 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
EP3127109B1 (en) | 2014-04-01 | 2018-03-14 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
KR102196190B1 (ko) | 2014-04-10 | 2020-12-30 | 주식회사 만도 | 차량용 전자제어 브레이크 장치의 피스톤 펌프 어셈블리 |
TR201900472T4 (tr) * | 2014-04-24 | 2019-02-21 | Nippon Telegraph & Telephone | Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı. |
EP3859734B1 (en) | 2014-05-01 | 2022-01-26 | Nippon Telegraph And Telephone Corporation | Sound signal decoding device, sound signal decoding method, program and recording medium |
EP3161821B1 (en) * | 2014-06-27 | 2018-09-26 | Dolby International AB | Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values |
CN110459229B (zh) * | 2014-06-27 | 2023-01-10 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
CN105336334B (zh) * | 2014-08-15 | 2021-04-02 | 北京天籁传音数字技术有限公司 | 多声道声音信号编码方法、解码方法及装置 |
CN107004421B (zh) * | 2014-10-31 | 2020-07-07 | 杜比国际公司 | 多通道音频信号的参数编码和解码 |
CN107004417B (zh) * | 2014-12-09 | 2021-05-07 | 杜比国际公司 | Mdct域错误掩盖 |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
JP6804528B2 (ja) * | 2015-09-25 | 2020-12-23 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
EP3405950B1 (en) * | 2016-01-22 | 2022-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Stereo audio coding with ild-based normalisation prior to mid/side decision |
CA2987808C (en) | 2016-01-22 | 2020-03-10 | Guillaume Fuchs | Apparatus and method for encoding or decoding an audio multi-channel signal using spectral-domain resampling |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US9959877B2 (en) * | 2016-03-18 | 2018-05-01 | Qualcomm Incorporated | Multi channel coding |
EP3246923A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
US10217467B2 (en) * | 2016-06-20 | 2019-02-26 | Qualcomm Incorporated | Encoding and decoding of interchannel phase differences between audio signals |
RU2628201C1 (ru) * | 2016-07-07 | 2017-08-15 | Самсунг Электроникс Ко., Лтд. | Способ адаптивного квантования для кодирования изображения радужной оболочки |
MX2019005214A (es) * | 2016-11-08 | 2019-06-24 | Fraunhofer Ges Forschung | Mezclador y metodo para mezclar al menos dos canales y codificador multicanal y decodificador multicanal. |
ES2938244T3 (es) * | 2016-11-08 | 2023-04-05 | Fraunhofer Ges Forschung | Aparato y procedimiento para codificar o decodificar una señal multicanal usando una ganancia lateral y una ganancia residual |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
KR20200106492A (ko) | 2017-11-20 | 2020-09-14 | 미합중국 (관리부서 : 미합중국 해군성) | 가요성 결정질 초박형 실리콘 태양 전지들 |
BR112020012648A2 (pt) | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
KR20200099560A (ko) | 2017-12-19 | 2020-08-24 | 돌비 인터네셔널 에이비 | 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템 |
TWI809289B (zh) | 2018-01-26 | 2023-07-21 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
CN114420139A (zh) * | 2018-05-31 | 2022-04-29 | 华为技术有限公司 | 一种下混信号的计算方法及装置 |
TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
DE102020210917B4 (de) * | 2019-08-30 | 2023-10-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein | Verbesserter M/S-Stereo-Codierer und -Decodierer |
JP7316384B2 (ja) * | 2020-01-09 | 2023-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
KR20230084244A (ko) * | 2020-10-09 | 2023-06-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
WO2023113490A1 (ko) * | 2021-12-15 | 2023-06-22 | 한국전자통신연구원 | 복소수 데이터를 이용한 오디오 처리 방법 및 그를 수행하는 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008516290A (ja) * | 2004-11-02 | 2008-05-15 | コーディング テクノロジーズ アクチボラゲット | 非相関信号を用いた音声符号化 |
WO2009141775A1 (en) * | 2008-05-23 | 2009-11-26 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US165587A (en) | 1875-07-13 | Improvement in vehicle-wheels | ||
GB8913758D0 (en) | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
RU2174714C2 (ru) | 1998-05-12 | 2001-10-10 | Научно-технический центр "Вычислительная техника" | Способ выделения основного тона |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US20050141722A1 (en) * | 2002-04-05 | 2005-06-30 | Koninklijke Philips Electronics N.V. | Signal processing |
DE10234130B3 (de) | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
JP4506141B2 (ja) | 2003-10-03 | 2010-07-21 | 日本電気株式会社 | 携帯無線端末 |
KR101106026B1 (ko) | 2003-10-30 | 2012-01-17 | 돌비 인터네셔널 에이비 | 오디오 신호 인코딩 또는 디코딩 |
US6980933B2 (en) | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
CN1914669A (zh) | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
DE102004007191B3 (de) | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004009955B3 (de) | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
CN1677490A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
TWI393121B (zh) | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
TWI498882B (zh) | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
US8423372B2 (en) * | 2004-08-26 | 2013-04-16 | Sisvel International S.A. | Processing of encoded signals |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
WO2006048814A1 (en) | 2004-11-02 | 2006-05-11 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
MX2007005261A (es) * | 2004-11-04 | 2007-07-09 | Koninkl Philips Electronics Nv | Codificacion y descodificacion de un conjunto de senales. |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
JP4809370B2 (ja) | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
KR100736607B1 (ko) | 2005-03-31 | 2007-07-09 | 엘지전자 주식회사 | 오디오 부호화 방법 및 장치 |
ATE421845T1 (de) * | 2005-04-15 | 2009-02-15 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
US7961890B2 (en) | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
WO2007004833A2 (en) | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US7684981B2 (en) | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
WO2007027051A1 (en) | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP5171256B2 (ja) | 2005-08-31 | 2013-03-27 | パナソニック株式会社 | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 |
US8259840B2 (en) | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7974287B2 (en) | 2006-02-23 | 2011-07-05 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
CN101484936B (zh) | 2006-03-29 | 2012-02-15 | 皇家飞利浦电子股份有限公司 | 音频解码 |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
KR101435893B1 (ko) | 2006-09-22 | 2014-09-02 | 삼성전자주식회사 | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 |
CA2874451C (en) * | 2006-10-16 | 2016-09-06 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
WO2008056775A1 (fr) * | 2006-11-10 | 2008-05-15 | Panasonic Corporation | Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre |
KR101434198B1 (ko) | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
EP2095365A4 (en) | 2006-11-24 | 2009-11-18 | Lg Electronics Inc | METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF |
DE102006055737A1 (de) * | 2006-11-25 | 2008-05-29 | Deutsche Telekom Ag | Verfahren zur skalierbaren Codierung von Stereo-Signalen |
JP5554065B2 (ja) | 2007-02-06 | 2014-07-23 | コーニンクレッカ フィリップス エヌ ヴェ | 複雑さの軽減されたパラメトリックステレオデコーダ |
ES2452348T3 (es) | 2007-04-26 | 2014-04-01 | Dolby International Ab | Aparato y procedimiento para sintetizar una señal de salida |
CN101067931B (zh) | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
US8385556B1 (en) | 2007-08-17 | 2013-02-26 | Dts, Inc. | Parametric stereo conversion system and method |
WO2009038512A1 (en) | 2007-09-19 | 2009-03-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Joint enhancement of multi-channel audio |
EP2082396A1 (en) | 2007-10-17 | 2009-07-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
CN101202043B (zh) * | 2007-12-28 | 2011-06-15 | 清华大学 | 音频信号的编码方法和装置与解码方法和装置 |
CN101903943A (zh) | 2008-01-01 | 2010-12-01 | Lg电子株式会社 | 用于处理信号的方法和装置 |
US8103005B2 (en) | 2008-02-04 | 2012-01-24 | Creative Technology Ltd | Primary-ambient decomposition of stereo audio signals using a complex similarity index |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
WO2009110738A2 (ko) | 2008-03-03 | 2009-09-11 | 엘지전자(주) | 오디오 신호 처리 방법 및 장치 |
JP5302980B2 (ja) * | 2008-03-04 | 2013-10-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 複数の入力データストリームのミキシングのための装置 |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
ES2379761T3 (es) * | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
KR101756834B1 (ko) | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
US8619856B2 (en) * | 2008-10-03 | 2013-12-31 | Qualcomm Incorporated | Video coding with large macroblocks |
KR101649376B1 (ko) * | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
CN105225667B (zh) | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
US8392200B2 (en) | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
US8346547B1 (en) * | 2009-05-18 | 2013-01-01 | Marvell International Ltd. | Encoder quantization architecture for advanced audio coding |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
JP5299327B2 (ja) * | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
BR112012026324B1 (pt) * | 2010-04-13 | 2021-08-17 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V | Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável |
US9378748B2 (en) * | 2012-11-07 | 2016-06-28 | Dolby Laboratories Licensing Corp. | Reduced complexity converter SNR calculation |
PL2943953T3 (pl) * | 2013-01-08 | 2017-07-31 | Dolby International Ab | Prognozowanie oparte na modelu w próbkowanym krytycznie banku filtrów |
CN117012210A (zh) * | 2013-05-24 | 2023-11-07 | 杜比国际公司 | 对音频场景进行解码的方法、装置及计算机可读介质 |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
-
2011
- 2011-04-06 RU RU2012143501/08A patent/RU2559899C2/ru active
- 2011-04-06 ES ES19184726T patent/ES2935962T3/es active Active
- 2011-04-06 CN CN201180028342.9A patent/CN102947880B/zh active Active
- 2011-04-06 EP EP18206652.2A patent/EP3474278B1/en active Active
- 2011-04-06 KR KR1020127029106A patent/KR101586198B1/ko active IP Right Grant
- 2011-04-06 CN CN201180025305.2A patent/CN103119647B/zh active Active
- 2011-04-06 RU RU2015121322A patent/RU2683175C2/ru active
- 2011-04-06 KR KR1020197002371A patent/KR102011793B1/ko active IP Right Grant
- 2011-04-06 WO PCT/EP2011/055369 patent/WO2011124616A1/en active Application Filing
- 2011-04-06 KR KR1020187001783A patent/KR101944328B1/ko active IP Right Grant
- 2011-04-06 KR KR1020147006732A patent/KR101698438B1/ko active IP Right Grant
- 2011-04-06 WO PCT/EP2011/055350 patent/WO2011124608A1/en active Application Filing
- 2011-04-06 KR KR1020147006735A patent/KR101698439B1/ko active IP Right Grant
- 2011-04-06 AU AU2011237877A patent/AU2011237877B2/en active Active
- 2011-04-06 SG SG10201502597QA patent/SG10201502597QA/en unknown
- 2011-04-06 CA CA2793140A patent/CA2793140C/en active Active
- 2011-04-06 SG SG2012069738A patent/SG184167A1/en unknown
- 2011-04-06 MY MYPI2016000052A patent/MY184661A/en unknown
- 2011-04-06 BR BR112012025863-0A patent/BR112012025863B1/pt active IP Right Grant
- 2011-04-06 ES ES20200782T patent/ES2935911T3/es active Active
- 2011-04-06 EP EP22188499.2A patent/EP4116969B1/en active Active
- 2011-04-06 TR TR2019/01375T patent/TR201901375T4/tr unknown
- 2011-04-06 WO PCT/EP2011/055374 patent/WO2011124621A1/en active Application Filing
- 2011-04-06 KR KR1020237017236A patent/KR20230074851A/ko not_active Application Discontinuation
- 2011-04-06 AU AU2011237882A patent/AU2011237882B2/en active Active
- 2011-04-06 CA CA3105050A patent/CA3105050C/en active Active
- 2011-04-06 AU AU2011237869A patent/AU2011237869B2/en active Active
- 2011-04-06 KR KR1020217001535A patent/KR20210008945A/ko not_active Application Discontinuation
- 2011-04-06 MX MX2012011530A patent/MX2012011530A/es active IP Right Grant
- 2011-04-06 JP JP2013503096A patent/JP5813094B2/ja active Active
- 2011-04-06 ES ES18206651T patent/ES2810824T3/es active Active
- 2011-04-06 CA CA2924315A patent/CA2924315C/en active Active
- 2011-04-06 EP EP11713259.7A patent/EP2556502B1/en active Active
- 2011-04-06 CA CA2793317A patent/CA2793317C/en active Active
- 2011-04-06 CA CA2921437A patent/CA2921437C/en active Active
- 2011-04-06 EP EP20184885.0A patent/EP3739577B1/en active Active
- 2011-04-06 CN CN201510245573.5A patent/CN104851427B/zh active Active
- 2011-04-06 MY MYPI2012004218A patent/MY164393A/en unknown
- 2011-04-06 ES ES11714256T patent/ES2712073T3/es active Active
- 2011-04-06 ES ES11713754T patent/ES2763367T3/es active Active
- 2011-04-06 CA CA3110542A patent/CA3110542C/en active Active
- 2011-04-06 DK DK11714256.2T patent/DK2556504T3/en active
- 2011-04-06 BR BR112012025878-8A patent/BR112012025878B1/pt active IP Right Grant
- 2011-04-06 EP EP22190159.8A patent/EP4120247A1/en active Pending
- 2011-04-06 IL IL303558A patent/IL303558B1/en unknown
- 2011-04-06 EP EP24170668.8A patent/EP4376000A2/en active Pending
- 2011-04-06 MX MX2012011532A patent/MX2012011532A/es active IP Right Grant
- 2011-04-06 CA CA3076786A patent/CA3076786C/en active Active
- 2011-04-06 CN CN201180023421.0A patent/CN102884570B/zh active Active
- 2011-04-06 SG SG10202104412WA patent/SG10202104412WA/en unknown
- 2011-04-06 CA CA3185301A patent/CA3185301A1/en active Pending
- 2011-04-06 TR TR2019/01336T patent/TR201901336T4/tr unknown
- 2011-04-06 KR KR1020197020021A patent/KR102168140B1/ko active IP Right Grant
- 2011-04-06 BR BR112012025868-0A patent/BR112012025868B1/pt active IP Right Grant
- 2011-04-06 CN CN201510437095.8A patent/CN105023578B/zh active Active
- 2011-04-06 ES ES20184885T patent/ES2936278T3/es active Active
- 2011-04-06 CA CA2988745A patent/CA2988745C/en active Active
- 2011-04-06 BR BR122019026130-0A patent/BR122019026130B1/pt active IP Right Grant
- 2011-04-06 CA CA3125378A patent/CA3125378C/en active Active
- 2011-04-06 KR KR1020177001234A patent/KR101823870B1/ko active IP Right Grant
- 2011-04-06 ES ES11713259T patent/ES2709755T3/es active Active
- 2011-04-06 DK DK11713259.7T patent/DK2556502T3/en active
- 2011-04-06 CA CA2793320A patent/CA2793320C/en active Active
- 2011-04-06 EP EP22188294.7A patent/EP4120246A1/en active Pending
- 2011-04-06 MX MX2012011528A patent/MX2012011528A/es active IP Right Grant
- 2011-04-06 ES ES18206652T patent/ES2831357T3/es active Active
- 2011-04-06 JP JP2013503104A patent/JP5814341B2/ja active Active
- 2011-04-06 IL IL286761A patent/IL286761B/en unknown
- 2011-04-06 EP EP11713754.7A patent/EP2556503B1/en active Active
- 2011-04-06 EP EP11714256.2A patent/EP2556504B1/en active Active
- 2011-04-06 KR KR1020157025399A patent/KR101698442B1/ko active IP Right Grant
- 2011-04-06 KR KR1020217031115A patent/KR102537360B1/ko active IP Right Grant
- 2011-04-06 CA CA2992917A patent/CA2992917C/en active Active
- 2011-04-06 KR KR1020127029113A patent/KR101437899B1/ko active IP Right Grant
- 2011-04-06 BR BR122019026166-0A patent/BR122019026166B1/pt active IP Right Grant
- 2011-04-06 IL IL311483A patent/IL311483A/en unknown
- 2011-04-06 IL IL295039A patent/IL295039B2/en unknown
- 2011-04-06 CA CA3040779A patent/CA3040779C/en active Active
- 2011-04-06 BR BR122019013299-2A patent/BR122019013299B1/pt not_active IP Right Cessation
- 2011-04-06 KR KR1020127029111A patent/KR101437896B1/ko active IP Right Grant
- 2011-04-06 SG SG10202101745XA patent/SG10202101745XA/en unknown
- 2011-04-06 US US13/638,898 patent/US9111530B2/en active Active
- 2011-04-06 CA CA3097372A patent/CA3097372C/en active Active
- 2011-04-06 RU RU2012144366/08A patent/RU2554844C2/ru active
- 2011-04-06 PL PL11713259T patent/PL2556502T3/pl unknown
- 2011-04-06 RU RU2012147499/08A patent/RU2525431C2/ru active
- 2011-04-06 US US13/638,901 patent/US9378745B2/en active Active
- 2011-04-06 US US13/638,900 patent/US9159326B2/en active Active
- 2011-04-06 PL PL11714256T patent/PL2556504T3/pl unknown
- 2011-04-06 JP JP2013503101A patent/JP5814340B2/ja active Active
- 2011-04-06 EP EP20200782.9A patent/EP3799043B8/en active Active
- 2011-04-06 CA CA3045686A patent/CA3045686C/en active Active
- 2011-04-06 KR KR1020197023095A patent/KR102207086B1/ko active IP Right Grant
- 2011-04-06 EP EP18206651.4A patent/EP3474277B1/en active Active
- 2011-04-06 CN CN201510245509.7A patent/CN104851426B/zh active Active
- 2011-04-06 EP EP19184726.8A patent/EP3582217B1/en active Active
-
2012
- 2012-09-12 IL IL221911A patent/IL221911A/en active IP Right Grant
- 2012-09-13 IL IL221962A patent/IL221962A/en active IP Right Grant
- 2012-10-09 IL IL222294A patent/IL222294A/en active IP Right Grant
-
2015
- 2015-03-02 JP JP2015040746A patent/JP6062467B2/ja active Active
- 2015-07-07 US US14/793,297 patent/US9892736B2/en active Active
- 2015-09-17 JP JP2015184492A patent/JP6197011B2/ja active Active
- 2015-09-17 JP JP2015184493A patent/JP6203799B2/ja active Active
-
2016
- 2016-05-01 IL IL245338A patent/IL245338A/en active IP Right Grant
- 2016-05-03 IL IL245444A patent/IL245444A/en active IP Right Grant
- 2016-06-01 US US15/170,100 patent/US9761233B2/en active Active
- 2016-12-14 JP JP2016242097A patent/JP6437990B2/ja active Active
-
2017
- 2017-02-20 IL IL250687A patent/IL250687B/en active IP Right Grant
- 2017-07-17 IL IL253522A patent/IL253522B/en active IP Right Grant
- 2017-08-07 US US15/670,709 patent/US10347260B2/en active Active
- 2017-08-14 IL IL253972A patent/IL253972B/en active IP Right Grant
- 2017-08-21 JP JP2017158657A patent/JP6405008B2/ja active Active
- 2017-08-30 JP JP2017165152A patent/JP6405010B2/ja active Active
- 2017-12-20 US US15/849,653 patent/US10283127B2/en active Active
- 2017-12-20 US US15/849,645 patent/US10276174B2/en active Active
- 2017-12-20 US US15/849,622 patent/US10283126B2/en active Active
-
2018
- 2018-02-28 IL IL25779218A patent/IL257792B/en active IP Right Grant
- 2018-09-13 JP JP2018171632A patent/JP6633707B2/ja active Active
- 2018-09-13 JP JP2018171542A patent/JP6633706B2/ja active Active
- 2018-11-15 JP JP2018214489A patent/JP6665260B2/ja active Active
- 2018-12-17 US US16/222,721 patent/US10360920B2/en active Active
-
2019
- 2019-02-11 IL IL264774A patent/IL264774B/en active IP Right Grant
- 2019-02-19 IL IL264905A patent/IL264905B/en active IP Right Grant
- 2019-03-11 RU RU2019106714A patent/RU2698154C1/ru active
- 2019-05-28 US US16/424,395 patent/US10586545B2/en active Active
- 2019-05-31 US US16/427,735 patent/US10475459B2/en active Active
- 2019-06-04 US US16/431,081 patent/US10475460B2/en active Active
- 2019-06-07 RU RU2019117738A patent/RU2717387C1/ru active
- 2019-06-17 IL IL267420A patent/IL267420B/en active IP Right Grant
- 2019-06-24 US US16/449,942 patent/US10553226B2/en active Active
- 2019-06-25 JP JP2019117104A patent/JP6677846B2/ja active Active
- 2019-09-23 IL IL269537A patent/IL269537B/en active IP Right Grant
- 2019-10-04 US US16/593,235 patent/US10734002B2/en active Active
- 2019-12-12 JP JP2019224406A patent/JP6833961B2/ja active Active
- 2019-12-12 JP JP2019224408A patent/JP6833962B2/ja active Active
-
2020
- 2020-02-16 IL IL272689A patent/IL272689B/en active IP Right Grant
- 2020-02-20 US US16/796,150 patent/US11264038B2/en active Active
- 2020-03-13 JP JP2020043882A patent/JP6740496B2/ja active Active
- 2020-06-23 IL IL275616A patent/IL275616B/en active IP Right Grant
- 2020-07-16 US US16/931,377 patent/US11217259B2/en active Active
- 2020-07-22 JP JP2020125072A patent/JP6817486B2/ja active Active
- 2020-12-24 JP JP2020215098A patent/JP6886069B2/ja active Active
-
2021
- 2021-01-18 IL IL280247A patent/IL280247B/en unknown
- 2021-01-28 IL IL280464A patent/IL280464B/en unknown
- 2021-05-13 JP JP2021081465A patent/JP6961854B2/ja active Active
- 2021-10-13 JP JP2021167954A patent/JP7193603B2/ja active Active
- 2021-12-23 US US17/560,295 patent/US11810582B2/en active Active
-
2022
- 2022-12-08 JP JP2022196162A patent/JP7451659B2/ja active Active
-
2023
- 2023-11-06 US US18/502,973 patent/US20240144940A1/en active Pending
-
2024
- 2024-03-06 JP JP2024033809A patent/JP2024056001A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008516290A (ja) * | 2004-11-02 | 2008-05-15 | コーディング テクノロジーズ アクチボラゲット | 非相関信号を用いた音声符号化 |
WO2009141775A1 (en) * | 2008-05-23 | 2009-11-26 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
Non-Patent Citations (2)
Title |
---|
HEIKO PURNHAGEN, ET AL.: "Technical Description of Proposed Unified Stereo Coding in USAC", ISO/IEC JTC1/SC29/WG11, MPEG2009/M16921, JPN5013006196, October 2009 (2009-10-01), pages 1 - 14, ISSN: 0004150262 * |
MAX NEUENDORF: "WD5 of USAC", ISO/IEC JTC1/SC29/WG11, MPEG2009/N11040, JPN5013006197, October 2009 (2009-10-01), pages 1 - 146, ISSN: 0004150263 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6405008B2 (ja) | デコーダシステム、復号方法及びコンピュータプログラム | |
AU2022202192B2 (en) | Audio Upmixer Operable in Prediction or Non-Prediction Mode | |
AU2019240610B2 (en) | Audio Upmixer Operable in Prediction or Non-Prediction Mode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6633706 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |