JP5292498B2 - 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 - Google Patents
周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 Download PDFInfo
- Publication number
- JP5292498B2 JP5292498B2 JP2012122890A JP2012122890A JP5292498B2 JP 5292498 B2 JP5292498 B2 JP 5292498B2 JP 2012122890 A JP2012122890 A JP 2012122890A JP 2012122890 A JP2012122890 A JP 2012122890A JP 5292498 B2 JP5292498 B2 JP 5292498B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- envelope
- time
- audio
- side information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007493 shaping process Methods 0.000 title description 5
- 230000005236 sound signal Effects 0.000 claims abstract description 68
- 238000000034 method Methods 0.000 claims description 50
- 230000002123 temporal effect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000257465 Echinoidea Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Apparatuses For Bulk Treatment Of Fruits And Vegetables And Apparatuses For Preparing Feeds (AREA)
Description
本開示の1つの特徴により、オーディオ信号のエンコーディング方法が提供され、本方法により、1以上のオーディオ信号がオーディオ情報とビットストリームをデコードするのに有用な該オーディオ情報に関するサイド情報とからなるビットストリームにエンコードされる。該エンコード処理には、1以上のオーディオ信号の各々を時間ブロックに分割し、デコードするときにブロックレートで制限される時間エンベロープ分解能をオーディオ情報が持つようなブロックレート以下の頻度で、少なくともいくつかのサイド情報を更新する処理が含まれる。少なくとも1つのオーディオ信号の時間エンベロープと、この少なくとも1つのオーディオ信号のそれぞれをデコードして復元したときの推定される時間エンベロープとの比較がなされる。復元の推定では、少なくともいくつかのオーディオ情報と、少なくともいくつかのサイド情報が用いられる。比較結果の表示は、デコードするときに、少なくともいくつかのオーディオ情報の時間エンベロープ分解能を改善するために有用である。
[周波数領域におけるウィナーフィルターの設計]
フィルター計算装置又は計算機能15−1から15−nまでの各々は、信号チャンネルの元の時間エンベロープをより正確に復元したものを取得するために必要な、時間領域における乗法的な変化を表す周波数領域でのFIRフィルターを特徴づけることが好ましい。このフィルター問題は少なくとも平方の問題として公式化することができ、しばしばウィナーフィルター設計と称される。例えば、X. Rong Liの、「Probability, Random Signals, and Statistics」CRC Press 1999年、ニューヨーク、423ページ参照のこと。ウィナーフィルター技法を適用することは、再整形フィルター情報をデコーダに伝達するために必要とされる付加ビットを減らす利点がある。ウィナーフィルターの一般的な応用は時間領域において設計・適用される。周波数領域の最小2乗フィルター設計問題は以下のように定義される。元の信号Y[k]のDFTスペクトル表現とそのような元のチャンネルX[k]の近似のDFTスペクトル表現が与えられ、式1の最小化するフィルター係数(am)のセットを計算する。Y[k]とX[k]は複素数であり、従って、一般にamもまた複素数となることに留意しなければならない。
式1は、式2に示すようにマトリックスを使った表現で表すこともできる
このようにして、式2の部分導関数をフィルター係数に関してゼロに設定することにより、最小化問題の解を示すことが簡単になり、式3で与えられる。
図2は、本発明の特徴を採用することのできるデコーダー又はデコーディング処理環境の例を示す。このようなエンコーダー又はエンコーディング処理は、図1の例に関連して説明したエンコーダー又はエンコーディング処理と協調して動作させるのに適切であろう。図1の構成により生成されたようなエンコードされたビットストリームは、適切な信号伝達様式又は信号記憶様式で受け取られ、エンコードされた情報をサイド情報とyes/noフラグ(ビットストリームに含まれる場合)とから分離するために必要なときにビットストリームをアンパックするビットストリームアンパッカー30に入力される。サイド情報には、図1のエンコーディングの構成に入力される1以上の入力信号のそれぞれの復元を改善するために用いられるフィルター係数のセットが含まれるようにすることが好ましい。
年3月28日出願、US2003/0187663Alとして、2003年10月2日に公開、に記載されたような他の周波数領域と時間領域の技術を採用してもよい。この出願は、そのすべてを参照として本明細書に編入するものとする。
[実施例]
本発明は、ハードウェア又はソフトウェア又はこれらの組み合わせ(例えばプログラマブルロジックアレー)により実施可能である。特に記述が無い場合は、本発明の一部として組み込まれるアルゴリズムは特定のコンピュータ又はその他の装置に本来的に結びついたものではない。特に、さまざまな汎用機でここに開示した記載のプログラムを用いてもよく、あるいは、必要な方法のステップを実行するためのもっと特化した装置(例えば集積回路)を組み立てたほうがもっと便利かもしれない。このように、本発明は、それぞれが少なくとも1つのプロセッサと、少なくとも1つのデータ記憶システム(揮発メモリ及び不揮発メモリ及び/又は記憶装置を含む)と、少なくとも1つの入力装置又は入力ポートと、少なくとも1つの出力装置からなる1以上のプログラム可能なコンピュータシステムで動作する1以上のコンピュータプログラムにより実行することができる。ここに記載した機能を実行し出力情報を出力するために入力データにプログラムコードが適用される。出力情報は、1以上の出力装置に既知の方法で適用される。
[参照としての編入]
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[AC−3]
ATSC標準A52/A:Digital Audio Compression Standard (AC-3), Revision A、Advanced Television Systems Committee、2001年8月20日。このA52/A書面は、ワールドワイドウェブhttp://www.atsc.orR/standards.html.にて参照することができる。
Steve Vernon /EEE Trans.による、1995年8月のConsumer Electronics,Vol.41,No.3、「Design and Implementation of AC-3 Coders」、
Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」、
Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」、
米国特許、5,583,962と、5,632,005と、5,633,981と、5,727,119と、6,021,386、
[AAC]
ISO/IEC IS-14496(パート3、オーディオ)、1996年、AAC ISO/IEC JTC1/SC29, 「Information technology-very low bitrate audio-visual coding」、
ISO/IEC 13818-7、International Standard、1997年「MPEG-2 advanced audio coding, AAC」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、1996年、Proc. of the 101st AES-Convention、「ISO/IEC MPEG-2 Advanced Audio Coding」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、Journal of the AES, Vol.45, No.10, October 1997, pp. 789-814、「ISO/IEC MPEG-2 Advanced Audio Coding」、
Karlheinz Brandenburgによる、Proc. of the AES 17th International Conference on High Quality Audio Coding, Florence, Italy, 1999、「MP3 and AAC explained」、及び、
G. A. Soulodre他による、J. Audio Eng. Soc, Vol.46, No.3, pp 164-177 March 1998、「Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs」、
[MPEG Intensity Stereo]
米国特許、5,323,396と、5,539,829と、5,606,618と、5,621,855、
米国公開特許出願US2001/0044713、
[空間的コーディング及びパラメトリックコーディング]
Davis他による2004年7月14日出願の米国暫定特許出願、S.N.60/588,256、表題「Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information」、
米国特許出願公開公報US2003/0026441、2003年2月6日公開、
米国特許出願公開公報US2003/0035553、2003年2月20日公開、
米国特許出願公開公報US2003/0219130(Baumgarte & Faller)、2003年11月27日公開、
Audio Engineering Society 論文5852、2003年3月、
国際公開公報WO03/090206、2003年10月30日公開、
国際公開公報WO03/090207、2003年10月30日公開、
国際公開公報WO03/090208、2003年10月30日公開、
国際公開公報WO03/007656、2003年1月22日公開、
Baumgarte他による、2003年12月25日に公開された、米国特許出願公開公報US2003/0236583Al、表題「Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals」、出願番号S.N.10/246,570、
Faller他による、Audio Engineering Society Convention Paper 5574, 112th Convention, Munich, May 2002、「Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression」、
Baumgarte他による、Audio Engineering Society Convention Paper 5575, 112th Convention, Munich, May 2002、「Why Binaural Cue Coding is Better than Intensity Stereo Coding」、
Baumgarte他による、Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, October 2002、「Design and Evaluatinof Binaural Cue Coding Schemes」、
Faller他による、IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New York, October 2001, pp.199-202、「Efficient Representation of Spatial Audio Using Perceptual Parametrization」、
Baumgarte他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1801-1804、「Estimation of Auditory Spatial Cues for Binaural Cue Coding」、
Faller他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1841II-1844、「Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio」、
Breebaart他による、Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, May 2004、「High-quality parametric spatial audio coding at low bitrates」、
Baumgarte他による、Audio Engineering Society Convention Paper 6060, 116th Convention, Berlin, May 2004、「Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing」、
Schuijers他による、Audio Engineering Society Convention Paper 6073, 116th Convention, Berlin, May 2004、「Low complexity parametric stereo coding」、
Engdegard他による、Audio Engineering Society Convention Paper 6074, 116th Convention, Berlin, May 2004、「Synthetic Ambience in Parametric Stereo Coding」、
[その他]
Herreによる米国特許5,812,971、表題「Enhanced Joint Stereo Coding Method Using Temporal Envelope Shaping」1998年9月22日付、
Herre他による、Audio Engineering Society Preprint 3799, 96th Convention, Amsterdam, 1994。
Claims (10)
- 少なくとも一つの出力オーディオ信号の時間エンベロープを再整形して、入力オーディオ信号の時間エンベロープに、より近似させるための方法であって、
a)ダウンミックスオーディオ信号及びエンベロープサイド情報を含む、空間的にエンコードされたビットストリームを受信することであって、
前記ダウンミックスオーディオ信号は、複数の時間スロットに分割されたオーディオ信号を含み、前記エンベロープサイド情報は、前記オーディオ信号に関連し、前記少なくとも一つの出力オーディオ信号の時間エンベロープの再整形において有用であり、
前記エンベロープサイド情報は、前記入力オーディオ信号のエンベロープと、前記ダウンミックスオーディオ信号から導出されたオーディオ信号のエンベロープとを比較することにより得られる情報を含み、前記ダウンミックスオーディオ信号は、少なくとも前記入力オーディオ信号からダウンミックスされている、前記空間的にエンコードされたビットストリームを受信すること、
b)前記空間的にエンコードされたビットストリームをデコードして、前記少なくとも一つの出力オーディオ信号を生成すること、
c)前記エンベロープサイド情報に従って、前記少なくとも一つの出力オーディオ信号の時間エンベロープを再整形して、前記入力オーディオ信号の時間エンベロープに、より近似させること
を含む方法。 - 前記複数の時間スロットの粒度は、前記ダウンミックスオーディオ信号のエンベロープについて、入力オーディオ信号のエンベロープに関連している、請求項1に記載の方法。
- 前記ビットストリームをデコードすることは、再整形フィルターの、前記エンベロープサイド情報との相関除去を制御することを含む、請求項1に記載の方法。
- 入力オーディオ信号のエンベロープと前記ダウンミックスオーディオ信号から導出された信号のエンベロープとの比較は、比較されたエンベロープのサイド情報の表示を含む、請求項1に記載の方法。
- 前記空間的にエンコードされたビットストリームは、一つ又は複数の入力オーディオ信号から構築されたビットストリームを含む、請求項1に記載の方法。
- 前記一つ又は複数の入力オーディオ信号は、複数チャンネル音場を含む、請求項5に記載の方法。
- 前記オーディオ信号が分割されている複数の時間スロットはそれぞれ、時間のブロックを含む、請求項1に記載の方法。
- 前記時間スロットの粒度は、前記時間のブロックのレートにより制限される分解能を備える、請求項7に記載の方法。
- 前記時間のブロックは、前記エンベロープサイド情報の分解能を制限するブロックレートを有する、請求項7に記載の方法。
- 前記ダウンミックスオーディオ信号から導出される信号は、前記入力オーディオ信号の推定されデコードされた復元を含む、請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US60483604P | 2004-08-25 | 2004-08-25 | |
US60/604,836 | 2004-08-25 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007529954A Division JP5038138B2 (ja) | 2004-08-25 | 2005-08-15 | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012177939A JP2012177939A (ja) | 2012-09-13 |
JP5292498B2 true JP5292498B2 (ja) | 2013-09-18 |
Family
ID=35636849
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007529954A Active JP5038138B2 (ja) | 2004-08-25 | 2005-08-15 | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
JP2012122890A Active JP5292498B2 (ja) | 2004-08-25 | 2012-05-30 | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007529954A Active JP5038138B2 (ja) | 2004-08-25 | 2005-08-15 | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
Country Status (15)
Country | Link |
---|---|
US (3) | US8255211B2 (ja) |
EP (4) | EP3279893B1 (ja) |
JP (2) | JP5038138B2 (ja) |
KR (3) | KR20120006077A (ja) |
CN (3) | CN102270453B (ja) |
AU (2) | AU2005280392B2 (ja) |
BR (3) | BR122018077099B1 (ja) |
CA (1) | CA2589623C (ja) |
ES (3) | ES2899286T3 (ja) |
IL (3) | IL181407A (ja) |
MX (1) | MX2007001948A (ja) |
MY (2) | MY151318A (ja) |
PL (3) | PL1784818T3 (ja) |
TW (3) | TWI498882B (ja) |
WO (1) | WO2006026161A2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI498882B (zh) * | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
US8577686B2 (en) * | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
TWI396188B (zh) | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
JP5507844B2 (ja) * | 2005-10-20 | 2014-05-28 | エルジー エレクトロニクス インコーポレイティド | マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置 |
WO2007083959A1 (en) * | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
CN104681030B (zh) | 2006-02-07 | 2018-02-27 | Lg电子株式会社 | 用于编码/解码信号的装置和方法 |
JP5222279B2 (ja) | 2006-03-28 | 2013-06-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネルオーディオ再構成における信号整形のための改善された方法 |
CN101790758B (zh) | 2007-07-13 | 2013-01-09 | 杜比实验室特许公司 | 用于控制音频信号的信号处理的设备和方法 |
CN101673545B (zh) * | 2008-09-12 | 2011-11-16 | 华为技术有限公司 | 一种编解码方法及装置 |
EP2214161A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
EP2402941B1 (en) * | 2009-02-26 | 2015-04-15 | Panasonic Intellectual Property Corporation of America | Channel signal generation apparatus |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
BR122019026166B1 (pt) | 2010-04-09 | 2021-01-05 | Dolby International Ab | sistema decodificador, aparelho e método para emitir um sinal de áudio estereofônico tendo um canal esquerdo e um canal direito e meio legível por computador não transitório |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
US9978379B2 (en) * | 2011-01-05 | 2018-05-22 | Nokia Technologies Oy | Multi-channel encoding and/or decoding using non-negative tensor factorization |
US9015042B2 (en) | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
WO2014023443A1 (en) | 2012-08-10 | 2014-02-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and method employing a residual concept for parametric audio object coding |
CN109509478B (zh) * | 2013-04-05 | 2023-09-05 | 杜比国际公司 | 音频处理装置 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
RU2744485C1 (ru) * | 2017-10-27 | 2021-03-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Ослабление шума в декодере |
JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
CN118414661A (zh) * | 2021-12-20 | 2024-07-30 | 杜比国际公司 | Qmf域中的ivas spar滤波器组 |
KR102446720B1 (ko) * | 2022-02-18 | 2022-09-26 | 오드컨셉 주식회사 | 이미지 복원 모델, 및 이미지 복원 모델의 학습 방법 |
KR102423552B1 (ko) * | 2022-02-28 | 2022-07-21 | 오드컨셉 주식회사 | 적대적 생성 신경망으로 구성된 상품 이미지 복원 및 합성 모델, 및 상품 이미지 복원 및 합성 모델의 학습 방법 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4875095A (en) * | 1987-06-30 | 1989-10-17 | Kokusai Denshin Denwa Kabushiki Kaisha | Noise-shaping predictive coding system |
US4943855A (en) * | 1988-07-22 | 1990-07-24 | At&T Bell Laboratories | Progressive sub-band image coding system |
US6289308B1 (en) | 1990-06-01 | 2001-09-11 | U.S. Philips Corporation | Encoded wideband digital transmission signal and record carrier recorded with such a signal |
US5539829A (en) | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
NL9000338A (nl) | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
EP0506680B1 (en) * | 1989-10-11 | 1997-12-29 | Cias Inc. | Optimal error-detecting and error-correcting code and apparatus |
ES2087522T3 (es) | 1991-01-08 | 1996-07-16 | Dolby Lab Licensing Corp | Descodificacion/codificacion para campos sonoros multidimensionales. |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
NL9100173A (nl) | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
DE4320990B4 (de) * | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
DE4331376C1 (de) * | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
BE1007616A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met vereenvoudigde broncodering. |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3365874B2 (ja) | 1994-10-05 | 2003-01-14 | 富士写真フイルム株式会社 | キノンジアジドの合成法およびこれを含むポジ型レジスト |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3747492B2 (ja) * | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
JP4132109B2 (ja) * | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
GB9614209D0 (en) * | 1996-07-05 | 1996-09-04 | Univ Manchester | Speech synthesis system |
JP3259759B2 (ja) * | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
TW382094B (en) * | 1997-12-11 | 2000-02-11 | Inventec Corp | Base tone synchronous differential coding method and device thereof |
US6529730B1 (en) * | 1998-05-15 | 2003-03-04 | Conexant Systems, Inc | System and method for adaptive multi-rate (AMR) vocoder rate adaption |
WO2002021794A2 (en) * | 2000-09-08 | 2002-03-14 | Findthedot,Inc. | A method and system of connecting printed media to electronic information as a response to a request |
US6614365B2 (en) * | 2000-12-14 | 2003-09-02 | Sony Corporation | Coding device and method, decoding device and method, and recording medium |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4399185B2 (ja) * | 2002-04-11 | 2010-01-13 | パナソニック株式会社 | 符号化装置および復号化装置 |
CN1308913C (zh) * | 2002-04-11 | 2007-04-04 | 松下电器产业株式会社 | 编码设备、解码设备及其方法 |
US7215787B2 (en) | 2002-04-17 | 2007-05-08 | Dirac Research Ab | Digital audio precompensation |
BR0304540A (pt) | 2002-04-22 | 2004-07-20 | Koninkl Philips Electronics Nv | Métodos para codificar um sinal de áudio, e para decodificar um sinal de áudio codificado, codificador para codificar um sinal de áudio, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenagem, e, decodificador para decodificar um sinal de áudio codificado |
BR0304542A (pt) | 2002-04-22 | 2004-07-20 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio |
WO2003090206A1 (en) | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
US20040086130A1 (en) | 2002-05-03 | 2004-05-06 | Eid Bradley F. | Multi-channel sound processing systems |
BRPI0305434B1 (pt) | 2002-07-12 | 2017-06-27 | Koninklijke Philips Electronics N.V. | Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal |
EP1527441B1 (en) * | 2002-07-16 | 2017-09-06 | Koninklijke Philips N.V. | Audio coding |
US20040083417A1 (en) * | 2002-10-29 | 2004-04-29 | Lane Richard D. | Multimedia transmission using variable error coding rate based on data importance |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US8983834B2 (en) | 2004-03-01 | 2015-03-17 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7391870B2 (en) | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
MX2007000391A (es) * | 2004-07-14 | 2007-06-25 | Koninkl Philips Electronics Nv | Conversion de canal de audio. |
TWI498882B (zh) | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
US10113858B2 (en) | 2015-08-19 | 2018-10-30 | Medlumics S.L. | Distributed delay-line for low-coherence interferometry |
US9996281B2 (en) | 2016-03-04 | 2018-06-12 | Western Digital Technologies, Inc. | Temperature variation compensation |
CN113535073B (zh) | 2020-04-22 | 2024-04-16 | 伊姆西Ip控股有限责任公司 | 管理存储单元的方法、电子设备和计算机可读存储介质 |
-
2005
- 2005-08-12 TW TW101147782A patent/TWI498882B/zh active
- 2005-08-12 TW TW101147783A patent/TWI497485B/zh active
- 2005-08-12 TW TW094127540A patent/TWI393120B/zh active
- 2005-08-15 EP EP17193794.9A patent/EP3279893B1/en active Active
- 2005-08-15 CN CN201110236398.5A patent/CN102270453B/zh active Active
- 2005-08-15 BR BR122018077099-6A patent/BR122018077099B1/pt active IP Right Grant
- 2005-08-15 CN CN2005800275874A patent/CN101006494B/zh active Active
- 2005-08-15 CN CN201210467810.9A patent/CN102968996B/zh active Active
- 2005-08-15 BR BR122018077089A patent/BR122018077089B8/pt active IP Right Grant
- 2005-08-15 MX MX2007001948A patent/MX2007001948A/es active IP Right Grant
- 2005-08-15 ES ES17193794T patent/ES2899286T3/es active Active
- 2005-08-15 PL PL05786297T patent/PL1784818T3/pl unknown
- 2005-08-15 BR BRPI0514650-0A patent/BRPI0514650B1/pt active Search and Examination
- 2005-08-15 CA CA2589623A patent/CA2589623C/en active Active
- 2005-08-15 EP EP22155826.5A patent/EP4036914A1/en active Pending
- 2005-08-15 ES ES21195475T patent/ES2923661T3/es active Active
- 2005-08-15 KR KR1020117029616A patent/KR20120006077A/ko not_active Application Discontinuation
- 2005-08-15 PL PL21195475.5T patent/PL3940697T3/pl unknown
- 2005-08-15 KR KR1020117011055A patent/KR101139880B1/ko active IP Right Grant
- 2005-08-15 US US11/660,893 patent/US8255211B2/en active Active
- 2005-08-15 JP JP2007529954A patent/JP5038138B2/ja active Active
- 2005-08-15 ES ES05786297.1T patent/ES2658824T3/es active Active
- 2005-08-15 EP EP21195475.5A patent/EP3940697B1/en active Active
- 2005-08-15 KR KR1020077003692A patent/KR101253699B1/ko active IP Right Grant
- 2005-08-15 PL PL17193794T patent/PL3279893T3/pl unknown
- 2005-08-15 EP EP05786297.1A patent/EP1784818B1/en active Active
- 2005-08-15 WO PCT/US2005/029157 patent/WO2006026161A2/en active Application Filing
- 2005-08-15 AU AU2005280392A patent/AU2005280392B2/en active Active
- 2005-08-23 MY MYPI20053940 patent/MY151318A/en unknown
- 2005-08-23 MY MYPI2012000244A patent/MY163042A/en unknown
-
2007
- 2007-02-18 IL IL181407A patent/IL181407A/en active IP Right Grant
- 2007-07-31 US US11/888,646 patent/US20080040103A1/en not_active Abandoned
- 2007-07-31 US US11/888,651 patent/US7945449B2/en active Active
-
2009
- 2009-10-12 IL IL201469A patent/IL201469A/en active IP Right Grant
-
2011
- 2011-02-18 AU AU2011200680A patent/AU2011200680C1/en active Active
- 2011-07-18 IL IL214135A patent/IL214135A/en active IP Right Grant
-
2012
- 2012-05-30 JP JP2012122890A patent/JP5292498B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5292498B2 (ja) | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 | |
JP4909272B2 (ja) | 空間オーディオコーディングにおける複数チャンネルデコリレーション | |
MX2007001969A (es) | Ensamble de guia de fruta de carriles multiples que tiene extremos de reborde integrales para un extractor de jugo y metodos relacionados. | |
AU2012205170B2 (en) | Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130308 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5292498 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |