JP2005535940A - スケーラブルエンコーディングのための方法および装置ならびにスケーラブルデコーディングのための方法および装置 - Google Patents
スケーラブルエンコーディングのための方法および装置ならびにスケーラブルデコーディングのための方法および装置 Download PDFInfo
- Publication number
- JP2005535940A JP2005535940A JP2004531856A JP2004531856A JP2005535940A JP 2005535940 A JP2005535940 A JP 2005535940A JP 2004531856 A JP2004531856 A JP 2004531856A JP 2004531856 A JP2004531856 A JP 2004531856A JP 2005535940 A JP2005535940 A JP 2005535940A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- scaling
- bits
- subscaling
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000003595 spectral effect Effects 0.000 claims abstract description 275
- 238000001228 spectrum Methods 0.000 claims abstract description 25
- 230000000873 masking effect Effects 0.000 claims description 90
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 description 33
- 230000006870 function Effects 0.000 description 23
- 239000011159 matrix material Substances 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 9
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Discrete Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
α=arctan[w(N/2−1−k)/w(N/2+k)]
(x,y)→(x,y+xsinα)
(x,y)→(x,y+r(xsinα))
(x’,y’)→(x’,y’−r((xsinα))
Claims (21)
- オーディオおよび/またはビデオ情報を含む信号のスペクトルをスケーラブルエンコードするための装置であって、スペクトルは2進スペクトル値を含み、
1つのバンド中の2進スペクトル値の第1の数の特定オーダのビットを用いて第1のサブスケーリングレイヤを生成するためおよび2進スペクトル値の第2の数の特定オーダのビットを用いて第2のサブスケーリングレイヤを生成するための手段(102)であり、第1の数は、1以上かつバンド中の2進スペクトル値の総数未満であり、生成するための手段(102)は、2進スペクトル値の第2の数を、該数が1以上かつバンド中の2進スペクトル値の総数未満となるように選択するように、そしてさらに、スペクトル値の第2の数を、該数が2進スペクトル値の第1の数に含まれていない少なくとも1つの2進スペクトル値を含むように決定するように実施される手段(102)と、
エンコードされた信号を形成するための手段(106)であり、第1および第2のサブスケーリングレイヤ(113a,113b)が互いに別個にデコードできるように、第1のサブスケーリングレイヤおよび第2のサブスケーリングレイヤを、エンコードされた信号中に含めるように実施される手段(106)とを含む装置。 - バンド中の特定のオーダと異なるオーダを有するすべてのビットを用いてフルスケーリングレイヤを生成するための手段をさらに含み、
フルスケーリングレイヤが第1および第2のサブスケーリングレイヤ(113a,113b)とは独立してデコード可能になるように、フルスケーリングレイヤをビットストリーム中に含めるように、形成するための手段(106)がさらに実施される請求項1に記載の装置。 - 2進スペクトル値が量子化され、
バンドについての心理音響マスキング閾値の最重要ビットのオーダを計算するための手段(84)と、
2進スペクトル値のビットのスケーリングレイヤを定義するための手段(604)とをさらに含み、スケーリングレイヤは、2進スペクトル値のビットを含み、該ビットのオーダは、バンドについての心理音響マスキング閾値の最重要ビットのオーダとは特定の差があり、またはビットのオーダは、これらのバンドについての心理音響マスキング閾値の最重要ビットのオーダに等しい請求項1または2に記載の装置。 - 第1および第2のサブスケーリングレイヤ(113a,113b)を生成するための手段(102)は、2進スペクトル値のビットを特定オーダのビットとして用いるように実施され、バンドにおける心理音響マスキング閾値の最重要ビットのオーダとの差は、「+1」、「0」および/または「−1」に等しい請求項3に記載の装置。
- 心理音響マスキング閾値の最重要ビットオーダを計算するための手段(84)は、バンド中の各スペクトル値について最重要ビットのオーダを決定するようにまたはバンド全体について心理音響マスキング閾値の最重要ビットのオーダを決定するように実施される請求項3または4に記載の装置。
- 形成するための手段(106)は、心理音響マスキング閾値についての情報を副次的情報(110)として、エンコードされた信号中に含ませるようにさらに実施される請求項3〜5のいずれか1項に記載の装置。
- 第1のサブスケーリングレイヤは、第2のサブスケーリングレイヤの前にデコード可能であり、
第1および第2のサブスケーリングレイヤを生成するための手段(102)は、バンドについての最大精度利得をそれにより達成できるスペクトル値を2進スペクトル値の第1の数について選択するように実施される先行請求項のいずれか1項に記載の装置。 - 第1のサブスケーリングレイヤは、第2のサブスケーリングレイヤの前にデコード可能であり、
第1および第2のサブスケーリングレイヤを生成するための手段(102)は、第1のサブスケーリングレイヤのために、より高いスケーリングレイヤのビットにより表される、バンド中のスペクトル値についての心理音響マスキング閾値との最大の差を有する2進スペクトル値を用いるように実施される請求項1ないし7のいずれか1項に記載の装置。 - 第1および第2のサブスケーリングレイヤを生成するための手段(102)は、第1のサブスケーリングレイヤのために、より高いスケーリングレイヤのビットにより表される、バンド中で最小の量子化されたスペクトル値である2進スペクトル値を用いるように実施される先行請求項のいずれか1項に記載の装置。
- スペクトル値は、整数MDCTにより信号の時間サンプル値から生成されている先行請求項のいずれか1項に記載の装置。
- スペクトル値は、心理音響および/または心理光学モデル(82)を用いて量子化されている請求項1または2に記載の装置。
- 第1および第2のサブスケーリングレイヤを生成するための手段(102)は、バンド中のビットの一定の特定オーダを用いるように実施される請求項11に記載の装置。
- 特定オーダは、量子化された2進スペクトル値のビットの最も重要でないオーダを含む請求項11または12に記載の装置。
- 1つのバンドがm個のスペクトル値を含み、
mは、2以上であり、
第1および第2のサブスケーリングレイヤを生成するための手段(102)は、サブスケーリングレイヤの第1および第2の数を、それらの数が最大でmに等しく最小で1に等しくなるように計算するように実施され、m個のサブスケーリングレイヤが存在する場合に、各サブスケーリングレイヤが、正確に1つのスペクトル値の特定オーダの1つのビットを含み、1つのスペクトル値が、特定オーダについて正確に1つのサブスケーリングレイヤ中にのみ存在する先行請求項のいずれか1項に記載の装置。 - mは、4に等しい請求項14に記載の装置。
- 第1および第2のサブスケーリングレイヤを生成するための手段(102)は、特定オーダの量子化されたスペクトル値の第1および/または第2の数のビットの算術エンコーディングを実行するように実施される先行請求項のいずれか1項に記載の装置。
- 第1および第2のサブスケーリングレイヤを含むエンコードされた信号をスケーラブルデコードするための装置であって、第1のサブスケーリングレイヤは、1つのバンド中の2進スペクトル値の第1の数の特定オーダのビットを含んでおり、第2のサブスケーリングレイヤは、バンド中の2進スペクトル値の第2の数の特定オーダのビットを含んでおり、さらに第2の数は、第1の数には含まれない少なくとも1つのスペクトル値を含んでおり、
第1のサブスケーリングレイヤをエンコードされた信号からおよび第2のサブスケーリングレイヤをエンコードされた信号から抽出するための手段(704)と、
バンド中の2進量子化されたスペクトル値の特定オーダのビットを決定するように、第1のサブスケーリングレイヤおよび第2のサブスケーリングレイヤを処理するための手段とを含む装置。 - 第1のサブスケーリングレイヤのための2進スペクトル値の第1の数は、1つのバンドについて最大精度利得を達成するように選択され、
抽出のための手段(704)は、第2のサブスケーリングレイヤの前に、第1のサブスケーリングレイヤを抽出するように実施される請求項17に記載の装置。 - オーディオおよび/またはビデオ情報を含む信号のスペクトルをスケーラブルエンコードするための方法であって、スペクトルは2進スペクトル値を含み、
1つのバンド中の2進スペクトル値の第1の数の特定オーダのビットを用いて第1のサブスケーリングレイヤを生成するためおよび2進スペクトル値の第2の数の特定オーダのビットを用いて第2のサブスケーリングレイヤを生成するためのステップ(102)であり、第1の数は、1以上かつバンド中の2進スペクトル値の総数未満であり、生成するための手段(102)は、2進スペクトル値の第2の数を、該数が1以上かつバンド中の2進スペクトル値の総数未満となるように選択するように、そしてさらに、スペクトル値の第2の数を、該数が2進スペクトル値の第1の数に含まれていない少なくとも1つの2進スペクトル値を含むように決定するように実施されるステップ(102)と、
エンコードされた信号を形成するためのステップ(106)であり、形成するための手段は、第1および第2のサブスケーリングレイヤ(113a,113b)が互いに別個にデコードできるように、第1のサブスケーリングレイヤおよび第2のサブスケーリングレイヤを、エンコードされた信号中に含めるように実施されるステップ(106)とを含む方法。 - 第1および第2のサブスケーリングレイヤを含むエンコードされた信号をスケーラブルデコードするための方法であって、第1のサブスケーリングレイヤは、1つのバンド中の2進スペクトル値の第1の数の特定オーダのビットを含んでおり、第2のサブスケーリングレイヤは、バンド中の2進スペクトル値の第2の数の特定オーダのビットを含んでおり、さらに第2の数は、第1の数には含まれない少なくとも1つのスペクトル値を含んでおり、
第1のサブスケーリングレイヤをエンコードされた信号からおよび第2のサブスケーリングレイヤをエンコードされた信号から抽出するステップ(704)と、
バンド中の2進量子化されたスペクトル値の特定オーダのビットを決定するように、第1のサブスケーリングレイヤおよび第2のサブスケーリングレイヤを処理するステップとを含む方法。 - コンピュータプログラムであって、コンピュータ上で実行される場合に、請求項19または請求項20に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10236694A DE10236694A1 (de) | 2002-08-09 | 2002-08-09 | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
PCT/EP2003/008623 WO2004021710A2 (de) | 2002-08-09 | 2003-08-04 | Vorrichtung und verfahren zum skalierbaren codieren und vorrichtung und verfahren zum skalierbaren decodieren eines audiosignales |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005535940A true JP2005535940A (ja) | 2005-11-24 |
JP4043476B2 JP4043476B2 (ja) | 2008-02-06 |
Family
ID=30775133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004531856A Expired - Lifetime JP4043476B2 (ja) | 2002-08-09 | 2003-08-04 | スケーラブルエンコーディングのための方法および装置ならびにスケーラブルデコーディングのための方法および装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7343287B2 (ja) |
EP (1) | EP1502255B1 (ja) |
JP (1) | JP4043476B2 (ja) |
CN (1) | CN1332373C (ja) |
AU (1) | AU2003250209A1 (ja) |
DE (1) | DE10236694A1 (ja) |
HK (1) | HK1072122A1 (ja) |
WO (1) | WO2004021710A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
US8095360B2 (en) | 2006-03-20 | 2012-01-10 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
DE10129240A1 (de) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
ATE543179T1 (de) | 2002-09-04 | 2012-02-15 | Microsoft Corp | Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
US7822150B2 (en) * | 2003-03-15 | 2010-10-26 | Alcatel-Lucent Usa Inc. | Spherical decoder for wireless communications |
JP4486646B2 (ja) * | 2003-05-28 | 2010-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム |
KR100885437B1 (ko) * | 2003-09-29 | 2009-02-24 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 시간 도메인에서 주파수 도메인으로 그리고 그 반대로디지털 신호를 변환하는 방법 |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
KR100537517B1 (ko) * | 2004-01-13 | 2005-12-19 | 삼성전자주식회사 | 오디오 데이타 변환 방법 및 장치 |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
EP1780895B1 (en) * | 2004-07-28 | 2020-07-01 | III Holdings 12, LLC | Signal decoding apparatus |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
DE102004041418A1 (de) * | 2004-08-26 | 2006-03-09 | Micronas Gmbh | Verfahren zur Codierung eines ersten und zweiten Datenwortes und Verfahren zur Decodierung eines codierten Datenwortes |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
JP5101292B2 (ja) | 2004-10-26 | 2012-12-19 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整 |
KR100685992B1 (ko) | 2004-11-10 | 2007-02-23 | 엘지전자 주식회사 | 디지털 방송 수신기에서 채널 전환시 정보 출력 방법 |
JP5542306B2 (ja) * | 2005-01-11 | 2014-07-09 | コーニンクレッカ フィリップス エヌ ヴェ | オーディオ信号のスケーラブル符号化及び復号 |
TWI397903B (zh) * | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
EA026063B1 (ru) * | 2005-04-18 | 2017-02-28 | Басф Се | Сополимер, синтезированный из по меньшей мере трех различных моноэтиленненасыщенных мономеров |
JP5191886B2 (ja) * | 2005-06-03 | 2013-05-08 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サイド情報を有するチャンネルの再構成 |
CN101199005B (zh) * | 2005-06-17 | 2011-11-09 | 松下电器产业株式会社 | 后置滤波器、解码装置以及后置滤波处理方法 |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
US7933337B2 (en) * | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
KR100738077B1 (ko) * | 2005-09-28 | 2007-07-12 | 삼성전자주식회사 | 계층적 오디오 부호화 및 복호화 장치와 방법 |
EP1949693B1 (en) * | 2005-10-12 | 2012-04-18 | Samsung Electronics Co., Ltd. | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
JP5185254B2 (ja) * | 2006-04-04 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Mdct領域におけるオーディオ信号音量測定と改良 |
NO345590B1 (no) | 2006-04-27 | 2021-05-03 | Dolby Laboratories Licensing Corp | Audioforsterkningsregulering ved bruk av spesifikk lydstyrkebasert hørehendelsesdeteksjon |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
EP1855271A1 (en) * | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for re-encoding signals |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
BRPI0717484B1 (pt) | 2006-10-20 | 2019-05-21 | Dolby Laboratories Licensing Corporation | Método e aparelho para processar um sinal de áudio |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
WO2008114080A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | Audio decoding |
ES2377719T3 (es) * | 2007-07-13 | 2012-03-30 | Dolby Laboratories Licensing Corporation | Procesamiento de audio utilizando un análisis de escenas auditivas y oblicuidad espectral. |
EP2193348A1 (en) * | 2007-09-28 | 2010-06-09 | Voiceage Corporation | Method and device for efficient quantization of transform information in an embedded speech and audio codec |
KR101238239B1 (ko) * | 2007-11-06 | 2013-03-04 | 노키아 코포레이션 | 인코더 |
US8315398B2 (en) * | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
BR122021003142B1 (pt) | 2008-07-11 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
EP2237269B1 (en) * | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
EP2306456A1 (en) | 2009-09-04 | 2011-04-06 | Thomson Licensing | Method for decoding an audio signal that has a base layer and an enhancement layer |
EP2524371B1 (en) * | 2010-01-12 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
US9210442B2 (en) | 2011-01-12 | 2015-12-08 | Google Technology Holdings LLC | Efficient transform unit representation |
US9380319B2 (en) | 2011-02-04 | 2016-06-28 | Google Technology Holdings LLC | Implicit transform unit representation |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
AR085361A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
JP5712288B2 (ja) * | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
TWI476760B (zh) | 2011-02-14 | 2015-03-11 | Fraunhofer Ges Forschung | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 |
US9015042B2 (en) | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US8838442B2 (en) * | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US10515643B2 (en) * | 2011-04-05 | 2019-12-24 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder, decoder, program, and recording medium |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9225310B1 (en) * | 2012-11-08 | 2015-12-29 | iZotope, Inc. | Audio limiter system and method |
US9967559B1 (en) | 2013-02-11 | 2018-05-08 | Google Llc | Motion vector dependent spatial transformation in video coding |
US9544597B1 (en) | 2013-02-11 | 2017-01-10 | Google Inc. | Hybrid transform in video encoding and decoding |
US9674530B1 (en) | 2013-04-30 | 2017-06-06 | Google Inc. | Hybrid transforms in video coding |
US9613634B2 (en) * | 2014-06-19 | 2017-04-04 | Yang Gao | Control of acoustic echo canceller adaptive filter for speech enhancement |
US9565451B1 (en) | 2014-10-31 | 2017-02-07 | Google Inc. | Prediction dependent transform coding |
US9742780B2 (en) * | 2015-02-06 | 2017-08-22 | Microsoft Technology Licensing, Llc | Audio based discovery and connection to a service controller |
US9769499B2 (en) | 2015-08-11 | 2017-09-19 | Google Inc. | Super-transform video coding |
US10277905B2 (en) | 2015-09-14 | 2019-04-30 | Google Llc | Transform selection for non-baseband signal coding |
US9807423B1 (en) | 2015-11-24 | 2017-10-31 | Google Inc. | Hybrid transform scheme for video coding |
EP3616196A4 (en) * | 2017-04-28 | 2021-01-20 | DTS, Inc. | AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS |
US11272207B2 (en) * | 2017-06-12 | 2022-03-08 | Futurewei Technologies, Inc. | Selection and signaling of motion vector (MV) precisions |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11122297B2 (en) | 2019-05-03 | 2021-09-14 | Google Llc | Using border-aligned block functions for image compression |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
GB9703441D0 (en) | 1997-02-19 | 1997-04-09 | British Tech Group | Progressive block-based coding for image compression |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
DE19742201C1 (de) | 1997-09-24 | 1999-02-04 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
DE19804564A1 (de) * | 1998-02-05 | 1999-08-12 | Fraunhofer Ges Forschung | Kommunikationsnetz, Verfahren zum Übertragen eines Signals, Netzverbindungseinheit und Verfahren zum Anpassen der Datenrate eines skalierten Datenstroms |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
DE10007171A1 (de) | 2000-02-17 | 2001-08-30 | Siemens Ag | Verfahren und Anordnung zur Codierung bzw. zur Codierung und Decodierung einer Zahlenfolge |
-
2002
- 2002-08-09 DE DE10236694A patent/DE10236694A1/de not_active Ceased
-
2003
- 2003-08-04 WO PCT/EP2003/008623 patent/WO2004021710A2/de active Application Filing
- 2003-08-04 EP EP03790855.5A patent/EP1502255B1/de not_active Expired - Lifetime
- 2003-08-04 AU AU2003250209A patent/AU2003250209A1/en not_active Abandoned
- 2003-08-04 CN CNB038190559A patent/CN1332373C/zh not_active Expired - Lifetime
- 2003-08-04 JP JP2004531856A patent/JP4043476B2/ja not_active Expired - Lifetime
- 2003-08-07 US US10/636,149 patent/US7343287B2/en active Active
-
2005
- 2005-06-08 HK HK05104838.3A patent/HK1072122A1/xx not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8095360B2 (en) | 2006-03-20 | 2012-01-10 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
Also Published As
Publication number | Publication date |
---|---|
DE10236694A1 (de) | 2004-02-26 |
AU2003250209A8 (en) | 2004-03-19 |
WO2004021710A2 (de) | 2004-03-11 |
JP4043476B2 (ja) | 2008-02-06 |
EP1502255B1 (de) | 2014-11-19 |
CN1675683A (zh) | 2005-09-28 |
HK1072122A1 (en) | 2005-08-12 |
EP1502255A2 (de) | 2005-02-02 |
US20040184537A1 (en) | 2004-09-23 |
AU2003250209A1 (en) | 2004-03-19 |
WO2004021710A3 (de) | 2004-04-22 |
US7343287B2 (en) | 2008-03-11 |
CN1332373C (zh) | 2007-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4043476B2 (ja) | スケーラブルエンコーディングのための方法および装置ならびにスケーラブルデコーディングのための方法および装置 | |
US7275036B2 (en) | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data | |
JP4081447B2 (ja) | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 | |
EP2301020B1 (en) | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme | |
JP5705964B2 (ja) | オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法 | |
JP5820464B2 (ja) | オーディオまたはビデオエンコーダ、オーディオまたはビデオデコーダ、及び予測方向可変の予測を使用したマルチチャンネルオーディオまたはビデオ信号処理方法 | |
EP0785631B1 (en) | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain | |
EP2255358B1 (en) | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum | |
EP2016583B1 (en) | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream | |
EP1852851A1 (en) | An enhanced audio encoding/decoding device and method | |
US20100274555A1 (en) | Audio Coding Apparatus and Method Thereof | |
US20110145003A1 (en) | Simultaneous Time-Domain and Frequency-Domain Noise Shaping for TDAC Transforms | |
NO20171179A1 (no) | System og metode for etterbehandling av spektrale verdier, koder og dekoder for lydsignaler | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
TW200400487A (en) | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
EP2227682A1 (en) | An encoder | |
US20100280830A1 (en) | Decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4043476 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131122 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |