JP4794452B2 - オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法 - Google Patents
オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法 Download PDFInfo
- Publication number
- JP4794452B2 JP4794452B2 JP2006533960A JP2006533960A JP4794452B2 JP 4794452 B2 JP4794452 B2 JP 4794452B2 JP 2006533960 A JP2006533960 A JP 2006533960A JP 2006533960 A JP2006533960 A JP 2006533960A JP 4794452 B2 JP4794452 B2 JP 4794452B2
- Authority
- JP
- Japan
- Prior art keywords
- window type
- frame
- short
- preliminary
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 60
- 230000007704 transition Effects 0.000 claims description 31
- 230000001052 transient effect Effects 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 description 111
- 230000008569 process Effects 0.000 description 35
- 230000005236 sound signal Effects 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Discrete Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
Claims (10)
- コンピュータによって実行される方法であって、
オーディオデータの次フレームにおいて、安定した信号から過渡信号への遷移の指示を検出するステップを有し、
上記指示を検出するステップは、
現フレーム及び次フレームそれぞれのロングウィンドウタイプを用いて、該現フレームのデータのための複数の修正離散コサイン変換(MDCT)係数を算出し、該次フレームのデータのための複数の予備的MDCT係数を算出するステップと、
上記現フレームの複数の予備的MDCT係数を用いて該現フレームの総エネルギを算出するステップと、
上記次フレームの複数の予備的MDCT係数を用いて該次フレームの総エネルギを算出するステップと、
上記現フレームの総エネルギ及び上記次フレームの総エネルギを対数的に換算するステップと、
上記次フレームの換算された総エネルギから上記現フレームの換算された総エネルギを減算することによって傾斜エネルギを算出するステップと、
上記傾斜エネルギが閾値を超えているかを判定するステップと、
上記傾斜エネルギが閾値を超えている場合、上記次フレームにおいて、過渡信号への遷移がある可能性が高いと判定するステップと、を含み、
さらに、方法は、
過渡信号への遷移がある可能性が高いと判定された場合、上記次フレームの予備的ウィンドウタイプをショートウィンドウタイプに決定し、過渡信号への遷移がある可能性が高いと判定されなかった場合、上記次フレームの予備的ウィンドウタイプをロングウィンドウタイプに決定するステップと、
上記次フレームの予備的ウィンドウタイプ及びオーディオデータの前フレームのウィンドウタイプに基づいて、オーディオデータの現フレームのウィンドウタイプを判定するステップと、を有し、
上記オーディオデータは、上記ウィンドウタイプによって定義される変換範囲を用いて周波数領域に変換されることを特徴としており、
上記現フレームのウィンドウタイプを判定するステップは、
上記前フレームのウィンドウタイプを特定するステップと、
上記前フレームのウィンドウタイプから上記次フレームの予備的ウィンドウタイプへの遷移について、ショートウィンドウタイプよりロングウィンドウタイプを優先して、上記現フレームのためのウィンドウタイプを選択するステップと、を含み、
上記ウィンドウタイプを選択するステップは、さらに、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショート−ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロング−ショートウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショートウィンドウタイプを選択するステップと、を含むことを特徴とする方法。 - 上記複数の予備的MDCT係数は、時間軸に沿って生成された複数の対応するサンプルから算出されることを特徴とする請求項1記載のウィンドウタイプ決定方法。
- 上記閾値は、経験的に設定されることを特徴とする請求項1記載のウィンドウタイプ決定方法。
- プロセッサにより実行されて、該プロセッサにウィンドウタイプ決定方法を実行させる命令を提供するコンピュータにより読取可能な媒体において、該ウィンドウタイプ決定方法は、
オーディオデータの次フレームにおいて、安定した信号から過渡信号への遷移の指示を検出するステップを有し、
上記指示を検出するステップは、
現フレーム及び次フレームそれぞれのロングウィンドウタイプを用いて、該現フレームのデータのための複数の修正離散コサイン変換(MDCT)係数を算出し、該次フレームのデータのための複数の予備的MDCT係数を算出するステップと、
上記現フレームの複数の予備的MDCT係数を用いて該現フレームの総エネルギを算出するステップと、
上記次フレームの複数の予備的MDCT係数を用いて該次フレームの総エネルギを算出するステップと、
上記現フレームの総エネルギ及び上記次フレームの総エネルギを対数的に換算するステップと、
上記次フレームの換算された総エネルギから上記現フレームの換算された総エネルギを減算することによって傾斜エネルギを算出するステップと、
上記傾斜エネルギが閾値を超えているかを判定するステップと、
上記傾斜エネルギが閾値を超えている場合、上記次フレームにおいて、過渡信号への遷移がある可能性が高いと判定するステップと、を含み、
さらに、方法は、
過渡信号への遷移がある可能性が高いと判定された場合、上記次フレームの予備的ウィンドウタイプをショートウィンドウタイプに決定し、過渡信号への遷移がある可能性が高いと判定されなかった場合、上記次フレームの予備的ウィンドウタイプをロングウィンドウタイプに決定するステップと、
上記次フレームの予備的ウィンドウタイプ及びオーディオデータの前フレームのウィンドウタイプに基づいて、オーディオデータの現フレームのウィンドウタイプを判定するステップと、を有し、
上記オーディオデータは、上記ウィンドウタイプによって定義される変換範囲を用いて周波数領域に変換されることを特徴としており、
上記現フレームのウィンドウタイプを判定するステップは、
上記前フレームのウィンドウタイプを特定するステップと、
上記前フレームのウィンドウタイプから上記次フレームの予備的ウィンドウタイプへの遷移について、ショートウィンドウタイプよりロングウィンドウタイプを優先して、上記現フレームのためのウィンドウタイプを選択するステップと、を含み、
上記ウィンドウタイプを選択するステップは、さらに、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショート−ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロング−ショートウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショートウィンドウタイプを選択するステップと、を含むことを特徴とするコンピュータにより読取可能な媒体。 - 上記複数の予備的MDCT係数は、時間軸に沿って生成された複数の対応するサンプルから算出されることを特徴とする請求項4記載のコンピュータにより読取可能な媒体。
- 上記決定された現フレームのウィンドウタイプがロングウィンドウタイプである場合、該現フレームの複数の最終的なMDCT係数として該現フレームの複数の予備的MDCT係数を用いることを特徴とする請求項4記載のコンピュータにより読取可能な媒体。
- メモリと、
上記メモリに接続された、少なくとも1つのプロセッサと、を備えるコンピュータシステムにおいて、
上記少なくとも1つのプロセッサは、一連のインストラクションを実行することにより、
オーディオデータの次フレームにおいて、安定した信号から過渡信号への遷移の指示を検出するステップを実行し、
上記指示を検出するステップは、
現フレーム及び次フレームそれぞれのロングウィンドウタイプを用いて、該現フレームのデータのための複数の修正離散コサイン変換(MDCT)係数を算出し、該次フレームのデータのための複数の予備的MDCT係数を算出するステップと、
上記現フレームの複数の予備的MDCT係数を用いて該現フレームの総エネルギを算出するステップと、
上記次フレームの複数の予備的MDCT係数を用いて該次フレームの総エネルギを算出するステップと、
上記現フレームの総エネルギ及び上記次フレームの総エネルギを対数的に換算するステップと、
上記次フレームの換算された総エネルギから上記現フレームの換算された総エネルギを減算することによって傾斜エネルギを算出するステップと、
上記傾斜エネルギが閾値を超えているかを判定するステップと、
上記傾斜エネルギが閾値を超えている場合、上記次フレームにおいて、過渡信号への遷移がある可能性が高いと判定するステップと、を含み、
さらに、上記少なくとも1つのプロセッサがインストラクションを実行することにより、
過渡信号への遷移がある可能性が高いと判定された場合、上記次フレームの予備的ウィンドウタイプをショートウィンドウタイプに決定し、過渡信号への遷移がある可能性が高いと判定されなかった場合、上記次フレームの予備的ウィンドウタイプをロングウィンドウタイプに決定するステップと、
上記次フレームの予備的ウィンドウタイプ及びオーディオデータの前フレームのウィンドウタイプに基づいて、オーディオデータの現フレームのウィンドウタイプを判定するステップと、を実行し、
上記オーディオデータは、上記ウィンドウタイプによって定義される変換範囲を用いて周波数領域に変換されることを特徴としており、
上記現フレームのウィンドウタイプを判定するステップは、
上記前フレームのウィンドウタイプを特定するステップと、
上記前フレームのウィンドウタイプから上記次フレームの予備的ウィンドウタイプへの遷移について、ショートウィンドウタイプよりロングウィンドウタイプを優先して、上記現フレームのためのウィンドウタイプを選択するステップと、を含み、
上記ウィンドウタイプを選択するステップは、さらに、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショート−ロングウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロング−ショートウィンドウタイプを選択するステップと、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショートウィンドウタイプを選択するステップと、を含むことを特徴とするコンピュータシステム。 - 上記複数の予備的MDCT係数は、時間軸に沿って生成された複数の対応するサンプルから算出されることを特徴とする請求項7記載のコンピュータシステム。
- 上記プロセッサは、更に、上記決定された現フレームのウィンドウタイプがロングウィンドウタイプである場合、上記現フレームの複数の最終的なMDCT係数として該現フレームの複数の予備的MDCT係数を用いることを特徴とする請求項7記載のコンピュータシステム。
- 装置であって、
オーディオデータの次フレームにおいて、安定した信号から過渡信号への遷移の指示を検出する検出手段を有し、
上記検出手段は、
現フレーム及び次フレームそれぞれのロングウィンドウタイプを用いて、該現フレームのデータのための複数の修正離散コサイン変換(MDCT)係数を算出し、該次フレームのデータのための複数の予備的MDCT係数を算出する手段と、
上記現フレームの複数の予備的MDCT係数を用いて該現フレームの総エネルギを算出する手段と、
上記次フレームの複数の予備的MDCT係数を用いて該次フレームの総エネルギを算出する手段と、
上記現フレームの総エネルギ及び上記次フレームの総エネルギを対数的に換算する手段と、
上記次フレームの換算された総エネルギから上記現フレームの換算された総エネルギを減算することによって傾斜エネルギを算出する手段と、
上記傾斜エネルギが閾値を超えているかを判定する手段と、
上記傾斜エネルギが閾値を超えている場合、上記次フレームにおいて、過渡信号への遷移がある可能性が高いと判定する手段と、を有し、
さらに、装置は、
過渡信号への遷移がある可能性が高いと判定された場合、上記次フレームの予備的ウィンドウタイプをショートウィンドウタイプに決定し、過渡信号への遷移がある可能性が高いと判定されなかった場合、上記次フレームの予備的ウィンドウタイプをロングウィンドウタイプに決定する決定手段と、
上記次フレームの予備的ウィンドウタイプ及びオーディオデータの前フレームのウィンドウタイプに基づいて、オーディオデータの現フレームのウィンドウタイプを判定する判定手段と、を備え、
上記オーディオデータは、上記ウィンドウタイプによって定義される変換範囲を用いて周波数領域に変換されることを特徴としており、
上記判定手段は、
上記前フレームのウィンドウタイプを特定する手段と、
上記前フレームのウィンドウタイプから上記次フレームの予備的ウィンドウタイプへの遷移について、ショートウィンドウタイプよりロングウィンドウタイプを優先して、上記現フレームのためのウィンドウタイプを選択する手段と、を有し、
上記ウィンドウタイプを選択する手段は、さらに、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロングウィンドウタイプを選択する手段と、
上記次フレームの予備的ウィンドウタイプがロングウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショート−ロングウィンドウタイプを選択する手段と、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがロングウィンドウタイプ又はショート−ロングウィンドウタイプである場合、上記現フレームについて、ロング−ショートウィンドウタイプを選択する手段と、
上記次フレームの予備的ウィンドウタイプがショートウィンドウタイプであり、上記前フレームのウィンドウタイプがショートウィンドウタイプ又はロング−ショートウィンドウタイプである場合、上記現フレームについて、ショートウィンドウタイプを選択する手段と、を有することを特徴とする装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/674,616 | 2003-09-29 | ||
US10/674,616 US7325023B2 (en) | 2003-09-29 | 2003-09-29 | Method of making a window type decision based on MDCT data in audio encoding |
PCT/US2004/031024 WO2005034080A2 (en) | 2003-09-29 | 2004-09-20 | A method of making a window type decision based on mdct data in audio encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007512546A JP2007512546A (ja) | 2007-05-17 |
JP4794452B2 true JP4794452B2 (ja) | 2011-10-19 |
Family
ID=34376897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006533960A Expired - Fee Related JP4794452B2 (ja) | 2003-09-29 | 2004-09-20 | オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7325023B2 (ja) |
EP (1) | EP1676264B1 (ja) |
JP (1) | JP4794452B2 (ja) |
KR (1) | KR101157930B1 (ja) |
CN (2) | CN1997988B (ja) |
DE (1) | DE602004029065D1 (ja) |
WO (1) | WO2005034080A2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
DE602004025517D1 (de) * | 2004-05-17 | 2010-03-25 | Nokia Corp | Audiocodierung mit verschiedenen codierungsrahmenlängen |
US7937271B2 (en) * | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
EP1793372B1 (en) * | 2004-10-26 | 2011-12-14 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
KR100668319B1 (ko) * | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
MX2009006201A (es) | 2006-12-12 | 2009-06-22 | Fraunhofer Ges Forschung | Codificador, decodificador y metodos para codificar y decodificar segmentos de datos que representan una corriente de datos del dominio temporal. |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
CN101398825B (zh) * | 2007-09-29 | 2013-07-03 | 三星电子株式会社 | 用于快速音乐分类和检索的方法和设备 |
EP2242047B1 (en) * | 2008-01-09 | 2017-03-15 | LG Electronics Inc. | Method and apparatus for identifying frame type |
CN102105930B (zh) * | 2008-07-11 | 2012-10-03 | 弗朗霍夫应用科学研究促进协会 | 用于编码采样音频信号的帧的音频编码器和解码器 |
CN102216982A (zh) | 2008-09-18 | 2011-10-12 | 韩国电子通信研究院 | 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备 |
US9384748B2 (en) | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
WO2011013980A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN102243872A (zh) * | 2010-05-10 | 2011-11-16 | 炬力集成电路设计有限公司 | 对音频数字信号进行编码、解码的方法及系统 |
EP2645365B1 (en) * | 2010-11-24 | 2018-01-17 | LG Electronics Inc. | Speech signal encoding method and speech signal decoding method |
CN103325373A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
US9069726B2 (en) * | 2012-12-12 | 2015-06-30 | Microsoft Technology Licensing, Llc | Iteratively calculating standard deviation for streamed data |
PT2959482T (pt) | 2013-02-20 | 2019-08-02 | Fraunhofer Ges Forschung | Aparelho e método para codificar ou descodificar um sinal de áudio usando uma sobreposição dependente da localização de transiente |
CN105247614B (zh) | 2013-04-05 | 2019-04-05 | 杜比国际公司 | 音频编码器和解码器 |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US10387412B1 (en) * | 2015-02-12 | 2019-08-20 | Cloud & Stream Gears Llc | Incremental Z-score calculation for big data or streamed data using components |
US9959877B2 (en) * | 2016-03-18 | 2018-05-01 | Qualcomm Incorporated | Multi channel coding |
JP7178506B2 (ja) * | 2019-02-21 | 2022-11-25 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 位相ecu f0補間スプリットのための方法および関係するコントローラ |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000134106A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法 |
JP2001160758A (ja) * | 1999-12-02 | 2001-06-12 | Matsushita Electric Ind Co Ltd | オーディオ信号のブロックに基く変換符号化におけるブロックサイズ決定方法 |
JP2003216188A (ja) * | 2002-01-25 | 2003-07-30 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、符号化装置、及び記憶媒体 |
JP2005003912A (ja) * | 2003-06-11 | 2005-01-06 | Canon Inc | オーディオ信号符号化装置、オーディオ信号符号化方法及びプログラム |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5341457A (en) | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US4964113A (en) * | 1989-10-20 | 1990-10-16 | International Business Machines Corporation | Multi-frame transmission control for token ring networks |
US5642437A (en) | 1992-02-22 | 1997-06-24 | Texas Instruments Incorporated | System decoder circuit with temporary bit storage and method of operation |
JP2693893B2 (ja) | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
IL104636A (en) | 1993-02-07 | 1997-06-10 | Oli V R Corp Ltd | Apparatus and method for encoding and decoding digital signals |
US5729556A (en) | 1993-02-22 | 1998-03-17 | Texas Instruments | System decoder circuit with temporary bit storage and method of operation |
US5748763A (en) | 1993-11-18 | 1998-05-05 | Digimarc Corporation | Image steganography system featuring perceptually adaptive and globally scalable signal embedding |
US5488665A (en) | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
WO1995032499A1 (fr) | 1994-05-25 | 1995-11-30 | Sony Corporation | Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur |
JP3046224B2 (ja) | 1994-07-26 | 2000-05-29 | 三星電子株式会社 | 固定ビット率の符号化方法および装置とこれを利用した高速探索のためのトラッキング方法 |
TW316302B (ja) | 1995-05-02 | 1997-09-21 | Nippon Steel Corp | |
WO1996035269A1 (en) | 1995-05-03 | 1996-11-07 | Sony Corporation | Non-linearly quantizing an information signal |
US5864802A (en) | 1995-09-22 | 1999-01-26 | Samsung Electronics Co., Ltd. | Digital audio encoding method utilizing look-up table and device thereof |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5893066A (en) | 1996-10-15 | 1999-04-06 | Samsung Electronics Co. Ltd. | Fast requantization apparatus and method for MPEG audio decoding |
JP3484908B2 (ja) | 1997-01-27 | 2004-01-06 | 三菱電機株式会社 | ビットストリーム再生装置 |
US5982935A (en) | 1997-04-11 | 1999-11-09 | National Semiconductor Corporation | Method and apparatus for computing MPEG video reconstructed DCT coefficients |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
KR100335611B1 (ko) | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
JP3515903B2 (ja) | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
US6108622A (en) | 1998-06-26 | 2000-08-22 | Lsi Logic Corporation | Arithmetic logic unit controller for linear PCM scaling and decimation in an audio decoder |
US6298087B1 (en) | 1998-08-31 | 2001-10-02 | Sony Corporation | System and method for decoding a variable length code digital signal |
US6704705B1 (en) | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
JP3352406B2 (ja) | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
US6282631B1 (en) | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
JP3739959B2 (ja) | 1999-03-23 | 2006-01-25 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
JP3323175B2 (ja) | 1999-04-20 | 2002-09-09 | 松下電器産業株式会社 | 符号化装置 |
JP2000323993A (ja) | 1999-05-11 | 2000-11-24 | Mitsubishi Electric Corp | Mpeg1オーディオレイヤiii復号処理装置およびコンピュータをmpeg1オーディオレイヤiii復号処理装置として機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体 |
JP3762579B2 (ja) | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6542863B1 (en) | 2000-06-14 | 2003-04-01 | Intervideo, Inc. | Fast codebook search method for MPEG audio encoding |
US20030079222A1 (en) | 2000-10-06 | 2003-04-24 | Boykin Patrick Oscar | System and method for distributing perceptually encrypted encoded files of music and movies |
JP2002311996A (ja) | 2001-02-09 | 2002-10-25 | Sony Corp | コンテンツ供給システム |
JP3639216B2 (ja) | 2001-02-27 | 2005-04-20 | 三菱電機株式会社 | 音響信号符号化装置 |
US6587057B2 (en) | 2001-07-25 | 2003-07-01 | Quicksilver Technology, Inc. | High performance memory efficient variable-length coding decoder |
US6732071B2 (en) | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
CN1414795A (zh) * | 2001-10-22 | 2003-04-30 | 矽统科技股份有限公司 | 在视窗中显示立体动画的装置及方法 |
DE60208426T2 (de) | 2001-11-02 | 2006-08-24 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten |
US6950794B1 (en) | 2001-11-20 | 2005-09-27 | Cirrus Logic, Inc. | Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression |
US6662154B2 (en) | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
US7460993B2 (en) | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
WO2003065353A1 (en) | 2002-01-30 | 2003-08-07 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
US7110941B2 (en) | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US20030215013A1 (en) | 2002-04-10 | 2003-11-20 | Budnikov Dmitry N. | Audio encoder with adaptive short window grouping |
KR100467617B1 (ko) | 2002-10-30 | 2005-01-24 | 삼성전자주식회사 | 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치 |
KR100547113B1 (ko) | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
-
2003
- 2003-09-29 US US10/674,616 patent/US7325023B2/en active Active
-
2004
- 2004-09-20 CN CN2004800353332A patent/CN1997988B/zh not_active Expired - Fee Related
- 2004-09-20 CN CN2010102688198A patent/CN101968781B/zh not_active Expired - Fee Related
- 2004-09-20 WO PCT/US2004/031024 patent/WO2005034080A2/en active Application Filing
- 2004-09-20 JP JP2006533960A patent/JP4794452B2/ja not_active Expired - Fee Related
- 2004-09-20 DE DE602004029065T patent/DE602004029065D1/de not_active Expired - Lifetime
- 2004-09-20 KR KR1020067005661A patent/KR101157930B1/ko active IP Right Grant
- 2004-09-20 EP EP04784750A patent/EP1676264B1/en not_active Ceased
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000134106A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法 |
JP2001160758A (ja) * | 1999-12-02 | 2001-06-12 | Matsushita Electric Ind Co Ltd | オーディオ信号のブロックに基く変換符号化におけるブロックサイズ決定方法 |
JP2003216188A (ja) * | 2002-01-25 | 2003-07-30 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、符号化装置、及び記憶媒体 |
JP2005003912A (ja) * | 2003-06-11 | 2005-01-06 | Canon Inc | オーディオ信号符号化装置、オーディオ信号符号化方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN101968781A (zh) | 2011-02-09 |
JP2007512546A (ja) | 2007-05-17 |
US7325023B2 (en) | 2008-01-29 |
WO2005034080A3 (en) | 2007-01-04 |
WO2005034080A2 (en) | 2005-04-14 |
CN1997988B (zh) | 2010-11-03 |
CN1997988A (zh) | 2007-07-11 |
KR101157930B1 (ko) | 2012-06-22 |
EP1676264A2 (en) | 2006-07-05 |
EP1676264A4 (en) | 2008-02-20 |
KR20060088542A (ko) | 2006-08-04 |
DE602004029065D1 (de) | 2010-10-21 |
CN101968781B (zh) | 2012-06-27 |
EP1676264B1 (en) | 2010-09-08 |
US20050071402A1 (en) | 2005-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4794452B2 (ja) | オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP3762579B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
JP6227117B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP4750707B2 (ja) | オーディオ符号化におけるショートウィンドウグループ化方法 | |
JP2011509426A (ja) | オーディオエンコーダおよびデコーダ | |
US20090106030A1 (en) | Method of signal encoding | |
EP2555191A1 (en) | Method and device for audio signal denoising | |
US8825494B2 (en) | Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program | |
US8593321B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
KR101103004B1 (ko) | 오디오 인코딩 시의 레이트-왜곡 제어 구조 | |
US7426462B2 (en) | Fast codebook selection method in audio encoding | |
US20180226082A1 (en) | Audio parameter quantization | |
RU2828411C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
JPH09288498A (ja) | 音声符号化装置 | |
US8626501B2 (en) | Encoding apparatus, encoding method, decoding apparatus, decoding method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070723 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080603 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080603 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100628 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100922 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100930 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101025 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101227 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110328 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110627 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110726 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4794452 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |