JPWO2006003891A1 - 音声信号復号化装置及び音声信号符号化装置 - Google Patents
音声信号復号化装置及び音声信号符号化装置 Download PDFInfo
- Publication number
- JPWO2006003891A1 JPWO2006003891A1 JP2006528708A JP2006528708A JPWO2006003891A1 JP WO2006003891 A1 JPWO2006003891 A1 JP WO2006003891A1 JP 2006528708 A JP2006528708 A JP 2006528708A JP 2006528708 A JP2006528708 A JP 2006528708A JP WO2006003891 A1 JPWO2006003891 A1 JP WO2006003891A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio
- channel
- channel signal
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 115
- 230000008569 process Effects 0.000 claims abstract description 71
- 238000002156 mixing Methods 0.000 claims abstract description 52
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 238000006243 chemical reaction Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 11
- 210000005069 ears Anatomy 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 28
- 238000000926 separation method Methods 0.000 description 20
- 230000001052 transient effect Effects 0.000 description 18
- 230000000694 effects Effects 0.000 description 10
- 238000013139 quantization Methods 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 10
- XIJXHOVKJAXCGJ-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidin-2-one Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC(I)=C1 XIJXHOVKJAXCGJ-XLPZGREQSA-N 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
[1]ISO/IEC 14496−3:2001/FDAM2,″Parametric Coding for high Quality Audio″
102 ダウンミクスモジュール
104 エネルギーエンベロープ分析器
106 IPDL(b)を算出するモジュール
108 IPDR(b)を算出するモジュール
110 ICC(b)を算出するモジュール
200 変換モジュール
202 残響生成器
204 過渡検出器
206、208 位相調整器
210、212 ミキサ2
214、216 エネルギー調整器
218 逆変換モジュール
300 変換モジュール
302 残響生成器
304 過渡検出器
306、308 位相調整器
310、312 ミキサ2
314、316 エネルギー調整器
318 逆変換モジュール
320 低域通過フィルタ
322、324 ミキサ1
326 高域通過フィルタ
400 帯域
402 セクション0
404 セクション2
406 境界
410 ダウンミクス部
411 AACエンコーダ
412 バイノーラルキューエンコーダ
413 第2エンコーダ
414 AACデコーダ
415 プレミクス部
416 信号分離部
417 ミキシング部
418 チャネル分離部
419 位相調整部
500 ダウンミキシング部
502 バイノーラルキュー抽出部
504 音声符号化器
506 マルチプレクサ
508 デマルチプレクサ
510 音声復号化器
512 マルチチャネル合成部
601 境界
以下に示す実施の形態は、本発明の様々な進歩性の原理を例示しているに過ぎず、以下に示す詳細な説明に対して種々変形を加えることが可能であることは、当業者であれば容易に理解するところである。従って、本発明は特許請求の範囲によってのみ制限されるものであって、以下に示す詳細な具体例よって限定されるものではない。
適用される数式は以下の通りである。
実施の形態2は、図3に示すエネルギーエンベロープ分析モジュール(104)に関わる。図2に示す分割方法の例では、耳が持つ音響心理学的特性を利用できていない。そこで本実施の形態では、図4に示すように、高い周波数の音に対しては感度が低いという耳の特性を利用して、低い周波数に対しては緻密に分割を行い、高い周波数に対しては分割の精度を下げる。
ビットレートが高い場合、残響信号を用いてマルチチャネル信号を導出するだけでは高ビットレートで期待される透明性レベルを獲得するのに不十分である。このため、実施の形態3では、粗い量子化が行われた差分信号Llf(t)およびRlf(t)を、ダウンミクス信号とは別に符号化して復号化装置に送り、ダウンミクス信号から分離された音声チャネル信号と原音チャネル信号とのずれを復号化装置において補正する。図6は、実施の形態3の復号化装置の構成を示すブロック図である。同図において、破線で囲んで示す部分は、ミキサ1(322、324)でのプレミキシングによって得られたプレミキシングチャネル信号の位相を調整するためのLreverb、Rreverbを、残響生成器(302)においてダウンミクス信号から分離する信号分離部である。この復号化装置は、前述の信号分離部、変換モジュール(300)、ミキサ1(322、324)、低域通過フィルタ(320)、ミキサ2(310、312)、エネルギー調整器(314、316)及び逆変換モジュール(318)を備える。図6に示す本実施の形態3の復号化装置では、粗い量子化を行ったマルチチャネル信号と低周波数領域における残響信号とをミキシングする。粗い量子化が行われるのは、ビットレートに制限があるためである。
[1]ISO/IEC 14496-3:2001/FDAM2, "Parametric Coding for high Quality Audio"
以下に示す実施の形態は、本発明の様々な進歩性の原理を例示しているに過ぎず、以下に示す詳細な説明に対して種々変形を加えることが可能であることは、当業者であれば容易に理解するところである。従って、本発明は特許請求の範囲によってのみ制限されるものであって、以下に示す詳細な具体例よって限定されるものではない。
適用される数式は以下の通りである。
実施の形態2は、図3に示すエネルギーエンベロープ分析モジュール(104)に関わる。図2に示す分割方法の例では、耳が持つ音響心理学的特性を利用できていない。そこで本実施の形態では、図4に示すように、高い周波数の音に対しては感度が低いという耳の特性を利用して、低い周波数に対しては緻密に分割を行い、高い周波数に対しては分割の精度を下げる。
ビットレートが高い場合、残響信号を用いてマルチチャネル信号を導出するだけでは高ビットレートで期待される透明性レベルを獲得するのに不十分である。このため、実施の形態3では、粗い量子化が行われた差分信号Llf(t)およびRlf(t)を、ダウンミクス信号とは別に符号化して復号化装置に送り、ダウンミクス信号から分離された音声チャネル信号と原音チャネル信号とのずれを復号化装置において補正する。図6は、実施の形態3の復号化装置の構成を示すブロック図である。同図において、破線で囲んで示す部分は、ミキサ1(322、324)でのプレミキシングによって得られたプレミキシングチャネル信号の位相を調整するためのLreverb、Rreverbを、残響生成器(302)においてダウンミクス信号から分離する信号分離部である。この復号化装置は、前述の信号分離部、変換モジュール(300)、ミキサ1(322、324)、低域通過フィルタ(320)、ミキサ2(310、312)、エネルギー調整器(314、316)及び逆変換モジュール(318)を備える。図6に示す本実施の形態3の復号化装置では、粗い量子化を行ったマルチチャネル信号と低周波数領域における残響信号とをミキシングする。粗い量子化が行われるのは、ビットレートに制限があるためである。
102 ダウンミクスモジュール
104 エネルギーエンベロープ分析器
106 IPDL(b)を算出するモジュール
108 IPDR(b)を算出するモジュール
110 ICC(b)を算出するモジュール
200 変換モジュール
202 残響生成器
204 過渡検出器
206、208 位相調整器
210、212 ミキサ2
214、216 エネルギー調整器
218 逆変換モジュール
300 変換モジュール
302 残響生成器
304 過渡検出器
306、308 位相調整器
310、312 ミキサ2
314、316 エネルギー調整器
318 逆変換モジュール
320 低域通過フィルタ
322、324 ミキサ1
326 高域通過フィルタ
400 帯域
402 セクション0
404 セクション2
406 境界
410 ダウンミクス部
411 AACエンコーダ
412 バイノーラルキューエンコーダ
413 第2エンコーダ
414 AACデコーダ
415 プレミクス部
416 信号分離部
417 ミキシング部
418 チャネル分離部
419 位相調整部
500 ダウンミキシング部
502 バイノーラルキュー抽出部
504 音声符号化器
506 マルチプレクサ
508 デマルチプレクサ
510 音声復号化器
512 マルチチャネル合成部
601 境界
Claims (22)
- 複数の音声チャネル信号をダウンミクスして得られるダウンミクスチャネル信号から、複数の前記音声チャネル信号を復号化する音声信号復号化装置であって、
ダウンミクスチャネル信号を、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換するダウンミクス信号変換手段と、
低ビット量に量子化された音声チャネル信号を前記時間−周波数表現に変換する音声チャネル信号変換手段と、
変換後の前記ダウンミクスチャネル信号と、変換後の前記音声チャネル信号とを、前記帯域ごとにプレミキシングすることによってプレミキシングチャネル信号を生成するプレミキシング手段と、
音声チャネル信号間の空間的特徴を表す空間音声情報に基づいて所定の処理を施された前記ダウンミクスチャネル信号と、生成された前記プレミキシングチャネル信号とを前記帯域ごとにミキシングすることによって、ミキシングチャネル信号を生成するミキシング手段と、
前記ミキシングチャネル信号を、複数の前記音声チャネル信号に変換するミキシングチャネル信号変換手段と
を備えることを特徴とする音声信号復号化装置。 - 前記空間音声情報は、時間軸方向への境界と、周波数方向への境界とによって区切られた領域に対して、それぞれ与えられる
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記時間方向への境界の数は、周波数方向に設定されたセクションごとに異なる
ことを特徴とする請求項2記載の音声信号復号化装置。 - 前記空間音声情報はさらに、チャネル間の干渉性を示す成分を含み、前記ミキシング手段は、前記チャネル間の干渉性を示す成分によって示ざれる割合でミキシングする
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記空間音声情報に基づく所定の処理は、ダウンミクス信号に対して残響成分を生成付加する処理を含み、
残響成分を生成する前記処理は、前記チャネル間の干渉性を示す成分によって制御される
ことを特徴とする請求項4記載の音声信号復号化装置。 - 全ての周波数帯域について、前記ミキシングチャネル信号のゲイン係数を導出するために、前記ミキシングチャネル信号のエネルギーを算出し、当該ゲイン係数を前記周波数帯域におけるミキシング信号に乗算する
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記音声チャネル信号は、ある一定の上限周波数まで、低いビット量に量子化された上、符号化されている
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記上限周波数は、符号化のビットレートに合わせて決定されている
ことを特徴とする請求項4記載の音声信号復号化装置。 - 前記プレミキシングは、前記上限周波数までの時間−周波数信号に対して行う
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記ミキシングは、前記上限周波数より高域の時間−周波数信号に対して行う
ことを特徴とする請求項1記載の音声信号復号化装置。 - 前記ダウンミクス信号変換手段および音声チャネル信号変換手段は、QMF手段であり、前記ミキシングチャネル信号変換手段は、逆QMF手段である
ことを特徴とする請求項1記載の音声信号復号化装置。 - 複数の音声チャネル信号を前記音声チャネル信号間の空間的特徴を表す空間音声情報とともに符号化する音声信号符号化装置であって、
複数の前記音声チャネル信号をダウンミクスすることによって、ダウンミクスチャネル信号を生成するダウンミクス手段と、
複数の前記音声チャネル信号と、生成された前記ダウンミクスチャネル信号とを、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換する信号変換手段と、
所定の時間−周波数領域ごとに、複数の前記音声チャネル信号を比較して、前記空間音声情報を算出する空間音声情報算出手段と、
前記ダウンミクスチャネル信号と前記空間音声情報とを符号化する第1符号化手段と、
複数の前記音声チャネル信号を低ビット量に量子化した後、符号化する第2符号化手段と
を備えることを特徴とする音声信号符号化装置。 - 前記時間−周波数領域の時間境界は、前記音声チャネル信号および前記ダウンミクスチャネルのいずれかの信号のエネルギーに、急激な変化が生じる時間的位置に配置される
ことを特徴とする請求項12記載の音声信号符号化装置。 - 前記空間音声情報は、前記時間境界と前記周波数の境界とによって区切られる領域ごとに算出される
ことを特徴とする請求項12記載の音声信号符号化装置。 - 前記空間音声情報のうち、音が両耳に届くまでの時間差を示す成分は、各音声チャネルの帯域ごとに算出される
ことを特徴とする請求項12記載の音声信号符号化装置。 - 前記空間音声情報のうち、前記音声チャネル信号間の干渉性を示す成分は、前記複数の音声チャネル信号の相関性として算出される
ことを特徴とする請求項12記載の音声信号符号化装置。 - 複数の音声チャネル信号をダウンミクスして得られるダウンミクスチャネル信号から、複数の前記音声チャネル信号を復号化する音声信号復号化方法であって、
ダウンミクスチャネル信号を、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換し、
低ビット量に量子化された音声チャネル信号を前記時間−周波数表現に変換し、
変換後の前記ダウンミクスチャネル信号と、変換後の前記音声チャネル信号とを、前記帯域ごとにプレミキシングすることによってプレミキシングチャネル信号を生成し、
音声チャネル信号間の空間的特徴を表す空間音声情報に基づいて所定の処理を施された前記ダウンミクスチャネル信号と、生成された前記プレミキシングチャネル信号とを前記帯域ごとにミキシングすることによって、ミキシングチャネル信号を生成し、
前記ミキシングチャネル信号を、複数の前記音声チャネル信号に変換する
ことを特徴とする音声信号復号化方法。 - 複数の音声チャネル信号を前記音声チャネル信号間の空間的特徴を表す空間音声情報とともに符号化する音声信号符号化方法であって、
複数の前記音声チャネル信号をダウンミクスすることによって、ダウンミクスチャネル信号を生成し、
複数の前記音声チャネル信号と、生成された前記ダウンミクスチャネル信号とを、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換し、
所定の時間−周波数領域ごとに、複数の前記音声チャネル信号を比較して、前記空間音声情報を算出し、
前記ダウンミクスチャネル信号と前記空間音声情報とを符号化し、
複数の前記音声チャネル信号を低ビット量に量子化した後、符号化する
ことを特徴とする音声信号符号化方法。 - 複数の音声チャネル信号をダウンミクスして得られるダウンミクスチャネル信号から、複数の前記音声チャネル信号を復号化する音声信号復号化装置のためのプログラムであって、
ダウンミクスチャネル信号を、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換するステップと、低ビット量に量子化された音声チャネル信号を前記時間−周波数表現に変換するステップと、変換後の前記ダウンミクスチャネル信号と、変換後の前記音声チャネル信号とを、前記帯域ごとにプレミキシングすることによってプレミキシングチャネル信号を生成するステップと、音声チャネル信号間の空間的特徴を表す空間音声情報に基づいて所定の処理を施された前記ダウンミクスチャネル信号と、生成された前記プレミキシングチャネル信号とを前記帯域ごとにミキシングすることによって、ミキシングチャネル信号を生成するステップと、前記ミキシングチャネル信号を、複数の前記音声チャネル信号に変換するステップとをコンピュータに実行させるプログラム。 - 複数の音声チャネル信号を前記音声チャネル信号間の空間的特徴を表す空間音声情報とともに符号化する音声信号符号化装置のためのプログラムであって、
複数の前記音声チャネル信号をダウンミクスすることによって、ダウンミクスチャネル信号を生成するステップと、複数の前記音声チャネル信号と、生成された前記ダウンミクスチャネル信号とを、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換するステップと、所定の時間−周波数領域ごとに、複数の前記音声チャネル信号を比較して、前記空間音声情報を算出するステップと、前記ダウンミクスチャネル信号と前記空間音声情報とを符号化するステップと、複数の前記音声チャネル信号を低ビット量に量子化した後、符号化するステップとをコンピュータに実行させるプログラム。 - ダウンミクスチャネル信号を、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換するステップと、低ビット量に量子化された音声チャネル信号を前記時間−周波数表現に変換するステップと、変換後の前記ダウンミクスチャネル信号と、変換後の前記音声チャネル信号とを、前記帯域ごとにプレミキシングすることによってプレミキシングチャネル信号を生成するステップと、音声チャネル信号間の空間的特徴を表す空間音声情報に基づいて所定の処理を施された前記ダウンミクスチャネル信号と、生成された前記プレミキシングチャネル信号とを前記帯域ごとにミキシングすることによって、ミキシングチャネル信号を生成するステップと、前記ミキシングチャネル信号を、複数の前記音声チャネル信号に変換するステップとをコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体。
- 複数の前記音声チャネル信号をダウンミクスすることによって、ダウンミクスチャネル信号を生成するステップと、複数の前記音声チャネル信号と、生成された前記ダウンミクスチャネル信号とを、周波数軸に沿って分割された複数の帯域における時間−周波数表現に変換するステップと、所定の時間−周波数領域ごとに、複数の前記音声チャネル信号を比較して、前記空間音声情報を算出するステップと、前記ダウンミクスチャネル信号と前記空間音声情報とを符号化するステップと、複数の前記音声チャネル信号を低ビット量に量子化した後、符号化するステップとをコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006528708A JP4934427B2 (ja) | 2004-07-02 | 2005-06-28 | 音声信号復号化装置及び音声信号符号化装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004197336 | 2004-07-02 | ||
JP2004197336 | 2004-07-02 | ||
PCT/JP2005/011842 WO2006003891A1 (ja) | 2004-07-02 | 2005-06-28 | 音声信号復号化装置及び音声信号符号化装置 |
JP2006528708A JP4934427B2 (ja) | 2004-07-02 | 2005-06-28 | 音声信号復号化装置及び音声信号符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006003891A1 true JPWO2006003891A1 (ja) | 2008-04-17 |
JP4934427B2 JP4934427B2 (ja) | 2012-05-16 |
Family
ID=35782698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006528708A Active JP4934427B2 (ja) | 2004-07-02 | 2005-06-28 | 音声信号復号化装置及び音声信号符号化装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7756713B2 (ja) |
EP (1) | EP1768107B1 (ja) |
JP (1) | JP4934427B2 (ja) |
KR (1) | KR101120911B1 (ja) |
CN (1) | CN1981326B (ja) |
CA (1) | CA2572805C (ja) |
WO (1) | WO2006003891A1 (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1803115A2 (en) * | 2004-10-15 | 2007-07-04 | Koninklijke Philips Electronics N.V. | A system and a method of processing audio data to generate reverberation |
JP4887288B2 (ja) * | 2005-03-25 | 2012-02-29 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
AU2006266655B2 (en) | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8494667B2 (en) | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
BRPI0615899B1 (pt) * | 2005-09-13 | 2019-07-09 | Koninklijke Philips N.V. | Unidade decodificadora espacial, dispositivo decodificador espacial, sistema de áudio, dispositivo de consumidor, e método para produzir um par de canais de saída binaurais |
JP4999846B2 (ja) * | 2006-08-04 | 2012-08-15 | パナソニック株式会社 | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
JP5451394B2 (ja) | 2006-09-29 | 2014-03-26 | 韓國電子通信研究院 | 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 |
KR20090013178A (ko) | 2006-09-29 | 2009-02-04 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치 |
WO2008069596A1 (en) | 2006-12-07 | 2008-06-12 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
JP5309944B2 (ja) | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
KR101342425B1 (ko) | 2008-12-19 | 2013-12-17 | 돌비 인터네셔널 에이비 | 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하기 위한 방법 및 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하도록 구성된 리버브레이터 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
EP3144932B1 (en) * | 2010-08-25 | 2018-11-07 | Fraunhofer Gesellschaft zur Förderung der Angewand | An apparatus for encoding an audio signal having a plurality of channels |
US8908874B2 (en) | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
KR101756838B1 (ko) * | 2010-10-13 | 2017-07-11 | 삼성전자주식회사 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
TWI462087B (zh) | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
KR101842257B1 (ko) * | 2011-09-14 | 2018-05-15 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
CN102446507B (zh) * | 2011-09-27 | 2013-04-17 | 华为技术有限公司 | 一种下混信号生成、还原的方法和装置 |
US20130315402A1 (en) * | 2012-05-24 | 2013-11-28 | Qualcomm Incorporated | Three-dimensional sound compression and over-the-air transmission during a call |
US9190065B2 (en) | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
JP2014074782A (ja) * | 2012-10-03 | 2014-04-24 | Sony Corp | 音声送信装置、音声送信方法、音声受信装置および音声受信方法 |
WO2014058138A1 (ko) * | 2012-10-12 | 2014-04-17 | 한국전자통신연구원 | 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치 |
KR20140047509A (ko) | 2012-10-12 | 2014-04-22 | 한국전자통신연구원 | 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치 |
WO2014068817A1 (ja) * | 2012-10-31 | 2014-05-08 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号装置 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US8804971B1 (en) | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
EP2804176A1 (en) | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
US9666198B2 (en) | 2013-05-24 | 2017-05-30 | Dolby International Ab | Reconstruction of audio scenes from a downmix |
EP2840811A1 (en) * | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
WO2015012594A1 (ko) * | 2013-07-23 | 2015-01-29 | 한국전자통신연구원 | 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더 |
KR101804744B1 (ko) | 2013-10-22 | 2017-12-06 | 연세대학교 산학협력단 | 오디오 신호 처리 방법 및 장치 |
CN104768121A (zh) * | 2014-01-03 | 2015-07-08 | 杜比实验室特许公司 | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 |
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
CN108665902B (zh) | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
BR112021025265A2 (pt) | 2019-06-14 | 2022-03-15 | Fraunhofer Ges Forschung | Sintetizador de áudio, codificador de áudio, sistema, método e unidade de armazenamento não transitória |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09102472A (ja) * | 1995-10-06 | 1997-04-15 | Matsushita Electric Ind Co Ltd | 誘電体素子の製造方法 |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
WO2003090206A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
JP2004078183A (ja) * | 2002-06-24 | 2004-03-11 | Agere Systems Inc | オーディオ信号のマルチチャネル/キュー符号化/復号化 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5343171A (en) * | 1992-09-28 | 1994-08-30 | Kabushiki Kaish Toshiba | Circuit for improving carrier rejection in a balanced modulator |
US5640385A (en) * | 1994-01-04 | 1997-06-17 | Motorola, Inc. | Method and apparatus for simultaneous wideband and narrowband wireless communication |
JPH09102742A (ja) * | 1995-10-05 | 1997-04-15 | Sony Corp | 符号化方法および装置、復号化方法および装置、並びに記録媒体 |
US6252965B1 (en) * | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
DE19721487A1 (de) * | 1997-05-23 | 1998-11-26 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
US6985594B1 (en) * | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
-
2005
- 2005-06-28 US US11/629,135 patent/US7756713B2/en active Active
- 2005-06-28 WO PCT/JP2005/011842 patent/WO2006003891A1/ja active Application Filing
- 2005-06-28 CN CN2005800226670A patent/CN1981326B/zh active Active
- 2005-06-28 CA CA2572805A patent/CA2572805C/en active Active
- 2005-06-28 KR KR1020067024727A patent/KR101120911B1/ko active IP Right Grant
- 2005-06-28 EP EP05765247.1A patent/EP1768107B1/en active Active
- 2005-06-28 JP JP2006528708A patent/JP4934427B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09102472A (ja) * | 1995-10-06 | 1997-04-15 | Matsushita Electric Ind Co Ltd | 誘電体素子の製造方法 |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
WO2003090206A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
JP2005523480A (ja) * | 2002-04-22 | 2005-08-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的オーディオのパラメータ表示 |
JP2005523624A (ja) * | 2002-04-22 | 2005-08-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号合成方法 |
JP2005523479A (ja) * | 2002-04-22 | 2005-08-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメータによるマルチチャンネルオーディオ表示 |
JP2004078183A (ja) * | 2002-06-24 | 2004-03-11 | Agere Systems Inc | オーディオ信号のマルチチャネル/キュー符号化/復号化 |
Also Published As
Publication number | Publication date |
---|---|
JP4934427B2 (ja) | 2012-05-16 |
US20080071549A1 (en) | 2008-03-20 |
CN1981326A (zh) | 2007-06-13 |
EP1768107B1 (en) | 2016-03-09 |
CA2572805A1 (en) | 2006-01-12 |
KR101120911B1 (ko) | 2012-02-27 |
US7756713B2 (en) | 2010-07-13 |
CA2572805C (en) | 2013-08-13 |
EP1768107A1 (en) | 2007-03-28 |
EP1768107A4 (en) | 2009-10-21 |
KR20070030796A (ko) | 2007-03-16 |
CN1981326B (zh) | 2011-05-04 |
WO2006003891A1 (ja) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
RU2388068C2 (ru) | Временное и пространственное генерирование многоканальных аудиосигналов | |
US7630396B2 (en) | Multichannel signal coding equipment and multichannel signal decoding equipment | |
US8817992B2 (en) | Multichannel audio coder and decoder | |
JP5224017B2 (ja) | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム | |
JP4832305B2 (ja) | ステレオ信号生成装置およびステレオ信号生成方法 | |
RU2551797C2 (ru) | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов | |
US8756066B2 (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
JP4794448B2 (ja) | オーディオエンコーダ | |
US10255928B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
JP5426680B2 (ja) | 信号処理方法及び装置 | |
JP2008519306A (ja) | 信号の組のエンコード及びデコード | |
JP2012512441A (ja) | ピーク検出に基づいた選択型スケーリングマスク演算 | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
JP2006323314A (ja) | マルチチャネル音声信号をバイノーラルキュー符号化する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4934427 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150224 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |