JP5483813B2 - マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 - Google Patents
マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 Download PDFInfo
- Publication number
- JP5483813B2 JP5483813B2 JP2007330311A JP2007330311A JP5483813B2 JP 5483813 B2 JP5483813 B2 JP 5483813B2 JP 2007330311 A JP2007330311 A JP 2007330311A JP 2007330311 A JP2007330311 A JP 2007330311A JP 5483813 B2 JP5483813 B2 JP 5483813B2
- Authority
- JP
- Japan
- Prior art keywords
- occupied channel
- channel
- occupied
- semi
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
まず、第1の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図1は第1の実施形態に係るマルチチャネル音声音響信号符号化装置1aの構成を示すブロック図である。
続いて、第2の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図2は第2の実施形態に係るマルチチャネル音声音響信号符号化装置1bの構成を示すブロック図である。このマルチチャネル音声音響信号符号化装置1bは、図1のマルチチャネル音声音響信号符号化装置1aに対し、ビットレート制御部16を加えた構成である。以下、ビットレート制御部16の動作について説明する。
続いて、第3の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図3は第3の実施形態に係るマルチチャネル音声音響信号符号化装置1cの構成を示すブロック図である。このマルチチャネル音声音響信号符号化装置1cは、図1のマルチチャネル音声音響信号符号化装置1aと同じ構成要素から成るが、最占有チャネル変換係数符号化部14の中間情報および出力符号化データの、一部または全部が、準占有チャネル群変換係数符号化部15に出力される構成である。以下、最占有チャネル変換係数符号化部14および準占有チャネル群変換係数符号化部15の動作について説明する。
続いて、第4の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図4は第4の実施形態に係るマルチチャネル音声音響信号符号化装置1dの構成を示すブロック図である。このマルチチャネル音声音響信号符号化装置1dは、図1のマルチチャネル音声音響信号符号化装置1aと同じ構成要素から成るが、最占有チャネル決定部12、準占有チャネル群決定部13、最占有チャネル変換係数符号化部14、準占有チャネル群変換係数符号化部15の少なくとも1つは、入力された各チャネルの音声音響信号をどの位置に定位するかを表す音源定位位置情報を用いる。以下、音源定位位置情報の扱いについて説明する。
続いて、第5の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図5は第5の実施形態に係るマルチチャネル音声音響信号符号化装置1eの構成を示すブロック図である。このマルチチャネル音声音響信号符号化装置1eは、図1のマルチチャネル音声音響信号符号化装置1aに対し、過去占有チャネル情報保持部17を加えた構成である。以下、過去占有チャネル情報保持部17および準占有チャネル群決定部13の動作について説明する。
続いて、第6の実施形態に係るマルチチャネル音声音響信号符号化装置の構成について説明する。図6は第6の実施形態に係るマルチチャネル音声音響信号復号装置2aの構成を示すブロック図である。
[第7の実施形態]
続いて、第7の実施形態に係るマルチチャネル音声音響信号復号装置の構成について説明する。図7は第7の実施形態に係るマルチチャネル音声音響信号復号装置2bの構成を示すブロック図である。このマルチチャネル音声音響信号復号装置2bは、図6のマルチチャネル音声音響信号復号装置2aと同じ構成要素から成るが、最占有チャネル変換係数復号部23の中間情報および出力符号化データの、一部または全部が、準占有チャネル群変換係数復号部24に出力される構成である。以下、最占有チャネル変換係数復号部23および準占有チャネル群変換係数復号部24の動作について説明する。
Claims (12)
- 入力された時間領域の音声音響信号を周波数領域に変換し、少なくとも1つの周波数帯域に分割した形式で変換係数を出力する時間周波数変換手段と、
前記時間周波数変換手段より出力された各チャネルの変換係数に基づいて、各周波数帯域についてそれぞれ最も占有的なチャネルを決定し、決定したチャネルに関する最占有チャネルインデックス情報を出力する最占有チャネル決定手段と、
前記時間周波数変換手段より出力された各チャネルの変換係数と前記最占有チャネル決定手段より出力された最占有チャネルインデックス情報とに基づいて、各周波数帯域についてそれぞれ0個以上の準占有的なチャネルを決定し、決定したチャネルに関する準占有チャネル群インデックス情報を出力する準占有チャネル群決定手段と、
前記時間周波数変換手段より出力された各チャネルの変換係数と前記最占有チャネル決定手段より出力された最占有チャネルインデックス情報とに基づいて、該当する周波数帯域の最占有チャネルの変換係数を符号化し、符号化後の最占有チャネル音響符号化データを出力する最占有チャネル変換係数符号化手段と、
前記時間周波数変換手段より出力された各チャネルの変換係数と前記準占有チャネル群決定手段より出力された準占有チャネル群インデックス情報とに基づいて、該当する周波数帯域の準占有的なチャネルの変換係数を符号化し、符号化後の準占有チャネル群音響符号化データを出力する準占有チャネル群変換係数符号化手段と
を備え、
前記最占有チャネル決定手段、前記準占有チャネル群決定手段、前記最占有チャネル変換係数符号化手段、前記準占有チャネル群変換係数符号化手段の少なくとも1つは、入力された各チャネルの音声音響信号をどの位置に定位するかを表す音源定位位置情報を用いることを特徴とするマルチチャネル音声音響信号符号化装置。 - 前記準占有チャネル群決定手段は、人間の聴覚におけるマスキング効果および聴覚感度の周波数依存性の少なくとも一方に基づいて、前記準占有的なチャネルを決定することを特徴とする
請求項1に記載のマルチチャネル音声音響信号符号化装置。 - 前記準占有チャネル群決定手段は、各周波数帯域において最占有チャネルとの利得差分が所定値以内のチャネルを、前記準占有的なチャネルとして決定することを特徴とする
請求項1に記載のマルチチャネル音声音響信号符号化装置。 - 前記準占有チャネル群決定手段は、所定の周波数帯域についてのみ前記準占有的なチャネルを決定することを特徴とする
請求項1〜3の何れか一項に記載のマルチチャネル音声音響信号符号化装置。 - 前記マルチチャネル音声音響信号符号化装置は、
固定または可変の所定のビットレートで符号化を行うために、前記準占有チャネル群決定手段より出力された準占有チャネル群インデックス情報に基づいて、前記準占有チャネル群決定手段、前記最占有チャネル変換係数符号化手段、前記準占有チャネル群変換係数符号化手段の少なくとも1つの処理を制御するビットレート制御手段、をさらに備えることを特徴とする
請求項1〜4の何れか一項に記載のマルチチャネル音声音響信号符号化装置。 - 前記準占有チャネル群変換係数符号化手段は、前記最占有チャネル変換係数符号化手段の中間情報および出力符号化データの、一部または全部を用いることを特徴とする
請求項1〜5の何れか一項に記載のマルチチャネル音声音響信号符号化装置。 - 前記マルチチャネル音声音響信号符号化装置は、
少なくとも前記最占有チャネル決定手段より出力される最占有チャネルインデックス情報を保持し、次回以降の処理時に前記最占有チャネルインデックス情報を出力する過去占有チャネル情報保持手段をさらに備え、
前記準占有チャネル群決定手段は、前記時間周波数変換手段より出力された各チャネルの変換係数、前記最占有チャネル決定手段より出力された最占有チャネルインデックス情報、および前記過去占有チャネル情報保持手段より出力された過去の占有チャネル情報に基づいて、各周波数帯域についてそれぞれ0個以上の準占有的なチャネルを決定し、決定したチャネルに関する準占有チャネル群インデックス情報を出力することを特徴とする
請求項1〜6の何れか一項に記載のマルチチャネル音声音響信号符号化装置。 - 前記準占有チャネル群決定手段は、前記時間周波数変換手段より出力された各チャネルの変換係数と前記最占有チャネル決定手段より出力された最占有チャネルインデックス情報に加え、前記最占有チャネル変換係数符号化手段より出力された前記符号化後の最占有チャネル音響符号化データも基礎として、各周波数帯域についてそれぞれ0個以上の準占有的なチャネルを決定することを特徴とする
請求項1〜7の何れか一項に記載のマルチチャネル音声音響信号符号化装置。 - 入力された最占有チャネルインデックス情報に基づいて、各周波数帯域について最占有チャネルの音声音響信号の音像を制御するための音像制御情報を決定する最占有チャネル音像制御情報決定手段と、
入力された準占有チャネル群インデックス情報に基づいて、各周波数帯域について準占有チャネル群の音声音響信号の音像を制御するための音像制御情報を決定する準占有チャネル群音像制御情報決定手段と、
入力された最占有チャネル音響符号化データを復号し、復号後の最占有チャネル変換係数を出力する最占有チャネル変換係数復号手段と、
入力された準占有チャネル群音響符号化データを復号し、復号後の準占有チャネル群変換係数を出力する準占有チャネル群変換係数復号手段と、
前記最占有チャネル変換係数復号手段より出力された最占有チャネル変換係数に対し、前記最占有チャネル音像制御情報決定手段より出力された最占有チャネル音像制御情報を付加することで音像制御を行い、少なくとも2つの再生チャネルについてそれぞれ最占有チャネル変形変換係数を出力する最占有チャネル音像制御手段と、
前記準占有チャネル群変換係数復号手段より出力された準占有チャネル群変換係数に対し、前記準占有チャネル群音像制御情報決定手段より出力された準占有チャネル群音像制御情報を付加することで音像制御を行い、少なくとも2つの再生チャネルについてそれぞれ準占有チャネル群変形変換係数を出力する準占有チャネル群音像制御手段と、
各再生チャネルについて、前記最占有チャネル音像制御手段より出力された最占有チャネル変形変換係数と、前記準占有チャネル群音像制御手段より出力された準占有チャネル群変形変換係数とを合成し、合成後の再生チャネルごとの合成変換係数を出力する変換係数合成手段と、
前記各変換係数合成手段より出力された合成変換係数を周波数領域から時間領域に変換し、変換後の各再生チャネルの出力信号を出力する周波数時間変換手段と
を備えることを特徴とするマルチチャネル音声音響信号復号装置。 - 前記準占有チャネル群変換係数復号手段は、前記最占有チャネル変換係数復号手段の中間情報および出力符号化データの、一部または全部を用いることを特徴とする
請求項9に記載のマルチチャネル音声音響信号復号装置。 - 音声音響信号を符号化する装置により実行されるマルチチャネル音声音響信号符号化方法であって、
入力された時間領域の音声音響信号を周波数領域に変換し、少なくとも1つの周波数帯域に分割した形式で変換係数を出力する時間周波数変換ステップと、
前記時間周波数変換ステップにより出力された各チャネルの変換係数に基づいて、各周波数帯域についてそれぞれ最も占有的なチャネルを決定し、決定したチャネルに関する最占有チャネルインデックス情報を出力する最占有チャネル決定ステップと、
前記時間周波数変換ステップにより出力された各チャネルの変換係数と前記最占有チャネル決定ステップにより出力された最占有チャネルインデックス情報とに基づいて、各周波数帯域についてそれぞれ0個以上の準占有的なチャネルを決定し、決定したチャネルに関する準占有チャネル群インデックス情報を出力する準占有チャネル群決定ステップと、
前記時間周波数変換ステップにより出力された各チャネルの変換係数と前記最占有チャネル決定ステップにより出力された最占有チャネルインデックス情報とに基づいて、該当する周波数帯域の最占有チャネルの変換係数を符号化し、符号化後の最占有チャネル音響符号化データを出力する最占有チャネル変換係数符号化ステップと、
前記時間周波数変換ステップにより出力された各チャネルの変換係数と前記準占有チャネル群決定ステップにより出力された準占有チャネル群インデックス情報とに基づいて、該当する周波数帯域の準占有的なチャネルの変換係数を符号化し、符号化後の準占有チャネル群音響符号化データを出力する準占有チャネル群変換係数符号化ステップと
を備え、
前記最占有チャネル決定ステップ、前記準占有チャネル群決定ステップ、前記最占有チャネル変換係数符号化ステップ、前記準占有チャネル群変換係数符号化ステップの少なくとも1つは、入力された各チャネルの音声音響信号をどの位置に定位するかを表す音源定位位置情報を用いることを特徴とするマルチチャネル音声音響信号符号化方法。 - 音声音響信号を復号する装置により実行されるマルチチャネル音声音響信号復号方法であって、
入力された最占有チャネルインデックス情報に基づいて、各周波数帯域について最占有チャネルの音声音響信号の音像を制御するための音像制御情報を決定する最占有チャネル音像制御情報決定ステップと、
入力された準占有チャネル群インデックス情報に基づいて、各周波数帯域について準占有チャネル群の音声音響信号の音像を制御するための音像制御情報を決定する準占有チャネル群音像制御情報決定ステップと、
入力された最占有チャネル音響符号化データを復号し、復号後の最占有チャネル変換係数を出力する最占有チャネル変換係数復号ステップと、
入力された準占有チャネル群音響符号化データを復号し、復号後の準占有チャネル群変換係数を出力する準占有チャネル群変換係数復号ステップと、
前記最占有チャネル変換係数復号ステップにより出力された最占有チャネル変換係数に対し、前記最占有チャネル音像制御情報決定ステップにより出力された最占有チャネル音像制御情報を付加することで音像制御を行い、少なくとも2つの再生チャネルについてそれぞれ最占有チャネル変形変換係数を出力する最占有チャネル音像制御ステップと、
前記準占有チャネル群変換係数復号ステップにより出力された準占有チャネル群変換係数に対し、前記準占有チャネル群音像制御情報決定ステップにより出力された準占有チャネル群音像制御情報を付加することで音像制御を行い、少なくとも2つの再生チャネルについてそれぞれ準占有チャネル群変形変換係数を出力する準占有チャネル群音像制御ステップと、
各再生チャネルについて、前記最占有チャネル音像制御ステップにより出力された最占有チャネル変形変換係数と、前記準占有チャネル群音像制御ステップにより出力された準占有チャネル群変形変換係数とを合成し、合成後の再生チャネルごとの合成変換係数を出力する変換係数合成ステップと、
前記各変換係数合成ステップにより出力された合成変換係数を周波数領域から時間領域に変換し、変換後の各再生チャネルの出力信号を出力する周波数時間変換ステップと
を備えることを特徴とするマルチチャネル音声音響信号復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007330311A JP5483813B2 (ja) | 2007-12-21 | 2007-12-21 | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007330311A JP5483813B2 (ja) | 2007-12-21 | 2007-12-21 | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009151183A JP2009151183A (ja) | 2009-07-09 |
JP5483813B2 true JP5483813B2 (ja) | 2014-05-07 |
Family
ID=40920368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007330311A Expired - Fee Related JP5483813B2 (ja) | 2007-12-21 | 2007-12-21 | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5483813B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6243770B2 (ja) * | 2014-03-25 | 2017-12-06 | 日本放送協会 | チャンネル数変換装置 |
CN107895580B (zh) * | 2016-09-30 | 2021-06-01 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58225751A (ja) * | 1982-06-24 | 1983-12-27 | Fujitsu Ltd | 音声多重伝送方式 |
JP3285185B2 (ja) * | 1995-06-16 | 2002-05-27 | 日本電信電話株式会社 | 音響信号符号化方法 |
JPH11262100A (ja) * | 1998-03-13 | 1999-09-24 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化/復号方法および装置 |
JP2905191B1 (ja) * | 1998-04-03 | 1999-06-14 | 日本放送協会 | 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2001144720A (ja) * | 1999-11-18 | 2001-05-25 | Sony Corp | 多重化装置および方法、並びに記録媒体 |
JP2002236499A (ja) * | 2000-12-06 | 2002-08-23 | Matsushita Electric Ind Co Ltd | 音楽信号圧縮装置、音楽信号圧縮伸張装置及び前処理制御装置 |
JP2002182699A (ja) * | 2000-12-15 | 2002-06-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JP2003023683A (ja) * | 2001-07-06 | 2003-01-24 | Mitsubishi Electric Corp | 音声中継伝送システム |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
-
2007
- 2007-12-21 JP JP2007330311A patent/JP5483813B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009151183A (ja) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4589962B2 (ja) | レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法 | |
JP4944902B2 (ja) | バイノーラルオーディオ信号の復号制御 | |
JP5452936B2 (ja) | 複素変調フィルタバンクを用いた効率的なフィルタリング | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
RU2376726C2 (ru) | Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио | |
JP5054035B2 (ja) | 符号化/復号化装置及び方法 | |
NO344091B1 (no) | Kompatibel flerkanal-koding/dekoding. | |
CN101385075B (zh) | 用于编码/解码信号的装置和方法 | |
KR20080078882A (ko) | 입체 오디오 신호 디코딩 | |
WO2010017833A1 (en) | Multichannel audio coder and decoder | |
JP2009531886A (ja) | 多チャンネル信号のパラメータ表現からの空間ダウンミックスの生成 | |
WO2013156814A1 (en) | Stereo audio signal encoder | |
CN112567765B (zh) | 空间音频捕获、传输和再现 | |
US9311925B2 (en) | Method, apparatus and computer program for processing multi-channel signals | |
JP5483813B2 (ja) | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 | |
CN110556116B (zh) | 计算下混信号和残差信号的方法和装置 | |
KR20080078907A (ko) | 양 귀 오디오 신호들의 복호화 제어 | |
JP5032921B2 (ja) | 音像制御装置および音像制御方法 | |
MX2008009565A (en) | Apparatus and method for encoding/decoding signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5483813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |