JP4685165B2 - 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法 - Google Patents
仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法 Download PDFInfo
- Publication number
- JP4685165B2 JP4685165B2 JP2008522700A JP2008522700A JP4685165B2 JP 4685165 B2 JP4685165 B2 JP 4685165B2 JP 2008522700 A JP2008522700 A JP 2008522700A JP 2008522700 A JP2008522700 A JP 2008522700A JP 4685165 B2 JP4685165 B2 JP 4685165B2
- Authority
- JP
- Japan
- Prior art keywords
- cld
- quantization
- channel
- vsli
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 186
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000005236 sound signal Effects 0.000 claims abstract description 62
- 238000004590 computer program Methods 0.000 claims description 4
- 238000011965 cell line development Methods 0.000 abstract 2
- 238000006073 displacement reaction Methods 0.000 description 11
- 230000015556 catabolic process Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 2
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 102100040836 Claudin-1 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100113671 Homo sapiens CLDN1 gene Proteins 0.000 description 1
- 101100113675 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLD1 gene Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Claims (26)
- N−チャネル(N1)オーディオ信号を空間オーディオ符号化(Spatial Audio coding:SAC)方式に基づいた符号化時に空間パラメータとして利用されるチャネル間レベル差(Channel Level Difference:CLD)パラメータを量子化するための方法において、
前記N−チャネルオーディオ信号からサブバンド別CLDを抽出する段階と、
N−チャネル(N1)オーディオ信号の仮想音源位置情報(virtual source location information:VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを参照して前記CLDを量子化する、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、段階と、
を含むCLD量子化方法。 - 前記VSLIの量子化値は、0度から90度間で一定の量子化間隔で量子化されることを特徴とする請求項1に記載のCLD量子化方法。
- 前記一定の量子化間隔は、3度であることを特徴とする請求項2に記載のCLD量子化方法。
- 前記CLD量子化のための境界値(decision level)は、VSLI量子化のためのVSLI境界値から導き出されることを特徴とする請求項1に記載のCLD量子化方法。
- 前記CLDの量子化インデックスに対してハフマン符号化を行う段階をさらに含むことを特徴とする請求項1に記載のCLD量子化方法。
- 請求項1乃至11のいずれかに記載のCLD量子化方法を行うためのコンピュータープログラムが記録されたコンピューターによって読み取り可能な記録媒体。
- N−チャネルオーディオ信号(N1)を空間オーディオ符号化(SAC)方式に基づいて符号化するための方法において、
前記N−チャネルオーディオ信号をダウンミキシング及び符号化する段階と、
前記N−チャネルオーディオ信号からチャネル間レベル差(CLD)、チャネル間類似度(Inter channel Correlation/Coherences:ICC)及びチャネル予測係数(Channel Prediction Coefficient:CPC)を含む空間パラメータをサブバンド別に抽出する段階と、
前記抽出された空間パラメータを量子化する段階と、を含み、
前記量子化段階で、前記CLDは、N−チャネル(N1)オーディオ信号の仮想音源位置情報(VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを参照して量子化され、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、
ことを特徴とするN−チャネルオーディオ信号のSACに基づいた符号化方法。 - N−チャネルオーディオ信号(N1)を空間オーディオ符号化(SAC)方式に基づいて符号化するための装置において、
前記装置は、
前記N−チャネルオーディオ信号をダウンミキシングしてダウンミックス信号を生成し、前記N−チャネルオーディオ信号からチャネル間レベル差(CLD)、チャネル間類似度(ICC)及びチャネル予測係数(CPC)を含む空間パラメータをサブバンド別に抽出するためのSAC符号化手段と、
前記SAC符号化手段で生成されたダウンミックス信号から圧縮されたオーディオビットストリームを生成するためのオーディオ符号化手段と、
前記SAC符号化手段で生成された空間パラメータを量子化するための空間パラメータ量子化手段と、
前記量子化された空間パラメータ値を符号化するための空間パラメータ符号化手段と、を含み、
前記量子化手段は、前記CLDをN−チャネル(N1)オーディオ信号の仮想音源位置情報(VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを参照して量子化し、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、
ことを特徴とするSACに基づいたオーディオ符号化装置。 - 空間オーディオ符号化(SAC)方式に基づいて符号化されたN−チャネル(N1)オーディオビットストリームの復号化時に符号化されたチャネル間レベル差(CLD)量子化値を逆量子化するための方法において、
前記符号化されたCLD量子化値をハフマン復号化する段階と、
N−チャネル(N1)オーディオ信号の仮想音源位置情報(VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを利用して前記復号化されたCLD量子化値を逆量子化する、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、段階と、
を含むCLD逆量子化方法。 - 請求項17乃至21のいずれかに記載のCLD逆量子化方法を行うためのコンピュータープログラムが記録されたコンピューターによって読み取り可能な記録媒体。
- 空間オーディオ符号化(SAC)方式に基づいて符号化されたN−チャネル(N1)オーディオビットストリームの復号化方法において、
前記符号化されたオーディオビットストリームを復号化する段階と、
前記符号化されたオーディオビットストリームとともに受信された空間パラメータの量子化値を逆量子化する段階と、
前記逆量子化された空間パラメータに基づいて前記復号化されたオーディオビットストリームを合成してN−チャネルオーディオ信号を復元する段階と、を含み、
前記空間パラメータの量子化値を逆量子化する段階で、前記空間パラメータに含まれるCLDは、N−チャネル(N1)オーディオ信号の仮想音源位置情報(VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを参照して逆量子化され、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、
ことを特徴とするSACに基づいたオーディオ復号化方法。 - 空間オーディオ符号化(SAC)方式に基づいて符号化されたN−チャネル(N1)オーディオビットストリームを復号化するための装置において、
前記装置は、
前記符号化されたオーディオビットストリームを復号化するための手段と、
前記符号化されたオーディオビットストリームとともに受信された符号化された空間パラメータの量子化値を復号化するための手段と、
前記復号化された空間パラメータの量子化値を逆量子化するための手段と、
前記逆量子化された空間パラメータに基づいて前記復号化されたオーディオビットストリームを合成してN−チャネルオーディオ信号を復元するための手段と、を含み、
前記空間パラメータの量子化値を逆量子化するための手段は、前記空間パラメータに含まれるCLDをN−チャネル(N1)オーディオ信号の仮想音源位置情報(VSLI)量子化値から導き出されたCLD量子化値を利用して設計されたVSLIベースのCLD量子化テーブルを参照して逆量子化し、前記VSLIは、前記N−チャネルオーディオ信号のチャネル別パワーとチャネル音源間別角度とに基づいて求められる、
ことを特徴とするSACに基づいたオーディオ復号化装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20050065515 | 2005-07-19 | ||
KR20050096256 | 2005-10-12 | ||
KR1020060066822A KR100755471B1 (ko) | 2005-07-19 | 2006-07-18 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
PCT/KR2006/002824 WO2007011157A1 (en) | 2005-07-19 | 2006-07-19 | Virtual source location information based channel level difference quantization and dequantization method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009502086A JP2009502086A (ja) | 2009-01-22 |
JP4685165B2 true JP4685165B2 (ja) | 2011-05-18 |
Family
ID=38012181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008522700A Expired - Fee Related JP4685165B2 (ja) | 2005-07-19 | 2006-07-19 | 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4685165B2 (ja) |
KR (1) | KR100755471B1 (ja) |
CN (1) | CN101223598B (ja) |
AT (1) | ATE511691T1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101422745B1 (ko) * | 2007-03-30 | 2014-07-24 | 한국전자통신연구원 | 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 |
JP5098458B2 (ja) * | 2007-06-20 | 2012-12-12 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
KR101268616B1 (ko) * | 2008-07-14 | 2013-05-29 | 한국전자통신연구원 | 오디오 채널 코딩의 성능 향상을 위한 채널간 정보 파라미터 양자화 방법 및 그 장치 |
KR101613975B1 (ko) | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
CN102157151B (zh) | 2010-02-11 | 2012-10-03 | 华为技术有限公司 | 一种多声道信号编码方法、解码方法、装置和系统 |
WO2011097903A1 (zh) * | 2010-02-11 | 2011-08-18 | 华为技术有限公司 | 多声道信号编码、解码方法、装置及编解码系统 |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
KR20120038311A (ko) | 2010-10-13 | 2012-04-23 | 삼성전자주식회사 | 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법 |
EP2702588B1 (en) * | 2012-04-05 | 2015-11-18 | Huawei Technologies Co., Ltd. | Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder |
CN104464742B (zh) * | 2014-12-31 | 2017-07-11 | 武汉大学 | 一种3d音频空间参数全方位非均匀量化编码系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
JP2004078183A (ja) * | 2002-06-24 | 2004-03-11 | Agere Systems Inc | オーディオ信号のマルチチャネル/キュー符号化/復号化 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3664416B2 (ja) * | 1996-06-18 | 2005-06-29 | Ykk Ap株式会社 | 建物の柵構造 |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
KR100378796B1 (ko) * | 2001-04-03 | 2003-04-03 | 엘지전자 주식회사 | 디지탈 오디오 부호화기 및 복호화 방법 |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
KR100923297B1 (ko) * | 2002-12-14 | 2009-10-23 | 삼성전자주식회사 | 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치 |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
-
2006
- 2006-07-18 KR KR1020060066822A patent/KR100755471B1/ko not_active IP Right Cessation
- 2006-07-19 AT AT06783342T patent/ATE511691T1/de not_active IP Right Cessation
- 2006-07-19 JP JP2008522700A patent/JP4685165B2/ja not_active Expired - Fee Related
- 2006-07-19 CN CN2006800259842A patent/CN101223598B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
JP2004078183A (ja) * | 2002-06-24 | 2004-03-11 | Agere Systems Inc | オーディオ信号のマルチチャネル/キュー符号化/復号化 |
Also Published As
Publication number | Publication date |
---|---|
KR20070011136A (ko) | 2007-01-24 |
ATE511691T1 (de) | 2011-06-15 |
CN101223598A (zh) | 2008-07-16 |
KR100755471B1 (ko) | 2007-09-05 |
JP2009502086A (ja) | 2009-01-22 |
CN101223598B (zh) | 2011-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4685165B2 (ja) | 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法 | |
KR101664434B1 (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
KR101139880B1 (ko) | 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을 위한 시간적 엔벨로프 정형화 | |
JP4521032B2 (ja) | 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
JP4887307B2 (ja) | ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成 | |
RU2665214C1 (ru) | Стереофонический кодер и декодер аудиосигналов | |
EP1905034B1 (en) | Virtual source location information based channel level difference quantization and dequantization | |
JP2009510514A (ja) | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 | |
JP2013506164A (ja) | オーディオ信号デコーダ、オーディオ信号エンコーダ、アップミックス信号表現の生成方法、ダウンミックス信号表現の生成方法、コンピュータプログラム、及び共通するオブジェクト間相関パラメータ値を用いるビットストリーム | |
JP2006201785A (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
KR20060109298A (ko) | 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보의적응적 양자화 | |
US20240153512A1 (en) | Audio codec with adaptive gain control of downmixed signals | |
US11176954B2 (en) | Encoding and decoding of multichannel or stereo audio signals | |
CN105336334B (zh) | 多声道声音信号编码方法、解码方法及装置 | |
US20190096410A1 (en) | Audio Signal Encoder, Audio Signal Decoder, Method for Encoding and Method for Decoding | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 | |
KR20070035410A (ko) | 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치 | |
KR20130012972A (ko) | 오디오/스피치 신호 부호화방법 | |
KR20120089230A (ko) | 신호 복호화 장치 | |
KR20070108313A (ko) | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110114 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S201 | Request for registration of exclusive licence |
Free format text: JAPANESE INTERMEDIATE CODE: R314201 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |