JP5977434B2 - パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器 - Google Patents
パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器 Download PDFInfo
- Publication number
- JP5977434B2 JP5977434B2 JP2015503764A JP2015503764A JP5977434B2 JP 5977434 B2 JP5977434 B2 JP 5977434B2 JP 2015503764 A JP2015503764 A JP 2015503764A JP 2015503764 A JP2015503764 A JP 2015503764A JP 5977434 B2 JP5977434 B2 JP 5977434B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- audio
- spatial
- spatial coding
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000005236 sound signal Effects 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 15
- 230000011664 signaling Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
1a 符号化されたオーディオビットストリームセクション
1b パラメータセクション
2 シグナリングフラグビット
3 シグナリングフラグビット
3 暗黙的なフラグ付けセクション
4 フラグセクション
5 パラメータ値セクション
5a パラメータ値セクション
5b パラメータ値セクション
6 パラメータ値セクション
10 空間オーディオ符号化デバイス
10a オーディオチャネル信号
10b オーディオチャネル信号
11 パラメータ抽出モジュール
11a パラメータ推定モジュール
11b パラメータ選択モジュール
12 ダウンミキシングモジュール
13 符号化モジュール
14 ストリーミングモジュール
15 変換モジュール
20 空間オーディオ復号化デバイス
20a 出力オーディオチャネル信号
20b 出力オーディオチャネル信号
21 パラメータ抽出モジュール
21a パラメータ検出モジュール
21b 選択モジュール
22 復号化モジュール
24 アップミキシングモジュール
25 変換モジュール
26 ビットストリーム抽出モジュール
30 方法
100 空間オーディオ符号化システム
Claims (14)
- 複数のオーディオチャネル信号を備えるマルチチャネルオーディオ信号のパラメトリック空間オーディオ符号化のための方法であって、
前記複数のオーディオチャネル信号のうちの1つのオーディオチャネル信号について少なくとも2つの異なる空間符号化パラメータを計算するステップであって、前記少なくとも2つの異なる空間符号化パラメータが、少なくとも2つの異なるタイプの空間符号化パラメータであり、前記オーディオチャネル信号と基準オーディオ信号から計算され、前記基準オーディオ信号が、前記複数のオーディオチャネル信号のうちの別のオーディオチャネル信号、または前記複数のオーディオチャネル信号のうちの少なくとも2つのオーディオチャネル信号から導出されたダウンミックスオーディオ信号である、ステップと、
前記計算された空間符号化パラメータの値に基づいて前記オーディオチャネル信号に関連付けられる前記少なくとも2つの異なる空間符号化パラメータのうちの少なくとも1つの空間符号化パラメータを選択するステップと、
前記選択された空間符号化パラメータの量子化された表現を、オーディオビットストリームのパラメータセクションに含めるステップと、
前記オーディオビットストリームの前記パラメータセクションに、前記オーディオビットストリームに含まれている前記選択された空間符号化パラメータのタイプを示すパラメータタイプフラグを設定するステップと、
を備え、
少なくとも1つの空間符号化パラメータを選択する前記ステップが、
第1の空間符号化パラメータ(ITD)の値が、第1の空間符号化パラメータタイプに関連するあらかじめ定められた第1の選択基準を満たす場合、前記少なくとも2つの空間符号化パラメータ(ITD、IPD、ICC)から、前記第1の空間符号化パラメータタイプの前記第1の空間符号化パラメータを選択するステップ、および/または、
前記第1の空間符号化パラメータの前記値が、前記第1の空間符号化パラメータタイプに関連する前記あらかじめ定められた第1の選択基準を満たさず、第2の空間符号化パラメータ(IPD)の値が、第2の空間符号化パラメータタイプに関連するあらかじめ定められた第2の選択基準を満たす場合、前記少なくとも2つの空間符号化パラメータ(ITD、IPD、ICC)から、前記第2の空間符号化パラメータタイプの前記第2の空間符号化パラメータを選択するステップ、
を備える、
方法。 - あらかじめ定められたフラグ値の量子化された表現を、前記オーディオビットストリームの前記パラメータセクションに含めるステップと、
前記選択された空間符号化パラメータの量子化された表現を、あらかじめ定められたフラグ値の前記量子化された表現とともに前記オーディオビットストリームの前記パラメータセクションに含めるステップであって、それによって、前記オーディオビットストリームに含まれている前記選択された空間符号化パラメータの前記タイプを示す、ステップと、
をさらに備える、請求項1に記載の方法。 - 前記選択された空間符号化パラメータの前記量子化された表現が4ビットを含む、請求項1から2のいずれか一項に記載の方法。
- 前記パラメータタイプフラグが1ビットを含む、請求項3に記載の方法。
- 前記あらかじめ定められたフラグ値の前記量子化された表現が4ビットを含む、請求項3に記載の方法。
- チャネル間時間差値が15の量子化値に量子化される、および/またはチャネル間位相差値が16の量子化値に量子化される、および/または、チャネル間コヒーレンス値が4の量子化値に量子化される、請求項1から5のいずれか一項に記載の方法。
- 空間符号化パラメータの前記タイプが、チャネル間時間差ITD、チャネル間位相差IPD、チャネル間レベル差ILD、またはチャネル間コヒーレンスICCである、請求項1から6のいずれか一項に記載の方法。
- 複数のオーディオチャネル信号を備えるマルチチャネルオーディオ信号の空間オーディオ符号化デバイスであって、
前記複数のオーディオチャネル信号のうちの1つのオーディオチャネル信号について少なくとも2つの異なる空間符号化パラメータを計算するように構成されたパラメータ推定モジュールであって、前記少なくとも2つの異なる空間符号化パラメータが、少なくとも2つの異なるタイプの空間符号化パラメータであり、前記オーディオチャネル信号と基準オーディオ信号から計算され、前記基準オーディオ信号が、前記複数のオーディオチャネル信号のうちの別のオーディオチャネル信号、または前記複数のオーディオチャネル信号のうちの少なくとも2つのオーディオチャネル信号から導出されたダウンミックスオーディオ信号である、パラメータ推定モジュールと、
前記パラメータ推定モジュールに結合され、前記計算された空間符号化パラメータの値に基づいて前記オーディオチャネル信号に関連付けられる前記少なくとも2つの異なる空間符号化パラメータのうちの少なくとも1つの空間符号化パラメータを選択するように構成されたパラメータ選択モジュールと、
前記パラメータ推定モジュールおよび前記パラメータ選択モジュールに結合されたストリーミングモジュールであって、前記選択された空間符号化パラメータの量子化された表現を備えるパラメータセクションを備えるオーディオビットストリームを生成し、前記オーディオビットストリームの前記パラメータセクションに、前記オーディオビットストリームに含まれている前記選択された空間符号化パラメータの前記タイプを示すパラメータタイプフラグを設定するように構成されたストリーミングモジュールと、
を備え、
前記パラメータ選択モジュールが、
第1の空間符号化パラメータ(ITD)の値が、第1の空間符号化パラメータタイプに関連するあらかじめ定められた第1の選択基準を満たす場合、前記少なくとも2つの空間符号化パラメータ(ITD、IPD、ICC)から前記第1の空間符号化パラメータタイプの前記第1の空間符号化パラメータを選択し、および/または、
前記第1の空間符号化パラメータの前記値が、前記第1の空間符号化パラメータタイプに関連する前記あらかじめ定められた第1の選択基準を満たさず、第2の空間符号化パラメータ(IPD)の値が、第2の空間符号化パラメータタイプに関連するあらかじめ定められた第2の選択基準を満たす場合、前記少なくとも2つの空間符号化パラメータ(ITD、IPD、ICC)から、前記第2の空間符号化パラメータタイプの第2の前記空間符号化パラメータを選択するようにさらに構成される、
空間オーディオ符号化デバイス。 - 前記複数のオーディオチャネル信号をダウンミックスすることによって前記ダウンミックスオーディオ信号を生成するように構成されたダウンミキシングモジュールをさらに備える、請求項8に記載の空間オーディオ符号化デバイス。
- 前記ダウンミキシングモジュールに結合され、また符号化されダウンミックスされたオーディオビットストリームを備える符号化されたオーディオビットストリームを生成するように構成された符号化モジュールをさらに備える、請求項9に記載の空間オーディオ符号化デバイス。
- 時間領域から周波数領域への変換を前記複数のオーディオチャネル信号に適用するように構成された変換モジュールをさらに備える、請求項8から10のいずれか一項に記載の空間オーディオ符号化デバイス。
- 前記ストリーミングモジュールが、前記オーディオビットストリームにフラグを設定するようにさらに構成されており、前記フラグが、前記オーディオビットストリームの前記パラメータセクション内の少なくとも1つの空間符号化パラメータの存在を示す、請求項11に記載の空間オーディオ符号化デバイス。
- 前記フラグが、前記オーディオビットストリーム全体について設定されるか、前記オーディオビットストリームの前記パラメータセクションに含まれる、請求項12に記載の空間オーディオ符号化デバイス。
- コンピュータ上で実行する際に、請求項1から7のうちのいずれか一項に記載の方法を実行するためのプログラムコードを備える、コンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2012/056319 WO2013149670A1 (en) | 2012-04-05 | 2012-04-05 | Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015518578A JP2015518578A (ja) | 2015-07-02 |
JP5977434B2 true JP5977434B2 (ja) | 2016-08-24 |
Family
ID=45937370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015503764A Active JP5977434B2 (ja) | 2012-04-05 | 2012-04-05 | パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9324329B2 (ja) |
EP (1) | EP2702588B1 (ja) |
JP (1) | JP5977434B2 (ja) |
KR (1) | KR101606665B1 (ja) |
CN (1) | CN103493127B (ja) |
ES (1) | ES2560402T3 (ja) |
WO (1) | WO2013149670A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3074970B1 (en) * | 2013-10-21 | 2018-02-21 | Dolby International AB | Audio encoder and decoder |
KR101565048B1 (ko) | 2014-10-16 | 2015-11-02 | 현대자동차주식회사 | 라인 타입 터치 센서를 이용한 전자식 자동 변속 장치 및 그 작동 방법 |
CA2997334A1 (en) | 2015-09-25 | 2017-03-30 | Voiceage Corporation | Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget |
KR102521017B1 (ko) * | 2016-02-16 | 2023-04-13 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 통화 방식 변환 방법 |
US10217467B2 (en) * | 2016-06-20 | 2019-02-26 | Qualcomm Incorporated | Encoding and decoding of interchannel phase differences between audio signals |
US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
US10354667B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
KR100755471B1 (ko) * | 2005-07-19 | 2007-09-05 | 한국전자통신연구원 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
WO2007046659A1 (en) | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
EP2128856A4 (en) * | 2007-10-16 | 2011-11-02 | Panasonic Corp | DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2169664A3 (en) | 2008-09-25 | 2010-04-07 | LG Electronics Inc. | A method and an apparatus for processing a signal |
KR20100035121A (ko) * | 2008-09-25 | 2010-04-02 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
-
2012
- 2012-04-05 WO PCT/EP2012/056319 patent/WO2013149670A1/en active Application Filing
- 2012-04-05 JP JP2015503764A patent/JP5977434B2/ja active Active
- 2012-04-05 KR KR1020147029854A patent/KR101606665B1/ko active IP Right Grant
- 2012-04-05 EP EP12713147.2A patent/EP2702588B1/en active Active
- 2012-04-05 ES ES12713147.2T patent/ES2560402T3/es active Active
- 2012-04-05 CN CN201280003212.4A patent/CN103493127B/zh active Active
-
2013
- 2013-12-31 US US14/145,328 patent/US9324329B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103493127B (zh) | 2015-03-11 |
KR101606665B1 (ko) | 2016-03-25 |
ES2560402T3 (es) | 2016-02-18 |
KR20140139586A (ko) | 2014-12-05 |
US9324329B2 (en) | 2016-04-26 |
WO2013149670A1 (en) | 2013-10-10 |
CN103493127A (zh) | 2014-01-01 |
EP2702588A1 (en) | 2014-03-05 |
EP2702588B1 (en) | 2015-11-18 |
US20140112482A1 (en) | 2014-04-24 |
JP2015518578A (ja) | 2015-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5977434B2 (ja) | パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器 | |
JP5947971B2 (ja) | マルチチャネルオーディオ信号の符号化パラメータを決定する方法及びマルチチャネルオーディオエンコーダ | |
ES2904275T3 (es) | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo | |
KR100888474B1 (ko) | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 | |
KR101391110B1 (ko) | 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림 | |
EP2702587B1 (en) | Method for inter-channel difference estimation and spatial audio coding device | |
KR101449434B1 (ko) | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 | |
JP6133422B2 (ja) | マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法 | |
KR20140140102A (ko) | 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법 | |
JP2009503615A (ja) | 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御 | |
RU2609097C2 (ru) | Устройство и способы для адаптации аудиоинформации при пространственном кодировании аудиообъектов | |
KR101660004B1 (ko) | 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법 | |
JP2017058696A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160721 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5977434 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |