JP5895050B2 - 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法 - Google Patents
符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法 Download PDFInfo
- Publication number
- JP5895050B2 JP5895050B2 JP2014516462A JP2014516462A JP5895050B2 JP 5895050 B2 JP5895050 B2 JP 5895050B2 JP 2014516462 A JP2014516462 A JP 2014516462A JP 2014516462 A JP2014516462 A JP 2014516462A JP 5895050 B2 JP5895050 B2 JP 5895050B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- encoded
- audio signal
- audio
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 221
- 238000000034 method Methods 0.000 title claims description 15
- 230000004044 response Effects 0.000 claims description 5
- 238000009877 rendering Methods 0.000 description 16
- 238000013459 approach Methods 0.000 description 10
- 230000009467 reduction Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
Claims (15)
- 複数の符号化された多チャンネルオーディオ信号を受け取る受信器と、
前記複数の符号化された多チャンネルオーディオ信号のうちの第1の符号化された多チャンネルオーディオ信号を復号化して第1の復号化された多チャンネルオーディオ信号を生成する多チャンネルデコーダと、
前記複数の符号化された多チャンネルオーディオ信号のうちの少なくとも第2の符号化された多チャンネルオーディオ信号から符号化されたオーディオデータを、前記第2の符号化された多チャンネルオーディオ信号からの前記符号化されたオーディオデータを含む符号化された更なるオーディオ信号のチャンネル数が、前記第2の符号化された多チャンネルオーディオ信号におけるチャンネル数より少ないように、選択することによって、前記符号化された更なるオーディオ信号を抽出する発生器と、
前記符号化された更なるオーディオ信号を復号化することによって復号化された更なるオーディオ信号を生成する更なるデコーダと、
少なくとも前記第1の復号化された多チャンネルオーディオ信号と前記復号化された更なるオーディオ信号とを合成して多チャンネル出力信号を生成する合成器と、
を含む、オーディオ信号プロセッサ。 - 前記発生器は、前記第2の符号化された多チャンネルオーディオ信号の単一のチャンネルから符号化されたオーディオデータを選択することによって、前記符号化された更なるオーディオ信号の第1のチャンネルを抽出する、請求項1に記載のオーディオ信号プロセッサ。
- 前記符号化された更なるオーディオ信号は、多チャンネル信号であり、前記発生器は、第3の符号化された多チャンネルオーディオ信号の単一のチャンネルから符号化されたオーディオデータを選択することによって、前記符号化された更なるオーディオ信号の第2のチャンネルを生成する、請求項2に記載のオーディオ信号プロセッサ。
- 前記符号化された更なるオーディオ信号の単一のチャンネルの符号化されたオーディオデータは、前記第2の符号化された多チャンネルオーディオ信号の前記単一のチャンネルの符号化されたオーディオデータと同一である、請求項2に記載のオーディオ信号プロセッサ。
- 前記第2の符号化された多チャンネルオーディオ信号の前記単一のチャンネルは、
中央−側方ステレオ信号用の中央チャンネル、
左右ステレオ信号用の左チャンネル、及び
左右ステレオ信号用の右チャンネル
のうちの少なくとも1つである、請求項2に記載のオーディオ信号プロセッサ。 - 前記符号化された更なるオーディオ信号は、モノ信号である、請求項1に記載のオーディオ信号プロセッサ。
- 前記符号化された更なるオーディオ信号は、前記複数の符号化された多チャンネルオーディオ信号のうちの様々な符号化された多チャンネルオーディオ信号からの符号化されたオーディオデータを含む様々なチャンネルを有する多チャンネル信号である、請求項1に記載のオーディオ信号プロセッサ。
- 前記符号化された更なるオーディオ信号の各チャンネルは、前記様々な符号化された多チャンネルオーディオ信号のうちの1つの信号の1つのチャンネルに対応する、請求項7に記載のオーディオ信号プロセッサ。
- 前記発生器は、前記複数の符号化された多チャンネルオーディオ信号から前記符号化された更なるオーディオ信号の1つのチャンネル用の符号化されたオーディオデータを選択する、請求項1に記載のオーディオ信号プロセッサ。
- 前記発生器は、前記符号化された更なるオーディオ信号の前記符号化されたオーディオデータに対応するように前記第2の符号化された多チャンネルオーディオ信号の符号化制御データを変更することによって、前記符号化された更なるオーディオ信号用の符号化制御データを抽出する、請求項1に記載のオーディオ信号プロセッサ。
- ユーザ入力を受け取るユーザインターフェースと、
仮想ユーザ位置と、前記複数の符号化された多チャンネルオーディオ信号に関連付けられた仮想空間音源位置とを表す空間モデルと、
を更に含み、
前記発生器は、前記空間モデルに呼応して、前記複数の符号化された多チャンネルオーディオ信号のうちの前記第1の符号化された多チャンネルオーディオ信号と、前記第2の符号化された多チャンネルオーディオ信号とを選択する、請求項1に記載のオーディオ信号プロセッサ。 - 前記合成器は、前記空間モデルに呼応して、少なくとも前記復号化された更なるオーディオ信号に空間処理を適用する、請求項11に記載のオーディオ信号プロセッサ。
- 前記復号化された更なるオーディオ信号は、多チャンネル信号であり、前記空間処理は、前記空間モデルの様々な仮想空間音源位置に対応するように前記復号化された更なるオーディオ信号の様々なチャンネルを空間処理することを含む、請求項12に記載のオーディオ信号プロセッサ。
- 前記発生器は、前記仮想ユーザ位置と、前記第2の符号化された多チャンネルオーディオ信号に関連付けられる前記仮想空間音源位置との距離に呼応して、前記第2の符号化された多チャンネルオーディオ信号を選択する、請求項11に記載のオーディオ信号プロセッサ。
- オーディオ信号を処理する方法であって、
複数の符号化された多チャンネルオーディオ信号を受け取るステップと、
第1の復号化された多チャンネルオーディオ信号を生成するように、前記複数の符号化された多チャンネルオーディオ信号のうちの第1の符号化された多チャンネルオーディオ信号を復号化するステップと、
前記複数の符号化された多チャンネルオーディオ信号のうちの少なくとも第2の符号化された多チャンネルオーディオ信号から符号化されたオーディオデータを、前記第2の符号化された多チャンネルオーディオ信号からの前記符号化されたオーディオデータを含む符号化された更なるオーディオ信号のチャンネル数が、前記第2の符号化された多チャンネルオーディオ信号におけるチャンネル数より少ないように、選択することによって、前記符号化された更なるオーディオ信号を抽出するステップと、
前記符号化された更なるオーディオ信号を復号化することによって復号化された更なるオーディオ信号を生成するステップと、
多チャンネル出力信号を生成するように、少なくとも前記第1の復号化された多チャンネルオーディオ信号と前記復号化された更なるオーディオ信号とを合成するステップと、
を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11171280 | 2011-06-24 | ||
EP11171280.8 | 2011-06-24 | ||
PCT/IB2012/052795 WO2012176084A1 (en) | 2011-06-24 | 2012-06-04 | Audio signal processor for processing encoded multi - channel audio signals and method therefor |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014520473A JP2014520473A (ja) | 2014-08-21 |
JP2014520473A5 JP2014520473A5 (ja) | 2015-07-23 |
JP5895050B2 true JP5895050B2 (ja) | 2016-03-30 |
Family
ID=46321192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014516462A Expired - Fee Related JP5895050B2 (ja) | 2011-06-24 | 2012-06-04 | 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9626975B2 (ja) |
EP (1) | EP2724555B1 (ja) |
JP (1) | JP5895050B2 (ja) |
CN (1) | CN103620673B (ja) |
BR (1) | BR112013032727A2 (ja) |
RU (1) | RU2595910C2 (ja) |
WO (1) | WO2012176084A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10203839B2 (en) * | 2012-12-27 | 2019-02-12 | Avaya Inc. | Three-dimensional generalized space |
US9774974B2 (en) * | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
US9980078B2 (en) | 2016-10-14 | 2018-05-22 | Nokia Technologies Oy | Audio object modification in free-viewpoint rendering |
US11096004B2 (en) | 2017-01-23 | 2021-08-17 | Nokia Technologies Oy | Spatial audio rendering point extension |
US10531219B2 (en) | 2017-03-20 | 2020-01-07 | Nokia Technologies Oy | Smooth rendering of overlapping audio-object interactions |
US11074036B2 (en) | 2017-05-05 | 2021-07-27 | Nokia Technologies Oy | Metadata-free audio-object interactions |
US10165386B2 (en) | 2017-05-16 | 2018-12-25 | Nokia Technologies Oy | VR audio superzoom |
US10043523B1 (en) | 2017-06-16 | 2018-08-07 | Cypress Semiconductor Corporation | Advanced packet-based sample audio concealment |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US11395087B2 (en) | 2017-09-29 | 2022-07-19 | Nokia Technologies Oy | Level-based audio-object interactions |
US10542368B2 (en) | 2018-03-27 | 2020-01-21 | Nokia Technologies Oy | Audio content modification for playback audio |
US10771913B2 (en) | 2018-05-11 | 2020-09-08 | Dts, Inc. | Determining sound locations in multi-channel audio |
CN112218020B (zh) * | 2019-07-09 | 2023-03-21 | 海信视像科技股份有限公司 | 一种多声道平台音频数据传输方法及其装置 |
WO2023157650A1 (ja) * | 2022-02-16 | 2023-08-24 | ソニーグループ株式会社 | 信号処理装置および信号処理方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3059191B2 (ja) | 1990-05-24 | 2000-07-04 | ローランド株式会社 | 音像定位装置 |
JP3439485B2 (ja) | 1992-04-18 | 2003-08-25 | ヤマハ株式会社 | 映像連動音像定位装置 |
US5864820A (en) | 1996-12-20 | 1999-01-26 | U S West, Inc. | Method, system and product for mixing of encoded audio signals |
GB2321577B (en) | 1997-01-27 | 2001-08-01 | British Broadcasting Corp | Audio compression |
US6983251B1 (en) | 1999-02-15 | 2006-01-03 | Sharp Kabushiki Kaisha | Information selection apparatus selecting desired information from plurality of audio information by mainly using audio |
US7043312B1 (en) | 2000-02-17 | 2006-05-09 | Sonic Solutions | CD playback augmentation for higher resolution and multi-channel sound |
JP2001298680A (ja) * | 2000-04-17 | 2001-10-26 | Matsushita Electric Ind Co Ltd | ディジタル放送用信号の仕様およびその受信装置 |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
JP2003122374A (ja) * | 2001-10-17 | 2003-04-25 | Nippon Hoso Kyokai <Nhk> | サラウンド音響生成方法、その装置およびそのプログラム |
US8078475B2 (en) * | 2004-05-19 | 2011-12-13 | Panasonic Corporation | Audio signal encoder and audio signal decoder |
KR100773539B1 (ko) | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
JP4844093B2 (ja) * | 2005-11-11 | 2011-12-21 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
TWI420918B (zh) | 2005-12-02 | 2013-12-21 | Dolby Lab Licensing Corp | 低複雜度音訊矩陣解碼器 |
WO2007088490A1 (en) | 2006-01-31 | 2007-08-09 | Koninklijke Philips Electronics N.V. | Device for and method of processing audio data |
JP5222279B2 (ja) * | 2006-03-28 | 2013-06-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネルオーディオ再構成における信号整形のための改善された方法 |
JP4894386B2 (ja) | 2006-07-21 | 2012-03-14 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
RU2394283C1 (ru) * | 2007-02-14 | 2010-07-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |
CN101681663B (zh) | 2007-05-22 | 2013-10-16 | 皇家飞利浦电子股份有限公司 | 处理音频数据的设备和方法 |
WO2009084165A1 (ja) * | 2007-12-28 | 2009-07-09 | Panasonic Corporation | 音声混合再生装置 |
ES2391801T3 (es) * | 2008-01-01 | 2012-11-30 | Lg Electronics Inc. | Procedimiento y aparato para procesar una señal de audio |
CN101971132A (zh) | 2008-03-13 | 2011-02-09 | 皇家飞利浦电子股份有限公司 | 用于使得能够从多个项目中选择项目的方法和设备 |
US8380333B2 (en) * | 2009-12-21 | 2013-02-19 | Nokia Corporation | Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content and lowering computational load for processing audio data |
-
2012
- 2012-06-04 US US14/124,048 patent/US9626975B2/en not_active Expired - Fee Related
- 2012-06-04 RU RU2014102198/08A patent/RU2595910C2/ru not_active IP Right Cessation
- 2012-06-04 EP EP20120728809 patent/EP2724555B1/en not_active Not-in-force
- 2012-06-04 BR BR112013032727A patent/BR112013032727A2/pt not_active IP Right Cessation
- 2012-06-04 WO PCT/IB2012/052795 patent/WO2012176084A1/en active Application Filing
- 2012-06-04 JP JP2014516462A patent/JP5895050B2/ja not_active Expired - Fee Related
- 2012-06-04 CN CN201280031218.2A patent/CN103620673B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2724555A1 (en) | 2014-04-30 |
RU2595910C2 (ru) | 2016-08-27 |
US20140133661A1 (en) | 2014-05-15 |
US9626975B2 (en) | 2017-04-18 |
RU2014102198A (ru) | 2015-07-27 |
JP2014520473A (ja) | 2014-08-21 |
CN103620673A (zh) | 2014-03-05 |
EP2724555B1 (en) | 2015-04-22 |
BR112013032727A2 (pt) | 2017-01-31 |
CN103620673B (zh) | 2016-04-27 |
WO2012176084A1 (en) | 2012-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5895050B2 (ja) | 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法 | |
KR102178231B1 (ko) | 인코딩된 오디오 메타데이터-기반 등화 | |
CN102779514B (zh) | 对多声道音频信号进行编码/解码的系统、介质和方法 | |
EP2205007B1 (en) | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction | |
KR102294767B1 (ko) | 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱 | |
AU2007312597B2 (en) | Apparatus and method for multi -channel parameter transformation | |
EP3025329B1 (en) | Concept for audio encoding and decoding for audio channels and audio objects | |
CN101151658B (zh) | 多声道音频编码和解码方法、编码器和解码器 | |
RU2643644C2 (ru) | Кодирование и декодирование аудиосигналов | |
EP1376538B1 (en) | Hybrid multi-channel/cue coding/decoding of audio signals | |
KR102374897B1 (ko) | 3차원 오디오 사운드트랙의 인코딩 및 재현 | |
CN103890841A (zh) | 音频对象编码和解码 | |
CN114554386A (zh) | 用于自适应音频的混合型基于优先度的渲染系统和方法 | |
JP2005533426A (ja) | オーディオ符合化方法 | |
JP2012234192A (ja) | オーディオソースのパラメトリックジョイント符号化 | |
WO2005122639A1 (ja) | 音響信号符号化装置および音響信号復号装置 | |
WO2020104726A1 (en) | Ambience audio representation and associated rendering | |
CN106716525A (zh) | 下混音频信号中的声音对象插入 | |
WO2020080099A1 (ja) | 信号処理装置および方法、並びにプログラム | |
WO2008084436A1 (en) | An object-oriented audio decoder | |
JP2018518875A (ja) | オーディオ信号処理装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150602 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150602 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151116 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160229 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5895050 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |