JP2017535153A - オーディオ・エンコーダおよびデコーダ - Google Patents
オーディオ・エンコーダおよびデコーダ Download PDFInfo
- Publication number
- JP2017535153A JP2017535153A JP2017517248A JP2017517248A JP2017535153A JP 2017535153 A JP2017535153 A JP 2017535153A JP 2017517248 A JP2017517248 A JP 2017517248A JP 2017517248 A JP2017517248 A JP 2017517248A JP 2017535153 A JP2017535153 A JP 2017535153A
- Authority
- JP
- Japan
- Prior art keywords
- dialog
- downmix
- object representing
- audio objects
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 74
- 238000009877 rendering Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 abstract description 7
- 239000011159 matrix material Substances 0.000 description 38
- 230000005236 sound signal Effects 0.000 description 14
- 238000012937 correction Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は2014年10月1日に出願された米国仮特許出願第62/058,157号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本開示は、概括的にはオーディオ符号化に関する。詳細には、オーディオ・システムにおけるデコーダにおいてダイアログを向上させるための方法および装置に関する。本開示はさらに、ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードする方法および装置に関する。
第一の側面によれば、例示的実施形態は、デコード方法、デコーダおよびデコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、デコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
例示的実施形態によれば、本方法はさらに、前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領し、ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する前記情報を、前記空間的情報をもつデータに基づいて計算する段階を含む。この実施形態の利点は、ダウンミックス信号およびサイド情報を含むビットストリームをエンコーダに伝送するために必要とされるビットレートが低減されるということでありうる。前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する前記空間的情報は、いずれにせよデコーダによって受領されうるのであり、さらなる情報やデータがデコーダによって受領される必要がないからである。
第二の側面によれば、例示的実施形態は、エンコード方法、エンコーダおよびエンコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、エンコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。一般に、第二の側面の特徴は第一の側面の対応する特徴と同じ利点をもちうる。
上記のように、ダイアログ向上は、他のオーディオ成分に対するダイアログ・レベルの増大に関する。コンテンツ生成から適正に編成されると、オブジェクト・コンテンツは、ダイアログが別個のオブジェクトによって表現できるので、ダイアログ向上のために好適である。オブジェクト(すなわち、オブジェクト・クラスターまたはダウンミックス信号)のパラメトリック符号化は、ダイアログと他のオブジェクトとの間の混合を導入することがある。
Q=(absP)TC
によって計算されてもよい。ここで、absPは、未修正のウェット・アップミックス行列Pの要素の絶対値を取ることによって得られる行列を表わし、Cは未修正のドライ・アップミックス行列を表わす。
ここで、Dbは、ブーストされたダイアログ部分を含む修正されたダウンミックス214である。修正行列Mは
M=GC 式2
によって得られる。ここで、Gはダウンミックス利得の[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]行列、すなわち、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号110の現在デコードされている時間‐周波数タイルD中に混合されたかを記述する情報202である。Cは修正された係数218の[ダイアログ・オブジェクト数,ダウンミックス・チャネル数]行列である。
ここで、Xbは向上されたダイアログ部分を含む修正されたダウンミックス214である。修正行列Eは
E=I+GC 式4
によって得られる。ここで、Iは[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]の恒等行列、Gはダウンミックス利得の[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]行列、すなわちダイアログを表わす前記少なくとも一つのオブジェクトがどのように現在デコードされている複数のダウンミックス信号110中に混合されたかを記述する情報202であり、Cは修正された係数218の[ダイアログ・オブジェクト数,ダウンミックス・チャネル数]行列である。
G=[rendCoef1,rendCoef2,…,rendCoefn] 式5
によって得られる。ここで、rendCoefiは、n個のダイアログ・オブジェクトのうちダイアログ・オブジェクトiについてのレンダリング係数である。
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
Claims (25)
- オーディオ・システムにおけるデコーダにおいてダイアログを向上させる方法であって:
複数のダウンミックス信号を受領する段階であって、前記ダウンミックス信号はダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトのダウンミックスである、段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を受領する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを受領する段階と、
向上パラメータおよび前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを使って前記係数を修正する段階と、
修正された係数を使ってダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階とを含む、
方法。 - 前記向上パラメータを使って前記係数を修正する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトの再構成を可能にする係数に、前記向上パラメータを乗算することを含む、請求項1記載の方法。
- 前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を、前記サイド情報から計算することを含む、請求項1または2記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトのみを再構成することを含む、請求項1ないし3のうちいずれか一項記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトのみの再構成は、前記ダウンミックス信号の脱相関を含まない、請求項4記載の方法。
- ダイアログを表わす再構成された前記少なくとも一つのオブジェクトを前記ダウンミックス信号と、少なくとも一つの別個の信号としてマージする段階をさらに含む、請求項4または5記載の方法。
- 前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
前記複数のダウンミックス信号およびダイアログを表わす再構成された前記少なくとも一つのオブジェクトを、前記空間的情報をもつデータに基づいてレンダリングする段階とを含む、
請求項6記載の方法。 - 前記ダウンミックス信号およびダイアログを表わす再構成された前記少なくとも一つのオブジェクトを、ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を使って、組み合わせる段階をさらに含む、
請求項4または5記載の方法。 - 前記ダウンミックス信号とダイアログを表わす再構成された前記少なくとも一つのオブジェクトとの組み合わせをレンダリングする段階をさらに含む、請求項8記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を受領する段階をさらに含む、
請求項8または9記載の方法。 - ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されたかを記述する受領された前記情報は、エントロピー符号化によって符号化されている、請求項10記載の方法。
- 前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する前記情報を、前記空間的情報をもつデータに基づいて計算する段階とをさらに含む、
請求項8または9記載の方法。 - 前記計算する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置を、前記複数のダウンミックス信号についての空間位置にマッピングする関数を適用することを含む、請求項12記載の方法。
- 前記関数が3Dパン・アルゴリズムである、請求項13記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、前記複数のオーディオ・オブジェクトを再構成することを含む、請求項1記載の方法。
- 前記複数のオーディオ・オブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
前記空間的情報をもつデータに基づいて、再構成された前記複数のオーディオ・オブジェクトをレンダリングする段階とをさらに含む、
請求項15記載の方法。 - 請求項1ないし16のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
- オーディオ・システムにおいてダイアログを向上させるデコーダであって:
ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を受領し、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を受領し、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを受領するよう構成された受領段と;
向上パラメータおよび前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを使って前記係数を修正するよう構成された修正段と;
修正された係数を使ってダイアログを表わす前記少なくとも一つのオブジェクトを再構成するよう構成された再構成段とを有する、
デコーダ。 - ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードする方法であって:
ダイアログを表わす少なくとも一つのオブジェクトを含む前記複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を決定する段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を決定する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを決定する段階と、
前記複数のダウンミックス信号、前記サイド情報および前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを含むビットストリームを形成する段階とを含む、
方法。 - 前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報を決定する段階と、
前記空間的情報を前記ビットストリームに含める段階とをさらに含む、
請求項19記載の方法。 - 前記複数のダウンミックス信号を決定する段階はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する情報を決定することを含み、
当該方法はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する前記情報を、前記ビットストリームに含める段階を含む、
請求項19または20記載の方法。 - ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する決定された前記情報が、エントロピー符号化を使ってエンコードされる、請求項21記載の方法。
- 前記複数のオーディオ・オブジェクトについての空間位置に対応する空間的情報を決定する段階と、
前記複数のオーディオ・オブジェクトについての空間位置に対応する前記空間的情報を前記ビットストリームに含める段階とをさらに含む、
請求項19ないし22のうちいずれか一項記載の方法。 - 請求項19ないし23のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
- ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードするエンコーダであって:
ダイアログを表わす少なくとも一つのオブジェクトを含む前記複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を決定し、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を決定するよう構成されたダウンミックス段と、
前記複数のダウンミックス信号および前記サイド情報を含むビットストリームであって、前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータをさらに含むビットストリームを形成するよう構成された符号化段とを有する、
エンコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462058157P | 2014-10-01 | 2014-10-01 | |
US62/058,157 | 2014-10-01 | ||
PCT/EP2015/072666 WO2016050899A1 (en) | 2014-10-01 | 2015-10-01 | Audio encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017535153A true JP2017535153A (ja) | 2017-11-24 |
JP6732739B2 JP6732739B2 (ja) | 2020-07-29 |
Family
ID=54238446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017517248A Active JP6732739B2 (ja) | 2014-10-01 | 2015-10-01 | オーディオ・エンコーダおよびデコーダ |
Country Status (8)
Country | Link |
---|---|
US (1) | US10163446B2 (ja) |
EP (1) | EP3201916B1 (ja) |
JP (1) | JP6732739B2 (ja) |
KR (2) | KR20220066996A (ja) |
CN (1) | CN107077861B (ja) |
ES (1) | ES2709117T3 (ja) |
RU (1) | RU2696952C2 (ja) |
WO (1) | WO2016050899A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160315722A1 (en) * | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US9961475B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US10249312B2 (en) | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
CN110998724B (zh) | 2017-08-01 | 2021-05-21 | 杜比实验室特许公司 | 基于位置元数据的音频对象分类 |
EP3444820B1 (en) * | 2017-08-17 | 2024-02-07 | Dolby International AB | Speech/dialog enhancement controlled by pupillometry |
KR20210151831A (ko) * | 2019-04-15 | 2021-12-14 | 돌비 인터네셔널 에이비 | 오디오 코덱에서의 대화 향상 |
US12118987B2 (en) | 2019-04-18 | 2024-10-15 | Dolby Laboratories Licensing Corporation | Dialog detector |
US11710491B2 (en) | 2021-04-20 | 2023-07-25 | Tencent America LLC | Method and apparatus for space of interest of audio scene |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010508545A (ja) * | 2007-02-14 | 2010-03-18 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置 |
JP2010536299A (ja) * | 2007-08-13 | 2010-11-25 | エルジー エレクトロニクス インコーポレイティド | リミキシング能力を有する向上したオーディオ |
JP2011528200A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5870480A (en) | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
US7415120B1 (en) * | 1998-04-14 | 2008-08-19 | Akiba Electronics Institute Llc | User adjustable volume control that accommodates hearing |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
WO1999053612A1 (en) * | 1998-04-14 | 1999-10-21 | Hearing Enhancement Company, Llc | User adjustable volume control that accommodates hearing |
US7283965B1 (en) | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
RU2376655C2 (ru) * | 2005-04-19 | 2009-12-20 | Коудинг Текнолоджиз Аб | Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука |
CN101253550B (zh) * | 2005-05-26 | 2013-03-27 | Lg电子株式会社 | 将音频信号编解码的方法 |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
JP4823030B2 (ja) * | 2006-11-27 | 2011-11-24 | 株式会社ソニー・コンピュータエンタテインメント | 音声処理装置および音声処理方法 |
DE602008001787D1 (de) | 2007-02-12 | 2010-08-26 | Dolby Lab Licensing Corp | Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
ES2704286T3 (es) * | 2007-08-27 | 2019-03-15 | Ericsson Telefon Ab L M | Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales |
US20090226152A1 (en) | 2008-03-10 | 2009-09-10 | Hanes Brett E | Method for media playback optimization |
EP2373067B1 (en) * | 2008-04-18 | 2013-04-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
WO2010130084A1 (zh) | 2009-05-12 | 2010-11-18 | 华为终端有限公司 | 远程呈现系统、方法及视频采集设备 |
EP2478444B1 (en) | 2009-09-14 | 2018-12-12 | DTS, Inc. | System for adaptive voice intelligibility processing |
CN108989721B (zh) | 2010-03-23 | 2021-04-16 | 杜比实验室特许公司 | 用于局域化感知音频的技术 |
KR101429564B1 (ko) * | 2010-09-28 | 2014-08-13 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 디코딩된 다중채널 오디오 신호 또는 디코딩된 스테레오 신호를 포스트프로세싱하기 위한 장치 및 방법 |
CN103329571B (zh) | 2011-01-04 | 2016-08-10 | Dts有限责任公司 | 沉浸式音频呈现系统 |
EP2727383B1 (en) | 2011-07-01 | 2021-04-28 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
US9955280B2 (en) * | 2012-04-19 | 2018-04-24 | Nokia Technologies Oy | Audio scene apparatus |
WO2013184520A1 (en) * | 2012-06-04 | 2013-12-12 | Stone Troy Christopher | Methods and systems for identifying content types |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
CN104604256B (zh) | 2012-08-31 | 2017-09-15 | 杜比实验室特许公司 | 基于对象的音频的反射声渲染 |
JP6186436B2 (ja) | 2012-08-31 | 2017-08-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング |
EP2891338B1 (en) | 2012-08-31 | 2017-10-25 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
US9805725B2 (en) | 2012-12-21 | 2017-10-31 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
CN105493182B (zh) | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
US10621994B2 (en) * | 2014-06-06 | 2020-04-14 | Sony Corporaiton | Audio signal processing device and method, encoding device and method, and program |
-
2015
- 2015-10-01 KR KR1020227016227A patent/KR20220066996A/ko not_active Application Discontinuation
- 2015-10-01 KR KR1020177008778A patent/KR102482162B1/ko active IP Right Grant
- 2015-10-01 RU RU2017113711A patent/RU2696952C2/ru active
- 2015-10-01 JP JP2017517248A patent/JP6732739B2/ja active Active
- 2015-10-01 CN CN201580053303.2A patent/CN107077861B/zh active Active
- 2015-10-01 WO PCT/EP2015/072666 patent/WO2016050899A1/en active Application Filing
- 2015-10-01 US US15/515,775 patent/US10163446B2/en active Active
- 2015-10-01 ES ES15771962T patent/ES2709117T3/es active Active
- 2015-10-01 EP EP15771962.6A patent/EP3201916B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010508545A (ja) * | 2007-02-14 | 2010-03-18 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置 |
JP2010536299A (ja) * | 2007-08-13 | 2010-11-25 | エルジー エレクトロニクス インコーポレイティド | リミキシング能力を有する向上したオーディオ |
JP2011528200A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
ES2709117T3 (es) | 2019-04-15 |
RU2696952C2 (ru) | 2019-08-07 |
US10163446B2 (en) | 2018-12-25 |
RU2017113711A (ru) | 2018-11-07 |
WO2016050899A1 (en) | 2016-04-07 |
BR112017006278A2 (pt) | 2017-12-12 |
KR20220066996A (ko) | 2022-05-24 |
CN107077861A (zh) | 2017-08-18 |
EP3201916A1 (en) | 2017-08-09 |
JP6732739B2 (ja) | 2020-07-29 |
CN107077861B (zh) | 2020-12-18 |
EP3201916B1 (en) | 2018-12-05 |
RU2017113711A3 (ja) | 2019-04-19 |
KR20170063657A (ko) | 2017-06-08 |
US20170249945A1 (en) | 2017-08-31 |
KR102482162B1 (ko) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP5563647B2 (ja) | マルチチャンネル復号化方法及びマルチチャンネル復号化装置 | |
US9966080B2 (en) | Audio object encoding and decoding | |
KR101858479B1 (ko) | 제 1 및 제 2 입력 채널들을 적어도 하나의 출력 채널에 매핑하기 위한 장치 및 방법 | |
TWI485699B (zh) | 音訊信號訊框中事件槽位的編碼與解碼技術 | |
KR101761569B1 (ko) | 오디오 현장의 코딩 | |
JP5490143B2 (ja) | ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム | |
JP6134867B2 (ja) | レンダラ制御式空間アップミックス | |
US9478228B2 (en) | Encoding and decoding of audio signals | |
US11056122B2 (en) | Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal | |
JP7383685B2 (ja) | バイノーラル・ダイアログ向上 | |
JP6640849B2 (ja) | マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード | |
JP6686015B2 (ja) | オーディオ信号のパラメトリック混合 | |
CN106796804B (zh) | 用于对话增强的解码方法和解码器 | |
KR102657547B1 (ko) | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 | |
JP6248186B2 (ja) | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ | |
JP2024503186A (ja) | マルチチャネル・コーデックにおける空間ノイズ充填 | |
BR112017006278B1 (pt) | Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6732739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |