JP7001588B2 - オブジェクトベースのオーディオ信号バランシング法 - Google Patents
オブジェクトベースのオーディオ信号バランシング法 Download PDFInfo
- Publication number
- JP7001588B2 JP7001588B2 JP2018522683A JP2018522683A JP7001588B2 JP 7001588 B2 JP7001588 B2 JP 7001588B2 JP 2018522683 A JP2018522683 A JP 2018522683A JP 2018522683 A JP2018522683 A JP 2018522683A JP 7001588 B2 JP7001588 B2 JP 7001588B2
- Authority
- JP
- Japan
- Prior art keywords
- interactive
- signal
- dialogue
- term
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 98
- 238000000034 method Methods 0.000 title claims description 87
- 230000002452 interceptive effect Effects 0.000 claims description 297
- 230000007774 longterm Effects 0.000 claims description 113
- 238000012545 processing Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 10
- 238000009877 rendering Methods 0.000 claims description 9
- 230000003068 static effect Effects 0.000 claims description 4
- 238000013479 data entry Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 description 24
- 230000033001 locomotion Effects 0.000 description 20
- 230000015654 memory Effects 0.000 description 12
- 230000009471 action Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 239000000203 mixture Substances 0.000 description 7
- 230000003993 interaction Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 206010011878 Deafness Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001010 compromised effect Effects 0.000 description 2
- 230000010370 hearing loss Effects 0.000 description 2
- 231100000888 hearing loss Toxicity 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/005—Control by a pilot signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Stereophonic System (AREA)
Description
本出願は、引用によって本明細書に全体的に組み込まれる、2015年10月28日に出願された米国出願第62/247,678号に対する優先権の利益を主張する。
L=-0.691+10log10[Σ(m∈Ω)kmp(m)/|J|] (1)
ここでp(m)は、オーディオ信号ブロックmで測定されたパワーであり、各信号ブロックは、75%のオーバラップを有する400ms持続時間であり、Ωは、低レベル信号フレームが廃棄されるゲーティング基準に従うパワー平均に含めるよう選択された信号ブロックのセットを表し、|J|は、ゲート後に保持された信号フレームのセットであるJの要素のカウント又は数を示す。マルチチャネル信号では、ブロックmのパワー寄与は、空間位置に値が依存する係数kmにより重み付けすることができる。
S = LD - LN (2)
ここでLD及びLNは、それぞれの信号ブロックセットΩD及びΩNに対して式(1)に従って計算される。ブロックセットΩD及びΩNは、対話オブジェクト及び非対話オブジェクトそれぞれにΩを限定することによって定義される。
GD-GN=SP-S (3)
pow(LD+GD)+pow(LN+GN)=pow(L) (4)
式(4)において、pow()は、LUFSからパワーへの変換、すなわち式(1)のように
pow(L)=|J|exp10[(L+0.691)/10]
を示す。式(3)は対話バランス補正を表し、式(4)は全体的なオーディオプログラムラウドネス保存を保証する。
s(m)=ID(m)-IN(m) (5)
式(5)において、mがブロック指数であり、ID(m)がブロックmに対する対話オブジェクトの短期ラウドネスを示し、IN(m)が同じブロックmに対する非対話オブジェクトの短期ラウドネスである。値ID(m)及びIS(m)は、例えば、式(1)のアンゲート形態などを用いて対話オブジェクト及び非対話オブジェクトそれぞれに関してパワー平均化を実行することによりブロック指数mに対して計算することができる。
senv(m)=αs(m)+(1-α)senv(m-1) (6)
110 1又は2以上のオーディオ信号
111 符号化されたオーディオ信号
112 1又は2以上の出力信号
113 メタデータ
114 プログラムジャンル
120 エンコーダ
122 マルチプレクサ
130 復号器
131 入力
132 デマルチプレクサ
133 第2入力
135 プロセッサ回路
136 対話バランス設定
139 出力
140 データベース
150 再生デバイス
Claims (18)
- オーディオプログラムにおける対話信号と非対話信号の関係を調整する方法であって、前記方法は、
プロセッサ回路を用いて、前記オーディオプログラムの対話対非対話ラウドネス関係を示す前記オーディオプログラムに対する長期対話バランスを受け取るステップと、
前記プロセッサ回路を用いて、長期対話バランスプリファレンスを受け取るステップと、
前記プロセッサ回路を用いて、前記オーディオプログラムの前記対話信号及び前記非対話信号のうちの少なくとも1つに適用する長期ゲイン又は減衰を決定するステップであって、前記長期ゲイン又は減衰は、前記オーディオプログラムに対する受け取った前記長期対話バランスと受け取った前記長期対話バランスプリファレンスとの間の差に従って決定される、ステップと、
前記プロセッサ回路を用いて、前記オーディオプログラムの複数のセグメントの各々に対して短期対話バランスを受け取るステップであって、前記各短期対話バランスは、指定されたセグメントにおける対話対非対話ラウドネス関係を示す、ステップと、
前記プロセッサ回路を用いて、短期対話バランスプリファレンスを受け取るステップと、
前記プロセッサ回路を用いて、前記対話信号及び前記非対話信号のうちの少なくとも1つに適用する短期ゲイン又は減衰を決定するステップであって、前記短期ゲイン又は減衰は、前記セグメントのうちの指定されたセグメントに対して受け取った短期ラウドネスバランスと前記短期対話ラウドネスプリファレンスとの間の差に従って決定される、ステップと、
(1)前記決定された長期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用するステップ、及び(2)前記決定された短期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用するステップによって、ゲイン調整された対話信号及び/又はゲイン調整された非対話信号を提供するステップと、
前記ゲイン調整された対話信号及び/又は前記ゲイン調整された非対話信号を含むオーディオ出力信号をレンダリングするステップと、
を含む、方法。 - 前記オーディオプログラムの前記対話信号に適用する前記長期ゲインを決定するステップと、
前記プロセッサ回路を用いて、前記決定された長期ゲインを前記対話信号に適用してゲイン調整された対話信号を生成するステップと、
前記ゲイン調整された対話信号と前記非対話信号との組み合わせを含むオーディオ出力信号をレンダリングするステップと、
を更に含む、請求項1に記載の方法。 - 前記オーディオプログラムの前記対話信号に適用する前記長期減衰を決定するステップと、
前記プロセッサ回路を用いて前記決定された長期減衰を前記対話信号に適用して調整された対話信号を生成するステップと、
前記調整された対話信号と前記非対話信号との組み合わせを含むオーディオ出力信号をレンダリングするステップと、
を更に含む、請求項1に記載の方法。 - 前記対話信号及び前記非対話信号に適用するそれぞれの異なる長期ゲイン又は減衰量を決定するステップを更に含む、請求項1に記載の方法。
- 前記プロセッサ回路を用いて、前記オーディオプログラムの前記対話信号に対応する長期対話ラウドネスメトリックを受け取るステップと、
前記オーディオプログラムの前記非対話信号に対応する長期非対話ラウドネスメトリックを受け取るステップと、
前記プロセッサ回路を用いて、前記受け取った対話ラウドネスメトリックと前記非対話ラウドネスメトリックとの間の差に基づいて前記長期対話バランスを提供するステップと、
を更に含む、請求項1に記載の方法。 - 前記対話信号を前記プロセッサ回路にて受け取るステップであって、前記対話信号が、前記オーディオプログラムについての前記対話信号のグローバルラウドネスに関する情報を備えた第1メタデータを含む、ステップと、
前記非対話信号を前記プロセッサ回路にて受け取るステップであって、前記非対話信号が、前記オーディオプログラムについての前記非対話信号のグローバルラウドネスに関する情報を備えた第2メタデータを含む、ステップと、
を更に含み、
前記オーディオプログラムについての前記長期対話バランスを受け取るステップは、前記プロセッサ回路を用いて、前記対話信号のグローバルラウドネス及び前記非対話信号のグローバルラウドネスに基づいて前記長期対話バランスを決定するステップを含む、請求項1に記載の方法。 - 前記長期ゲイン又は減衰を決定するステップは、前記オーディオプログラムの持続時間の間に対話信号に適用する静的ゲイン又は減衰を決定するステップを含む、請求項1に記載の方法。
- 前記対話ラウドネスプリファレンスを受け取るステップは、前記オーディオプログラムのジャンルに対応するジャンル固有の対話ラウドネスプリファレンスを受け取るステップを含む、請求項1に記載の方法。
- 前記対話信号から及び/又は前記非対話信号から回復されたメタデータに基づいて、前記オーディオプログラムのジャンルを決定するステップを更に含む、請求項8に記載の方法。
- 前記対話ラウドネスプリファレンスを受け取るステップは、前記オーディオプログラムを再生するように構成された再生デバイスに対応する再生デバイス固有の対話ラウドネスプリファレンスを受け取るステップを含む、請求項1に記載の方法。
- デコーダ装置を備えたオーディオ信号処理システムであって、
前記デコーダ装置が、
対話信号、非対話信号、及び前記対話信号及び/又は前記非対話信号に対応するメタデータを受け取るように構成された第1データ入力と、
長期対話バランスプリファレンス及び短期対話バランスプリファレンスを受け取るように構成された第2データ入力と、
オーディオ信号出力と、
プロセッサ回路と、
を含み、
前記プロセッサ回路が、
前記対話信号及び/又は前記非対話信号に対応する前記メタデータを用いて、前記対話信号及び前記非対話信号を含むオーディオプログラムに対して、前記オーディオプログラムの対話対非対話ラウドネス関係を示す長期対話バランスを識別し、
前記オーディオプログラムに対する識別された長期対話バランスと前記受け取った長期対話バランスプリファレンスとの間の差に基づいて、前記オーディオプログラムの前記対話信号及び前記非対話信号のうちの1つに適用する長期ゲイン又は減衰を決定し、
各々が指定されたセグメントにおける対話対非対話ラウドネス関係を示す短期対話バランスであって、前記対話信号及び前記非対話信号に対応するメタデータを用いて、前記オーディオプログラムの複数のセグメントの各々に対して短期対話バランスを識別し、
前記セグメントのうちの指定されたセグメントに対して識別された短期ラウドネスバランスと短期対話ラウドネスプリファレンスとの間の差に基づいている短期ゲイン又は減衰であって、前記対話信号及び前記非対話信号のうちの少なくとも1つに適用する前記短期ゲイン又は減衰を決定し、
(1)前記決定された長期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用すること、及び(2)前記決定された短期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用することによって、ゲイン調整された対話信号及び/又はゲイン調整された非対話信号を提供し、
前記ゲイン調整された対話信号及び/又は前記ゲイン調整された非対話信号を含むオーディオ出力信号をレンダリングする、
ように構成されている、オーディオ信号処理システム。 - 前記デコーダ装置は、前記対話信号及び/又は前記非対話信号に対応するオーディオプログラムタイプ指標を受け取るように構成された第3入力を含み、
前記プロセッサ回路は、前記オーディオプログラムタイプ指標、及び、前記オーディオプログラムに対する識別された長期対話バランスと前記受け取った対話バランスプリファレンスとの間の差に基づいて、前記長期ゲイン又は減衰を決定するように構成される、請求項11に記載のオーディオ信号処理システム。 - 前記第1データ入力は、前記対話信号及び前記非対話信号に対応するメタデータを受け取るように構成され、
前記プロセッサ回路は、前記対話信号及び非対話信号に対応する前記受け取ったメタデータに基づいて、前記対話信号及び非対話信号のそれぞれの長期ラウドネス特性を識別するように構成され、
前記プロセッサ回路は、前記対話信号及び非対話信号の前記長期ラウドネス特性の間の関係に基づいて前記オーディオプログラムに対する長期対話バランスを識別するように構成される、請求項11に記載のオーディオ信号処理システム。 - 前記プロセッサ回路は、ユーザ指定の短期対話バランスプリファレンス設定に従って前記対話信号を処理するよう更に構成される、請求項11に記載のオーディオ信号処理システム。
- オーディオプログラムの対話オーディオ信号及び非対話オーディオ信号間のバランスを調整するためのオーディオ信号処理システムであって、前記システムがプロセッサ回路を備えは、該プロセッサ回路が、
前記オーディオプログラムの対話部分のラウドネス特性を表す、前記対話オーディオ信号に対する長期対話ラウドネスメトリックを識別し、
前記オーディオプログラムの非対話部分のラウドネス特性を表す、前記非対話オーディオ信号に対する長期ラウドネスメトリックを識別し、
、
各々が指定されたセグメントにおける対話対非対話ラウドネス関係を示す短期対話バランスであって、前記オーディオプログラムの複数のセグメントの各々に対して前記短期対話バランスを受け取り、
短期対話バランスプリファレンスを受け取り、
前記セグメントのうちの指定されたセグメントに対して受け取った短期ラウドネスバランスと前記短期対話ラウドネスプリファレンスとの間の差に従って決定される短期ゲイン又は減衰であって、前記対話信号及び前記非対話信号のうちの少なくとも1つに適用する前記短期ゲイン又は減衰を決定し、
(1)前記決定された長期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用すること、及び(2)前記決定された短期ゲイン又は減衰を前記対話信号及び前記非対話信号のうちの少なくとも1つに適用することによって、ゲイン調整された対話信号及び/又はゲイン調整された非対話信号を提供し、
前記ゲイン調整された対話信号及び/又は前記ゲイン調整された非対話信号を含むオーディオ出力信号をレンダリングする、ように構成されており、オーディオ信号処理システム。 - 前記プロセッサ回路は、前記オーディオプログラムに対応するプログラムタイプの受け取った指標に基づいて、前記対話オーディオ信号及び/又は前記非対話オーディオ信号に適用するゲインの量を決定するように構成される、請求項15に記載のオーディオ信号処理システム。
- 前記プロセッサ回路は、ユーザプリファレンスに基づいて、前記対話オーディオ信号及び/又は前記非対話オーディオ信号に適用するゲインの量を決定するように構成される、請求項15に記載のオーディオ信号処理システム。
- 前記プロセッサ回路は、再生環境又は再生デバイスの受け取った指標に基づいて、前記対話オーディオ信号及び/又は前記非対話オーディオ信号に適用するゲインの量を決定するように構成される、請求項15に記載のオーディオ信号処理システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562247678P | 2015-10-28 | 2015-10-28 | |
US62/247,678 | 2015-10-28 | ||
PCT/US2016/059175 WO2017075249A1 (en) | 2015-10-28 | 2016-10-27 | Object-based audio signal balancing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019501563A JP2019501563A (ja) | 2019-01-17 |
JP7001588B2 true JP7001588B2 (ja) | 2022-01-19 |
Family
ID=58630724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018522683A Active JP7001588B2 (ja) | 2015-10-28 | 2016-10-27 | オブジェクトベースのオーディオ信号バランシング法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10251016B2 (ja) |
EP (1) | EP3369175B1 (ja) |
JP (1) | JP7001588B2 (ja) |
KR (1) | KR20180132032A (ja) |
CN (1) | CN108432130B (ja) |
WO (1) | WO2017075249A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2749832B1 (fr) * | 1996-06-12 | 1998-09-11 | Delmas | Systeme de recuperation d'eau de condensation a l'interieur de conteneurs, et conteneur equipe d'un tel systeme de recuperation |
US10251016B2 (en) | 2015-10-28 | 2019-04-02 | Dts, Inc. | Dialog audio signal balancing in an object-based audio program |
EP3698201A4 (en) | 2017-10-17 | 2020-12-09 | Magic Leap, Inc. | MIXED REALITY SPACE AUDIO |
US11477510B2 (en) | 2018-02-15 | 2022-10-18 | Magic Leap, Inc. | Mixed reality virtual reverberation |
CN112236940A (zh) | 2018-05-30 | 2021-01-15 | 奇跃公司 | 用于滤波器参数的索引方案 |
WO2020185025A1 (ko) * | 2019-03-14 | 2020-09-17 | 가우디오랩 주식회사 | 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치 |
US11545166B2 (en) | 2019-07-02 | 2023-01-03 | Dolby International Ab | Using metadata to aggregate signal processing operations |
WO2021081435A1 (en) | 2019-10-25 | 2021-04-29 | Magic Leap, Inc. | Reverberation fingerprint estimation |
US11533560B2 (en) | 2019-11-15 | 2022-12-20 | Boomcloud 360 Inc. | Dynamic rendering device metadata-informed audio enhancement system |
EP4062649A2 (en) | 2019-11-20 | 2022-09-28 | Dolby International AB | Methods and devices for personalizing audio content |
CN111327944A (zh) * | 2020-03-09 | 2020-06-23 | 上海电力大学 | 一种基于嵌入式cpu的广播语音响度检测的方法 |
CN117280416A (zh) | 2021-03-08 | 2023-12-22 | 弗劳恩霍夫应用研究促进协会 | 用于自适应背景音频增益平滑的装置和方法 |
CN113963724A (zh) * | 2021-09-18 | 2022-01-21 | 赛因芯微(北京)电子科技有限公司 | 音频内容元数据和产生方法、电子设备及存储介质 |
CN115879422B (zh) * | 2023-02-16 | 2023-06-13 | 之江实验室 | 一种对话回复生成方法、装置和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002171482A (ja) | 2000-12-01 | 2002-06-14 | Hitachi Ltd | 記録装置およびビデオカメラ |
JP2003522472A (ja) | 2000-02-04 | 2003-07-22 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 消費者アプリケーションにおける音声対残余オーディオ(vra)の使用 |
JP2005167380A (ja) | 2003-11-28 | 2005-06-23 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
JP2005348216A (ja) | 2004-06-04 | 2005-12-15 | Nippon Hoso Kyokai <Nhk> | 音質補正伝送システム、送信装置、受信装置 |
JP2013543599A (ja) | 2010-09-22 | 2013-12-05 | ドルビー ラボラトリーズ ライセンシング コーポレイション | デジタルレベル正規化を備えるオーディオストリームミキシング |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69942521D1 (de) * | 1998-04-14 | 2010-08-05 | Hearing Enhancement Co Llc | Vom benutzer einstellbare lautstärkensteuerung zur höranpassung |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
JP4197344B2 (ja) * | 2006-02-20 | 2008-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声対話システム |
KR101137359B1 (ko) | 2006-09-14 | 2012-04-25 | 엘지전자 주식회사 | 다이알로그 증폭 기술 |
US8489392B2 (en) * | 2006-11-06 | 2013-07-16 | Nokia Corporation | System and method for modeling speech spectra |
WO2008078232A1 (en) * | 2006-12-21 | 2008-07-03 | Koninklijke Philips Electronics N.V. | A system for processing audio data |
WO2008100503A2 (en) | 2007-02-12 | 2008-08-21 | Dolby Laboratories Licensing Corporation | Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
SG189747A1 (en) | 2008-04-18 | 2013-05-31 | Dolby Lab Licensing Corp | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
US9391579B2 (en) * | 2010-09-10 | 2016-07-12 | Dts, Inc. | Dynamic compensation of audio signals for improved perceived spectral imbalances |
TWI687918B (zh) * | 2010-12-03 | 2020-03-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
JP5279099B1 (ja) * | 2012-03-14 | 2013-09-04 | 住友電工ハードメタル株式会社 | 切削工具 |
EP2837094B1 (en) * | 2012-04-12 | 2016-03-30 | Dolby Laboratories Licensing Corporation | System and method for leveling loudness variation in an audio signal |
CN103377656B (zh) * | 2012-04-16 | 2016-08-10 | 联想(北京)有限公司 | 一种音频文件的五音分析方法、播放器及电子设备 |
CN104604257B (zh) * | 2012-08-31 | 2016-05-25 | 杜比实验室特许公司 | 用于在各种收听环境中渲染并且回放基于对象的音频的系统 |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US20140126736A1 (en) * | 2012-11-02 | 2014-05-08 | Daniel M. Gauger, Jr. | Providing Audio and Ambient Sound simultaneously in ANR Headphones |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
WO2015038475A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US9240763B2 (en) * | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9578436B2 (en) * | 2014-02-20 | 2017-02-21 | Bose Corporation | Content-aware audio modes |
US10251016B2 (en) | 2015-10-28 | 2019-04-02 | Dts, Inc. | Dialog audio signal balancing in an object-based audio program |
-
2016
- 2016-10-27 US US15/336,382 patent/US10251016B2/en active Active
- 2016-10-27 KR KR1020187014900A patent/KR20180132032A/ko active IP Right Grant
- 2016-10-27 CN CN201680073125.4A patent/CN108432130B/zh active Active
- 2016-10-27 EP EP16860811.5A patent/EP3369175B1/en active Active
- 2016-10-27 WO PCT/US2016/059175 patent/WO2017075249A1/en active Application Filing
- 2016-10-27 JP JP2018522683A patent/JP7001588B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003522472A (ja) | 2000-02-04 | 2003-07-22 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 消費者アプリケーションにおける音声対残余オーディオ(vra)の使用 |
JP2002171482A (ja) | 2000-12-01 | 2002-06-14 | Hitachi Ltd | 記録装置およびビデオカメラ |
JP2005167380A (ja) | 2003-11-28 | 2005-06-23 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
JP2005348216A (ja) | 2004-06-04 | 2005-12-15 | Nippon Hoso Kyokai <Nhk> | 音質補正伝送システム、送信装置、受信装置 |
JP2013543599A (ja) | 2010-09-22 | 2013-12-05 | ドルビー ラボラトリーズ ライセンシング コーポレイション | デジタルレベル正規化を備えるオーディオストリームミキシング |
Also Published As
Publication number | Publication date |
---|---|
CN108432130B (zh) | 2022-04-01 |
EP3369175A4 (en) | 2019-05-08 |
US20170127212A1 (en) | 2017-05-04 |
EP3369175A1 (en) | 2018-09-05 |
EP3369175C0 (en) | 2024-01-10 |
WO2017075249A1 (en) | 2017-05-04 |
JP2019501563A (ja) | 2019-01-17 |
EP3369175B1 (en) | 2024-01-10 |
KR20180132032A (ko) | 2018-12-11 |
US10251016B2 (en) | 2019-04-02 |
CN108432130A (zh) | 2018-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7001588B2 (ja) | オブジェクトベースのオーディオ信号バランシング法 | |
US10958229B2 (en) | Metadata for loudness and dynamic range control | |
JP2022084856A (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
JP2019097219A (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 | |
KR101538623B1 (ko) | 두 개의 입력 오디오 신호 믹싱 방법, 및 이를 실행하기 위한 디코더 및 컴퓨터 판독가능한 매체, 및 입력 오디오 신호 믹싱 디바이스 | |
BR122021011658B1 (pt) | Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia | |
CN114495953A (zh) | 用于回避控制的元数据 | |
CN113257274A (zh) | 高效drc配置文件传输 | |
US20230230607A1 (en) | Automated mixing of audio description | |
WO2022189188A1 (en) | Apparatus and method for adaptive background audio gain smoothing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210322 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7001588 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |