JP6235725B2 - マルチ・チャンネル・オーディオ信号分類器 - Google Patents
マルチ・チャンネル・オーディオ信号分類器 Download PDFInfo
- Publication number
- JP6235725B2 JP6235725B2 JP2016546482A JP2016546482A JP6235725B2 JP 6235725 B2 JP6235725 B2 JP 6235725B2 JP 2016546482 A JP2016546482 A JP 2016546482A JP 2016546482 A JP2016546482 A JP 2016546482A JP 6235725 B2 JP6235725 B2 JP 6235725B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- channel
- audio
- relative
- entropy value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 279
- 238000000034 method Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 13
- 210000005069 ears Anatomy 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 208000029523 Interstitial Lung disease Diseases 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000708948 Solva Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Description
{
mag_l = 0.0、
mag_r = 0.0、
for (k =BAND_START[j]、 k<BAND_START[j +1]、 k++)
{
mag_l + = fft_l[k]*fft_l[k] + fft_l[L_FFT−k]*fft_l[L_FFT −k]、
mag_r + = fft_r[k]*fft_r[k] + fft_r[L_FFT −k]*fft_r [L_FFT −k]、
}
mag[j] = 10.0f * log10(sqrt((mag_l + EPSILON)/(mag_r + EPSILON)))、
広帯域(WB)用ITDサブバンド
const short scale1024_WB [ ] =
{1、5、8、12、20、34、48、56、120、512}、
超広帯域(SWB)用ITDサブバンド
const short scale1024_SWB [ ] =
{1、2、4、6、10、14、17、24、28、60、256、512}、
フル帯域(FB)用ITDサブバンド
const short scale1024_FB [ ] =
{1、2、3、4、7、11、16、19、40、171、341、448 /* 〜21 kHz */}、
広帯域(WB)用ILDサブバンド
const short scf_band_WB [ ] =
{1、8、20、32、44、60、90、110、170、216、290、394、512}、
超広帯域(SWB)用ILDサブバンド
const short scf_band_SWB [ ] =
{1、4、10、16、22、30、45、65、85、108、145、197、256、322、412、512}、
フル帯域(FB)用ILDサブバンド
const short scf_band_FB [ ] =
{1、3、7、11、15、20、30、43、57、72、97、131、171、215、275、341、391、448 /* 〜21 kHz */}、
entropy_estim_hist (short * scale, short no_scales, float * H0, shortmax_value)
{
float h0, hist0[2 *(2*MAX_ST_SCALE+1), sum、
short i、
set_f(hist0, 0.0f, 2*max_Value+1)、
for(i=0、 i<no_scale、 i++)
{
hist0[scale[i]]+=1.0f、
}
sum = 0.0、
for(i=0、i<=2*max_value、 i++)
{
hist0[i]+=0.01f、
sum +=hist0[i]、
}
sum = 1.0f/sum、
h0 = 0.0f、
for(i=0、i<=2*max_value、 i++)
{
hist0[i]*= sum、
h0 −= hist0 [i]*logf(hist0[i])、
}
*H0/logf(2.0f)
}
(a)ハードウエアだけの回路実装(例えば、アナログおよび/またはデジタル回路だけの実装)、および
(b)回路とソフトウエア(および/またはファームウエア)の組合わせ、例えば、(i)プロセッサの組み合わせ、または(ii)一緒に作動し、携帯電話やサーバのような装置に様々な機能を実行させるプロセッサ/ソフトウエア(含む、デジタル信号プロセッサ)、ソフトウエアおよびメモリの部分、および
(c)ソフトウエアやファームウエアが物理的に存在しなくとも、動作のためにソフトウエアやファームウエアを必要とする、例えばマイクロプロセッサまたはマイクロプロセッサの一部のような回路
Claims (24)
- マルチ・チャンネル・オーディオ信号のエントロピー値を推定するステップと、
前記エントロピー値から前記マルチ・チャンネル・オーディオ信号のチャンネル構成を決定するステップと、
前記チャンネル構成に依存する符号化モードで前記マルチ・チャンネル・オーディオ信号を符号化するステップと、
を含む方法。 - 前記マルチ・チャンネル・オーディオ信号は、少なくとも第1オーディオ・チャンネル信号と、第2オーディオ・チャンネル信号とを含み、
前記マルチ・チャンネル・オーディオ信号の前記エントロピー値を推定するステップは、
前記第1オーディオ・チャンネル信号と第2オーディオ・チャンネルとをそれぞれ、複数の周波数帯域を含む周波数領域オーディオ信号に変換するステップと、
前記第2オーディオ・チャンネル信号の周波数帯域におけるオーディオ信号レベルに対する前記第1オーディオ・チャンネル信号の周波数帯域におけるオーディオ信号レベルを決定することによって相対的オーディオ信号レベルを決定するステップと、
前記相対的オーディオ信号レベルから前記エントロピー値を決定するステップと、
を含む、請求項1に記載の方法。 - 前記マルチ・チャンネル・オーディオ信号の前記チャンネル構成を決定するステップは、
前記エントロピー値を閾値と比較するステップと、
前記エントロピー値が前記閾値以下の場合、前記チャンネル構成を第1タイプのチャンネル構成として分類するステップと、
前記エントロピー値が前記閾値より大きい場合、前記チャンネル構成を第2タイプのチャンネル構成として分類するステップと、
を含む、請求項1または2に記載の方法。 - 前記相対的オーディオ信号レベルから前記エントロピー値を決定するステップは、前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの複数の相対的オーディオ信号レベルからなるヒストグラムを決定することによって相対的オーディオ信号レベルの確率を決定するステップを含む、請求項2に記載の方法。
- 前記相対的オーディオ信号レベルから前記エントロピー値を決定するステップは、前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの相対的オーディオ信号レベル値のシーケンスを連続して観察することによって、同じ値を有する2つの相対的オーディオ信号レベル値のコインシデンス間における相対的オーディオ信号レベル値の平均数を推定するステップを含む、請求項2に記載の方法。
- 前記マルチ・チャンネル・オーディオ信号は、2チャンネル・オーディオ信号を含み、
前記第1タイプのチャンネル構成はバイノーラル・オーディオ・チャンネルであり、
前記第2タイプのチャンネル構成はステレオ・オーディオ・チャンネルである、
請求項3に記載の方法。 - 前記オーディオ信号レベルは、前記周波数帯域におけるオーディオ信号の大きさを含む、請求項2、4、5のいずれか1項に記載の方法。
- 前記相対的オーディオ信号レベルは両耳間のレベル差である、請求項2、4、5、7のいずれか1項に記載の方法。
- マルチ・チャンネル・オーディオ信号のエントロピー値を推定し、
前記エントロピー値から前記マルチ・チャンネル・オーディオ信号のチャンネル構成を決定し、
前記チャンネル構成に依存する符号化モードで前記マルチ・チャンネル・オーディオ信号を符号化するように構成された装置。 - 前記マルチ・チャンネル・オーディオ信号は、少なくとも第1オーディオ・チャンネル信号と、第2オーディオ・チャンネル信号とを含み、
前記マルチ・チャンネル・オーディオ信号のエントロピー値を推定するように構成された前記装置は、
前記第1オーディオ・チャンネル信号と第2オーディオ・チャンネルをそれぞれ、複数の周波数帯域を含む周波数領域オーディオ信号に変換し、
前記第2オーディオ・チャンネル信号の周波数帯域のオーディオ信号レベルに対する前記第1オーディオ・チャンネル信号の周波数帯域におけるオーディオ信号レベルを決定するように構成された前記装置によって相対的オーディオ信号レベルを決定し、
前記相対的オーディオ信号レベルから前記エントロピー値を決定するように更に構成される、請求項9に記載の装置。 - 前記マルチ・チャンネル・オーディオ信号の前記チャンネル構成を決定するように構成された前記装置は、
前記エントロピー値を閾値と比較し、
前記エントロピー値が前記閾値以下の場合、前記チャンネル構成を第1タイプのチャンネル構成として分類し、
前記エントロピー値が前記閾値より大きい場合、前記チャンネル構成を第2タイプのチャンネル構成として分類するように更に構成される、
請求項9または請求項10に記載の装置。 - 前記相対的オーディオ信号レベルから前記エントロピー値を決定するように構成された前記装置は、前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの複数の相対的オーディオ信号レベルのヒストグラムを決定するように構成することによって、前記相対的オーディオ信号レベルの確率を決定するように更に構成される、
請求項10に記載の装置。 - 前記相対的オーディオ信号レベルから前記エントロピー値を決定するように構成された前記装置は、
前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの相対的オーディオ信号レベル値のシーケンスを連続して観察することによって、同じ値を有する2つの相対的オーディオ信号レベル値のコインシデンス間における相対的オーディオ信号レベル値の平均数を推定するように更に構成される、
請求項10に記載の装置。 - 前記マルチ・チャンネル・オーディオ信号は、2チャンネル・オーディオ信号を含み、
前記第1タイプのチャンネル構成はバイノーラル・オーディオ・チャンネルであり、
前記第2タイプのチャンネル構成はステレオ・オーディオ・チャンネルである、
請求項11に記載の装置。 - 前記オーディオ信号レベルは、前記周波数帯域におけるオーディオ信号の大きさを含む、請求項10、12、または、13に記載の装置。
- 前記相対的オーディオ信号レベルは両耳間のレベル差である、請求項10、12、13、または、15に記載の装置。
- 1つ以上のプロセッサによって実行されるとき、装置に、エントロピー値を閾値と比較させ、
前記エントロピー値が前記閾値以下の場合、チャンネル構成を第1タイプのチャンネル構成として分類させ、
前記エントロピー値が前記閾値より大きい場合、前記チャンネル構成を第2タイプのチャンネル構成として分類させる命令のセットを備えるコンピュータ・プログラム。 - マルチ・チャンネル・オーディオ信号は、少なくとも第1オーディオ・チャンネル信号と、第2オーディオ・チャンネル信号とを含み、
前記装置に前記マルチ・チャンネル・オーディオ信号のエントロピー値を推定させる前記コンピュータ・プログラムは、
前記装置に、更に、
前記第1オーディオ・チャンネル信号と第2オーディオ・チャンネルをそれぞれ、複数の周波数帯域を含む周波数領域オーディオ信号に変換させ、
前記第2オーディオ・チャンネル信号の周波数帯域のオーディオ信号レベルに対する前記第1オーディオ・チャンネル信号の周波数帯域におけるオーディオ信号レベルを決定するようにされた前記装置によって相対的オーディオ信号レベルを決定させ、
前記相対的オーディオ信号レベルから前記エントロピー値を決定させる、
請求項17に記載のコンピュータ・プログラム。 - 前記装置にマルチ・チャンネル・オーディオ信号の前記チャンネル構成を決定させる前記コンピュータ・プログラムは、
前記装置に、更に、
前記エントロピー値を閾値と比較させ、
前記エントロピー値が前記閾値以下の場合、前記チャンネル構成を第1タイプのチャンネル構成として分類させ、
前記エントロピー値が前記閾値より大きい場合、前記チャンネル構成を第2タイプのチャンネル構成として分類させる、
請求項17または18に記載のコンピュータ・プログラム。 - 前記装置に前記相対的オーディオ信号レベルから前記エントロピー値を決定させる前記コンピュータ・プログラムは、
前記装置に、更に、
前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの複数の相対的オーディオ信号レベルのヒストグラムを決定するようにさせることによって前記相対的オーディオ信号レベルの確率を決定させる、請求項18に記載のコンピュータ・プログラム。 - 前記装置に前記相対的オーディオ信号レベルから前記エントロピー値を決定させる前記コンピュータ・プログラムは、
前記装置に、更に、
前記マルチ・チャンネル・オーディオ信号のオーディオ・フレームからの相対的オーディオ信号レベル値のシーケンスを連続して観察することによって、同じ値を有する2つの相対的オーディオ信号レベル値のコインシデンス間における相対的オーディオ信号レベル値の平均数を推定させる、請求項18に記載のコンピュータ・プログラム。 - 前記マルチ・チャンネル・オーディオ信号は、2チャンネル・オーディオ信号を含み、
前記第1タイプのチャンネル構成はバイノーラル・オーディオ・チャンネルであり、
前記第2タイプのチャンネル構成はステレオ・オーディオ・チャンネルである、
請求項18ないし21のいずれか1項に記載のコンピュータ・プログラム。 - 前記オーディオ信号レベルは、前記周波数帯域におけるオーディオ信号の大きさを含む、請求項18に記載のコンピュータ・プログラム。
- 前記相対的オーディオ信号レベルは両耳間のレベル差である、請求項18、20、21または23に記載のコンピュータ・プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/FI2014/050019 WO2015104447A1 (en) | 2014-01-13 | 2014-01-13 | Multi-channel audio signal classifier |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017503214A JP2017503214A (ja) | 2017-01-26 |
JP6235725B2 true JP6235725B2 (ja) | 2017-11-22 |
Family
ID=53523566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016546482A Expired - Fee Related JP6235725B2 (ja) | 2014-01-13 | 2014-01-13 | マルチ・チャンネル・オーディオ信号分類器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9911423B2 (ja) |
EP (1) | EP3095117B1 (ja) |
JP (1) | JP6235725B2 (ja) |
KR (1) | KR101841380B1 (ja) |
CN (1) | CN106104684A (ja) |
RU (1) | RU2648632C2 (ja) |
WO (1) | WO2015104447A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101993828B1 (ko) * | 2014-07-28 | 2019-06-27 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 장치, 프로그램 및 기록 매체 |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4345171C2 (de) * | 1993-09-15 | 1996-02-01 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
US6298071B1 (en) | 1998-09-03 | 2001-10-02 | Diva Systems Corporation | Method and apparatus for processing variable bit rate information in an information distribution system |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US6650784B2 (en) | 2001-07-02 | 2003-11-18 | Qualcomm, Incorporated | Lossless intraframe encoding using Golomb-Rice |
BR0304542A (pt) | 2002-04-22 | 2004-07-20 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio |
CN1312660C (zh) | 2002-04-22 | 2007-04-25 | 皇家飞利浦电子股份有限公司 | 信号合成方法和设备 |
US7181019B2 (en) * | 2003-02-11 | 2007-02-20 | Koninklijke Philips Electronics N. V. | Audio coding |
EP1611772A1 (en) | 2003-03-04 | 2006-01-04 | Nokia Corporation | Support of a multichannel audio extension |
EP1618686A1 (en) | 2003-04-30 | 2006-01-25 | Nokia Corporation | Support of a multichannel audio extension |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
WO2005119950A1 (ja) | 2004-06-02 | 2005-12-15 | Matsushita Electric Industrial Co., Ltd. | 音声データ送信/受信装置および音声データ送信/受信方法 |
WO2006022190A1 (ja) | 2004-08-27 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ |
US20060088093A1 (en) | 2004-10-26 | 2006-04-27 | Nokia Corporation | Packet loss compensation |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US7991610B2 (en) | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
ES2297825T3 (es) * | 2005-04-19 | 2008-05-01 | Coding Technologies Ab | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. |
WO2006132857A2 (en) * | 2005-06-03 | 2006-12-14 | Dolby Laboratories Licensing Corporation | Apparatus and method for encoding audio signals with decoding instructions |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
ES2433316T3 (es) * | 2005-07-19 | 2013-12-10 | Koninklijke Philips N.V. | Generación de señales de audio de multiples canales |
US20070055510A1 (en) | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
CN101283250B (zh) | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
US20090313029A1 (en) * | 2006-07-14 | 2009-12-17 | Anyka (Guangzhou) Software Technologiy Co., Ltd. | Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy |
CN101479786B (zh) * | 2006-09-29 | 2012-10-17 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
KR101100222B1 (ko) | 2006-12-07 | 2011-12-28 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
US8200351B2 (en) | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
DE102007048973B4 (de) | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
WO2009048239A2 (en) | 2007-10-12 | 2009-04-16 | Electronics And Telecommunications Research Institute | Encoding and decoding method using variable subband analysis and apparatus thereof |
US20100324708A1 (en) | 2007-11-27 | 2010-12-23 | Nokia Corporation | encoder |
US20090164223A1 (en) | 2007-12-19 | 2009-06-25 | Dts, Inc. | Lossless multi-channel audio codec |
US8972247B2 (en) * | 2007-12-26 | 2015-03-03 | Marvell World Trade Ltd. | Selection of speech encoding scheme in wireless communication terminals |
CN102057424B (zh) | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2304723T3 (pl) | 2008-07-11 | 2013-03-29 | Fraunhofer Ges Forschung | Urządzenie i sposób dekodowania zakodowanego sygnału audio |
PT2146344T (pt) | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
JP5446258B2 (ja) * | 2008-12-26 | 2014-03-19 | 富士通株式会社 | オーディオ符号化装置 |
US20120121091A1 (en) | 2009-02-13 | 2012-05-17 | Nokia Corporation | Ambience coding and decoding for audio applications |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
US8848925B2 (en) | 2009-09-11 | 2014-09-30 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
PL3093843T3 (pl) | 2009-09-29 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder sygnału audio MPEG-SAOC, koder sygnału audio MPEG-SAOC, sposób dostarczania reprezentacji sygnału upmixu z wykorzystaniem dekodowania MPEG-SAOC, sposób dostarczania reprezentacji sygnału downmixu z wykorzystaniem dekodowania MPEG-SAOC oraz program komputerowy wykorzystujący wspólną wartość parametru korelacji międzyobiektowej zależną od czasu/częstotliwości |
US9167367B2 (en) | 2009-10-15 | 2015-10-20 | France Telecom | Optimized low-bit rate parametric coding/decoding |
US20120035940A1 (en) | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor |
EP2609590B1 (en) | 2010-08-25 | 2015-05-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for decoding a signal comprising transients using a combining unit and a mixer |
EP2612322B1 (en) | 2010-10-05 | 2016-05-11 | Huawei Technologies Co., Ltd. | Method and device for decoding a multichannel audio signal |
US20140052440A1 (en) | 2011-01-28 | 2014-02-20 | Nokia Corporation | Coding through combination of code vectors |
US9026434B2 (en) | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN104011794B (zh) * | 2011-12-21 | 2016-06-08 | 杜比国际公司 | 具有并行架构的音频编码器 |
KR20130109793A (ko) * | 2012-03-28 | 2013-10-08 | 삼성전자주식회사 | 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치 |
EP2839460A4 (en) * | 2012-04-18 | 2015-12-30 | Nokia Technologies Oy | STEREOTONSIGNALCODIERER |
KR101647576B1 (ko) * | 2012-05-29 | 2016-08-10 | 노키아 테크놀로지스 오와이 | 스테레오 오디오 신호 인코더 |
US9865269B2 (en) | 2012-07-19 | 2018-01-09 | Nokia Technologies Oy | Stereo audio signal encoder |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
WO2014108738A1 (en) | 2013-01-08 | 2014-07-17 | Nokia Corporation | Audio signal multi-channel parameter encoder |
EP2976768A4 (en) | 2013-03-20 | 2016-11-09 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR |
EP2981955B1 (en) | 2013-04-05 | 2023-06-07 | Dts Llc | Layered audio coding and transmission |
US20150025894A1 (en) | 2013-07-16 | 2015-01-22 | Electronics And Telecommunications Research Institute | Method for encoding and decoding of multi channel audio signal, encoder and decoder |
-
2014
- 2014-01-13 RU RU2016131192A patent/RU2648632C2/ru not_active IP Right Cessation
- 2014-01-13 CN CN201480077074.3A patent/CN106104684A/zh active Pending
- 2014-01-13 KR KR1020167022075A patent/KR101841380B1/ko active IP Right Grant
- 2014-01-13 WO PCT/FI2014/050019 patent/WO2015104447A1/en active Application Filing
- 2014-01-13 JP JP2016546482A patent/JP6235725B2/ja not_active Expired - Fee Related
- 2014-01-13 EP EP14877980.4A patent/EP3095117B1/en not_active Not-in-force
- 2014-01-13 US US15/110,356 patent/US9911423B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP3095117A4 (en) | 2017-06-21 |
KR101841380B1 (ko) | 2018-03-22 |
US9911423B2 (en) | 2018-03-06 |
WO2015104447A1 (en) | 2015-07-16 |
CN106104684A (zh) | 2016-11-09 |
KR20160110447A (ko) | 2016-09-21 |
JP2017503214A (ja) | 2017-01-26 |
EP3095117A1 (en) | 2016-11-23 |
RU2016131192A (ru) | 2018-02-20 |
US20160329056A1 (en) | 2016-11-10 |
EP3095117B1 (en) | 2018-08-22 |
RU2648632C2 (ru) | 2018-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9865269B2 (en) | Stereo audio signal encoder | |
US9799339B2 (en) | Stereo audio signal encoder | |
US10199044B2 (en) | Audio signal encoder comprising a multi-channel parameter selector | |
CN111316353A (zh) | 确定空间音频参数编码和相关联的解码 | |
WO2019105575A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
US20220343928A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
EP3991170A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
WO2019106221A1 (en) | Processing of spatial audio parameters | |
JP6235725B2 (ja) | マルチ・チャンネル・オーディオ信号分類器 | |
CN117083881A (zh) | 分离空间音频对象 | |
WO2019243670A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
US20160064004A1 (en) | Multiple channel audio signal encoder mode determiner | |
US20240185869A1 (en) | Combining spatial audio streams | |
US20190096410A1 (en) | Audio Signal Encoder, Audio Signal Decoder, Method for Encoding and Method for Decoding | |
US20230377587A1 (en) | Quantisation of audio parameters | |
WO2020193865A1 (en) | Determination of the significance of spatial audio parameters and associated encoding | |
EP4315324A1 (en) | Combining spatial audio streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160912 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171026 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6235725 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |