RU2016151121A - Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa - Google Patents

Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa Download PDF

Info

Publication number
RU2016151121A
RU2016151121A RU2016151121A RU2016151121A RU2016151121A RU 2016151121 A RU2016151121 A RU 2016151121A RU 2016151121 A RU2016151121 A RU 2016151121A RU 2016151121 A RU2016151121 A RU 2016151121A RU 2016151121 A RU2016151121 A RU 2016151121A
Authority
RU
Russia
Prior art keywords
max
hoa
specified
representation
des
Prior art date
Application number
RU2016151121A
Other languages
English (en)
Other versions
RU2016151121A3 (ru
RU2725602C9 (ru
RU2725602C2 (ru
Inventor
Свен КОРДОН
Александр КРЮГЕР
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51178839&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2016151121(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2016151121A publication Critical patent/RU2016151121A/ru
Publication of RU2016151121A3 publication Critical patent/RU2016151121A3/ru
Application granted granted Critical
Publication of RU2725602C2 publication Critical patent/RU2725602C2/ru
Publication of RU2725602C9 publication Critical patent/RU2725602C9/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (54)

1. Способ определения сжатия представления (C(k)) кадра данных HOA наименьшего целого числа βe битов для описания представлений недифференцируемых значений коэффициентов усиления, соответствующих изменениям амплитуды в качестве показателя «два» () для сигналов каналов кадров данных HOA, в котором каждый сигнал канала в каждом кадре содержит группу значений выборки и в котором каждому сигналу (y1(k – 2), … , yI(k – 2)) канала каждого одного из кадров данных HOA присваивают дифференцируемое значение коэффициента усиления, при этом дифференцируемое значение коэффициента усиления вызывает изменение амплитуд (15, 151) первых значений выборки сигнала канала в текущем кадре ((k – 2)) данных HOA по отношению ко вторым значениям выборки сигнала канала в предыдущем кадре ((k – 3)) данных HOA, и при этом результирующие сигналы каналов с адаптированным коэффициентом усиления кодируют в кодирующем устройстве (16);
и при этом представление кадра данных HOA выполняют в пространственной области для O сигналов wj(t) виртуальных громкоговорителей, при этом положения виртуальных громкоговорителей лежат на единичной сфере и должны быть распределены равномерно по этой единичной сфере, при этом указанное воспроизведение представляют произведением матриц w(t) = (Ψ)-1 ⋅ c(t), где w(t) – вектор, содержащий все сигналы виртуальных громкоговорителей, Ψ – модовая матрица виртуальных положений громкоговорителей, и c(t) – вектор соответствующих последовательностей коэффициентов HOA представления кадра данных HOA;
и при этом указанное представление (C(k)) (C(k)) кадра данных HOA нормализуют таким образом, что | | w ( t ) | | = max 1 j O | w j ( t ) | 1 t
Figure 00000001
,
при этом способ включает:
- формирование сигналов каналов посредством:
a) умножения вектора последовательностей c(t) коэффициентов HOA на матрицу смешивания Α для представления доминирующих звуковых сигналов (x(t)) в сигналах каналов, при этом матрица смешивания Α представляет линейную комбинацию последовательностей коэффициентов нормализованного представления кадра данных HOA;
b) вычитания доминирующих звуковых сигналов из нормализованного представления кадра данных HOA для представления компонента cAMB(t) окружающей среды в сигналах каналов, и преобразования результирующего минимального компонента cAMB,MIN(t) окружающей среды путем вычисления w MIN ( t ) = Ψ MIN 1 c AMB ,MIN ( t )
Figure 00000002
, где | | Ψ MIN 1 | | 2 < 1
Figure 00000003
, и ΨMIN – модовая матрица для указанного минимального компонента cAMB,MIN(t) окружающей среды;
c) выбора части последовательностей c(t) коэффициентов HOA, которые относятся к последовательностям коэффициентов компонента окружающей среды HOA, к которым применяют пространственное преобразование;
- определение целого числа βe битов исходя из
β e = log 2 ( log 2 ( K MAX O ) + 1 )
Figure 00000004
,
где K M A X = max 1 N N MAX K ( N , Ω 1 ( N ) , , Ω O ( N ) )
Figure 00000005
– порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) , , Ω O ( N )
Figure 00000006
– направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||2 2 указанной модовой матрицы и O.
2. Способ по п. 1, отличающийся тем, что в дополнение к указанному преобразованному минимальному компоненту окружающей среды непреобразованные последовательности коэффициентов окружающей среды компонента cAMB(t) окружающей среды включают в сигнал (y1(k – 2), … , yI(k – 2)) канала.
3. Способ по пп. 1 или 2, отличающийся тем, что представления недифференцируемых значений ( 2 e
Figure 00000007
) коэффициентов усиления, связанных с указанными сигналами каналов из конкретных указанных кадров данных HOA, передают в качестве дополнительной информации, при этом каждое из них представляют в виде βe битов.
4. Способ по любому из пп. 1—2, отличающийся тем, что целое число βe битов устанавливают как β e = log 2 ( log 2 ( K MAX O ) + e max + 1 )
Figure 00000008
, где e max
Figure 00000009
≥0 служит для увеличения количества битов βe исходя из определения того, что амплитуды значений выборки сигнала канала перед регулятором (15, 151) усиления ниже порогового значения.
5. Способ по любому из пп. 1—2, отличающийся тем, что K MAX
Figure 00000010
=1,5.
6. Способ по любому из пп. 1—2, отличающийся тем, что указанную матрицу A смешивания определяют таким образом, чтобы свести к минимуму евклидову норму остатка между исходным представлением HOA и представлением доминирующих звуковых сигналов, полагая, что псевдоинверсия Мура-Пенроуза модовой матрицы сформирована из всех векторов, представляющих распределение по направлениям монофонических доминирующих звуковых сигналов.
7. Способ по любому из пп. 1—2, отличающийся тем, что исходя из определения того, что положения O сигналов виртуальных громкоговорителей не совпадают с положениями, предполагаемыми для вычисления βe, включающего:
- вычисление (51) модовой матрицы Ψ исходя из несовпадающих положений виртуальных громкоговорителей;
- вычисление (52) евклидовой нормы ||Ψ||2 модовой матрицы;
- вычисление (53) максимально допустимого значения амплитуды γ = min ( 1, O K MAX ,DES | | Ψ | | 2 )
Figure 00000011
, которое замещает максимально допустимую амплитуду в указанной нормализации;
при этом K MAX ,DES = max 1 N N MAX ,DES K ( N , Ω DES ,1 ( N ) , , Ω DES , O ( N ) )
Figure 00000012
; N – порядок; O = (N + 1)2 – число последовательностей коэффициентов HOA; K – отношение между квадратом евклидовой нормы указанной модовой матрицы и O; и где NMAX,DES – порядок, представляющий интерес, и Ω DES ,1 ( N ) , , Ω DES ,1 ( N )
Figure 00000013
являются для каждого порядка направлениями виртуальных громкоговорителей, которые допускают для реализации указанного сжатия указанного представления (C(k)) кадра данных HOA, так что βe выбирают в виде β e = log 2 ( log 2 ( K MAX ,DES O ) + 1 )
Figure 00000014
, для кодирования показателей (e) по основанию «2» указанных недифференцируемых значений коэффициентов усиления.
8. Устройство для определения сжатия представления (C(k)) кадра данных HOA наименьшего целого числа βe битов для описания представлений недифференцируемых значений коэффициентов усиления, соответствующих изменениям амплитуды в качестве показателя «два» () для сигналов каналов кадров данных HOA,
при этом каждый сигнал канала в каждом кадре содержит группу значений выборки и при этом каждому сигналу (y1(k – 2), … , yI(k – 2)) канала каждого одного из кадров данных HOA присвоено дифференцируемое значение коэффициента усиления, при этом дифференцируемое значение коэффициента усиления вызывает изменение амплитуд (15, 151) первых значений выборки сигнала канала в текущем кадре ((k – 2)) данных HOA по отношению ко вторым значениям выборки сигнала канала в предыдущем кадре ((k – 3)) данных HOA, и при этом результирующие сигналы каналов с адаптированным коэффициентом усиления кодированы в кодирующем устройстве (16);
и при этом представление (C(k)) кадра данных HOA выполнено в пространственной области для O сигналов wj(t) виртуальных громкоговорителей, при этом положения виртуальных громкоговорителей лежат на единичной сфере и должны быть распределены равномерно по этой единичной сфере; при этом указанное выполнение представлено перемножением матриц w(t) = (Ψ)-1 ⋅ c(t), где w(t) – вектор, содержащий все сигналы виртуальных громкоговорителей; Ψ – модовая матрица положений виртуальных громкоговорителей; и c(t) – вектор соответствующих последовательностей коэффициентов HOA представления кадра данных HOA;
и при этом указанное представление (C(k)) кадра данных HOA нормализовано таким образом, что | | w ( t ) | | = max 1 j O | w j ( t ) | 1 t
Figure 00000015
;
при этом указанное устройство содержит:
- средства (12, 13, 14), формирующие указанные сигналы (y1(k – 2), … , yI(k – 2)) каналов посредством:
a) умножения указанного вектора последовательностей c(t) коэффициентов HOA на матрицу смешивания Α для представления доминирующих звуковых сигналов (x(t)) в указанных сигналах каналов, при этом матрица смешивания Α представляет линейную комбинацию последовательностей коэффициентов нормализованного представления кадра данных HOA;
b) вычитания доминирующих звуковых сигналов из нормализованного представления кадра данных HOA для представления компонента cAMB(t) окружающей среды в сигналах каналов, и преобразования результирующего минимального компонента cAMB,MIN(t) окружающей среды путем вычисления w MIN ( t ) = Ψ MIN 1 c AMB ,MIN ( t )
Figure 00000016
, где | | Ψ MIN 1 | | 2 < 1
Figure 00000017
, и ΨMIN – модовая матрица для указанного минимального компонента cAMB,MIN(t) окружающей среды;
c) выбора части последовательностей c(t) коэффициентов HOA, которые относятся к последовательностям коэффициентов компонента окружающей среды HOA, к которым применено пространственное преобразование;
- средства (15,..., 151), которые определяют целое число βe битов исходя из
β e = log 2 ( log 2 ( K MAX O ) + 1 )
Figure 00000018
,
где K M A X = max 1 N N MAX K ( N , Ω 1 ( N ) , , Ω O ( N ) )
Figure 00000019
– порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) , , Ω O ( N )
Figure 00000020
– направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||2 2 указанной модовой матрицы и O.
9. Устройство по п. 8, отличающееся тем, что в дополнение к указанному преобразованному минимальному компоненту окружающей среды непреобразованные последовательности коэффициентов окружающей среды компонента cAMB(t) окружающей среды включены в сигнал (y1(k – 2), … , yI(k – 2)) канала.
10. Устройство по любому из пп. 8—9, отличающееся тем, что представления недифференцируемых значений ( 2 e
Figure 00000021
) коэффициентов усиления, связанных с указанными сигналами каналов из конкретных указанных кадров данных HOA, переданы в качестве дополнительной информации, при этом каждое из них представлено в виде βe битов.

11     Устройство по любому из пп. 8—9, отличающееся тем, что целое число βe битов установлено как β e = log 2 ( log 2 ( K MAX O ) + e max + 1 )
Figure 00000008
, при этом e max
Figure 00000009
≥0 служит для увеличения количества битов βe исходя из определения того, что амплитуды значений выборки сигнала канала перед регулятором (15, 151) усиления ниже порогового значения.
12. Устройство по любому из пп. 8—9, отличающееся тем, что K MAX
Figure 00000010
=1,5.
13. Устройство по любому из пп. 8—9, отличающееся тем, что указанная матрица смешивания Α определена таким образом, чтобы свести к минимуму евклидову норму остатка между исходным представлением HOA и представлением доминирующих звуковых сигналов, полагая, что псевдоинверсия Мура-Пенроуза модовой матрицы сформирована из всех векторов, представляющих распределение по направлениям монофонических доминирующих звуковых сигналов.
14. Устройство по любому из пп. 8—9, отличающееся тем, что исходя из определения того, что положения O сигналов виртуальных громкоговорителей не совпадают с положениями, предполагаемыми для вычисления βe, включающего:
- вычисление (51) модовой матрицы Ψ исходя из несовпадающих положений виртуальных громкоговорителей;
- вычисление (52) евклидовой нормы ||Ψ||2 модовой матрицы;
- вычисление (53) максимально допустимого значения амплитуды γ = min ( 1, O K MAX ,DES | | Ψ | | 2 )
Figure 00000011
, которое замещает максимально допустимую амплитуду в указанной нормализации,
при этом K MAX ,DES = max 1 N N MAX ,DES K ( N , Ω DES ,1 ( N ) , , Ω DES , O ( N ) )
Figure 00000012
; N – порядок; O = (N + 1)2 – число последовательностей коэффициентов HOA; K – отношение между квадратом евклидовой нормы указанной модовой матрицы и O; и где NMAX,DES – порядок, представляющий интерес, и Ω DES ,1 ( N ) , , Ω DES ,1 ( N )
Figure 00000013
являются для каждого порядка направлениями виртуальных громкоговорителей, допускаемыми для реализации указанного сжатия указанного представления (C(k)) кадра данных HOA, так что βe выбрано в виде β e = log 2 ( log 2 ( K MAX ,DES O ) + 1 )
Figure 00000022
, для кодирования показателей (e) по основанию «2» указанных недифференцируемых значений коэффициентов усиления.
15. Кодированное представление B
Figure 00000023
кадра данных HOA, содержащее недифференцируемые значения коэффициентов усиления, в которых наименьшее целое число (βe) битов, требуемых для представления этих недифференцируемых значений коэффициентов усиления, определено согласно способу по одному из пп. 1—7.
16. Запоминающая среда, которая содержит, или хранит, или имеет записанное на ней кодированное представление ( B
Figure 00000024
) кадра данных HOA по п. 15.
17. Запоминающая среда, которая содержит, или хранит, или имеет записанный на ней компьютерный программный продукт, содержащий инструкции, которые при выполнении на компьютере выполняют способ по пп. 1—7.
18. Способ декодирования сжатого звукового представления с помощью воспроизводящей аппаратуры более высокого порядка (НОА) звука или звукового поля, при этом способ включает:
прием битового потока, содержащего сжатое представление НОА, при этом битовый поток содержит ряд коэффициентов HOA, соответствующих сжатому представлению HOA; и
декодирование сжатого представления НОА исходя из наименьшего целого числа βe, при этом наименьшее целое число βe определяют исходя из β e = log 2 ( log 2 ( K MAX O ) + 1 )
Figure 00000025
, где K M A X = max 1 N N MAX K ( N , Ω 1 ( N ) , , Ω O ( N ) )
Figure 00000005
– порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) , , Ω O ( N )
Figure 00000006
– направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||2 2 указанной модовой матрицы и O.
19. Способ по п. 18, отличающийся тем, что K MAX
Figure 00000010
=1,5.
20. Устройство декодирования сжатого звукового представления с помощью воспроизводящей аппаратуры более высокого порядка (НОА) звука или звукового поля, при этом устройство содержит:
средства для приема битового потока, содержащего сжатое представление НОА, при этом битовый поток содержит ряд коэффициентов HOA, соответствующих сжатому представлению HOA; и
средства для декодирования сжатого представления НОА исходя из наименьшего целого числа βe, при этом наименьшее целое число βe определено исходя из β e = log 2 ( log 2 ( K MAX O ) + 1 )
Figure 00000025
, где K M A X = max 1 N N MAX K ( N , Ω 1 ( N ) , , Ω O ( N ) )
Figure 00000005
– порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) , , Ω O ( N )
Figure 00000006
– направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||2 2 указанной модовой матрицы и O.
21. Устройство по п. 20, отличающееся тем, что K MAX
Figure 00000010
=1,5.
RU2016151121A 2014-06-27 2015-06-22 Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa RU2725602C9 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14306023.4 2014-06-27
EP14306023.4A EP2960903A1 (en) 2014-06-27 2014-06-27 Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
PCT/EP2015/063912 WO2015197512A1 (en) 2014-06-27 2015-06-22 Method and apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2020115874A Division RU2802176C2 (ru) 2014-06-27 2015-06-22 Способ и устройство для декодирования сжатого звукового представления звука или звукового поля с помощью hoa

Publications (4)

Publication Number Publication Date
RU2016151121A true RU2016151121A (ru) 2018-06-26
RU2016151121A3 RU2016151121A3 (ru) 2019-02-07
RU2725602C2 RU2725602C2 (ru) 2020-07-02
RU2725602C9 RU2725602C9 (ru) 2020-08-28

Family

ID=51178839

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016151121A RU2725602C9 (ru) 2014-06-27 2015-06-22 Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa

Country Status (9)

Country Link
US (5) US10236003B2 (ru)
EP (3) EP2960903A1 (ru)
JP (3) JP6567571B2 (ru)
KR (3) KR102568636B1 (ru)
CN (3) CN106471580B (ru)
BR (2) BR122022022357B1 (ru)
RU (1) RU2725602C9 (ru)
TW (4) TW202431250A (ru)
WO (1) WO2015197512A1 (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113808600A (zh) * 2014-06-27 2021-12-17 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9794713B2 (en) * 2014-06-27 2017-10-17 Dolby Laboratories Licensing Corporation Coded HOA data frame representation that includes non-differential gain values associated with channel signals of specific ones of the dataframes of an HOA data frame representation
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
KR102128281B1 (ko) * 2017-08-17 2020-06-30 가우디오랩 주식회사 앰비소닉 신호를 사용하는 오디오 신호 처리 방법 및 장치
KR20220028021A (ko) 2019-07-02 2022-03-08 돌비 인터네셔널 에이비 이산 지향성 데이터의 표현, 인코딩 및 디코딩을 위한 방법들, 장치 및 시스템들
CN115376529B (zh) * 2021-05-17 2024-10-11 华为技术有限公司 三维音频信号编码方法、装置和编码器

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757927A (en) 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE522453C2 (sv) 2000-02-28 2004-02-10 Scania Cv Ab Sätt och anordning för styrning av ett mekaniskt tillsatsaggregat i ett motorfordon
CN1677492A (zh) 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US7848280B2 (en) * 2007-06-15 2010-12-07 Telefonaktiebolaget L M Ericsson (Publ) Tunnel overhead reduction
EP2159790B1 (en) 2007-06-27 2019-11-13 NEC Corporation Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
KR20240009530A (ko) 2010-03-26 2024-01-22 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9161149B2 (en) * 2012-05-24 2015-10-13 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US20140358565A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
CN110556120B (zh) * 2014-06-27 2023-02-28 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
CN113808600A (zh) * 2014-06-27 2021-12-17 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
US9794713B2 (en) * 2014-06-27 2017-10-17 Dolby Laboratories Licensing Corporation Coded HOA data frame representation that includes non-differential gain values associated with channel signals of specific ones of the dataframes of an HOA data frame representation

Also Published As

Publication number Publication date
CN112908349A (zh) 2021-06-04
EP3161820B1 (en) 2020-11-18
KR20230124763A (ko) 2023-08-25
RU2016151121A3 (ru) 2019-02-07
BR122018012705A8 (pt) 2022-09-13
JP6869296B2 (ja) 2021-05-12
JP6567571B2 (ja) 2019-08-28
US20240212692A1 (en) 2024-06-27
US10236003B2 (en) 2019-03-19
TW202431250A (zh) 2024-08-01
TW202238566A (zh) 2022-10-01
US10872612B2 (en) 2020-12-22
CN112951254A (zh) 2021-06-11
KR20170023017A (ko) 2017-03-02
JP2021103337A (ja) 2021-07-15
WO2015197512A1 (en) 2015-12-30
TWI820530B (zh) 2023-11-01
BR122023009299B1 (pt) 2023-12-26
JP2017523456A (ja) 2017-08-17
US20190214027A1 (en) 2019-07-11
TWI689916B (zh) 2020-04-01
US20210193156A1 (en) 2021-06-24
TW201603000A (zh) 2016-01-16
BR112016029978A2 (pt) 2017-08-22
CN106471580A (zh) 2017-03-01
TWI749471B (zh) 2021-12-11
CN106471580B (zh) 2021-03-05
RU2725602C9 (ru) 2020-08-28
JP2019185065A (ja) 2019-10-24
BR122022022357B1 (pt) 2024-01-16
RU2020115874A (ru) 2020-06-18
KR102568636B1 (ko) 2023-08-22
US20170133020A1 (en) 2017-05-11
KR20220110615A (ko) 2022-08-08
US11322165B2 (en) 2022-05-03
EP3809409A1 (en) 2021-04-21
EP2960903A1 (en) 2015-12-30
CN112908348A (zh) 2021-06-04
KR102428370B1 (ko) 2022-08-02
US11875803B2 (en) 2024-01-16
US20220270620A1 (en) 2022-08-25
BR122018012705A2 (ru) 2017-08-22
RU2725602C2 (ru) 2020-07-02
CN112908348B (zh) 2022-07-15
TW202105364A (zh) 2021-02-01
EP3161820A1 (en) 2017-05-03

Similar Documents

Publication Publication Date Title
RU2016151121A (ru) Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa
US10290304B2 (en) Reconstruction of audio scenes from a downmix
US10262670B2 (en) Method for decoding a higher order ambisonics (HOA) representation of a sound or soundfield
US8090587B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
Merimaa et al. Correlation-based ambience extraction from stereo recordings
CN105144287A (zh) 基于对象的音频编码系统中利用旁路音频对象信号的通知响度估计的解码器、编码器及方法
CN105247893A (zh) 音频信号输出装置和方法、编码装置和方法、解码装置和方法及程序
JP7333855B2 (ja) 高次アンビソニックス信号にダイナミックレンジ圧縮を適用するための方法および装置
US10621994B2 (en) Audio signal processing device and method, encoding device and method, and program
EP3332557B1 (en) Processing object-based audio signals
KR102710843B1 (ko) 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
US20140025389A1 (en) Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
EP3201918B1 (en) Decoding method and decoder for dialog enhancement
JP2023076610A (ja) 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
EP3869826A1 (en) Signal processing device and method, and program
US20180012607A1 (en) Audio Signal Processing Apparatuses and Methods
US20170133021A1 (en) Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
EP4052257B1 (en) Multichannel audio encode and decode using directional metadata
EP3005352B1 (en) Audio object encoding and decoding
EP3278332B1 (en) Audio signal processing apparatuses and methods
RU2826480C1 (ru) Кодирование и декодирование многоканального аудио с использованием метаданных направленности
CN107787584A (zh) 处理低复杂度格式转换的内部声道的方法和装置
RU2018135962A (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов

Legal Events

Date Code Title Description
TH4A Reissue of patent specification
TH4A Reissue of patent specification