RU2020119761A - Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений - Google Patents

Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений Download PDF

Info

Publication number
RU2020119761A
RU2020119761A RU2020119761A RU2020119761A RU2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A
Authority
RU
Russia
Prior art keywords
parameters
frequency
parameter
time
resolution
Prior art date
Application number
RU2020119761A
Other languages
English (en)
Other versions
RU2020119761A3 (ru
RU2763313C2 (ru
Inventor
Гийом ФУКС
Юрген ХЕРРЕ
Фабиан КЮХ
Штефан ДЁЛА
Маркус МУЛЬТРУС
Оливер ТИРГАРТ
Оливер ВЮББОЛЬТ
Флорин ГИДО
Штефан БАЙЕР
Вольфганг ЕГЕРС
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2020119761A publication Critical patent/RU2020119761A/ru
Publication of RU2020119761A3 publication Critical patent/RU2020119761A3/ru
Application granted granted Critical
Publication of RU2763313C2 publication Critical patent/RU2763313C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6005Decoder aspects
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects

Claims (32)

1. Устройство для кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности и параметры направления, содержащее модуль (100) вычисления параметров для вычисления параметров рассеянности с первым временным или частотным разрешением и для вычисления параметров направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения, и процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления.
2. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления параметров рассеянности и параметров направления таким образом, что первое временное разрешение ниже второго временного разрешения, или второе частотное разрешение больше первого частотного разрешения, или первое временное разрешение ниже второго временного разрешения, и первое частотное разрешение равно второму частотному разрешению.
3. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления параметров рассеянности и параметров направления для набора полос частот, при этом полоса частот, имеющая более низкую центральную частоту, является более узкой, чем полоса частот, имеющая более высокую центральную частоту.
4. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью получения начальных параметров рассеянности, имеющих третье временное или частотное разрешение, и получения начальных параметров направления, имеющих четвертое временное или частотное разрешение, и в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров рассеянности таким образом, что третье временное или частотное разрешение выше первого временного или частотного разрешения, или в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров направления таким образом, что четвертое временное или частотное разрешение выше второго временного или частотного разрешения.
5. Устройство по п. 4, в котором третье временное или частотное разрешение и четвертое временное или частотное разрешение равны друг другу.
6. Устройство по п. 5, в котором третье временное разрешение или частотное разрешение представляет собой постоянное временное или частотное разрешение таким образом, что каждый начальный параметр рассеянности ассоциирован с временным квантом или частотным элементом разрешения, имеющим такой же размер, или в котором четвертое временное или частотное разрешение представляет собой постоянное временное или частотное разрешение таким образом, что каждый начальный параметр направления ассоциирован с временным квантом или частотным элементом разрешения, имеющим такой же размер, и в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по первому множеству параметров рассеянности, ассоциированных с первым множеством временных квантов, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по второму множеству параметров рассеянности, ассоциированных со вторым множеством частотных элементов разрешения, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по третьему множеству параметров направления, ассоциированных с третьим множеством временных квантов, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по четвертому множеству параметров направления, ассоциированных с четвертым множеством частотных элементов разрешения.
7. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью усреднения с использованием среднего взвешенного, при этом параметр рассеянности или параметр направления, извлекаемый из части входного сигнала, имеющей более высокий связанный с амплитудой показатель, взвешивается с использованием более высокого весового коэффициента по сравнению с параметром рассеянности или параметром направления, извлекаемым из части входного сигнала, имеющей более низкий связанный с амплитудой показатель.
8. Устройство по п. 7, в котором связанный с амплитудой показатель представляет собой мощность или энергию во временной части или частотной части либо мощность или энергию, возведенную в степень посредством вещественного неотрицательного числа, равного или отличающегося от 1 во временной части или частотной части.
9. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью выполнения усреднения таким образом, что параметр рассеянности или параметр направления нормализуется относительно связанного с амплитудой показателя, извлекаемого из временной части входного сигнала, соответствующего первому или второму временному или частотному разрешению.
10. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров направления с использованием усреднения со взвешиванием, при этом первый параметр направления, ассоциированный с первой временной частью, имеющей первый параметр рассеянности, указывающий более низкую рассеянность, взвешивается выше второго параметра направления, ассоциированного со второй временной частью, имеющей второй параметр рассеянности, указывающий более высокую рассеянность.
11. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления начальных параметров направления таким образом, что начальные параметры направления содержат декартов вектор, имеющий компонент для каждого из двух или трех направлений, и при этом модуль (100) вычисления параметров выполнен с возможностью выполнения усреднения для каждого отдельного компонента декартова вектора отдельно, или при этом компоненты нормализуются таким образом, что сумма возведенных в квадрат компонентов декартова вектора для параметра направления равна единице.
12. Устройство по п. 1, дополнительно содержащее модуль частотно-временного разложения для разложения входного сигнала, имеющего множество входных каналов, в частотно-временное представление для каждого входного канала, или при этом модуль частотно-временного разложения выполнен с возможностью разложения входного сигнала, имеющего множество входных каналов, в частотно-временное представление для каждого входного канала, имеющего третье временное или частотное разрешение или четвертое временное или частотное разрешение.
13. Устройство по п. 5, в котором модуль частотно-временного разложения содержит модулированную гребенку фильтров, приводящую к комплексным значениям для каждого подполосного сигнала, при этом каждый подполосный сигнал имеет множество временных квантов в расчете на кадр и полосу частот.
14. Устройство по п. 1, при этом устройство выполнено с возможностью ассоциирования индикатора первого или второго временного или частотного разрешения в квантованное и кодированное представление для передачи в декодер или для хранения.
15. Устройство по п. 1, в котором процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления содержит квантователь параметров для квантования параметров рассеянности и параметров направления и кодер параметров для кодирования квантованных параметров рассеянности и квантованных параметров направления по любому из вышеприведенных примеров 1-26.
16. Способ кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности и параметры направления, содержащий этапы, на которых вычисляют параметры рассеянности с первым временным или частотным разрешением и вычисляют параметры направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения; и формируют квантованное и кодированное представление параметров рассеянности и параметров направления.
17. Декодер для декодирования кодированного аудиосигнала, содержащего параметры направленного кодирования аудио, включающие в себя кодированные параметры рассеянности и кодированные параметры направления, причем декодер содержит- процессор (300) параметров для декодирования кодированных параметров направленного кодирования аудио для получения декодированного параметра рассеянности с первым временным или частотным разрешением и декодированных параметров направления со вторым временным или частотным разрешением; и преобразователь (710) разрешения параметров для преобразования кодированных или декодированных параметров рассеянности или кодированных или декодированных параметров направления в преобразованные параметры рассеянности или преобразованные параметры направления, имеющие третье временное или частотное разрешение, при этом третье временное или частотное разрешение отличается от первого временного или частотного разрешения или второго временного или частотного разрешения либо от первого временного или частотного разрешения и второго временного или частотного разрешения.
18. Декодер по п. 17, дополнительно содержащий модуль (420) рендеринга аудио, работающий в спектральной области, причем спектральная область содержит для кадра первое число временных квантов и второе число полос частот таким образом, что кадр содержит число частотно-временных элементов разрешения, равное результату умножения первого числа и второго числа, при этом первое число и второе число задают третье временное или частотное разрешение.
19. Декодер по п. 17, дополнительно содержащий модуль (420) рендеринга аудио, работающий в спектральной области, причем спектральная область содержит для кадра первое число временных квантов и второе число полос частот таким образом, что кадр содержит число частотно-временных элементов разрешения, равное результату умножения первого числа и второго числа, при этом первое число и второе число задают четвертое частотно-временное разрешение, при этом четвертое временное или частотное разрешение является равным или превышает третье временное или частотное разрешение.
20. Декодер по п. 17, в котором первое временное или частотное разрешение ниже второго временного или частотного разрешения, и при этом преобразователь (710) разрешения параметров выполнен с возможностью формирования из декодированного параметра рассеянности первого множества преобразованных параметров рассеянности и формирования из декодированного параметра направления второго множества преобразованных параметров направления, при этом второе множество превышает первое множество.
21. Декодер по п. 17, в котором кодированный аудиосигнал содержит последовательность кадров, причём каждый кадр организован в полосах частот, при этом каждый кадр содержит только один кодированный параметр рассеянности в расчете на полосу частот и по меньшей мере два последовательных во времени параметра направления в расчете на полосу частот, и при этом преобразователь (710) разрешения параметров выполнен с возможностью ассоциирования декодированного параметра рассеянности со всеми временными элементами разрешения в полосе частот или с каждым частотно-временным элементом разрешения, включенным в полосу частот в кадре, и ассоциирования одного из по меньшей мере двух параметров направления полосы частот с первой группой временных элементов разрешения и с каждым частотно-временным элементом разрешения, включенным в полосу частот, и ассоциирования второго декодированного параметра направления из по меньшей мере двух параметров направления со второй группой временных элементов разрешения и с каждым частотно-временным элементом разрешения, включенным в полосу частот, при этом вторая группа не включает в себя ни одного из временных элементов разрешения в первой группе.
22. Декодер по п. 17, в котором кодированный аудиосигнал содержит кодированный транспортный аудиосигнал, при этом декодер содержит аудиодекодер (340) для декодирования кодированного транспортного аудиосигнала для получения декодированного аудиосигнала, и частотно-временной преобразователь (430) для преобразования декодированного аудиосигнала в частотное представление, имеющее третье временное или частотное разрешение.
23. Декодер по п. 17, содержащий модуль (420) рендеринга аудио для применения преобразованных параметров рассеянности и преобразованных параметров направления к спектральному представлению аудиосигнала в третьем временном или частотном разрешении для получения спектрального представления синтеза; и спектрально-временной преобразователь (440) для преобразования спектрального представления синтеза в третьем или четвертом временном или частотном разрешении для получения синтезированного пространственного аудиосигнала временной области, имеющего временное разрешение, превышающее разрешение третьего временного или частотного разрешения.
24. Декодер по п. 17, в котором преобразователь (710) разрешения параметров выполнен с возможностью умножения декодированного параметра направления с использованием операции копирования, или умножения декодированного параметра рассеянности с использованием операции копирования либо сглаживания или фильтрации по нижним частотам набора умноженных параметров направления или набора умноженных параметров рассеянности.
25. Декодер по п. 17, в котором второе временное или частотное разрешение отличается от первого временного или частотного разрешения.
26. Декодер по п. 17, в котором первое временное разрешение ниже второго временного разрешения, или второе частотное разрешение превышает первое частотное разрешение, или первое временное разрешение ниже второго временного разрешения, и первое частотное разрешение равно второму частотному разрешению.
27. Декодер по п. 17, в котором преобразователь (710) разрешения параметров выполнен с возможностью умножения декодированных параметров рассеянности и декодированных параметров направления в соответствующее число смежных по частоте преобразованных параметров для набора полос частот, при этом полоса частот, имеющая более низкую центральную частоту, принимает меньшее число умноженных параметров, чем полоса частот, имеющая более высокую центральную частоту.
28. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью декодирования кодированного параметра рассеянности для кадра кодированного аудиосигнала для получения квантованного параметра рассеянности для кадра, и при этом процессор (300) параметров выполнен с возможностью определения точности деквантования для деквантования по меньшей мере одного параметра направления для кадра с использованием квантованного или деквантованного параметра рассеянности, и при этом процессор параметров выполнен с возможностью деквантования квантованного параметра направления с использованием точности деквантования.
29. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью определения из точности деквантования, которая должна использоваться процессором (300) параметров для деквантования, алфавита декодирования для декодирования кодированного параметра направления для кадра, и при этом процессор (300) параметров выполнен с возможностью декодирования кодированного параметра направления с использованием определенного алфавита декодирования и определения деквантованного параметра направления.
30. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью определения из точности деквантования, которая должна использоваться процессором (300) параметров для деквантования, параметра направления, алфавита наклона для обработки кодированного параметра наклона, и определения из индекса наклона, полученного с использованием алфавита наклона, алфавита азимута, и при этом процессор (300) параметров выполнен с возможностью деквантования кодированного параметра азимута с использованием алфавита азимута.
31. Способ декодирования кодированного аудиосигнала, содержащего параметры направленного кодирования аудио, включающие в себя кодированные параметры рассеянности и кодированные параметры направления, при этом способ содержит этапы, на которых: декодируют (300) кодированные параметры направленного кодирования аудио для получения декодированного параметра рассеянности с первым временным или частотным разрешением и декодированные параметры направления со вторым временным или частотным разрешением; и преобразуют (710) кодированные или декодированные параметры рассеянности либо кодированные или декодированные параметры направления в преобразованные параметры рассеянности или преобразованные параметры направления, имеющие третье временное или частотное разрешение, при этом третье временное или частотное разрешение отличается от первого временного или частотного разрешения или второго временного или частотного разрешения либо от первого временного или частотного разрешения и второго временного или частотного разрешения.
32. Компьютерная программа для осуществления, при выполнении на компьютере или процессоре, способа по п. 16 или 31.
RU2020119761A 2017-11-17 2018-11-16 Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений RU2763313C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17202393 2017-11-17
EP17202393.9 2017-11-17
PCT/EP2018/081620 WO2019097017A1 (en) 2017-11-17 2018-11-16 Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions

Publications (3)

Publication Number Publication Date
RU2020119761A true RU2020119761A (ru) 2021-12-17
RU2020119761A3 RU2020119761A3 (ru) 2021-12-17
RU2763313C2 RU2763313C2 (ru) 2021-12-28

Family

ID=60515115

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2020119761A RU2763313C2 (ru) 2017-11-17 2018-11-16 Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений
RU2020119762A RU2763155C2 (ru) 2017-11-17 2018-11-16 Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2020119762A RU2763155C2 (ru) 2017-11-17 2018-11-16 Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования

Country Status (19)

Country Link
US (4) US11367454B2 (ru)
EP (3) EP4113512A1 (ru)
JP (5) JP7175980B2 (ru)
KR (3) KR102599743B1 (ru)
CN (3) CN117351970A (ru)
AR (2) AR113525A1 (ru)
AU (2) AU2018368589B2 (ru)
BR (2) BR112020011026A2 (ru)
CA (2) CA3083891C (ru)
ES (1) ES2930374T3 (ru)
FI (1) FI3711047T3 (ru)
MX (2) MX2020005045A (ru)
PL (1) PL3711047T3 (ru)
PT (1) PT3711047T (ru)
RU (2) RU2763313C2 (ru)
SG (2) SG11202004430YA (ru)
TW (3) TWI759240B (ru)
WO (2) WO2019097017A1 (ru)
ZA (2) ZA202003476B (ru)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018368589B2 (en) 2017-11-17 2021-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
GB2572761A (en) * 2018-04-09 2019-10-16 Nokia Technologies Oy Quantization of spatial audio parameters
GB2575305A (en) * 2018-07-05 2020-01-08 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
JP2022511156A (ja) 2018-11-13 2022-01-31 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号及び関連するメタデータによる空間オーディオの表現
GB2585187A (en) * 2019-06-25 2021-01-06 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
GB2586214A (en) * 2019-07-31 2021-02-17 Nokia Technologies Oy Quantization of spatial audio direction parameters
GB2586586A (en) 2019-08-16 2021-03-03 Nokia Technologies Oy Quantization of spatial audio direction parameters
GB2586461A (en) * 2019-08-16 2021-02-24 Nokia Technologies Oy Quantization of spatial audio direction parameters
CN110660401B (zh) * 2019-09-02 2021-09-24 武汉大学 一种基于高低频域分辨率切换的音频对象编解码方法
GB2587196A (en) 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
EP4037317A4 (en) * 2019-09-25 2023-01-04 Panasonic Intellectual Property Corporation of America ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD AND DECODING METHOD
GB2590651A (en) * 2019-12-23 2021-07-07 Nokia Technologies Oy Combining of spatial audio parameters
GB2590650A (en) * 2019-12-23 2021-07-07 Nokia Technologies Oy The merging of spatial audio parameters
GB2590913A (en) * 2019-12-31 2021-07-14 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2592896A (en) * 2020-01-13 2021-09-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2595883A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2595871A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy The reduction of spatial audio parameters
KR102361651B1 (ko) 2020-07-23 2022-02-09 효성티앤에스 주식회사 매체 입금기의 번들모듈
GB2598104A (en) * 2020-08-17 2022-02-23 Nokia Technologies Oy Discontinuous transmission operation for spatial audio parameters
GB2598773A (en) * 2020-09-14 2022-03-16 Nokia Technologies Oy Quantizing spatial audio parameters
GB202014572D0 (en) * 2020-09-16 2020-10-28 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
JP2023554411A (ja) * 2020-12-15 2023-12-27 ノキア テクノロジーズ オサケユイチア 空間音声パラメータの量子化
CN116940983A (zh) * 2021-01-18 2023-10-24 诺基亚技术有限公司 变换空间音频参数
CN117395591A (zh) * 2021-03-05 2024-01-12 华为技术有限公司 Hoa系数的获取方法和装置
JP2024512953A (ja) * 2021-03-22 2024-03-21 ノキア テクノロジーズ オサケユイチア 空間音声ストリームの結合
WO2022223133A1 (en) * 2021-04-23 2022-10-27 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
WO2023147864A1 (en) 2022-02-03 2023-08-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method to transform an audio stream
FR3132811A1 (fr) * 2022-02-14 2023-08-18 Orange Codage et décodage de coordonnées sphériques utilisant un dictionnaire de quantification sphérique optimisé
WO2023179846A1 (en) * 2022-03-22 2023-09-28 Nokia Technologies Oy Parametric spatial audio encoding

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
FR2810476B1 (fr) 2000-06-14 2002-10-11 De Palluel Darcel Vince Crette Balises multifonctions d'emissions/reception et/ou de reemissions, des signaux codes ou non par emetteurs recepteurs d'ondes avec capteurs realises en technologie mikrotelec
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2006003580A (ja) * 2004-06-17 2006-01-05 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びオーディオ信号符号化方法
JP4640020B2 (ja) 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
MX2009003564A (es) * 2006-10-16 2009-05-28 Fraunhofer Ges Forschung Aparato y metodo para transformacion de parametro multicanal.
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2312578A4 (en) 2008-07-11 2012-09-12 Nec Corp SIGNAL ANALYSIS DEVICE, SIGNAL CONTROL DEVICE AND METHOD AND PROGRAM THEREFOR
EP2154910A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
WO2011000409A1 (en) * 2009-06-30 2011-01-06 Nokia Corporation Positional disambiguation in spatial audio
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
US8897455B2 (en) * 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
CN102860048B (zh) * 2010-02-26 2016-02-17 诺基亚技术有限公司 用于处理产生声场的多个音频信号的方法和设备
ES2656815T3 (es) 2010-03-29 2018-02-28 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica
JP2014506416A (ja) 2010-12-22 2014-03-13 ジェノーディオ,インコーポレーテッド オーディオ空間化および環境シミュレーション
KR20140027954A (ko) 2011-03-16 2014-03-07 디티에스, 인코포레이티드 3차원 오디오 사운드트랙의 인코딩 및 재현
CN102760437B (zh) * 2011-04-29 2014-03-12 上海交通大学 实时声道控制转换的音频解码装置
JP2015509212A (ja) * 2012-01-19 2015-03-26 コーニンクレッカ フィリップス エヌ ヴェ 空間オーディオ・レンダリング及び符号化
BR112015021520B1 (pt) 2013-03-05 2021-07-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho e método para criar um ou mais sinais do canal de saída de áudio dependendo de dois ou mais sinais do canal de entrada de áudio
US9384741B2 (en) * 2013-05-29 2016-07-05 Qualcomm Incorporated Binauralization of rotated higher order ambisonics
US20140355769A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9466305B2 (en) * 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
TWI615834B (zh) 2013-05-31 2018-02-21 Sony Corp 編碼裝置及方法、解碼裝置及方法、以及程式
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
US20150332682A1 (en) * 2014-05-16 2015-11-19 Qualcomm Incorporated Spatial relation coding for higher order ambisonic coefficients
CN106023999B (zh) * 2016-07-11 2019-06-11 武汉大学 用于提高三维音频空间参数压缩率的编解码方法及系统
GB2554446A (en) * 2016-09-28 2018-04-04 Nokia Technologies Oy Spatial audio signal format generation from a microphone array using adaptive capture
US10483913B2 (en) * 2017-07-13 2019-11-19 Qualcomm Incorporated Low power crystal oscillator
CN109274969B (zh) * 2017-07-17 2020-12-22 华为技术有限公司 色度预测的方法和设备
AU2018368589B2 (en) 2017-11-17 2021-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
GB2577698A (en) * 2018-10-02 2020-04-08 Nokia Technologies Oy Selection of quantisation schemes for spatial audio parameter encoding

Also Published As

Publication number Publication date
RU2020119762A (ru) 2021-12-17
KR20230110842A (ko) 2023-07-25
US11783843B2 (en) 2023-10-10
TW201923751A (zh) 2019-06-16
CN111656442A (zh) 2020-09-11
CA3084225C (en) 2023-03-28
EP3711047A1 (en) 2020-09-23
AU2018368589B2 (en) 2021-10-14
KR102535997B1 (ko) 2023-05-23
JP7175980B2 (ja) 2022-11-21
US20200273473A1 (en) 2020-08-27
JP7175979B2 (ja) 2022-11-21
JP2021503627A (ja) 2021-02-12
TWI759240B (zh) 2022-03-21
BR112020011035A2 (pt) 2020-11-17
RU2020119762A3 (ru) 2021-12-17
CA3083891C (en) 2023-05-02
EP3711047B1 (en) 2022-10-05
JP2022171686A (ja) 2022-11-11
US20200265851A1 (en) 2020-08-20
SG11202004389VA (en) 2020-06-29
AU2018368588B2 (en) 2021-12-09
RU2020119761A3 (ru) 2021-12-17
TW201923750A (zh) 2019-06-16
PL3711047T3 (pl) 2023-01-30
EP4113512A1 (en) 2023-01-04
ES2930374T3 (es) 2022-12-09
MX2020005044A (es) 2020-08-20
ZA202003473B (en) 2022-04-28
TWI708241B (zh) 2020-10-21
AR113525A1 (es) 2020-05-13
RU2763155C2 (ru) 2021-12-27
US20230410819A1 (en) 2023-12-21
KR20200100061A (ko) 2020-08-25
AU2018368588A1 (en) 2020-07-02
MX2020005045A (es) 2020-08-20
CA3083891A1 (en) 2019-05-23
WO2019097017A1 (en) 2019-05-23
PT3711047T (pt) 2022-11-16
JP7372360B2 (ja) 2023-10-31
TWI752281B (zh) 2022-01-11
AR113524A1 (es) 2020-05-13
FI3711047T3 (fi) 2023-01-13
US20220130404A1 (en) 2022-04-28
CA3084225A1 (en) 2019-05-23
CN111656441A (zh) 2020-09-11
CN117351970A (zh) 2024-01-05
SG11202004430YA (en) 2020-06-29
JP2024003010A (ja) 2024-01-11
KR20200091880A (ko) 2020-07-31
KR102599743B1 (ko) 2023-11-08
TW202145197A (zh) 2021-12-01
AU2018368589A1 (en) 2020-06-25
WO2019097018A1 (en) 2019-05-23
JP2021503628A (ja) 2021-02-12
EP3711048A1 (en) 2020-09-23
BR112020011026A2 (pt) 2020-11-17
US11367454B2 (en) 2022-06-21
RU2763313C2 (ru) 2021-12-28
JP2022058577A (ja) 2022-04-12
CN111656441B (zh) 2023-10-03
ZA202003476B (en) 2022-10-26

Similar Documents

Publication Publication Date Title
RU2020119761A (ru) Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений
US10699720B2 (en) Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
CA2871252C (en) Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
RU2670797C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
DE69815650T2 (de) Sprachkodierer
US20230410822A1 (en) Filling of Non-Coded Sub-Vectors in Transform Coded Audio Signals
US11264041B2 (en) Transform encoding/decoding of harmonic audio signals
RU2013124065A (ru) Кодирование обобщенных аудиосигналов на низких скоростях передачи битов и с низкой задержкой
US20110071839A1 (en) Method and apparatus for encoding audio data
EP2461590A3 (en) Image prediction on the basis of a frequency band analysis of the to be predicted image
MX2014004797A (es) Método y aparato de codificación sin perdida de energia, método y aparato de codificación de audio, método y aparato de decodificación sin perdida de energia y método y aparato de decodificación de audio.
KR102512359B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
KR102452637B1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
KR20170035827A (ko) 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
US9230551B2 (en) Audio encoder or decoder apparatus
KR102386738B1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
JP2009198612A (ja) 符号化装置、符号化方法および符号化プログラム
EP3637417B1 (en) Signal processing method and device
JP6179087B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム
JP2019070823A (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
US20080243489A1 (en) Multiple stream decoder
US8924202B2 (en) Audio signal coding system and method using speech signal rotation prior to lattice vector quantization
US11468905B2 (en) Sample sequence converter, signal encoding apparatus, signal decoding apparatus, sample sequence converting method, signal encoding method, signal decoding method and program
Nemer et al. Reducing Musical Noise in Transform Based Audio Codecs