RU2020119761A - Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений - Google Patents
Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений Download PDFInfo
- Publication number
- RU2020119761A RU2020119761A RU2020119761A RU2020119761A RU2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A RU 2020119761 A RU2020119761 A RU 2020119761A
- Authority
- RU
- Russia
- Prior art keywords
- parameters
- frequency
- parameter
- time
- resolution
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 5
- 230000002123 temporal effect Effects 0.000 claims 32
- 230000005236 sound signal Effects 0.000 claims 11
- 238000009792 diffusion process Methods 0.000 claims 10
- 230000003595 spectral effect Effects 0.000 claims 7
- 238000012935 Averaging Methods 0.000 claims 3
- 238000000354 decomposition reaction Methods 0.000 claims 3
- 238000009877 rendering Methods 0.000 claims 3
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000013139 quantization Methods 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
- 238000009499 grossing Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
Claims (32)
1. Устройство для кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности и параметры направления, содержащее модуль (100) вычисления параметров для вычисления параметров рассеянности с первым временным или частотным разрешением и для вычисления параметров направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения, и процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления.
2. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления параметров рассеянности и параметров направления таким образом, что первое временное разрешение ниже второго временного разрешения, или второе частотное разрешение больше первого частотного разрешения, или первое временное разрешение ниже второго временного разрешения, и первое частотное разрешение равно второму частотному разрешению.
3. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления параметров рассеянности и параметров направления для набора полос частот, при этом полоса частот, имеющая более низкую центральную частоту, является более узкой, чем полоса частот, имеющая более высокую центральную частоту.
4. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью получения начальных параметров рассеянности, имеющих третье временное или частотное разрешение, и получения начальных параметров направления, имеющих четвертое временное или частотное разрешение, и в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров рассеянности таким образом, что третье временное или частотное разрешение выше первого временного или частотного разрешения, или в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров направления таким образом, что четвертое временное или частотное разрешение выше второго временного или частотного разрешения.
5. Устройство по п. 4, в котором третье временное или частотное разрешение и четвертое временное или частотное разрешение равны друг другу.
6. Устройство по п. 5, в котором третье временное разрешение или частотное разрешение представляет собой постоянное временное или частотное разрешение таким образом, что каждый начальный параметр рассеянности ассоциирован с временным квантом или частотным элементом разрешения, имеющим такой же размер, или в котором четвертое временное или частотное разрешение представляет собой постоянное временное или частотное разрешение таким образом, что каждый начальный параметр направления ассоциирован с временным квантом или частотным элементом разрешения, имеющим такой же размер, и в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по первому множеству параметров рассеянности, ассоциированных с первым множеством временных квантов, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по второму множеству параметров рассеянности, ассоциированных со вторым множеством частотных элементов разрешения, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по третьему множеству параметров направления, ассоциированных с третьим множеством временных квантов, или в котором модуль (100) вычисления параметров выполнен с возможностью усреднения по четвертому множеству параметров направления, ассоциированных с четвертым множеством частотных элементов разрешения.
7. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью усреднения с использованием среднего взвешенного, при этом параметр рассеянности или параметр направления, извлекаемый из части входного сигнала, имеющей более высокий связанный с амплитудой показатель, взвешивается с использованием более высокого весового коэффициента по сравнению с параметром рассеянности или параметром направления, извлекаемым из части входного сигнала, имеющей более низкий связанный с амплитудой показатель.
8. Устройство по п. 7, в котором связанный с амплитудой показатель представляет собой мощность или энергию во временной части или частотной части либо мощность или энергию, возведенную в степень посредством вещественного неотрицательного числа, равного или отличающегося от 1 во временной части или частотной части.
9. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью выполнения усреднения таким образом, что параметр рассеянности или параметр направления нормализуется относительно связанного с амплитудой показателя, извлекаемого из временной части входного сигнала, соответствующего первому или второму временному или частотному разрешению.
10. Устройство по п. 4, в котором модуль (100) вычисления параметров выполнен с возможностью группирования и усреднения начальных параметров направления с использованием усреднения со взвешиванием, при этом первый параметр направления, ассоциированный с первой временной частью, имеющей первый параметр рассеянности, указывающий более низкую рассеянность, взвешивается выше второго параметра направления, ассоциированного со второй временной частью, имеющей второй параметр рассеянности, указывающий более высокую рассеянность.
11. Устройство по п. 1, в котором модуль (100) вычисления параметров выполнен с возможностью вычисления начальных параметров направления таким образом, что начальные параметры направления содержат декартов вектор, имеющий компонент для каждого из двух или трех направлений, и при этом модуль (100) вычисления параметров выполнен с возможностью выполнения усреднения для каждого отдельного компонента декартова вектора отдельно, или при этом компоненты нормализуются таким образом, что сумма возведенных в квадрат компонентов декартова вектора для параметра направления равна единице.
12. Устройство по п. 1, дополнительно содержащее модуль частотно-временного разложения для разложения входного сигнала, имеющего множество входных каналов, в частотно-временное представление для каждого входного канала, или при этом модуль частотно-временного разложения выполнен с возможностью разложения входного сигнала, имеющего множество входных каналов, в частотно-временное представление для каждого входного канала, имеющего третье временное или частотное разрешение или четвертое временное или частотное разрешение.
13. Устройство по п. 5, в котором модуль частотно-временного разложения содержит модулированную гребенку фильтров, приводящую к комплексным значениям для каждого подполосного сигнала, при этом каждый подполосный сигнал имеет множество временных квантов в расчете на кадр и полосу частот.
14. Устройство по п. 1, при этом устройство выполнено с возможностью ассоциирования индикатора первого или второго временного или частотного разрешения в квантованное и кодированное представление для передачи в декодер или для хранения.
15. Устройство по п. 1, в котором процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления содержит квантователь параметров для квантования параметров рассеянности и параметров направления и кодер параметров для кодирования квантованных параметров рассеянности и квантованных параметров направления по любому из вышеприведенных примеров 1-26.
16. Способ кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности и параметры направления, содержащий этапы, на которых вычисляют параметры рассеянности с первым временным или частотным разрешением и вычисляют параметры направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения; и формируют квантованное и кодированное представление параметров рассеянности и параметров направления.
17. Декодер для декодирования кодированного аудиосигнала, содержащего параметры направленного кодирования аудио, включающие в себя кодированные параметры рассеянности и кодированные параметры направления, причем декодер содержит- процессор (300) параметров для декодирования кодированных параметров направленного кодирования аудио для получения декодированного параметра рассеянности с первым временным или частотным разрешением и декодированных параметров направления со вторым временным или частотным разрешением; и преобразователь (710) разрешения параметров для преобразования кодированных или декодированных параметров рассеянности или кодированных или декодированных параметров направления в преобразованные параметры рассеянности или преобразованные параметры направления, имеющие третье временное или частотное разрешение, при этом третье временное или частотное разрешение отличается от первого временного или частотного разрешения или второго временного или частотного разрешения либо от первого временного или частотного разрешения и второго временного или частотного разрешения.
18. Декодер по п. 17, дополнительно содержащий модуль (420) рендеринга аудио, работающий в спектральной области, причем спектральная область содержит для кадра первое число временных квантов и второе число полос частот таким образом, что кадр содержит число частотно-временных элементов разрешения, равное результату умножения первого числа и второго числа, при этом первое число и второе число задают третье временное или частотное разрешение.
19. Декодер по п. 17, дополнительно содержащий модуль (420) рендеринга аудио, работающий в спектральной области, причем спектральная область содержит для кадра первое число временных квантов и второе число полос частот таким образом, что кадр содержит число частотно-временных элементов разрешения, равное результату умножения первого числа и второго числа, при этом первое число и второе число задают четвертое частотно-временное разрешение, при этом четвертое временное или частотное разрешение является равным или превышает третье временное или частотное разрешение.
20. Декодер по п. 17, в котором первое временное или частотное разрешение ниже второго временного или частотного разрешения, и при этом преобразователь (710) разрешения параметров выполнен с возможностью формирования из декодированного параметра рассеянности первого множества преобразованных параметров рассеянности и формирования из декодированного параметра направления второго множества преобразованных параметров направления, при этом второе множество превышает первое множество.
21. Декодер по п. 17, в котором кодированный аудиосигнал содержит последовательность кадров, причём каждый кадр организован в полосах частот, при этом каждый кадр содержит только один кодированный параметр рассеянности в расчете на полосу частот и по меньшей мере два последовательных во времени параметра направления в расчете на полосу частот, и при этом преобразователь (710) разрешения параметров выполнен с возможностью ассоциирования декодированного параметра рассеянности со всеми временными элементами разрешения в полосе частот или с каждым частотно-временным элементом разрешения, включенным в полосу частот в кадре, и ассоциирования одного из по меньшей мере двух параметров направления полосы частот с первой группой временных элементов разрешения и с каждым частотно-временным элементом разрешения, включенным в полосу частот, и ассоциирования второго декодированного параметра направления из по меньшей мере двух параметров направления со второй группой временных элементов разрешения и с каждым частотно-временным элементом разрешения, включенным в полосу частот, при этом вторая группа не включает в себя ни одного из временных элементов разрешения в первой группе.
22. Декодер по п. 17, в котором кодированный аудиосигнал содержит кодированный транспортный аудиосигнал, при этом декодер содержит аудиодекодер (340) для декодирования кодированного транспортного аудиосигнала для получения декодированного аудиосигнала, и частотно-временной преобразователь (430) для преобразования декодированного аудиосигнала в частотное представление, имеющее третье временное или частотное разрешение.
23. Декодер по п. 17, содержащий модуль (420) рендеринга аудио для применения преобразованных параметров рассеянности и преобразованных параметров направления к спектральному представлению аудиосигнала в третьем временном или частотном разрешении для получения спектрального представления синтеза; и спектрально-временной преобразователь (440) для преобразования спектрального представления синтеза в третьем или четвертом временном или частотном разрешении для получения синтезированного пространственного аудиосигнала временной области, имеющего временное разрешение, превышающее разрешение третьего временного или частотного разрешения.
24. Декодер по п. 17, в котором преобразователь (710) разрешения параметров выполнен с возможностью умножения декодированного параметра направления с использованием операции копирования, или умножения декодированного параметра рассеянности с использованием операции копирования либо сглаживания или фильтрации по нижним частотам набора умноженных параметров направления или набора умноженных параметров рассеянности.
25. Декодер по п. 17, в котором второе временное или частотное разрешение отличается от первого временного или частотного разрешения.
26. Декодер по п. 17, в котором первое временное разрешение ниже второго временного разрешения, или второе частотное разрешение превышает первое частотное разрешение, или первое временное разрешение ниже второго временного разрешения, и первое частотное разрешение равно второму частотному разрешению.
27. Декодер по п. 17, в котором преобразователь (710) разрешения параметров выполнен с возможностью умножения декодированных параметров рассеянности и декодированных параметров направления в соответствующее число смежных по частоте преобразованных параметров для набора полос частот, при этом полоса частот, имеющая более низкую центральную частоту, принимает меньшее число умноженных параметров, чем полоса частот, имеющая более высокую центральную частоту.
28. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью декодирования кодированного параметра рассеянности для кадра кодированного аудиосигнала для получения квантованного параметра рассеянности для кадра, и при этом процессор (300) параметров выполнен с возможностью определения точности деквантования для деквантования по меньшей мере одного параметра направления для кадра с использованием квантованного или деквантованного параметра рассеянности, и при этом процессор параметров выполнен с возможностью деквантования квантованного параметра направления с использованием точности деквантования.
29. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью определения из точности деквантования, которая должна использоваться процессором (300) параметров для деквантования, алфавита декодирования для декодирования кодированного параметра направления для кадра, и при этом процессор (300) параметров выполнен с возможностью декодирования кодированного параметра направления с использованием определенного алфавита декодирования и определения деквантованного параметра направления.
30. Декодер по п. 17, в котором процессор (300) параметров выполнен с возможностью определения из точности деквантования, которая должна использоваться процессором (300) параметров для деквантования, параметра направления, алфавита наклона для обработки кодированного параметра наклона, и определения из индекса наклона, полученного с использованием алфавита наклона, алфавита азимута, и при этом процессор (300) параметров выполнен с возможностью деквантования кодированного параметра азимута с использованием алфавита азимута.
31. Способ декодирования кодированного аудиосигнала, содержащего параметры направленного кодирования аудио, включающие в себя кодированные параметры рассеянности и кодированные параметры направления, при этом способ содержит этапы, на которых: декодируют (300) кодированные параметры направленного кодирования аудио для получения декодированного параметра рассеянности с первым временным или частотным разрешением и декодированные параметры направления со вторым временным или частотным разрешением; и преобразуют (710) кодированные или декодированные параметры рассеянности либо кодированные или декодированные параметры направления в преобразованные параметры рассеянности или преобразованные параметры направления, имеющие третье временное или частотное разрешение, при этом третье временное или частотное разрешение отличается от первого временного или частотного разрешения или второго временного или частотного разрешения либо от первого временного или частотного разрешения и второго временного или частотного разрешения.
32. Компьютерная программа для осуществления, при выполнении на компьютере или процессоре, способа по п. 16 или 31.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17202393 | 2017-11-17 | ||
EP17202393.9 | 2017-11-17 | ||
PCT/EP2018/081620 WO2019097017A1 (en) | 2017-11-17 | 2018-11-16 | Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2020119761A true RU2020119761A (ru) | 2021-12-17 |
RU2020119761A3 RU2020119761A3 (ru) | 2021-12-17 |
RU2763313C2 RU2763313C2 (ru) | 2021-12-28 |
Family
ID=60515115
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020119761A RU2763313C2 (ru) | 2017-11-17 | 2018-11-16 | Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений |
RU2020119762A RU2763155C2 (ru) | 2017-11-17 | 2018-11-16 | Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020119762A RU2763155C2 (ru) | 2017-11-17 | 2018-11-16 | Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования |
Country Status (19)
Country | Link |
---|---|
US (4) | US11367454B2 (ru) |
EP (3) | EP4113512A1 (ru) |
JP (5) | JP7175980B2 (ru) |
KR (3) | KR102599743B1 (ru) |
CN (3) | CN117351970A (ru) |
AR (2) | AR113525A1 (ru) |
AU (2) | AU2018368589B2 (ru) |
BR (2) | BR112020011026A2 (ru) |
CA (2) | CA3083891C (ru) |
ES (1) | ES2930374T3 (ru) |
FI (1) | FI3711047T3 (ru) |
MX (2) | MX2020005045A (ru) |
PL (1) | PL3711047T3 (ru) |
PT (1) | PT3711047T (ru) |
RU (2) | RU2763313C2 (ru) |
SG (2) | SG11202004430YA (ru) |
TW (3) | TWI759240B (ru) |
WO (2) | WO2019097017A1 (ru) |
ZA (2) | ZA202003476B (ru) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018368589B2 (en) | 2017-11-17 | 2021-10-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
GB2572761A (en) * | 2018-04-09 | 2019-10-16 | Nokia Technologies Oy | Quantization of spatial audio parameters |
GB2575305A (en) * | 2018-07-05 | 2020-01-08 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
JP2022511156A (ja) | 2018-11-13 | 2022-01-31 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号及び関連するメタデータによる空間オーディオの表現 |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
GB2586214A (en) * | 2019-07-31 | 2021-02-17 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2586586A (en) | 2019-08-16 | 2021-03-03 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2586461A (en) * | 2019-08-16 | 2021-02-24 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
CN110660401B (zh) * | 2019-09-02 | 2021-09-24 | 武汉大学 | 一种基于高低频域分辨率切换的音频对象编解码方法 |
GB2587196A (en) | 2019-09-13 | 2021-03-24 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
EP4037317A4 (en) * | 2019-09-25 | 2023-01-04 | Panasonic Intellectual Property Corporation of America | ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD AND DECODING METHOD |
GB2590651A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
GB2590650A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | The merging of spatial audio parameters |
GB2590913A (en) * | 2019-12-31 | 2021-07-14 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2592896A (en) * | 2020-01-13 | 2021-09-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2595883A (en) * | 2020-06-09 | 2021-12-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2595871A (en) * | 2020-06-09 | 2021-12-15 | Nokia Technologies Oy | The reduction of spatial audio parameters |
KR102361651B1 (ko) | 2020-07-23 | 2022-02-09 | 효성티앤에스 주식회사 | 매체 입금기의 번들모듈 |
GB2598104A (en) * | 2020-08-17 | 2022-02-23 | Nokia Technologies Oy | Discontinuous transmission operation for spatial audio parameters |
GB2598773A (en) * | 2020-09-14 | 2022-03-16 | Nokia Technologies Oy | Quantizing spatial audio parameters |
GB202014572D0 (en) * | 2020-09-16 | 2020-10-28 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
JP2023554411A (ja) * | 2020-12-15 | 2023-12-27 | ノキア テクノロジーズ オサケユイチア | 空間音声パラメータの量子化 |
CN116940983A (zh) * | 2021-01-18 | 2023-10-24 | 诺基亚技术有限公司 | 变换空间音频参数 |
CN117395591A (zh) * | 2021-03-05 | 2024-01-12 | 华为技术有限公司 | Hoa系数的获取方法和装置 |
JP2024512953A (ja) * | 2021-03-22 | 2024-03-21 | ノキア テクノロジーズ オサケユイチア | 空間音声ストリームの結合 |
WO2022223133A1 (en) * | 2021-04-23 | 2022-10-27 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
WO2023147864A1 (en) | 2022-02-03 | 2023-08-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method to transform an audio stream |
FR3132811A1 (fr) * | 2022-02-14 | 2023-08-18 | Orange | Codage et décodage de coordonnées sphériques utilisant un dictionnaire de quantification sphérique optimisé |
WO2023179846A1 (en) * | 2022-03-22 | 2023-09-28 | Nokia Technologies Oy | Parametric spatial audio encoding |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
FR2810476B1 (fr) | 2000-06-14 | 2002-10-11 | De Palluel Darcel Vince Crette | Balises multifonctions d'emissions/reception et/ou de reemissions, des signaux codes ou non par emetteurs recepteurs d'ondes avec capteurs realises en technologie mikrotelec |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2006003580A (ja) * | 2004-06-17 | 2006-01-05 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びオーディオ信号符号化方法 |
JP4640020B2 (ja) | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
MX2009003564A (es) * | 2006-10-16 | 2009-05-28 | Fraunhofer Ges Forschung | Aparato y metodo para transformacion de parametro multicanal. |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8290167B2 (en) * | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US8897359B2 (en) * | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2312578A4 (en) | 2008-07-11 | 2012-09-12 | Nec Corp | SIGNAL ANALYSIS DEVICE, SIGNAL CONTROL DEVICE AND METHOD AND PROGRAM THEREFOR |
EP2154910A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
WO2011000409A1 (en) * | 2009-06-30 | 2011-01-06 | Nokia Corporation | Positional disambiguation in spatial audio |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
US8897455B2 (en) * | 2010-02-18 | 2014-11-25 | Qualcomm Incorporated | Microphone array subset selection for robust noise reduction |
CN102860048B (zh) * | 2010-02-26 | 2016-02-17 | 诺基亚技术有限公司 | 用于处理产生声场的多个音频信号的方法和设备 |
ES2656815T3 (es) | 2010-03-29 | 2018-02-28 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung | Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica |
JP2014506416A (ja) | 2010-12-22 | 2014-03-13 | ジェノーディオ,インコーポレーテッド | オーディオ空間化および環境シミュレーション |
KR20140027954A (ko) | 2011-03-16 | 2014-03-07 | 디티에스, 인코포레이티드 | 3차원 오디오 사운드트랙의 인코딩 및 재현 |
CN102760437B (zh) * | 2011-04-29 | 2014-03-12 | 上海交通大学 | 实时声道控制转换的音频解码装置 |
JP2015509212A (ja) * | 2012-01-19 | 2015-03-26 | コーニンクレッカ フィリップス エヌ ヴェ | 空間オーディオ・レンダリング及び符号化 |
BR112015021520B1 (pt) | 2013-03-05 | 2021-07-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho e método para criar um ou mais sinais do canal de saída de áudio dependendo de dois ou mais sinais do canal de entrada de áudio |
US9384741B2 (en) * | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
US20140355769A1 (en) * | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9466305B2 (en) * | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
TWI615834B (zh) | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
US20150332682A1 (en) * | 2014-05-16 | 2015-11-19 | Qualcomm Incorporated | Spatial relation coding for higher order ambisonic coefficients |
CN106023999B (zh) * | 2016-07-11 | 2019-06-11 | 武汉大学 | 用于提高三维音频空间参数压缩率的编解码方法及系统 |
GB2554446A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
US10483913B2 (en) * | 2017-07-13 | 2019-11-19 | Qualcomm Incorporated | Low power crystal oscillator |
CN109274969B (zh) * | 2017-07-17 | 2020-12-22 | 华为技术有限公司 | 色度预测的方法和设备 |
AU2018368589B2 (en) | 2017-11-17 | 2021-10-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
GB2577698A (en) * | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
-
2018
- 2018-11-16 AU AU2018368589A patent/AU2018368589B2/en active Active
- 2018-11-16 KR KR1020207017247A patent/KR102599743B1/ko active IP Right Grant
- 2018-11-16 WO PCT/EP2018/081620 patent/WO2019097017A1/en active Search and Examination
- 2018-11-16 BR BR112020011026-4A patent/BR112020011026A2/pt unknown
- 2018-11-16 MX MX2020005045A patent/MX2020005045A/es unknown
- 2018-11-16 KR KR1020207017280A patent/KR102535997B1/ko active IP Right Grant
- 2018-11-16 CN CN202311255126.9A patent/CN117351970A/zh active Pending
- 2018-11-16 JP JP2020526994A patent/JP7175980B2/ja active Active
- 2018-11-16 ES ES18803985T patent/ES2930374T3/es active Active
- 2018-11-16 RU RU2020119761A patent/RU2763313C2/ru active
- 2018-11-16 PT PT188039853T patent/PT3711047T/pt unknown
- 2018-11-16 EP EP22192222.2A patent/EP4113512A1/en active Pending
- 2018-11-16 CN CN201880086690.3A patent/CN111656442A/zh active Pending
- 2018-11-16 JP JP2020526987A patent/JP7175979B2/ja active Active
- 2018-11-16 BR BR112020011035-3A patent/BR112020011035A2/pt unknown
- 2018-11-16 WO PCT/EP2018/081623 patent/WO2019097018A1/en active Search and Examination
- 2018-11-16 CN CN201880086689.0A patent/CN111656441B/zh active Active
- 2018-11-16 MX MX2020005044A patent/MX2020005044A/es unknown
- 2018-11-16 EP EP18803987.9A patent/EP3711048A1/en active Pending
- 2018-11-16 KR KR1020237024617A patent/KR20230110842A/ko not_active Application Discontinuation
- 2018-11-16 SG SG11202004430YA patent/SG11202004430YA/en unknown
- 2018-11-16 CA CA3083891A patent/CA3083891C/en active Active
- 2018-11-16 SG SG11202004389VA patent/SG11202004389VA/en unknown
- 2018-11-16 AU AU2018368588A patent/AU2018368588B2/en active Active
- 2018-11-16 PL PL18803985.3T patent/PL3711047T3/pl unknown
- 2018-11-16 RU RU2020119762A patent/RU2763155C2/ru active
- 2018-11-16 CA CA3084225A patent/CA3084225C/en active Active
- 2018-11-16 EP EP18803985.3A patent/EP3711047B1/en active Active
- 2018-11-16 FI FIEP18803985.3T patent/FI3711047T3/fi active
- 2018-11-19 TW TW110129069A patent/TWI759240B/zh active
- 2018-11-19 TW TW107141079A patent/TWI708241B/zh active
- 2018-11-19 TW TW107141081A patent/TWI752281B/zh active
- 2018-11-20 AR ARP180103392A patent/AR113525A1/es active IP Right Grant
- 2018-11-20 AR ARP180103391A patent/AR113524A1/es active IP Right Grant
-
2020
- 2020-05-06 US US16/867,856 patent/US11367454B2/en active Active
- 2020-05-11 US US16/871,223 patent/US11783843B2/en active Active
- 2020-06-10 ZA ZA2020/03476A patent/ZA202003476B/en unknown
- 2020-06-10 ZA ZA2020/03473A patent/ZA202003473B/en unknown
-
2022
- 2022-01-10 US US17/571,970 patent/US20220130404A1/en active Pending
- 2022-01-12 JP JP2022003012A patent/JP7372360B2/ja active Active
- 2022-08-24 JP JP2022133236A patent/JP2022171686A/ja active Pending
-
2023
- 2023-08-28 US US18/456,670 patent/US20230410819A1/en active Pending
- 2023-10-18 JP JP2023179870A patent/JP2024003010A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2020119761A (ru) | Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием различных частотно-временных разрешений | |
US10699720B2 (en) | Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus | |
CA2871252C (en) | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program | |
RU2670797C2 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
DE69815650T2 (de) | Sprachkodierer | |
US20230410822A1 (en) | Filling of Non-Coded Sub-Vectors in Transform Coded Audio Signals | |
US11264041B2 (en) | Transform encoding/decoding of harmonic audio signals | |
RU2013124065A (ru) | Кодирование обобщенных аудиосигналов на низких скоростях передачи битов и с низкой задержкой | |
US20110071839A1 (en) | Method and apparatus for encoding audio data | |
EP2461590A3 (en) | Image prediction on the basis of a frequency band analysis of the to be predicted image | |
MX2014004797A (es) | Método y aparato de codificación sin perdida de energia, método y aparato de codificación de audio, método y aparato de decodificación sin perdida de energia y método y aparato de decodificación de audio. | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
KR102452637B1 (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 | |
KR20170035827A (ko) | 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법 | |
US9230551B2 (en) | Audio encoder or decoder apparatus | |
KR102386738B1 (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 | |
JP2009198612A (ja) | 符号化装置、符号化方法および符号化プログラム | |
EP3637417B1 (en) | Signal processing method and device | |
JP6179087B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム | |
JP2019070823A (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 | |
US20080243489A1 (en) | Multiple stream decoder | |
US8924202B2 (en) | Audio signal coding system and method using speech signal rotation prior to lattice vector quantization | |
US11468905B2 (en) | Sample sequence converter, signal encoding apparatus, signal decoding apparatus, sample sequence converting method, signal encoding method, signal decoding method and program | |
Nemer et al. | Reducing Musical Noise in Transform Based Audio Codecs |