RU2015116287A

RU2015116287A - Кодер, декодер и способы для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов

Info

Publication number: RU2015116287A
Application number: RU2015116287A
Authority: RU
Inventors: Саша ДИШ; Йоуни ПАУЛУС; Бернд ЭДЛЕР; Оливер ХЕЛЛЬМУТ; Юрген ХЕРРЕ; Торстен КАСТНЕР
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2012-10-05
Filing date: 2013-10-02
Publication date: 2016-11-27
Also published as: RU2625939C2; JP2015535959A; US20150279377A1; HK1213361A1; EP2717262A1; TWI541795B; US20150221314A1; CA2886999C; BR112015007649B1; RU2015116645A; BR112015007650A2; MX350691B; TW201423729A; EP2904611B1; CA2887028A1; JP6185592B2; WO2014053548A1; CN105190747A; US9734833B2; CN104798131A

Abstract

1. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:генератор (134) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,модуль (135) t/f-анализа для преобразования упомянутого множества выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, иблок (136) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.2. Декодер по п. 1, в котором генератор (134) последовательности

Claims

1. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:

генератор (134) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,

модуль (135) t/f-анализа для преобразования упомянутого множества выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и

блок (136) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

2. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования, был составлен первым окном анализа из упомянутого множества окон анализа и вторым окном анализа из упомянутого множества окон анализа, при этом центр c_k упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k=t-l_b, а центр c_k+1 упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k+1=t+l_a, при этом l_a и l_b являются числами.

3. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования, был составлен первым окном анализа из упомянутого множества окон анализа, при этом центр c_k упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k=t, при этом центр c_k-1 второго окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с c_k-1=t-l_b, и при этом центр c_k+1 третьего окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с c_k+1=t+l_a, при этом l_a и l_b являются числами.

4. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы каждое из упомянутого множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, при этом упомянутое второе количество выборок сигнала временной области больше упомянутого первого количества выборок сигнала временной области, и при этом каждое из окон анализа упомянутого множества окон анализа содержит упомянутое первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий переключение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования.

5. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:

первый подмодуль (161) анализа для преобразования упомянутого множества выборок понижающего микширования временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов,

генератор (162) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое окно анализа упомянутого множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом генератор (162) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,

второй модуль (163) анализа для преобразования упомянутого множества выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и

блок (164) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

6. Кодер для кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом кодер содержит:

блок (102) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок сигнала временной области одного из сигналов входных аудиообъектов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области упомянутого окна анализа, при этом блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,

блок (103) t/f-анализа для преобразования выборок сигнала временной области каждого из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала, при этом блок (103) t/f-анализа сконфигурирован для преобразования упомянутого множества выборок сигнала временной области каждого из окон анализа в зависимости от длины окна упомянутого окна анализа, и

блок (104) оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

7. Кодер по п. 6, при этом кодер дополнительно содержит блок (101) обнаружения перехода, сконфигурированный для определения множества разностей уровней объектов упомянутых двух или более сигналов входных аудиообъектов, и сконфигурированный для определения, больше ли порогового значения разница между первой из разностей уровней объектов и второй из разностей уровней объектов, чтобы для каждого из окон анализа определить, содержит ли упомянутое окно анализа переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов.

8. Кодер по п. 7,

в котором блок (101) обнаружения перехода сконфигурирован для применения функции d(n) обнаружения, чтобы определить, больше ли упомянутого порогового значения разница между упомянутой первой из разностей уровней объектов и упомянутой второй из разностей уровней объектов,

при этом функция d(n) обнаружения задается в виде:

,

где n указывает индекс,

где i указывает первый объект,

где j указывает второй объект, и

где b указывает параметрический диапазон.

9. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из упомянутого множества окон анализа и вторым окном анализа из упомянутого множества окон анализа, при этом центр c_k упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k=t-l_b, а центр c_k+1 упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k+1=t+l_a, при этом l_a и l_b являются числами.

10. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из упомянутого множества окон анализа, при этом центр c_k упомянутого первого окна анализа задается местоположением t перехода в соответствии с c_k=t, при этом центр c_k-1 второго окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с c_k-1=t-l_b, и при этом центр c_k+1 третьего окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с c_k+1=t+l_a, при этом l_a и l_b являются числами.

11. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы каждое из упомянутого множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, при этом упомянутое второе количество выборок сигнала временной области больше упомянутого первого количества выборок сигнала временной области, и при этом каждое из окон анализа упомянутого множества окон анализа содержит упомянутое первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов.

12. Кодер для кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом кодер содержит:

первый подмодуль (171) анализа для преобразования упомянутого множества выборок сигнала временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов,

блок (172) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом блок (172) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,

второй модуль (173) анализа для преобразования упомянутого множества выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованные выборки сигнала, и

блок (174) оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

13. Способ декодирования для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом способ содержит этапы, на которых:

определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,

преобразуют упомянутое множество выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и

осуществляют повышающее микширование преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

14. Способ кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом способ содержит этапы, на которых:

определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок сигнала временной области одного из сигналов входных аудиообъектов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,

преобразуют выборки сигнала временной области каждого из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала, при этом преобразование упомянутого множества выборок сигнала временной области каждого из окон анализа зависит от длины окна упомянутого окна анализа,

определяют параметрическую дополнительную информацию в зависимости от преобразованных выборок сигнала.

15. Способ декодирования путем формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом способ содержит этапы, на которых:

преобразуют упомянутое множество выборок понижающего микширования временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов,

определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,

преобразуют упомянутое множество выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и

16. Способ кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом способ содержит этапы, на которых:

преобразуют упомянутое множество выборок сигнала временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов,

определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,

преобразуют упомянутое множество выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованные выборки сигнала, и

17. Компьютерная программа для реализации одного из способов по пп. 13-16 при исполнении на компьютере или процессоре сигналов.