RU2018133016A

RU2018133016A - Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка

Info

Publication number: RU2018133016A
Application number: RU2018133016A
Authority: RU
Inventors: Александр КРЮГЕР; Свен КОРДОН
Original assignee: Долби Интернэшнл Аб
Priority date: 2013-04-29
Filing date: 2014-04-24
Publication date: 2018-10-02
Also published as: CA2907595A1; EP2800401A1; US20200304931A1; EP3232687A1; CN107180639B; EP2992689B1; RU2015150988A; CN107146627B; CA3110057C; US20170318406A1; US20160088415A1; KR102232486B1; US20220225044A1; CN105144752B; MX2022012186A; JP2021060614A; JP2022058929A; US10999688B2; EP3926984A1; JP6606241B2

Claims

1. Способ сжатия представления на основе амбиофонии высшего порядка звукового поля с использованием первого числа перцепционных кодирований, обозначаемой HOA, с входными временными кадрами последовательностей HOA-коэффициентов, причем упомянутый способ включает в себя этапы, которые выполняются на покадровой основе, на которых:

для текущего кадра, оценивают набор доминирующих направлений и соответствующий набор данных индексов обнаруженных направленных сигналов;

отделяют от последовательностей HOA-коэффициентов упомянутого текущего кадра, второе число направленных сигналов с соответствующими направлениями, содержащимися в упомянутом наборе оценок доминирующих направлений, и с соответствующим задержанным набором данных индексов упомянутых направленных сигналов,

и окружающий HOA-компонент, который представлен посредством сокращенного числа последовательностей HOA-коэффициентов и соответствующего набора данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов, причем это сокращенное число соответствует разности между упомянутым первым числом и упомянутым вторым числом;

назначают упомянутые направленные сигналы и последовательности HOA-коэффициентов упомянутого окружающего HOA-компонента кадру из каналов, число которых соответствует упомянутому первому числу, при этом для упомянутого назначения используются упомянутый задержанный набор данных индексов упомянутых направленных сигналов и упомянутый набор данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов;

перцепционно кодируют упомянутые каналы получившего назначение кадра таким образом, чтобы предоставлять кодированный сжатый кадр.

2. Способ по п. 1, в котором упомянутое второе число направленных сигналов определяется согласно перцепционно связанному критерию таким образом, что:

соответственно, распакованное HOA-представление предоставляет наименьшую воспринимаемую ошибку, которая может достигаться с помощью фиксированного данного числа каналов для сжатия, при этом упомянутый критерий учитывает следующие ошибки:

ошибки моделирования, возникающие в результате использования различных чисел упомянутых направленных сигналов и различных чисел последовательностей HOA-коэффициентов для окружающего HOA-компонента;

шум квантования, введенный посредством перцепционного кодирования упомянутых направленных сигналов;

шум квантования, введенный посредством кодирования отдельных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента;

полная ошибка, получающаяся в результате вышеуказанных трех ошибок, учитывается для числа тестовых направлений и числа критических полос частот относительно своей воспринимаемости;

упомянутое второе число направленных сигналов выбирается таким образом, чтобы минимизировать среднюю воспринимаемую ошибку или максимальную воспринимаемую ошибку, с тем, чтобы достигать упомянутой наименьшей воспринимаемой ошибки.

3. Способ по п. 1, в котором выбор сокращенного числа последовательностей HOA-коэффициентов для того, чтобы представлять окружающий HOA-компонент, выполняется согласно критерию, который различается между следующими тремя случаями:

в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра является идентичным числу последовательностей HOA-коэффициентов для предыдущего кадра, выбираются последовательности HOA-коэффициентов, идентичные последовательностям HOA-коэффициентов в упомянутом предыдущем кадре;

в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра меньше числа последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, деактивируются те последовательности HOA-коэффициентов из упомянутого предыдущего кадра, которые находятся в упомянутом предыдущем кадре, назначаемом каналу, который находится в упомянутом текущем кадре, занимаемом посредством направленного сигнала;

в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра превышает число последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, те последовательности HOA-коэффициентов, которые выбраны в упомянутом предыдущем кадре, также выбраны в упомянутом текущем кадре, и эти дополнительные последовательности HOA-коэффициентов могут выбираться согласно своей перцепционной значимости или согласно наибольшей средней мощности.

4. Способ по п. 1, в котором упомянутое назначение выполняется следующим образом:

активные направленные сигналы назначаются данным каналам таким образом, что они сохраняют свои индексы каналов, чтобы получать непрерывные сигналы для упомянутого перцепционного кодирования;

последовательности HOA-коэффициентов упомянутого окружающего HOA-компонента назначаются таким образом, что минимальное число (

) таких последовательностей коэффициентов всегда содержится в соответствующем числе (

) последних каналов;

для назначения дополнительных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента определяется, выбраны ли они также в предыдущем кадре:

если это является истинным, назначение этих последовательностей HOA-коэффициентов каналам, которые должны быть перцепционно кодированы, является идентичным назначению для упомянутого предыдущего кадра;

если это не является истинным, и если последовательности HOA-коэффициентов выбираются как новые, последовательности HOA-коэффициентов сначала размещаются относительно своих индексов в порядке по возрастанию и в этом порядке назначаются каналам, которые должны быть перцепционно кодированы, которые еще не заняты посредством направленных сигналов.

5. Способ по п. 1, в котором

является числом последовательностей HOA-коэффициентов, представляющих упомянутый окружающий HOA-компонент, и при этом параметры, описывающие упомянутое назначение, размещаются в битовом массиве, который имеет длину, соответствующую дополнительному числу последовательностей HOA-коэффициентов, используемых в дополнение к числу

последовательностей HOA-коэффициентов для представления упомянутого окружающего HOA-компонента, и при этом каждый o-ый бит в упомянутом битовом массиве указывает, используется ли

-ая дополнительная последовательность HOA-коэффициентов для представления упомянутого окружающего HOA-компонента.

6. Способ по п. 1, в котором параметры, описывающие упомянутое назначение, размещаются в векторе назначений, имеющем длину, соответствующую числу неактивных направленных сигналов, причем элементы этого вектора указывают, какие из дополнительных последовательностей HOA-коэффициентов окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.

7. Способ по п. 1, в котором упомянутое отделение последовательностей HOA-коэффициентов упомянутого текущего кадра, помимо этого, предоставляет параметры, которые могут использоваться на стороне распаковки для прогнозирования частей исходного HOA-представления из упомянутых направленных сигналов.

8. Способ по п. 4, в котором упомянутое назначение предоставляет вектор назначений, причем элементы этого вектора представляют информацию в отношении того, какие из дополнительных последовательностей HOA-коэффициентов для упомянутого окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.

9. Устройство для сжатия с использованием первого числа перцепционных кодирований представления на основе амбиофонии высшего порядка звукового поля, обозначаемой HOA, с входными временными кадрами последовательностей HOA-коэффициентов, причем упомянутое устройство выполняет обработку на покадровой основе и включает в себя:

блок оценки для оценки для текущего кадра набора доминирующих направлений и соответствующего набора данных индексов обнаруженных направленных сигналов;

блок отделения для отделения, от последовательностей HOA-коэффициентов упомянутого текущего кадра, второго числа направленных сигналов с соответствующими направлениями, содержащимися в упомянутом наборе оценок доминирующих направлений, и с соответствующим задержанным набором данных индексов упомянутых направленных сигналов,

блок назначения для назначения упомянутых направленных сигналов и последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента кадру из каналов, число которых соответствует упомянутому первому числу, и за счет этого получения параметров индексов выбранных окружающих последовательностей HOA-коэффициентов, описывающих упомянутое назначение, которое может использоваться для соответствующего перераспределения на стороне распаковки, при этом для упомянутого назначения используются упомянутый задержанный набор данных индексов упомянутых направленных сигналов и упомянутый набор данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов;

блок кодирования, который перцепционно кодирует упомянутые каналы получившего назначение кадра таким образом, чтобы предоставлять кодированный сжатый кадр.

10. Устройство по п. 9, в котором упомянутое второе число направленных сигналов определяется согласно перцепционно связанному критерию таким образом, что:

11. Устройство по п. 9, в котором выбор сокращенного числа последовательностей HOA-коэффициентов для того, чтобы представлять окружающий HOA-компонент, выполняется согласно критерию, который различается между следующими тремя случаями:

12. Устройство по п. 9, в котором упомянутое назначение выполняется следующим образом:

) последних каналов;

13. Устройство по п. 9, в котором

14. Устройство по п. 9, в котором параметры, описывающие упомянутое назначение, размещаются в векторе назначений, имеющем длину, соответствующую числу неактивных направленных сигналов, причем элементы этого вектора указывают, какие из дополнительных последовательностей HOA-коэффициентов окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.

15. Устройство по п. 9, в котором упомянутое отделение последовательностей HOA-коэффициентов упомянутого текущего кадра, помимо этого, предоставляет параметры, которые могут использоваться на стороне распаковки для прогнозирования частей исходного HOA-представления из упомянутых направленных сигналов.

16. Устройство по п. 12, в котором упомянутое назначение предоставляет вектор назначений, причем элементы этого вектора представляют информацию в отношении того, какие из дополнительных последовательностей HOA-коэффициентов для упомянутого окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.

17. Цифровой аудиосигнал, который сжат согласно способу по п. 1.

18. Способ распаковки сжатого представления на основе амбиофонии высшего порядка, причем упомянутая распаковка включает в себя этапы, на которых:

декодируют текущий кодированный сжатый кадр, чтобы предоставлять декодированный кадр каналов;

перераспределяют упомянутый перцепционно декодированный кадр каналов на основе вектора назначений, указывающего по меньшей мере индекс возможно содержащейся последовательности коэффициентов окружающего HOA-компонента и набора данных индексов направленных сигналов, чтобы воссоздавать соответствующий кадр окружающего HOA-компонента;

повторно составляют текущий распакованный кадр HOA-представления из воссозданного кадра окружающего HOA-компонента на основе набора данных индексов обнаруженных направленных сигналов и набора оценок доминирующих направлений.

19. Устройство для распаковки представления на основе амбиофонии высшего порядка, причем упомянутое устройство включает в себя:

блок декодирования для декодирования текущего кодированного сжатого кадра, с тем чтобы предоставлять декодированный кадр каналов;

блок перераспределения для перераспределения упомянутого перцепционно декодированного кадра каналов на основе вектора назначений, указывающего по меньшей мере индекс возможно содержащейся последовательности коэффициентов окружающего HOA-компонента и набора данных индексов направленных сигналов, чтобы воссоздавать соответствующий кадр окружающего HOA-компонента;

блок повторного составления для повторного составления текущего распакованного кадра HOA-представления из воссозданного кадра окружающего HOA-компонента на основе набора данных индексов обнаруженных направленных сигналов и набора оценок доминирующих направлений.