RU2018133016A - Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка - Google Patents
Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка Download PDFInfo
- Publication number
- RU2018133016A RU2018133016A RU2018133016A RU2018133016A RU2018133016A RU 2018133016 A RU2018133016 A RU 2018133016A RU 2018133016 A RU2018133016 A RU 2018133016A RU 2018133016 A RU2018133016 A RU 2018133016A RU 2018133016 A RU2018133016 A RU 2018133016A
- Authority
- RU
- Russia
- Prior art keywords
- sequences
- hoa
- hoa coefficients
- frame
- coefficients
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 12
- 230000003111 delayed effect Effects 0.000 claims 4
- 238000013139 quantization Methods 0.000 claims 4
- 230000001174 ascending effect Effects 0.000 claims 2
- 230000006835 compression Effects 0.000 claims 2
- 238000007906 compression Methods 0.000 claims 2
- 238000011156 evaluation Methods 0.000 claims 1
- 238000000926 separation method Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 claims 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (63)
1. Способ сжатия представления на основе амбиофонии высшего порядка звукового поля с использованием первого числа перцепционных кодирований, обозначаемой HOA, с входными временными кадрами последовательностей HOA-коэффициентов, причем упомянутый способ включает в себя этапы, которые выполняются на покадровой основе, на которых:
для текущего кадра, оценивают набор доминирующих направлений и соответствующий набор данных индексов обнаруженных направленных сигналов;
отделяют от последовательностей HOA-коэффициентов упомянутого текущего кадра, второе число направленных сигналов с соответствующими направлениями, содержащимися в упомянутом наборе оценок доминирующих направлений, и с соответствующим задержанным набором данных индексов упомянутых направленных сигналов,
и окружающий HOA-компонент, который представлен посредством сокращенного числа последовательностей HOA-коэффициентов и соответствующего набора данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов, причем это сокращенное число соответствует разности между упомянутым первым числом и упомянутым вторым числом;
назначают упомянутые направленные сигналы и последовательности HOA-коэффициентов упомянутого окружающего HOA-компонента кадру из каналов, число которых соответствует упомянутому первому числу, при этом для упомянутого назначения используются упомянутый задержанный набор данных индексов упомянутых направленных сигналов и упомянутый набор данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов;
перцепционно кодируют упомянутые каналы получившего назначение кадра таким образом, чтобы предоставлять кодированный сжатый кадр.
2. Способ по п. 1, в котором упомянутое второе число направленных сигналов определяется согласно перцепционно связанному критерию таким образом, что:
соответственно, распакованное HOA-представление предоставляет наименьшую воспринимаемую ошибку, которая может достигаться с помощью фиксированного данного числа каналов для сжатия, при этом упомянутый критерий учитывает следующие ошибки:
ошибки моделирования, возникающие в результате использования различных чисел упомянутых направленных сигналов и различных чисел последовательностей HOA-коэффициентов для окружающего HOA-компонента;
шум квантования, введенный посредством перцепционного кодирования упомянутых направленных сигналов;
шум квантования, введенный посредством кодирования отдельных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента;
полная ошибка, получающаяся в результате вышеуказанных трех ошибок, учитывается для числа тестовых направлений и числа критических полос частот относительно своей воспринимаемости;
упомянутое второе число направленных сигналов выбирается таким образом, чтобы минимизировать среднюю воспринимаемую ошибку или максимальную воспринимаемую ошибку, с тем, чтобы достигать упомянутой наименьшей воспринимаемой ошибки.
3. Способ по п. 1, в котором выбор сокращенного числа последовательностей HOA-коэффициентов для того, чтобы представлять окружающий HOA-компонент, выполняется согласно критерию, который различается между следующими тремя случаями:
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра является идентичным числу последовательностей HOA-коэффициентов для предыдущего кадра, выбираются последовательности HOA-коэффициентов, идентичные последовательностям HOA-коэффициентов в упомянутом предыдущем кадре;
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра меньше числа последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, деактивируются те последовательности HOA-коэффициентов из упомянутого предыдущего кадра, которые находятся в упомянутом предыдущем кадре, назначаемом каналу, который находится в упомянутом текущем кадре, занимаемом посредством направленного сигнала;
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра превышает число последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, те последовательности HOA-коэффициентов, которые выбраны в упомянутом предыдущем кадре, также выбраны в упомянутом текущем кадре, и эти дополнительные последовательности HOA-коэффициентов могут выбираться согласно своей перцепционной значимости или согласно наибольшей средней мощности.
4. Способ по п. 1, в котором упомянутое назначение выполняется следующим образом:
активные направленные сигналы назначаются данным каналам таким образом, что они сохраняют свои индексы каналов, чтобы получать непрерывные сигналы для упомянутого перцепционного кодирования;
для назначения дополнительных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента определяется, выбраны ли они также в предыдущем кадре:
если это является истинным, назначение этих последовательностей HOA-коэффициентов каналам, которые должны быть перцепционно кодированы, является идентичным назначению для упомянутого предыдущего кадра;
если это не является истинным, и если последовательности HOA-коэффициентов выбираются как новые, последовательности HOA-коэффициентов сначала размещаются относительно своих индексов в порядке по возрастанию и в этом порядке назначаются каналам, которые должны быть перцепционно кодированы, которые еще не заняты посредством направленных сигналов.
5. Способ по п. 1, в котором является числом последовательностей HOA-коэффициентов, представляющих упомянутый окружающий HOA-компонент, и при этом параметры, описывающие упомянутое назначение, размещаются в битовом массиве, который имеет длину, соответствующую дополнительному числу последовательностей HOA-коэффициентов, используемых в дополнение к числу последовательностей HOA-коэффициентов для представления упомянутого окружающего HOA-компонента, и при этом каждый o-ый бит в упомянутом битовом массиве указывает, используется ли -ая дополнительная последовательность HOA-коэффициентов для представления упомянутого окружающего HOA-компонента.
6. Способ по п. 1, в котором параметры, описывающие упомянутое назначение, размещаются в векторе назначений, имеющем длину, соответствующую числу неактивных направленных сигналов, причем элементы этого вектора указывают, какие из дополнительных последовательностей HOA-коэффициентов окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.
7. Способ по п. 1, в котором упомянутое отделение последовательностей HOA-коэффициентов упомянутого текущего кадра, помимо этого, предоставляет параметры, которые могут использоваться на стороне распаковки для прогнозирования частей исходного HOA-представления из упомянутых направленных сигналов.
8. Способ по п. 4, в котором упомянутое назначение предоставляет вектор назначений, причем элементы этого вектора представляют информацию в отношении того, какие из дополнительных последовательностей HOA-коэффициентов для упомянутого окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.
9. Устройство для сжатия с использованием первого числа перцепционных кодирований представления на основе амбиофонии высшего порядка звукового поля, обозначаемой HOA, с входными временными кадрами последовательностей HOA-коэффициентов, причем упомянутое устройство выполняет обработку на покадровой основе и включает в себя:
блок оценки для оценки для текущего кадра набора доминирующих направлений и соответствующего набора данных индексов обнаруженных направленных сигналов;
блок отделения для отделения, от последовательностей HOA-коэффициентов упомянутого текущего кадра, второго числа направленных сигналов с соответствующими направлениями, содержащимися в упомянутом наборе оценок доминирующих направлений, и с соответствующим задержанным набором данных индексов упомянутых направленных сигналов,
и окружающий HOA-компонент, который представлен посредством сокращенного числа последовательностей HOA-коэффициентов и соответствующего набора данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов, причем это сокращенное число соответствует разности между упомянутым первым числом и упомянутым вторым числом;
блок назначения для назначения упомянутых направленных сигналов и последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента кадру из каналов, число которых соответствует упомянутому первому числу, и за счет этого получения параметров индексов выбранных окружающих последовательностей HOA-коэффициентов, описывающих упомянутое назначение, которое может использоваться для соответствующего перераспределения на стороне распаковки, при этом для упомянутого назначения используются упомянутый задержанный набор данных индексов упомянутых направленных сигналов и упомянутый набор данных индексов упомянутого сокращенного числа окружающих последовательностей HOA-коэффициентов;
блок кодирования, который перцепционно кодирует упомянутые каналы получившего назначение кадра таким образом, чтобы предоставлять кодированный сжатый кадр.
10. Устройство по п. 9, в котором упомянутое второе число направленных сигналов определяется согласно перцепционно связанному критерию таким образом, что:
соответственно, распакованное HOA-представление предоставляет наименьшую воспринимаемую ошибку, которая может достигаться с помощью фиксированного данного числа каналов для сжатия, при этом упомянутый критерий учитывает следующие ошибки:
ошибки моделирования, возникающие в результате использования различных чисел упомянутых направленных сигналов и различных чисел последовательностей HOA-коэффициентов для окружающего HOA-компонента;
шум квантования, введенный посредством перцепционного кодирования упомянутых направленных сигналов;
шум квантования, введенный посредством кодирования отдельных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента;
полная ошибка, получающаяся в результате вышеуказанных трех ошибок, учитывается для числа тестовых направлений и числа критических полос частот относительно своей воспринимаемости;
упомянутое второе число направленных сигналов выбирается таким образом, чтобы минимизировать среднюю воспринимаемую ошибку или максимальную воспринимаемую ошибку, с тем, чтобы достигать упомянутой наименьшей воспринимаемой ошибки.
11. Устройство по п. 9, в котором выбор сокращенного числа последовательностей HOA-коэффициентов для того, чтобы представлять окружающий HOA-компонент, выполняется согласно критерию, который различается между следующими тремя случаями:
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра является идентичным числу последовательностей HOA-коэффициентов для предыдущего кадра, выбираются последовательности HOA-коэффициентов, идентичные последовательностям HOA-коэффициентов в упомянутом предыдущем кадре;
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра меньше числа последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, деактивируются те последовательности HOA-коэффициентов из упомянутого предыдущего кадра, которые находятся в упомянутом предыдущем кадре, назначаемом каналу, который находится в упомянутом текущем кадре, занимаемом посредством направленного сигнала;
в случае если число последовательностей HOA-коэффициентов для упомянутого текущего кадра превышает число последовательностей HOA-коэффициентов для упомянутого предыдущего кадра, те последовательности HOA-коэффициентов, которые выбраны в упомянутом предыдущем кадре, также выбраны в упомянутом текущем кадре, и эти дополнительные последовательности HOA-коэффициентов могут выбираться согласно своей перцепционной значимости или согласно наибольшей средней мощности.
12. Устройство по п. 9, в котором упомянутое назначение выполняется следующим образом:
активные направленные сигналы назначаются данным каналам таким образом, что они сохраняют свои индексы каналов, чтобы получать непрерывные сигналы для упомянутого перцепционного кодирования;
для назначения дополнительных последовательностей HOA-коэффициентов упомянутого окружающего HOA-компонента определяется, выбраны ли они также в предыдущем кадре:
если это является истинным, назначение этих последовательностей HOA-коэффициентов каналам, которые должны быть перцепционно кодированы, является идентичным назначению для упомянутого предыдущего кадра;
если это не является истинным, и если последовательности HOA-коэффициентов выбираются как новые, последовательности HOA-коэффициентов сначала размещаются относительно своих индексов в порядке по возрастанию и в этом порядке назначаются каналам, которые должны быть перцепционно кодированы, которые еще не заняты посредством направленных сигналов.
13. Устройство по п. 9, в котором является числом последовательностей HOA-коэффициентов, представляющих упомянутый окружающий HOA-компонент, и при этом параметры, описывающие упомянутое назначение, размещаются в битовом массиве, который имеет длину, соответствующую дополнительному числу последовательностей HOA-коэффициентов, используемых в дополнение к числу последовательностей HOA-коэффициентов для представления упомянутого окружающего HOA-компонента, и при этом каждый o-ый бит в упомянутом битовом массиве указывает, используется ли -ая дополнительная последовательность HOA-коэффициентов для представления упомянутого окружающего HOA-компонента.
14. Устройство по п. 9, в котором параметры, описывающие упомянутое назначение, размещаются в векторе назначений, имеющем длину, соответствующую числу неактивных направленных сигналов, причем элементы этого вектора указывают, какие из дополнительных последовательностей HOA-коэффициентов окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.
15. Устройство по п. 9, в котором упомянутое отделение последовательностей HOA-коэффициентов упомянутого текущего кадра, помимо этого, предоставляет параметры, которые могут использоваться на стороне распаковки для прогнозирования частей исходного HOA-представления из упомянутых направленных сигналов.
16. Устройство по п. 12, в котором упомянутое назначение предоставляет вектор назначений, причем элементы этого вектора представляют информацию в отношении того, какие из дополнительных последовательностей HOA-коэффициентов для упомянутого окружающего HOA-компонента назначаются каналам с неактивными направленными сигналами.
17. Цифровой аудиосигнал, который сжат согласно способу по п. 1.
18. Способ распаковки сжатого представления на основе амбиофонии высшего порядка, причем упомянутая распаковка включает в себя этапы, на которых:
декодируют текущий кодированный сжатый кадр, чтобы предоставлять декодированный кадр каналов;
перераспределяют упомянутый перцепционно декодированный кадр каналов на основе вектора назначений, указывающего по меньшей мере индекс возможно содержащейся последовательности коэффициентов окружающего HOA-компонента и набора данных индексов направленных сигналов, чтобы воссоздавать соответствующий кадр окружающего HOA-компонента;
повторно составляют текущий распакованный кадр HOA-представления из воссозданного кадра окружающего HOA-компонента на основе набора данных индексов обнаруженных направленных сигналов и набора оценок доминирующих направлений.
19. Устройство для распаковки представления на основе амбиофонии высшего порядка, причем упомянутое устройство включает в себя:
блок декодирования для декодирования текущего кодированного сжатого кадра, с тем чтобы предоставлять декодированный кадр каналов;
блок перераспределения для перераспределения упомянутого перцепционно декодированного кадра каналов на основе вектора назначений, указывающего по меньшей мере индекс возможно содержащейся последовательности коэффициентов окружающего HOA-компонента и набора данных индексов направленных сигналов, чтобы воссоздавать соответствующий кадр окружающего HOA-компонента;
блок повторного составления для повторного составления текущего распакованного кадра HOA-представления из воссозданного кадра окружающего HOA-компонента на основе набора данных индексов обнаруженных направленных сигналов и набора оценок доминирующих направлений.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13305558.2A EP2800401A1 (en) | 2013-04-29 | 2013-04-29 | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
EP13305558.2 | 2013-04-29 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015150988A Division RU2668060C2 (ru) | 2013-04-29 | 2014-04-24 | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2022117423A Division RU2022117423A (ru) | 2013-04-29 | 2022-06-28 | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018133016A true RU2018133016A (ru) | 2018-10-02 |
RU2018133016A3 RU2018133016A3 (ru) | 2022-02-16 |
RU2776307C2 RU2776307C2 (ru) | 2022-07-18 |
Family
ID=
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2015150988A (ru) | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка | |
JP2016520864A5 (ru) | ||
RU2711055C2 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала | |
US7539612B2 (en) | Coding and decoding scale factor information | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
RU2016105691A (ru) | Устройство и способ для эффективного кодирования метаданных объектов | |
KR102387162B1 (ko) | 다중 채널 오디오 신호 처리 방법, 장치 및 시스템 | |
JP2011522291A (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 | |
KR20220042166A (ko) | Ivas 비트스트림들의 인코딩 및 디코딩 | |
JP4728568B2 (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
KR100714980B1 (ko) | 가상음원위치정보를 이용한 멀티채널 오디오 신호의 압축및 복원 방법 | |
JP2023076610A (ja) | 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置 | |
US9691397B2 (en) | Device and method data for embedding data upon a prediction coding of a multi-channel signal | |
KR20160015280A (ko) | 오디오 신호 인코더 | |
US11176954B2 (en) | Encoding and decoding of multichannel or stereo audio signals | |
TWI540570B (zh) | 用以處理編碼信號之裝置及方法和用以產生編碼信號之編碼器及方法 | |
RU2797457C1 (ru) | Определение кодирования параметров пространственного звука и соответствующего декодирования | |
RU2022117423A (ru) | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка | |
RU2776307C2 (ru) | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка |