EA024310B1 - Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования - Google Patents
Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования Download PDFInfo
- Publication number
- EA024310B1 EA024310B1 EA201270642A EA201270642A EA024310B1 EA 024310 B1 EA024310 B1 EA 024310B1 EA 201270642 A EA201270642 A EA 201270642A EA 201270642 A EA201270642 A EA 201270642A EA 024310 B1 EA024310 B1 EA 024310B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- audio
- channel
- frame
- transform
- block
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 121
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 24
- 230000009466 transformation Effects 0.000 title claims description 19
- 238000012545 processing Methods 0.000 claims abstract description 77
- 230000003595 spectral effect Effects 0.000 claims abstract description 68
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 230000005236 sound signal Effects 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 description 23
- 238000003786 synthesis reaction Methods 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 14
- 230000001419 dependent effect Effects 0.000 description 12
- 238000009826 distribution Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 241000258241 Mantis Species 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- CDDBPMZDDVHXFN-ONEGZZNKSA-N 2-[(e)-3-(1,3-benzodioxol-5-yl)prop-2-enyl]-1-hydroxypiperidine Chemical compound ON1CCCCC1C\C=C\C1=CC=C(OCO2)C2=C1 CDDBPMZDDVHXFN-ONEGZZNKSA-N 0.000 description 1
- IXQPRUQVJIJUEB-UHFFFAOYSA-N 7-(diethylamino)-n-[2-(2,5-dioxopyrrol-1-yl)ethyl]-2-oxochromene-3-carboxamide Chemical compound O=C1OC2=CC(N(CC)CC)=CC=C2C=C1C(=O)NCCN1C(=O)C=CC1=O IXQPRUQVJIJUEB-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
В изобретении представлено повышение эффективности процедуры, используемой для декодирования кадров цифрового потока в формате Е-АС-3, за счет однократной обработки каждого аудиоблока в кадре. Процедура декодирования аудиоблоков кодированных данных выполняется не поканально, а поблочно. Описание примеров процедур декодирования цифровых потоков, кодированных с помощью таких усовершенствованных алгоритмов кодирования, как обработка с использованием адаптивного гибридного преобразования и спектральное расширение.
Description
Настоящее изобретение в целом относится к системам кодирования аудиосигналов и, в частности, относится к способам и устройствам для декодирования кодированных цифровых аудиосигналов.
Уровень техники
Комитет по перспективным системам телевещания США (АТ8С), сформированный организациямичленами Объединенного комитета по межведомственной координации (ЮС), разработал скоординированный набор национальных стандартов для развития национального телевидения в США. В число этих стандартов входят соответствующие стандарты кодирования/декодирования аудиосигналов, изложенные в различных нормативных документах, в том числе в документе А/52В, озаглавленном Стандарт сжатия цифрового аудиосигнала (АС-3, Е-АС-3), ревизия Б, опубликованном 14 июня 2005 г., который целиком включен в настоящий документ посредством ссылки. Алгоритм кодирования аудиосигнала, регламентированный в документе А/52В, имеет название АС-3. Усовершенствованная версия этого алгоритма, описанная в приложении Е к этому документу, имеет название Е-АС-3. Два этих алгоритма в настоящем документе именуются как АС-3 и соответствующие стандарты именуются как Стандарты АТ8С.
Документ А/52В не регламентирует многих аспектов архитектуры алгоритма, а описывает вместо этого синтаксис цифрового потока, задавая структурные и синтаксические характеристики кодированной информации, декодирование которой должно быть выполнено совместимым декодером. Многие приложения, совместимые со стандартом АТ8С, передают кодированную цифровую аудиоинформацию в виде последовательных двоичных данных. В результате кодированные данные зачастую называют цифровым потоком, но допустимы и другие упорядоченные структуры данных. В целях облегчения изложения термин цифровой поток используется в настоящем документе для обозначения кодированного цифрового аудиосигнала, независимо от формата или используемой методики записи или передачи.
Цифровой поток, совместимый со стандартами АТ8С, организован в виде последовательности кадров синхронизации. Каждый кадр является единицей цифрового потока, который может быть полностью декодирован для получения одного или более каналов цифровых аудиоданных с импульснокодовой модуляцией (ИКМ). Каждый кадр содержит аудиоблоки и метаданные кадра, относящиеся к аудиоблокам. Каждый из аудиоблоков содержит кодированные аудиоданные, представляющие цифровые отсчеты аудиосигнала для одного или больше аудиоканалов, и метаданные блока, относящиеся к кодированным аудиоданным.
Несмотря на то что стандарты АТ8С не регламентируют детали архитектуры алгоритмов, определенные особенности последних широко используются производителями профессионального и бытового декодирующего оборудования. Одной из универсальных особенностей реализации для декодеров, декодирующих цифровые потоки в формате Е-АС-3, создаваемые кодировщиками формата Е-АС-3, является алгоритм, декодирующий все содержащиеся в кадре кодированные данные для соответствующего канала перед декодированием данных для другого канала. Такой подход используется для повышения производительности вариантов реализации, выполненных на однокристальных процессорах, имеющих малый объем внутрикристального запоминающего устройства, поскольку в ряде процедур декодирования данные для определенного канала необходимо получить из каждого из аудиоблоков, входящих в кадр. При обработке кодированных данных для каждого канала поочередно возможно выполнение операций декодирования с использованием внутрикристального запоминающего устройства для определенного канала. Декодированные данные канала впоследствии могут быть переданы внешнему запоминающему устройству, освобождая внутрикристальные ресурсы для следующего канала.
Цифровой поток, совместимый со стандартами АТ8С, может быть весьма сложным вследствие большого числа возможных разновидностей. Некоторые приводимые здесь вкратце примеры включают в себя объединение каналов, рематрицирование каналов, нормирование уровня диалогов, сжатие динамического диапазона, уменьшение числа каналов и изменение длины блока для цифровых потоков в стандартном формате АС-3, а также параллельные независимые потоки, зависимые подпотоки, спектральное расширение и гибридное адаптивное преобразование для цифровых потоков в формате Е-АС-3. Подробности данных характеристик могут быть получены из документа А/52В.
При обработке каждого канала в отдельности возможно упрощение алгоритмов, необходимых для реализации этих разновидностей. Такие сложные последующие процедуры, как фильтрация синтеза, могут выполняться без учета этих разновидностей. Упрощенные алгоритмы выгодны с точки зрения сокращения потребности в вычислительных ресурсах, необходимых для обработки кадра аудиоданных.
К сожалению, подобный подход требует алгоритма декодирования с двукратным чтением и анализом данных во всех аудиоблоках. Каждая итерация чтения и анализа данных аудиоблоков в кадре именуется в настоящем документе как проход по аудиоблокам. Во время первого прохода производятся обширные вычисления для определения положения кодированных аудиоданных в каждом блоке. Во время второго прохода при выполнении процедур декодирования выполняются многие аналогичные вычисления. Для вычисления положения данных для обоих проходов необходимы значительные вычислительные ресурсы. В случае устранения первоначального прохода возможно сокращение потребности в вычислительных ресурсах для декодирования кадра аудиоданных.
- 1 024310
Сущность изобретения
Целью настоящего изобретения является сокращение потребности в вычислительных ресурсах для декодирования кадра аудиоданных в кодированных цифровых потоках, организованном в виде таких иерархических единиц, как вышеописанные кадры и аудиоблоки. Предшествующий текст и последующее описание относятся к кодированным цифровым потокам, соответствующим стандартам ЛТ8С. но настоящее изобретение не ограничивается лишь данными цифровыми потоками. Принципы настоящего изобретения могут быть применены практически к любому кодированному цифровому потоку, имеющему структурные характеристики, подобные кадрам, блокам и каналам, используемым в алгоритмах кодирования АС-3.
В соответствии с одной из особенностей настоящего изобретения, предлагается способ декодирования кадра кодированного цифрового аудиосигнала путем получения кадра и анализа кодированного цифрового аудиосигнала за один проход для поблочного декодирования кодированных аудиоданных для каждого аудиоблока. Каждый кадр содержит метаданные кадра и совокупность аудиоблоков. Каждый аудиоблок содержит метаданные блока и кодированные аудиоданные для одного или более аудиоканалов. Метаданные блока содержат управляющую информацию, описывающую средства кодирования, использованные процедурой кодирования, которая была применена для получения кодированных аудиоданных. Одним из таких средств кодирования является обработка с использованием гибридного преобразования, в процессе которой банк фильтров анализа, реализованный путем первичного преобразования, применяется к одному или более аудиоканалам для получения спектральных коэффициентов, представляющих спектральный состав одного или более аудиоканалов, при этом к данным спектральным коэффициентам, минимум к одному или более аудиоканалам, применяется вторичное преобразование для получения коэффициентов гибридного преобразования. При декодировании каждого аудиоблока происходит определение факта применения обработки с использованием адаптивного гибридного преобразования в процедуре кодирования для кодирования любой части кодированных аудиоданных. Если в процедуре кодирования применялась обработка с использованием адаптивного гибридного преобразования, то, согласно предлагаемому способу, все коэффициенты гибридного преобразования для кадра получаются из кодированных аудиоданных, содержащихся в первом аудиоблоке данного кадра, при этом к коэффициентам гибридного преобразования применяется обратное вторичное преобразование с целью получения коэффициентов обратного вторичного преобразования, а спектральные коэффициенты получаются из коэффициентов обратного вторичного преобразования. Если в процедуре кодирования обработка с использованием адаптивного гибридного преобразования не применялась, то спектральные коэффициенты получаются из кодированных аудиоданных, содержащихся в соответствующем аудиоблоке. Для получения выходного сигнала, представляющего один или больше каналов соответствующего аудиоблока, к спектральным коэффициентам применяется обратное первичное преобразование.
Различные особенности настоящего изобретения и его предпочтительных воплощений станут более понятны при рассмотрении последующего описания и прилагаемых чертежей, на которых ссылочные позиции соответствуют аналогичным элементам на нескольких чертежах. Содержание последующего описания и чертежей предлагается исключительно в качестве примеров и не должно восприниматься как нечто устанавливающее ограничения на объем настоящего изобретения.
Краткое описание чертежей
Фиг. 1 представляет схематическую функциональную диаграмму примера реализации кодировщика.
Фиг. 2 представляет схематическую функциональную диаграмму примера реализации декодера.
Фиг. ЗА и 3В представляют схематические иллюстрации кадров цифровых потоков в соответствии со стандартной и усовершенствованной структурами синтаксиса.
Фиг. 4А и 4В представляют схематические иллюстрации аудиоблоков в соответствии со стандартной и усовершенствованной структурами синтаксиса.
Фиг. 5А-5С представляют схематические иллюстрации примеров цифровых потоков, кодированных в режиме расширения числа программ и каналов.
Фиг. 6 представляет схематическую функциональную диаграмму примера процедуры, воплощенной в виде декодера для поканальной обработки аудиоданных.
Фиг. 7 представляет схематическую функциональную диаграмму примера процедуры, воплощенной в виде декодера для поблочной обработки аудиоданных.
Фиг. 8 представляет схематическую функциональную диаграмму устройства, которое может быть использовано для реализации различных особенностей настоящего изобретения.
Подробное описание изобретения
А. Обзор системы кодирования.
Фиг. 1 и 2 представляют схематические функциональные диаграммы примеров реализации кодировщика и декодера системы кодирования аудиосигналов, в декодере которой могут быть использованы различные особенности настоящего изобретения. Эти варианты реализации соответствуют содержанию упомянутого ранее документа А/52В.
Целью данной системы кодирования является получение кодированного представления входных
- 2 024310 аудиосигналов, которое может быть записано или передано, а впоследствии декодировано для получения выходных аудиосигналов, звучащих практически идентично входным аудиосигналам, при этом используется минимальное количество цифровой информации для представления кодированного сигнала. Системы кодирования, соответствующие основным стандартам ЛТ8С, выполняют кодирование и декодирование информации, которая может представлять от одного до так называемых 5.1 каналов аудиосигналов, где 5.1 обозначает пять каналов с полной шириной полосы пропускания и один канал с ограниченной шириной полосы пропускания, предназначенный для передачи сигналов низкочастотных эффектов (ЬРЕ).
Последующие разделы описывают варианты реализации кодировщика и декодера, а также некоторые подробности структуры кодированного цифрового потока и соответствующих процедур кодирования и декодирования. Данные описания приведены для сокращения описания и лучшего понимания различных особенностей настоящего изобретения.
1. Кодировщик.
В соответствии с примером варианта реализации, представленным на фиг. 1, последовательность отсчетов с импульсно-кодовой модуляцией (ИКМ), представляющих один или более каналов аудиосигналов, поступает на вход 1 кодировщика, после чего к данной последовательности отсчетов применяется банк фильтров анализа 2 для получения числовых значений, представляющих спектральный состав входных аудиосигналов. Для воплощений, соответствующих стандартам ЛТ8С, банк фильтров анализа реализуется с использованием модифицированного дискретного косинусного преобразования (МДКП), описанного в документе А/52В. МДКП применяется к перекрывающимся сегментам или блокам отсчетов для каждого входного канала аудиосигнала с целью получения блоков коэффициентов преобразования, представляющих спектральный состав сигнала этого входного канала. МДКП является частью системы анализа/синтеза, которая использует специально разработанные оконные функции и процессы перекрытия/сложения для устранения искажений во временной области. Данные коэффициенты преобразования в каждом блоке выражаются в формате с блочной плавающей точкой (БПТ), содержащем экспоненты и мантиссы с плавающей точкой. Такое описание относится к аудиоданным, выраженным в виде экспонент и мантисс с плавающей точкой, поскольку такой формат представления используется в цифровых потоках, соответствующих стандартам ЛТ8С; однако, данное представление является лишь одним примером численного представления, использующего коэффициенты масштабирования и соответствующие им масштабированные значения.
Экспоненты БПТ для каждого блока совместно представляют приближенную огибающую спектра входного аудиосигнала. Эти экспоненты кодируются методом дельта-модуляции, а также с помощью других методик кодирования для сокращения потребности в количестве информации, передаются форматеру 5, и поступают на вход психоакустической модели для оценки порога психоакустической маскировки кодируемого сигнала. Результаты, полученные моделью, используются блоком распределения битов 3 для распределения цифровой информации в форме битов для квантования мантисс таким образом, чтобы уровень шума квантования оставался ниже порога психоакустической маскировки кодируемого сигнала. Блок квантования 4 производит квантование мантисс в соответствии с распределением битов, полученным от блока распределения битов 3 и переданных форматеру 5.
Форматер 5 мультиплексирует или объединяет кодированные экспоненты, квантованные мантиссы и другую управляющую информацию, иногда именуемую метаданными блоков, в аудиоблоки. Данные для шести последовательных аудиоблоков объединяются в единицы цифровой информации, называемые кадрами. Кадры также содержат управляющую информацию или метаданные кадров. Кодированная информация для последовательных кадров поступает на выход в виде цифрового потока по цепи 6 для записи на носителе запоминающего устройства или для передачи по каналу связи. Для кодировщиков, соответствующих стандартам ЛТ8С, формат каждого кадра в цифровом потоке соответствует синтаксису, регламентированному в документе А/52В.
Алгоритм кодирования, который используется типовыми кодировщиками, соответствующими стандартам ЛТ8С, сложнее, чем представленный на фиг. 1 и описанный выше. Например, в кадры вносятся коды обнаружения ошибок, позволяющие приемному декодеру проверять достоверность цифрового потока. Для адаптации временного и спектрального разрешения банка фильтров анализа, для оптимизации его производительности при изменении характеристик сигнала может быть использована методика кодирования, известная как изменение длины блока, иногда упрощенно называемая изменением блока. Экспоненты с плавающей точкой могут кодироваться с переменным временным и частотным разрешением. Два или более каналов могут быть объединены в составное представление при использовании методики кодирования, известной как объединение каналов. К двухканальным аудиосигналам может быть адаптивно применена другая методика кодирования, известная как рематрицирование каналов. Могут быть использованы и дополнительные методики кодирования, здесь не упоминаемые. Некоторые из этих прочих методик кодирования будут рассмотрены далее. Многие прочие подробности реализации опускаются, поскольку они не являются необходимыми для понимания настоящего изобретения. При необходимости, эти подробности могут быть получены из документа А/52В.
- 3 024310
2. Декодер.
Алгоритм декодирования, выполняемый декодером, по сути, является обратным алгоритму кодирования, выполняемому кодировщиком. Как следует из примера реализации, представленного на фиг. 2, кодированный цифровой поток, представляющий собой последовательность кадров, поступает на вход 11 декодера. Кодированный цифровой поток может загружаться с носителя запоминающего устройства или приниматься по каналу связи. Для каждого фрейма закодированная информация демультиплексируется или разъединяется в блоке удаления формата 12 на метаданные фрейма и шесть аудиоблоков. Аудиоблоки разъединяются на соответствующие метаданные блоков, кодированные экспоненты и квантованные мантиссы. Кодированные экспоненты используются психоакустической моделью в блоке распределения битов 13 с целью распределения цифровой информации в формате битов для деквантования квантованных мантисс таким же образом, каким биты были распределены в кодировщике. Блок деквантования 14 производит деквантование квантованных мантисс в соответствии с распределениями битов, полученными от блока распределения битов 13, и передает деквантованные мантиссы банку фильтров синтеза 15. Кодированные экспоненты декодируются и передаются банку фильтров синтеза 15.
Декодированные экспоненты и деквантованные мантиссы образуют представление БПТ для спектрального состава входного аудиосигнала, закодированного кодировщиком. Банк фильтров синтеза 15 применяется к представлению спектрального состава для восстановления неточной копии исходных входных аудиосигналов, проходящей по цепи выходного сигнала 16. Для воплощений, соответствующих стандартам АТ§С, банк фильтров синтеза реализован в виде обратного модифицированного дискретного косинусного преобразования (ОМДКП), описанного в документе А/52В. ОМДКП является частью кратко упомянутой ранее системы анализа/синтеза, применяемой к блокам коэффициентов преобразования для получения блоков аудиоотсчетов, которые перекрываются и складываются для устранения искажений во временной области.
Алгоритм декодирования, который используется в типовых декодерах, соответствующих стандартам АТ§С, сложнее, чем представленный на фиг. 2 и описанный выше. Некоторые методики декодирования, являющиеся обратными для вышеописанных методик кодирования, включают в себя обнаружение ошибок для коррекции или маскировки последних, изменение длины блока для адаптации временного и спектрального разрешения банка фильтров синтеза, восстановление каналов для восстановления информации каналов из объединенных составных представлений и матричные операции для восстановления рематрицированных двухканальных представлений. При необходимости, информация о других методиках и дополнительные подробности могут быть получены из документа А/52В.
Б. Структура кодированного цифрового потока.
1. Кадр.
Кодированный цифровой поток, соответствующий стандартам АТ§С, состоит из последовательности единиц кодированной информации, именуемых кадрами синхронизации, часто называемых просто кадрами. Как указывалось выше, каждый кадр содержит метаданные кадра и шесть аудиоблоков. Каждый аудиоблок содержит метаданные блока и кодированные экспоненты, а также мантиссы БПТ для параллельных интервалов одного или более каналов аудиосигналов. Структура стандартного цифрового потока схематически представлена на фиг. 3А. Структура цифрового потока в формате Е-АС-3, описанная в приложении Е к документу А/52В, представлена на фиг. 3В. Участок каждого цифрового потока в пределах отмеченного интервала от §1 до СКС составляет один кадр.
В синхронизирующую информацию (§1), помещаемую в начале каждого кадра для того, чтобы декодер имел возможность идентифицировать начало кадра и поддерживать синхронизацию процедур декодирования с кодированным цифровым потоком, включена специальная комбинация битов или слово синхронизации. Секция информации о цифровом потоке (В§1), следующая непосредственно за §1, содержит необходимые параметры алгоритма декодирования для декодирования данного кадра. Например, в В§1 содержится информация о числе, типе и порядке каналов, представленных в кадре в виде закодированной информации, а также информация о сжатии динамического диапазона и нормировании уровня диалогов, используемая декодером. Каждый кадр содержит шесть аудиоблоков (от АВ0 до АВ5), за которыми при необходимости могут следовать дополнительные данные (АИХ). В конце каждого кадра предоставляется информация для обнаружения ошибок в формате слова циклического избыточного кода (СКС).
Кадр цифрового потока в формате Е-АС-3 также содержит аудиоданные кадра (АРКМ), содержащие отметки и параметры, относящиеся к дополнительным методикам кодирования, которые недоступны для использования при кодировании стандартного цифрового потока. Некоторые из этих дополнительных методик включают в себя использование спектрального расширения (§РХ), известного также как спектральная репликация, и адаптивное гибридное преобразование (АГП). Описание различных методик кодирования приведено далее.
2. Аудиоблоки.
Каждый аудиоблок содержит кодированные представления экспонент и квантованных мантисс БПТ для 256 коэффициентов преобразования, а также метаданные блока, необходимые для декодирования кодированных экспонент и квантованных мантисс. Такая структура схематически представлена на фиг.
- 4 024310
4А. Структура аудиоблока в цифровом потоке в формате Е-АС-3, описанная в приложении Е к документу А/52В, представлена на фиг. 4В. Структура аудиоблока в альтернативном варианте цифрового потока, описанном в приложении И к документу А/52В, здесь не рассматривается, поскольку ее уникальные характеристики к настоящему изобретению не относятся.
Ряд примеров метаданных блока включают в себя отметки и параметры, описывающие изменение длины блока (Ви<8\У). сжатие динамического диапазона (ΌΥΝΡΝΟ), объединение каналов (СРЬ), рематрицирование каналов (КЕМЛТ), методику или стратегию кодирования экспонент (ΕΧΡδΤΚ), использованную при кодировании экспонент БПТ, кодированные экспоненты БПТ (ЕХР), информацию о распределении битов (ВА) для мантисс, поправки к распределению битов, известные как разностная информация о распределении битов (ΌΒΑ), и квантованные мантиссы (ΜΑΝΤ). Каждый аудиоблок в цифровом потоке в формате Е-АС-3 может содержать информацию, относящуюся к дополнительным методикам кодирования, включая спектральное расширение (δΡΧ).
3. Требования к цифровому потоку.
Стандарты АТ8С предъявляют ряд требований к содержанию цифрового потока, имеющих отношение к настоящему изобретению. Здесь упоминается о двух таких требованиях: (1) первый аудиоблок в кадре, называемый ΑΒ0, должен содержать всю информацию, необходимую алгоритму декодирования для начала декодирования всех аудиоблоков в кадре, и (2) всякий раз, когда с цифровым потоком поступает кодированная информация, полученная при объединении каналов, аудиоблок, в котором впервые было использовано объединение каналов, должен содержать все параметры, необходимые для восстановления. Данные особенности описываются ниже. Информация о прочих процедурах, здесь не рассматриваемых, содержится в документе А/52В.
В. Стандартные процедуры и методики кодирования.
Стандарты АТ8С описывают ряд особенностей синтаксиса цифрового потока с точки зрения процедур кодирования или средств кодирования, которые могут быть использованы для получения кодированного цифрового потока. Кодировщику необязательно использовать все средства кодирования, однако соответствующий стандарту декодер должен быть в состоянии адекватно отреагировать на те средства кодирования, которые считаются обязательными для соответствия стандарту. Такая реакция реализуется путем применения надлежащего средства декодирования, являющегося, по сути, обратным для соответствующего средства кодирования.
Некоторые из таких средств декодирования особенно актуальны для настоящего изобретения, поскольку их использование или неиспользование влияет на реализацию особенностей настоящего изобретения. Некоторые процедуры декодирования и некоторые средства декодирования будут кратко рассмотрены в последующих параграфах. Дальнейшие описания не являются полным описанием. Различные подробности и дополнительные особенности опущены. Данные описания предназначены лишь для общего ознакомления для тех, кто не знаком с данными методиками, и для напоминания тем, кто мог позабыть, какие методики описываются данными терминами.
При необходимости, дополнительные подробности могут быть получены из документа А/52В, а также из патента США № 5583962, озаглавленного Кодировщик/декодер для многомерных звуковых полей, авторы Дэвис и др., выданного 10 декабря 1996 г. и целиком включенного в настоящий документ как неотъемлемая часть посредством ссылки.
1. Распаковка цифрового потока.
Все декодеры должны произвести распаковку или демультиплексирование кодированного цифрового потока для получения параметров и кодированных данных. Эта процедура выполняется блоком удаления формата 12, описанным ранее. При выполнении данной процедуры происходит считывание данных из входящего цифрового потока и копирование частей цифрового потока в регистры, копирование частей в ячейки запоминающего устройства или сохранение указателей или других ссылок на данные в цифровом потоке, сохраненные в буфере. Для сохранения данных и указателей необходимы ресурсы запоминающего устройства, а между сохранением этой информации для последующего использования и повторным считыванием цифрового потока для получения необходимой информации может быть сделан оптимальный выбор.
2. Декодирование экспонент.
Значения всех экспонент БПТ необходимы для распаковки данных в аудиоблоках для каждого кадра, поскольку эти значения косвенным образом указывают на число битов, выделенных для квантованных мантисс. Значения экспонент в цифровом потоке кодируются с использованием различных методик кодирования, которые могут быть применены как в частотной, так и во временной области. В результате, данные, представляющие кодированные экспоненты, должны быть распакованы из цифрового потока и декодированы до того, как они могут быть использованы для других процедур декодирования.
3. Обработка распределения битов.
Каждая из квантованных мантисс БПТ в цифровом потоке представлена различным числом битов, являющимся функцией экспонент БПТ и, возможно, других метаданных, содержащихся в цифровом потоке. Экспоненты БПТ являются входными данными для заданной модели, которая вычисляет распределение битов для каждой мантиссы. В случае, когда аудиоблок содержит различную информацию о рас- 5 024310 пределении битов (ΌΒΆ), эта дополнительная информация используется для внесения поправок в распределение битов, вычисляемое моделью.
4. Обработка мантиссы.
Квантованные мантиссы БПТ составляют большую часть данных, содержащихся в кодированном цифровом потоке. Распределение битов используется как для определения положения каждой мантиссы в цифровом потоке для распаковки, так и для выбора соответствующей функции деквантования для получения деквантованных мантисс. Некоторые данные в цифровом потоке могут представлять несколько мантисс с помощью одного значения. В такой ситуации из одного значения получается соответствующее число мантисс. Мантиссы, имеющие распределение битов, равное нулю, могут быть восстановлены либо со значением, равным нулю, либо в виде псевдослучайного числа.
5. Восстановление каналов.
Методика кодирования с объединением каналов позволяет кодировщику представить несколько аудиоканалов, используя меньшее количество данных. Данная методика объединяет спектральные компоненты двух или более избранных каналов, называемых объединяемыми каналами, с образованием одного канала составных спектральных компонент, называемого объединенным каналом. Спектральные компоненты объединенного канала представляются в формате БПТ. Набор коэффициентов масштабирования, описывающих разность энергий между объединенным каналом и каждым из объединяемых каналов и известных как координаты объединения, вычисляется для каждого из объединяемых каналов и включается в кодированный цифровой поток. Объединение используется только для определенной части полосы пропускания каждого канала.
При использовании методики объединения каналов, как обозначено параметрами в цифровом потоке, в декодере используется методика декодирования, известная как восстановление каналов, для получения неточной копии экспонент и мантисс БПТ для каждого из объединяемых каналов из спектральных компонент объединенного канала и координат объединения. Это производится путем умножения каждой спектральной компоненты объединенного сигнала на соответствующую координату объединения. Дополнительные подробности могут быть получены из документа А/52В.
6. Рематрицирование каналов.
Методика кодирования с использованием рематрицирования каналов позволяет кодировщику представлять двухканальные сигналы с помощью меньшего количества информации, используя матрицу для преобразования двух независимых аудиоканалов в суммарный и различный каналы. Экспоненты и мантиссы БПТ, обычным образом упакованные в цифровой поток для левого и правого аудиоканалов, вместо этого представляют суммарный и различный каналы. Данная методика может быть успешно использована в том случае, когда эти два канала имеют высокую степень сходства.
При использовании рематрицирования, на что указывает отметка в цифровом потоке, декодер получает значения, представляющие эти два аудиоканала, путем применения соответствующей матрицы к суммарным и различным значениям. Дополнительные подробности могут быть получены из документа А/52В.
Г. Усовершенствованные процедуры и методики кодирования.
Приложение Е к документу А/52В описывает характеристики синтаксиса цифрового потока в формате Е-АС-3, допускающего использование дополнительных средств кодирования. Некоторые из этих средств и соответствующие процедуры кратко описываются далее.
1. Обработка с использованием адаптивного гибридного преобразования.
Методика кодирования с использованием адаптивного гибридного преобразования (АГП) предоставляет дополнительное средство (помимо изменения длины блока) для адаптации временного и спектрального разрешения банков фильтров синтеза и анализа к изменениям характеристик сигнала путем каскадного применения двух преобразований. Дополнительная информация об обработке с использованием АГП может быть получена из документа А/52В и патента США 7516064, озаглавленного Адаптивное гибридное преобразование для анализа и синтеза сигналов, авторы Винтон и др., выданного 07.04.2009 г. и целиком включенного в настоящий документ как неотъемлемая часть посредством ссылки.
Кодировщики используют первичное преобразование, реализованное в виде вышеупомянутого преобразования МДКП анализа, перед и последовательно с вторичным преобразованием, реализованным в виде дискретного косинусного преобразования второго типа (ДКП-П). МДКП применяется к перекрывающимся блокам отсчетов аудиосигнала для получения спектральных коэффициентов, представляющих спектральный состав аудиосигнала. При необходимости ДКП-П может быть включено в цепь и исключено из цепи обработки сигнала, и, в случае включения, применяется к неперекрывающимся блокам спектральных коэффициентов МДКП, представляющих одинаковую частоту, для получения коэффициентов гибридного преобразования. В типовом варианте применения ДКП-П включено в том случае, когда аудиосигнал считается достаточно стационарным, поскольку при его применении значительно увеличивается эффективное спектральное разрешение банка фильтров анализа за счет уменьшения эффективного временного разрешения с 256 отсчетов до 1536 отсчетов.
В декодерах используется обратное первичное преобразование, реализованное в виде вышеупомя- 6 024310 нутого банка фильтров синтеза ОМДКП, следующее за и включенное последовательно с обратным вторичным преобразованием, реализованным в виде обратного дискретного косинусного преобразования второго типа (ОДКП-П). Преобразование ОДКП-П включается в цепь и исключается из цепи обработки сигнала в соответствии с метаданными, предоставляемыми кодировщиком. Будучи включенным в цепь обработки сигнала, преобразование ОДКП-П применяется к неперекрывающимся блокам коэффициентов гибридного преобразования для получения коэффициентов обратного вторичного преобразования. Данные коэффициенты обратного вторичного преобразования могут являться спектральными коэффициентами, непосредственно подаваемыми на вход ОМДКП в случае, когда иные средства кодирования, подобные объединению каналов или δΡΧ, не применяются. В противном случае, если средства кодирования, подобные объединению каналов или δΡΧ, были применены, спектральные коэффициенты МДКП могут быть получены из коэффициентов обратного вторичного преобразования. После получения спектральных коэффициентов МДКП к блокам спектральных коэффициентов МДКП в обычном порядке применяется ОМДКП.
АГП может быть применено для любого аудиоканала, в том числе для объединенного канала и канала ЬРЕ. В канале, кодированном с использованием АГП, используется другой вариант процедуры распределения битов и два различных типа квантования. Одним типом является векторное квантование (УЦ), а другим типом является адаптивное квантование с учетом усиления (СЛЦ). Методика СЛЦ описывается в патенте США № 6246345, озаглавленном Использование адаптивного квантования с учетом усиления и переменных длин символов для усовершенствованного кодирования аудиосигналов, авторы Девидсон и др., выданном 12 июня 2001 г. и целиком включенном в настоящий документ как неотъемлемая часть посредством ссылки.
При использовании АГП необходимо получение декодером ряда параметров из информации, содержащейся в кодированном цифровом потоке. Процесс вычисления этих параметров описан в документе А/52В. Один набор параметров задает число раз, которое экспоненты БПТ переносятся в кадре и получаются путем анализа метаданных, содержащихся в аудиоблоках кадра. Два других набора параметров идентифицируют те мантиссы БПТ, при квантовании которых использовалось СЛр. и содержат управляющие слова регулировки усиления для блоков квантования и получаются путем анализа метаданных канала в аудиоблоке.
Все коэффициенты гибридного преобразования для АГП переносятся в первом аудиоблоке АВ0 кадра. Если преобразование АГП применяется к объединенному каналу, то координаты объединения для коэффициентов АГП распределяются по всем аудиоблокам аналогично объединенным каналам без АГП. Процедура обработки в данной ситуации описывается далее.
2. Обработка с использованием спектрального расширения.
Методика кодирования с использованием спектрального расширения (δΡΧ) позволяет кодировщику сократить количество информации, необходимой для кодирования канала с полной шириной полосы пропускания, путем исключения высокочастотных спектральных компонент из кодированного цифрового потока и синтеза отсутствующих спектральных компонент в декодере из низкочастотных спектральных компонент, содержащихся в кодированном цифровом потоке.
При использовании δΡΧ, синтез отсутствующих спектральных компонент производится декодером путем копирования коэффициентов МДКП более низких частот в положения, соответствующие положениям коэффициентов МДКП для более высоких частот, добавления псевдослучайных или шумовых значений к коэффициентам преобразования и масштабирования амплитуды в соответствии с огибающей спектра δΡΧ, включенной в кодированный цифровой поток. Вычисление огибающей спектра δΡΧ и помещение ее в кодированный цифровой поток производится кодировщиком при каждом использовании средств кодирования δΡΧ.
Как правило, методика кодирования δΡΧ используется для синтеза высших полос спектральных компонент для канала. Она может быть использована совместно с объединением каналов для среднего диапазона частот. Дополнительные подробности процедуры обработки могут быть получены из документа А/52В.
3. Расширения числа программ и каналов.
Синтаксис цифрового потока в формате Е-АС-3 позволяет кодировщику создавать кодированный цифровой поток двоичных данных, представляющий одну программу с числом каналов, большим, чем 5.1 (расширение числа каналов), две или более программы с числом каналов вплоть до 5.1 (расширение числа программ) или комбинацию программ с числом каналов вплоть до 5.1 и программ с числом каналов, большим, чем 5.1. Расширение числа программ реализовано путем мультиплексирования кадров нескольких независимых потоков данных в кодированном цифровом потоке. Расширение числа каналов реализовано путем мультиплексирования кадров одного или более зависимых подпотоков данных, связанных с независимым потоком данных. В предпочтительных воплощениях режима расширения числа программ информация о программе или программах, подлежащих декодированию, поступает в декодер и в процедуре декодирования потоки или подпотоки, не подлежащие декодированию, пропускаются или фактически игнорируются.
Фиг. 5А-5С представляют три примера цифровых потоков, данные в которых содержат расширения
- 7 024310 числа программ и каналов. Фиг. 5А представляет пример цифрового потока, содержащего расширение числа каналов. Единственная программа Р1 представлена независимым потоком 80 и тремя связанными с ним зависимыми подпотоками 880, 881 и 882. Непосредственно после кадра Ей независимого потока данных 80 следуют кадры Еп каждого из связанных с ним зависимых подпотоков 880-883. После этих кадров следует следующий кадр Еп+1 независимого потока 80, за которым, в свою очередь, следуют кадры Еп+1 каждого из связанных с ним зависимых подпотоков 880-882. Синтаксис цифрового потока в формате Е-АС-3 предоставляет возможность для передачи до восьми зависимых подпотоков для каждого независимого потока.
На фиг. 5В представлен пример цифрового потока, содержащего расширение числа программ. Каждая из четырех программ Р1, Р2, Р3 и Р4 представлена независимым потоком 80, 81, 82 и 83 соответственно. Непосредственно после кадра Еп независимого потока данных 80 следуют кадры Еп каждого из независимых потоков 81, 82 и 83. После этих кадров следует следующий кадр Еп+1 каждого из независимых потоков. Синтаксис цифрового потока в формате Е-АС-3 предусматривает по меньшей мере один независимый поток и предоставляет возможность для передачи до восьми независимых потоков.
На фиг. 5С представлен пример цифрового потока, содержащего расширение числа программ и расширение числа каналов. Программа Р1 представлена данными в независимом потоке 80, а программа Р2 представлена данными в независимом потоке 81 и связанными с ним зависимыми подпотоками 880 и 881. Непосредственно после кадра Еп независимого потока данных 80 следует кадр Еп независимого потока 81, непосредственно за которым, в свою очередь, следуют кадры Еп каждого из связанных с ним зависимых подпотоков 880 и 881. После этих кадров следует следующий кадр Еп+1 каждого из независимых потоков и зависимых подпотоков.
Независимый поток без расширения числа каналов содержит данные, которые могут представлять до 5.1 независимых аудиоканалов. Независимый поток с расширением числа каналов или, другими словами, независимый поток с одним или более связанными с ним зависимыми подпотоками, содержит данные, представляющие все каналы программы, при этом число каналов уменьшено до 5.1. Термин уменьшение числа каналов обозначает комбинацию каналов с получением меньшего числа каналов. Это производится для сохранения совместимости с декодерами, не позволяющими декодирование зависимых подпотоков. В зависимых подпотоках содержатся данные, представляющие каналы, которые либо заменяют, либо дополняют каналы, передаваемые в связанном с ними независимом подпотоке. Расширение числа каналов позволяет передачу до четырнадцати каналов одной программы.
Дополнительные подробности синтаксиса цифрового потока и соответствующей процедуры обработки могут быть получены из документа А/52В.
Д. Поблочная обработка.
Для обработки и надлежащего декодирования многочисленных разновидностей в структуре цифрового потока, получающейся в результате применения различных комбинаций средств кодирования, использованных при получении кодированного цифрового потока, необходима сложная логическая процедура. Как было упомянуто выше, стандарты АТ8С не регламентируют детали архитектуры алгоритма, но общей характеристикой традиционных реализаций декодеров формата Е-АС-3 является алгоритм, декодирующий все данные в кадре, относящиеся к определенному каналу, перед декодированием данных, относящихся к другому каналу. Такой традиционный подход позволяет уменьшить объем внутрикристального запоминающего устройства, необходимого для декодирования цифрового потока, однако требует неоднократных проходов по данным, содержащимся в каждом кадре, для чтения и анализа данных во всех аудиоблоках кадра.
Данный традиционный подход схематически представлен на фиг. 6. Компонент 19 производит анализ кадров кодированного цифрового потока, получаемого по цепи 1, и получение данных из кадров в соответствии с сигналами управления, получаемыми по цепи 20. Данный анализ выполняется путем неоднократных проходов по данным кадра. Данные, полученные из одного кадра, представлены прямоугольниками под компонентом 19. Например, прямоугольник, обозначенный АВ0-СН0, представляет полученные данные, относящиеся к каналу 0 в аудиоблоке АВ0, а прямоугольник, обозначенный АВ5СН2, представляет полученные данные, относящиеся к каналу 2 в аудиоблоке АВ5. Для упрощения чертежа представлены только три канала от 0 до 2 и три аудиоблока 0, 1 и 5. Компонент 19 также передает параметры, полученные из метаданных кадра, компонентам обработки каналов 31, 32 и 33 по цепи 20. Сигнальные цепи и поворотные переключатели слева от прямоугольников данных представляют логическую процедуру, выполняемую традиционным декодером при поканальной обработке кодированных аудиоданных. Компонент обработки канала 31 получает кодированные аудиоданные и метаданные для канала СН0 через поворотный переключатель 21, начиная с аудиоблока АВ0 и заканчивая аудиоблоком АВ5, декодирует данные и формирует выходной сигнал путем применения банка фильтров синтеза к декодированным данным. Результаты обработки передаются по цепи 41. Компонент обработки канала 32 получает данные для канала СН1 для аудиоблоков АВ0-АВ5 через поворотный переключатель 22, обрабатывает эти данные и передает выходной сигнал по цепи 42. Компонент обработки канала 33 получает данные для канала СН2 для аудиоблоков АВ0-АВ5 через поворотный переключатель 23, обрабатывает эти данные и передает выходной сигнал по цепи 43.
- 8 024310
Применение настоящего изобретения во многих случаях может повысить эффективность обработки за счет отказа от неоднократных проходов по данным кадра. Неоднократные проходы используются в ситуациях, когда для получения кодированного цифрового потока используется определенная комбинация средств кодирования, однако, декодирование цифровых потоков формата Е-АС-3, получаемых при использовании нижеописанных комбинаций средств кодирования, может быть выполнено за один проход. Этот новый подход схематически представлен на фиг. 7. Компонент 19 производит анализ кадров кодированного цифрового потока, получаемого по цепи 1, и получение данных из кадров в соответствии с сигналами управления, получаемыми по цепи 20. Во многих ситуациях данный анализ выполняется путем неоднократных проходов при обработке данных кадра. Данные, полученные из одного кадра, представлены прямоугольниками под компонентом 19 в порядке, аналогичном приведенному ранее описанию для Фиг. 6. Компонент 19 передает параметры, полученные из метаданных кадра по цепи 20 к компонентам обработки блоков 61, 62 и 63. Компонент обработки блоков 61 получает кодированные аудиоданные и метаданные через поворотный переключатель 51 для всех каналов в блоке АВ0, декодирует данные и формирует выходной сигнал путем применения банка фильтров синтеза к декодированным данным. Результаты обработки для каналов СН0, СН1 и СН2 передаются через поворотный переключатель 71 к надлежащей выходной цепи 41, 42 и 43 соответственно. Компонент блока обработки 62 получает данные для всех каналов в аудиоблоке АВ1 через поворотный переключатель 52, обрабатывает эти данные и передает результат через поворотный переключатель 72 к надлежащей выходной цепи каждого канала. Компонент блока обработки 63 получает данные для всех каналов в аудиоблоке АВ5 через поворотный переключатель 53, обрабатывает эти данные и передает результат через поворотный переключатель 73 к надлежащей выходной цепи каждого канала.
Ряд особенностей настоящего изобретения описан ниже и проиллюстрирован фрагментами программ. Эти фрагменты программ не претендуют на практическое использование или на позицию наилучшего варианта реализации, а лишь есть примером для иллюстрации. Например, порядок операторов программы может быть изменен перестановкой некоторых операторов.
1. Общая процедура.
Общая иллюстрация настоящего изобретения представлена следующим фрагментом программы:
(1.1) определить начало кадра в цифровом потоке 8, (1.2) для каждого кадра N в цифровом потоке 8, (1.3) произвести распаковку метаданных в кадре Ν, (1.4) получить параметры из распакованных метаданных кадра, (1.5) определить начало первого аудиоблока К в кадре Ν, (1.6) для аудиоблока К в кадре Ν, (1.7) произвести распаковку метаданных в блоке К, (1.8) получить параметры из распакованных метаданных блока, (1.9) определить начало первого канала С в блоке К, (1.10) для канала С в блоке К, (1.11) произвести распаковку и декодирование экспонент, (1.12) произвести распаковку и деквантование мантисс, (1.13) применить фильтр синтеза к декодированным аудиоданным для канала С, (1.14) определить начало канала С+1 в блоке К, (1.15) конец цикла для, (1.16) определить начало блока К+1 в кадре Ν, (1.17) конец цикла для, (1.18) определить начало следующего кадра Ν+1 в цифровом потоке 8, (1.19) конец цикла для.
Оператором (1.1) производится анализ цифрового потока для обнаружения строки битов, соответствующей синхронизирующей комбинации, передаваемой в информации 81. При обнаружении синхронизирующей комбинации определяется начало кадра в цифровом потоке.
Операторами (1.2) и (1.19) осуществляется управление процедурой декодирования для обработки каждого кадра цифрового потока или до остановки процедуры декодирования иными средствами.
Операторами (1.3)-(1.18) выполняется процедура декодирования одного кадра в кодированном цифровом потоке.
Операторами (1.3)-(1.5) производится распаковка метаданных кадра, получение параметров декодирования из распакованных метаданных и определение положения начала данных первого аудиоблока К данного кадра в цифровом потоке. Оператором (1.16) определяется начало следующего аудиоблока в цифровом потоке при наличии последующих аудиоблоков в данном кадре.
Операторами (1.6) и (1.17) осуществляется управление процедурой декодирования для обработки каждого аудиоблока в данном кадре. Операторами (1.7)-(1.15) выполняется процедура декодирования одного аудиоблока в данном кадре. Операторами (1.7)-(1.9) производится распаковка метаданных аудиоблока, получение параметров декодирования из распакованных метаданных и определение положения начала данных для первого канала.
- 9 024310
Операторами (1.10) и (1.15) осуществляется управление процедурой декодирования для обработки каждого канала в данном аудиоблоке. Операторами (1.11)-(1.13) производится распаковка и декодирование экспонент, использование декодированных экспонент для определения распределения битов для распаковки и деквантования каждой квантованной мантиссы и применение банка фильтров синтеза к деквантованным мантиссам. Если в данном кадре присутствуют последующие каналы, то оператором (1.14) определяется положение начала данных для следующего канала в цифровом потоке.
Для согласования с различными методиками кодирования, применяемыми для получения кодированного цифрового потока, структура данной процедуры варьируется. Ниже приведены некоторые разновидности, описанные и проиллюстрированные с помощью фрагментов программ. В описаниях последующих фрагментов программ опущен ряд подробностей, рассмотренных для предыдущего фрагмента программы.
2. Спектральное расширение.
При использовании спектрального расширения (δΡΧ) в состав аудиоблока, с которого начинается процесс расширения, включаются общие параметры, необходимые для δΡΧ как в начальном аудиоблоке, так и в других аудиоблоках данного кадра, использующих δΡΧ. Такие общие параметры включают в себя идентификацию каналов, участвующих в процессе, частотный диапазон спектрального расширения и временное и частотное распределение огибающей спектра δΡΧ для каждого канала. Данные параметры извлекаются из того аудиоблока, с которого начинается использование δΡΧ, и сохраняются в запоминающем устройстве или регистрах компьютера для использования при обработке δΡΧ в последующих аудиоблоках данного кадра.
Допускается наличие более одного начального блока δΡΧ в кадре. Аудиоблок начинает использование δΡΧ в том случае, когда использование δΡΧ указывается в метаданных этого аудиоблока, и, либо в метаданных предшествующего аудиоблока использование δΡΧ не указывается, либо данный аудиоблок является первым блоком в кадре.
Каждый аудиоблок, использующий δΡΧ, содержит либо огибающую спектра δΡΧ, называемую координатами δΡΧ, используемыми при обработке с использованием спектрального расширения в этом аудиоблоке, либо отметка повторное использование, указывающий на необходимость использования координат δΡΧ предыдущего блока. Данные координаты δΡΧ в блоке распаковываются и сохраняются для возможного повторного использования при выполнении операций δΡΧ в последующих аудиоблоках.
Следующий фрагмент программы иллюстрирует один из способов обработки аудиоблоков с использованием δΡΧ:
(2.1) определить начало кадра в цифровом потоке δ, (2.2) для каждого кадра N в цифровом потоке δ, (2.3) произвести распаковку метаданных в кадре Ν, (2.4) получить параметры из распакованных метаданных кадра, (2.5) если присутствуют параметры δΡΧ кадра, то распаковать параметры δΡΧ кадра, (2.6) определить начало первого аудиоблока К в кадре Ν, (2.7) для аудиоблока К в кадре Ν, (2.8) произвести распаковку метаданных в блоке К, (2.9) получить параметры из распакованных метаданных блока, (2.10) если параметры δΡΧ блока присутствуют, то произвести распаковку параметров δΡΧ блока, (2.11) для канала С в блоке К, (2.12) произвести распаковку и декодирование экспонент, (2.13) произвести распаковку и деквантование мантисс, (2.14) если в канале С используется δΡΧ, то, (2.15) произвести расширение полосы пропускания канала С, (2.16) конец если, (2.17) применить фильтр синтеза к декодированным аудиоданным для канала С, (2.18) определить начало канала С+1 в блоке К, (2.19) конец цикла для, (2.20) определить начало блока К+1 в кадре Ν, (2.21) конец цикла для, (2.22) определить начало следующего кадра Ν+1 в цифровом потоке δ, (2.23) конец цикла для.
Оператором (2.5) производится получение параметров δΡΧ кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (2.10) производится получение параметров δΡΧ блока из метаданных блока в случае наличия таковых в метаданных блока. Параметры δΡΧ блока могут содержать координаты δΡΧ для одного или более каналов блока.
Операторами (2.12) и (2.13) производится распаковка и декодирование экспонент, а декодированные экспоненты используются с целью определения распределения битов для распаковки и деквантования каждой квантованной мантиссы. Оператором (2.14) производится проверка факта использования δΡΧ в канале С текущего аудиоблока. В случае использования δΡΧ оператором (2.15) применяется обра- 10 024310 ботка δΡΧ для расширения полосы пропускания канала С. Результатом этой процедуры являются спектральные компоненты канала С, поступающие на вход банка фильтров синтеза, применяемого оператором (2.17).
3. Адаптивное гибридное преобразование.
При использовании адаптивного гибридного преобразования (АГП) в первом блоке АВ0 кадра содержатся все коэффициенты гибридного преобразования для каждого канала, обработанного с использованием преобразования ЭСТ-ΙΙ. Для всех остальных каналов каждый из шести аудиоблоков кадра содержит 256 спектральных коэффициентов, создаваемых банком фильтров анализа МДКП.
Например, кодированный цифровой поток содержит данные для левого, центрального и правого каналов. В случае, когда обработка левого и правого каналов производится с использованием АГП, а обработка центрального канала производится без использования АГП, в аудиоблоке АВ0 содержатся все коэффициенты гибридного преобразования для каждого из левого и правого каналов, и содержатся 256 коэффициентов МДКП для центрального канала. Аудиоблоки АВ1-АВ5 содержат спектральные коэффициенты МДКП для центрального канала, но не содержат коэффициенты для левого и правого каналов.
Следующий фрагмент программы иллюстрирует один из возможных способов обработки аудиоблоков, содержащих коэффициенты АГП:
(3.1) определить начало кадра в цифровом потоке δ, (3.2) для каждого кадра N в цифровом потоке δ, (3.3) произвести распаковку метаданных в кадре Ν, (3.4) получить параметры из распакованных метаданных кадра, (3.5) определить начало первого аудиоблока К в кадре Ν, (3.6) для аудиоблока К в кадре Ν, (3.7) произвести распаковку метаданных в блоке К, (3.8) получить параметры из распакованных метаданных блока, (3.9) определить начало первого канала С в блоке К, (3.10) для канала С в блоке К, (3.11) если для канала С использовано АГП, то, (3.12) если К=0, то, (3.13) произвести распаковку и декодирование экспонент, (3.14) произвести распаковку и деквантование мантисс, (3.15) применить обратное вторичное преобразование к экспонентам и мантиссам, (3.16) сохранить мантиссы и экспоненты МДКП в буфере, (3.17) конец если, (3.18) получить экспоненты и мантиссы МДКП для блока К из буфера, (3.19) в противном случае, (3.20) произвести распаковку и декодирование экспонент, (3.21) произвести распаковку и деквантование мантисс, (3.22) конец если, (3.23) применить фильтр синтеза к декодированным аудиоданным для канала С, (3.24) определить начало канала С+1 в блоке К, (3.25) конец цикла для, (3.26) определить начало блока К+1 в кадре Ν, (3.27) конец цикла для, (3.28) определить начало следующего кадра Ν+1 в цифровом потоке δ, (3.29) конец цикла для.
Оператором (3.11) определяется факт использования АГП для канала С. В случае использования АГП оператором (3.12) определяется факт обработки первого аудиоблока АВ0. Если выполняется обработка первого аудиоблока, то операторами (3.13)-(3.16) производится получение всех коэффициентов АГП для канала С, применение к этим коэффициентам АГП обратного вторичного преобразования или ОДКП-ΙΙ для получения спектральных коэффициентов МДКП и сохранение их в буфере. Эти спектральные коэффициенты соответствуют экспонентам и деквантованным мантиссам, которые получаются операторами (3.20) и (3.21) для тех каналов, в которых не используется АГП. Оператором (3.18) получаются экспоненты и мантиссы спектральных коэффициентов МДКП, соответствующие обрабатываемому аудиоблоку К. Например, если производится обработка первого аудиоблока (К=0), то из буфера извлекаются экспоненты и мантиссы для набора спектральных коэффициентов МДКП для первого блока. Если производится обработка, например, второго аудиоблока (К=1), то из буфера извлекаются экспоненты и мантиссы для набора спектральных коэффициентов МДКП для второго блока.
4. Спектральное расширение и адаптивное гибридное преобразование.
δΡΧ и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов. Логические процедуры, описанные выше для спектрального расширения и гибридного преобразования в отдельности, могут быть объединены для обработки каналов, для которых используется δΡΧ, для которых используется АГП, или используются как δΡΧ, так и АГП.
- 11 024310
Следующий фрагмент программы иллюстрирует один из способов обработки аудиоблоков, содержащих коэффициенты АГП и 8РХ:
(4.1) определить начало кадра в цифровом потоке 8, (4.2) для каждого кадра N в цифровом потоке 8, (4.3) произвести распаковку метаданных в кадре Ν, (4.4) получить параметры из распакованных метаданных кадра, (4.5) если присутствуют параметры 8РХ кадра, то произвести распаковку параметров 8РХ кадра, (4.6) определить начало первого аудиоблока К в кадре Ν, (4.7) для аудиоблока К в кадре Ν, (4.8) произвести распаковку метаданных в блоке К, (4.9) получить параметры из распакованных метаданных блока, (4.10) если параметры 8РХ блока присутствуют, то произвести распаковку параметров 8РХ блока, (4.11) для канала С в блоке К, (4.12) если для канала С использовано АГП, то, (4.13) если К=0, то, (4.14) произвести распаковку и декодирование экспонент, (4.15) произвести распаковку и деквантование мантисс, (4.16) применить обратное вторичное преобразование к экспонентам и мантиссам, (4.17) сохранить в буфере экспоненты и мантиссы обратного вторичного преобразования, (4.18) конец если, (4.19) получить из буфера экспоненты и мантиссы обратного вторичного преобразования для блока К, (4.20) в противном случае, (4.21) произвести распаковку и декодирование экспонент, (4.22) произвести распаковку и деквантование мантисс, (4.23) конец если, (4.24) если в канале С используется 8РХ, то, (4.25) произвести расширение полосы пропускания канала С, (4.26) конец если, (4.27) применить фильтр синтеза к декодированным аудиоданным для канала С, (4.28) определить начало канала С+1 в блоке К, (4.29) конец цикла для, (4.30) определить начало блока К+1 в кадре Ν, (4.31) конец цикла для, (4.32) определить начало следующего кадра Ν+1 в цифровом потоке 8, (4.33) конец цикла для.
Оператором (4.5) производится получение параметров 8РХ кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (4.10) производится получение параметров 8РХ блока из метаданных блока в случае наличия таковых в метаданных блока. Параметры 8РХ блока могут содержать координаты 8РХ для одного или более каналов блока.
Оператором (4.12) определяется факт использования АГП для канала С. В случае использования АГП для канала С, оператором (4.13) определяется факт обработки первого аудиоблока. Если выполняется обработка первого аудиоблока, то операторами (4.14)-(4.17) производится получение коэффициентов АГП для канала С, применение обратного вторичного преобразования или ОДКП-ΙΙ к коэффициентам АГП для получения коэффициентов обратного вторичного преобразования и сохранение коэффициентов обратного вторичного преобразования в буфере. Экспоненты и мантиссы спектральных коэффициентов МДКП, соответствующие обрабатываемому аудиоблоку К, получаются оператором (4.19).
Если же для канала С не используется АГП, то операторами (4.21) и (4.22) производится распаковка и получение экспонент и мантисс для канала С в блоке К, согласно вышеприведенному описанию для операторов программы (1.11) и (1.12).
Оператором (4.24) производится проверка использования 8РХ в канале С в текущем аудиоблоке. В случае использования 8РХ оператором (4.25), применяется обработка 8РХ к коэффициентам обратного вторичного преобразования для расширения полосы пропускания, получая, таким образом, спектральные коэффициенты МДКП канала С. Результатом этой процедуры являются спектральные компоненты канала С, поступающие на вход банка фильтров синтеза, применяемого оператором (4.27). Если обработка 8РХ для канала С не используется, то спектральные коэффициенты получаются непосредственно из коэффициентов обратного вторичного преобразования.
5. Объединение и адаптивное гибридное преобразование.
Объединение каналов и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов. Фактически, логическая процедура, описанная выше для спектрального расширения и обработки с использованием гибридного преобразования, может быть использована для обработки цифровых потоков, в которых используется объединение каналов и АГП, поскольку вышеописан- 12 024310 ные подробности обработки 8РХ применимы к обработке, выполняемой при объединении каналов.
Следующий фрагмент программы иллюстрирует один из возможных способов обработки аудиоблоков, содержащих объединение каналов и коэффициенты АГП:
(5.1) определить начало кадра в цифровом потоке 8, (5.2) для каждого кадра N в цифровом потоке 8, (5.3) произвести распаковку метаданных в кадре Ν, (5.4) получить параметры из распакованных метаданных кадра, (5.5) если присутствуют параметры объединения кадра, то распаковать параметры объединения кадра, (5.6) определить начало первого аудиоблока К в кадре Ν, (5.7) для аудиоблока К в кадре Ν, (5.8) произвести распаковку метаданных в блоке К, (5.9) получить параметры из распакованных метаданных блока, (5.10) если присутствуют параметры объединения блока, то распаковать параметры объединения блока, (5.11) для канала С в блоке К, (5.12) если для канала С использовано АГП, то, (5.13) если К=0, то, (5.14) произвести распаковку и декодирование экспонент, (5.15) произвести распаковку и деквантование мантисс, (5.16) применить обратное вторичное преобразование к экспонентам и мантиссам, (5.17) сохранить в буфере экспоненты и мантиссы обратного вторичного преобразования, (5.18) конец если, (5.19) получить из буфера экспоненты и мантиссы обратного вторичного преобразования для блока К, (5.20) в противном случае, (5.21) произвести распаковку и декодирование экспонент для канала С, (5.22) произвести распаковку и деквантование мантисс для канала С, (5.23) конец если, (5.24) если в канале С используется объединение, то, (5.25) если канал С является первым каналом, в котором используется объединение, то, (5.26) если для объединенного канала использовано АГП, то, (5.27) если К=0, то, (5.28) произвести распаковку и декодирование экспонент объединенного канала, (5.29) произвести распаковку и деквантование мантисс объединенного канала, (5.30) применить обратное вторичное преобразование к объединенному каналу, (5.31) сохранить экспоненты и мантиссы обратного вторичного преобразования для объединенного канала в буфере, (5.32) конец если, (5.33) получить экспоненты и мантиссы объединенного канала для блока К из буфера, (5.34) в противном случае, (5.35) произвести распаковку и декодирование экспонент объединенного канала, (5.36) произвести распаковку и деквантование мантисс объединенного канала, (5.37) конец если, (5.38) конец если, (5.39) получить объединяемый канал С из объединенного канала, (5.40) конец если, (5.41) применить фильтр синтеза к декодированным аудиоданным для канала С, (5.42) определить начало канала С+1 в блоке К, (5.43) конец цикла для, (5.44) определить начало блока К+1 в кадре Ν, (5.45) конец цикла для, (5.46) определить начало следующего кадра Ν+1 в цифровом потоке 8, (5.47) конец цикла для.
Оператором (5.5) производится получение параметров объединения каналов кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (5.10) производится получение параметров объединения каналов блока из метаданных блока в случае наличия таковых в метаданных блока. Если таковые присутствуют, для объединяемых каналов в блоке получают координаты объединения.
Оператором (5.12) определяется факт использования АГП для канала С. В случае использования АГП, оператор (5.13) определяет факт обработки первого аудиоблока. Если выполняется обработка первого аудиоблока, то операторами (5.14)-(5.17) производится получение коэффициентов АГП для канала С, применение обратного вторичного преобразования или ОДКП-ΙΙ к коэффициентам АГП для получе- 13 024310 ния коэффициентов обратного вторичного преобразования и сохранение коэффициентов обратного вторичного преобразования в буфере. Экспоненты и мантиссы коэффициентов обратного вторичного преобразования, соответствующие обрабатываемому аудиоблоку К, получаются оператором (5.19).
Если же для канала С не используется АГП, то операторами (5.21) и (5.22) производится распаковка и получение экспонент и мантисс для канала С в блоке К согласно вышеприведенному описанию для операторов программы (1.11) и (1.12).
Оператор (5.24) проверяет факт использования объединения каналов для канала С. В случае использования объединения каналов, оператор (5.25) проверяет, является ли канал С первым каналом в блоке, использующим объединение. Если канал С является первым каналом в блоке, использующим объединение, то экспоненты и мантиссы для объединенного канала получаются либо путем применения обратного вторичного преобразования к экспонентам и мантиссам объединенного канала, как представлено операторами (5.26)-(5.33), либо из данных цифрового потока, как представлено операторами (5.35) и (5.36). В цифровом потоке данные, представляющие мантиссы объединенного канала, находятся непосредственно после данных, представляющих мантиссы канала С. Получение объединяемого канала С из объединенного канала производится оператором (5.39) с учетом соответствующих координат объединения для канала С. Если для канала С не используется объединение каналов, то спектральные коэффициенты МДКП получаются непосредственно из коэффициентов обратного вторичного преобразования.
6. Спектральное расширение, объединение и адаптивное гибридное преобразование.
Спектральное расширение, объединение каналов и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов.
Вышеописанные логические процедуры для комбинаций обработки АГП со спектральным расширением и гибридным преобразованием могут быть скомбинированы для обработки каналов, в которых используется любая комбинация этих трех средств кодирования, путем добавления дополнительной логической процедуры, необходимой для обработки восьми возможных ситуаций. Обработка, связанная с восстановлением каналов, выполняется до обработки δΡΧ.
Р. Реализация.
Устройства, использующие различные особенности настоящего изобретения, могут быть реализованы различными способами, в том числе в виде программного обеспечения, выполняемого компьютером или иным устройством, содержащим более специализированные компоненты, например схему с цифровым сигнальным процессором (ΌδΡ), соединенные с компонентами, подобными применяемым в компьютерах общего назначения. Фиг. 8 представляет схематическую функциональную диаграмму устройства 90, которое может быть использовано для реализации различных особенностей настоящего изобретения. Вычислительные ресурсы предоставляются процессором 92. ОЗУ 93 является оперативным запоминающим устройством (ОЗУ), которое процессор 92 использует для обработки информации. ПЗУ 94 представляет собой разновидность устройства постоянного хранения, например постоянное запоминающее устройство (ПЗУ) для хранения программ, необходимых для функционирования устройства 90, и, возможно, для реализации ряда особенностей настоящего изобретения. Блок управления вводом/выводом 95 представляет собой схему интерфейса для приема и передачи сигналов, используя каналы связи 1, 16. В показанном воплощении все основные компоненты системы соединены шиной 91, которая может представлять собой более, чем одну физическую или логическую шину; однако для реализации настоящего изобретения шинная архитектура не является обязательной.
В воплощениях, реализованных с использованием компьютерной системы общего назначения, могут содержаться дополнительные компоненты для сопряжения с такими устройствами, как клавиатура или устройство позиционирования мышь и монитор, и для управления устройством хранения данных, содержащим носитель для хранения данных, например магнитную ленту или диск, или оптический носитель. Такой носитель для хранения данных может быть использован для записи программ, представляющих собой команды операционной системы, служебные программы и приложения, и может содержать программы для реализации различных особенностей настоящего изобретения.
Функции, необходимые для практического осуществления различных особенностей настоящего изобретения, могут выполняться компонентами, реализованными разнообразными способами, в том числе с использованием дискретных логических компонентов, интегральных схем, одной или более специализированных интегральных схем (ΆδΙΟ) и/или процессоров с программным управлением. Для настоящего изобретения способ реализации этих компонентов значения не имеет.
Программные реализации настоящего изобретения могут передаваться с использованием различных машиночитаемых носителей, например каналов немодулированной и модулированной передачи данных в спектре от ультразвуковой до ультрафиолетовой области частот, или носителей запоминающих устройств, передающих информацию с использованием любой технологии записи, включая магнитную ленту, карты или диск, оптические карты или диск, и различимые маркировки на носителях, включая бумагу.
Claims (7)
- (1) определяют факт использования обработки с использованием адаптивного гибридного преобразования в процедуре кодирования для кодирования объединенного канала;(1) определяют факт использования обработки с использованием адаптивного гибридного преобразования в процедуре кодирования любой части кодированных аудиоданных для каждого соответствующего канала из двух или более каналов;1. Способ декодирования кадра кодированного цифрового аудиосигнала, согласно которому данный кадр содержит метаданные кадра, первый аудиоблок и один или больше последующих аудиоблоков;каждый из первого и последующих аудиоблоков содержит метаданные блока и кодированные аудиоданные для двух или более аудиоканалов, при этом кодированные аудиоданные содержат коэффициенты масштабирования и масштабированные значения, представляющие спектральный состав двух или больше аудиоканалов, причем каждое масштабированное значение связано с соответствующим коэффициентом масштабирования;метаданные блока содержат управляющую информацию, описывающую средства кодирования, используемые в процедуре кодирования, результатом которой являются вышеупомянутые кодированные аудиоданные, причем средства кодирования включают обработку с использованием адаптивного гибридного преобразования, включающую преобразование двух или больше аудиоканалов с помощью первичного преобразования для получения коэффициентов первичного преобразования, где первичное преобразование представляет собой модифицированное дискретное косинусное преобразование (МДКП);преобразование коэффициентов первичного преобразования по меньшей мере к двум или больше аудиоканалам с помощью вторичного преобразования для получения коэффициентов гибридного преобразования, где вторичное преобразование представляет собой дискретное косинусное преобразование второго типа (ДКП-11);при этом данный способ включает этапы, на которых:(A) получают кадр кодированного цифрового аудиосигнала;(B) анализируют кодированный цифровой аудиосигнал данного кадра для поблочного декодирования кодированных аудиоданных для каждого аудиоблока, при этом декодирование каждого соответствующего аудиоблока включает этапы, на которых:
- (2) в случае использования обработки с использованием адаптивного гибридного преобразования для кодирования объединенного канала:(а) если соответствующий аудиоблок является первым аудиоблоком в кадре:(ί) получают все коэффициенты гибридного преобразования, относящиеся к объединенному каналу в данном кадре, из кодированных аудиоданных в первом аудиоблоке;(ίί) преобразуют коэффициенты гибридного преобразования с помощью обратного вторичного преобразования для получения коэффициентов обратного вторичного преобразования, где обратное вторичное преобразование представляет собой обратное дискретное косинусное преобразование второго типа (ОДКП-11);(б) получают коэффициенты первичного преобразования из коэффициентов обратного вторичного преобразования для объединенного канала в соответствующем аудиоблоке;2. Способ по п.1, отличающийся тем, что кадр кодированного цифрового аудиосигнала соответствует синтаксису цифрового потока в формате Е-АС-3.(2) в случае использования в процедуре кодирования обработки с использованием адаптивного гибридного преобразования для соответствующего канала:(а) если соответствующий аудиоблок является первым аудиоблоком в кадре:(ί) получают все коэффициенты гибридного преобразования, относящиеся к соответствующему каналу для данного кадра, из кодированных аудиоданных в первом аудиоблоке;(ίί) преобразуют коэффициенты гибридного преобразования с помощью обратного вторичного преобразования для получения коэффициентов обратного вторичного преобразования, где обратное вторичное преобразование представляет собой обратное дискретное косинусное преобразование второго типа (ОДКП-11);(б) получают коэффициенты первичного преобразования из коэффициентов обратного вторичного преобразования для соответствующего канала в соответствующем аудиоблоке;
- (3) получают спектральные коэффициенты для объединенного канала путем декодирования кодированных данных в соответствующем аудиоблоке, если в процедуре кодирования для объединенного канала обработка с использованием адаптивного гибридного преобразования не использовалась;(B) получают коэффициенты первичного преобразования для соответствующего канала путем восстановления спектральных компонент для объединенного канала.3. Способ по п.2, отличающийся тем, что средства кодирования включают обработку с использованием спектрального расширения и процедура декодирования каждого соответствующего аудиоблока также включает этап, на котором синтезируют одну или более спектральных компонент из коэффициентов обратного вторичного преобразования для получения коэффициентов первичного преобразования с расширенной полосой пропускания.(3) получают коэффициенты первичного преобразования для соответствующего канала путем декодирования кодированных данных в соответствующем аудиоблоке, если в процедуре кодирования обработка с использованием адаптивного гибридного преобразования не использовалась для соответствующего канала;(C) преобразуют коэффициенты первичного преобразования с помощью обратного первичного преобразования для получения выходного сигнала, представляющего собой соответствующий канал в соответствующем аудиоблоке, где обратное первичное преобразование представляет собой обратное модифицированное дискретное косинусное преобразование (ОМДКП).
- 4. Способ по п.2 или 3, отличающийся тем, что средства кодирования включают обработку с использованием объединения каналов, а процедура декодирования каждого соответствующего аудиоблока также включает этапы, на которых определяют факт использования обработки с использованием объединения каналов в процедуре кодирования для кодирования любой части кодированных аудиоданных и получают спектральные компоненты из коэффициентов обратного вторичного преобразования с целью получения коэффициентов первичного преобразования для объединяемых каналов в случае использования обработки с использованием объединения каналов в процедуре кодирования.- 15 024310
- 5. Способ по п.2 или 3, отличающийся тем, что средства кодирования включают в себя обработку с использованием объединения каналов и процедура декодирования каждого соответствующего аудиоблока также включает этапы, на которых определяют факт использования обработки с использованием объединения каналов в процедуре кодирования для кодирования любой части кодированных аудиоданных; и в случае использования процедурой кодирования обработки с объединением каналов:(A) если соответствующий канал является первым каналом в кадре, использующим объединение, осуществляют этапы, на которых:
- 6. Устройство для декодирования кадра кодированного цифрового аудиосигнала, содержащее процессор, выполненный с возможностью осуществления всех этапов способа по любому из пп.1-5, оперативное запоминающее устройство (ОЗУ), которое процессор использует для обработки информации, постоянное запоминающее устройство (ПЗУ) для хранения программ, необходимых для функционирования устройства, и блок управления вводом/выводом для приема и передачи сигналов, причем указанные компоненты устройства соединены шиной.
- 7. Носитель запоминающего устройства с записанной на нем программой инструкций, которая может исполняться устройством для выполнения способа декодирования кадра кодированного цифрового аудиосигнала, причем данный способ включает в себя все этапы способа по любому из пп.1-5.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26742209P | 2009-12-07 | 2009-12-07 | |
PCT/US2010/054480 WO2011071610A1 (en) | 2009-12-07 | 2010-10-28 | Decoding of multichannel aufio encoded bit streams using adaptive hybrid transformation |
Publications (2)
Publication Number | Publication Date |
---|---|
EA201270642A1 EA201270642A1 (ru) | 2012-12-28 |
EA024310B1 true EA024310B1 (ru) | 2016-09-30 |
Family
ID=43334376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EA201270642A EA024310B1 (ru) | 2009-12-07 | 2010-10-28 | Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования |
Country Status (37)
Country | Link |
---|---|
US (2) | US8891776B2 (ru) |
EP (3) | EP2801975B1 (ru) |
JP (2) | JP5547297B2 (ru) |
KR (2) | KR101370522B1 (ru) |
CN (2) | CN104217724B (ru) |
AP (1) | AP3301A (ru) |
AR (1) | AR079878A1 (ru) |
AU (1) | AU2010328635B2 (ru) |
BR (1) | BR112012013745B1 (ru) |
CA (1) | CA2779453C (ru) |
CL (1) | CL2012001493A1 (ru) |
CO (1) | CO6460719A2 (ru) |
DK (1) | DK2510515T3 (ru) |
EA (1) | EA024310B1 (ru) |
EC (1) | ECSP12012006A (ru) |
ES (1) | ES2463840T3 (ru) |
GE (1) | GEP20146081B (ru) |
GT (1) | GT201200134A (ru) |
HK (1) | HK1170058A1 (ru) |
HN (1) | HN2012000819A (ru) |
HR (1) | HRP20140400T1 (ru) |
IL (1) | IL219304A (ru) |
MA (1) | MA33775B1 (ru) |
MX (1) | MX2012005723A (ru) |
MY (1) | MY161012A (ru) |
NI (1) | NI201200063A (ru) |
NZ (1) | NZ599981A (ru) |
PE (1) | PE20130167A1 (ru) |
PL (1) | PL2510515T3 (ru) |
PT (1) | PT2510515E (ru) |
RS (1) | RS53288B (ru) |
SI (1) | SI2510515T1 (ru) |
TN (1) | TN2012000211A1 (ru) |
TW (1) | TWI498881B (ru) |
UA (1) | UA100353C2 (ru) |
WO (1) | WO2011071610A1 (ru) |
ZA (1) | ZA201203290B (ru) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US8948406B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
US20120033819A1 (en) * | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
US9130596B2 (en) * | 2011-06-29 | 2015-09-08 | Seagate Technology Llc | Multiuse data channel |
EP2786377B1 (en) | 2011-11-30 | 2016-03-02 | Dolby International AB | Chroma extraction from an audio codec |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014126689A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for controlling the inter-channel coherence of upmixed audio signals |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
WO2014126688A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
CA3211308A1 (en) * | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
WO2014210284A1 (en) | 2013-06-27 | 2014-12-31 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10095468B2 (en) | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US10049683B2 (en) | 2013-10-21 | 2018-08-14 | Dolby International Ab | Audio encoder and decoder |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) * | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN105280212A (zh) * | 2014-07-25 | 2016-01-27 | 中兴通讯股份有限公司 | 混音播放方法及装置 |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
ES2853936T3 (es) * | 2017-01-10 | 2021-09-20 | Fraunhofer Ges Forschung | Decodificador de audio, codificador de audio, método para proporcionar una señal de audio decodificada, método para proporcionar una señal de audio codificada, flujo de audio, proveedor de flujos de audio y programa informático que utiliza un identificador de flujo |
US10354667B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
CN113168839B (zh) * | 2018-12-13 | 2024-01-23 | 杜比实验室特许公司 | 双端媒体智能 |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN111711493B (zh) * | 2020-06-16 | 2022-03-11 | 中国电子科技集团公司第三研究所 | 具有加密解密能力的水下通信设备及发射器和接收器 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
US6356639B1 (en) * | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
JPH10340099A (ja) * | 1997-04-11 | 1998-12-22 | Matsushita Electric Ind Co Ltd | オーディオデコーダ装置及び信号処理装置 |
US6246345B1 (en) | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
CN1261663C (zh) | 2002-12-31 | 2006-06-28 | 深圳市高科智能系统有限公司 | 无线集中控制门禁/门锁的方法及系统设备 |
US7516064B2 (en) | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
KR101325802B1 (ko) * | 2007-02-06 | 2013-11-05 | 엘지전자 주식회사 | 디지털 방송 송신기 및 디지털 방송 수신기와 그를 이용한디지털 방송 시스템 및 그 서비스 방법 |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
CN101896967A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 编码器 |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
-
2010
- 2010-10-28 SI SI201030604T patent/SI2510515T1/sl unknown
- 2010-10-28 PT PT107760175T patent/PT2510515E/pt unknown
- 2010-10-28 BR BR112012013745-0A patent/BR112012013745B1/pt active IP Right Grant
- 2010-10-28 UA UAA201208193A patent/UA100353C2/ru unknown
- 2010-10-28 KR KR1020127012464A patent/KR101370522B1/ko active IP Right Grant
- 2010-10-28 RS RS20140226A patent/RS53288B/en unknown
- 2010-10-28 AP AP2012006289A patent/AP3301A/xx active
- 2010-10-28 EP EP14160585.7A patent/EP2801975B1/en active Active
- 2010-10-28 MY MYPI2012001912A patent/MY161012A/en unknown
- 2010-10-28 CN CN201410410643.3A patent/CN104217724B/zh active Active
- 2010-10-28 EP EP13195367.1A patent/EP2706529A3/en not_active Ceased
- 2010-10-28 EA EA201270642A patent/EA024310B1/ru not_active IP Right Cessation
- 2010-10-28 EP EP10776017.5A patent/EP2510515B1/en active Active
- 2010-10-28 PL PL10776017T patent/PL2510515T3/pl unknown
- 2010-10-28 MX MX2012005723A patent/MX2012005723A/es active IP Right Grant
- 2010-10-28 CA CA2779453A patent/CA2779453C/en active Active
- 2010-10-28 US US13/514,286 patent/US8891776B2/en active Active
- 2010-10-28 WO PCT/US2010/054480 patent/WO2011071610A1/en active Application Filing
- 2010-10-28 DK DK10776017.5T patent/DK2510515T3/da active
- 2010-10-28 AU AU2010328635A patent/AU2010328635B2/en active Active
- 2010-10-28 CN CN201080051553.XA patent/CN102687198B/zh active Active
- 2010-10-28 NZ NZ599981A patent/NZ599981A/en unknown
- 2010-10-28 PE PE2012000561A patent/PE20130167A1/es active IP Right Grant
- 2010-10-28 KR KR1020137026329A patent/KR101629306B1/ko active IP Right Grant
- 2010-10-28 ES ES10776017.5T patent/ES2463840T3/es active Active
- 2010-10-28 JP JP2012541085A patent/JP5547297B2/ja active Active
- 2010-10-28 GE GEAP201012753A patent/GEP20146081B/en unknown
- 2010-11-04 TW TW099137944A patent/TWI498881B/zh active
- 2010-12-01 AR ARP100104440A patent/AR079878A1/es active IP Right Grant
-
2012
- 2012-04-19 IL IL219304A patent/IL219304A/en active IP Right Grant
- 2012-04-20 HN HN2012000819A patent/HN2012000819A/es unknown
- 2012-04-23 NI NI201200063A patent/NI201200063A/es unknown
- 2012-04-30 GT GT201200134A patent/GT201200134A/es unknown
- 2012-05-07 ZA ZA2012/03290A patent/ZA201203290B/en unknown
- 2012-05-09 TN TNP2012000211A patent/TN2012000211A1/en unknown
- 2012-05-14 CO CO12078993A patent/CO6460719A2/es active IP Right Grant
- 2012-05-31 MA MA34912A patent/MA33775B1/fr unknown
- 2012-06-07 CL CL2012001493A patent/CL2012001493A1/es unknown
- 2012-06-27 EC ECSP12012006 patent/ECSP12012006A/es unknown
- 2012-10-25 HK HK12110658.8A patent/HK1170058A1/xx unknown
-
2013
- 2013-11-18 JP JP2013237842A patent/JP5607809B2/ja active Active
-
2014
- 2014-05-05 HR HRP20140400AT patent/HRP20140400T1/hr unknown
- 2014-10-13 US US14/512,755 patent/US9620132B2/en active Active
Non-Patent Citations (3)
Title |
---|
ANDERSEN, ROBERT L.; CROCKETT, BRETT G.; DAVIDSON, GRANT A.; DAVIS, MARK F.; FIELDER, LOUIS D.; TURNER, STEPHEN C.; VINTON, MARK S: "Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System", AES CONVENTION 117; OCTOBER 2004, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 6196, 1 October 2004 (2004-10-01), 60 East 42nd Street, Room 2520 New York 10165-2520, USA, XP040506945 * |
ANONYMOUS: "A/52B, ATSC standard, Digital audio compression standard (AC-3, E-AC-3), revision B", NOT KNOWN, a_52b, 14 June 2005 (2005-06-14), XP030001573 * |
SAKAMOTO H., SHIBUYA Y., TAKANO H., KITABATAKE O., TAMITANI I.: "A Dolby AC-3/MPEG1 audio decoder core suitable for audio/visual system integration", CUSTOM INTEGRATED CIRCUITS CONFERENCE, 1997., PROCEEDINGS OF THE IEEE 1997 SANTA CLARA, CA, USA 5-8 MAY 1997, NEW YORK, NY, USA,IEEE, US, 5 May 1997 (1997-05-05) - 8 May 1997 (1997-05-08), US, pages 241 - 244, XP010235299, ISBN: 978-0-7803-3669-8, DOI: 10.1109/CICC.1997.606621 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EA024310B1 (ru) | Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования | |
JP6808781B2 (ja) | 信号をインタリーブするためのオーディオ復号器 | |
TW200415922A (en) | Conversion of synthesized spectral components for encoding and low-complexity transcoding | |
JP6181854B2 (ja) | マルチチャネル・オーディオのハイブリッド・エンコード | |
KR102275129B1 (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
TWI470622B (zh) | 用於低頻效應頻道降低複雜度之轉換 | |
DK2691951T3 (en) | TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency | |
KR20240151254A (ko) | 오디오 신호에 대한 고주파 재구성 기술의 하위 호환 통합 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s) |
Designated state(s): AM AZ KG TJ |
|
QB4A | Registration of a licence in a contracting state |