EA024310B1 - Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования - Google Patents

Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования Download PDF

Info

Publication number
EA024310B1
EA024310B1 EA201270642A EA201270642A EA024310B1 EA 024310 B1 EA024310 B1 EA 024310B1 EA 201270642 A EA201270642 A EA 201270642A EA 201270642 A EA201270642 A EA 201270642A EA 024310 B1 EA024310 B1 EA 024310B1
Authority
EA
Eurasian Patent Office
Prior art keywords
audio
channel
frame
transform
block
Prior art date
Application number
EA201270642A
Other languages
English (en)
Other versions
EA201270642A1 (ru
Inventor
Камаланатхан Рамамортху
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of EA201270642A1 publication Critical patent/EA201270642A1/ru
Publication of EA024310B1 publication Critical patent/EA024310B1/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

В изобретении представлено повышение эффективности процедуры, используемой для декодирования кадров цифрового потока в формате Е-АС-3, за счет однократной обработки каждого аудиоблока в кадре. Процедура декодирования аудиоблоков кодированных данных выполняется не поканально, а поблочно. Описание примеров процедур декодирования цифровых потоков, кодированных с помощью таких усовершенствованных алгоритмов кодирования, как обработка с использованием адаптивного гибридного преобразования и спектральное расширение.

Description

Настоящее изобретение в целом относится к системам кодирования аудиосигналов и, в частности, относится к способам и устройствам для декодирования кодированных цифровых аудиосигналов.
Уровень техники
Комитет по перспективным системам телевещания США (АТ8С), сформированный организациямичленами Объединенного комитета по межведомственной координации (ЮС), разработал скоординированный набор национальных стандартов для развития национального телевидения в США. В число этих стандартов входят соответствующие стандарты кодирования/декодирования аудиосигналов, изложенные в различных нормативных документах, в том числе в документе А/52В, озаглавленном Стандарт сжатия цифрового аудиосигнала (АС-3, Е-АС-3), ревизия Б, опубликованном 14 июня 2005 г., который целиком включен в настоящий документ посредством ссылки. Алгоритм кодирования аудиосигнала, регламентированный в документе А/52В, имеет название АС-3. Усовершенствованная версия этого алгоритма, описанная в приложении Е к этому документу, имеет название Е-АС-3. Два этих алгоритма в настоящем документе именуются как АС-3 и соответствующие стандарты именуются как Стандарты АТ8С.
Документ А/52В не регламентирует многих аспектов архитектуры алгоритма, а описывает вместо этого синтаксис цифрового потока, задавая структурные и синтаксические характеристики кодированной информации, декодирование которой должно быть выполнено совместимым декодером. Многие приложения, совместимые со стандартом АТ8С, передают кодированную цифровую аудиоинформацию в виде последовательных двоичных данных. В результате кодированные данные зачастую называют цифровым потоком, но допустимы и другие упорядоченные структуры данных. В целях облегчения изложения термин цифровой поток используется в настоящем документе для обозначения кодированного цифрового аудиосигнала, независимо от формата или используемой методики записи или передачи.
Цифровой поток, совместимый со стандартами АТ8С, организован в виде последовательности кадров синхронизации. Каждый кадр является единицей цифрового потока, который может быть полностью декодирован для получения одного или более каналов цифровых аудиоданных с импульснокодовой модуляцией (ИКМ). Каждый кадр содержит аудиоблоки и метаданные кадра, относящиеся к аудиоблокам. Каждый из аудиоблоков содержит кодированные аудиоданные, представляющие цифровые отсчеты аудиосигнала для одного или больше аудиоканалов, и метаданные блока, относящиеся к кодированным аудиоданным.
Несмотря на то что стандарты АТ8С не регламентируют детали архитектуры алгоритмов, определенные особенности последних широко используются производителями профессионального и бытового декодирующего оборудования. Одной из универсальных особенностей реализации для декодеров, декодирующих цифровые потоки в формате Е-АС-3, создаваемые кодировщиками формата Е-АС-3, является алгоритм, декодирующий все содержащиеся в кадре кодированные данные для соответствующего канала перед декодированием данных для другого канала. Такой подход используется для повышения производительности вариантов реализации, выполненных на однокристальных процессорах, имеющих малый объем внутрикристального запоминающего устройства, поскольку в ряде процедур декодирования данные для определенного канала необходимо получить из каждого из аудиоблоков, входящих в кадр. При обработке кодированных данных для каждого канала поочередно возможно выполнение операций декодирования с использованием внутрикристального запоминающего устройства для определенного канала. Декодированные данные канала впоследствии могут быть переданы внешнему запоминающему устройству, освобождая внутрикристальные ресурсы для следующего канала.
Цифровой поток, совместимый со стандартами АТ8С, может быть весьма сложным вследствие большого числа возможных разновидностей. Некоторые приводимые здесь вкратце примеры включают в себя объединение каналов, рематрицирование каналов, нормирование уровня диалогов, сжатие динамического диапазона, уменьшение числа каналов и изменение длины блока для цифровых потоков в стандартном формате АС-3, а также параллельные независимые потоки, зависимые подпотоки, спектральное расширение и гибридное адаптивное преобразование для цифровых потоков в формате Е-АС-3. Подробности данных характеристик могут быть получены из документа А/52В.
При обработке каждого канала в отдельности возможно упрощение алгоритмов, необходимых для реализации этих разновидностей. Такие сложные последующие процедуры, как фильтрация синтеза, могут выполняться без учета этих разновидностей. Упрощенные алгоритмы выгодны с точки зрения сокращения потребности в вычислительных ресурсах, необходимых для обработки кадра аудиоданных.
К сожалению, подобный подход требует алгоритма декодирования с двукратным чтением и анализом данных во всех аудиоблоках. Каждая итерация чтения и анализа данных аудиоблоков в кадре именуется в настоящем документе как проход по аудиоблокам. Во время первого прохода производятся обширные вычисления для определения положения кодированных аудиоданных в каждом блоке. Во время второго прохода при выполнении процедур декодирования выполняются многие аналогичные вычисления. Для вычисления положения данных для обоих проходов необходимы значительные вычислительные ресурсы. В случае устранения первоначального прохода возможно сокращение потребности в вычислительных ресурсах для декодирования кадра аудиоданных.
- 1 024310
Сущность изобретения
Целью настоящего изобретения является сокращение потребности в вычислительных ресурсах для декодирования кадра аудиоданных в кодированных цифровых потоках, организованном в виде таких иерархических единиц, как вышеописанные кадры и аудиоблоки. Предшествующий текст и последующее описание относятся к кодированным цифровым потокам, соответствующим стандартам ЛТ8С. но настоящее изобретение не ограничивается лишь данными цифровыми потоками. Принципы настоящего изобретения могут быть применены практически к любому кодированному цифровому потоку, имеющему структурные характеристики, подобные кадрам, блокам и каналам, используемым в алгоритмах кодирования АС-3.
В соответствии с одной из особенностей настоящего изобретения, предлагается способ декодирования кадра кодированного цифрового аудиосигнала путем получения кадра и анализа кодированного цифрового аудиосигнала за один проход для поблочного декодирования кодированных аудиоданных для каждого аудиоблока. Каждый кадр содержит метаданные кадра и совокупность аудиоблоков. Каждый аудиоблок содержит метаданные блока и кодированные аудиоданные для одного или более аудиоканалов. Метаданные блока содержат управляющую информацию, описывающую средства кодирования, использованные процедурой кодирования, которая была применена для получения кодированных аудиоданных. Одним из таких средств кодирования является обработка с использованием гибридного преобразования, в процессе которой банк фильтров анализа, реализованный путем первичного преобразования, применяется к одному или более аудиоканалам для получения спектральных коэффициентов, представляющих спектральный состав одного или более аудиоканалов, при этом к данным спектральным коэффициентам, минимум к одному или более аудиоканалам, применяется вторичное преобразование для получения коэффициентов гибридного преобразования. При декодировании каждого аудиоблока происходит определение факта применения обработки с использованием адаптивного гибридного преобразования в процедуре кодирования для кодирования любой части кодированных аудиоданных. Если в процедуре кодирования применялась обработка с использованием адаптивного гибридного преобразования, то, согласно предлагаемому способу, все коэффициенты гибридного преобразования для кадра получаются из кодированных аудиоданных, содержащихся в первом аудиоблоке данного кадра, при этом к коэффициентам гибридного преобразования применяется обратное вторичное преобразование с целью получения коэффициентов обратного вторичного преобразования, а спектральные коэффициенты получаются из коэффициентов обратного вторичного преобразования. Если в процедуре кодирования обработка с использованием адаптивного гибридного преобразования не применялась, то спектральные коэффициенты получаются из кодированных аудиоданных, содержащихся в соответствующем аудиоблоке. Для получения выходного сигнала, представляющего один или больше каналов соответствующего аудиоблока, к спектральным коэффициентам применяется обратное первичное преобразование.
Различные особенности настоящего изобретения и его предпочтительных воплощений станут более понятны при рассмотрении последующего описания и прилагаемых чертежей, на которых ссылочные позиции соответствуют аналогичным элементам на нескольких чертежах. Содержание последующего описания и чертежей предлагается исключительно в качестве примеров и не должно восприниматься как нечто устанавливающее ограничения на объем настоящего изобретения.
Краткое описание чертежей
Фиг. 1 представляет схематическую функциональную диаграмму примера реализации кодировщика.
Фиг. 2 представляет схематическую функциональную диаграмму примера реализации декодера.
Фиг. ЗА и 3В представляют схематические иллюстрации кадров цифровых потоков в соответствии со стандартной и усовершенствованной структурами синтаксиса.
Фиг. 4А и 4В представляют схематические иллюстрации аудиоблоков в соответствии со стандартной и усовершенствованной структурами синтаксиса.
Фиг. 5А-5С представляют схематические иллюстрации примеров цифровых потоков, кодированных в режиме расширения числа программ и каналов.
Фиг. 6 представляет схематическую функциональную диаграмму примера процедуры, воплощенной в виде декодера для поканальной обработки аудиоданных.
Фиг. 7 представляет схематическую функциональную диаграмму примера процедуры, воплощенной в виде декодера для поблочной обработки аудиоданных.
Фиг. 8 представляет схематическую функциональную диаграмму устройства, которое может быть использовано для реализации различных особенностей настоящего изобретения.
Подробное описание изобретения
А. Обзор системы кодирования.
Фиг. 1 и 2 представляют схематические функциональные диаграммы примеров реализации кодировщика и декодера системы кодирования аудиосигналов, в декодере которой могут быть использованы различные особенности настоящего изобретения. Эти варианты реализации соответствуют содержанию упомянутого ранее документа А/52В.
Целью данной системы кодирования является получение кодированного представления входных
- 2 024310 аудиосигналов, которое может быть записано или передано, а впоследствии декодировано для получения выходных аудиосигналов, звучащих практически идентично входным аудиосигналам, при этом используется минимальное количество цифровой информации для представления кодированного сигнала. Системы кодирования, соответствующие основным стандартам ЛТ8С, выполняют кодирование и декодирование информации, которая может представлять от одного до так называемых 5.1 каналов аудиосигналов, где 5.1 обозначает пять каналов с полной шириной полосы пропускания и один канал с ограниченной шириной полосы пропускания, предназначенный для передачи сигналов низкочастотных эффектов (ЬРЕ).
Последующие разделы описывают варианты реализации кодировщика и декодера, а также некоторые подробности структуры кодированного цифрового потока и соответствующих процедур кодирования и декодирования. Данные описания приведены для сокращения описания и лучшего понимания различных особенностей настоящего изобретения.
1. Кодировщик.
В соответствии с примером варианта реализации, представленным на фиг. 1, последовательность отсчетов с импульсно-кодовой модуляцией (ИКМ), представляющих один или более каналов аудиосигналов, поступает на вход 1 кодировщика, после чего к данной последовательности отсчетов применяется банк фильтров анализа 2 для получения числовых значений, представляющих спектральный состав входных аудиосигналов. Для воплощений, соответствующих стандартам ЛТ8С, банк фильтров анализа реализуется с использованием модифицированного дискретного косинусного преобразования (МДКП), описанного в документе А/52В. МДКП применяется к перекрывающимся сегментам или блокам отсчетов для каждого входного канала аудиосигнала с целью получения блоков коэффициентов преобразования, представляющих спектральный состав сигнала этого входного канала. МДКП является частью системы анализа/синтеза, которая использует специально разработанные оконные функции и процессы перекрытия/сложения для устранения искажений во временной области. Данные коэффициенты преобразования в каждом блоке выражаются в формате с блочной плавающей точкой (БПТ), содержащем экспоненты и мантиссы с плавающей точкой. Такое описание относится к аудиоданным, выраженным в виде экспонент и мантисс с плавающей точкой, поскольку такой формат представления используется в цифровых потоках, соответствующих стандартам ЛТ8С; однако, данное представление является лишь одним примером численного представления, использующего коэффициенты масштабирования и соответствующие им масштабированные значения.
Экспоненты БПТ для каждого блока совместно представляют приближенную огибающую спектра входного аудиосигнала. Эти экспоненты кодируются методом дельта-модуляции, а также с помощью других методик кодирования для сокращения потребности в количестве информации, передаются форматеру 5, и поступают на вход психоакустической модели для оценки порога психоакустической маскировки кодируемого сигнала. Результаты, полученные моделью, используются блоком распределения битов 3 для распределения цифровой информации в форме битов для квантования мантисс таким образом, чтобы уровень шума квантования оставался ниже порога психоакустической маскировки кодируемого сигнала. Блок квантования 4 производит квантование мантисс в соответствии с распределением битов, полученным от блока распределения битов 3 и переданных форматеру 5.
Форматер 5 мультиплексирует или объединяет кодированные экспоненты, квантованные мантиссы и другую управляющую информацию, иногда именуемую метаданными блоков, в аудиоблоки. Данные для шести последовательных аудиоблоков объединяются в единицы цифровой информации, называемые кадрами. Кадры также содержат управляющую информацию или метаданные кадров. Кодированная информация для последовательных кадров поступает на выход в виде цифрового потока по цепи 6 для записи на носителе запоминающего устройства или для передачи по каналу связи. Для кодировщиков, соответствующих стандартам ЛТ8С, формат каждого кадра в цифровом потоке соответствует синтаксису, регламентированному в документе А/52В.
Алгоритм кодирования, который используется типовыми кодировщиками, соответствующими стандартам ЛТ8С, сложнее, чем представленный на фиг. 1 и описанный выше. Например, в кадры вносятся коды обнаружения ошибок, позволяющие приемному декодеру проверять достоверность цифрового потока. Для адаптации временного и спектрального разрешения банка фильтров анализа, для оптимизации его производительности при изменении характеристик сигнала может быть использована методика кодирования, известная как изменение длины блока, иногда упрощенно называемая изменением блока. Экспоненты с плавающей точкой могут кодироваться с переменным временным и частотным разрешением. Два или более каналов могут быть объединены в составное представление при использовании методики кодирования, известной как объединение каналов. К двухканальным аудиосигналам может быть адаптивно применена другая методика кодирования, известная как рематрицирование каналов. Могут быть использованы и дополнительные методики кодирования, здесь не упоминаемые. Некоторые из этих прочих методик кодирования будут рассмотрены далее. Многие прочие подробности реализации опускаются, поскольку они не являются необходимыми для понимания настоящего изобретения. При необходимости, эти подробности могут быть получены из документа А/52В.
- 3 024310
2. Декодер.
Алгоритм декодирования, выполняемый декодером, по сути, является обратным алгоритму кодирования, выполняемому кодировщиком. Как следует из примера реализации, представленного на фиг. 2, кодированный цифровой поток, представляющий собой последовательность кадров, поступает на вход 11 декодера. Кодированный цифровой поток может загружаться с носителя запоминающего устройства или приниматься по каналу связи. Для каждого фрейма закодированная информация демультиплексируется или разъединяется в блоке удаления формата 12 на метаданные фрейма и шесть аудиоблоков. Аудиоблоки разъединяются на соответствующие метаданные блоков, кодированные экспоненты и квантованные мантиссы. Кодированные экспоненты используются психоакустической моделью в блоке распределения битов 13 с целью распределения цифровой информации в формате битов для деквантования квантованных мантисс таким же образом, каким биты были распределены в кодировщике. Блок деквантования 14 производит деквантование квантованных мантисс в соответствии с распределениями битов, полученными от блока распределения битов 13, и передает деквантованные мантиссы банку фильтров синтеза 15. Кодированные экспоненты декодируются и передаются банку фильтров синтеза 15.
Декодированные экспоненты и деквантованные мантиссы образуют представление БПТ для спектрального состава входного аудиосигнала, закодированного кодировщиком. Банк фильтров синтеза 15 применяется к представлению спектрального состава для восстановления неточной копии исходных входных аудиосигналов, проходящей по цепи выходного сигнала 16. Для воплощений, соответствующих стандартам АТ§С, банк фильтров синтеза реализован в виде обратного модифицированного дискретного косинусного преобразования (ОМДКП), описанного в документе А/52В. ОМДКП является частью кратко упомянутой ранее системы анализа/синтеза, применяемой к блокам коэффициентов преобразования для получения блоков аудиоотсчетов, которые перекрываются и складываются для устранения искажений во временной области.
Алгоритм декодирования, который используется в типовых декодерах, соответствующих стандартам АТ§С, сложнее, чем представленный на фиг. 2 и описанный выше. Некоторые методики декодирования, являющиеся обратными для вышеописанных методик кодирования, включают в себя обнаружение ошибок для коррекции или маскировки последних, изменение длины блока для адаптации временного и спектрального разрешения банка фильтров синтеза, восстановление каналов для восстановления информации каналов из объединенных составных представлений и матричные операции для восстановления рематрицированных двухканальных представлений. При необходимости, информация о других методиках и дополнительные подробности могут быть получены из документа А/52В.
Б. Структура кодированного цифрового потока.
1. Кадр.
Кодированный цифровой поток, соответствующий стандартам АТ§С, состоит из последовательности единиц кодированной информации, именуемых кадрами синхронизации, часто называемых просто кадрами. Как указывалось выше, каждый кадр содержит метаданные кадра и шесть аудиоблоков. Каждый аудиоблок содержит метаданные блока и кодированные экспоненты, а также мантиссы БПТ для параллельных интервалов одного или более каналов аудиосигналов. Структура стандартного цифрового потока схематически представлена на фиг. 3А. Структура цифрового потока в формате Е-АС-3, описанная в приложении Е к документу А/52В, представлена на фиг. 3В. Участок каждого цифрового потока в пределах отмеченного интервала от §1 до СКС составляет один кадр.
В синхронизирующую информацию (§1), помещаемую в начале каждого кадра для того, чтобы декодер имел возможность идентифицировать начало кадра и поддерживать синхронизацию процедур декодирования с кодированным цифровым потоком, включена специальная комбинация битов или слово синхронизации. Секция информации о цифровом потоке (В§1), следующая непосредственно за §1, содержит необходимые параметры алгоритма декодирования для декодирования данного кадра. Например, в В§1 содержится информация о числе, типе и порядке каналов, представленных в кадре в виде закодированной информации, а также информация о сжатии динамического диапазона и нормировании уровня диалогов, используемая декодером. Каждый кадр содержит шесть аудиоблоков (от АВ0 до АВ5), за которыми при необходимости могут следовать дополнительные данные (АИХ). В конце каждого кадра предоставляется информация для обнаружения ошибок в формате слова циклического избыточного кода (СКС).
Кадр цифрового потока в формате Е-АС-3 также содержит аудиоданные кадра (АРКМ), содержащие отметки и параметры, относящиеся к дополнительным методикам кодирования, которые недоступны для использования при кодировании стандартного цифрового потока. Некоторые из этих дополнительных методик включают в себя использование спектрального расширения (§РХ), известного также как спектральная репликация, и адаптивное гибридное преобразование (АГП). Описание различных методик кодирования приведено далее.
2. Аудиоблоки.
Каждый аудиоблок содержит кодированные представления экспонент и квантованных мантисс БПТ для 256 коэффициентов преобразования, а также метаданные блока, необходимые для декодирования кодированных экспонент и квантованных мантисс. Такая структура схематически представлена на фиг.
- 4 024310
4А. Структура аудиоблока в цифровом потоке в формате Е-АС-3, описанная в приложении Е к документу А/52В, представлена на фиг. 4В. Структура аудиоблока в альтернативном варианте цифрового потока, описанном в приложении И к документу А/52В, здесь не рассматривается, поскольку ее уникальные характеристики к настоящему изобретению не относятся.
Ряд примеров метаданных блока включают в себя отметки и параметры, описывающие изменение длины блока (Ви<8\У). сжатие динамического диапазона (ΌΥΝΡΝΟ), объединение каналов (СРЬ), рематрицирование каналов (КЕМЛТ), методику или стратегию кодирования экспонент (ΕΧΡδΤΚ), использованную при кодировании экспонент БПТ, кодированные экспоненты БПТ (ЕХР), информацию о распределении битов (ВА) для мантисс, поправки к распределению битов, известные как разностная информация о распределении битов (ΌΒΑ), и квантованные мантиссы (ΜΑΝΤ). Каждый аудиоблок в цифровом потоке в формате Е-АС-3 может содержать информацию, относящуюся к дополнительным методикам кодирования, включая спектральное расширение (δΡΧ).
3. Требования к цифровому потоку.
Стандарты АТ8С предъявляют ряд требований к содержанию цифрового потока, имеющих отношение к настоящему изобретению. Здесь упоминается о двух таких требованиях: (1) первый аудиоблок в кадре, называемый ΑΒ0, должен содержать всю информацию, необходимую алгоритму декодирования для начала декодирования всех аудиоблоков в кадре, и (2) всякий раз, когда с цифровым потоком поступает кодированная информация, полученная при объединении каналов, аудиоблок, в котором впервые было использовано объединение каналов, должен содержать все параметры, необходимые для восстановления. Данные особенности описываются ниже. Информация о прочих процедурах, здесь не рассматриваемых, содержится в документе А/52В.
В. Стандартные процедуры и методики кодирования.
Стандарты АТ8С описывают ряд особенностей синтаксиса цифрового потока с точки зрения процедур кодирования или средств кодирования, которые могут быть использованы для получения кодированного цифрового потока. Кодировщику необязательно использовать все средства кодирования, однако соответствующий стандарту декодер должен быть в состоянии адекватно отреагировать на те средства кодирования, которые считаются обязательными для соответствия стандарту. Такая реакция реализуется путем применения надлежащего средства декодирования, являющегося, по сути, обратным для соответствующего средства кодирования.
Некоторые из таких средств декодирования особенно актуальны для настоящего изобретения, поскольку их использование или неиспользование влияет на реализацию особенностей настоящего изобретения. Некоторые процедуры декодирования и некоторые средства декодирования будут кратко рассмотрены в последующих параграфах. Дальнейшие описания не являются полным описанием. Различные подробности и дополнительные особенности опущены. Данные описания предназначены лишь для общего ознакомления для тех, кто не знаком с данными методиками, и для напоминания тем, кто мог позабыть, какие методики описываются данными терминами.
При необходимости, дополнительные подробности могут быть получены из документа А/52В, а также из патента США № 5583962, озаглавленного Кодировщик/декодер для многомерных звуковых полей, авторы Дэвис и др., выданного 10 декабря 1996 г. и целиком включенного в настоящий документ как неотъемлемая часть посредством ссылки.
1. Распаковка цифрового потока.
Все декодеры должны произвести распаковку или демультиплексирование кодированного цифрового потока для получения параметров и кодированных данных. Эта процедура выполняется блоком удаления формата 12, описанным ранее. При выполнении данной процедуры происходит считывание данных из входящего цифрового потока и копирование частей цифрового потока в регистры, копирование частей в ячейки запоминающего устройства или сохранение указателей или других ссылок на данные в цифровом потоке, сохраненные в буфере. Для сохранения данных и указателей необходимы ресурсы запоминающего устройства, а между сохранением этой информации для последующего использования и повторным считыванием цифрового потока для получения необходимой информации может быть сделан оптимальный выбор.
2. Декодирование экспонент.
Значения всех экспонент БПТ необходимы для распаковки данных в аудиоблоках для каждого кадра, поскольку эти значения косвенным образом указывают на число битов, выделенных для квантованных мантисс. Значения экспонент в цифровом потоке кодируются с использованием различных методик кодирования, которые могут быть применены как в частотной, так и во временной области. В результате, данные, представляющие кодированные экспоненты, должны быть распакованы из цифрового потока и декодированы до того, как они могут быть использованы для других процедур декодирования.
3. Обработка распределения битов.
Каждая из квантованных мантисс БПТ в цифровом потоке представлена различным числом битов, являющимся функцией экспонент БПТ и, возможно, других метаданных, содержащихся в цифровом потоке. Экспоненты БПТ являются входными данными для заданной модели, которая вычисляет распределение битов для каждой мантиссы. В случае, когда аудиоблок содержит различную информацию о рас- 5 024310 пределении битов (ΌΒΆ), эта дополнительная информация используется для внесения поправок в распределение битов, вычисляемое моделью.
4. Обработка мантиссы.
Квантованные мантиссы БПТ составляют большую часть данных, содержащихся в кодированном цифровом потоке. Распределение битов используется как для определения положения каждой мантиссы в цифровом потоке для распаковки, так и для выбора соответствующей функции деквантования для получения деквантованных мантисс. Некоторые данные в цифровом потоке могут представлять несколько мантисс с помощью одного значения. В такой ситуации из одного значения получается соответствующее число мантисс. Мантиссы, имеющие распределение битов, равное нулю, могут быть восстановлены либо со значением, равным нулю, либо в виде псевдослучайного числа.
5. Восстановление каналов.
Методика кодирования с объединением каналов позволяет кодировщику представить несколько аудиоканалов, используя меньшее количество данных. Данная методика объединяет спектральные компоненты двух или более избранных каналов, называемых объединяемыми каналами, с образованием одного канала составных спектральных компонент, называемого объединенным каналом. Спектральные компоненты объединенного канала представляются в формате БПТ. Набор коэффициентов масштабирования, описывающих разность энергий между объединенным каналом и каждым из объединяемых каналов и известных как координаты объединения, вычисляется для каждого из объединяемых каналов и включается в кодированный цифровой поток. Объединение используется только для определенной части полосы пропускания каждого канала.
При использовании методики объединения каналов, как обозначено параметрами в цифровом потоке, в декодере используется методика декодирования, известная как восстановление каналов, для получения неточной копии экспонент и мантисс БПТ для каждого из объединяемых каналов из спектральных компонент объединенного канала и координат объединения. Это производится путем умножения каждой спектральной компоненты объединенного сигнала на соответствующую координату объединения. Дополнительные подробности могут быть получены из документа А/52В.
6. Рематрицирование каналов.
Методика кодирования с использованием рематрицирования каналов позволяет кодировщику представлять двухканальные сигналы с помощью меньшего количества информации, используя матрицу для преобразования двух независимых аудиоканалов в суммарный и различный каналы. Экспоненты и мантиссы БПТ, обычным образом упакованные в цифровой поток для левого и правого аудиоканалов, вместо этого представляют суммарный и различный каналы. Данная методика может быть успешно использована в том случае, когда эти два канала имеют высокую степень сходства.
При использовании рематрицирования, на что указывает отметка в цифровом потоке, декодер получает значения, представляющие эти два аудиоканала, путем применения соответствующей матрицы к суммарным и различным значениям. Дополнительные подробности могут быть получены из документа А/52В.
Г. Усовершенствованные процедуры и методики кодирования.
Приложение Е к документу А/52В описывает характеристики синтаксиса цифрового потока в формате Е-АС-3, допускающего использование дополнительных средств кодирования. Некоторые из этих средств и соответствующие процедуры кратко описываются далее.
1. Обработка с использованием адаптивного гибридного преобразования.
Методика кодирования с использованием адаптивного гибридного преобразования (АГП) предоставляет дополнительное средство (помимо изменения длины блока) для адаптации временного и спектрального разрешения банков фильтров синтеза и анализа к изменениям характеристик сигнала путем каскадного применения двух преобразований. Дополнительная информация об обработке с использованием АГП может быть получена из документа А/52В и патента США 7516064, озаглавленного Адаптивное гибридное преобразование для анализа и синтеза сигналов, авторы Винтон и др., выданного 07.04.2009 г. и целиком включенного в настоящий документ как неотъемлемая часть посредством ссылки.
Кодировщики используют первичное преобразование, реализованное в виде вышеупомянутого преобразования МДКП анализа, перед и последовательно с вторичным преобразованием, реализованным в виде дискретного косинусного преобразования второго типа (ДКП-П). МДКП применяется к перекрывающимся блокам отсчетов аудиосигнала для получения спектральных коэффициентов, представляющих спектральный состав аудиосигнала. При необходимости ДКП-П может быть включено в цепь и исключено из цепи обработки сигнала, и, в случае включения, применяется к неперекрывающимся блокам спектральных коэффициентов МДКП, представляющих одинаковую частоту, для получения коэффициентов гибридного преобразования. В типовом варианте применения ДКП-П включено в том случае, когда аудиосигнал считается достаточно стационарным, поскольку при его применении значительно увеличивается эффективное спектральное разрешение банка фильтров анализа за счет уменьшения эффективного временного разрешения с 256 отсчетов до 1536 отсчетов.
В декодерах используется обратное первичное преобразование, реализованное в виде вышеупомя- 6 024310 нутого банка фильтров синтеза ОМДКП, следующее за и включенное последовательно с обратным вторичным преобразованием, реализованным в виде обратного дискретного косинусного преобразования второго типа (ОДКП-П). Преобразование ОДКП-П включается в цепь и исключается из цепи обработки сигнала в соответствии с метаданными, предоставляемыми кодировщиком. Будучи включенным в цепь обработки сигнала, преобразование ОДКП-П применяется к неперекрывающимся блокам коэффициентов гибридного преобразования для получения коэффициентов обратного вторичного преобразования. Данные коэффициенты обратного вторичного преобразования могут являться спектральными коэффициентами, непосредственно подаваемыми на вход ОМДКП в случае, когда иные средства кодирования, подобные объединению каналов или δΡΧ, не применяются. В противном случае, если средства кодирования, подобные объединению каналов или δΡΧ, были применены, спектральные коэффициенты МДКП могут быть получены из коэффициентов обратного вторичного преобразования. После получения спектральных коэффициентов МДКП к блокам спектральных коэффициентов МДКП в обычном порядке применяется ОМДКП.
АГП может быть применено для любого аудиоканала, в том числе для объединенного канала и канала ЬРЕ. В канале, кодированном с использованием АГП, используется другой вариант процедуры распределения битов и два различных типа квантования. Одним типом является векторное квантование (УЦ), а другим типом является адаптивное квантование с учетом усиления (СЛЦ). Методика СЛЦ описывается в патенте США № 6246345, озаглавленном Использование адаптивного квантования с учетом усиления и переменных длин символов для усовершенствованного кодирования аудиосигналов, авторы Девидсон и др., выданном 12 июня 2001 г. и целиком включенном в настоящий документ как неотъемлемая часть посредством ссылки.
При использовании АГП необходимо получение декодером ряда параметров из информации, содержащейся в кодированном цифровом потоке. Процесс вычисления этих параметров описан в документе А/52В. Один набор параметров задает число раз, которое экспоненты БПТ переносятся в кадре и получаются путем анализа метаданных, содержащихся в аудиоблоках кадра. Два других набора параметров идентифицируют те мантиссы БПТ, при квантовании которых использовалось СЛр. и содержат управляющие слова регулировки усиления для блоков квантования и получаются путем анализа метаданных канала в аудиоблоке.
Все коэффициенты гибридного преобразования для АГП переносятся в первом аудиоблоке АВ0 кадра. Если преобразование АГП применяется к объединенному каналу, то координаты объединения для коэффициентов АГП распределяются по всем аудиоблокам аналогично объединенным каналам без АГП. Процедура обработки в данной ситуации описывается далее.
2. Обработка с использованием спектрального расширения.
Методика кодирования с использованием спектрального расширения (δΡΧ) позволяет кодировщику сократить количество информации, необходимой для кодирования канала с полной шириной полосы пропускания, путем исключения высокочастотных спектральных компонент из кодированного цифрового потока и синтеза отсутствующих спектральных компонент в декодере из низкочастотных спектральных компонент, содержащихся в кодированном цифровом потоке.
При использовании δΡΧ, синтез отсутствующих спектральных компонент производится декодером путем копирования коэффициентов МДКП более низких частот в положения, соответствующие положениям коэффициентов МДКП для более высоких частот, добавления псевдослучайных или шумовых значений к коэффициентам преобразования и масштабирования амплитуды в соответствии с огибающей спектра δΡΧ, включенной в кодированный цифровой поток. Вычисление огибающей спектра δΡΧ и помещение ее в кодированный цифровой поток производится кодировщиком при каждом использовании средств кодирования δΡΧ.
Как правило, методика кодирования δΡΧ используется для синтеза высших полос спектральных компонент для канала. Она может быть использована совместно с объединением каналов для среднего диапазона частот. Дополнительные подробности процедуры обработки могут быть получены из документа А/52В.
3. Расширения числа программ и каналов.
Синтаксис цифрового потока в формате Е-АС-3 позволяет кодировщику создавать кодированный цифровой поток двоичных данных, представляющий одну программу с числом каналов, большим, чем 5.1 (расширение числа каналов), две или более программы с числом каналов вплоть до 5.1 (расширение числа программ) или комбинацию программ с числом каналов вплоть до 5.1 и программ с числом каналов, большим, чем 5.1. Расширение числа программ реализовано путем мультиплексирования кадров нескольких независимых потоков данных в кодированном цифровом потоке. Расширение числа каналов реализовано путем мультиплексирования кадров одного или более зависимых подпотоков данных, связанных с независимым потоком данных. В предпочтительных воплощениях режима расширения числа программ информация о программе или программах, подлежащих декодированию, поступает в декодер и в процедуре декодирования потоки или подпотоки, не подлежащие декодированию, пропускаются или фактически игнорируются.
Фиг. 5А-5С представляют три примера цифровых потоков, данные в которых содержат расширения
- 7 024310 числа программ и каналов. Фиг. 5А представляет пример цифрового потока, содержащего расширение числа каналов. Единственная программа Р1 представлена независимым потоком 80 и тремя связанными с ним зависимыми подпотоками 880, 881 и 882. Непосредственно после кадра Ей независимого потока данных 80 следуют кадры Еп каждого из связанных с ним зависимых подпотоков 880-883. После этих кадров следует следующий кадр Еп+1 независимого потока 80, за которым, в свою очередь, следуют кадры Еп+1 каждого из связанных с ним зависимых подпотоков 880-882. Синтаксис цифрового потока в формате Е-АС-3 предоставляет возможность для передачи до восьми зависимых подпотоков для каждого независимого потока.
На фиг. 5В представлен пример цифрового потока, содержащего расширение числа программ. Каждая из четырех программ Р1, Р2, Р3 и Р4 представлена независимым потоком 80, 81, 82 и 83 соответственно. Непосредственно после кадра Еп независимого потока данных 80 следуют кадры Еп каждого из независимых потоков 81, 82 и 83. После этих кадров следует следующий кадр Еп+1 каждого из независимых потоков. Синтаксис цифрового потока в формате Е-АС-3 предусматривает по меньшей мере один независимый поток и предоставляет возможность для передачи до восьми независимых потоков.
На фиг. 5С представлен пример цифрового потока, содержащего расширение числа программ и расширение числа каналов. Программа Р1 представлена данными в независимом потоке 80, а программа Р2 представлена данными в независимом потоке 81 и связанными с ним зависимыми подпотоками 880 и 881. Непосредственно после кадра Еп независимого потока данных 80 следует кадр Еп независимого потока 81, непосредственно за которым, в свою очередь, следуют кадры Еп каждого из связанных с ним зависимых подпотоков 880 и 881. После этих кадров следует следующий кадр Еп+1 каждого из независимых потоков и зависимых подпотоков.
Независимый поток без расширения числа каналов содержит данные, которые могут представлять до 5.1 независимых аудиоканалов. Независимый поток с расширением числа каналов или, другими словами, независимый поток с одним или более связанными с ним зависимыми подпотоками, содержит данные, представляющие все каналы программы, при этом число каналов уменьшено до 5.1. Термин уменьшение числа каналов обозначает комбинацию каналов с получением меньшего числа каналов. Это производится для сохранения совместимости с декодерами, не позволяющими декодирование зависимых подпотоков. В зависимых подпотоках содержатся данные, представляющие каналы, которые либо заменяют, либо дополняют каналы, передаваемые в связанном с ними независимом подпотоке. Расширение числа каналов позволяет передачу до четырнадцати каналов одной программы.
Дополнительные подробности синтаксиса цифрового потока и соответствующей процедуры обработки могут быть получены из документа А/52В.
Д. Поблочная обработка.
Для обработки и надлежащего декодирования многочисленных разновидностей в структуре цифрового потока, получающейся в результате применения различных комбинаций средств кодирования, использованных при получении кодированного цифрового потока, необходима сложная логическая процедура. Как было упомянуто выше, стандарты АТ8С не регламентируют детали архитектуры алгоритма, но общей характеристикой традиционных реализаций декодеров формата Е-АС-3 является алгоритм, декодирующий все данные в кадре, относящиеся к определенному каналу, перед декодированием данных, относящихся к другому каналу. Такой традиционный подход позволяет уменьшить объем внутрикристального запоминающего устройства, необходимого для декодирования цифрового потока, однако требует неоднократных проходов по данным, содержащимся в каждом кадре, для чтения и анализа данных во всех аудиоблоках кадра.
Данный традиционный подход схематически представлен на фиг. 6. Компонент 19 производит анализ кадров кодированного цифрового потока, получаемого по цепи 1, и получение данных из кадров в соответствии с сигналами управления, получаемыми по цепи 20. Данный анализ выполняется путем неоднократных проходов по данным кадра. Данные, полученные из одного кадра, представлены прямоугольниками под компонентом 19. Например, прямоугольник, обозначенный АВ0-СН0, представляет полученные данные, относящиеся к каналу 0 в аудиоблоке АВ0, а прямоугольник, обозначенный АВ5СН2, представляет полученные данные, относящиеся к каналу 2 в аудиоблоке АВ5. Для упрощения чертежа представлены только три канала от 0 до 2 и три аудиоблока 0, 1 и 5. Компонент 19 также передает параметры, полученные из метаданных кадра, компонентам обработки каналов 31, 32 и 33 по цепи 20. Сигнальные цепи и поворотные переключатели слева от прямоугольников данных представляют логическую процедуру, выполняемую традиционным декодером при поканальной обработке кодированных аудиоданных. Компонент обработки канала 31 получает кодированные аудиоданные и метаданные для канала СН0 через поворотный переключатель 21, начиная с аудиоблока АВ0 и заканчивая аудиоблоком АВ5, декодирует данные и формирует выходной сигнал путем применения банка фильтров синтеза к декодированным данным. Результаты обработки передаются по цепи 41. Компонент обработки канала 32 получает данные для канала СН1 для аудиоблоков АВ0-АВ5 через поворотный переключатель 22, обрабатывает эти данные и передает выходной сигнал по цепи 42. Компонент обработки канала 33 получает данные для канала СН2 для аудиоблоков АВ0-АВ5 через поворотный переключатель 23, обрабатывает эти данные и передает выходной сигнал по цепи 43.
- 8 024310
Применение настоящего изобретения во многих случаях может повысить эффективность обработки за счет отказа от неоднократных проходов по данным кадра. Неоднократные проходы используются в ситуациях, когда для получения кодированного цифрового потока используется определенная комбинация средств кодирования, однако, декодирование цифровых потоков формата Е-АС-3, получаемых при использовании нижеописанных комбинаций средств кодирования, может быть выполнено за один проход. Этот новый подход схематически представлен на фиг. 7. Компонент 19 производит анализ кадров кодированного цифрового потока, получаемого по цепи 1, и получение данных из кадров в соответствии с сигналами управления, получаемыми по цепи 20. Во многих ситуациях данный анализ выполняется путем неоднократных проходов при обработке данных кадра. Данные, полученные из одного кадра, представлены прямоугольниками под компонентом 19 в порядке, аналогичном приведенному ранее описанию для Фиг. 6. Компонент 19 передает параметры, полученные из метаданных кадра по цепи 20 к компонентам обработки блоков 61, 62 и 63. Компонент обработки блоков 61 получает кодированные аудиоданные и метаданные через поворотный переключатель 51 для всех каналов в блоке АВ0, декодирует данные и формирует выходной сигнал путем применения банка фильтров синтеза к декодированным данным. Результаты обработки для каналов СН0, СН1 и СН2 передаются через поворотный переключатель 71 к надлежащей выходной цепи 41, 42 и 43 соответственно. Компонент блока обработки 62 получает данные для всех каналов в аудиоблоке АВ1 через поворотный переключатель 52, обрабатывает эти данные и передает результат через поворотный переключатель 72 к надлежащей выходной цепи каждого канала. Компонент блока обработки 63 получает данные для всех каналов в аудиоблоке АВ5 через поворотный переключатель 53, обрабатывает эти данные и передает результат через поворотный переключатель 73 к надлежащей выходной цепи каждого канала.
Ряд особенностей настоящего изобретения описан ниже и проиллюстрирован фрагментами программ. Эти фрагменты программ не претендуют на практическое использование или на позицию наилучшего варианта реализации, а лишь есть примером для иллюстрации. Например, порядок операторов программы может быть изменен перестановкой некоторых операторов.
1. Общая процедура.
Общая иллюстрация настоящего изобретения представлена следующим фрагментом программы:
(1.1) определить начало кадра в цифровом потоке 8, (1.2) для каждого кадра N в цифровом потоке 8, (1.3) произвести распаковку метаданных в кадре Ν, (1.4) получить параметры из распакованных метаданных кадра, (1.5) определить начало первого аудиоблока К в кадре Ν, (1.6) для аудиоблока К в кадре Ν, (1.7) произвести распаковку метаданных в блоке К, (1.8) получить параметры из распакованных метаданных блока, (1.9) определить начало первого канала С в блоке К, (1.10) для канала С в блоке К, (1.11) произвести распаковку и декодирование экспонент, (1.12) произвести распаковку и деквантование мантисс, (1.13) применить фильтр синтеза к декодированным аудиоданным для канала С, (1.14) определить начало канала С+1 в блоке К, (1.15) конец цикла для, (1.16) определить начало блока К+1 в кадре Ν, (1.17) конец цикла для, (1.18) определить начало следующего кадра Ν+1 в цифровом потоке 8, (1.19) конец цикла для.
Оператором (1.1) производится анализ цифрового потока для обнаружения строки битов, соответствующей синхронизирующей комбинации, передаваемой в информации 81. При обнаружении синхронизирующей комбинации определяется начало кадра в цифровом потоке.
Операторами (1.2) и (1.19) осуществляется управление процедурой декодирования для обработки каждого кадра цифрового потока или до остановки процедуры декодирования иными средствами.
Операторами (1.3)-(1.18) выполняется процедура декодирования одного кадра в кодированном цифровом потоке.
Операторами (1.3)-(1.5) производится распаковка метаданных кадра, получение параметров декодирования из распакованных метаданных и определение положения начала данных первого аудиоблока К данного кадра в цифровом потоке. Оператором (1.16) определяется начало следующего аудиоблока в цифровом потоке при наличии последующих аудиоблоков в данном кадре.
Операторами (1.6) и (1.17) осуществляется управление процедурой декодирования для обработки каждого аудиоблока в данном кадре. Операторами (1.7)-(1.15) выполняется процедура декодирования одного аудиоблока в данном кадре. Операторами (1.7)-(1.9) производится распаковка метаданных аудиоблока, получение параметров декодирования из распакованных метаданных и определение положения начала данных для первого канала.
- 9 024310
Операторами (1.10) и (1.15) осуществляется управление процедурой декодирования для обработки каждого канала в данном аудиоблоке. Операторами (1.11)-(1.13) производится распаковка и декодирование экспонент, использование декодированных экспонент для определения распределения битов для распаковки и деквантования каждой квантованной мантиссы и применение банка фильтров синтеза к деквантованным мантиссам. Если в данном кадре присутствуют последующие каналы, то оператором (1.14) определяется положение начала данных для следующего канала в цифровом потоке.
Для согласования с различными методиками кодирования, применяемыми для получения кодированного цифрового потока, структура данной процедуры варьируется. Ниже приведены некоторые разновидности, описанные и проиллюстрированные с помощью фрагментов программ. В описаниях последующих фрагментов программ опущен ряд подробностей, рассмотренных для предыдущего фрагмента программы.
2. Спектральное расширение.
При использовании спектрального расширения (δΡΧ) в состав аудиоблока, с которого начинается процесс расширения, включаются общие параметры, необходимые для δΡΧ как в начальном аудиоблоке, так и в других аудиоблоках данного кадра, использующих δΡΧ. Такие общие параметры включают в себя идентификацию каналов, участвующих в процессе, частотный диапазон спектрального расширения и временное и частотное распределение огибающей спектра δΡΧ для каждого канала. Данные параметры извлекаются из того аудиоблока, с которого начинается использование δΡΧ, и сохраняются в запоминающем устройстве или регистрах компьютера для использования при обработке δΡΧ в последующих аудиоблоках данного кадра.
Допускается наличие более одного начального блока δΡΧ в кадре. Аудиоблок начинает использование δΡΧ в том случае, когда использование δΡΧ указывается в метаданных этого аудиоблока, и, либо в метаданных предшествующего аудиоблока использование δΡΧ не указывается, либо данный аудиоблок является первым блоком в кадре.
Каждый аудиоблок, использующий δΡΧ, содержит либо огибающую спектра δΡΧ, называемую координатами δΡΧ, используемыми при обработке с использованием спектрального расширения в этом аудиоблоке, либо отметка повторное использование, указывающий на необходимость использования координат δΡΧ предыдущего блока. Данные координаты δΡΧ в блоке распаковываются и сохраняются для возможного повторного использования при выполнении операций δΡΧ в последующих аудиоблоках.
Следующий фрагмент программы иллюстрирует один из способов обработки аудиоблоков с использованием δΡΧ:
(2.1) определить начало кадра в цифровом потоке δ, (2.2) для каждого кадра N в цифровом потоке δ, (2.3) произвести распаковку метаданных в кадре Ν, (2.4) получить параметры из распакованных метаданных кадра, (2.5) если присутствуют параметры δΡΧ кадра, то распаковать параметры δΡΧ кадра, (2.6) определить начало первого аудиоблока К в кадре Ν, (2.7) для аудиоблока К в кадре Ν, (2.8) произвести распаковку метаданных в блоке К, (2.9) получить параметры из распакованных метаданных блока, (2.10) если параметры δΡΧ блока присутствуют, то произвести распаковку параметров δΡΧ блока, (2.11) для канала С в блоке К, (2.12) произвести распаковку и декодирование экспонент, (2.13) произвести распаковку и деквантование мантисс, (2.14) если в канале С используется δΡΧ, то, (2.15) произвести расширение полосы пропускания канала С, (2.16) конец если, (2.17) применить фильтр синтеза к декодированным аудиоданным для канала С, (2.18) определить начало канала С+1 в блоке К, (2.19) конец цикла для, (2.20) определить начало блока К+1 в кадре Ν, (2.21) конец цикла для, (2.22) определить начало следующего кадра Ν+1 в цифровом потоке δ, (2.23) конец цикла для.
Оператором (2.5) производится получение параметров δΡΧ кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (2.10) производится получение параметров δΡΧ блока из метаданных блока в случае наличия таковых в метаданных блока. Параметры δΡΧ блока могут содержать координаты δΡΧ для одного или более каналов блока.
Операторами (2.12) и (2.13) производится распаковка и декодирование экспонент, а декодированные экспоненты используются с целью определения распределения битов для распаковки и деквантования каждой квантованной мантиссы. Оператором (2.14) производится проверка факта использования δΡΧ в канале С текущего аудиоблока. В случае использования δΡΧ оператором (2.15) применяется обра- 10 024310 ботка δΡΧ для расширения полосы пропускания канала С. Результатом этой процедуры являются спектральные компоненты канала С, поступающие на вход банка фильтров синтеза, применяемого оператором (2.17).
3. Адаптивное гибридное преобразование.
При использовании адаптивного гибридного преобразования (АГП) в первом блоке АВ0 кадра содержатся все коэффициенты гибридного преобразования для каждого канала, обработанного с использованием преобразования ЭСТ-ΙΙ. Для всех остальных каналов каждый из шести аудиоблоков кадра содержит 256 спектральных коэффициентов, создаваемых банком фильтров анализа МДКП.
Например, кодированный цифровой поток содержит данные для левого, центрального и правого каналов. В случае, когда обработка левого и правого каналов производится с использованием АГП, а обработка центрального канала производится без использования АГП, в аудиоблоке АВ0 содержатся все коэффициенты гибридного преобразования для каждого из левого и правого каналов, и содержатся 256 коэффициентов МДКП для центрального канала. Аудиоблоки АВ1-АВ5 содержат спектральные коэффициенты МДКП для центрального канала, но не содержат коэффициенты для левого и правого каналов.
Следующий фрагмент программы иллюстрирует один из возможных способов обработки аудиоблоков, содержащих коэффициенты АГП:
(3.1) определить начало кадра в цифровом потоке δ, (3.2) для каждого кадра N в цифровом потоке δ, (3.3) произвести распаковку метаданных в кадре Ν, (3.4) получить параметры из распакованных метаданных кадра, (3.5) определить начало первого аудиоблока К в кадре Ν, (3.6) для аудиоблока К в кадре Ν, (3.7) произвести распаковку метаданных в блоке К, (3.8) получить параметры из распакованных метаданных блока, (3.9) определить начало первого канала С в блоке К, (3.10) для канала С в блоке К, (3.11) если для канала С использовано АГП, то, (3.12) если К=0, то, (3.13) произвести распаковку и декодирование экспонент, (3.14) произвести распаковку и деквантование мантисс, (3.15) применить обратное вторичное преобразование к экспонентам и мантиссам, (3.16) сохранить мантиссы и экспоненты МДКП в буфере, (3.17) конец если, (3.18) получить экспоненты и мантиссы МДКП для блока К из буфера, (3.19) в противном случае, (3.20) произвести распаковку и декодирование экспонент, (3.21) произвести распаковку и деквантование мантисс, (3.22) конец если, (3.23) применить фильтр синтеза к декодированным аудиоданным для канала С, (3.24) определить начало канала С+1 в блоке К, (3.25) конец цикла для, (3.26) определить начало блока К+1 в кадре Ν, (3.27) конец цикла для, (3.28) определить начало следующего кадра Ν+1 в цифровом потоке δ, (3.29) конец цикла для.
Оператором (3.11) определяется факт использования АГП для канала С. В случае использования АГП оператором (3.12) определяется факт обработки первого аудиоблока АВ0. Если выполняется обработка первого аудиоблока, то операторами (3.13)-(3.16) производится получение всех коэффициентов АГП для канала С, применение к этим коэффициентам АГП обратного вторичного преобразования или ОДКП-ΙΙ для получения спектральных коэффициентов МДКП и сохранение их в буфере. Эти спектральные коэффициенты соответствуют экспонентам и деквантованным мантиссам, которые получаются операторами (3.20) и (3.21) для тех каналов, в которых не используется АГП. Оператором (3.18) получаются экспоненты и мантиссы спектральных коэффициентов МДКП, соответствующие обрабатываемому аудиоблоку К. Например, если производится обработка первого аудиоблока (К=0), то из буфера извлекаются экспоненты и мантиссы для набора спектральных коэффициентов МДКП для первого блока. Если производится обработка, например, второго аудиоблока (К=1), то из буфера извлекаются экспоненты и мантиссы для набора спектральных коэффициентов МДКП для второго блока.
4. Спектральное расширение и адаптивное гибридное преобразование.
δΡΧ и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов. Логические процедуры, описанные выше для спектрального расширения и гибридного преобразования в отдельности, могут быть объединены для обработки каналов, для которых используется δΡΧ, для которых используется АГП, или используются как δΡΧ, так и АГП.
- 11 024310
Следующий фрагмент программы иллюстрирует один из способов обработки аудиоблоков, содержащих коэффициенты АГП и 8РХ:
(4.1) определить начало кадра в цифровом потоке 8, (4.2) для каждого кадра N в цифровом потоке 8, (4.3) произвести распаковку метаданных в кадре Ν, (4.4) получить параметры из распакованных метаданных кадра, (4.5) если присутствуют параметры 8РХ кадра, то произвести распаковку параметров 8РХ кадра, (4.6) определить начало первого аудиоблока К в кадре Ν, (4.7) для аудиоблока К в кадре Ν, (4.8) произвести распаковку метаданных в блоке К, (4.9) получить параметры из распакованных метаданных блока, (4.10) если параметры 8РХ блока присутствуют, то произвести распаковку параметров 8РХ блока, (4.11) для канала С в блоке К, (4.12) если для канала С использовано АГП, то, (4.13) если К=0, то, (4.14) произвести распаковку и декодирование экспонент, (4.15) произвести распаковку и деквантование мантисс, (4.16) применить обратное вторичное преобразование к экспонентам и мантиссам, (4.17) сохранить в буфере экспоненты и мантиссы обратного вторичного преобразования, (4.18) конец если, (4.19) получить из буфера экспоненты и мантиссы обратного вторичного преобразования для блока К, (4.20) в противном случае, (4.21) произвести распаковку и декодирование экспонент, (4.22) произвести распаковку и деквантование мантисс, (4.23) конец если, (4.24) если в канале С используется 8РХ, то, (4.25) произвести расширение полосы пропускания канала С, (4.26) конец если, (4.27) применить фильтр синтеза к декодированным аудиоданным для канала С, (4.28) определить начало канала С+1 в блоке К, (4.29) конец цикла для, (4.30) определить начало блока К+1 в кадре Ν, (4.31) конец цикла для, (4.32) определить начало следующего кадра Ν+1 в цифровом потоке 8, (4.33) конец цикла для.
Оператором (4.5) производится получение параметров 8РХ кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (4.10) производится получение параметров 8РХ блока из метаданных блока в случае наличия таковых в метаданных блока. Параметры 8РХ блока могут содержать координаты 8РХ для одного или более каналов блока.
Оператором (4.12) определяется факт использования АГП для канала С. В случае использования АГП для канала С, оператором (4.13) определяется факт обработки первого аудиоблока. Если выполняется обработка первого аудиоблока, то операторами (4.14)-(4.17) производится получение коэффициентов АГП для канала С, применение обратного вторичного преобразования или ОДКП-ΙΙ к коэффициентам АГП для получения коэффициентов обратного вторичного преобразования и сохранение коэффициентов обратного вторичного преобразования в буфере. Экспоненты и мантиссы спектральных коэффициентов МДКП, соответствующие обрабатываемому аудиоблоку К, получаются оператором (4.19).
Если же для канала С не используется АГП, то операторами (4.21) и (4.22) производится распаковка и получение экспонент и мантисс для канала С в блоке К, согласно вышеприведенному описанию для операторов программы (1.11) и (1.12).
Оператором (4.24) производится проверка использования 8РХ в канале С в текущем аудиоблоке. В случае использования 8РХ оператором (4.25), применяется обработка 8РХ к коэффициентам обратного вторичного преобразования для расширения полосы пропускания, получая, таким образом, спектральные коэффициенты МДКП канала С. Результатом этой процедуры являются спектральные компоненты канала С, поступающие на вход банка фильтров синтеза, применяемого оператором (4.27). Если обработка 8РХ для канала С не используется, то спектральные коэффициенты получаются непосредственно из коэффициентов обратного вторичного преобразования.
5. Объединение и адаптивное гибридное преобразование.
Объединение каналов и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов. Фактически, логическая процедура, описанная выше для спектрального расширения и обработки с использованием гибридного преобразования, может быть использована для обработки цифровых потоков, в которых используется объединение каналов и АГП, поскольку вышеописан- 12 024310 ные подробности обработки 8РХ применимы к обработке, выполняемой при объединении каналов.
Следующий фрагмент программы иллюстрирует один из возможных способов обработки аудиоблоков, содержащих объединение каналов и коэффициенты АГП:
(5.1) определить начало кадра в цифровом потоке 8, (5.2) для каждого кадра N в цифровом потоке 8, (5.3) произвести распаковку метаданных в кадре Ν, (5.4) получить параметры из распакованных метаданных кадра, (5.5) если присутствуют параметры объединения кадра, то распаковать параметры объединения кадра, (5.6) определить начало первого аудиоблока К в кадре Ν, (5.7) для аудиоблока К в кадре Ν, (5.8) произвести распаковку метаданных в блоке К, (5.9) получить параметры из распакованных метаданных блока, (5.10) если присутствуют параметры объединения блока, то распаковать параметры объединения блока, (5.11) для канала С в блоке К, (5.12) если для канала С использовано АГП, то, (5.13) если К=0, то, (5.14) произвести распаковку и декодирование экспонент, (5.15) произвести распаковку и деквантование мантисс, (5.16) применить обратное вторичное преобразование к экспонентам и мантиссам, (5.17) сохранить в буфере экспоненты и мантиссы обратного вторичного преобразования, (5.18) конец если, (5.19) получить из буфера экспоненты и мантиссы обратного вторичного преобразования для блока К, (5.20) в противном случае, (5.21) произвести распаковку и декодирование экспонент для канала С, (5.22) произвести распаковку и деквантование мантисс для канала С, (5.23) конец если, (5.24) если в канале С используется объединение, то, (5.25) если канал С является первым каналом, в котором используется объединение, то, (5.26) если для объединенного канала использовано АГП, то, (5.27) если К=0, то, (5.28) произвести распаковку и декодирование экспонент объединенного канала, (5.29) произвести распаковку и деквантование мантисс объединенного канала, (5.30) применить обратное вторичное преобразование к объединенному каналу, (5.31) сохранить экспоненты и мантиссы обратного вторичного преобразования для объединенного канала в буфере, (5.32) конец если, (5.33) получить экспоненты и мантиссы объединенного канала для блока К из буфера, (5.34) в противном случае, (5.35) произвести распаковку и декодирование экспонент объединенного канала, (5.36) произвести распаковку и деквантование мантисс объединенного канала, (5.37) конец если, (5.38) конец если, (5.39) получить объединяемый канал С из объединенного канала, (5.40) конец если, (5.41) применить фильтр синтеза к декодированным аудиоданным для канала С, (5.42) определить начало канала С+1 в блоке К, (5.43) конец цикла для, (5.44) определить начало блока К+1 в кадре Ν, (5.45) конец цикла для, (5.46) определить начало следующего кадра Ν+1 в цифровом потоке 8, (5.47) конец цикла для.
Оператором (5.5) производится получение параметров объединения каналов кадра из метаданных кадра в случае наличия таковых в этих метаданных. Оператором (5.10) производится получение параметров объединения каналов блока из метаданных блока в случае наличия таковых в метаданных блока. Если таковые присутствуют, для объединяемых каналов в блоке получают координаты объединения.
Оператором (5.12) определяется факт использования АГП для канала С. В случае использования АГП, оператор (5.13) определяет факт обработки первого аудиоблока. Если выполняется обработка первого аудиоблока, то операторами (5.14)-(5.17) производится получение коэффициентов АГП для канала С, применение обратного вторичного преобразования или ОДКП-ΙΙ к коэффициентам АГП для получе- 13 024310 ния коэффициентов обратного вторичного преобразования и сохранение коэффициентов обратного вторичного преобразования в буфере. Экспоненты и мантиссы коэффициентов обратного вторичного преобразования, соответствующие обрабатываемому аудиоблоку К, получаются оператором (5.19).
Если же для канала С не используется АГП, то операторами (5.21) и (5.22) производится распаковка и получение экспонент и мантисс для канала С в блоке К согласно вышеприведенному описанию для операторов программы (1.11) и (1.12).
Оператор (5.24) проверяет факт использования объединения каналов для канала С. В случае использования объединения каналов, оператор (5.25) проверяет, является ли канал С первым каналом в блоке, использующим объединение. Если канал С является первым каналом в блоке, использующим объединение, то экспоненты и мантиссы для объединенного канала получаются либо путем применения обратного вторичного преобразования к экспонентам и мантиссам объединенного канала, как представлено операторами (5.26)-(5.33), либо из данных цифрового потока, как представлено операторами (5.35) и (5.36). В цифровом потоке данные, представляющие мантиссы объединенного канала, находятся непосредственно после данных, представляющих мантиссы канала С. Получение объединяемого канала С из объединенного канала производится оператором (5.39) с учетом соответствующих координат объединения для канала С. Если для канала С не используется объединение каналов, то спектральные коэффициенты МДКП получаются непосредственно из коэффициентов обратного вторичного преобразования.
6. Спектральное расширение, объединение и адаптивное гибридное преобразование.
Спектральное расширение, объединение каналов и АГП могут быть использованы для получения кодированных данных для одних и тех же каналов.
Вышеописанные логические процедуры для комбинаций обработки АГП со спектральным расширением и гибридным преобразованием могут быть скомбинированы для обработки каналов, в которых используется любая комбинация этих трех средств кодирования, путем добавления дополнительной логической процедуры, необходимой для обработки восьми возможных ситуаций. Обработка, связанная с восстановлением каналов, выполняется до обработки δΡΧ.
Р. Реализация.
Устройства, использующие различные особенности настоящего изобретения, могут быть реализованы различными способами, в том числе в виде программного обеспечения, выполняемого компьютером или иным устройством, содержащим более специализированные компоненты, например схему с цифровым сигнальным процессором (ΌδΡ), соединенные с компонентами, подобными применяемым в компьютерах общего назначения. Фиг. 8 представляет схематическую функциональную диаграмму устройства 90, которое может быть использовано для реализации различных особенностей настоящего изобретения. Вычислительные ресурсы предоставляются процессором 92. ОЗУ 93 является оперативным запоминающим устройством (ОЗУ), которое процессор 92 использует для обработки информации. ПЗУ 94 представляет собой разновидность устройства постоянного хранения, например постоянное запоминающее устройство (ПЗУ) для хранения программ, необходимых для функционирования устройства 90, и, возможно, для реализации ряда особенностей настоящего изобретения. Блок управления вводом/выводом 95 представляет собой схему интерфейса для приема и передачи сигналов, используя каналы связи 1, 16. В показанном воплощении все основные компоненты системы соединены шиной 91, которая может представлять собой более, чем одну физическую или логическую шину; однако для реализации настоящего изобретения шинная архитектура не является обязательной.
В воплощениях, реализованных с использованием компьютерной системы общего назначения, могут содержаться дополнительные компоненты для сопряжения с такими устройствами, как клавиатура или устройство позиционирования мышь и монитор, и для управления устройством хранения данных, содержащим носитель для хранения данных, например магнитную ленту или диск, или оптический носитель. Такой носитель для хранения данных может быть использован для записи программ, представляющих собой команды операционной системы, служебные программы и приложения, и может содержать программы для реализации различных особенностей настоящего изобретения.
Функции, необходимые для практического осуществления различных особенностей настоящего изобретения, могут выполняться компонентами, реализованными разнообразными способами, в том числе с использованием дискретных логических компонентов, интегральных схем, одной или более специализированных интегральных схем (ΆδΙΟ) и/или процессоров с программным управлением. Для настоящего изобретения способ реализации этих компонентов значения не имеет.
Программные реализации настоящего изобретения могут передаваться с использованием различных машиночитаемых носителей, например каналов немодулированной и модулированной передачи данных в спектре от ультразвуковой до ультрафиолетовой области частот, или носителей запоминающих устройств, передающих информацию с использованием любой технологии записи, включая магнитную ленту, карты или диск, оптические карты или диск, и различимые маркировки на носителях, включая бумагу.

Claims (7)

    ФОРМУЛА ИЗОБРЕТЕНИЯ
  1. (1) определяют факт использования обработки с использованием адаптивного гибридного преобразования в процедуре кодирования для кодирования объединенного канала;
    (1) определяют факт использования обработки с использованием адаптивного гибридного преобразования в процедуре кодирования любой части кодированных аудиоданных для каждого соответствующего канала из двух или более каналов;
    1. Способ декодирования кадра кодированного цифрового аудиосигнала, согласно которому данный кадр содержит метаданные кадра, первый аудиоблок и один или больше последующих аудиоблоков;
    каждый из первого и последующих аудиоблоков содержит метаданные блока и кодированные аудиоданные для двух или более аудиоканалов, при этом кодированные аудиоданные содержат коэффициенты масштабирования и масштабированные значения, представляющие спектральный состав двух или больше аудиоканалов, причем каждое масштабированное значение связано с соответствующим коэффициентом масштабирования;
    метаданные блока содержат управляющую информацию, описывающую средства кодирования, используемые в процедуре кодирования, результатом которой являются вышеупомянутые кодированные аудиоданные, причем средства кодирования включают обработку с использованием адаптивного гибридного преобразования, включающую преобразование двух или больше аудиоканалов с помощью первичного преобразования для получения коэффициентов первичного преобразования, где первичное преобразование представляет собой модифицированное дискретное косинусное преобразование (МДКП);
    преобразование коэффициентов первичного преобразования по меньшей мере к двум или больше аудиоканалам с помощью вторичного преобразования для получения коэффициентов гибридного преобразования, где вторичное преобразование представляет собой дискретное косинусное преобразование второго типа (ДКП-11);
    при этом данный способ включает этапы, на которых:
    (A) получают кадр кодированного цифрового аудиосигнала;
    (B) анализируют кодированный цифровой аудиосигнал данного кадра для поблочного декодирования кодированных аудиоданных для каждого аудиоблока, при этом декодирование каждого соответствующего аудиоблока включает этапы, на которых:
  2. (2) в случае использования обработки с использованием адаптивного гибридного преобразования для кодирования объединенного канала:
    (а) если соответствующий аудиоблок является первым аудиоблоком в кадре:
    (ί) получают все коэффициенты гибридного преобразования, относящиеся к объединенному каналу в данном кадре, из кодированных аудиоданных в первом аудиоблоке;
    (ίί) преобразуют коэффициенты гибридного преобразования с помощью обратного вторичного преобразования для получения коэффициентов обратного вторичного преобразования, где обратное вторичное преобразование представляет собой обратное дискретное косинусное преобразование второго типа (ОДКП-11);
    (б) получают коэффициенты первичного преобразования из коэффициентов обратного вторичного преобразования для объединенного канала в соответствующем аудиоблоке;
    2. Способ по п.1, отличающийся тем, что кадр кодированного цифрового аудиосигнала соответствует синтаксису цифрового потока в формате Е-АС-3.
    (2) в случае использования в процедуре кодирования обработки с использованием адаптивного гибридного преобразования для соответствующего канала:
    (а) если соответствующий аудиоблок является первым аудиоблоком в кадре:
    (ί) получают все коэффициенты гибридного преобразования, относящиеся к соответствующему каналу для данного кадра, из кодированных аудиоданных в первом аудиоблоке;
    (ίί) преобразуют коэффициенты гибридного преобразования с помощью обратного вторичного преобразования для получения коэффициентов обратного вторичного преобразования, где обратное вторичное преобразование представляет собой обратное дискретное косинусное преобразование второго типа (ОДКП-11);
    (б) получают коэффициенты первичного преобразования из коэффициентов обратного вторичного преобразования для соответствующего канала в соответствующем аудиоблоке;
  3. (3) получают спектральные коэффициенты для объединенного канала путем декодирования кодированных данных в соответствующем аудиоблоке, если в процедуре кодирования для объединенного канала обработка с использованием адаптивного гибридного преобразования не использовалась;
    (B) получают коэффициенты первичного преобразования для соответствующего канала путем восстановления спектральных компонент для объединенного канала.
    3. Способ по п.2, отличающийся тем, что средства кодирования включают обработку с использованием спектрального расширения и процедура декодирования каждого соответствующего аудиоблока также включает этап, на котором синтезируют одну или более спектральных компонент из коэффициентов обратного вторичного преобразования для получения коэффициентов первичного преобразования с расширенной полосой пропускания.
    (3) получают коэффициенты первичного преобразования для соответствующего канала путем декодирования кодированных данных в соответствующем аудиоблоке, если в процедуре кодирования обработка с использованием адаптивного гибридного преобразования не использовалась для соответствующего канала;
    (C) преобразуют коэффициенты первичного преобразования с помощью обратного первичного преобразования для получения выходного сигнала, представляющего собой соответствующий канал в соответствующем аудиоблоке, где обратное первичное преобразование представляет собой обратное модифицированное дискретное косинусное преобразование (ОМДКП).
  4. 4. Способ по п.2 или 3, отличающийся тем, что средства кодирования включают обработку с использованием объединения каналов, а процедура декодирования каждого соответствующего аудиоблока также включает этапы, на которых определяют факт использования обработки с использованием объединения каналов в процедуре кодирования для кодирования любой части кодированных аудиоданных и получают спектральные компоненты из коэффициентов обратного вторичного преобразования с целью получения коэффициентов первичного преобразования для объединяемых каналов в случае использования обработки с использованием объединения каналов в процедуре кодирования.
    - 15 024310
  5. 5. Способ по п.2 или 3, отличающийся тем, что средства кодирования включают в себя обработку с использованием объединения каналов и процедура декодирования каждого соответствующего аудиоблока также включает этапы, на которых определяют факт использования обработки с использованием объединения каналов в процедуре кодирования для кодирования любой части кодированных аудиоданных; и в случае использования процедурой кодирования обработки с объединением каналов:
    (A) если соответствующий канал является первым каналом в кадре, использующим объединение, осуществляют этапы, на которых:
  6. 6. Устройство для декодирования кадра кодированного цифрового аудиосигнала, содержащее процессор, выполненный с возможностью осуществления всех этапов способа по любому из пп.1-5, оперативное запоминающее устройство (ОЗУ), которое процессор использует для обработки информации, постоянное запоминающее устройство (ПЗУ) для хранения программ, необходимых для функционирования устройства, и блок управления вводом/выводом для приема и передачи сигналов, причем указанные компоненты устройства соединены шиной.
  7. 7. Носитель запоминающего устройства с записанной на нем программой инструкций, которая может исполняться устройством для выполнения способа декодирования кадра кодированного цифрового аудиосигнала, причем данный способ включает в себя все этапы способа по любому из пп.1-5.
EA201270642A 2009-12-07 2010-10-28 Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования EA024310B1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26742209P 2009-12-07 2009-12-07
PCT/US2010/054480 WO2011071610A1 (en) 2009-12-07 2010-10-28 Decoding of multichannel aufio encoded bit streams using adaptive hybrid transformation

Publications (2)

Publication Number Publication Date
EA201270642A1 EA201270642A1 (ru) 2012-12-28
EA024310B1 true EA024310B1 (ru) 2016-09-30

Family

ID=43334376

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201270642A EA024310B1 (ru) 2009-12-07 2010-10-28 Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования

Country Status (37)

Country Link
US (2) US8891776B2 (ru)
EP (3) EP2801975B1 (ru)
JP (2) JP5547297B2 (ru)
KR (2) KR101370522B1 (ru)
CN (2) CN104217724B (ru)
AP (1) AP3301A (ru)
AR (1) AR079878A1 (ru)
AU (1) AU2010328635B2 (ru)
BR (1) BR112012013745B1 (ru)
CA (1) CA2779453C (ru)
CL (1) CL2012001493A1 (ru)
CO (1) CO6460719A2 (ru)
DK (1) DK2510515T3 (ru)
EA (1) EA024310B1 (ru)
EC (1) ECSP12012006A (ru)
ES (1) ES2463840T3 (ru)
GE (1) GEP20146081B (ru)
GT (1) GT201200134A (ru)
HK (1) HK1170058A1 (ru)
HN (1) HN2012000819A (ru)
HR (1) HRP20140400T1 (ru)
IL (1) IL219304A (ru)
MA (1) MA33775B1 (ru)
MX (1) MX2012005723A (ru)
MY (1) MY161012A (ru)
NI (1) NI201200063A (ru)
NZ (1) NZ599981A (ru)
PE (1) PE20130167A1 (ru)
PL (1) PL2510515T3 (ru)
PT (1) PT2510515E (ru)
RS (1) RS53288B (ru)
SI (1) SI2510515T1 (ru)
TN (1) TN2012000211A1 (ru)
TW (1) TWI498881B (ru)
UA (1) UA100353C2 (ru)
WO (1) WO2011071610A1 (ru)
ZA (1) ZA201203290B (ru)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US8948406B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium
US20120033819A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium
US9130596B2 (en) * 2011-06-29 2015-09-08 Seagate Technology Llc Multiuse data channel
EP2786377B1 (en) 2011-11-30 2016-03-02 Dolby International AB Chroma extraction from an audio codec
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
US9460729B2 (en) 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014126689A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
CA3211308A1 (en) * 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2014210284A1 (en) 2013-06-27 2014-12-31 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10095468B2 (en) 2013-09-12 2018-10-09 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
US10049683B2 (en) 2013-10-21 2018-08-14 Dolby International Ab Audio encoder and decoder
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN105280212A (zh) * 2014-07-25 2016-01-27 中兴通讯股份有限公司 混音播放方法及装置
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US9837086B2 (en) * 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10015612B2 (en) 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
ES2853936T3 (es) * 2017-01-10 2021-09-20 Fraunhofer Ges Forschung Decodificador de audio, codificador de audio, método para proporcionar una señal de audio decodificada, método para proporcionar una señal de audio codificada, flujo de audio, proveedor de flujos de audio y programa informático que utiliza un identificador de flujo
US10354667B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data
US10885921B2 (en) * 2017-07-07 2021-01-05 Qualcomm Incorporated Multi-stream audio coding
US10854209B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Multi-stream audio coding
US10657974B2 (en) * 2017-12-21 2020-05-19 Qualcomm Incorporated Priority information for higher order ambisonic audio data
CN113168839B (zh) * 2018-12-13 2024-01-23 杜比实验室特许公司 双端媒体智能
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN111711493B (zh) * 2020-06-16 2022-03-11 中国电子科技集团公司第三研究所 具有加密解密能力的水下通信设备及发射器和接收器

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US6356639B1 (en) * 1997-04-11 2002-03-12 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
JPH10340099A (ja) * 1997-04-11 1998-12-22 Matsushita Electric Ind Co Ltd オーディオデコーダ装置及び信号処理装置
US6246345B1 (en) 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CN1261663C (zh) 2002-12-31 2006-06-28 深圳市高科智能系统有限公司 无线集中控制门禁/门锁的方法及系统设备
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
KR101325802B1 (ko) * 2007-02-06 2013-11-05 엘지전자 주식회사 디지털 방송 송신기 및 디지털 방송 수신기와 그를 이용한디지털 방송 시스템 및 그 서비스 방법
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN101743586B (zh) * 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
CN101896967A (zh) * 2007-11-06 2010-11-24 诺基亚公司 编码器
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDERSEN, ROBERT L.; CROCKETT, BRETT G.; DAVIDSON, GRANT A.; DAVIS, MARK F.; FIELDER, LOUIS D.; TURNER, STEPHEN C.; VINTON, MARK S: "Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System", AES CONVENTION 117; OCTOBER 2004, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 6196, 1 October 2004 (2004-10-01), 60 East 42nd Street, Room 2520 New York 10165-2520, USA, XP040506945 *
ANONYMOUS: "A/52B, ATSC standard, Digital audio compression standard (AC-3, E-AC-3), revision B", NOT KNOWN, a_52b, 14 June 2005 (2005-06-14), XP030001573 *
SAKAMOTO H., SHIBUYA Y., TAKANO H., KITABATAKE O., TAMITANI I.: "A Dolby AC-3/MPEG1 audio decoder core suitable for audio/visual system integration", CUSTOM INTEGRATED CIRCUITS CONFERENCE, 1997., PROCEEDINGS OF THE IEEE 1997 SANTA CLARA, CA, USA 5-8 MAY 1997, NEW YORK, NY, USA,IEEE, US, 5 May 1997 (1997-05-05) - 8 May 1997 (1997-05-08), US, pages 241 - 244, XP010235299, ISBN: 978-0-7803-3669-8, DOI: 10.1109/CICC.1997.606621 *

Also Published As

Publication number Publication date
CN104217724B (zh) 2017-04-05
PL2510515T3 (pl) 2014-07-31
CA2779453C (en) 2015-12-22
PT2510515E (pt) 2014-05-23
CN102687198A (zh) 2012-09-19
IL219304A (en) 2015-05-31
IL219304A0 (en) 2012-06-28
EP2706529A2 (en) 2014-03-12
JP5547297B2 (ja) 2014-07-09
HRP20140400T1 (hr) 2014-06-06
US9620132B2 (en) 2017-04-11
MY161012A (en) 2017-03-31
CL2012001493A1 (es) 2012-10-19
SI2510515T1 (sl) 2014-06-30
UA100353C2 (ru) 2012-12-10
US20150030161A1 (en) 2015-01-29
EP2801975A1 (en) 2014-11-12
AU2010328635B2 (en) 2014-02-13
AP3301A (en) 2015-06-30
MA33775B1 (fr) 2012-11-01
HK1170058A1 (en) 2013-02-15
AP2012006289A0 (en) 2012-06-30
RS53288B (en) 2014-08-29
TN2012000211A1 (en) 2013-12-12
JP2014063187A (ja) 2014-04-10
CA2779453A1 (en) 2011-06-16
KR101629306B1 (ko) 2016-06-10
EP2510515B1 (en) 2014-03-19
US8891776B2 (en) 2014-11-18
EP2510515A1 (en) 2012-10-17
AU2010328635A1 (en) 2012-05-17
HN2012000819A (es) 2015-03-16
DK2510515T3 (da) 2014-05-19
PE20130167A1 (es) 2013-02-16
US20120243692A1 (en) 2012-09-27
BR112012013745B1 (pt) 2020-10-27
JP5607809B2 (ja) 2014-10-15
CO6460719A2 (es) 2012-06-15
TWI498881B (zh) 2015-09-01
EA201270642A1 (ru) 2012-12-28
WO2011071610A1 (en) 2011-06-16
NI201200063A (es) 2013-06-13
GT201200134A (es) 2013-08-29
JP2013511754A (ja) 2013-04-04
ZA201203290B (en) 2013-07-31
KR101370522B1 (ko) 2014-03-06
KR20120074305A (ko) 2012-07-05
MX2012005723A (es) 2012-06-13
CN102687198B (zh) 2014-09-24
KR20130116959A (ko) 2013-10-24
EP2801975B1 (en) 2017-01-04
ECSP12012006A (es) 2012-08-31
AR079878A1 (es) 2012-02-29
TW201126511A (en) 2011-08-01
ES2463840T3 (es) 2014-05-29
GEP20146081B (en) 2014-04-25
NZ599981A (en) 2014-07-25
CN104217724A (zh) 2014-12-17
BR112012013745A2 (pt) 2016-03-15
EP2706529A3 (en) 2014-04-02

Similar Documents

Publication Publication Date Title
EA024310B1 (ru) Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования
JP6808781B2 (ja) 信号をインタリーブするためのオーディオ復号器
TW200415922A (en) Conversion of synthesized spectral components for encoding and low-complexity transcoding
JP6181854B2 (ja) マルチチャネル・オーディオのハイブリッド・エンコード
KR102275129B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
TWI470622B (zh) 用於低頻效應頻道降低複雜度之轉換
DK2691951T3 (en) TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency
KR20240151254A (ko) 오디오 신호에 대한 고주파 재구성 기술의 하위 호환 통합

Legal Events

Date Code Title Description
MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): AM AZ KG TJ

QB4A Registration of a licence in a contracting state