RU2665887C1 - Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе - Google Patents

Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе Download PDF

Info

Publication number
RU2665887C1
RU2665887C1 RU2017131858A RU2017131858A RU2665887C1 RU 2665887 C1 RU2665887 C1 RU 2665887C1 RU 2017131858 A RU2017131858 A RU 2017131858A RU 2017131858 A RU2017131858 A RU 2017131858A RU 2665887 C1 RU2665887 C1 RU 2665887C1
Authority
RU
Russia
Prior art keywords
spectral band
copy
audio
metadata
bitstream
Prior art date
Application number
RU2017131858A
Other languages
English (en)
Inventor
Ларс ВИЛЛЕМОЕС
Хейко ПУРНХАГЕН
Пер ЭКСТРАНД
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Application granted granted Critical
Publication of RU2665887C1 publication Critical patent/RU2665887C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к средствам для декодирования битового аудиопотока с метаданными расширенного копирования спектральной полосы. Технический результат заключается в повышении эффективности декодирования. Принимают по меньшей мере один блок кодированного битового аудиопотока. Демультиплексируют часть по меньшей мере одного блока кодированного битового аудиопотока. Декодируют часть по меньшей мере одного блока кодированного битового аудиопотока. Причем по меньшей мере один блок кодированного битового аудиопотока включает в себя: заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора. Причем заполняющие данные включают в себя: по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока; и метаданные расширенного копирования спектральной полосы. 2 н. и 22 з.п. ф-лы, 7 ил., 3 табл.

Description

Область техники, к которой относится изобретение
Изобретение относится к обработке аудиосигналов. Некоторые варианты осуществления относятся к кодированию и декодированию битовых аудиопотоков (например, битовых потоков, имеющих формат MPEG-4 AAC), включающих в себя метаданные для управления расширенным копированием спектральной полосы (eSBR). Другие варианты осуществления относятся к декодированию таких битовых потоков посредством декодеров прежних версий, которые не выполнены с возможностью выполнения обработки eSBR, и которые игнорируют такие метаданные, или к декодированию битового аудиопотока, который не включает в себя такие метаданные, включающему в себя формирование управляющих данных eSBR в ответ на битовый поток.
Уровень техники
Обычно битовый аудиопоток включает в себя как аудиоданные (например, кодированные аудиоданные), указывающие один или более каналов аудиосодержимого, так и метаданные, указывающие по меньшей мере одну характеристику аудиоданных или аудиосодержимого. Одним известным форматом для формирования кодированного битового аудиопотока является формат усовершенствованного аудиокодирования MPEG-4 (MPEG-4 Advanced Audio Coding, AAC), описанный в стандарте ISO/IEC 14496-3:2009. В стандарте MPEG-4 аббревиатура AAC обозначает ʺadvanced audio coding (усовершенствованное аудиокодирование)ʺ, и аббревиатура HE-AAC обозначает ʺhigh-efficiency advanced audio coding (высокоэффективное усовершенствованное аудиокодирование)ʺ.
Стандарт MPEG-4 AAC определяет несколько аудиопрофилей, которые определяют, какие объекты и инструменты кодирования присутствуют в совместимом кодере или декодере. Три из этих аудиопрофилей представляют собой (1) профиль AAC, (2) профиль HE-AAC и (3) профиль HE-AAC v2. Профиль AAC включает в себя тип объекта AAC низкой сложности (или "AAC-LC"). Объект AAC-LC является аналогом профиля MPEG-2 AAC низкой сложности с некоторыми корректировками и не включает в себя ни тип объекта копирования спектральной полосы ("SBR"), ни тип объекта параметрического стерео ("PS"). Профиль HE-AAC является надмножеством профиля AAC и дополнительно включает в себя тип объекта SBR. Профиль HE-AAC v2 является надмножеством профиля HE-AAC и дополнительно включает в себя тип объекта PS.
Тип объекта SBR содержит инструмент копирования спектральной полосы, являющийся важным инструментом кодирования, который значительно повышает эффективность сжатия перцепционных аудиокодеков. SBR воссоздает высокочастотные компоненты аудиосигнала на стороне приемника (например, в декодере). Таким образом, кодер должен только закодировать и передать низкочастотные компоненты, что дает намного более высокое качество звука на низких скоростях передачи данных. SBR основан на копировании последовательностей гармоник, предварительно усеченной, чтобы сократить скорость передачи данных, из сигнала с ограниченной доступной шириной полосы и управляющих данных, полученных от кодера. Отношение между тональными и шумоподобными компонентами поддерживается посредством адаптивной обратной фильтрации, а также факультативным добавлением шума и синусоид. В стандарте MPEG-4 AAC инструмент SBR выполняет спектральную вставку, в которой несколько смежных поддиапазонов квадратурного зеркального фильтра (Quadrature Mirror Filter, QMF) копируются из переданной низкополосной части аудиосигнала в высокополосной участок аудиосигнала, который формируется в декодере.
Спектральная вставка может не являться идеальной для некоторых типов звука, например, для музыки с относительно низким переходом по частотам. Таким образом, необходимы методики для улучшения копирования спектральной полосы.
Раскрытие изобретения
Первый класс вариантов осуществления относится к блокам обработки аудиоданных, которые включают в себя память, блок удаления форматирования полезной нагрузки битового потока и подсистему декодирования. Память выполнена с возможностью хранения по меньшей мере одного блока кодированного битового аудиопотока (например, битового потока MPEG-4 AAC). Блок удаления форматирования полезной нагрузки битового потока выполнен с возможностью демультиплексирования кодированного аудиоблока. Подсистема декодирования выполнена с возможностью декодирования аудиосодержимого кодированного аудиоблока. Кодированный аудиоблок включает в себя заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора. Заполняющие данные включают в себя по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR) для аудиосодержимого кодированного аудиоблока.
Второй класс вариантов осуществления относится к способам декодирования кодированного битового аудиопотока. Способ включает в себя прием по меньшей мере одного блока кодированного битового аудиопотока, демультиплексирование по меньшей мере некоторых частей по меньшей мере одного блока кодированного битового аудиопотока и декодирование по меньшей мере некоторых частей по меньшей мере одного блока кодированного битового аудиопотока. По меньшей мере один блок кодированного битового аудиопотока включает в себя заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора. Заполняющие данные включают в себя по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR) для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока.
Другие классы вариантов осуществления относятся к кодированию и транскодированию битовых аудиопотоков, содержащих метаданные, идентифицирующие, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR).
Краткое описание чертежей
Фиг. 1 - блок-схема варианта осуществления системы, которая может быть выполнена с возможностью выполнения варианта осуществления способа изобретения.
Фиг. 2 - блок-схема кодера, который является вариантом осуществления блока обработки аудиоданных изобретения.
Фиг. 3 - блок-схема системы, включающей в себя декодер, который является вариантом осуществления блока обработки аудиоданных изобретения, и при необходимости также постпроцессор, соединенный с ним.
Фиг. 4 - блок-схема декодера, который является вариантом осуществления блока обработки аудиоданных изобретения.
Фиг. 5 - блок-схема декодера, который является другим вариантом осуществления блока обработки аудиоданных изобретения.
Фиг. 6 - блок-схемой другого варианта осуществления блока обработки аудиоданных изобретения.
Фиг. 7 - схема блока битового потока MPEG-4 AAC, включающего в себя сегменты, на которые он разделен.
Обозначения и терминология
В этом раскрытии, в том числе в формуле изобретения, выражение «выполнять операцию над» сигналом или данными (например, фильтрацию, масштабирование, преобразование сигнала или данных, или применение коэффициента усиления к сигналу или данным) используется в широком смысле для обозначения выполнения операции непосредственно над сигналом или данными, или над обработанной версией сигнала или данных (например, над версией сигнала, который подвергся предварительной фильтрации или предварительной обработке до выполнения дальнейшей операции).
В этом раскрытии, в том числе в формуле изобретения, выражение «блок обработки аудиоданных» используется в широком смысле для обозначения системы или устройства, выполненных с возможностью обработки аудиоданных. Примеры блоков обработки аудиоданных включают в себя, но без ограничения, кодеры (например, транскодеры), декодеры, кодер-декодеры, системы предварительной обработки, системы последующей обработке и системы обработки битового потока (иногда называемые инструментами обработки битового потока). Фактически вся бытовая электроника, такая как мобильные телефоны, телевизоры, ноутбуки и планшетные компьютеры, содержит блок обработки аудиоданных.
В этом раскрытии, в том числе в формуле изобретения, термин «соединяет» или «соединенный» используется в широком смысле для обозначения либо прямого, либо опосредованного соединения. Таким образом, если первое устройство соединяется со вторым устройством, то соединение может быть через прямое соединение, или через косвенное соединение через другие устройства и соединения. Кроме того, компоненты, которые интегрированы в другие компоненты или с другими компонентами, также соединены друг с другом.
Осуществление изобретения
Стандарт MPEG-4 AAC предполагает, что кодированный битовый поток MPEG-4 AAC включает в себя метаданные, указывающие каждый тип обработки SBR, которая должна быть применена (если должна быть применена) декодером, чтобы декодировать аудиосодержимое битового потока, и/или которые управляют такой обработкой SBR, и/или указывающие по меньшей мере одну характеристику или параметр по меньшей мере одного инструмента SBR, который должен использоваться, чтобы декодировать аудиосодержимое битового потока. В настоящем документе мы используем выражение ʺметаданные SBRʺ для обозначения метаданных этого типа, которые описаны или упомянуты в стандарте MPEG-4 AAC.
Верхний уровень битового потока MPEG-4 AAC является последовательностью блоков данных (элементов "raw_data_block"), каждый из которых является сегментом данных (в настоящем документе называемым «блоком»), который содержит аудиоданные (как правило, для периода времени из 1024 или 960 отсчетов) и соответствующую информацию и/или другие данные. В настоящем документе мы используем термин «блок» для обозначения сегмента битового потока MPEG-4 AAC, содержащего аудиоданные (и соответствующие метаданные, и при необходимости также другие соответствующие данные), которые определяют или являются показателем одного (но не более чем одного) элемента "raw_data_block".
Каждый блок битового потока MPEG-4 AAC может включать в себя несколько синтаксических элементов (каждый из которых также осуществлен в битовом потоке как сегмент данных). Семь типов таких синтаксических элементов определены в стандарте MPEG-4 AAC. Каждый синтаксический элемент идентифицируется различным значением элемента данных "id_syn_ele". Примеры синтаксических элементов включают в себя ʺsingle_channel_element()ʺ, ʺchannel_pair_element()ʺ и ʺfill_element()ʺ. Элемент одиночного канала является контейнером, включающим в себя аудиоданные одного аудиоканала (монофонический аудиосигнал). Элемент пары каналов включает в себя аудиоданные двух аудиоканалов (то есть стереофонический аудиосигнал).
Заполняющий элемент является контейнером информации, включающим в себя идентификатор (например, значение упомянутого выше элемента "id_syn_ele"), за которым следуют данные, которые упоминаются как "заполняющие данные". Заполняющие элементы исторически использовались для корректировки текущей скорости передачи данных битовых потоков, которые должны передаваться по каналу с постоянной скоростью. Посредством добавления подходящего количества заполняющих данных к каждому блоку может быть достигнута постоянная скорость передачи данных.
В соответствии с вариантами осуществления изобретения заполняющие данные могут включать в себя одну или более добавочных полезных нагрузок, которые расширяют тип данных (например, метаданных), которые могут быть переданы в битовом потоке. Декодер, который принимает битовые потоки с заполняющими данными, содержащими новый тип данных, может при необходимости использоваться устройством, принимающим битовый поток (например, декодером), чтобы расширить функциональность устройства. Таким образом, как может оценить специалист в области техники, заполняющие элементы являются специальным типом структуры данных и отличаются от структур данных, обычно используемых для передачи аудиоданных (например, полезной нагрузки аудиоданных, содержащей данные канала).
В некоторых вариантах осуществления изобретения идентификатор, используемый для идентификации заполняющего элемента, может состоять из трехбитного целого без знака, у которого сначала передается старший значащий бит ("uimsbf"), имеющего значение 0×6. В одном блоке могут встречаться несколько экземпляров синтаксического элемента одинакового типа (например, несколько заполняющих элементов).
Другим стандартом для кодирования битовых аудиопотоков является стандарт унифицированного кодирования речи и звука MPEG (MPEG Unified Speech and Audio Coding, USAC) (ISO/IEC 23003-3:2012). Стандарт MPEG USAC описывает кодирование и декодирование аудиосодержимого с использованием обработки копирования спектральной полосы (в том числе обработка SBR, как описано в стандарте MPEG-4 AAC, а также в том числе другие расширенные формы обработки копирования спектральной полосы). Эта обработка применяет инструменты копирования спектральной полосы (иногда упоминаемые в настоящем документе как «ʺинструменты расширенного SBR» или «инструменты eSBR») расширенной и усовершенствованной версии набора инструментов SBR, описанных в стандарте MPEG-4 AAC. Таким образом, eSBR (как определено в стандарте USAC) представляет собой улучшение SBR (как определено в стандарте MPEG-4 AAC).
В настоящем документе мы используем выражение ʺобработка расширенного SBRʺ (или ʺобработка eSBRʺ) для обозначения обработки копирования спектральной полосы с использованием по меньшей мере одного инструмента eSBR (например, по меньшей мере одного инструмента eSBR, который описан или упомянут в стандарте MPEG USAC), который не описан и не упомянут в стандарте MPEG-4 AAC. Примерами таких инструментов eSBR являются гармоническая транспозиция, дополнительная предварительная обработка QMF-вставки, или «предварительное сглаживание», и формирование временной огибающей (Temporal Envelope Shaping) отсчетов между поддиапазонами, или «интер-TES».
Битовый поток, сформированный в соответствии со стандартом MPEG USAC (иногда упоминаемый в настоящем документе как ʺбитовый поток USACʺ), включает в себя кодированное аудиосодержимое и обычно включает в себя метаданные, указывающие каждый тип обработки копирования спектральной полосы, которая должна быть применена декодером, чтобы декодировать аудиосодержимое битового потока USAC, и/или метаданные, которые управляют такой обработкой копирования спектральной полосы, и/или указывающие по меньшей мере одну характеристику или параметр по меньшей мере одного инструмента SBR и/или инструмента eSBR, который должен использоваться, чтобы декодировать аудиосодержимое битового потока USAC.
В настоящем документе мы используем выражение ʺметаданные расширенного SBRʺ (или «метаданные eSBR») для обозначения метаданных, указывающих каждый тип обработки копирования спектральной полосы, которая должна быть применена декодером, чтобы декодировать аудиосодержимое кодированного битового аудиопотока (например, битового потока USAC), и/или которые управляют такой обработкой копирования спектральной полосы, и/или указывающие по меньшей мере одну характеристики или параметр по меньшей мере одного инструмента SBR и/или инструмента eSBR, который должен использоваться, чтобы декодировать такое аудиосодержимое, но который не описан и не упомянут в стандарте MPEG-4 AAC. Примером метаданных eSBR являются метаданные (указывающие обработку копирования спектральной полосы или управляющие ей), которые описаны или упомянуты в стандарте MPEG USAC, но не в стандарте MPEG-4 AAC. Таким образом, метаданные eSBR в настоящем документе обозначают метаданные, которые не являются метаданными SBR, и метаданные SBR в настоящем документе обозначают метаданные, которые не являются метаданными eSBR.
Битовый поток USAC может включать в себя и метаданные SBR, и метаданные eSBR. Более конкретно, битовый поток USAC может включать в себя метаданные eSBR, которые управляют функционированием обработки eSBR посредством декодера, и метаданные SBR, которые управляют функционированием обработки SBR посредством декодера. В соответствии с типичными вариантами осуществления настоящего изобретения метаданные eSBR (например, специфичные для eSBR данные конфигурации) включены (в соответствии с настоящим изобретением) в битовый поток MPEG-4 AAC (например, в контейнер sbr_extension() в конце полезной нагрузки SBR).
Функционирование обработки eSBR во время декодирования кодированного битового потока с использованием множества инструментов eSBR (содержащих по меньшей мере один инструмент eSBR) посредством декодера восстанавливает высокочастотную полосу аудиосигнала на основе копирования последовательностей гармоник, которые были отсечены во время кодирования. Такая обработка eSBR обычно корректирует огибающую спектра сформированной высокочастотной полосы и применяет обратную фильтрацию и добавляет шумовые и синусоидальные компоненты, чтобы воссоздать спектральные характеристики первоначального аудиосигнала.
В соответствии с типичными вариантами осуществления изобретения метаданные eSBR включены (например, включено небольшое количество управляющих битов, которые являются метаданными eSBR) в один или более сегментов метаданных кодированного битового аудиопотока (например, битового потока MPEG-4 AAC), который также включает кодированные аудиоданные в другие сегменты (сегменты аудиоданных). Как правило, по меньшей мере один такой сегмент метаданных каждого блока битового потока представляет собой (или включает в себя) заполняющий элемент (включающий в себя идентификатор, указывающий начало заполняющего элемента), и метаданные eSBR включены в заполняющий элемент после идентификатора.
Фиг. 1 является блок-схемой иллюстративной последовательности обработки аудиосигналов (системы обработки аудиоданных), в которой один или более элементов системы могут конфигурированы в соответствии с вариантом осуществления настоящего изобретения. Система включает в себя следующие элементы, соединенные вместе, как показано: кодер 1, подсистему 2 передачи, декодер 3 и блок 4 последующей обработки. В вариациях показанной системы один или более элементов опущены, или включены дополнительные блоки обработки аудиоданных.
В некоторых реализациях кодер 1 (который при необходимости включает в себя блок предварительной обработки) выполнен с возможностью приёма отсчетов PCM (во временной области), содержащие аудиосодержимое, в качестве входной информации и выдавать кодированный битовый аудиопоток (имеющий формат, который совместим со стандартом MPEG-4 AAC), указывающий аудиосодержимое. Данные битового потока, указывающие аудиосодержимого, иногда упоминаются в настоящем документе как «аудиоданные» или «кодированные аудиоданные». Если кодер выполнен в соответствии с типичным вариантом осуществления настоящего изобретения, вывод битового аудиопотока из кодера включает в себя метаданные eSBR (и, как правило, также другие метаданные), а также аудиоданные.
Один или более кодированный битовый аудиопоток, выданный из кодера 1, может помещен в подсистему 2 передачи кодированного аудио. Подсистема 2 выполнена с возможностью сохранения и/или передачи каждого кодированного битового потока, выданного из кодера 1. Кодированный битовый аудиопоток, выданный из кодера 1, может быть сохранен подсистемой 2 (например, в форме диска DVD или Blu-ray) или передан подсистемой 2 (которая может реализовать линию передачи или сеть), или может быть и сохранен, и передан подсистемой 2.
Декодер 3 выполнен с возможностью декодирования кодированного битового аудиопотока MPEG-4 AAC (сформированного кодером 1), который он принимает через подсистему 2. В некоторых вариантах осуществления декодер 3 выполнен с возможностью извлечения метаданных eSBR из каждого блока битового потока и декодирования битового потока (в том числе посредством выполнения обработки eSBR с использованием извлеченных метаданных eSBR), чтобы сформировать декодированные аудиоданные (например, потоки декодированных отсчетов аудиоданных PCM). В некоторых вариантах осуществления декодер 3 выполнен с возможностью извлечения метаданных SBR из битового потока (но игнорирования метаданных eSBR, включенных в битовый поток) и декодирования битового потока (в том числе посредством выполнения обработки SBR с использованием извлеченных метаданных SBR), чтобы сформировать декодированные аудиоданные (например, потоки декодированных отсчетов аудиоданных PCM). Как правило, декодер 3 включает в себя буфер, который хранит (например, постоянным образом) сегменты кодированного битового аудиопотока, принятого от подсистемы 2.
Блок 4 последующей обработки на фиг. 1 выполнен с возможностью приёма потока декодированных аудиоданных от декодера 3 (например, декодированных отсчетов аудиоданных PCM) и выполнения их последующей обработки. Блок последующей обработки также может быть выполнен с возможностью рендеринга подвергнутого последующей обработке аудиосодержимого (или декодированных аудиоданных, принятых от декодера 3) для воспроизведения посредством одного или более динамиков.
Фиг. 2 является блок-схемой кодера (100), который является вариантом осуществления блока обработки аудиоданных изобретения. Любой из компонентов или элементов кодера 100 может быть реализован как один или более процессов и/или одна или более схем (например, специализированных интегральных схем (ASIC), программируемых пользователем вентильных матриц (FPGA) или других интегральных схем), в аппаратных средствах, в программном обеспечении или в комбинации аппаратных средств и программного обеспечения. Кодер 100 включает в себя кодер 105, модуль 107 форматирования, модуль 106 формирования метаданных и буферную память 109, соединенные, как показано. Как правило, также кодер 100 включает в себя другие элементы обработки (не показаны). Кодер 100 выполненным с возможностью преобразования входного битового аудиопотока в выходной кодированный битовый поток MPEG-4 AAC.
Генератор 106 метаданных соединен и выполнен с возможностью формирования (и/или пропуска в модуль 107) метаданных (включающих в себя метаданные eSBR и метаданные SBR), которые должны быть включены посредством модуля 107 в кодированный битовый поток, который должен быть выдан из кодера 100.
Кодер 105 соединен и выполнен с возможностью кодирования (например, посредством выполнения сжатия) входных аудиоданных и помещения полученных кодированных аудиоданных в модуль 107 для включения в кодированный битовый поток, который должен быть выдан из модуля 107.
Модуль 107 выполнен с возможностью мультиплексирования кодированных аудиоданных из кодера 105 и метаданных (включающих в себя метаданные eSBR и метаданные SBR) из генератора 106, чтобы сформировать кодированный битовый поток, который должен быть выдан из модуля 107, предпочтительно таким образом, чтобы кодированный битовый поток имел формат, определенный одним из вариантов осуществления настоящего изобретения.
Буферная память 109 выполнена с возможностью хранения (например, постоянным образом) по меньшей мере одного блока кодированного битового аудиопотока, выданного из модуля 107, и последовательность блоков кодированного битового аудиопотока затем перемещается из буферной памяти 109 как вывод из кодера 100 в систему передачи.
Фиг. 3 является блок-схемой системы, включающей в себя декодер (200), который является вариантом осуществления блока обработки аудиоданных, и при необходимости также постпроцессор (300), соединенный с ним. Любой из компонентов или элементов декодера 200 и постпроцессора 300 может быть реализован как один или более процессов и/или одна или более схем (например, специализированных интегральных схем (ASIC), программируемых пользователем вентильных матриц (FPGA) или других интегральных схем), в аппаратных средствах, в программном обеспечении или в комбинации аппаратных средств и программного обеспечения. Декодер 200 содержит буферную память 201, блок 205 удаления форматирования (синтаксического разбора) полезной нагрузки битового потока, подсистему 202 аудиодекодирования (иногда называемую «базовым» модулем декодирования или «базовой» подсистемой декодирования), модуль 203 обработки eSBR и модуль 204 формирования управляющих битов, соединенные, как показано. Как правило, декодер 200 также включает в себя другие элементы обработки (не показаны).
Буферная память (буфер) 201 хранит (например, постоянным образом) по меньшей мере один блок кодированного битового аудиопотока, принятого декодером 200. При работе декодера 200, последовательность блоков битового потока перемещается из буфера 201 в блок 205 удаления форматирования.
В вариациях вариантов осуществления на фиг. 3 (или вариантов осуществления на фиг. 4, которые будут описаны), блок APU, который не является декодером (например, блок 500 APU на фиг. 6) включает в себя буферную память (например, буферную память, идентичную буферу 201), которая хранит (например, постоянным образом) по меньшей мере один блок кодированного битового аудиопотока (например, битового аудиопотока MPEG-4 AAC) такого же типа, принятого буфером 201 на фиг. 3 или фиг. 4 (т.е. кодированный битовый аудиопоток, который включает в себя метаданные eSBR).
Снова со ссылкой на фиг. 3, блок 205 удаления форматирования соединен и выполнен с возможностью демультиплексирования каждого блока битового потока, чтобы извлечь оттуда метаданные SBR (включающие в себя квантованные данные огибающей) и метаданные eSBR (и, как правило, также другие метаданные), помещать по меньшей мере метаданные eSBR и метаданные SBR в модуль 203 обработки eSBR и, как правило, также помещать другие извлеченные метаданные в подсистему 202 декодирования (и при необходимости также в генератор 204 управляющих битов). Блок 205 удаления форматирования также соединен и выполнен с возможностью извлечения аудиоданных из каждого блока битового потока и помещения извлеченных аудиоданных в подсистему 202 декодирования (модуль декодирования).
Система на фиг. 3 при необходимости также включает в себя постпроцессор 300. Постпроцессор 300 включает в себя буферную память (буфер) 301 и другие элементы обработки (не показаны), включающие в себя по меньшей мере один элемент обработки, соединенный с буфером 301. Буфер 301 хранит (например, постоянным образом) по меньшей мере один блок (или кадр) декодированных аудиоданных, принятых постпроцессором 300 от декодера 200. Элементы обработки постпроцессора 300 соединены и выполнены с возможностью приёма и адаптивной обработки последовательности блоков (или кадров) декодированной аудиоданных, выданной из буфера 301, с использованием метаданных, выданных из подсистемы декодирования 202 (и/или блока 205 удаления форматирования), и/или управляющих битов, выданных из модуля 204 декодера 200.
Подсистема 202 аудиодекодирования декодера 200 выполнена с возможностью декодирования аудиоданных, извлеченных блоком 205 синтаксического разбора (такое декодирование может упоминаться как «базовая» операция декодирования), чтобы сформировать декодированные аудиоданные, и помещать декодированные аудиоданные в модуль 203 обработки eSBR. Декодирование выполняется в частотной области и, как правило, включает в себя обратное квантование, за которым следует спектральная обработка. Как правило, заключительный этап обработки в подсистеме 202 применяет преобразование из частотной области во временную область к декодированным аудиоданным частотной области, таким образом, выводом подсистемы являются декодированные аудиоданные во временной области. Модуль 203 выполнен с возможностью применения инструментов SBR и инструментов eSBR, указанных посредством метаданных SBR и метаданных eSBR (извлеченных блоком 205 синтаксического разбора) к декодированным аудиоданным (т.е. выполнять обработку SBR и обработку eSBR на выходе подсистемы 202 декодирования с использованием метаданных SBR и метаданных eSBR), чтобы сформировать полностью декодированные аудиоданные, которые выдаются (например, постпроцессору 300) из декодера 200. Как правило, декодер 200 включает в себя память (доступную для подсистемы 202 и модуля 203), которая хранит подвергнутые удалению форматирования аудиоданные и метаданные, выданные из блока 205 удаления форматирования, и модуль 203 выполнен с возможностью осуществления доступа к аудиоданным и метаданным (включающим в себя метаданные SBR и метаданные eSBR) по мере необходимости во время обработки SBR и обработки eSBR. Обработка SBR и обработка eSBR в модуле 203 могут рассматриваться как последующая обработка на выходе основной подсистемы 202 декодирования. При необходимости декодер 200 также включает в себя подсистему финального повышающего микширования (которая может применить инструменты параметрического стерео ("PS"), определенные в стандарте MPEG-4 AAC, с использованием метаданных PS, извлеченных блоком 205 удаления форматирования, и/или управляющих битов, сформированных в подсистеме 204), которая соединена и выполнена с возможностью выполнения повышающего микширования на выходе модуля 203, чтобы сформировать полностью декодированную, подвергнутую повышающему микшированию аудиоданных, которые выдается из декодера 200. В качестве альтернативы постпроцессор 300 выполнен с возможностью выполнения повышающего микширования на выходе декодера 200 (например, с использованием метаданных PS, извлеченных блоком 205 удаления форматирования, и/или управляющих битов, сформированных в подсистеме 204).
В ответ на метаданные, извлеченные блоком 205 удаления форматирования, генератор 204 управляющих битов может сформировать управляющие данные, и управляющие данные могут быть использованы в декодере 200 (например, в системе финального повышающего микширования) и/или размещены как вывод декодера 200 (например, в постпроцессоре 300 для использования при последующей обработке). В ответ на метаданные, извлеченные из входного битового потока (и при необходимости также в ответ на управляющие данные), модуль 204 может сформировать (и поместить в постпроцессор 300), управляющие биты, указывающие, что декодированные аудиоданные, выданные из модуля 203 обработки eSBR, должен быть подвергнуты определенному типу последующей обработки. В некоторых реализациях декодер 200 выполнен с возможностью помещения метаданных, извлеченных блоком 205 удаления форматирования из входного битового потока, в постпроцессор 300, и постпроцессор 300 выполнен с возможностью выполнения последующей обработки декодированных аудиоданных, выданных из декодера 200, с использованием метаданных.
Фиг. 4 является блок-схемой блока (210) обработки аудиоданных ("APU"), который является другим вариантом осуществления блока обработки аудиоданных изобретения. Блок 210 APU является декодером прежних версий, который не выполнен с возможностью выполнения обработки eSBR. Любой из компонентов или элементов APU 210 может быть реализован как один или более процессов и/или одна или более схем (например, специализированных интегральных схем (ASIC), программируемых пользователем вентильных матриц (FPGA) или других интегральных схем), в аппаратных средствах, в программном обеспечении или в комбинации аппаратных средств и программного обеспечения. Блок 210 APU содержит буферную память 201, блок 215 удаления форматирования (блок синтаксического разбора) полезной нагрузки битового потока, подсистему 202 аудиодекодирования (иногда называемую «базовым» модулем декодирования или «базовой» подсистемой декодирования), и модуль 213 обработки SBR, соединенные, как показано. Как правило, Блок 210 APU также включает в себя другие элементы обработки (не показаны).
Элементы 201 и 202 блока 210 APU идентичны идентично пронумерованным элементам декодера 200 (фиг. 3), и их приведенное выше описание не будет повторяться. При работе блока 210 APU последовательность блоков кодированного битового аудиопотока (битовый поток MPEG-4 AAC), принятого блоком 210 APU, перемещается из буфера 201 в блок 215 удаления форматирования.
Блок 215 удаления форматирования соединен и выполнен с возможностью демультиплексирования каждого блока битового потока, чтобы извлечь оттуда метаданные SBR (включающие в себя квантованные данные огибающей), и, как правило, также другие метаданные, но игнорирования метаданных eSBR, которые могут быть включены в битовый поток, в соответствии с любым вариантом осуществления настоящего изобретения. Блок 215 удаления форматирования выполнен с возможностью помещения по меньшей мере метаданных SBR в модуль 213 обработки SBR. Блок 215 удаления форматирования также соединен и выполнен с возможностью извлечения аудиоданных из каждого блока битового потока и помещения извлеченных аудиоданных в подсистему 202 декодирования (модуль декодирования).
Подсистема 202 аудиодекодирования декодера 200 выполнена с возможностью декодирования аудиоданных, извлеченных блоком 215 удаления форматирования (такое декодирование может упоминаться как «базовая» операция декодирования), чтобы сформировать декодированные аудиоданные, и помещения декодированных аудиоданных в модуль 213 обработки SBR. Декодирование выполняется в частотной области. Как правило, заключительный этап обработки в подсистеме 202 применяет преобразование из частотной области во временную область к декодированным аудиоданным частотной области, таким образом, выводом подсистемы являются декодированные аудиоданные во временной области. Модуль 213 выполнен с возможностью применения инструментов SBR (но не инструментов eSBR), указанных посредством метаданных SBR (извлеченных блоком 215 удаления форматирования) к декодированным аудиоданным (т.е. выполнения обработки SBR на выходе подсистемы 202 декодирования с использованием метаданных SBR), чтобы сформировать полностью декодированные аудиоданные, которые выдаются (например, постпроцессору 300) из блока 210 APU. Как правило, Блок 210 APU включает в себя память (доступную для подсистемы 202 и модуля 213), которая хранит подвергнутые удалению форматирования аудиоданные и метаданные, выданные из блока 215 удаления форматирования, и модуль 213 выполнен с возможностью осуществления доступа к аудиоданным и метаданным (включающим в себя метаданные SBR) по мере необходимости во время обработки SBR. Обработка SBR в модуле 213 может рассматриваться как последующая обработка на выходе основной подсистемы 202 декодирования. При необходимости блок 210 APU также включает в себя подсистему финального повышающего микширования (которая может применить инструменты параметрического стерео ("PS"), определенные в стандарте MPEG-4 AAC, с использованием метаданных PS, извлеченных блоком 215 удаления форматирования), который соединен и выполнен с возможностью выполнения повышающего микширования на выходе модуля 213, чтобы сформировать полностью декодированную, подвергнутую повышающему микшированию аудиоданные, которые выдаются из блока 210 APU. В качестве альтернативы постпроцессор выполнен с возможностью выполнения повышающего микширования на выходе блока 210 APU (например, с использованием метаданных PS, извлеченных блоком 215 удаления форматирования и/или управляющих битов, сформированных в блоке 210 APU).
Различные реализации кодера 100, декодера 200 и блока 210 APU выполнены с возможностью выполнения различных вариантов осуществления способа согласно изобретению.
В соответствии с некоторыми вариантами осуществления метаданные eSBR (например, включено небольшое количество управляющих битов, которые являются метаданными eSBR) включены в кодированный битовый аудиопоток (например, битовый поток MPEG-4 AAC), в результате чего декодеры прежних версий (которые не выполнены с возможностью анализа метаданных eSBR или использования какого-либо инструмента eSBR, к которому относятся метаданные eSBR), может проигнорировать метаданные eSBR, но тем не менее декодировать битовый поток по мере возможности без использования метаданных eSBR или какого-либо инструмента eSBR, к которому относятся метаданные eSBR, как правило, без каких-либо значительных потерь качества декодированного звука. Однако декодеры eSBR, выполненные с возможностью анализа битового потока, чтобы идентифицировать метаданные eSBR и использовать по меньшей мере один инструмент eSBR в ответ на метаданные eSBR, будут обладать преимуществами использования по меньшей мере одного такого инструмента eSBR. Таким образом, варианты осуществления изобретения обеспечивают средство для эффективной передачи управляющих данных или метаданных расширенного копирования спектральной полосы (eSBR) с соблюдением обратной совместимости.
Как правило, метаданные eSBR в битовом потоке указывают (например, указывают по меньшей мере одну характеристику или параметр) один или более из следующих инструментов eSBR (которые описаны в стандарте MPEG USAC, и которые могут быть применены или не применены кодером во время формирования битового потока):
- гармоническая транспозиция;
- дополнительная предварительная обработка QMF-вставки (предварительное сглаживание); и
- формирование временной огибающей отсчетов между поддиапазонами, или «интер-TES».
Например, метаданные eSBR, включенные в битовый поток, могут указывать значения параметров (описанные в стандарте MPEG USAC и в настоящем раскрытии): harmonicSBR[ch], sbrPatchingMode[ch], sbrOversamplingFlag[ch], sbrPitchInBins[ch], sbrPitchInBins[ch], bs_interTes, bs_temp_shape[ch][env], bs_inter_temp_shape_mode[ch][env] и bs_sbr_preprocessing.
Здесь обозначение X[ch], где X - некоторый параметр, обозначает, что параметр относится к каналу ("ch") аудиосодержимого кодированного битового потока, который должен быть декодирован. Для простоты мы иногда опускаем выражение [ch] и предполагаем, что релевантный параметр относится к каналу аудиосодержимого.
Здесь обозначение X[ch][env], где X - некоторый параметр, обозначает, что параметр относится к огибающей SBR (ʺenvʺ) канала ("ch") аудиосодержимого кодированного битового потока, который должен быть декодирован. Для простоты мы иногда опускаем выражения [env] и [ch] и предполагаем, что релевантный параметр относится к огибающей SBR канала аудиосодержимого.
Как отмечено, стандарт MPEG USAC предполагает, что битовый поток USAC включает в себя метаданные eSBR, которые управляют функционированием обработки eSBR посредством декодера. Метаданные eSBR включают в себя следующие однобитные параметры метаданных: harmonicSBR; bs_interTES и bs_pvc.
Параметр "harmonicSBR" указывает использование гармонической вставки (гармонической транспозиции) для SBR. Более конкретно, harmonicSBR=0 указывает не гармоническую спектральную вставку, как описано в разделе 4.6.18.6.3 стандарта MPEG-4 AAC; и harmonicSBR=1 указывает гармоническую вставку SBR (типа, используемого в eSBR, как описано в разделе 7.5.3 или 7.5.4 стандарта MPEG USAC). Гармоническая вставка SBR не используется в соответствии с копированием спектральной полосы, не являющемся eSBR (т.е. SBR, а не eSBR). В этом раскрытии спектральная вставка упоминается как базовая форма копирования спектральной полосы, тогда как гармоническая транспозиция упоминается как расширенная форма копирования спектральной полосы.
Значение параметра "bs_interTES" указывает использование инструмента интер-TES eSBR.
Значение параметра "bs_pvc" указывает использование инструмента PVC eSBR.
Во время декодирования кодированного битового потока функционированием гармонической транспозиции во время этапа обработки eSBR декодирования (для каждого канала "ch" аудиосодержимого, указанного битовым потоком) управляют следующие параметры метаданных eSBR: sbrPatchingMode[ch]; sbrOversamplingFlag[ch]; sbrPitchInBinsFlag[ch]; и sbrPitchInBins[ch].
Значение "sbrPatchingMode[ch]" указывает тип транспозиции, используемой в eSBR: sbrPatchingMode[ch]=1 указывает не гармоническую вставку, как описано в разделе 4.6.18.6.3 стандарта MPEG-4 AAC; sbrPatchingMode[ch]=0 указывает гармоническую вставку SBR, как описано в разделе 7.5.3 или 7.5.4 стандарта MPEG USAC.
Значение "sbrOversamplingFlag[ch]" указывает использование сигнальной адаптивной сверхдискретизации в частотной области в eSBR в сочетании с основанной на DFT гармонической вставкой SBR, как описано в разделе 7.5.3 стандарта MPEG USAC. Этот флаг управляет размером DFT, который используется при транспозиции: 1 указывает, что сигнальная адаптивная сверхдискретизация в частотной области доступна, как описано в разделе 7.5.3.1 стандарта MPEG USAC; 0 указывает, что сигнальная адаптивная сверхдискретизация в частотной области недоступна, как описано в разделе 7.5.3.1 стандарта MPEG USAC.
Значение "sbrPitchInBinsFlag[ch]" управляет интерпретацией параметра sbrPitchInBins[ch]: 1 указывает, что значение в параметре sbrPitchInBins[ch] является пригодным и больше нуля; 0 указывает, что значение sbrPitchInBins[ch] установлено равным нулю.
Значение "sbrPitchInBins[ch]" управляет добавлением множителей векторного произведения при гармонической транспозиции SBR. Значение sbrPitchinBins[ch] является целочисленным значением в диапазоне [0,127] и представляет расстояние, измеренное в частотных двоичных символах для преобразования DFT с 1536 линиями, действующего на частоту дискретизации основного кодера.
В случае, когда битовый поток MPEG-4 AAC указывает пару каналов SBR, каналы которой не соединены (а не единственный канал SBR), битовый поток указывает два экземпляра упомянутого выше синтаксиса (для гармонической или не гармонической транспозиции), по одному для каждого канала sbr_channel_pair_element().
Гармоническая транспозиция инструмента eSBR, как правило, улучшает качество декодированных музыкальных сигналов при относительно низком переходе по частотам. Не гармоническая транспозиция (то есть спектральная вставка прежних версий), как правило, улучшает речевые сигналы. Следовательно, отправная точка при решении относительно того, какой тип транспозиции предпочтителен для кодирования заданного аудиосодержимого, состоит в выборе способа транспозиции в зависимости от обнаружения речи/музыки, при этом гармоническая транспозиция используется для музыки, и спектральная вставка используется для речи.
Функционированием предварительного сглаживания во время обработки eSBR управляет значение однобитного параметра метаданных eSBR, известного как "bs_sbr_preprocessing", в том смысле, что предварительное сглаживание либо выполнятся, либо не выполняется в зависимости от значения этого единственного бита. Когда используется алгоритм QMF-вставки SBR, как описано в разделе 4.6.18.6.3 стандарта MPEG-4 AAC, может быть выполнен этап предварительного сглаживания (когда обозначено параметром "bs_sbr_preprocessing"), чтобы избежать неоднородностей в форме огибающей спектра высокочастотного сигнала, вводимого в последующий блок корректировки огибающей (блок корректировки огибающей выполняет другой этап обработки eSBR). Предварительное сглаживание, как правило, улучшает операцию последующего этапа корректировки огибающей, что дает в результате высокополосный сигнал, который воспринимается более стабильно.
Функционированием формирования временной огибающей отсчетов между поддиапазонами (инструмент «интер-TES») во время обработки eSBR в декодере управляют следующие параметры метаданных eSBR для каждой огибающей SBR ("env") каждого канала (“ch”) аудиосодержимого декодируемого битового потока USAC: bs_temp_shape[ch][env]; и bs_inter_temp_shape_mode[ch][env].
Инструмент интер-TES обрабатывает QMF отсчеты поддиапазона после блока корректировки огибающей. Этот этап обработки формирует временную огибающую более высокого диапазона частот с более высокой степенью временной детализации, чем блок корректировки огибающей. Посредством применения коэффициента усиления к каждому QMF отсчету поддиапазона в огибающей SBR интер-TES формирует временную огибающую среди QMF отсчетов поддиапазона.
Параметр ʺbs_temp_shape[ch][env]ʺ является флагом, который сигнализирует использование интер-TES. Параметр ʺbs_inter_temp_shape_mode[ch][env]ʺ указывает (как определено в стандарте MPEG USAC) значения параметра γ в интер-TES.
Общее требование битовой скорости для включения в битовый поток MPEG-4 AAC метаданных eSBR, указывающих упомянутые выше инструменты eSBR (гармоническая транспозиция, предварительное сглаживание и интер-TES) предполагается на уровне порядка нескольких сотен бит в секунду, поскольку только отличительные управляющие данные, необходимые для выполнения обработки eSBR, передаются в соответствии с некоторыми вариантами осуществления изобретения. Декодеры прежних версий могут игнорировать эту информацию, поскольку она включена с соблюдением обратной совместимости (как будет описано позже). Таким образом, неблагоприятное воздействие на битовую скорость, связанную с включением метаданных eSBR, является незначительным по ряду причин, в том числе следующих:
- Потери битовой скорости (вследствие включения метаданных eSBR) представляют собой очень небольшую часть общей битовой скорости, поскольку передаются только отличительные управляющие данные, необходимые для выполнения обработки eSBR (а не параллельная передача управляющих данных SBR);
- Настройка относящейся к SBR управляющей информации, как правило, не зависит от подробных сведений о транспозиции; и
- Инструмент интер-TES (используемый во время обработки eSBR) выполняет одностороннюю последующую обработку транспонированного сигнала.
Таким образом, варианты осуществления изобретения обеспечивают средство для эффективной передачи управляющих данных или метаданных расширенного копирования спектральной полосы (eSBR) с соблюдением обратной совместимости. Эта эффективная передача управляющих данных eSBR сокращает требования к памяти в декодерах, кодерах и транскодерах, использующих аспекты изобретения, без оказания какого-либо ощутимого отрицательного эффекта на битовую скорость. Кроме того, сложность и требования к обработке, связанные с выполнением eSBR в соответствии с вариантами осуществления изобретения, также сокращены, поскольку данные SBR необходимо обработать только один раз, а не передавать их параллельно, что имело бы место, если бы eSBR рассматривалось как совершенно отдельный тип объекта в MPEG-4 AAC, вместо того, чтобы быть интегрированным в кодер-декодер MPEG-4 AAC с соблюдением обратной совместимости.
Далее со ссылкой на фиг. 7 мы описываем элементы блока ("raw_data_block") битового потока MPEG-4 AAC, в которые включены метаданные eSBR, в соответствии с некоторыми вариантами осуществления настоящего изобретения. Фиг. 7 является схемой блока ("raw_data_block") битового потока MPEG-4 AAC, показывающей некоторые его сегменты.
Блок битового потока MPEG-4 AAC может включать в себя по меньшей мере один элемент ʺsingle_channel_element()ʺ (например, элемент одиночного канала, показанный на фиг. 7) и/или по меньшей мере один элемент ʺchannel_pair_element()ʺ (специально не показан на фиг. 7, хотя может присутствовать), включающий в себя аудиоданные для аудиопрограммы. Блок также может включать в себя несколько элементов "fill_elements" (например, заполняющий элемент 1 и/или заполняющий элемент 2 на фиг. 7), включающих в себя данные (например, метаданные), относящиеся к программе. Каждый элемент ʺsingle_channel_element()ʺ включает в себя идентификатор (например, "ID1" на фиг. 7), указывающий начало элемента одиночного канала, и может включать в себя аудиоданные, указывающие другой канал многоканальной аудиопрограммы. Каждый элемент ʺchannel_pair_element" включает в себя идентификатор (не показан на фиг. 7), указывающий начало элемента пары каналов, и может включать в себя аудиоданные, указывающие два канала программы.
Элемент fill_element (называемый здесь далее «заполняющим элементом») битового потока MPEG-4 AAC включает в себя идентификатор ("ID2" на фиг. 7), указывающий начало заполняющего элемента, и заполняющие данные после идентификатора. Идентификатор ID2 может состоять из трехбитного целого без знака, у которого сначала передается старший значащий бит ("uimsbf"), имеющего значение 0×6. Заполняющие данные могут включать в себя элемент extension_payload() (иногда упоминаемый в настоящем документе как добавочная полезная нагрузка), синтаксис которого показан в таблице 4.57 стандарта MPEG-4 AAC. Существуют несколько типов добавочных полезных нагрузок, и они идентифицируются через параметр "extension_type", который является четырехбитным целым без знака, у которого сначала передается старший значащий бит ("uimsbf").
Заполняющие данные (например, их добавочная полезная нагрузка) могут включать в себя заголовок или идентификатор (например, «Заголовок 1» на фиг. 7), который указывает сегмент заполняющих данных, который указывает объект SBR (т.е. заголовок инициализирует тип «объект SBR», называемый sbr_extension_data() в стандарте MPEG-4 AAC). Например, добавочная полезная нагрузка копирования спектральной полосы (SBR) идентифицируется значением '1101' или ʹ1110ʹ для extension_type поля в заголовке, и идентификатор ʹ1101ʹ идентифицирует добавочную полезную нагрузку с данными SBR, а ʹ1110ʹ идентифицирует добавочную полезную нагрузку с данными SBR с циклическим контролем избыточности (CRC) для проверки правильности данных SBR.
Когда заголовок (например, поле extension_type) инициализирует тип объекта SBR, метаданные SBR (иногда упоминаемые в настоящем документе как ʺданные копирования спектральной полосыʺ и называемые sbr_data() в стандарте MPEG-4 AAC) следуют за заголовком, и по меньшей мере один добавочный элемент копирования спектральной полосы (например, ʺдобавочный элемент SBRʺ заполняющего элемента 1 на фиг. 7) может следовать за метаданными SBR. Такой добавочный элемент копирования спектральной полосы (сегмент битового потока) упоминается как контейнер ʺsbr_extension()ʺ в стандарте MPEG-4 AAC. Добавочный элемент копирования спектральной полосы при необходимости включает в себя заголовок (например, ʺдобавочный заголовок SBRʺ заполняющего элемента 1 на фиг. 7).
Стандарт MPEG-4 AAC предполагает, что добавочный элемент копирования спектральной полосы может включать в себя данные PS (параметрического стерео) для аудиоданных программы. Стандарт MPEG-4 AAC предполагает, что когда заголовок заполняющего элемента (например, его добавочной полезной нагрузки) инициализирует тип объекта SBR (как делает «Заголовок 1» на фиг. 7), и добавочный элемент копирования спектральной полосы заполняющего элемента включает в себя данные PS, заполняющий элемент (например, его добавочная полезная нагрузка) включает в себя данные копирования спектральной полосы и параметр "bs_extension_id", значение которого (т.е. bs_extension_id=2) указывает, что данные PS включены в добавочный элемент копирования спектральной полосы заполняющего элемента.
В соответствии с некоторыми вариантами осуществления настоящего изобретения метаданные eSBR (например, флаг, указывающий, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR) для аудиосодержимого блока), включены в добавочный элемент копирования спектральной полосы заполняющего элемента. Например, такой флаг обозначен в заполняющем элементе 1 на фиг. 7, где флаг имеет место после заголовка («добавочный заголовок SBR» заполняющего элемента 1) «добавочного элемента SBR» заполняющего элемента 1. При необходимости такой флаг и дополнительные метаданные eSBR включаются в добавочный элемент копирования спектральной полосы после заголовка добавочного элемента копирования спектральной полосы (например, в дополнительном элементе SBR заполняющего элемента 1 на фиг. 7, после добавочного заголовка SBR). В соответствии с некоторыми вариантами осуществления настоящего изобретения, заполняющий элемент, который включает в себя метаданные eSBR, также включает в себя параметр "bs_extension_id", значение которого (например, bs_extension_id=3) указывает, что метаданные eSBR включены в заполняющий элемент, и что обработка eSBR должна быть выполнена для аудиосодержимого релевантного блока.
В соответствии с некоторыми вариантами осуществления изобретения метаданные eSBR включены в заполняющий элемент (например, заполняющий элемент 2 на фиг. 7) битового потока MPEG-4 AAC, отличающийся от добавочного элемента копирования спектральной полосы (добавочный элемент SBR) заполняющего элемента. Это вызвано тем, что заполняющие элементы, содержащие extension_payload() с данными SBR или данными SBR с CRC, не содержат никакую другую добавочную полезную нагрузку никакого другого добавочного типа. Таким образом, в вариантах осуществления, когда метаданные eSBR хранят их собственную добавочную полезную нагрузку, отдельный заполняющий элемент используется, чтобы хранить метаданные eSBR. Такой заполняющий элемент включает в себя идентификатор (например, "ID2" на фиг. 7), указывающий начало заполняющего элемента, и заполняющие данные после идентификатора. Заполняющие данные могут включать в себя элемент extension_payload() (иногда упоминаемый в настоящем документе как добавочная полезная нагрузка), синтаксис которого показан в таблице 4.57 стандарта MPEG-4 AAC. Заполняющие данные (например, добавочная полезная нагрузка) включает в себя заголовок (например, «Заголовок 2» заполняющего элемента 2 на фиг. 7), который указывает объект eSBR (т.е. заголовок инициализирует тип объекта расширенного копирования спектральной полосы (eSBR)), и заполняющие данные (например, дополнительная полезная нагрузка) включает в себя метаданные eSBR после заголовка. Например, заполняющий элемент 2 на фиг. 7 включает в себя такой заголовок («Заголовок 2»), и также включает в себя после заголовка метаданные eSBR (т.е. «флаг» в заполняющем элементе 2, который указывает, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR) для аудиосодержимого блока). При необходимости дополнительные метаданные eSBR также включены в заполняющие данные заполняющего элемента 2 на фиг. 7 после Заголовка 2. В вариантах осуществления, описываемых в настоящем абзаце, заголовок (например, Заголовок 2 на фиг. 7) имеет идентификационное значение, которое не является одним из традиционных значений, определенных в таблице 4.57 стандарта MPEG-4 AAC, и вместо этого указывает добавочную полезную нагрузку eSBR (таким образом, что extension_type поле заголовка указывает, что заполняющие данные включают в себя метаданные eSBR).
В первом классе вариантов осуществления изобретение представляет собой блок обработки аудиоданных (например, декодер), содержащий:
память (например, буфер 201 на фиг. 3 или 4), выполненная с возможностью хранения по меньшей мере одного блока кодированного битового аудиопотока (например, по меньшей мере одного блока битового потока MPEG-4 AAC);
блок удаления форматирования полезной нагрузки битового потока (например, элемент 205 на фиг. 3 или элемент 215 на фиг. 4), соединенный с памятью и выполненный с возможностью демультиплексирования по меньшей мере одной части упомянутого блока битового потока; и
подсистему декодирования (например, элементы 202 и 203 на фиг. 3 или элементы 202 и 213 на фиг. 4), соединенную и выполненную с возможностью декодирования по меньшей мере одной части аудиосодержимого упомянутого блока битового потока, причем блок включает в себя:
заполняющий элемент, включающий в себя идентификатор, указывающий начало заполняющего элемента (например, идентификатор "id_syn_ele", имеющий значение 0×6, таблицы 4.85 стандарта MPEG-4 AAC), и заполняющие данные после идентификатора, причем заполняющие данные включают в себя:
по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы (eSBR) для аудиосодержимого блока (например, с использованием данных копирования спектральной полосы и метаданных eSBR, включенных в блок).
Флаг представляет собой метаданные eSBR, и примером флага является флаг sbrPatchingMode. Другим примером флага является флаг harmonicSBR. Оба из этих флагов указывают, должна ли быть выполнена базовая форма копирования спектральной полосы или расширенная форма копирования спектральной полосы для аудиоданных блока. Базовой формой копирования спектральной полосы является спектральная вставка, и расширенной формой копирования спектральной полосы является гармоническая транспозиция.
В некоторых вариантах осуществления заполняющие данные также включают в себя дополнительные метаданные eSBR (т.е. метаданные eSBR, не являющиеся флагом).
Память может представлять собой буферную памятью (например, реализация буфера 201 на фиг. 4), которая хранит (например, постоянным образом) по меньшей мере один блок кодированного битового аудиопотока.
Предполагается, что сложность функционирования обработки eSBR (с использованием инструментов гармонической транспозиции, предварительного сглаживания и интер-TES eSBR) посредством декодера eSBR во время декодирования битового потока MPEG-4 AAC, который включает в себя метаданные eSBR (указывающие эти инструменты eSBR) будет следующей (для типичного декодирования с указанными параметрами):
- Гармоническая транспозиция (16 Кбит/с, 14400/28800 Гц)
-- на основе DFT: 3,68 WMOPS (взвешенных миллионов операций в секунду);
-- на основе QMF: 0,98 WMOPS;
- Предварительная обработка QMF-вставки (предварительное сглаживание): 0,1 WMOPS; и
- Формирование временной огибающей отсчетов между поддиапазонами (интер-TES): по большей мере 0,16 WMOPS.
Известно, что транспозиция на основе DFT, как правило, выполняется лучше, чем транспозиция на основе QMF для переходных процессов.
В соответствии с некоторыми вариантами осуществления настоящего изобретения заполняющий элемент (кодированного битового аудиопотока), который включает в себя метаданные eSBR, также включает в себя параметр (например, параметр "bs_extension_id"), значение которого (например, bs_extension_id=3) сигнализирует, что метаданные eSBR включены в заполняющий элемент, и что обработка eSBR должна быть выполнена для аудиосодержимого релевантного блока, и/или параметр (например, этот же параметр "bs_extension_id"), значение которого (например, bs_extension_id=2) сигнализирует, что контейнер sbr_extension() заполняющего элемента включает в себя данные PS. Например, как указано в приведенной ниже таблице 1, такой параметр, имеющий значение bs_extension_id=2, может сигнализировать, что контейнер sbr_extension() заполняющего элемента включает в себя данные PS, и такой параметр, имеющий значение bs_extension_id=3, может сигнализировать, что контейнер sbr_extension() заполняющего элемента включает в себя метаданные eSBR:
Таблица 1
bs_extension_id Значение
0 Зарезервировано
1 Зарезервировано
2 EXTENSION_ID_PS
3 EXTENSION_ID_ESBR
В соответствии с некоторыми вариантами осуществления изобретения синтаксис каждого добавочного элемента копирования спектральной полосы, который включает в себя метаданные eSBR и/или данные PS, как указано в приведенной ниже таблице 2 (в которой ʺsbr_extension()ʺ обозначает контейнер, который является добавочным элементом копирования спектральной полосы, "bs_extension_id" описан в приведенной выше таблице 1, "ps_data" обозначает данные PS, и "esbr_data" обозначает метаданные eSBR):
Таблица 2
Figure 00000001
Figure 00000002
Прим. 1: ps_data() возвращает количество считанных битов.
Прим. 2: esbr_data() возвращает количество считанных битов.
Прим. 3: параметр bs_fill_bits содержит N битов, где N=num_bits_left.
В иллюстративном варианте осуществления esbr_data(), упомянутый в приведенной выше таблице 2, указывает значения следующих параметров метаданных:
1. каждый из описанных выше однобитных параметров метаданных “harmonicSBR”; “bs_interTES”; и “bs_sbr_preprocessing”;
2. для каждого канала ("ch") аудиосодержимого кодированного битового потока, который должен быть декодирован, каждый из описанных выше параметров: "sbrPatchingMode[ch]"; "sbrOversamplingFlag[ch]"; "sbrPitchInBinsFlag[ch]"; и "sbrPitchInBins[ch]"; и
3. для каждой огибающей SBR (ʺenvʺ) каждого канала ("ch") аудиосодержимого кодированного битового потока, который должен быть декодирован, каждый из описанных выше параметров: ʺbs_temp_shape[ch][env]ʺ; и ʺbs_inter_temp_shape_mode[ch][env]ʺ.
Например, в некоторых вариантах осуществления esbr_data() может иметь синтаксис, указанный в таблице 3, чтобы указать эти параметры метаданных:
Таблица 3
Figure 00000003
Приведенный выше синтаксис дает возможность эффективной реализации расширенной формы копирования спектральной полосы, такой как гармоническая транспозиция, в качестве расширения для декодера прежних версий. Более конкретно, данные eSBR в таблице 3 включают в себя только те параметры, необходимые для выполнения расширенной формы копирования спектральной полосы, которые либо уже не поддерживаются в битовом потоке, либо могут быть непосредственно выведены из параметров, уже поддерживаемых в битовом потоке. Все другие параметры и данные обработки, необходимые для выполнения расширенной формы копирования спектральной полосы, извлечены из ранее существующих параметров в уже определенных местоположениях в битовом потоке.
Например, декодер, совместимый с MPEG-4 HE-AAC или HE-AAC v2, может быть расширен, чтобы он включал в себя расширенную форму копирования спектральной полосы, такую как гармоническая транспозиция. Эта расширенная форма копирования спектральной полосы дополняет базовую форму копирования спектральной полосы, уже поддерживаемую декодером. В контексте декодера, совместимого с MPEG-4 HE-AAC или HE-AAC v2, этой базовой формой копирования спектральной полосы является инструмент спектральной вставки QMF SBR, как определено в разделе 4.6.18 стандарта MPEG-4 AAC.
При выполнении расширенной формы копирования спектральной полосы расширенный декодер HE-AAC может повторно использовать многие параметры битового потока, уже включенные в добавочную полезную нагрузку SBR битового потока. Конкретные параметры, которые могут быть повторно использованы, включают в себя, например, различные параметры, которые определяют основную таблицу диапазонов частот. Эти параметры включают в себя bs_start_freq (параметр, который определяет начало параметра основной таблицы частот), bs_stop_freq (параметр, который определяет конец основной таблицы частот), bs_freq_scale (параметр, который определяет количество диапазонов частот на октаву) и bs_alter_scale (параметр, который изменяет масштаб диапазонов частот). Параметры, которые могут быть повторно использованы, также включают в себя параметры, которые определяют таблицу полосы шумов (bs_noise_bands) и параметры таблицы полосы ограничителя (bs_limiter_bands). В соответствии с этим в различных вариантах осуществления по меньшей мере некоторые эквивалентные параметры, определенные в стандарте USAC, опущены из битового потока, и тем самым сокращаются накладные расходы управления в битовом потоке. Как правило, когда параметр, определенный в стандарте AAC, имеет эквивалентный параметр, определенный в стандарте USAC, эквивалентный параметр, определенный в стандарте USAC, имеет такое же имя, как параметр, определенный в стандарте AAC, например, масштабный коэффициент огибающей EOrigMapped. Однако эквивалентный параметр, определенный в стандарте USAC, как правило, имеет другое значение, которое «настроено» для обработки расширенного SBR, определенной в стандарте USAC, а не для обработки SBR, определенной в стандарте AAC.
В дополнение к многочисленным параметрам другие элементы данных также могут быть повторно использованы расширенным декодером HE-AAC при выполнении расширенной форму копирования спектральной полосы в соответствии с вариантами осуществления изобретения. Например, данные огибающей и данные минимального уровня шума также могут быть извлечены из данных bs_data_env и bs_noise_env и использованы во время расширенной формы копирования спектральной полосы.
В сущности, эти варианты осуществления используют параметры конфигурации и данные огибающей, уже поддерживаемые декодером HE-AAC или HE-AAC v2 прежних версий, в добавочной полезной нагрузке SBR, чтобы дать возможность для расширенной формы копирования спектральной полосы, требуя как можно меньше дополнительных переданных данных. В соответствии с этим расширенные декодеры, которые поддерживают расширенную форму копирования спектральной полосы, могут быть созданы очень эффективным образом, полагаясь на уже определенные элементы битового потока (например, в добавочной полезной нагрузке SBR) и добавляя только те параметры, которые необходимы для поддержки расширенной формы копирования спектральной полосы (в добавочной полезной нагрузке заполняющего элемента). Этот признак сокращения объема данных в сочетании с размещением новых добавленных параметров в зарезервированном поле данных, таком как добавочный контейнер, в значительной степени сокращает барьеры для создания декодера, который поддерживает расширенное копирование спектральной полосы, гарантируя, что битовый поток обратно совместим с декодером прежних версий, не поддерживающим расширенную форму копирования спектральной полосы.
В таблице 3 число в центральном столбце указывает количество битов соответствующего параметра в левой колонке.
В некоторых вариантах осуществления изобретение представляет собой способ, включающий в себя этап кодирования аудиоданных, чтобы сформировать кодированный битовый поток (например, битовый поток MPEG-4 AAC), в том числе посредством включения метаданных eSBR по меньшей мере в один сегмент по меньшей мере одного блока кодированного битового потока и аудиоданных по меньшей мере еще в один сегмент блока. В типичных вариантах осуществления способ включает в себя этап мультиплексирования аудиоданных с метаданными eSBR в каждом блоке кодированного битового потока. В типичном декодировании кодированного битового потока в декодере eSBR декодер извлекает метаданные eSBR из битового потока (в том числе посредством синтаксического разбора и демультиплексирования метаданных eSBR и аудиоданных) и использует метаданные eSBR для обработки аудиоданных, чтобы сформировать поток декодированных аудиоданных.
Другим аспектом изобретения является декодер eSBR, выполненный с возможностью выполнения обработки eSBR (например, с использованием по меньшей мере одного из инструментов eSBR, известных как гармоническая транспозиция, предварительное сглаживание или интер-TES) во время декодирования кодированного битового аудиопотока (например, битового потока MPEG-4 AAC), который не включает в себя метаданные eSBR. Пример такого декодера будет описан со ссылкой на фиг. 5.
Декодер (400) eSBR на фиг. 5 включает в себя буферную память 201 (которая идентична памяти 201 на фиг. 3 и 4), блок 215 удаления форматирования полезной нагрузки битового потока (который идентичен блоку 215 удаления форматирования на фиг. 4), подсистему 202 аудиодекодирования (иногда называемую «базовым» модулем декодирования или «базовой» подсистемой декодирования, которая идентична базовой подсистеме 202 декодирования на фиг. 3), подсистему 401 формирования управляющих данных eSBR и модуль 203 обработки eSBR (который идентичен модулю 203 на фиг. 3), соединенные, как показано. Как правило, также декодер 400 включает в себя другие элементы обработки (не показаны).
В работе декодера 400 последовательность блоков кодированного битового аудиопотока (битового потока MPEG-4 AAC), принятого декодером 400, перемещается из буфера 201 в блок 215 удаления форматирования.
Блок 215 удаления форматирования соединен и выполнен с возможностью демультиплексирования каждого блока битового потока, чтобы извлечь оттуда метаданные SBR (включающие в себя квантованные данные огибающей) и, как правило, также другие метаданные. Блок 215 удаления форматирования выполнен с возможностью помещения по меньшей мере метаданных SBR в модуль 203 обработки eSBR. Блок 215 удаления форматирования также соединен и выполнен с возможностью извлечения аудиоданных из каждого блока битового потока и помещения извлеченных аудиоданных в подсистему 202 декодирования (модуль декодирования).
Подсистема 202 аудиодекодирования декодера 400 выполнена с возможностью декодирования аудиоданных, извлеченных блоком 215 удаления форматирования (такое декодирование может упоминаться как «базовая» операция декодирования), чтобы сформировать декодированные аудиоданные, и помещения декодированных аудиоданных в модуль 203 обработки eSBR. Декодирование выполняется в частотной области. Как правило, заключительный этап обработки в подсистеме 202 применяет преобразование из частотной области во временную область к декодированным аудиоданным частотной области, таким образом, выводом подсистемы являются декодированные аудиоданные во временной области. Модуль 203 выполнен с возможностью применения инструментов SBR (и инструментов eSBR), указанных посредством метаданных SBR (извлеченных блоком 215 удаления форматирования) и метаданных eSBR, сформированных в подсистеме 401, к декодированным аудиоданным (т.е. выполнения обработки SBR и обработки eSBR на выходе подсистемы 202 декодирования с использованием метаданных SBR и метаданных eSBR), чтобы сформировать полностью декодированные аудиоданные, которые выдаются из декодера 400. Как правило, декодер 400 включает в себя память (доступную для подсистемы 202 и модуля 203), которая хранит подвергнутые удалению форматирования аудиоданные и метаданные, выданные из блока 215 удаления форматирования (и при необходимости также подсистемы 401), и модуль 203 выполнен с возможностью осуществления доступа к аудиоданным и метаданным по мере необходимости во время обработки SBR и обработки eSBR. Обработка SBR в 203 может рассматриваться как последующая обработка на выходе основной подсистемы 202 декодирования. При необходимости декодер 400 также включает в себя подсистему финального повышающего микширования (которая может применить инструменты параметрического стерео ("PS"), определенные в стандарте MPEG-4 AAC, с использованием метаданных PS, извлеченных блоком 215 удаления форматирования), которая соединена и выполнена с возможностью выполнения повышающего микширования на выходе модуля 203, чтобы сформировать полностью декодированную, подвергнутую повышающему микшированию аудиоданные, которые выдаются из блока 210 APU.
Подсистема 401 формирования управляющих данных на фиг. 5 соединена и выполнена с возможностью обнаружения по меньшей мере одного свойства кодированного битового аудиопотока, который должен быть декодирован, и формирования управляющих данных eSBR (которые могут представлять собой или включать в себя метаданные eSBR любого из типов, включенных в кодированные битовые аудиопотоки в соответствии с другими вариантами осуществления изобретения) в ответ на по меньшей мере один результат этапа обнаружения. Управляющие данные eSBR помещаются в модуль 203, чтобы инициировать применение отдельных инструментов eSBR или комбинации инструментов eSBR после обнаружения заданного свойства (или комбинации свойств) битового потока, и/или управлять применением таких инструментов eSBR. Например, чтобы управлять функционированием обработки eSBR с использованием гармонической транспозиции, некоторые варианты осуществления подсистемы формирования управляющих данных 401 включают в себя: датчик музыки (например, упрощенную версию традиционного датчика музыки) для установки параметра sbrPatchingMode[ch] (и помещения установленного параметр в модуль 203) в ответ на обнаружение, что битовый поток указывает или не указывает музыку; датчик перехода для установки параметра sbrOversamplingFlag[ch] (и помещения установленного параметра в модуль 203) в ответ на обнаружение присутствия или отсутствия переходных процессов в аудиосодержимом, указанным посредством битового потока; и/или датчик тона для установки параметров sbrPitchInBinsFlag[ch] и sbrPitchInBins[ch] (и помещения установленных параметров в модуль 203) в ответ на обнаружение тона аудиосодержимого, указанного посредством битового потока. Другими аспектами изобретения являются способы декодирования битового аудиопотока, выполненные посредством любого варианта осуществления декодера изобретения, описанного в этом абзаце и предыдущем абзаце.
Аспекты изобретения включают в себя способ кодирования или декодирования типа, с возможностью выполнения которого выполнен (например, запрограммирован) любой вариант осуществления блока APU, системы или устройства изобретения. Другие аспекты изобретения включают в себя систему или устройство, выполненные с возможностью (например, запрограммированные) выполнения любого варианта осуществления способа согласно изобретению, и машиночитаемый носитель (например, диск), который хранит код (например, постоянным образом) для реализации любого варианта осуществления способа изобретения или его этапов. Например, система изобретения может представлять собой или включать в себя программируемый процессор общего назначения, процессор цифровой обработки сигналов или микропроцессор, запрограммированный с помощью программного обеспечения или программно-аппаратного обеспечения и/или иным образом выполненный с возможностью выполнения любого множества операций для данных, включающих в себя вариант осуществления способа изобретения или его этапов. Такой процессор общего назначения может представлять собой или включать в себя компьютерную систему, включающую в себя устройство ввода, память и схему обработки, запрограммированную для (и/или иным образом выполненную с возможностью) выполнения варианта осуществления способа согласно изобретению (или его этапов) в ответ на помещенные в него данные.
Варианты осуществления настоящего изобретения могут быть реализованы в аппаратных средствах, программно-аппаратном обеспечении или программном обеспечении, или в их комбинации (например, как программируемая логическая матрица). Если не определено иначе, алгоритмы или процессы, включенные как часть изобретения, изначально не относятся к каким-либо конкретному компьютеру или другому устройству. В частности, различные машины общего назначения могут использоваться с программами, написанными в соответствии с идеями в настоящем документе, или может быть более удобно построить более специализированное устройство (например, интегральные схемы) для выполнения этапов требуемого метода. Таким образом, изобретение может быть реализовано в одной или более компьютерных программах, исполняющихся на одной или более программируемых компьютерных системах (например, реализация любого из элементов на фиг. 1, или кодер 100 на фиг. 2 (или его элемент), или декодер 200 на фиг. 3 (или его элемент), или декодер 210 на фиг. 4 (или его элемент), или декодер 400 на фиг. 5 (или его элемент)), каждая из которых включает в себя по меньшей мере один процессор, по меньшей мере одну систему хранения данных (в том числе энергозависимую и энергонезависимую память и/или запоминающие элементы), по меньшей мере одно устройство или порт ввода и по меньшей мере одно устройство или порт вывода. Программный код применяется для ввода данных для выполнения функций, описанных в настоящем документе, и формирования выходной информации. Выходная информация применяется к одному или более устройствам вывода известным образом.
Каждая такая программа может быть реализована на любом желаемом компьютерном языке (в том числе машинном языке, языке ассемблера или процедурных, логических или объектно-ориентированных языках программирования высокого уровня) для взаимодействия с компьютерной системой. В любом случае язык может являться компилируемым или интерпретируемым языком.
Например, при реализации посредством последовательностей компьютерных программных команд различные функции и этапы вариантов осуществления изобретения могут быть реализованы посредством многопоточных последовательностей программных команд, работающих в подходящих аппаратных средствах цифровой обработки сигналов, в этом случае различные устройства, модули и функции вариантов осуществления могут соответствовать частям программных команд.
Каждая такая компьютерная программа предпочтительно сохранена или загружена на запоминающий носитель или устройство (например, в твердотельную память или на носитель, или магнитные или оптические носители), читаемые посредством программируемого компьютера общего или специализированного назначения, для конфигурации и работы компьютера, когда запоминающий носитель или устройство считываются компьютерной системой для выполнения процедур, описанных в настоящем документе. Система изобретения также может быть реализована как машиночитаемый запоминающий носитель, конфигурированный посредством (т.е. хранящий) компьютерной программы, причем конфигурированный таким образом запоминающий носитель побуждает компьютерную систему работать заданным и заранее определенным образом для выполнения функций, описанных в настоящем документе.
Было описано множество вариантов осуществления изобретения. Тем не менее, следует понимать, что могут быть сделаны различные модификации без отступления от сущности и объема изобретения. Многочисленные модификации и изменения настоящего изобретения возможны в свете изложенных выше идей. Следует понимать, что в рамках объема приложенной формулы изобретения изобретение может быть осуществлено иначе, чем конкретно описано в настоящем документе. Любые ссылочные позиции, содержащиеся в нижеследующей формуле изобретения, даны только в иллюстративных целях и не должны использоваться для толкования или ограничения формулы изобретения каким бы то ни было образом.

Claims (46)

1. Блок (210) обработки аудиоданных, содержащий:
буфер (201), выполненный с возможностью хранения по меньшей мере одного блока кодированного битового аудиопотока;
блок (215) удаления форматирования полезной нагрузки битового потока, соединенный с буфером и выполненный с возможностью демультиплексирования по меньшей мере части по меньшей мере одного блока кодированного битового аудиопотока; и
подсистему (202) декодирования, соединенную с блоком (215) удаления форматирования полезной нагрузки битового потока и выполненную с возможностью декодирования по меньшей мере части по меньшей мере одного блока кодированного битового аудиопотока, причем по меньшей мере один блок кодированного битового аудиопотока включает в себя:
заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора, причем заполняющие данные включают в себя:
по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока; и
метаданные расширенного копирования спектральной полосы, которые не включают в себя один или более параметров, используемых и для спектральной вставки, и для гармонической транспозиции, причем метаданные расширенного копирования спектральной полосы представляют собой метаданные, выполненные с возможностью обеспечения по меньшей мере одного инструмента eSBR, который описан или упомянут в стандарте MPEG USAC, и который не описан и не упомянут в стандарте MPEG-4 AAC.
2. Блок обработки аудиоданных по п. 1, в котором метаданные расширенного копирования спектральной полосы не включают в себя параметр для выбора между гармонической транспозицией и спектральной вставкой.
3. Блок обработки аудиоданных по п. 1 или 2, в котором метаданные расширенного копирования спектральной полосы включают в себя по меньшей мере одно из i) параметра, указывающего, следует ли выполнять предварительное сглаживание; ii) параметра, указывающего, следует ли выполнять формирование временной огибающей отсчетов между поддиапазонами; и iii) параметра, указывающего, следует ли выполнять сигнальную адаптивную сверхдискретизацию в частотной области.
4. Блок обработки аудиоданных по любому из предыдущих пунктов, в котором по меньшей мере один блок кодированного битового аудиопотока включает в себя метаданные копирования спектральной полосы.
5. Блок обработки аудиоданных по п. 4, в котором метаданные расширенного копирования спектральной полосы не включают в себя параметр, который эквивалентен параметру метаданных копирования спектральной полосы.
6. Блок обработки аудиоданных по п. 4 или 5, в котором метаданные копирования спектральной полосы представляют собой метаданные, выполненные с возможностью обеспечения по меньшей мере одного инструмента SBR, который описан или упомянут в стандарте MPEG-4 AAC.
7. Блок обработки аудиоданных по любому из пп. 4-6, в котором метаданные копирования спектральной полосы включают в себя один или более параметров, используемых и для спектральной вставки, и для гармонической транспозиции.
8. Блок обработки аудиоданных по любому из предыдущих пунктов, в котором обработка расширенного копирования спектральной полосы включает в себя гармоническую транспозицию и не включает в себя спектральную вставку.
9. Блок обработки аудиоданных по любому из предыдущих пунктов, в котором одно значение по меньшей мере одного флага указывает, что упомянутая обработка расширенного копирования спектральной полосы должна быть выполнена для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока, и другое значение по меньшей мере одного флага указывает, что обработка базового копирования спектральной полосы должна быть выполнена для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока.
10. Блок обработки аудиоданных по п. 9, в котором обработка базового копирования спектральной полосы включает в себя спектральную вставку и не включает в себя гармоническую транспозицию.
11. Блок обработки аудиоданных по п. 9 или 10, в котором обработка базового копирования спектральной полосы представляет собой обработку копирования спектральной полосы с использованием спектральной вставки, как описано в стандарте MPEG-4 AAC.
12. Блок обработки аудиоданных по любому из предыдущих пунктов, в котором обработка расширенного копирования спектральной полосы представляет собой обработку копирования спектральной полосы с использованием по меньшей мере одного инструмента eSBR, который описан или упомянут в стандарте MPEG USAC, и который не описан и не упомянут в стандарте MPEG-4 AAC.
13. Блок обработки аудиоданных по любому из предыдущих пунктов, причем блок обработки аудиоданных является аудиодекодером, и идентификатор является трехбитным целым без знака, у которого сначала передается старший значащий бит, и имеющим значение 0×6.
14. Блок обработки аудиоданных по любому из предыдущих пунктов, причем заполняющие данные включают в себя добавочную полезную нагрузку, добавочная полезная нагрузка включает в себя добавочные данные копирования спектральной полосы, и добавочная полезная нагрузка идентифицируется четырехбитным целым без знака, у которого сначала передается старший значащий бит, и имеющим значение '1101' или '1110', и при необходимости,
при этом добавочные данные копирования спектральной полосы включают в себя:
факультативный заголовок копирования спектральной полосы,
данные копирования спектральной полосы после заголовка, и
добавочный элемент копирования спектральной полосы после данных копирования спектральной полосы, причем в добавочный элемент копирования спектральной полосы включен флаг.
15. Блок обработки аудиоданных по любому из предыдущих пунктов, в котором по меньшей мере один блок кодированного битового аудиопотока включает в себя первый заполняющий элемент и второй заполняющий элемент, и данные копирования спектральной полосы включены в первый заполняющий элемент, и флаг, но не данные копирования спектральной полосы, включен во второй заполняющий элемент.
16. Блок обработки аудиоданных по любому из предыдущих пунктов, дополнительно содержащий подсистему (203) обработки расширенного копирования спектральной полосы, выполненную с возможностью выполнения обработки расширенного копирования спектральной полосы с использованием или в ответ на по меньшей мере один флаг, причем расширенное копирование спектральной полосы включает в себя гармоническую транспозицию.
17. Блок обработки аудиоданных по любому из пп. 1-16, в котором кодированный битовый аудиопоток является битовым потоком MPEG-4 AAC.
18. Способ декодирования кодированного битового аудиопотока, причём способ содержит этапы, на которых:
принимают по меньшей мере один блок кодированного битового аудиопотока;
демультиплексируют по меньшей мере часть по меньшей мере одного блока кодированного битового аудиопотока; и
декодируют по меньшей мере часть по меньшей мере одного блока кодированного битового аудиопотока,
причем по меньшей мере один блок кодированного битового аудиопотока включает в себя:
заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора, причем заполняющие данные включают в себя:
по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока; и
метаданные расширенного копирования спектральной полосы, которые не включают в себя один или более параметров, используемых и для спектральной вставки, и для гармонической транспозиции, причем метаданные расширенного копирования спектральной полосы представляют собой метаданные, выполненные с возможностью обеспечения по меньшей мере одного инструмента eSBR, который описан или упомянут в стандарте MPEG USAC, и который не описан и не упомянут в стандарте MPEG-4 AAC.
19. Способ по п. 18, в котором идентификатор является трехбитным целым без знака, у которого сначала передается старший значащий бит, и имеющим значение 0×6.
20. Способ по п. 18 или 19, в котором заполняющие данные включают в себя добавочную полезную нагрузку, добавочная полезная нагрузка включает в себя добавочные данные копирования спектральной полосы, и добавочная полезная нагрузка идентифицируется четырехбитным целым без знака, у которого сначала передается старший значащий бит, и имеющим значение '1101' или '1110', и при необходимости,
при этом добавочные данные копирования спектральной полосы включают в себя:
факультативный заголовок копирования спектральной полосы,
данные копирования спектральной полосы после заголовка,
добавочный элемент копирования спектральной полосы после данных копирования спектральной полосы, и причем в добавочный элемент копирования спектральной полосы включен флаг.
21. Способ по любому из пп. 18-20, в котором обработка расширенного копирования спектральной полосы является гармонической транспозицией, одно значение по меньшей мере одного флага указывает, что упомянутая обработка расширенного копирования спектральной полосы должна быть выполнена для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока, и другое значение по меньшей мере одного флага указывает, что спектральная вставка, а не упомянутая гармоническая транспозиция, должна быть выполнена для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока.
22. Способ по п. 20 или 21, в котором добавочный элемент копирования спектральной полосы включает в себя метаданные расширенного копирования спектральной полосы, не являющиеся флагом, и в котором метаданные расширенного копирования спектральной полосы включают в себя параметр, указывающий, следует ли выполнять предварительное сглаживание, или
в котором добавочный элемент копирования спектральной полосы включает в себя метаданные расширенного копирования спектральной полосы, отличающиеся от флага, и в котором метаданные расширенного копирования спектральной полосы включают в себя параметр, указывающий, следует ли выполнять формирование временной огибающей отсчетов между поддиапазонами.
23. Способ по любому из пп. 18-22, дополнительно содержащий этап, на котором выполняют обработку расширенного копирования спектральной полосы с использованием по меньшей мере одного флага, причем расширенное копирование спектральной полосы включает в себя гармоническую транспозицию.
24. Способ по любому из пп. 18-23, в котором кодированный битовый аудиопоток является битовым потоком MPEG-4 AAC.
RU2017131858A 2015-03-13 2016-03-10 Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе RU2665887C1 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP15159067 2015-03-13
EP15159067.6 2015-03-13
US201562133800P 2015-03-16 2015-03-16
US62/133,800 2015-03-16
PCT/EP2016/055202 WO2016146492A1 (en) 2015-03-13 2016-03-10 Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2018126300A Division RU2764186C2 (ru) 2015-03-13 2016-03-10 Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе

Publications (1)

Publication Number Publication Date
RU2665887C1 true RU2665887C1 (ru) 2018-09-04

Family

ID=52692473

Family Applications (4)

Application Number Title Priority Date Filing Date
RU2017131851A RU2658535C1 (ru) 2015-03-13 2016-03-10 Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе
RU2018118173A RU2760700C2 (ru) 2015-03-13 2016-03-10 Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе
RU2017131858A RU2665887C1 (ru) 2015-03-13 2016-03-10 Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе
RU2018126300A RU2764186C2 (ru) 2015-03-13 2016-03-10 Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе

Family Applications Before (2)

Application Number Title Priority Date Filing Date
RU2017131851A RU2658535C1 (ru) 2015-03-13 2016-03-10 Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе
RU2018118173A RU2760700C2 (ru) 2015-03-13 2016-03-10 Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2018126300A RU2764186C2 (ru) 2015-03-13 2016-03-10 Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе

Country Status (23)

Country Link
US (12) US10134413B2 (ru)
EP (10) EP4198974B1 (ru)
JP (8) JP6383502B2 (ru)
KR (11) KR102481326B1 (ru)
CN (22) CN109243474B (ru)
AR (10) AR103856A1 (ru)
AU (6) AU2016233669B2 (ru)
BR (9) BR122019004614B1 (ru)
CA (5) CA3135370C (ru)
CL (1) CL2017002268A1 (ru)
DK (6) DK3598443T3 (ru)
ES (4) ES2893606T3 (ru)
FI (3) FI4198974T3 (ru)
HU (4) HUE057225T2 (ru)
IL (3) IL295809B2 (ru)
MX (2) MX2017011490A (ru)
MY (1) MY184190A (ru)
PL (8) PL4141866T3 (ru)
RU (4) RU2658535C1 (ru)
SG (2) SG11201707459SA (ru)
TW (4) TWI758146B (ru)
WO (2) WO2016149015A1 (ru)
ZA (4) ZA201903963B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2806121C1 (ru) * 2019-11-27 2023-10-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования и способ декодирования для долговременного предсказания в частотной области тональных сигналов для кодировки аудио

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
BR112020012654A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
KR20200099561A (ko) 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 개선을 위한 방법, 장치 및 시스템
HUE054531T2 (hu) * 2018-01-26 2021-09-28 Dolby Int Ab Visszafelé kompatibilis integrálása magas frekvenciás rekonstrukciós technikáknak audio jelek elõállításához
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
WO2019207036A1 (en) * 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
US11081116B2 (en) * 2018-07-03 2021-08-03 Qualcomm Incorporated Embedding enhanced audio transports in backward compatible audio bitstreams
BR112021003104A2 (pt) * 2018-08-21 2021-05-11 Dolby International Ab métodos, aparelho e sistemas para geração, transporte e processamento de quadros de reprodução imediata (ipfs)
KR102510716B1 (ko) * 2020-10-08 2023-03-16 문경미 양파를 이용한 잼의 제조방법 및 이로 제조된 양파잼
CN114051194A (zh) * 2021-10-15 2022-02-15 赛因芯微(北京)电子科技有限公司 一种音频轨道元数据和生成方法、电子设备及存储介质
WO2024012665A1 (en) * 2022-07-12 2024-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding of precomputed data for rendering early reflections in ar/vr systems
CN116528330B (zh) * 2023-07-05 2023-10-03 Tcl通讯科技(成都)有限公司 设备入网方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2408089C9 (ru) * 2006-06-01 2011-04-27 Нокиа Корпорейшн Декодирование кодированных с предсказанием данных с использованием адаптации буфера
US8200481B2 (en) * 2007-09-15 2012-06-12 Huawei Technologies Co., Ltd. Method and device for performing frame erasure concealment to higher-band signal
WO2012110415A1 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US8494843B2 (en) * 2008-12-19 2013-07-23 Electronics And Telecommunications Research Institute Encoding and decoding apparatuses for improving sound quality of G.711 codec
WO2013158804A1 (en) * 2012-04-17 2013-10-24 Sirius Xm Radio Inc. Systems and methods for implementing efficient cross-fading between compressed audio streams

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
GB0003960D0 (en) * 2000-02-18 2000-04-12 Pfizer Ltd Purine derivatives
TW524330U (en) 2001-09-11 2003-03-11 Inventec Corp Multi-purposes image capturing module
EP1440433B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
KR20050097989A (ko) * 2003-02-06 2005-10-10 돌비 레버러토리즈 라이쎈싱 코오포레이션 연속 백업 오디오
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
PL1839297T3 (pl) * 2005-01-11 2019-05-31 Koninklijke Philips Nv Skalowalne kodowanie/dekodowanie sygnałów audio
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
KR20070003574A (ko) * 2005-06-30 2007-01-05 엘지전자 주식회사 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR100857102B1 (ko) * 2005-07-29 2008-09-08 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법
EP1946062A4 (en) * 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
KR100878766B1 (ko) 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
EP4325723A3 (en) * 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
MX2011000382A (es) * 2008-07-11 2011-02-25 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.
RU2491658C2 (ru) 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2730200C (en) 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2380172B1 (en) * 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
CA3076203C (en) * 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
KR20100089772A (ko) * 2009-02-03 2010-08-12 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
WO2010117327A1 (en) 2009-04-07 2010-10-14 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for providing a backwards compatible payload format
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8515768B2 (en) 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
KR101701759B1 (ko) * 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
JP5771618B2 (ja) * 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
PT2491553T (pt) * 2009-10-20 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo
CA2862715C (en) * 2009-10-20 2017-10-17 Ralf Geiger Multi-mode audio codec and celp coding adapted therefore
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
EP2510515B1 (en) 2009-12-07 2014-03-19 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
RU2683175C2 (ru) * 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
PL3779979T3 (pl) 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
ES2719102T3 (es) 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
CN102254560B (zh) * 2010-05-19 2013-05-08 安凯(广州)微电子技术有限公司 一种移动数字电视录像中的音频处理方法
US9117459B2 (en) * 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US8489391B2 (en) 2010-08-05 2013-07-16 Stmicroelectronics Asia Pacific Pte., Ltd. Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication
CA3220202A1 (en) * 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
CN102446506B (zh) * 2010-10-11 2013-06-05 华为技术有限公司 音频信号的分类识别方法及装置
WO2014124377A2 (en) 2013-02-11 2014-08-14 Dolby Laboratories Licensing Corporation Audio bitstreams with supplementary data and encoding and decoding of such bitstreams
US9093120B2 (en) * 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
JP5969513B2 (ja) * 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
PL3154057T3 (pl) 2011-04-05 2019-04-30 Nippon Telegraph & Telephone Dekodowanie sygnału akustycznego
EP2702589B1 (en) * 2011-04-28 2017-04-05 Dolby International AB Efficient content classification and loudness estimation
CN103548077B (zh) * 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
JP5843856B2 (ja) 2011-05-20 2016-01-13 株式会社ソシオネクスト ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
TWI651005B (zh) * 2011-07-01 2019-02-11 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
EP2786377B1 (en) * 2011-11-30 2016-03-02 Dolby International AB Chroma extraction from an audio codec
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
EP2950308B1 (en) 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
BR122022020326B1 (pt) * 2013-01-28 2023-03-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
MY172752A (en) 2013-01-29 2019-12-11 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
AU2014211479B2 (en) * 2013-01-29 2017-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN105408957B (zh) 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2830047A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI732403B (zh) 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10628134B2 (en) 2016-09-16 2020-04-21 Oracle International Corporation Generic-flat structure rest API editor
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
TWI834582B (zh) * 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2408089C9 (ru) * 2006-06-01 2011-04-27 Нокиа Корпорейшн Декодирование кодированных с предсказанием данных с использованием адаптации буфера
US8200481B2 (en) * 2007-09-15 2012-06-12 Huawei Technologies Co., Ltd. Method and device for performing frame erasure concealment to higher-band signal
US8494843B2 (en) * 2008-12-19 2013-07-23 Electronics And Telecommunications Research Institute Encoding and decoding apparatuses for improving sound quality of G.711 codec
WO2012110415A1 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
WO2013158804A1 (en) * 2012-04-17 2013-10-24 Sirius Xm Radio Inc. Systems and methods for implementing efficient cross-fading between compressed audio streams

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2806121C1 (ru) * 2019-11-27 2023-10-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования и способ декодирования для долговременного предсказания в частотной области тональных сигналов для кодировки аудио

Also Published As

Publication number Publication date
CN109065062B (zh) 2022-12-16
CN109360575A (zh) 2019-02-19
IL295809B1 (en) 2023-12-01
BR122020018629B1 (pt) 2022-11-22
CN108962269A (zh) 2018-12-07
EP3958259B1 (en) 2022-10-19
IL295809B2 (en) 2024-04-01
AR114578A2 (es) 2020-09-23
CN109273016A (zh) 2019-01-25
CN109243475B (zh) 2022-12-20
EP3268956A4 (en) 2018-11-21
BR122020018731B1 (pt) 2023-02-07
KR20170115101A (ko) 2017-10-16
US11842743B2 (en) 2023-12-12
JP2018508831A (ja) 2018-03-29
KR102445316B1 (ko) 2022-09-21
ZA201906647B (en) 2023-04-26
CN109461454B (zh) 2023-05-23
KR20210145299A (ko) 2021-12-01
RU2018126300A3 (ru) 2021-11-11
CN109461453B (zh) 2022-12-09
AU2016233669B2 (en) 2017-11-02
HUE061857T2 (hu) 2023-08-28
AR114580A2 (es) 2020-09-23
EP3598443B1 (en) 2021-03-17
CN109461454A (zh) 2019-03-12
JP6671429B2 (ja) 2020-03-25
ES2893606T3 (es) 2022-02-09
CN109273016B (zh) 2023-03-28
TW202226221A (zh) 2022-07-01
MX2020005843A (es) 2020-09-07
PL3657500T3 (pl) 2022-01-03
CN109509479B (zh) 2023-05-09
SG11201707459SA (en) 2017-10-30
AU2018260941A1 (en) 2018-11-29
MY184190A (en) 2021-03-24
AR114579A2 (es) 2020-09-23
DK3598443T3 (da) 2021-04-19
CN107430867B (zh) 2018-12-14
EP3657500B1 (en) 2021-09-15
US10734010B2 (en) 2020-08-04
US20180025737A1 (en) 2018-01-25
JP6383502B2 (ja) 2018-08-29
FI3985667T3 (fi) 2023-05-25
RU2764186C2 (ru) 2022-01-14
AU2020277092B2 (en) 2022-06-23
KR20210059806A (ko) 2021-05-25
KR20170113667A (ko) 2017-10-12
PL3268956T3 (pl) 2021-12-20
CA3210429A1 (en) 2016-09-22
WO2016146492A1 (en) 2016-09-22
KR102330202B1 (ko) 2021-11-24
JP7354328B2 (ja) 2023-10-02
CA2989595A1 (en) 2016-09-22
RU2760700C2 (ru) 2021-11-29
CN109273013B (zh) 2023-04-04
KR20180071418A (ko) 2018-06-27
CN109326295B (zh) 2023-06-20
CA3051966A1 (en) 2016-09-22
US20190172475A1 (en) 2019-06-06
BR112017019499B1 (pt) 2022-11-22
BR122020018736B1 (pt) 2023-05-16
CN109065063B (zh) 2023-06-16
KR20230144114A (ko) 2023-10-13
ZA201903963B (en) 2022-09-28
DK4198974T3 (da) 2024-03-18
PL4198974T3 (pl) 2024-05-06
JP2018165845A (ja) 2018-10-25
CN109360576B (zh) 2023-03-28
AU2018260941B9 (en) 2020-09-24
FI4141866T3 (fi) 2024-03-22
EP3268961B1 (en) 2020-01-01
RU2018126300A (ru) 2019-03-12
CN109410969B (zh) 2022-12-20
AR114577A2 (es) 2020-09-23
CN109509479A (zh) 2019-03-22
MX2017011490A (es) 2018-01-25
BR122020018676B1 (pt) 2023-02-07
BR112017019499A2 (pt) 2018-05-15
EP4328909A2 (en) 2024-02-28
US10262668B2 (en) 2019-04-16
DK3958259T3 (da) 2022-12-05
EP3268956A1 (en) 2018-01-17
RU2018118173A (ru) 2018-11-02
EP4336499A2 (en) 2024-03-13
AU2016233669A1 (en) 2017-09-21
CA2978915A1 (en) 2016-09-22
AU2018260941B2 (en) 2020-08-27
PL3598443T3 (pl) 2021-07-12
EP3958259A1 (en) 2022-02-23
CL2017002268A1 (es) 2018-01-26
EP3657500A1 (en) 2020-05-27
US20200411024A1 (en) 2020-12-31
EP3985667A1 (en) 2022-04-20
CN109243475A (zh) 2019-01-18
CN109273014A (zh) 2019-01-25
CN109003616A (zh) 2018-12-14
CN107430867A (zh) 2017-12-01
CN109360576A (zh) 2019-02-19
CN108962269B (zh) 2023-03-03
TWI758146B (zh) 2022-03-11
US20180322889A1 (en) 2018-11-08
JP2023029578A (ja) 2023-03-03
HUE057183T2 (hu) 2022-04-28
CN109243474B (zh) 2023-06-16
CN109065062A (zh) 2018-12-21
EP4336499A3 (en) 2024-05-01
KR20230005419A (ko) 2023-01-09
SG10201802002QA (en) 2018-05-30
CA3135370C (en) 2024-01-02
US20200111502A1 (en) 2020-04-09
KR102269858B1 (ko) 2021-06-28
US20230368805A1 (en) 2023-11-16
US10943595B2 (en) 2021-03-09
JP2023164629A (ja) 2023-11-10
CN109360575B (zh) 2023-06-27
CA3135370A1 (en) 2016-09-22
EP4198974A1 (en) 2023-06-21
EP3598443A1 (en) 2020-01-22
DK3657500T3 (da) 2021-11-08
EP4328909A3 (en) 2024-04-24
CN109461452B (zh) 2023-04-07
EP3985667B1 (en) 2023-04-26
TWI693594B (zh) 2020-05-11
RU2018118173A3 (ru) 2021-09-16
KR102255142B1 (ko) 2021-05-24
KR20210079406A (ko) 2021-06-29
CA2978915C (en) 2018-04-24
JP2020101824A (ja) 2020-07-02
AU2022204887B2 (en) 2024-05-16
HUE057225T2 (hu) 2022-04-28
CN109326295A (zh) 2019-02-12
AU2017251839B2 (en) 2018-11-15
US20220293116A1 (en) 2022-09-15
TW202203206A (zh) 2022-01-16
IL254195B (en) 2018-03-29
PL3268961T3 (pl) 2020-05-18
CN109243474A (zh) 2019-01-18
KR102321882B1 (ko) 2021-11-05
US20180025738A1 (en) 2018-01-25
PL3958259T3 (pl) 2023-02-13
US20200005804A1 (en) 2020-01-02
JP6383501B2 (ja) 2018-08-29
WO2016149015A1 (en) 2016-09-22
KR20220132653A (ko) 2022-09-30
JP7503666B2 (ja) 2024-06-20
AU2024203127A1 (en) 2024-05-30
JP2022066477A (ja) 2022-04-28
KR20180088755A (ko) 2018-08-06
ZA202106847B (en) 2023-03-29
US10453468B2 (en) 2019-10-22
IL254195A0 (en) 2017-10-31
CA3051966C (en) 2021-12-14
CN109065063A (zh) 2018-12-21
KR102585375B1 (ko) 2023-10-06
KR20210134434A (ko) 2021-11-09
AU2022204887A1 (en) 2022-07-28
AU2017251839A1 (en) 2017-11-16
ES2933476T3 (es) 2023-02-09
CN109273013A (zh) 2019-01-25
EP4198974B1 (en) 2024-02-07
JP6671430B2 (ja) 2020-03-25
BR122019004614B1 (pt) 2023-03-14
FI4198974T3 (fi) 2024-03-21
CN108899039A (zh) 2018-11-27
CN108899039B (zh) 2023-05-23
CN109410969A (zh) 2019-03-01
US11417350B2 (en) 2022-08-16
HUE060688T2 (hu) 2023-04-28
US20210142813A1 (en) 2021-05-13
KR102481326B1 (ko) 2022-12-28
JP2018508830A (ja) 2018-03-29
CN108899040A (zh) 2018-11-27
CN108899040B (zh) 2023-03-10
DK4141866T3 (da) 2024-03-18
BR112017018548A2 (pt) 2018-04-24
DK3985667T3 (da) 2023-05-22
US11367455B2 (en) 2022-06-21
EP4141866A1 (en) 2023-03-01
BR122020018627B1 (pt) 2022-11-01
EP3268956B1 (en) 2021-09-01
IL307827A (en) 2023-12-01
CN109461452A (zh) 2019-03-12
EP4141866B1 (en) 2024-01-17
AR114572A2 (es) 2020-09-23
ZA202209998B (en) 2024-02-28
EP3268961A1 (en) 2018-01-17
CN109273014B (zh) 2023-03-10
CN107408391B (zh) 2018-11-13
CN109273015B (zh) 2022-12-09
ES2897660T3 (es) 2022-03-02
CN109461453A (zh) 2019-03-12
AR114573A2 (es) 2020-09-23
CN107408391A (zh) 2017-11-28
US20220293115A1 (en) 2022-09-15
TW202242853A (zh) 2022-11-01
JP2018165844A (ja) 2018-10-25
AU2020277092A1 (en) 2020-12-17
US10553232B2 (en) 2020-02-04
BR112017018548B1 (pt) 2022-11-22
US10134413B2 (en) 2018-11-20
AR114575A2 (es) 2020-09-23
TW201643864A (zh) 2016-12-16
KR101871643B1 (ko) 2018-06-26
US10262669B1 (en) 2019-04-16
JP7038747B2 (ja) 2022-03-18
PL4141866T3 (pl) 2024-05-06
RU2658535C1 (ru) 2018-06-22
TWI771266B (zh) 2022-07-11
KR101884829B1 (ko) 2018-08-03
IL295809A (en) 2022-10-01
CN109273015A (zh) 2019-01-25
US20190103123A1 (en) 2019-04-04
US11664038B2 (en) 2023-05-30
AR114574A2 (es) 2020-09-23
CA2989595C (en) 2019-10-15
EP3958259B8 (en) 2022-11-23
AR114576A2 (es) 2020-09-23
CN109003616B (zh) 2023-06-16
BR122020018673B1 (pt) 2023-05-09
PL3985667T3 (pl) 2023-07-17
ES2946760T3 (es) 2023-07-25
AR103856A1 (es) 2017-06-07
KR102530978B1 (ko) 2023-05-11

Similar Documents

Publication Publication Date Title
RU2665887C1 (ru) Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе
IL285643B2 (en) Decoding bitstreams with a spectral band duplication meta-method enhanced by at least one filler element