RU2504026C2 - Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера - Google Patents

Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера Download PDF

Info

Publication number
RU2504026C2
RU2504026C2 RU2010145274/08A RU2010145274A RU2504026C2 RU 2504026 C2 RU2504026 C2 RU 2504026C2 RU 2010145274/08 A RU2010145274/08 A RU 2010145274/08A RU 2010145274 A RU2010145274 A RU 2010145274A RU 2504026 C2 RU2504026 C2 RU 2504026C2
Authority
RU
Russia
Prior art keywords
signal
reconstructed
encoder
energy
encoded
Prior art date
Application number
RU2010145274/08A
Other languages
English (en)
Other versions
RU2010145274A (ru
Inventor
Удар МИТТАЛ
Джеймс П. ЭШЛИ
Джонатан А. ГИББС
Original Assignee
Моторола Мобилити, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Моторола Мобилити, Инк. filed Critical Моторола Мобилити, Инк.
Publication of RU2010145274A publication Critical patent/RU2010145274A/ru
Application granted granted Critical
Publication of RU2504026C2 publication Critical patent/RU2504026C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)

Abstract

В селективном кодере сигнала входной сигнал сначала кодируется (1004) с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. Кодированный сигнал базового уровня декодируется (1006) для получения восстановленного сигнала, и сигнал ошибки генерируется (1008) как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается (1010) с входным сигналом. Один из двух или более кодеров уровня расширения выбираются (1014, 1016) в зависимости от сравнения и используются для кодирования сигнала ошибки. Кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся (1018) в канал (например, для передачи или хранения). Технический результат - высококачественное воспроизведение речи и аудио при приемлемо низких скоростях данных. 3 н. и 15 з.п. ф-лы, 10 ил.

Description

Передача текста, изображений, голоса и речевых сигналов по каналам связи, включая Интернет, быстро расширяется, как и предоставление мультимедийных услуг, способных размещать различные типы информации, такие как текст, изображения и музыка. Мультимедийные сигналы, включая речевые и музыкальные сигналы, требуют большой ширины полосы во время передач. Таким образом, для передачи мультимедийных данных, включая текст, изображения и аудио, весьма желательно, чтобы эти данные были сжаты.
Сжатие цифровых речевых и аудио сигналов хорошо известно. Сжатие, как правило, требуется, чтобы эффективно передавать сигналы по каналам связи или хранить сжатые сигналы на цифровых мультимедийных устройствах, таких как жесткий диск компьютера или устройство твердотельной памяти.
Фундаментальным принципом сжатия данных является устранение избыточных данных. Данные могут быть сжаты путем устранения избыточной информации, например, когда звук повторяется, является прогнозируемым или перцепционно избыточным. При этом принимается во внимание нечувствительность человека к высоким частотам.
Как правило, сжатие приводит к искажениям сигнала, причем более высокие степени сжатия приводят к увеличенным искажениям. Битовый поток называется масштабируемым, когда части потока могут быть удалены таким образом, что полученный в результате подпоток формирует другой действительный поток битов для некоторого целевого декодера, и подпоток представляет исходный контент с качеством восстановления, которое ниже, чем качество полного исходного потока битов, но является высоким, принимая во внимание меньшее количество оставшихся данных. Потоки битов, которые не обеспечивают это свойство, называют одноуровневыми потоками битов. Обычными режимами масштабируемости являются временная, пространственная масштабируемость и масштабируемость качества. Масштабируемость позволяет корректировать сжатый сигнал для достижения оптимальных рабочих характеристик в ограниченном по полосе канале.
Масштабируемость может быть реализована таким образом, что предусматривается несколько уровней кодирования, в том числе базовый уровень и по меньшей мере один уровень расширения, и соответствующие уровни формируются так, чтобы иметь различные разрешения.
Хотя многие схемы кодирования являются обобщенными, некоторые схемы кодирования включают в себя модели сигнала. В общем, лучшее сжатие сигнала достигается тогда, когда модель характеризует кодируемый сигнал. Таким образом, известен выбор схемы кодирования на основе классификации типа сигнала. Например, голосовой сигнал может моделироваться и кодироваться иным образом, чем музыкальный сигнал. Однако классификация сигнала в общем случае является сложной задачей.
Пример способа сжатия (или кодирования), который остается очень популярным для цифрового кодирования речи, известен как линейное предсказание с кодовым возбуждением (CELP), который является одним из семейства алгоритмов кодирования путем “анализа через синтез”. Анализ через синтез в общем случае относится к процессу кодирования, в котором множество параметров цифровой модели используются для синтеза набора сигналов-кандидатов, которые сравниваются с входным сигналом и анализируются на предмет искажения. Набор параметров, которые дают наиболее низкое искажение, затем либо передается, либо сохраняется и в конечном итоге используется для восстановления оценки первоначального входного сигнала. CELP является конкретным способом анализа через синтез, который использует одну или более кодовых книг, каждая из которых, по существу, содержит множество кодов-векторов, которые извлекаются из кодовой книги в ответ на индекс кодовой книги.
В современных CELP кодерах имеется проблема с поддержанием высококачественного воспроизведения речи и аудио при приемлемо низких скоростях данных. Это, в частности, справедливо для музыкальных или других обобщенных аудио сигналов, которые не соответствуют CELP речевой модели с высокой степенью точности. В этом случае несоответствие модели может вызвать серьезное ухудшение качества аудио, что может быть неприемлемым для конечного пользователя оборудования, которое использует подобные методы.
Краткое описание чертежей
Иллюстрирующие чертежи, на которых одинаковые ссылочные позиции относятся к идентичным или функционально подобным элементам на отдельных видах, и которые вместе с подробным описанием, приведенным ниже, включены в состав и образуют часть спецификации, служат дальнейшей иллюстрации различных вариантов осуществления и объяснению различных принципов и преимуществ в соответствии с настоящим изобретением.
Фиг.1 - блок-схема системы кодирования и системы декодирования известного уровня техники.
Фиг.2 - блок-схема системы кодирования и системы декодирования в соответствии с некоторыми вариантами осуществления изобретения.
Фиг.3 - блок-схема способа выбора системы кодирования в соответствии с некоторыми вариантами осуществления изобретения.
Фиг.4-6 - ряд графиков, показывающих приведенные для примера сигналы в компараторе/селекторе в соответствии с некоторыми вариантами осуществления изобретения, когда вводится речевой сигнал.
Фиг.7-9 - ряд графиков, показывающих приведенные для примера сигналы в компараторе/селекторе в соответствии с некоторыми вариантами осуществления изобретения, когда вводится музыкальный сигнал.
Фиг.10 - блок-схема способа для селективного кодирования сигнала в соответствии с некоторыми вариантами осуществления изобретения.
Специалистам в данной области должно быть понятно, что элементы на чертежах проиллюстрированы для простоты и ясности и не обязательно должны быть представлены в масштабе. Например, размеры некоторых элементов на чертежах могут быть преувеличены относительно других элементов, чтобы способствовать лучшему пониманию вариантов осуществления настоящего изобретения.
Подробное описание
Перед подробным описанием вариантов осуществления в соответствии с настоящим изобретением следует отметить, что варианты осуществления заключаются главным образом в комбинациях этапов способа и компонентов устройства, относящихся к селективному кодированию сигнала на основе соответствующей модели. Соответственно, компоненты устройства и этапы способа представлены, где уместно, обычными символами на чертежах, показывающих только те конкретные делали, которые существенны для понимания вариантов осуществления настоящего изобретения, чтобы не загромождать раскрытие изобретения деталями, которые будут очевидны специалистам в данной области техники на основе представленного описания.
В этом документе относительные термины, такие как «первый» и «второй», «верхний» и «нижний» и т.п., могут быть использованы исключительно для отличия одного объекта или действия от другого объекта или действия, без обязательного требования какого-либо действительного такого отношения или порядка между такими объектами или действиями. Термины “содержит”, “содержащий” или какие-либо другие их вариации предназначены, чтобы охватывать неисключительное включение, так что процесс, способ, изделие или устройство, которое содержит перечень элементов, включает не только эти элементы, но может включать другие элементы, не перечисленные в явном виде или присущие такому процессу, способу, изделию или устройству. Элемент, которому предшествует слово “содержит…”, без больших ограничений, не препятствует существованию дополнительных идентичных элементов в процессе, способе, изделии или устройстве, которые включают в себя этот элемент.
Следует отметить, что варианты осуществления изобретения, описанного здесь, могут включать в себя один или более обычных процессоров и уникальные сохраненные программные инструкции, которые управляют одним или более процессорами для реализации, во взаимосвязи с некоторыми непроцессорными схемами, некоторых, большинства или всех, функций селективного кодирования сигнала на основе подбора модели, описанного здесь. Альтернативно, некоторые или все функции могут быть реализованы посредством конечного автомата, который не имеет сохраненных программных инструкций, или в одной или более специализированных интегральных микросхемах (ASIC), в которых каждая функция или некоторые комбинации определенных функций реализованы в виде заказных логических схем. Разумеется, может быть использована комбинация двух подходов. Таким образом, здесь описаны способы и средства для выполнения этих функций. Кроме того, ожидается, что специалист, несмотря на возможно значительные усилия и большое количество вариантов проектирования, мотивированный, например, располагаемым временем, современной технологией и экономическими соображениями, руководствуясь концепциями и принципами, описанными здесь, сможет создать такие инструкции программного обеспечения и программы и микросхемы при минимальном объеме экспериментирования.
Фиг. 1 представляет собой блок-схему встроенной системы кодирования и декодирования 100 известного уровня техники. На фиг.1 исходный сигнал s(n) 102 подается на вход кодера 104 базового уровня от системы кодирования. Кодер 104 базового уровня кодирует сигнал 102 и формирует кодированный сигнал 106 базового уровня. Кроме того, исходный сигнал 102 вводится в кодер 108 уровня расширения системы кодирования. Кодер 108 уровня расширения также принимает первый восстановленный сигнал sc(n) 110 в качестве входа. Первый восстановленный сигнал 110 формируется путем передачи кодированного сигнала 106 базового уровня через первый декодер 112 базового уровня. Кодер 108 уровня расширения используется для кодирования дополнительной информации на основе некоторого сравнения сигналов s(n) (102) и sc(n) (110) и может дополнительно использовать параметры из кодера 104 базового уровня. В одном варианте осуществления кодер 108 уровня расширения кодирует сигнал ошибки, который является разностью между восстановленным сигналом 110 и входным сигналом 102. Кодер 108 уровня расширения формирует кодированный сигнал 114 уровня расширения. Как кодированный сигнал 106 базового уровня, так и кодированный сигнал 114 уровня расширения передаются в канал 116. Канал представляет собой среду, такую как канал связи и/или носитель хранения.
После прохождения через канал второй восстановленный сигнал 118 формируется путем передачи принятого кодированного сигнала 106' базового уровня через второй декодер 120 базового уровня. Второй декодер 120 базового уровня выполняет ту же функцию, что и первый декодер 112 базового уровня. Если кодированный сигнал 114 уровня расширения также передан через канал 116 и принят как сигнал 114', он может быть передан на декодер 122 уровня расширения. Декодер 122 уровня расширения также принимает второй восстановленный сигнал 118 в качестве входа и формирует третий восстановленный сигнал 124 в качестве выхода. Третий восстановленный сигнал 124 согласуется с исходным сигналом 102 более точно, чем второй восстановленный сигнал 118.
Кодированный сигнал 114 уровня расширения включает в себя дополнительную информацию, которая позволяет восстанавливать сигнал 102 более точно, чем второй восстановленный сигнал 118. То есть это является расширенным (улучшенным) восстановлением.
Одним из преимуществ такой встроенной системы кодирования является то, что конкретный канал 116 не способен последовательно поддерживать требование к ширине полосы, ассоциированное с алгоритмами кодирования аудио высокого качества. Встроенный кодер, однако, позволяет принимать часть потока битов (к примеру, только поток битов базового уровня) из канала 116 для формирования, например, только базового выходного аудио, когда поток битов уровня расширения потерян или искажен. Однако имеются компромиссы по качеству между встроенными и невстроенными кодерами, а также между различными целями оптимизации встроенного кодирования. То есть кодирование уровня расширения более высокого качества может способствовать достижению лучшего баланса между базовым уровнем и уровнем расширения, а также уменьшить общую скорость передачи данных для улучшения характеристик передачи (к примеру, снижение перегрузки), что может привести к снижению частоты появления пакетных ошибок для уровней расширения.
Хотя многие схемы кодирования являются обобщенными, некоторые схемы кодирования включают в себя модели сигнала. В общем, лучшее сжатие сигнала достигается тогда, когда модель представляет кодируемый сигнал. Таким образом, известно, что схема кодирования выбирается после классификации типа сигнала. Например, голосовой сигнал может моделироваться и кодироваться иным образом, чем музыкальный сигнал. Однако, классификация сигнала, как правило, является трудной задачей.
Фиг.2 представляет собой блок-схему системы 200 кодирования и декодирования в соответствии с некоторыми вариантами осуществления изобретения. Согласно Фиг.2 исходный сигнал 102 вводится в кодер 104 базового уровня системы кодирования. Исходный сигнал 102 может быть речевым/аудио сигналом или другим видом сигнала. Кодер 104 базового уровня кодирует сигнал 102 и формирует кодированный сигнал 106 базового уровня. Первый восстановленный сигнал 110 формируется путем передачи кодированного сигнала 106 базового уровня через первый декодер 112 базового уровня. Исходный сигнал 102 и первый восстановленный сигнал 110 сравниваются в модуле 202 компаратора/селектора. Модуль 202 компаратора/селектора сравнивает исходный сигнал 102 с первым восстановленным сигналом 110 и, основываясь на сравнении, формирует селекторный сигнал 204, который выбирает, какой из кодеров 206 уровня расширения использовать. Хотя только два кодера уровня расширения показаны на чертеже, должно быть понятно, что может быть использовано множество кодеров уровня расширения. Модуль 202 компаратора/селектора 202 выбрать кодер уровня расширения, чтобы с наибольшей вероятностью формировать наилучший восстановленный сигнал.
Хотя декодер 112 расширения показан как принимающий кодированный сигнал 106 базового уровня, который, соответственно, послан в канал 116, физическое соединение между элементами 104 и 106 может допускать более эффективную реализацию, так что общие элементы обработки и/или состояния могут совместно использоваться, и, таким образом, не потребовалась бы регенерация или дублирование.
Каждый кодер 206 уровня расширения принимает исходный сигнал 102 и первый восстановленный сигнал в качестве входов (или сигнал такой, как разностный сигнал, полученный из этих сигналов), и выбранный кодер формирует кодированный сигнал 208 уровня расширения. В одном варианте осуществления кодер 206 уровня расширения кодирует сигнал ошибки, который является разностью между восстановленным сигналом 110 и входным сигналом 102. Кодированный сигнал 208 уровня расширения содержит дополнительную информацию, основанную на сравнении сигналов s(n) (102) и sc(n) (110). Дополнительно он может использовать параметры из декодера 104 базового уровня. Кодированный сигнал 106 базового уровня, кодированный сигнал 208 уровня расширения и селекторный сигнал 204 все передаются в канал 116. Канал представляет собой среду, такую как канал связи и/или носитель хранения.
После прохождения через канал второй восстановленный сигнал 118 формируется путем передачи принятого кодированного сигнала 106' базового уровня через второй декодер 120 базового уровня. Второй декодер 120 базового уровня выполняет те же функции, что и первый декодер 112 базового уровня. Если кодированный сигнал 208 уровня расширения также передается через канал 116 и принимается как сигнал 208', он может быть передан на декодер 210 уровня расширения. Декодер 210 уровня расширения также принимает второй восстановленный сигнал 118 и принятый селекторный сигнал 204' в качестве входов и формирует третий восстановленный сигнал 212 в качестве выхода. Работа декодера 210 уровня расширения зависит от принятого селекторного сигнала 204'. Третий восстановленный сигнал 212 согласуется с исходным сигналом 102 более точно, чем второй восстановленный сигнал 118.
Кодированный сигнал 208 уровня расширения включает в себя дополнительную информацию, поэтому третий восстановленный сигнал 212 согласуется с сигналом 102 более точно, чем второй восстановленный сигнал 118.
Фиг.3 представляет собой блок-схему способа для выбора системы кодирования в соответствии с некоторыми вариантами осуществления изобретения. В частности, фиг.3 описывает работу модуля компаратора/селектора в варианте осуществления изобретения. После блока 302 начала входной сигнал (102 на фиг.2) и восстановленный сигнал (110 на фиг.2) преобразуются, если требуется, в выбранную область сигнала. Сигналы временной области могут быть использованы без преобразования, или в блоке 304 сигналы могут быть преобразованы в спектральную область, такую как частотная область, область модифицированного дискретного косинусного преобразования (МДКП) или вэйвлетную область, а также могут быть обработаны другими дополнительными элементами, такими как перцепционное взвешивание некоторой частоты или временных характеристик сигналов. Преобразованный входной сигнал (или сигнал временной области) обозначается как S(k) для спектрального компонента k, и преобразованный восстановленный сигнал (или сигнал временной области) обозначается как Sc(k) для спектрального компонента k. Для каждого компонента k в выбранном наборе компонентов (которые могут быть всеми или только некоторыми из компонентов) энергия E_tot во всех компонентах Sc(k) восстановленного сигнала сравнивается с энергией E_err в тех компонентах, которые больше (например, с некоторым коэффициентом), чем соответствующий компонент S(k) исходного входного сигнала.
В то время как компоненты входного и восстановленного сигналов могут существенно отличаться по амплитуде, значительное увеличение по амплитуде компонента восстановленного сигнала свидетельствуют о плохо смоделированном входном сигнале. Как таковой, компонент восстановленного сигнала меньшей амплитуды может быть скомпенсирован посредством заданного способа кодирования уровня расширения, в то время как компонент восстановленного сигнала большей амплитуды (то есть плохо смоделированный) может лучше подходить для альтернативного способа кодирования уровня расширения. Один такой альтернативный способ кодирования уровня расширения может использовать снижение энергии некоторых компонентов восстановленного сигнал перед кодированием уровня расширения, так что слышимые шумы или искажения, получаемые в результате рассогласования модели сигнала базового уровня, уменьшаются.
Согласно фиг.3 цикл компонентов инициализируется в блоке 306, где компонент k инициализируется, и меры энергии E_tot и E_err инициализируются в нуль. В решающем блоке 308 выполняется проверка, чтобы определить, является ли абсолютное значение компонента восстановленного сигнал значительно большим, чем соответствующий компонент входного сигнала. Если он значительно больше, как обозначено положительной ветвью от решающего блока 308, компонент добавляется к энергии ошибки E_err в блоке 310, и обработка переходит к блоку 312. В блоке 312 компонент восстановленных сигналов добавляется к полному значению энергии E_tot. В решающем блоке 314 значение компонента получает приращение, и выполняется проверка, чтобы определить, все ли компоненты были обработаны. Если нет, как показано отрицательной ветвью от решающего блока 314, обработка возвращается в блок 308. В противном случае, как изображено положительной ветвью от решающего блока 316, цикл завершается, и общая накопленная энергия сравнивается в решающем блоке 316. Если энергия ошибки E_err значительно ниже, чем общая энергия E_tot, как показано отрицательной ветвью от решающего блока 316, то в блоке 318 выбирается уровень расширения типа 1. В противном случае, как изображено положительной ветвью от решающего блока 316, в блоке 320 выбирается уровень расширения типа 2. Обработка этого блока входного сигнала завершается в блоке 322.
Для специалистов в данной области техники будет очевидным, что и другие меры энергии сигнала могут быть использованы, например абсолютное значение компонента в некоторой степени. Например, энергия компонента Sc(k) может быть оценена как |Sc(к)|p, а энергия компонента S(k) может быть оценена как |Sc(к)|p, где P - число больше нуля.
Для специалистов в данной области техники будет очевидным, что энергию ошибки E_err можно сравнить с полной энергией во входном сигнале, а не с полной энергией в восстановленном сигнале.
Кодер может быть реализован на запрограммированном процессоре. Например, листинг кода, соответствующий фиг.3, приведен ниже. Переменные energy_tot и energy_err обозначены на чертеже как E_tot и E_err соответственно
Figure 00000001
Figure 00000002
В этом примере пороговые значения Tresh1 и Tresh2 установлены на 0,49 и 0,264 соответственно. Другие значения могут быть использованы в зависимости от используемых типов кодеров уровня расширения, а также в зависимости от используемой области преобразования.
Может быть добавлен этап гистерезиса, так чтобы тип уровня расширения изменялся только в том случае, если определенное число блоков сигнала имеют тот же самый тип. Например, если используется тип 1 кодера, то тип 2 не будет выбран до тех пор, пока два последовательных блока не покажут использование типа 2.
Фиг.4-6 представляет собой ряд графиков, показывающих приведенные для примера результаты для речевого сигнала. График 402 на фиг.4 показывает энергию E_tot восстановленного сигнала. Энергия вычисляется в течение 20 миллисекундных кадров, так что график показывает изменение энергии сигнала в течение 10 секундного интервала. График 502 на фиг.5 показывает отношение энергии ошибки E_err к полной энергии E_tot за тот же период времени. Пороговое значение Thresh2 показано как пунктирная линия 504. Речевой сигнал в кадрах, где отношение превышает порог, не удовлетворительно смоделирован кодером. Однако для большинства кадров порог не превышен. График 602 на фиг.6 показывает селекторный или решающий сигнал за тот же период времени. В этом примере значение 0 указывает, что выбран кодер уровня расширения типа 1, а значение 1 указывает, что выбран кодер уровня расширения типа 2. Изолированные кадры, где отношение выше, чем порог, игнорируются, и выбор изменяется только тогда, когда два последовательных кадра указывают на тот же выбор. Так, например, кодер уровня расширения типа 1 выбирается для кадра 141, даже если отношение превышает порог.
Фиг.7-9 показывают соответствующий ряд графиков музыкального сигнала. График 702 на фиг.7 показывает энергию E_tot входного сигнала. Вновь, энергия рассчитывается в течение 20 миллисекундных кадров, так что график показывает изменение входной энергии в течение 10 секундного интервала. Участок 802 на фиг.8 показывает отношение энергии ошибки E_err к общей энергии E_tot за тот же период времени. Пороговое значение Thresh2 показано как пунктирная линия 504. Музыкальный сигнал в кадрах, где отношение превышает порог, не удовлетворительно смоделировано кодером. Это имеет место для большинства кадров, так как базовый кодер предназначен для речевых сигналов. График 902 на фиг.9 показывает селекторный или решающий сигнал за тот же период времени. Вновь, значение 0 указывает, что выбирается кодер уровня расширения типа 1, а значение 1 указывает, что выбирается кодер уровня расширения типа 2. Таким образом, кодер уровня расширения типа 2 выбран для большей части времени. Однако в кадрах, где базовый кодер работает хорошо для музыкального сигнала, выбирается кодер уровня расширения типа 1.
В тесте на 22803 кадрах речевого сигнала кодер уровня расширения типа 2 был выбран только в 227 кадрах, то есть лишь 1% времени. В тесте на 29644 кадрах музыкального сигнала кодер уровня расширения типа 2 был выбран в 16145 кадрах, то есть 54% времени. В других кадрах базовый кодер хорошо работает для музыкального сигнала, а для речевого сигнала выбран кодер уровня расширения. Таким образом, компаратор/селектор не является классификатором речевого/музыкального сигнала. Это является отличием от предшествующих схем, которые стремятся классифицировать входной сигнал как речь или музыку, а затем выбирают схему кодирования соответствующим образом. Предложенный подход состоит в выборе кодера уровня расширения в зависимости от рабочих характеристик кодера базового уровня.
Фиг.10 представляет собой блок-схему, иллюстрирующую работу встроенного кодера в соответствии с некоторыми вариантами осуществления изобретения. Блок-схема показывает способ, используемый для кодирования одного кадра сигнальных данных. Длина кадра выбирается в зависимости от временной характеристики сигнала. Например, 20 мс кадр может использоваться для речевых сигналов. После блока 1002 начала на фиг.10 входной сигнал кодируется в блоке 1004 с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. В блоке 1006 кодированный сигнал базового уровня декодируется для формирования восстановленного сигнала. В этом варианте осуществления сигнал ошибки генерируется в блоке 1008 как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается с входным сигналом в блоке 1010, и в решающем блоке 1012 определяется, хорошо ли согласован восстановленный сигнал с входным сигналом. Если согласование хорошее, как показано положительной ветвью от решающего блока 1012, то кодер уровня расширения типа 1 используется для кодирования сигнала ошибки в блоке 1014. Если согласование не является хорошим, как изображено отрицательной ветвью от решающего блока 1012, то кодер уровня расширения типа 2 используется для кодирования сигнала ошибки в блоке 1016. В блоке 1018 кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся в канал (например, для передачи или хранения). Обработка кадра заканчивается в блоке 1020.
В этом варианте осуществления кодер уровня расширения реагирует на сигнал ошибки, однако в альтернативном варианте кодер уровня расширения реагирует на входной сигнал и дополнительно, при необходимости, один или несколько сигналов от кодера базового уровня и/или декодера базового уровня. В еще одном варианте осуществления используется альтернативный сигнал ошибки, например взвешенная разность между входным сигналом и восстановленным сигналом. Например, некоторые частоты восстановленного сигнала могут быть ослаблены до формирования сигнала ошибки. Полученный в результате сигнал ошибки может упоминаться как взвешенный сигнал ошибки.
В другом альтернативном варианте осуществления кодер и декодер базового уровня могут также включать в себя другие уровни расширения, и компаратор согласно настоящему изобретению может получать, в качестве входа, выход одного из предыдущих уровней расширения, как восстановленный сигнал. Кроме того, могут быть уровни расширения, последующие относительно вышеупомянутых уровней расширения, которые могут или не могут переключаться в результате сравнения. Например, встроенные системы кодирования могут содержать пять уровней. Базовый уровень (L1) и второй уровень (L2) может формировать восстановленный сигнал Sc(k). Восстановленный сигнал Sc(k) и входной сигнал S(k) могут быть использованы для выбора способов кодирования уровня расширения на уровнях 3 и 4 (L3, L4). Наконец, уровень 5 (L5) может включать в себя только один способ кодирования уровня расширения.
Кодер может выбирать между двумя или более кодерами уровня расширения в зависимости от сравнения между восстановленным сигналом и входным сигналом.
Кодер и декодер могут быть реализованы на запрограммированном процессоре, на реконфигурируемом процессоре или, например, на специализированной (ориентированной на приложение) интегральной схеме.
В предыдущем описании были описаны конкретные варианты осуществления изобретения. Однако специалисту в данной области техники должно быть понятно, что различные модификации и изменения могут быть выполнены без отклонения от объема настоящего изобретения, как изложено в формуле изобретения. Соответственно, описание и чертежи следует рассматривать в иллюстративном смысле, а не в качестве ограничения, и все такие изменения должны включаться в объем настоящего изобретения. Выгоды, преимущества, решения проблем и любой(ые) элемент(ы), которые могут обусловить то, что любая выгода, преимущество или решение возникают или становятся более выраженными, не следует рассматривать как критические, требуемые или существенные признаки или элементы любого или всех пунктов формулы изобретения. Изобретение определяется исключительно формулой изобретения, включая все изменения, сделанные в ходе рассмотрения настоящей заявки, и все эквиваленты пунктов формулы изобретения, с которой последует выдача патента.

Claims (18)

1. Способ кодирования входного сигнала, содержащий:
кодирование входного сигнала с использованием кодера базового уровня для формирования кодированного сигнала базового уровня;
декодирование кодированного сигнала базового уровня для формирования восстановленного сигнала;
сравнение восстановленного сигнала с входным сигналом, причем этап сравнения содержит оценивание энергии Е_err восстановленного сигнала, который содержит ошибки, определение, что отношение S(k)/Sc(k) компонента S(k) входного сигнала к компоненту Sc(k) восстановленного сигнала превышает пороговое значение, и суммирование энергий этих компонент Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение;
выбор кодера уровня расширения из множества кодеров уровня расширения в зависимости от сравнения между восстановленным сигналом и входным сигналом; и
генерацию кодированного сигнала уровня расширения с использованием выбранного кодера уровня расширения, причем кодированный сигнал уровня расширения зависит от входного сигнала.
2. Способ по п.1, дополнительно содержащий:
генерацию сигнала ошибки как разность между восстановленным сигналом и входным сигналом,
причем генерация кодированного сигнала уровня расширения включает в себя кодирование сигнала ошибки.
3. Способ по п.2, в котором сигнал ошибки содержит взвешенную разность между восстановленным сигналом и входным сигналом.
4. Способ по п.1, в котором сравнение восстановленного сигнала с входным сигналом включает в себя:
оценку энергии E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценку энергии Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнение энергии E_tot с энергией Е_err.
5. Способ по п.4, дополнительно содержащий:
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала,
причем преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МСКТ) и вейвлет-преобразования.
6. Способ по п.4, дополнительно содержащий:
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала; и
преобразование входного сигнала для формирования компонентов входного сигнала,
при этом преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МДКП) и вейвлет-преобразования.
7. Способ по п.1, в котором энергия компонента Sc(k) оценивается как |Sc(k)|p и в котором энергия компонента S(k) оценивается как |S(k)|р, Р - число больше нуля.
8. Способ по п.4, в котором сравнение энергии Е_tot с энергией Е_err включает в себя:
сравнение отношения энергий E_err/E_tot с пороговым значением.
9. Способ по п.1, в котором кодер базового уровня содержит речевой кодер.
10. Способ по п.1, дополнительно содержащий вывод кодированного сигнала базового уровня, кодированного сигнала уровня расширения и указателя выбранного кодера уровня расширения в канал.
11. Селективный кодер сигнала, содержащий:
кодер базового уровня, который принимает входной аудио сигнал, подлежащий кодированию, и формирует кодированный сигнал базового уровня;
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует восстановленный сигнал; и
множество кодеров уровня расширения, каждый из которых выбирается для кодирования сигнала ошибки, чтобы сформировать кодированный сигнал уровня расширения, причем сигнал ошибки содержит разность между входным сигналом и восстановленным сигналом; и
модуль компаратора/селектора, который выбирает кодер уровня расширения из множества кодеров уровня расширения в зависимости от сравнения входного сигнала и кодированного сигнала базового уровня,
при этом модуль компаратора/селектора оценивает энергию E_err восстановленного сигнала, который содержит ошибки, определяет отношение S(k)/Sc(k) компонента S (k) входного сигнала к компоненту Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение, и,
дополнительно при этом входной сигнал кодируется как кодированный сигнал базового уровня, кодированный сигнал уровня расширения и сигнал выбора выбранного кодера уровня расширения.
12. Селективный кодер сигнала по п.11, в котором кодер базового уровня включает в себя речевой кодер.
13. Селективный кодер сигнала по п.11, в котором модуль компаратора/селектора:
оценивает энергию E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценивает энергию Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнивает энергию E_tot с энергией Е_err.
14. Селективный кодер сигнала по п.13, в котором модуль компаратора/селектора сравнивает энергию E_tot с энергией Е_err путем сравнения отношения энергий E_err/E_tot с пороговым значением.
15. Селективный кодер сигнала по п.13, в котором компоненты восстановленного сигнала и компоненты входного сигнала вычисляются с помощью преобразования, выбранного из группы, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МДКП) и вейвлет-преобразования.
16. Селективный декодер сигнала, содержащий процессор, который включает в себя инструкции для декодирования исходного сигнала, который кодирован как кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбранного кодера уровня расширения, причем декодер содержит:
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует первый восстановленный сигнал; и
декодер уровня расширения, который принимает сигнал выбора для выбора кодера уровня расширения, который декодирует кодированный сигнал уровня расширения для формирования второго восстановленного сигнала.
17. Селективный декодер сигнала по п.16, в котором второй восстановленный сигнал включает в себя сигнал ошибки и в котором исходный сигнал восстанавливается в виде суммы восстановленного сигнала и сигнала ошибки.
18. Селективный декодер сигнала по п.16, в котором декодер уровня расширения реагирует на первый и второй восстановленные сигналы и кодированный сигнал уровня расширения и в котором второй восстановленный сигнал является оценкой исходного сигнала.
RU2010145274/08A 2008-04-09 2009-04-09 Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера RU2504026C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/099,842 2008-04-09
US12/099,842 US8639519B2 (en) 2008-04-09 2008-04-09 Method and apparatus for selective signal coding based on core encoder performance
PCT/US2009/039984 WO2009126759A1 (en) 2008-04-09 2009-04-09 Method and apparatus for selective signal coding based on core encoder performance

Publications (2)

Publication Number Publication Date
RU2010145274A RU2010145274A (ru) 2012-05-20
RU2504026C2 true RU2504026C2 (ru) 2014-01-10

Family

ID=40909774

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010145274/08A RU2504026C2 (ru) 2008-04-09 2009-04-09 Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера

Country Status (9)

Country Link
US (1) US8639519B2 (ru)
EP (1) EP2272063B1 (ru)
KR (1) KR101317530B1 (ru)
CN (1) CN102047325A (ru)
BR (1) BRPI0909487A8 (ru)
ES (1) ES2396481T3 (ru)
MX (1) MX2010011111A (ru)
RU (1) RU2504026C2 (ru)
WO (1) WO2009126759A1 (ru)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
EP2348504B1 (en) * 2009-03-27 2014-01-08 Huawei Technologies Co., Ltd. Encoding and decoding method and device
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
CN105580369B (zh) * 2013-03-11 2019-04-26 杜比实验室特许公司 使用分层编码对多格式高动态范围视频进行编解码的方法、装置及系统
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system
CN112639968A (zh) * 2018-08-30 2021-04-09 杜比国际公司 用于控制对经低比特率编码的音频的增强的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997015983A1 (en) * 1995-10-27 1997-05-01 Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. Method of and apparatus for coding, manipulating and decoding audio signals
WO2003073741A2 (en) * 2002-02-21 2003-09-04 The Regents Of The University Of California Scalable compression of audio and other signals
RU2006139794A (ru) * 2004-05-19 2008-06-27 Нокиа Корпорейшн (Fi) Поддержка переключения между режимами звукового кодера
RU2440627C2 (ru) * 2007-02-26 2012-01-20 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи в звукозаписи развлекательных программ

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4560977A (en) 1982-06-11 1985-12-24 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4670851A (en) 1984-01-09 1987-06-02 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4727354A (en) 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
JP2527351B2 (ja) 1987-02-25 1996-08-21 富士写真フイルム株式会社 画像デ―タの圧縮方法
US5067152A (en) 1989-01-30 1991-11-19 Information Technologies Research, Inc. Method and apparatus for vector quantization
DE68922610T2 (de) 1989-09-25 1996-02-22 Rai Radiotelevisione Italiana Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren.
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
WO1993018505A1 (en) 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6253185B1 (en) 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6904174B1 (en) 1998-12-11 2005-06-07 Intel Corporation Simplified predictive video encoder
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP4249821B2 (ja) 1998-08-31 2009-04-08 富士通株式会社 ディジタルオーディオ再生装置
CA2246532A1 (en) 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6453287B1 (en) 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6691092B1 (en) 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6418408B1 (en) 1999-04-05 2002-07-09 Hughes Electronics Corporation Frequency domain interpolative speech codec system
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6504877B1 (en) 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
JP4149637B2 (ja) 2000-05-25 2008-09-10 株式会社東芝 半導体装置
US6304196B1 (en) 2000-10-19 2001-10-16 Integrated Device Technology, Inc. Disparity and transition density control system and method
AUPR105000A0 (en) 2000-10-27 2000-11-23 Canon Kabushiki Kaisha Method for generating and detecting marks
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
JP3636094B2 (ja) 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6662154B2 (en) 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
KR100711989B1 (ko) 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
EP1619664B1 (en) 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
JP2005005844A (ja) 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
JP4123109B2 (ja) 2003-08-29 2008-07-23 日本ビクター株式会社 変調装置及び変調方法並びに復調装置及び復調方法
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
US20060022374A1 (en) 2004-07-28 2006-02-02 Sun Turn Industrial Co., Ltd. Processing method for making column-shaped foam
US6975253B1 (en) 2004-08-06 2005-12-13 Analog Devices, Inc. System and method for static Huffman decoding
US7161507B2 (en) 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
US20060047522A1 (en) 2004-08-26 2006-03-02 Nokia Corporation Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP5046652B2 (ja) 2004-12-27 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
US20060190246A1 (en) * 2005-02-23 2006-08-24 Via Telecom Co., Ltd. Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC
CN101138174B (zh) * 2005-03-14 2013-04-24 松下电器产业株式会社 可扩展解码装置和可扩展解码方法
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
CN101151658B (zh) * 2005-03-30 2011-07-06 皇家飞利浦电子股份有限公司 多声道音频编码和解码方法、编码器和解码器
US7885809B2 (en) 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
ES2356492T3 (es) * 2005-07-22 2011-04-08 France Telecom Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
WO2007026763A1 (ja) 2005-08-31 2007-03-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
JP5142723B2 (ja) * 2005-10-14 2013-02-13 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法
JP4969454B2 (ja) * 2005-11-30 2012-07-04 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
KR101366124B1 (ko) 2006-02-14 2014-02-21 오렌지 오디오 인코딩/디코딩에서의 인지 가중 장치
US8306827B2 (en) * 2006-03-10 2012-11-06 Panasonic Corporation Coding device and coding method with high layer coding based on lower layer coding results
US20070239294A1 (en) 2006-03-29 2007-10-11 Andrea Brueckner Hearing instrument having audio feedback capability
US7230550B1 (en) 2006-05-16 2007-06-12 Motorola, Inc. Low-complexity bit-robust method and system for combining codewords to form a single codeword
US7414549B1 (en) 2006-08-04 2008-08-19 The Texas A&M University System Wyner-Ziv coding based on TCQ and LDPC codes
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
WO2008062990A1 (en) * 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
EP2095365A4 (en) 2006-11-24 2009-11-18 Lg Electronics Inc METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
PL2311034T3 (pl) 2008-07-11 2016-04-29 Fraunhofer Ges Forschung Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio
US20100088090A1 (en) 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997015983A1 (en) * 1995-10-27 1997-05-01 Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. Method of and apparatus for coding, manipulating and decoding audio signals
WO2003073741A2 (en) * 2002-02-21 2003-09-04 The Regents Of The University Of California Scalable compression of audio and other signals
RU2006139794A (ru) * 2004-05-19 2008-06-27 Нокиа Корпорейшн (Fi) Поддержка переключения между режимами звукового кодера
RU2440627C2 (ru) * 2007-02-26 2012-01-20 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи в звукозаписи развлекательных программ

Also Published As

Publication number Publication date
US20090259477A1 (en) 2009-10-15
BRPI0909487A2 (pt) 2017-10-17
KR20110002088A (ko) 2011-01-06
BRPI0909487A8 (pt) 2018-04-03
EP2272063A1 (en) 2011-01-12
US8639519B2 (en) 2014-01-28
CN102047325A (zh) 2011-05-04
WO2009126759A1 (en) 2009-10-15
EP2272063B1 (en) 2012-11-28
MX2010011111A (es) 2011-02-23
RU2010145274A (ru) 2012-05-20
KR101317530B1 (ko) 2013-10-15
ES2396481T3 (es) 2013-02-21

Similar Documents

Publication Publication Date Title
RU2504026C2 (ru) Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера
KR101125429B1 (ko) 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
JP5722040B2 (ja) スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
KR101274827B1 (ko) 다수 채널 오디오 신호를 디코딩하기 위한 장치 및 방법, 및 다수 채널 오디오 신호를 코딩하기 위한 방법
US8442837B2 (en) Embedded speech and audio coding using a switchable model core
KR101275892B1 (ko) 오디오 신호를 인코딩하고 디코딩하기 위한 방법 및 장치
KR101180202B1 (ko) 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치
KR101274802B1 (ko) 오디오 신호를 인코딩하기 위한 장치 및 방법
US20100014679A1 (en) Multi-channel encoding and decoding method and apparatus
KR20080101873A (ko) 부호화/복호화 장치 및 방법
JP6170172B2 (ja) 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置
EP1441330B1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
Moreno Variable frame size for vector quantization and application to speech coding

Legal Events

Date Code Title Description
PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20141125

PC41 Official registration of the transfer of exclusive right

Effective date: 20180111