RU2504026C2 - Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера - Google Patents
Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера Download PDFInfo
- Publication number
- RU2504026C2 RU2504026C2 RU2010145274/08A RU2010145274A RU2504026C2 RU 2504026 C2 RU2504026 C2 RU 2504026C2 RU 2010145274/08 A RU2010145274/08 A RU 2010145274/08A RU 2010145274 A RU2010145274 A RU 2010145274A RU 2504026 C2 RU2504026 C2 RU 2504026C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- reconstructed
- encoder
- energy
- encoded
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
Abstract
В селективном кодере сигнала входной сигнал сначала кодируется (1004) с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. Кодированный сигнал базового уровня декодируется (1006) для получения восстановленного сигнала, и сигнал ошибки генерируется (1008) как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается (1010) с входным сигналом. Один из двух или более кодеров уровня расширения выбираются (1014, 1016) в зависимости от сравнения и используются для кодирования сигнала ошибки. Кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся (1018) в канал (например, для передачи или хранения). Технический результат - высококачественное воспроизведение речи и аудио при приемлемо низких скоростях данных. 3 н. и 15 з.п. ф-лы, 10 ил.
Description
Передача текста, изображений, голоса и речевых сигналов по каналам связи, включая Интернет, быстро расширяется, как и предоставление мультимедийных услуг, способных размещать различные типы информации, такие как текст, изображения и музыка. Мультимедийные сигналы, включая речевые и музыкальные сигналы, требуют большой ширины полосы во время передач. Таким образом, для передачи мультимедийных данных, включая текст, изображения и аудио, весьма желательно, чтобы эти данные были сжаты.
Сжатие цифровых речевых и аудио сигналов хорошо известно. Сжатие, как правило, требуется, чтобы эффективно передавать сигналы по каналам связи или хранить сжатые сигналы на цифровых мультимедийных устройствах, таких как жесткий диск компьютера или устройство твердотельной памяти.
Фундаментальным принципом сжатия данных является устранение избыточных данных. Данные могут быть сжаты путем устранения избыточной информации, например, когда звук повторяется, является прогнозируемым или перцепционно избыточным. При этом принимается во внимание нечувствительность человека к высоким частотам.
Как правило, сжатие приводит к искажениям сигнала, причем более высокие степени сжатия приводят к увеличенным искажениям. Битовый поток называется масштабируемым, когда части потока могут быть удалены таким образом, что полученный в результате подпоток формирует другой действительный поток битов для некоторого целевого декодера, и подпоток представляет исходный контент с качеством восстановления, которое ниже, чем качество полного исходного потока битов, но является высоким, принимая во внимание меньшее количество оставшихся данных. Потоки битов, которые не обеспечивают это свойство, называют одноуровневыми потоками битов. Обычными режимами масштабируемости являются временная, пространственная масштабируемость и масштабируемость качества. Масштабируемость позволяет корректировать сжатый сигнал для достижения оптимальных рабочих характеристик в ограниченном по полосе канале.
Масштабируемость может быть реализована таким образом, что предусматривается несколько уровней кодирования, в том числе базовый уровень и по меньшей мере один уровень расширения, и соответствующие уровни формируются так, чтобы иметь различные разрешения.
Хотя многие схемы кодирования являются обобщенными, некоторые схемы кодирования включают в себя модели сигнала. В общем, лучшее сжатие сигнала достигается тогда, когда модель характеризует кодируемый сигнал. Таким образом, известен выбор схемы кодирования на основе классификации типа сигнала. Например, голосовой сигнал может моделироваться и кодироваться иным образом, чем музыкальный сигнал. Однако классификация сигнала в общем случае является сложной задачей.
Пример способа сжатия (или кодирования), который остается очень популярным для цифрового кодирования речи, известен как линейное предсказание с кодовым возбуждением (CELP), который является одним из семейства алгоритмов кодирования путем “анализа через синтез”. Анализ через синтез в общем случае относится к процессу кодирования, в котором множество параметров цифровой модели используются для синтеза набора сигналов-кандидатов, которые сравниваются с входным сигналом и анализируются на предмет искажения. Набор параметров, которые дают наиболее низкое искажение, затем либо передается, либо сохраняется и в конечном итоге используется для восстановления оценки первоначального входного сигнала. CELP является конкретным способом анализа через синтез, который использует одну или более кодовых книг, каждая из которых, по существу, содержит множество кодов-векторов, которые извлекаются из кодовой книги в ответ на индекс кодовой книги.
В современных CELP кодерах имеется проблема с поддержанием высококачественного воспроизведения речи и аудио при приемлемо низких скоростях данных. Это, в частности, справедливо для музыкальных или других обобщенных аудио сигналов, которые не соответствуют CELP речевой модели с высокой степенью точности. В этом случае несоответствие модели может вызвать серьезное ухудшение качества аудио, что может быть неприемлемым для конечного пользователя оборудования, которое использует подобные методы.
Краткое описание чертежей
Иллюстрирующие чертежи, на которых одинаковые ссылочные позиции относятся к идентичным или функционально подобным элементам на отдельных видах, и которые вместе с подробным описанием, приведенным ниже, включены в состав и образуют часть спецификации, служат дальнейшей иллюстрации различных вариантов осуществления и объяснению различных принципов и преимуществ в соответствии с настоящим изобретением.
Фиг.1 - блок-схема системы кодирования и системы декодирования известного уровня техники.
Фиг.2 - блок-схема системы кодирования и системы декодирования в соответствии с некоторыми вариантами осуществления изобретения.
Фиг.3 - блок-схема способа выбора системы кодирования в соответствии с некоторыми вариантами осуществления изобретения.
Фиг.4-6 - ряд графиков, показывающих приведенные для примера сигналы в компараторе/селекторе в соответствии с некоторыми вариантами осуществления изобретения, когда вводится речевой сигнал.
Фиг.7-9 - ряд графиков, показывающих приведенные для примера сигналы в компараторе/селекторе в соответствии с некоторыми вариантами осуществления изобретения, когда вводится музыкальный сигнал.
Фиг.10 - блок-схема способа для селективного кодирования сигнала в соответствии с некоторыми вариантами осуществления изобретения.
Специалистам в данной области должно быть понятно, что элементы на чертежах проиллюстрированы для простоты и ясности и не обязательно должны быть представлены в масштабе. Например, размеры некоторых элементов на чертежах могут быть преувеличены относительно других элементов, чтобы способствовать лучшему пониманию вариантов осуществления настоящего изобретения.
Подробное описание
Перед подробным описанием вариантов осуществления в соответствии с настоящим изобретением следует отметить, что варианты осуществления заключаются главным образом в комбинациях этапов способа и компонентов устройства, относящихся к селективному кодированию сигнала на основе соответствующей модели. Соответственно, компоненты устройства и этапы способа представлены, где уместно, обычными символами на чертежах, показывающих только те конкретные делали, которые существенны для понимания вариантов осуществления настоящего изобретения, чтобы не загромождать раскрытие изобретения деталями, которые будут очевидны специалистам в данной области техники на основе представленного описания.
В этом документе относительные термины, такие как «первый» и «второй», «верхний» и «нижний» и т.п., могут быть использованы исключительно для отличия одного объекта или действия от другого объекта или действия, без обязательного требования какого-либо действительного такого отношения или порядка между такими объектами или действиями. Термины “содержит”, “содержащий” или какие-либо другие их вариации предназначены, чтобы охватывать неисключительное включение, так что процесс, способ, изделие или устройство, которое содержит перечень элементов, включает не только эти элементы, но может включать другие элементы, не перечисленные в явном виде или присущие такому процессу, способу, изделию или устройству. Элемент, которому предшествует слово “содержит…”, без больших ограничений, не препятствует существованию дополнительных идентичных элементов в процессе, способе, изделии или устройстве, которые включают в себя этот элемент.
Следует отметить, что варианты осуществления изобретения, описанного здесь, могут включать в себя один или более обычных процессоров и уникальные сохраненные программные инструкции, которые управляют одним или более процессорами для реализации, во взаимосвязи с некоторыми непроцессорными схемами, некоторых, большинства или всех, функций селективного кодирования сигнала на основе подбора модели, описанного здесь. Альтернативно, некоторые или все функции могут быть реализованы посредством конечного автомата, который не имеет сохраненных программных инструкций, или в одной или более специализированных интегральных микросхемах (ASIC), в которых каждая функция или некоторые комбинации определенных функций реализованы в виде заказных логических схем. Разумеется, может быть использована комбинация двух подходов. Таким образом, здесь описаны способы и средства для выполнения этих функций. Кроме того, ожидается, что специалист, несмотря на возможно значительные усилия и большое количество вариантов проектирования, мотивированный, например, располагаемым временем, современной технологией и экономическими соображениями, руководствуясь концепциями и принципами, описанными здесь, сможет создать такие инструкции программного обеспечения и программы и микросхемы при минимальном объеме экспериментирования.
Фиг. 1 представляет собой блок-схему встроенной системы кодирования и декодирования 100 известного уровня техники. На фиг.1 исходный сигнал s(n) 102 подается на вход кодера 104 базового уровня от системы кодирования. Кодер 104 базового уровня кодирует сигнал 102 и формирует кодированный сигнал 106 базового уровня. Кроме того, исходный сигнал 102 вводится в кодер 108 уровня расширения системы кодирования. Кодер 108 уровня расширения также принимает первый восстановленный сигнал sc(n) 110 в качестве входа. Первый восстановленный сигнал 110 формируется путем передачи кодированного сигнала 106 базового уровня через первый декодер 112 базового уровня. Кодер 108 уровня расширения используется для кодирования дополнительной информации на основе некоторого сравнения сигналов s(n) (102) и sc(n) (110) и может дополнительно использовать параметры из кодера 104 базового уровня. В одном варианте осуществления кодер 108 уровня расширения кодирует сигнал ошибки, который является разностью между восстановленным сигналом 110 и входным сигналом 102. Кодер 108 уровня расширения формирует кодированный сигнал 114 уровня расширения. Как кодированный сигнал 106 базового уровня, так и кодированный сигнал 114 уровня расширения передаются в канал 116. Канал представляет собой среду, такую как канал связи и/или носитель хранения.
После прохождения через канал второй восстановленный сигнал 118 формируется путем передачи принятого кодированного сигнала 106' базового уровня через второй декодер 120 базового уровня. Второй декодер 120 базового уровня выполняет ту же функцию, что и первый декодер 112 базового уровня. Если кодированный сигнал 114 уровня расширения также передан через канал 116 и принят как сигнал 114', он может быть передан на декодер 122 уровня расширения. Декодер 122 уровня расширения также принимает второй восстановленный сигнал 118 в качестве входа и формирует третий восстановленный сигнал 124 в качестве выхода. Третий восстановленный сигнал 124 согласуется с исходным сигналом 102 более точно, чем второй восстановленный сигнал 118.
Кодированный сигнал 114 уровня расширения включает в себя дополнительную информацию, которая позволяет восстанавливать сигнал 102 более точно, чем второй восстановленный сигнал 118. То есть это является расширенным (улучшенным) восстановлением.
Одним из преимуществ такой встроенной системы кодирования является то, что конкретный канал 116 не способен последовательно поддерживать требование к ширине полосы, ассоциированное с алгоритмами кодирования аудио высокого качества. Встроенный кодер, однако, позволяет принимать часть потока битов (к примеру, только поток битов базового уровня) из канала 116 для формирования, например, только базового выходного аудио, когда поток битов уровня расширения потерян или искажен. Однако имеются компромиссы по качеству между встроенными и невстроенными кодерами, а также между различными целями оптимизации встроенного кодирования. То есть кодирование уровня расширения более высокого качества может способствовать достижению лучшего баланса между базовым уровнем и уровнем расширения, а также уменьшить общую скорость передачи данных для улучшения характеристик передачи (к примеру, снижение перегрузки), что может привести к снижению частоты появления пакетных ошибок для уровней расширения.
Хотя многие схемы кодирования являются обобщенными, некоторые схемы кодирования включают в себя модели сигнала. В общем, лучшее сжатие сигнала достигается тогда, когда модель представляет кодируемый сигнал. Таким образом, известно, что схема кодирования выбирается после классификации типа сигнала. Например, голосовой сигнал может моделироваться и кодироваться иным образом, чем музыкальный сигнал. Однако, классификация сигнала, как правило, является трудной задачей.
Фиг.2 представляет собой блок-схему системы 200 кодирования и декодирования в соответствии с некоторыми вариантами осуществления изобретения. Согласно Фиг.2 исходный сигнал 102 вводится в кодер 104 базового уровня системы кодирования. Исходный сигнал 102 может быть речевым/аудио сигналом или другим видом сигнала. Кодер 104 базового уровня кодирует сигнал 102 и формирует кодированный сигнал 106 базового уровня. Первый восстановленный сигнал 110 формируется путем передачи кодированного сигнала 106 базового уровня через первый декодер 112 базового уровня. Исходный сигнал 102 и первый восстановленный сигнал 110 сравниваются в модуле 202 компаратора/селектора. Модуль 202 компаратора/селектора сравнивает исходный сигнал 102 с первым восстановленным сигналом 110 и, основываясь на сравнении, формирует селекторный сигнал 204, который выбирает, какой из кодеров 206 уровня расширения использовать. Хотя только два кодера уровня расширения показаны на чертеже, должно быть понятно, что может быть использовано множество кодеров уровня расширения. Модуль 202 компаратора/селектора 202 выбрать кодер уровня расширения, чтобы с наибольшей вероятностью формировать наилучший восстановленный сигнал.
Хотя декодер 112 расширения показан как принимающий кодированный сигнал 106 базового уровня, который, соответственно, послан в канал 116, физическое соединение между элементами 104 и 106 может допускать более эффективную реализацию, так что общие элементы обработки и/или состояния могут совместно использоваться, и, таким образом, не потребовалась бы регенерация или дублирование.
Каждый кодер 206 уровня расширения принимает исходный сигнал 102 и первый восстановленный сигнал в качестве входов (или сигнал такой, как разностный сигнал, полученный из этих сигналов), и выбранный кодер формирует кодированный сигнал 208 уровня расширения. В одном варианте осуществления кодер 206 уровня расширения кодирует сигнал ошибки, который является разностью между восстановленным сигналом 110 и входным сигналом 102. Кодированный сигнал 208 уровня расширения содержит дополнительную информацию, основанную на сравнении сигналов s(n) (102) и sc(n) (110). Дополнительно он может использовать параметры из декодера 104 базового уровня. Кодированный сигнал 106 базового уровня, кодированный сигнал 208 уровня расширения и селекторный сигнал 204 все передаются в канал 116. Канал представляет собой среду, такую как канал связи и/или носитель хранения.
После прохождения через канал второй восстановленный сигнал 118 формируется путем передачи принятого кодированного сигнала 106' базового уровня через второй декодер 120 базового уровня. Второй декодер 120 базового уровня выполняет те же функции, что и первый декодер 112 базового уровня. Если кодированный сигнал 208 уровня расширения также передается через канал 116 и принимается как сигнал 208', он может быть передан на декодер 210 уровня расширения. Декодер 210 уровня расширения также принимает второй восстановленный сигнал 118 и принятый селекторный сигнал 204' в качестве входов и формирует третий восстановленный сигнал 212 в качестве выхода. Работа декодера 210 уровня расширения зависит от принятого селекторного сигнала 204'. Третий восстановленный сигнал 212 согласуется с исходным сигналом 102 более точно, чем второй восстановленный сигнал 118.
Кодированный сигнал 208 уровня расширения включает в себя дополнительную информацию, поэтому третий восстановленный сигнал 212 согласуется с сигналом 102 более точно, чем второй восстановленный сигнал 118.
Фиг.3 представляет собой блок-схему способа для выбора системы кодирования в соответствии с некоторыми вариантами осуществления изобретения. В частности, фиг.3 описывает работу модуля компаратора/селектора в варианте осуществления изобретения. После блока 302 начала входной сигнал (102 на фиг.2) и восстановленный сигнал (110 на фиг.2) преобразуются, если требуется, в выбранную область сигнала. Сигналы временной области могут быть использованы без преобразования, или в блоке 304 сигналы могут быть преобразованы в спектральную область, такую как частотная область, область модифицированного дискретного косинусного преобразования (МДКП) или вэйвлетную область, а также могут быть обработаны другими дополнительными элементами, такими как перцепционное взвешивание некоторой частоты или временных характеристик сигналов. Преобразованный входной сигнал (или сигнал временной области) обозначается как S(k) для спектрального компонента k, и преобразованный восстановленный сигнал (или сигнал временной области) обозначается как Sc(k) для спектрального компонента k. Для каждого компонента k в выбранном наборе компонентов (которые могут быть всеми или только некоторыми из компонентов) энергия E_tot во всех компонентах Sc(k) восстановленного сигнала сравнивается с энергией E_err в тех компонентах, которые больше (например, с некоторым коэффициентом), чем соответствующий компонент S(k) исходного входного сигнала.
В то время как компоненты входного и восстановленного сигналов могут существенно отличаться по амплитуде, значительное увеличение по амплитуде компонента восстановленного сигнала свидетельствуют о плохо смоделированном входном сигнале. Как таковой, компонент восстановленного сигнала меньшей амплитуды может быть скомпенсирован посредством заданного способа кодирования уровня расширения, в то время как компонент восстановленного сигнала большей амплитуды (то есть плохо смоделированный) может лучше подходить для альтернативного способа кодирования уровня расширения. Один такой альтернативный способ кодирования уровня расширения может использовать снижение энергии некоторых компонентов восстановленного сигнал перед кодированием уровня расширения, так что слышимые шумы или искажения, получаемые в результате рассогласования модели сигнала базового уровня, уменьшаются.
Согласно фиг.3 цикл компонентов инициализируется в блоке 306, где компонент k инициализируется, и меры энергии E_tot и E_err инициализируются в нуль. В решающем блоке 308 выполняется проверка, чтобы определить, является ли абсолютное значение компонента восстановленного сигнал значительно большим, чем соответствующий компонент входного сигнала. Если он значительно больше, как обозначено положительной ветвью от решающего блока 308, компонент добавляется к энергии ошибки E_err в блоке 310, и обработка переходит к блоку 312. В блоке 312 компонент восстановленных сигналов добавляется к полному значению энергии E_tot. В решающем блоке 314 значение компонента получает приращение, и выполняется проверка, чтобы определить, все ли компоненты были обработаны. Если нет, как показано отрицательной ветвью от решающего блока 314, обработка возвращается в блок 308. В противном случае, как изображено положительной ветвью от решающего блока 316, цикл завершается, и общая накопленная энергия сравнивается в решающем блоке 316. Если энергия ошибки E_err значительно ниже, чем общая энергия E_tot, как показано отрицательной ветвью от решающего блока 316, то в блоке 318 выбирается уровень расширения типа 1. В противном случае, как изображено положительной ветвью от решающего блока 316, в блоке 320 выбирается уровень расширения типа 2. Обработка этого блока входного сигнала завершается в блоке 322.
Для специалистов в данной области техники будет очевидным, что и другие меры энергии сигнала могут быть использованы, например абсолютное значение компонента в некоторой степени. Например, энергия компонента Sc(k) может быть оценена как |Sc(к)|p, а энергия компонента S(k) может быть оценена как |Sc(к)|p, где P - число больше нуля.
Для специалистов в данной области техники будет очевидным, что энергию ошибки E_err можно сравнить с полной энергией во входном сигнале, а не с полной энергией в восстановленном сигнале.
Кодер может быть реализован на запрограммированном процессоре. Например, листинг кода, соответствующий фиг.3, приведен ниже. Переменные energy_tot и energy_err обозначены на чертеже как E_tot и E_err соответственно
В этом примере пороговые значения Tresh1 и Tresh2 установлены на 0,49 и 0,264 соответственно. Другие значения могут быть использованы в зависимости от используемых типов кодеров уровня расширения, а также в зависимости от используемой области преобразования.
Может быть добавлен этап гистерезиса, так чтобы тип уровня расширения изменялся только в том случае, если определенное число блоков сигнала имеют тот же самый тип. Например, если используется тип 1 кодера, то тип 2 не будет выбран до тех пор, пока два последовательных блока не покажут использование типа 2.
Фиг.4-6 представляет собой ряд графиков, показывающих приведенные для примера результаты для речевого сигнала. График 402 на фиг.4 показывает энергию E_tot восстановленного сигнала. Энергия вычисляется в течение 20 миллисекундных кадров, так что график показывает изменение энергии сигнала в течение 10 секундного интервала. График 502 на фиг.5 показывает отношение энергии ошибки E_err к полной энергии E_tot за тот же период времени. Пороговое значение Thresh2 показано как пунктирная линия 504. Речевой сигнал в кадрах, где отношение превышает порог, не удовлетворительно смоделирован кодером. Однако для большинства кадров порог не превышен. График 602 на фиг.6 показывает селекторный или решающий сигнал за тот же период времени. В этом примере значение 0 указывает, что выбран кодер уровня расширения типа 1, а значение 1 указывает, что выбран кодер уровня расширения типа 2. Изолированные кадры, где отношение выше, чем порог, игнорируются, и выбор изменяется только тогда, когда два последовательных кадра указывают на тот же выбор. Так, например, кодер уровня расширения типа 1 выбирается для кадра 141, даже если отношение превышает порог.
Фиг.7-9 показывают соответствующий ряд графиков музыкального сигнала. График 702 на фиг.7 показывает энергию E_tot входного сигнала. Вновь, энергия рассчитывается в течение 20 миллисекундных кадров, так что график показывает изменение входной энергии в течение 10 секундного интервала. Участок 802 на фиг.8 показывает отношение энергии ошибки E_err к общей энергии E_tot за тот же период времени. Пороговое значение Thresh2 показано как пунктирная линия 504. Музыкальный сигнал в кадрах, где отношение превышает порог, не удовлетворительно смоделировано кодером. Это имеет место для большинства кадров, так как базовый кодер предназначен для речевых сигналов. График 902 на фиг.9 показывает селекторный или решающий сигнал за тот же период времени. Вновь, значение 0 указывает, что выбирается кодер уровня расширения типа 1, а значение 1 указывает, что выбирается кодер уровня расширения типа 2. Таким образом, кодер уровня расширения типа 2 выбран для большей части времени. Однако в кадрах, где базовый кодер работает хорошо для музыкального сигнала, выбирается кодер уровня расширения типа 1.
В тесте на 22803 кадрах речевого сигнала кодер уровня расширения типа 2 был выбран только в 227 кадрах, то есть лишь 1% времени. В тесте на 29644 кадрах музыкального сигнала кодер уровня расширения типа 2 был выбран в 16145 кадрах, то есть 54% времени. В других кадрах базовый кодер хорошо работает для музыкального сигнала, а для речевого сигнала выбран кодер уровня расширения. Таким образом, компаратор/селектор не является классификатором речевого/музыкального сигнала. Это является отличием от предшествующих схем, которые стремятся классифицировать входной сигнал как речь или музыку, а затем выбирают схему кодирования соответствующим образом. Предложенный подход состоит в выборе кодера уровня расширения в зависимости от рабочих характеристик кодера базового уровня.
Фиг.10 представляет собой блок-схему, иллюстрирующую работу встроенного кодера в соответствии с некоторыми вариантами осуществления изобретения. Блок-схема показывает способ, используемый для кодирования одного кадра сигнальных данных. Длина кадра выбирается в зависимости от временной характеристики сигнала. Например, 20 мс кадр может использоваться для речевых сигналов. После блока 1002 начала на фиг.10 входной сигнал кодируется в блоке 1004 с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. В блоке 1006 кодированный сигнал базового уровня декодируется для формирования восстановленного сигнала. В этом варианте осуществления сигнал ошибки генерируется в блоке 1008 как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается с входным сигналом в блоке 1010, и в решающем блоке 1012 определяется, хорошо ли согласован восстановленный сигнал с входным сигналом. Если согласование хорошее, как показано положительной ветвью от решающего блока 1012, то кодер уровня расширения типа 1 используется для кодирования сигнала ошибки в блоке 1014. Если согласование не является хорошим, как изображено отрицательной ветвью от решающего блока 1012, то кодер уровня расширения типа 2 используется для кодирования сигнала ошибки в блоке 1016. В блоке 1018 кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся в канал (например, для передачи или хранения). Обработка кадра заканчивается в блоке 1020.
В этом варианте осуществления кодер уровня расширения реагирует на сигнал ошибки, однако в альтернативном варианте кодер уровня расширения реагирует на входной сигнал и дополнительно, при необходимости, один или несколько сигналов от кодера базового уровня и/или декодера базового уровня. В еще одном варианте осуществления используется альтернативный сигнал ошибки, например взвешенная разность между входным сигналом и восстановленным сигналом. Например, некоторые частоты восстановленного сигнала могут быть ослаблены до формирования сигнала ошибки. Полученный в результате сигнал ошибки может упоминаться как взвешенный сигнал ошибки.
В другом альтернативном варианте осуществления кодер и декодер базового уровня могут также включать в себя другие уровни расширения, и компаратор согласно настоящему изобретению может получать, в качестве входа, выход одного из предыдущих уровней расширения, как восстановленный сигнал. Кроме того, могут быть уровни расширения, последующие относительно вышеупомянутых уровней расширения, которые могут или не могут переключаться в результате сравнения. Например, встроенные системы кодирования могут содержать пять уровней. Базовый уровень (L1) и второй уровень (L2) может формировать восстановленный сигнал Sc(k). Восстановленный сигнал Sc(k) и входной сигнал S(k) могут быть использованы для выбора способов кодирования уровня расширения на уровнях 3 и 4 (L3, L4). Наконец, уровень 5 (L5) может включать в себя только один способ кодирования уровня расширения.
Кодер может выбирать между двумя или более кодерами уровня расширения в зависимости от сравнения между восстановленным сигналом и входным сигналом.
Кодер и декодер могут быть реализованы на запрограммированном процессоре, на реконфигурируемом процессоре или, например, на специализированной (ориентированной на приложение) интегральной схеме.
В предыдущем описании были описаны конкретные варианты осуществления изобретения. Однако специалисту в данной области техники должно быть понятно, что различные модификации и изменения могут быть выполнены без отклонения от объема настоящего изобретения, как изложено в формуле изобретения. Соответственно, описание и чертежи следует рассматривать в иллюстративном смысле, а не в качестве ограничения, и все такие изменения должны включаться в объем настоящего изобретения. Выгоды, преимущества, решения проблем и любой(ые) элемент(ы), которые могут обусловить то, что любая выгода, преимущество или решение возникают или становятся более выраженными, не следует рассматривать как критические, требуемые или существенные признаки или элементы любого или всех пунктов формулы изобретения. Изобретение определяется исключительно формулой изобретения, включая все изменения, сделанные в ходе рассмотрения настоящей заявки, и все эквиваленты пунктов формулы изобретения, с которой последует выдача патента.
Claims (18)
1. Способ кодирования входного сигнала, содержащий:
кодирование входного сигнала с использованием кодера базового уровня для формирования кодированного сигнала базового уровня;
декодирование кодированного сигнала базового уровня для формирования восстановленного сигнала;
сравнение восстановленного сигнала с входным сигналом, причем этап сравнения содержит оценивание энергии Е_err восстановленного сигнала, который содержит ошибки, определение, что отношение S(k)/Sc(k) компонента S(k) входного сигнала к компоненту Sc(k) восстановленного сигнала превышает пороговое значение, и суммирование энергий этих компонент Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение;
выбор кодера уровня расширения из множества кодеров уровня расширения в зависимости от сравнения между восстановленным сигналом и входным сигналом; и
генерацию кодированного сигнала уровня расширения с использованием выбранного кодера уровня расширения, причем кодированный сигнал уровня расширения зависит от входного сигнала.
кодирование входного сигнала с использованием кодера базового уровня для формирования кодированного сигнала базового уровня;
декодирование кодированного сигнала базового уровня для формирования восстановленного сигнала;
сравнение восстановленного сигнала с входным сигналом, причем этап сравнения содержит оценивание энергии Е_err восстановленного сигнала, который содержит ошибки, определение, что отношение S(k)/Sc(k) компонента S(k) входного сигнала к компоненту Sc(k) восстановленного сигнала превышает пороговое значение, и суммирование энергий этих компонент Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение;
выбор кодера уровня расширения из множества кодеров уровня расширения в зависимости от сравнения между восстановленным сигналом и входным сигналом; и
генерацию кодированного сигнала уровня расширения с использованием выбранного кодера уровня расширения, причем кодированный сигнал уровня расширения зависит от входного сигнала.
2. Способ по п.1, дополнительно содержащий:
генерацию сигнала ошибки как разность между восстановленным сигналом и входным сигналом,
причем генерация кодированного сигнала уровня расширения включает в себя кодирование сигнала ошибки.
генерацию сигнала ошибки как разность между восстановленным сигналом и входным сигналом,
причем генерация кодированного сигнала уровня расширения включает в себя кодирование сигнала ошибки.
3. Способ по п.2, в котором сигнал ошибки содержит взвешенную разность между восстановленным сигналом и входным сигналом.
4. Способ по п.1, в котором сравнение восстановленного сигнала с входным сигналом включает в себя:
оценку энергии E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценку энергии Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнение энергии E_tot с энергией Е_err.
оценку энергии E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценку энергии Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнение энергии E_tot с энергией Е_err.
5. Способ по п.4, дополнительно содержащий:
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала,
причем преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МСКТ) и вейвлет-преобразования.
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала,
причем преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МСКТ) и вейвлет-преобразования.
6. Способ по п.4, дополнительно содержащий:
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала; и
преобразование входного сигнала для формирования компонентов входного сигнала,
при этом преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МДКП) и вейвлет-преобразования.
преобразование восстановленного сигнала для формирования компонентов восстановленного сигнала; и
преобразование входного сигнала для формирования компонентов входного сигнала,
при этом преобразование выбрано из группы преобразований, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МДКП) и вейвлет-преобразования.
7. Способ по п.1, в котором энергия компонента Sc(k) оценивается как |Sc(k)|p и в котором энергия компонента S(k) оценивается как |S(k)|р, Р - число больше нуля.
8. Способ по п.4, в котором сравнение энергии Е_tot с энергией Е_err включает в себя:
сравнение отношения энергий E_err/E_tot с пороговым значением.
сравнение отношения энергий E_err/E_tot с пороговым значением.
9. Способ по п.1, в котором кодер базового уровня содержит речевой кодер.
10. Способ по п.1, дополнительно содержащий вывод кодированного сигнала базового уровня, кодированного сигнала уровня расширения и указателя выбранного кодера уровня расширения в канал.
11. Селективный кодер сигнала, содержащий:
кодер базового уровня, который принимает входной аудио сигнал, подлежащий кодированию, и формирует кодированный сигнал базового уровня;
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует восстановленный сигнал; и
множество кодеров уровня расширения, каждый из которых выбирается для кодирования сигнала ошибки, чтобы сформировать кодированный сигнал уровня расширения, причем сигнал ошибки содержит разность между входным сигналом и восстановленным сигналом; и
модуль компаратора/селектора, который выбирает кодер уровня расширения из множества кодеров уровня расширения в зависимости от сравнения входного сигнала и кодированного сигнала базового уровня,
при этом модуль компаратора/селектора оценивает энергию E_err восстановленного сигнала, который содержит ошибки, определяет отношение S(k)/Sc(k) компонента S (k) входного сигнала к компоненту Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение, и,
дополнительно при этом входной сигнал кодируется как кодированный сигнал базового уровня, кодированный сигнал уровня расширения и сигнал выбора выбранного кодера уровня расширения.
кодер базового уровня, который принимает входной аудио сигнал, подлежащий кодированию, и формирует кодированный сигнал базового уровня;
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует восстановленный сигнал; и
множество кодеров уровня расширения, каждый из которых выбирается для кодирования сигнала ошибки, чтобы сформировать кодированный сигнал уровня расширения, причем сигнал ошибки содержит разность между входным сигналом и восстановленным сигналом; и
модуль компаратора/селектора, который выбирает кодер уровня расширения из множества кодеров уровня расширения в зависимости от сравнения входного сигнала и кодированного сигнала базового уровня,
при этом модуль компаратора/селектора оценивает энергию E_err восстановленного сигнала, который содержит ошибки, определяет отношение S(k)/Sc(k) компонента S (k) входного сигнала к компоненту Sc(k) восстановленного сигнала, когда отношение S(k)/Sc(k) компонента S(k) превышает пороговое значение, и,
дополнительно при этом входной сигнал кодируется как кодированный сигнал базового уровня, кодированный сигнал уровня расширения и сигнал выбора выбранного кодера уровня расширения.
12. Селективный кодер сигнала по п.11, в котором кодер базового уровня включает в себя речевой кодер.
13. Селективный кодер сигнала по п.11, в котором модуль компаратора/селектора:
оценивает энергию E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценивает энергию Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнивает энергию E_tot с энергией Е_err.
оценивает энергию E_tot как суммирование энергий всех компонент восстановленного сигнала;
оценивает энергию Е_err как суммирование энергий всех компонент восстановленного сигнала, которые содержат ошибки; и
сравнивает энергию E_tot с энергией Е_err.
14. Селективный кодер сигнала по п.13, в котором модуль компаратора/селектора сравнивает энергию E_tot с энергией Е_err путем сравнения отношения энергий E_err/E_tot с пороговым значением.
15. Селективный кодер сигнала по п.13, в котором компоненты восстановленного сигнала и компоненты входного сигнала вычисляются с помощью преобразования, выбранного из группы, состоящей из преобразования Фурье, модифицированного дискретного косинусного преобразования (МДКП) и вейвлет-преобразования.
16. Селективный декодер сигнала, содержащий процессор, который включает в себя инструкции для декодирования исходного сигнала, который кодирован как кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбранного кодера уровня расширения, причем декодер содержит:
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует первый восстановленный сигнал; и
декодер уровня расширения, который принимает сигнал выбора для выбора кодера уровня расширения, который декодирует кодированный сигнал уровня расширения для формирования второго восстановленного сигнала.
декодер базового уровня, который принимает кодированный сигнал базового уровня в качестве входа и формирует первый восстановленный сигнал; и
декодер уровня расширения, который принимает сигнал выбора для выбора кодера уровня расширения, который декодирует кодированный сигнал уровня расширения для формирования второго восстановленного сигнала.
17. Селективный декодер сигнала по п.16, в котором второй восстановленный сигнал включает в себя сигнал ошибки и в котором исходный сигнал восстанавливается в виде суммы восстановленного сигнала и сигнала ошибки.
18. Селективный декодер сигнала по п.16, в котором декодер уровня расширения реагирует на первый и второй восстановленные сигналы и кодированный сигнал уровня расширения и в котором второй восстановленный сигнал является оценкой исходного сигнала.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/099,842 | 2008-04-09 | ||
US12/099,842 US8639519B2 (en) | 2008-04-09 | 2008-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
PCT/US2009/039984 WO2009126759A1 (en) | 2008-04-09 | 2009-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010145274A RU2010145274A (ru) | 2012-05-20 |
RU2504026C2 true RU2504026C2 (ru) | 2014-01-10 |
Family
ID=40909774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010145274/08A RU2504026C2 (ru) | 2008-04-09 | 2009-04-09 | Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера |
Country Status (9)
Country | Link |
---|---|
US (1) | US8639519B2 (ru) |
EP (1) | EP2272063B1 (ru) |
KR (1) | KR101317530B1 (ru) |
CN (1) | CN102047325A (ru) |
BR (1) | BRPI0909487A8 (ru) |
ES (1) | ES2396481T3 (ru) |
MX (1) | MX2010011111A (ru) |
RU (1) | RU2504026C2 (ru) |
WO (1) | WO2009126759A1 (ru) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
CN101771417B (zh) * | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
EP2348504B1 (en) * | 2009-03-27 | 2014-01-08 | Huawei Technologies Co., Ltd. | Encoding and decoding method and device |
US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
US8149144B2 (en) * | 2009-12-31 | 2012-04-03 | Motorola Mobility, Inc. | Hybrid arithmetic-combinatorial encoder |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN101964188B (zh) * | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN105580369B (zh) * | 2013-03-11 | 2019-04-26 | 杜比实验室特许公司 | 使用分层编码对多格式高动态范围视频进行编解码的方法、装置及系统 |
US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
CN112639968A (zh) * | 2018-08-30 | 2021-04-09 | 杜比国际公司 | 用于控制对经低比特率编码的音频的增强的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997015983A1 (en) * | 1995-10-27 | 1997-05-01 | Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. | Method of and apparatus for coding, manipulating and decoding audio signals |
WO2003073741A2 (en) * | 2002-02-21 | 2003-09-04 | The Regents Of The University Of California | Scalable compression of audio and other signals |
RU2006139794A (ru) * | 2004-05-19 | 2008-06-27 | Нокиа Корпорейшн (Fi) | Поддержка переключения между режимами звукового кодера |
RU2440627C2 (ru) * | 2007-02-26 | 2012-01-20 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи в звукозаписи развлекательных программ |
Family Cites Families (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4560977A (en) | 1982-06-11 | 1985-12-24 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4670851A (en) | 1984-01-09 | 1987-06-02 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
JP2527351B2 (ja) | 1987-02-25 | 1996-08-21 | 富士写真フイルム株式会社 | 画像デ―タの圧縮方法 |
US5067152A (en) | 1989-01-30 | 1991-11-19 | Information Technologies Research, Inc. | Method and apparatus for vector quantization |
DE68922610T2 (de) | 1989-09-25 | 1996-02-22 | Rai Radiotelevisione Italiana | Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren. |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
WO1993018505A1 (en) | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6904174B1 (en) | 1998-12-11 | 2005-06-07 | Intel Corporation | Simplified predictive video encoder |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
JP4249821B2 (ja) | 1998-08-31 | 2009-04-08 | 富士通株式会社 | ディジタルオーディオ再生装置 |
CA2246532A1 (en) | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
US6453287B1 (en) | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6691092B1 (en) | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
US6418408B1 (en) | 1999-04-05 | 2002-07-09 | Hughes Electronics Corporation | Frequency domain interpolative speech codec system |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6504877B1 (en) | 1999-12-14 | 2003-01-07 | Agere Systems Inc. | Successively refinable Trellis-Based Scalar Vector quantizers |
JP4149637B2 (ja) | 2000-05-25 | 2008-09-10 | 株式会社東芝 | 半導体装置 |
US6304196B1 (en) | 2000-10-19 | 2001-10-16 | Integrated Device Technology, Inc. | Disparity and transition density control system and method |
AUPR105000A0 (en) | 2000-10-27 | 2000-11-23 | Canon Kabushiki Kaisha | Method for generating and detecting marks |
JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
JP3636094B2 (ja) | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6662154B2 (en) | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
KR100711989B1 (ko) | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
EP1619664B1 (en) | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
JP2005005844A (ja) | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 計算装置及び符号化処理プログラム |
JP4123109B2 (ja) | 2003-08-29 | 2008-07-23 | 日本ビクター株式会社 | 変調装置及び変調方法並びに復調装置及び復調方法 |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
KR100629997B1 (ko) * | 2004-02-26 | 2006-09-27 | 엘지전자 주식회사 | 오디오 신호의 인코딩 방법 |
CN1973320B (zh) * | 2004-04-05 | 2010-12-15 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
US20060022374A1 (en) | 2004-07-28 | 2006-02-02 | Sun Turn Industrial Co., Ltd. | Processing method for making column-shaped foam |
US6975253B1 (en) | 2004-08-06 | 2005-12-13 | Analog Devices, Inc. | System and method for static Huffman decoding |
US7161507B2 (en) | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
JP4771674B2 (ja) * | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
JP5046652B2 (ja) | 2004-12-27 | 2012-10-10 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US20060190246A1 (en) * | 2005-02-23 | 2006-08-24 | Via Telecom Co., Ltd. | Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC |
CN101138174B (zh) * | 2005-03-14 | 2013-04-24 | 松下电器产业株式会社 | 可扩展解码装置和可扩展解码方法 |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
CN101151658B (zh) * | 2005-03-30 | 2011-07-06 | 皇家飞利浦电子股份有限公司 | 多声道音频编码和解码方法、编码器和解码器 |
US7885809B2 (en) | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
RU2007139784A (ru) * | 2005-04-28 | 2009-05-10 | Мацусита Электрик Индастриал Ко., Лтд. (Jp) | Устройство кодирования звука и способ кодирования звука |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
WO2006134992A1 (ja) * | 2005-06-17 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd. | ポストフィルタ、復号化装置及びポストフィルタ処理方法 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
ES2356492T3 (es) * | 2005-07-22 | 2011-04-08 | France Telecom | Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda. |
WO2007026763A1 (ja) | 2005-08-31 | 2007-03-08 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 |
JP5142723B2 (ja) * | 2005-10-14 | 2013-02-13 | パナソニック株式会社 | スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法 |
JP4969454B2 (ja) * | 2005-11-30 | 2012-07-04 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
KR101366124B1 (ko) | 2006-02-14 | 2014-02-21 | 오렌지 | 오디오 인코딩/디코딩에서의 인지 가중 장치 |
US8306827B2 (en) * | 2006-03-10 | 2012-11-06 | Panasonic Corporation | Coding device and coding method with high layer coding based on lower layer coding results |
US20070239294A1 (en) | 2006-03-29 | 2007-10-11 | Andrea Brueckner | Hearing instrument having audio feedback capability |
US7230550B1 (en) | 2006-05-16 | 2007-06-12 | Motorola, Inc. | Low-complexity bit-robust method and system for combining codewords to form a single codeword |
US7414549B1 (en) | 2006-08-04 | 2008-08-19 | The Texas A&M University System | Wyner-Ziv coding based on TCQ and LDPC codes |
US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
WO2008062990A1 (en) * | 2006-11-21 | 2008-05-29 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
EP2095365A4 (en) | 2006-11-24 | 2009-11-18 | Lg Electronics Inc | METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF |
US8060363B2 (en) * | 2007-02-13 | 2011-11-15 | Nokia Corporation | Audio signal encoding |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US7889103B2 (en) | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
US20090234642A1 (en) | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
PL2311034T3 (pl) | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
US20100088090A1 (en) | 2008-10-08 | 2010-04-08 | Motorola, Inc. | Arithmetic encoding for celp speech encoders |
US8219408B2 (en) | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8140342B2 (en) | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8200496B2 (en) | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
-
2008
- 2008-04-09 US US12/099,842 patent/US8639519B2/en active Active
-
2009
- 2009-04-09 ES ES09730909T patent/ES2396481T3/es active Active
- 2009-04-09 BR BRPI0909487A patent/BRPI0909487A8/pt not_active IP Right Cessation
- 2009-04-09 CN CN2009801125660A patent/CN102047325A/zh active Pending
- 2009-04-09 KR KR1020107025140A patent/KR101317530B1/ko active IP Right Grant
- 2009-04-09 MX MX2010011111A patent/MX2010011111A/es active IP Right Grant
- 2009-04-09 EP EP09730909A patent/EP2272063B1/en active Active
- 2009-04-09 WO PCT/US2009/039984 patent/WO2009126759A1/en active Application Filing
- 2009-04-09 RU RU2010145274/08A patent/RU2504026C2/ru active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997015983A1 (en) * | 1995-10-27 | 1997-05-01 | Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. | Method of and apparatus for coding, manipulating and decoding audio signals |
WO2003073741A2 (en) * | 2002-02-21 | 2003-09-04 | The Regents Of The University Of California | Scalable compression of audio and other signals |
RU2006139794A (ru) * | 2004-05-19 | 2008-06-27 | Нокиа Корпорейшн (Fi) | Поддержка переключения между режимами звукового кодера |
RU2440627C2 (ru) * | 2007-02-26 | 2012-01-20 | Долби Лэборетериз Лайсенсинг Корпорейшн | Повышение разборчивости речи в звукозаписи развлекательных программ |
Also Published As
Publication number | Publication date |
---|---|
US20090259477A1 (en) | 2009-10-15 |
BRPI0909487A2 (pt) | 2017-10-17 |
KR20110002088A (ko) | 2011-01-06 |
BRPI0909487A8 (pt) | 2018-04-03 |
EP2272063A1 (en) | 2011-01-12 |
US8639519B2 (en) | 2014-01-28 |
CN102047325A (zh) | 2011-05-04 |
WO2009126759A1 (en) | 2009-10-15 |
EP2272063B1 (en) | 2012-11-28 |
MX2010011111A (es) | 2011-02-23 |
RU2010145274A (ru) | 2012-05-20 |
KR101317530B1 (ko) | 2013-10-15 |
ES2396481T3 (es) | 2013-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2504026C2 (ru) | Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера | |
KR101125429B1 (ko) | 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치 | |
US7149683B2 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
JP5722040B2 (ja) | スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術 | |
KR101274827B1 (ko) | 다수 채널 오디오 신호를 디코딩하기 위한 장치 및 방법, 및 다수 채널 오디오 신호를 코딩하기 위한 방법 | |
US8442837B2 (en) | Embedded speech and audio coding using a switchable model core | |
KR101275892B1 (ko) | 오디오 신호를 인코딩하고 디코딩하기 위한 방법 및 장치 | |
KR101180202B1 (ko) | 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치 | |
KR101274802B1 (ko) | 오디오 신호를 인코딩하기 위한 장치 및 방법 | |
US20100014679A1 (en) | Multi-channel encoding and decoding method and apparatus | |
KR20080101873A (ko) | 부호화/복호화 장치 및 방법 | |
JP6170172B2 (ja) | 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置 | |
EP1441330B1 (en) | Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
Moreno | Variable frame size for vector quantization and application to speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC43 | Official registration of the transfer of the exclusive right without contract for inventions |
Effective date: 20141125 |
|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20180111 |