RU2387022C2 - Масштабируемый аудиокодер без потерь и авторское инструментальное средство - Google Patents

Масштабируемый аудиокодер без потерь и авторское инструментальное средство Download PDF

Info

Publication number
RU2387022C2
RU2387022C2 RU2006137566/09A RU2006137566A RU2387022C2 RU 2387022 C2 RU2387022 C2 RU 2387022C2 RU 2006137566/09 A RU2006137566/09 A RU 2006137566/09A RU 2006137566 A RU2006137566 A RU 2006137566A RU 2387022 C2 RU2387022 C2 RU 2387022C2
Authority
RU
Russia
Prior art keywords
mlr
bit
parts
audio data
bit width
Prior art date
Application number
RU2006137566/09A
Other languages
English (en)
Other versions
RU2006137566A (ru
Inventor
Зоран ФЕЙЗО (US)
Зоран ФЕЙЗО
Original Assignee
ДиТиЭс, ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ДиТиЭс, ИНК. filed Critical ДиТиЭс, ИНК.
Publication of RU2006137566A publication Critical patent/RU2006137566A/ru
Application granted granted Critical
Publication of RU2387022C2 publication Critical patent/RU2387022C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к аудиокодекам без потерь, более конкретно - к масштабируемому аудиокодеку без потерь и авторскому инструментальному средству. Аудиокодек кодирует без потерь аудиоданные в последовательность окон для анализа в масштабируемом битовом потоке. Это выполняется разделением аудиоданных на части СтР и МлР и кодированием каждой части с использованием различных алгоритмов без потерь. Авторское инструментальное средство сравнивает буферизированную полезную нагрузку с разрешенной полезной нагрузкой для каждого окна и выборочно масштабирует кодированные без потерь аудиоданные, соответствующие части МлР, в окнах, не соответствующих требованиям, для уменьшения кодированной полезной нагрузки, а следовательно, буферизированной полезной нагрузки. Технический результат, достигаемый при осуществлении изобретения, состоит в том, что такой подход соответствует ограничениям скорости передачи данных носителей и емкости буфера, не требуя фильтрации исходных аудиоданных, повторного кодирования или иного искажения битового потока без потерь. 8 н. и 26 з.п. ф-лы, 16 ил.

Description

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА СВЯЗАННЫЕ ЗАЯВКИ
Настоящая заявка испрашивает приоритет, согласно разделу 35 Кодекса законов США 119 (e), предварительной заявки № 60/566183, озаглавленной «Backward Compatible Lossless Audio Codec», зарегистрированной 25 марта 2004, содержание которой полностью включено в настоящий документ посредством ссылки.
Область техники
Настоящее изобретение относится к аудиокодекам без потерь, более конкретно - к масштабируемому аудиокодеку без потерь и авторскому инструментальному средству.
Описание предшествующего уровня техники
Множество систем кодирования аудиосигнала с потерями с низкой битовой скоростью используется в настоящее время в широком диапазоне потребительских и профессиональных продуктов и услуг аудиовоспроизведения. Например, система кодирования аудиосигнала Dolby AC3 (Dolby digital) является международным стандартом для кодирования стереозвука и звуковых дорожек формата 5.1 для лазерных дисков, кодированного с помощью стандарта NTSC видео DVD (цифрового видеодиска) и ATV, с использованием битовых скоростей до 640 кбит/с. Стандарты аудиокодирования MPEG I (экспертной группы по вопросам движущихся изображений) и MPEG II широко используются для стерео и многоканального кодирования звуковых дорожек для кодированного с помощью стандарта PAL видео DVD, наземного цифрового радиовещания в Европе и спутникового радиовещания в США, на битовых скоростях до 768 кбит/с. Системы аудиокодирования Coherent Acoustics DTS (Digital Theater Systems, Системы цифрового театра) часто используют для звуковых дорожек формата 5.1 со студийным качеством для компакт-диска, видео DVD, спутникового радиовещания в Европе и лазерных дисков на битовых скоростях до 1536 кбит/сек.
Улучшенный кодек, обеспечивающий ширину полосы 96 кГц и разрешающую способность 24 бита, раскрыт в патенте США № 6226616 (также переуступленном Digital Theater Systems, Inc). Этот патент использует методологию основного потока и дополнительного потока (расширения), в которой традиционный алгоритм кодирования аудиосигнала составляет «основной» аудиокодер, и он остается неизменным. Аудиоданные, необходимые для представления более высоких аудиочастот (в случае более высоких частот дискретизации) или более высокой дискретизации выборок (в случае большей длины слов), или их обеих, передают как «дополнительный» поток. Это позволяет поставщикам аудиоконтента (информационного содержимого) обеспечивать единый битовый аудиопоток, который совместим с различными типами декодеров, существующих в оборудовании потребителя. Основной поток декодируется с использованием более старых декодеров, которые игнорируют данные расширения, в то время как более новые декодеры используют и основной поток данных, и дополнительные потоки данных, которые обеспечивают аудиовоспроизведение более высокого качества. Однако этот предшествующий подход не обеспечивает кодирование или декодирование на самом деле без потерь. Хотя система патента США 6226216 обеспечивает аудиовоспроизведение превосходного качества, она не обеспечивает функционирование «без потерь».
В последнее время многие потребители показывают заинтересованность в этих так называемых кодеках «без потерь». Кодеки «без потерь» основываются на алгоритмах, которые сжимают данные, не отбрасывая никакую информацию. Также они не используют психоакустические эффекты, такие как «маскирование». Кодек без потерь создает декодированный сигнал, который идентичен (цифровому) исходному сигналу. Такие характеристики обеспечиваются ценой стоимости: такие кодеки обычно требуют бульшую ширину полосы, чем кодеки с потерями, и сжимают данные в меньшей степени.
Недостаточное сжатие может вызывать проблемы, когда контент записывается на диск, CD (компакт-диск), DVD и т.д., особенно в случаях в значительной степени некоррелированных исходных материалов или высоких исходных требований к ширине полосы. Свойства оптических носителей устанавливают пиковую битовую скорость для всего содержимого, которая не может быть превышена. Как показано на фиг.1, жесткое пороговое значение 10, например 9,6 Мбит/с для аудио DVD, обычно устанавливается для аудиосигнала так, чтобы полная скорость передачи данных не превышала предельное значение для носителей.
Аудиосигнал и другие данные располагаются на диске так, чтобы удовлетворять различным ограничениям носителей и обеспечивать, чтобы все данные, которые необходимо декодировать в данном кадре, присутствовали в аудиобуфере декодера. Буфер имеет эффект сглаживания кодированной полезной нагрузки от кадра к кадру (битовой скорости) 12, которая может колебаться в широких пределах от кадра к кадру для создания буферизированной полезной нагрузки 14, т.е. буферизированной усредненной от кадра к кадру кодированной полезной нагрузки. Если буферизированная полезная нагрузка 14 из битового потока без потерь для заданного канала превышает пороговое значение в какой-нибудь точке, то входные аудиофайлы изменяют для уменьшения их информационного содержимого. Аудиофайлы можно изменять с помощью уменьшения битовой глубины одного или более каналов, например, с 24 бит до 22 бит, фильтрации ширины полосы частот канала только относительно низких частот или уменьшения полосы аудиосигнала, например, путем фильтрации информации выше 40 кГц при дискретизации 96 кГц. Измененные входные аудиофайлы повторно кодируются, чтобы полезная нагрузка 16 никогда не превышала пороговое значение 10. Пример этого процесса описан в SurCode MLP - Owner's Manual pp. 20-23.
Этот процесс очень неэффективен в вычислительном отношении и требует много времени. Кроме того, хотя аудиокодер все еще остается кодером без потерь, количество аудиосодержимого, которое доставляется пользователю, уменьшают по всему битовому потоку. Кроме того, процесс изменения неточен, если удалено слишком мало информации, то проблема может все еще существовать, если удалено слишком много информации, то аудиоданные бесполезно отбрасываются. Кроме того, процесс создания автором мультимедиа-продуктов необходимо настраивать для определенных свойств оптических носителей и для размера буфера декодера.
Сущность изобретения
Настоящее изобретение обеспечивает аудиокодек, который генерирует битовый поток без потерь, и авторское инструментальное средство, которое селективно отбрасывает биты для соответствия ограничениям для носителей, канала, буфера декодера или скорости передачи данных устройства воспроизведения, без необходимости фильтровать входные аудиофайлы, повторно кодировать или иным образом искажать битовый поток без потерь.
Это достигается с помощью кодирования без потерь аудиоданных в последовательности окон анализа в масштабируемый битовый поток, сравнения буферизированной полезной информации с разрешенной полезной информацией для каждого окна и селективного масштабирования кодированных без потерь аудиоданных в окнах, не соответствующих требованиям, для уменьшения кодированной полезной нагрузки, а следовательно, буферизированной полезной нагрузки, таким образом вводя потери.
В примерном варианте осуществления аудиокодер делит аудиоданные на части старших разрядов (СтР, MSB) и младших разрядов (МлР, LSB) и кодирует каждую из них с помощью различных алгоритмов без потерь. Авторское инструментальное средство записывает части СтР в битовый поток, записывает части МлР в окнах, соответствующих требованиям, в битовый поток, и масштабируют части МлР без потерь в любых кадрах, не соответствующих требованиям, так, чтобы сделать их соответствующими требованиям, и записывает части МлР, которые теперь имеют потери, в битовый поток. Аудиодекодер декодирует части СтР и МлР и повторно компонует модулированные с помощью импульсно-кодовой модуляции (ИКМ, PCM) аудиоданные.
Аудиокодер разделяет каждую аудиовыборку на части СтР и МлР, кодирует часть СтР с помощью первого алгоритма без потерь, кодирует часть МлР с помощью второго алгоритма без потерь и упаковывает кодированные аудиоданные в масштабируемый битовый поток без потерь. Граничная точка между частями СтР и МлР соответствующим образом устанавливается на основе энергии и/или максимальной амплитуды выборок в окне анализа. Битовая ширина МлР упаковывается в битовый поток. Часть МлР предпочтительно кодируется так, чтобы все или некоторые МлР можно было селективно отбросить. Расширения частоты можно подобным образом кодировать с помощью СтР/МлР или полностью кодировать как МлР.
Авторское инструментальное средство используется для размещения кодированных данных на диске (носителе). Начальное размещение соответствует буферизированной полезной нагрузке. Данное средство сравнивает буферизированную полезную нагрузку с разрешенной полезной нагрузкой для каждого окна анализа для определения, требует ли размещение какой-нибудь модификации. Если нет, то все части СтР и МлР без потерь битового потока без потерь записываются в битовый поток и записываются на диск. Если да, то авторское инструментальное средство масштабирует битовый поток без потерь так, чтобы соответствовать требованиям ограничения. Более конкретно, данное средство записывает части без потерь СтР и МлР для всех окон, соответствующих требованиям, и заголовки и части без потерь СтР для окон, не соответствующих требованиям, в модифицированный битовый поток. Основываясь на правиле назначения приоритетов, для каждого окна, не соответствующего требованиям, авторское инструментальное средство затем определяет, сколько МлР отбрасываются из каждой аудиовыборки в окне анализа для одного или более количества аудиоканалов, и повторно упаковывает части МлР в модифицированный битовый поток с их измененной битовой шириной. Это повторяется только для тех окон анализа, в которых буферизированная полезная нагрузка превышает разрешенную полезную нагрузку.
Декодер принимает созданный битовый поток посредством носителя или канала передачи данных. Аудиоданные направляют в буфер, который не переполняется с учетом авторского создания мультимедиа-продуктов и в свою очередь выдает достаточное количество данных в чип процессора цифровой обработки сигналов (ПЦОС, DSP) для декодирования аудиоданных для текущего окна анализа. Чип ПЦОС извлекает информацию заголовка и извлекает, декодирует и компонует части СтР аудиоданных. Если все МлР были отброшены в процессе авторского создания, то чип ПЦОС преобразует выборки СтР в слово исходной битовой ширины и выводит ИКМ-данные. В противном случае чип ПЦОС декодирует части МлР, компонует выборки СтР и МлР, преобразует скомпонованные выборки в слово исходной битовой ширины и выводит ИКМ-данные.
Эти и другие признаки и преимущества изобретения будут очевидны специалистам из последующего подробного описания предпочтительных вариантов осуществления, иллюстрируемых чертежами.
Краткое описание чертежей
Фиг.1 - график битовой скорости и полезной нагрузки для аудиоканала без потерь в зависимости от времени;
фиг.2 - структурная схема аудиокодека без потерь и авторского инструментального средства в соответствии с настоящим изобретением;
фиг.3 - упрощенная последовательность операций аудиокодера;
фиг.4 - диаграмма разделения СтР/МлР для выборки в битовом потоке без потерь;
фиг.5 - упрощенная последовательность операций авторского инструментального средства;
фиг.6 - диаграмма разделения СтР/МлР для выборки в созданных автором битовых потоках;
фиг.7 - диаграмма битового потока, включающего в себя части СтР и МлР и информацию заголовка;
фиг.8 - график полезной нагрузки для битового потока без потерь и созданного автором битового потока;
фиг.9 - простая структурная схема аудиодекодера;
фиг.10 - последовательность операций процесса декодирования;
фиг.11 - диаграмма скомпонованного битового потока;
фиг.12-15 иллюстрируют формат битового потока, кодирование, создание автором и декодирование для конкретного варианта осуществления; и
фиг.16a и 16b - структурные схемы кодера и декодера для масштабируемого кодека без потерь, который обратно совместим с основным кодером с потерями.
Подробное описание изобретения
Настоящее изобретение обеспечивает аудиокодек без потерь и авторское инструментальное средство для селективного отбрасывания битов, чтобы соответствовать ограничениям носителей, канала, буфера декодера или скорости передачи данных устройства воспроизведения без необходимости фильтровать аудиовходные файлы, повторно кодировать или иным образом искажать битовый поток без потерь.
Как показано на фиг.2, аудиокодер 20 без потерь кодирует аудиоданные в последовательности окон анализа и упаковывает кодированные данные и информацию заголовка в масштабируемый битовый поток 22 без потерь, который соответственно сохраняется в архиве 24. Окна анализа - обычно кадры кодированных данных, но, как использовано в настоящем описании, окна могут охватывать множество кадров. Кроме того, окно анализа может уточняться на один или большее количество сегментов данных в кадре, один или большее количество наборов каналов в сегменте, один или большее количество каналов в каждом наборе каналов и, наконец, на одно или большее количество расширений частоты в канале. Решения масштабирования для битового потока могут быть весьма грубыми (множество кадров) или более точными (для расширения частоты в наборе каналов в кадре).
Авторское инструментальное средство 30 используют для размещения кодированных данных на диске (носителе) в соответствии с емкостью буфера декодера. Начальное размещение соответствует буферизированной полезной нагрузке. Данное средство сравнивает буферизированную полезную нагрузку с разрешенной полезной нагрузкой для каждого окна анализа для определения, требует ли размещение какой-нибудь модификации. Разрешенная полезная нагрузка обычно является функцией пиковой битовой скорости, поддерживаемой носителями (диском DVD) или каналом передачи. Разрешенная полезная нагрузка может быть фиксированной или может изменяться как часть глобальной оптимизации. Авторское инструментальное средство селективно масштабирует кодированные без потерь аудиоданные в окнах, не соответствующих требованиям, для уменьшения кодированной полезной нагрузки, а следовательно, буферизированной полезной нагрузки. Процесс масштабирования вводит потери в кодированные данные, но он ограничен только окнами, не соответствующими требованиям, и соответственно выполняется только для того, чтобы привести в соответствие каждое окно. Авторское инструментальное средство упаковывает данные с потерями и без потерь и любую информацию измененного заголовка в битовый поток 32. Битовый поток 32 обычно сохраняется на носителях 34 или передается по каналу 36 передачи для последующего воспроизведения через аудиодекодер 38, который генерирует одно- или многоканальный ИКМ аудиопоток 40.
В примерном варианте осуществления, который показан на фиг. 3 и 4, аудиокодер 20 разделяет каждую аудиовыборку на часть 42 СтР и часть 44 МлР (этап 46). Граничная точка 48, которая разделяет аудиоданные, вычисляется сначала с помощью назначения минимальной битовой ширины 50 СтР (минимального количества СтР), которая устанавливает минимальный уровень кодирования для каждой аудиовыборки. Например, если битовая ширина 52 аудиоданных равна 20 битам, то минимальное количество СтР может быть 16 битов. Из этого следует, что максимальная битовая ширина МлР (максимальное количество МлР) 54 - битовая ширина 52 минус минимальное количество 50 СтР. Кодер вычисляет функцию стоимости, например, нормы L2 или L∞, для аудиоданных в окне анализа. Если функция стоимости превышает пороговое значение, то кодер вычисляет битовую ширину 56 МлР, по меньшей мере, одного бита и не больше максимального количества МлР. Если функция стоимости не превышает пороговое значение, то битовая ширина 56 МлР устанавливается в ноль бит. В общем случае разделение на СтР/МлР выполняется для каждого окна анализа. Как описано выше, это обычно один или более кадров. Разделение может дополнительно уточняться, например, для каждого сегмента данных, набора каналов, канала или расширения частоты. Дополнительное уточнение повышает эффективность кодирования за счет дополнительных вычислений и большего количества служебной информации в битовом потоке.
Кодер без потерь кодирует части СтР (этап 58) и части МлР (этап 60) с помощью различных алгоритмов без потерь. Аудиоданные в частях СтР обычно сильно коррелированы и по времени в пределах любого канала, и между каналами. Поэтому алгоритм без потерь соответственно использует методы энтропийного кодирования, фиксированного (неадаптивного) предсказания, адаптивного предсказания и декорреляции объединенного канала для эффективного кодирования частей СтР. Подходящий кодер без потерь описан в находящейся на рассмотрении заявке «Lossless Multi-Channel Audio Codec», зарегистрированной 8 августа 2004, серийный номер 10/911067, включенной в настоящее описание посредством ссылки. Другие соответствующие кодеры без потерь включают в себя MLP (аудио DVD), Monkey's audio (компьютерные приложения), кодер без потерь Apple, Windows Media Pro без потерь, AudioPak, DVD, LTAC, MUSICcompress, OggSquish, Philips, Shorten, Sonarc и WA. Обзор многих из этих кодеков содержится в Mat Hans, Ronald Schafer «Lossless Compression of Digital Audio» Hewlett Packard, 1999.
Наоборот, аудиоданные в части МлР являются в высокой степени некоррелированными, близкими к шуму. Поэтому сложные методы сжатия в значительной степени неэффективны и потребляют ресурсы обработки. Кроме того, для эффективного авторского создания битового потока очень желателен очень простой код без потерь, использующий упрощенное предсказание очень низкого порядка, с последующим применением простого энтропийного (статистического) кодера. Фактически, являющийся в настоящее время предпочтительным алгоритм должен кодировать часть МлР, просто копируя биты МлР «как есть». Это позволит отбрасывать отдельные МлР без необходимости декодировать часть МлР.
Кодер отдельно упаковывает кодированные части СтР и МлР в масштабируемый битовый поток 62 без потерь так, чтобы их можно было легко распаковать и декодировать (этап 64). В дополнение к обычной информации заголовка кодер упаковывает в заголовок битовую ширину 56 МлР (этап 66). Заголовок также включает в себя промежуток для уменьшения 68 битовой ширины МлР, который не используется при кодировании. Этот процесс повторяется для каждого окна анализа (кадров, кадра, сегмента, набора каналов или расширения частоты), для которого повторно вычисляется разделение.
Как показано на фиг.5, 6 и 7, авторское инструментальное средство 30 предоставляет пользователю возможность выполнять первый проход при размещении аудио и видео битовых потоков на носителях в соответствии с емкостью буфера декодера (этап 70) для удовлетворения ограничений пиковой скорости передачи данных носителей. Авторское инструментальное средство запускает цикл окон анализа (этап 71), вычисляет буферизированную полезную нагрузку (этап 72) и сравнивает буферизированную полезную нагрузку с разрешенной полезной нагрузкой для окна 73 анализа для определения, требует ли битовый поток без потерь какого-нибудь масштабирования для удовлетворения требований ограничения (этап 74). Разрешенная полезная нагрузка определяется емкостью буфера аудиодекодера и пиковой битовой скоростью носителей или канала. Кодированная полезная нагрузка определяется битовой шириной аудиоданных и количеством выборок во всех сегментах 75 данных плюс заголовок 76. Если она не превышает разрешенную полезную нагрузку, то кодированные без потерь части СтР и МлР упаковываются в соответствующие области 77 и 78 СтР и МлР сегментов 75 данных в модифицированном битовом потоке 79 (этап 80). Если разрешенная полезная нагрузка никогда не превышается, то битовый поток без потерь перемещается непосредственно на носители или в канал.
Если буферизированная полезная нагрузка превышает разрешенную полезную нагрузку, то авторское инструментальное средство упаковывает заголовки и кодированные без потерь части 42 СтР в модифицированный битовый поток 79 (этап 81). Основываясь на правиле назначения приоритетов, авторское инструментальное средство вычисляет уменьшение 68 битовой ширины МлР, на которую уменьшается кодированная полезная нагрузка, следовательно буферизуемую полезную нагрузку, до самой большой разрешенной полезной нагрузки (этап 82). Предполагая, что части МлР были просто скопированы во время кодирования без потерь, авторское инструментальное средство масштабирует части МлР (этап 84), предпочтительно добавляя случайный шум к каждой части МлР для сглаживания следующего бита МлР после уменьшения битовой ширины МлР и затем сдвигая часть МлР вправо на уменьшение битовой ширины МлР для отбрасывания битов. Если части МлР закодированы, то они должны декодироваться, сглаживаться, сдвигаться и повторно кодироваться. Данное средство упаковывает теперь кодированные с потерями части МлР для окон, которые теперь соответствуют требованиям, в битовый поток с измененной битовой шириной 56 МлР и уменьшением 68 битовой ширины МлР и параметром добавляемого случайного шума (этап 86).
Как показано на фиг.6, часть 44 МлР масштабирована от битовой ширины, равной 3, к измененной битовой ширине 56 МлР из 1 бита. Два МлР 88, которые отбрасываются, соответствуют уменьшению 68 битовой ширины МлР на 2 бита. В примерном варианте осуществления измененная битовая ширина 56 МлР и уменьшение 68 битовой ширины МлР передаются в декодер в заголовке. Альтернативно любой из них мог быть опущен, и может передаваться исходная битовая ширина МлР. Любой из параметров уникально определяется двумя другими.
Преимущества масштабируемого кодера без потерь и авторского инструментального средства лучше всего иллюстрируются с помощью наложения буферизированной полезной нагрузки 90 на созданный автором битовый поток, показанный на фиг.1, как это сделано на фиг.8. Используя известный подход изменения аудиофайлов для удаления содержимого и затем простого повторного кодирования с помощью кодера без потерь, буферизированная полезная нагрузка 14 была фактически сдвинута вниз до буферизированной полезной нагрузки 16, которая меньше разрешенной полезной нагрузки 10. Для обеспечения того, чтобы пиковая полезная нагрузка была меньше разрешенной полезной нагрузки, значительное количество содержимого отбрасывается по всему битовому потоку. Для сравнения буферизированная полезная нагрузка 90 копирует исходную без потерь буферизированную полезную нагрузку 14 за исключением тех немногих окон (кадров), где буферизированная полезная нагрузка превышает разрешенную полезную нагрузку. В этих областях кодированная полезная нагрузка, а следовательно, буферизированная полезная информация, уменьшается настолько, чтобы удовлетворить требования ограничения, и предпочтительно не больше. В результате емкость полезной нагрузки используется более эффективно, и большее количество содержимого доставляется до конечного пользователя без необходимости изменения исходных аудиофайлов или повторного кодирования.
Как показано на фиг.9, 10 и 11, аудиодекодер 38 принимает созданный автором битовый поток через диск 100. Битовый поток делится на последовательность окон анализа, каждое из которых включает в себя информацию заголовка и кодированные аудиоданные. Большинство окон включает в себя кодированные без потерь части СтР и МлР, исходную битовую ширину МлР и уменьшения битовой ширины МлР, равные нулю. Для удовлетворения требований ограничения полезной нагрузки, которые устанавливаются пиковой битовой скоростью диска 100 и емкостью буфера 102, некоторые из окон включают в себя кодированные части СтР без потерь и части МлР с потерями, измененную битовую ширину частей МлР с потерями и уменьшения битовой ширины МлР.
Контроллер 104 считывает кодированные аудиоданные из битового потока на диске 100. Средство 106 анализа отделяет аудиоданные от видеоданных и передает аудиоданные на аудиобуфер 102, который не переполняется с учетом авторского создания мультимедиа-продуктов. Буфер в свою очередь выдает достаточное количество данных в чип ПЦОС 108 для декодирования аудиоданных для текущего окна анализа. Чип ПЦОС извлекает информацию заголовка (этап 110), который включает в себя измененную битовую ширину 56 МлР, уменьшение 68 битовой ширины МлР, количество 112 пустых МлР в слове исходной ширины, и извлекает, декодирует и компонует части СтР аудиоданных (этап 114). Если все МлР отброшены в процессе авторского создания мультимедиа-продуктов или исходная битовая ширина МлР равна 0 (этап 115), то чип ПЦОС преобразует выборки СтР в слово исходной битовой ширины и выводит ИКМ-данные (этап 116). В противном случае чип ПЦОС декодирует части МлР с потерями и без потерь (этап 118), компонует выборки СтР и МлР (этап 120) и, используя информацию заголовка, преобразует скомпонованные выборки в слово исходной битовой ширины (этап 122).
Многоканальный аудиокодек и авторское инструментальное средство
Примерный вариант осуществления аудиокодека и авторского инструментального средства для кодированного аудиобитового потока, представленного как последовательность кадров, показаны на фиг.12-15. Как показано на фиг.12, каждый кадр 200 содержит заголовок 202 для хранения обычной информации 204 и подзаголовки 206 для каждого набора канала, которые хранят битовую ширину МлР и уменьшения битовой ширины МлР, и один или более сегментов 208 данных. Каждый сегмент данных содержит один или более наборов 210 каналов, причем каждый набор каналов содержит один или более аудиоканалов 212. Каждый канал содержит одно или более расширений 214 частоты, причем, по меньшей мере, расширения самой низкой частоты включают в себя кодированные части 216, 218 СтР и МлР. Битовый поток имеет различное разделение на СтР и МлР для каждого канала в каждом наборе каналов в каждом кадре. Расширения более высокой частоты можно разделять подобным образом или можно полностью кодировать как части МлР.
Масштабируемый битовый поток без потерь, из которого создается этот битовый поток, кодируется, как показано на фиг.13a и 13b. Кодер устанавливает исходную битовую ширину слова (24 бит), минимальное количество (16 бит) СтР, пороговое значение (ПЗ) для квадратичной нормы L2 и фактор масштабирования (ФМ) для этой нормы (этап 220). Кодер запускает цикл кадров (этап 222) и цикл наборов каналов (этап 224). Поскольку фактическая ширина аудиоданных (20 бит) может быть меньше исходной ширины слова, кодер вычисляет количество пустых МлР (24-20=4) (минимальное количество «0» МлР в любой ИКМ-выборке в текущем кадре) и сдвигает вправо каждую выборку на это количество (этап 226). Битовая ширина данных равна исходной битовой ширине (24) минус количество пустых МлР (4) (этап 228). Кодер затем определяет максимальное количество битов (максимальное количество МлР), которое разрешено кодировать, как часть части МлР как максимальное значение (битовая ширина - минимальное количество СтР, 0) (этап 230). В текущем примере максимальное количество МлР=20-16=4 бита.
Для определения граничной точки для разделения аудиоданных на части СтР и МлР кодер начинает индексирование цикла каналов (этап 232) и вычисляет норму L∞ как максимальную абсолютную амплитуду аудиоданных в канале и квадратичную норму L2 как сумму квадратичных амплитуд аудиоданных в окне анализа (этап 234). Кодер устанавливает параметр Max Amp как минимальное целое число, большее или равное log2(L∞) (этап 236), и инициализирует битовую ширину МлР в ноль (этап 237). Если Max Amp больше минимального количества СтР (этап 238), то битовая ширина МлР устанавливается равной разности Max Amp и минимального количества СтР (этап 240). В противном случае, если норма L2 превышает пороговое значение (малая амплитуда, но значительная дисперсия) (этап 242), то битовая ширина МлР устанавливается равной параметру Max Amp, деленному на фактор масштабирования, обычно >1 (этап 244). Если оба теста - «ложно», то битовая ширина МлР остается равной нулю. Другими словами, для поддержания минимального качества кодирования, например, минимального количества СтР, МлР не доступны. Кодер ограничивает битовую ширину МлР на значении максимального количества МлР (этап 246) и упаковывает данное значение в подзаголовок набора каналов (этап 248).
Когда определена граничная точка, т.е. битовая ширина МлР, кодер разделяет аудиоданные на части СтР и МлР (этап 250). Часть СтР кодируется без потерь с использованием соответствующего алгоритма (этап 252) и упаковывается в расширение низкой частоты в конкретном канале в наборе каналов текущего кадра (этап 254). Часть МлР кодируется без потерь с использованием соответствующего алгоритма, например, простого разрядного копирования (этап 256), и упаковывается (этап 258).
Этот процесс повторяется для каждого канала (этап 260) для каждого набора каналов (этап 262) для каждого кадра (этап 264) в битовом потоке. Кроме того, та же самая процедура может повторяться для расширений высоких частот. Однако, поскольку эти расширения содержат намного меньше информации, минимальное количество СтР можно устанавливать в 0, чтобы все кодировалось как МлР.
Когда масштабируемый битовый поток без потерь кодируется для определенного аудиосодержимого, авторское инструментальное средство создает наилучший возможный битовый поток, который удовлетворяет требованиям ограничений пиковой битовой скорости транспортных носителей и емкости буфера в аудиодекодере. Как показано на фиг.14, пользователь пытается разместить битовый поток без потерь 268 на носителе в соответствии с требованиями ограничений битовой скорости и емкости буфера (этап 270). В случае успеха битовый поток без потерь 268 записывается как созданный автором битовый поток 272 и сохраняется на носителе. В противном случае авторское инструментальное средство начинает цикл кадров (этап 274) и сравнивает буферизированную полезную нагрузку (буферизированную среднюю полезную нагрузку от кадра к кадру) с разрешенной полезной нагрузкой (пиковой скоростью передачи данных) (этап 276). Если текущий кадр соответствует разрешенной полезной нагрузке, то кодированные без потерь части СтР и МлР извлекаются из битового потока 268 без потерь и записываются в созданный автором битовый поток 272, и выполняется переход к следующему кадру.
Если авторское инструментальное средство обнаруживает кадр, не соответствующий требованиям, в котором буферизированная полезная нагрузка превышает разрешенную полезную нагрузку, то данное средство вычисляет максимальное уменьшение, которое может быть достигнуто, отбрасывая все части МлР в наборе каналов, и вычитает его из буферизированной полезной нагрузки (этап 278). Если минимальная полезная нагрузка все еще велика, то данное средство отображает сообщение об ошибке, которое включает в себя количество лишних данных и номер кадра (этап 280). В этом случае или следует уменьшать минимальное количество СтР, или следует изменять и повторно кодировать исходные аудиофайлы.
В противном случае авторское инструментальное средство вычисляет уменьшение битовой ширины МлР для каждого канала в текущем кадре, основываясь на указанном правиле назначения приоритета канала (этап 282), так что:
уменьшение битовой ширины [n-ного канала] < битовая ширина МлР [n-ного канала], когда n-ный канал = 0... общее количество каналов -1, и
буферизированная полезная нагрузка [n-ного кадра] - Σ (уменьшение битовой ширины [n-ного канала] · количество выборок в кадре) < разрешенная полезная нагрузка [n-ного кадра].
Уменьшение битовой ширины МлР на эти значения будет гарантировать соответствие кадра разрешенной полезной нагрузке. Это выполняется с минимальными потерями, вводимыми в кадры, не соответствующие требованиям, не воздействуя на кадры без потерь, которые соответствуют требованиям.
Авторское инструментальное средство корректирует кодированные части МлР (предполагая кодирование с разрядным копированием) для каждого канала, добавляя случайный шум к каждой части МлР в кадре для сглаживания следующего бита, и затем сдвигает вправо на уменьшение битовой ширины МлР (этап 284). Добавление случайного шума не является необходимым, но чрезвычайно желательно для декорреляции ошибок квантования, а также чтобы сделать их декоррелированными относительно исходного аудиосигнала. Инструментальное средство упаковывает теперь масштабированные с потерями части МлР (этап 286), измененную битовую ширину МлР и уменьшения битовой ширины МлР для каждого канала (этап 288) и измененные навигационные точки потока (этап 290) в созданный автором битовый поток. Если добавляется случайный шум, то параметр случайного шума упаковывается в битовый поток. Этот процесс затем повторяется для каждого кадра (этап 292) до завершения (этап 294).
Как показано на фиг.15a и 15b, соответствующий декодер синхронизируется с битовым потоком (этап 300) и запускает цикл кадров (этап 302). Декодер извлекает информацию заголовка кадра, включающую в себя некоторое количество сегментов, выборок в сегменте, наборов каналов и т.д. (этап 304), и извлекает информацию заголовка набора каналов, включающую в себя некоторое количество каналов в наборе, пустых МлР, битовую ширину МлР, уменьшение битовой ширины МлР для каждого набора каналов (этап 306), и сохраняет ее для каждого набора каналов (этап 307).
Когда информация заголовка доступна, декодер запускает цикл сегментов (этап 308) и цикл наборов каналов (этап 310) для текущего кадра. Декодер распаковывает и декодирует части СтР (этап 312) и сохраняет ИКМ-выборки (этап 314). Декодер затем запускает цикл каналов в текущем наборе каналов (этап 316) и продолжает работу с кодированными данными МлР.
Если измененная битовая ширина МлР не превышает ноль (этап 318), то декодер запускает цикл выборок в текущем сегменте (этап 320), преобразует ИКМ-выборки для части СтР в слово исходной ширины (этап 322) и повторяет обработку, пока цикл выборок не закончится (этап 324).
В противном случае, декодер запускает цикл выборок в текущем сегменте (этап 326), распаковывает и декодирует части МлР (этап 328) и компонует ИКМ-выборки, присоединяя часть МлР к части СтР (этап 330). Декодер затем преобразует ИКМ-выборку в слово исходной ширины, используя пустые МлР, измененную битовую ширину МлР и информацию уменьшения битовой ширины МлР из заголовка (этап 332), и повторяет этапы, пока цикл выборок не заканчивается (этап 334). Для восстановления всей аудиопоследовательности, декодер повторяет эти этапы для каждого канала (этап 336) в каждом наборе каналов (этап 338) в каждом кадре (этап 340).
Обратно совместимый масштабируемый аудиокодек
Свойства масштабируемости могут вводиться в обратно совместимый кодер без потерь, формат битового потока и декодер. Основной кодовый поток «с потерями» упаковывается совместно с кодированными без потерь частями СтР и МлР аудиоданных для передачи (или записи). После декодирования в декодере с расширенными возможностями без потерь потоки СтР без потерь и с потерями объединяются, и поток МлР присоединяется для создания восстановленного сигнала без потерь. В декодере предшествующего поколения дополнительные потоки СтР и МлР без потерь игнорируются, и основной поток «с потерями» декодируется для обеспечения высококачественного многоканального аудиосигнала с шириной полосы и характеристикой отношения сигнал - шум основного потока.
Фиг.16a показывает представление на уровне системы масштабируемого обратносовместимого кодера 400. Цифровой аудиосигнал, соответственно М-битовые аудио ИКМ-выборки, подаются на вход 402. Предпочтительно цифровой аудиосигнал имеет частоту дискретизации и ширину полосы, которые превышают ширину полосы модифицированного основного кодера 404 с потерями. В одном из вариантов осуществления частота дискретизации цифрового аудиосигнала - 96 кГц (соответствует полосе пропускания 48 кГц для дискретизированного аудиосигнала). Следует также понимать, что входной аудиосигнал может быть, и предпочтительно является, многоканальным сигналом, в котором каждый канал дискретизирован с частотой 96 кГц. Последующее описание относится к обработке одного канала, но расширение на множество каналов не вызывает затруднений. Входные сигналы дублируются в узле 406 и обрабатываются в параллельных трактах. В первом тракте сигнала модифицированный широкополосный кодер 404 с потерями кодирует сигнал. Модифицированный основной кодер 404, который описан подробно ниже, формирует кодированный поток данных (основной поток 408), который передается на блок упаковывания, или мультиплексор 410. Основной поток 408 также передается на модифицированный декодер 412 основного потока, который формирует на выходе модифицированный восстановленный основной сигнал 414, который сдвигается вправо на N бит (>>N 415), чтобы отбросить его N МлР.
Оцифрованный аудиосигнал 402, вводимый в параллельный тракт, подвергают компенсирующей задержке 416 по существу так, чтобы она равнялась задержке, введенной в восстановленный аудиопоток (модифицированным кодером и модифицированными декодерами), для создания задержанного цифрового аудиопотока. Аудиопоток разделяется на части СтР и МлР 417, как описано выше. N-битная часть 418 МлР передается в блок 410 сжатия. M-N битный восстановленный основной сигнал 414, который был сдвинут, чтобы выровнять его с частью СтР, вычитается из части СтР задержанного цифрового аудиопотока 419 в узле 420 вычитания. (Следует отметить, что узел вычитания можно заменить узлом суммирования, изменяя полярность одного из входов. Таким образом, суммирование и вычитание могут быть по существу эквивалентными для этой цели.)
Узел 420 вычитания формирует разностный сигнал 422, который представляет различие между M-N СтР исходного сигнала и восстановленным основным сигналом. Для реализации кодирования совершенно «без потерь» необходимо кодировать и передавать разностный сигнал с помощью методов кодирования без потерь. Соответственно M-N битовый разностный сигнал 422 кодируется с помощью кодера 424 без потерь, и кодированный M-N битовый сигнал 426 упаковывается, или мультиплексируется, с основным потоком 408 в блоке 410 упаковывания для создания мультиплексированного битового выходного потока 428. Следует отметить, что кодирование без потерь формирует кодированные потоки 418 и 426 без потерь, которые имеют различную битовую скорость, с учетом потребностей кодера без потерь. Сжатый поток затем дополнительно подвергается кодированию последующих уровней, которые включают в себя канальное кодирование, и затем передается или записывается. Следует отметить, что в целях данного раскрытия запись может рассматриваться как передача через канал.
Основной кодер 404 описывается как «модифицированный», потому что в варианте осуществления, который может обрабатывать расширенную ширину полосы, основной кодер требует модификации. Блок фильтров анализа с 64 полосами в кодере отбрасывает половину его выходных данных и кодирует только 32 нижние полосы частот. Эта отброшенная информация не представляет никакого интереса для существующих декодеров, которые в любом случае не способны восстанавливать верхнюю половину спектра сигнала. Остальная информация кодируется согласно немодифицированному кодеру, чтобы сформировать обратно совместимый основной выходной поток. Однако в другом варианте осуществления, работающем с частотой дискретизации 48 кГц или ниже, основной кодер может быть по существу немодифицированной версией предшествующего основного кодера. Точно так же для работы выше частоты дискретизации существующих декодеров, основной декодер 412 должен быть модифицирован, как описано ниже. Для работы на обычной частоте дискретизации (например, 48 кГц и ниже) основной декодер может быть по существу немодифицированной версией основного декодера предшествующего уровня техники или эквивалентен ему. В некоторых вариантах осуществления частота дискретизации может выбираться в процессе кодирования, и модули кодирования и декодирования при этом нереконфигурируются с помощью программного обеспечения, как требуется.
Как показано на фиг.16b способ декодирования является дополняющим к способу кодирования. Декодер предшествующего поколения может декодировать основной аудиосигнал с потерями, просто декодируя основной поток 408 и отбрасывая части МлР и СтР без потерь. Качество аудиосигнала, сформированного в таком декодере предшествующего поколения, будет очень хорошим, эквивалентным аудиоинформации предшествующего поколения, но не без потерь.
Согласно фиг.16b, поступающий битовый поток (восстановленный или из канала передачи данных, или с носителя записи) сначала распаковывается в блоке 430 распаковывания, который отделяет основной поток 408 от потоков данных расширения без потерь 418 (МлР) и 426 (СтР). Основной поток декодируется с помощью модифицированного основного декодера 432, который восстанавливает основной поток с помощью обнуления не переданных выборок подполос для 32 верхних полос при 64-полосном синтезе при восстановлении. (Следует обратить внимание, что если выполняется стандартное основное кодирование, то обнуление не требуется.) Поле расширения СтР декодируется с помощью декодера 434 СтР без потерь. Поскольку данные МлР кодировались без потерь с использованием разрядного копирования, то никакого декодирования не требуется.
После параллельного декодирования основного потока и расширений СтР без потерь интерполированные восстановленные основные данные сдвигаются вправо на N битов 436 и объединяются с частью данных без потерь с помощью сложения в блоке 438 сложения. Суммированная выходная информация сдвигается влево на N битов 440 для формирования части 442 СтР без потерь и компонуется с N-битной частью 444 МлР для формирования ИКМ информационного слова 446, которое является восстановленным представлением без потерь исходного аудиосигнала 402.
Поскольку данный сигнал кодировался путем вычитания декодированного восстановленного сигнала с потерями из точного входного сигнала, то восстановленный сигнал представляет точную реконструкцию исходных аудиоданных. Таким образом, как это ни парадоксально, комбинация кодека с потерями и кодированного сигнала без потерь фактически выступает в качестве кодека полностью без потерь, но с дополнительным преимуществом, что кодированные данные остаются совместимыми с декодерами без потерь предшествующего поколения. Кроме того, битовый поток может масштабироваться путем селективного отбрасывания МлР, чтобы он соответствовал ограничениям битовой скорости носителей и емкости буфера.
Хотя показаны и описаны некоторые иллюстративные варианты осуществления изобретения, специалистами могут быть предложены многочисленные разновидности и дополнительные варианты осуществления. Такие разновидности и дополнительные варианты осуществления предполагаются, и они могут выполняться без отклонения от сущности и объема изобретения, как определено в прилагаемой формуле изобретения.

Claims (34)

1. Способ кодирования и авторского создания аудиоданных, содержащий этапы:
разделяют аудиоданные на части старших значащих разрядов (СтР) и младших значащих разрядов (МлР) в каждом из последовательности окон анализа;
кодируют без потерь соответствующие части СтР и МлР в каждом окне анализа для формирования масштабируемого битового потока;
сравнивают буферизированную полезную нагрузку для кодированных без потерь частей СтР и МлР с разрешенной полезной нагрузкой для каждого окна; и
масштабируют кодированную без потерь часть МлР аудиоданных в окнах, не соответствующих требованиям, так, чтобы буферизированная полезная нагрузка для битового потока авторского создания не превышала разрешенную полезную нагрузку, при этом этап масштабирования уменьшает битовую ширину части МлР на уменьшение битовой ширины, тем самым вводя потери в часть МлР кодированных аудиоданных в этих окнах, и
упаковывают битовые ширины и уменьшения битовой ширины частей МлР в битовый поток авторского создания.
2. Способ по п.1, в котором аудиоданные разделяют с помощью этапов, на которых:
назначают минимальную битовую ширину СтР (минимум СтР);
вычисляют норму параметра для аудиоданных в окне анализа;
если норма параметра превышает пороговое значение, то вычисляют битовую ширину МлР, по меньшей мере, одного бита, которая удовлетворяет минимуму СтР; и
если норма параметра не превышает пороговое значение, то назначают битовую ширину МлР равной ноль битов.
3. Способ по п.2, дополнительно содержащий этапы, на которых:
вычисляют максимальную битовую ширину МлР (максимум МлР) как битовую ширину аудиоданных за вычетом минимума СтР;
вычисляют норму L∞, как максимальную абсолютную амплитуду аудиоданных в окне анализа;
вычисляют Max Amp, как количество битов, необходимых для представления выборки со значением, равным - L∞;
вычисляют квадратичную норму L2 как сумму квадратичных амплитуд аудиоданных в окне анализа;
если Max Amp не превышает минимума СтР и норма L2 не превышает пороговое значение, то устанавливают битовую ширину МлР в ноль битов;
если Max Amp не превышает минимума СтР, но норма L2 превышает пороговое значение, то устанавливают битовую ширину МлР в максимальное значение битовой ширины МлР, деленное на коэффициент масштабирования;
если Max Amp превышает минимум СтР, то устанавливают битовую ширину МлР равной Max Amp минус минимум СтР.
4. Способ по п.3, в котором битовую ширину МлР ограничивают максимальной битовой шириной МлР (максимумом МлР), определенной шириной слова аудиоданных и минимумом СтР.
5. Способ по п.1, в котором битовую ширину МлР и кодированные части СтР и МлР упаковывают в битовый поток для каждого окна анализа.
6. Способ по п.1, в котором часть СтР кодируют с использованием алгоритма без потерь, который включает в себя декорреляцию между множеством аудиоканалов и адаптивное предсказание в пределах каждого аудиоканала.
7. Способ по п.1, в котором часть МлР кодируют с использованием алгоритма без потерь, который копирует биты для ИКМ-выборок.
8. Способ по п.1, в котором часть МлР кодируют с помощью алгоритма без потерь, который использует предсказание с низким порядком и энтропийное кодирование.
9. Способ по п.1, в котором окна анализа представляют собой кадры, причем каждый кадр содержит заголовок для хранения битовой ширины МлР и один или большее количество секторов, каждый сектор содержит один или более наборов каналов, каждый набор каналов содержит один или более аудиоканалов, каждый канал содержит одно или более расширений частоты, причем упомянутое расширение нижних частот включает в себя кодированные части МлР и СтР.
10. Способ по п.9, в котором битовый поток имеет отличающееся разделение на СтР и МлР для каждого канала в каждом наборе каналов в каждом кадре.
11. Способ по п.10, в котором упомянутые расширения высоких частот включают в себя только кодированные части МлР.
12. Способ по п.1, в котором авторское создание битового потока осуществляется посредством:
упаковки кодированных без потерь частей СтР в битовый поток для всех окон;
упаковки кодированных без потерь частей МлР в битовый поток для окон, соответствующих требованиям;
масштабирования кодированных без потерь частей МлР для любых окон, не соответствующих требованиям, для приведения их в соответствие требованиям; и
упаковки частей МлР, которые теперь кодированы с потерями, для окон, которые теперь соответствуют требованиям, в битовый поток.
13. Способ по п.12, в котором масштабирование частей МлР выполняется посредством:
вычисления уменьшения битовой ширины МлР для окна анализа;
декодирования частей МлР в окнах, не соответствующих требованиям;
уменьшения частей МлР на уменьшение битовой ширины МлР путем отбрасывания данного количества МлР;
кодирования измененных частей МлР с использованием алгоритма кодирования без потерь;
упаковки кодированных частей МлР; и упаковки измененных битовых ширин МлР и уменьшения битовой ширины МлР в битовый поток.
14. Способ по п.13, в котором кодирование без потерь представляет собой простое битовое копирование, причем части МлР уменьшают посредством:
добавления случайного шума к каждой части МлР так, чтобы сглаживать следующий МлР после уменьшения битовой ширины МлР; и
сдвига части МлР вправо на уменьшение битовой ширины МлР.
15. Способ по п.13, в котором уменьшение битовой ширины МлР как раз достаточно для того, чтобы буферизированная полезная нагрузка не превышала разрешенную полезную нагрузку.
16. Способ по п.13, в котором аудиоданные включают в себя множество каналов, при этом упомянутое уменьшение битовой ширины МлР вычисляют для каждого канала в соответствии с правилом назначения приоритета канала.
17. Способ кодирования масштабируемого битового потока без потерь для аудиоданных, содержащий этапы, на которых:
определяют точку разрыва, которая разделяет аудиоданные на часть СтР и МлР для окна анализа;
без потерь кодируют части СтР;
без потерь кодируют части МлР;
упаковывают кодированные части СтР и части МлР в битовый поток без потерь и
упаковывают битовые ширины частей МлР в заголовок; и
упаковывают заголовок в битовый поток без потерь.
18. Способ по п.17, в котором точку разрыва определяют посредством этапов, на которых:
назначают минимальную битовую ширину СтР (минимум СтР);
вычисляют норму параметра для аудиоданных в окне анализа;
если норма параметра превышает пороговое значение, то вычисляют битовую ширину МлР, по меньшей мере, одного бита, которая удовлетворяет минимуму СтР; и
если норма параметра не превышает пороговое значение, то назначают битовую ширину МлР равной ноль бит.
19. Способ по п.17, в котором части МлР кодируют с помощью алгоритма без потерь, который копирует биты аудиоданных.
20. Способ авторского создания битового потока аудиоданных на носителе, содержащий этапы, на которых:
a) определяют схему размещения кодированных аудиоданных из битового потока на носителе для буфера декодера, причем упомянутый битовый поток включает в себя кодированные без потерь части СтР и МлР в последовательности окон анализа;
b) вычисляют буферизированную полезную нагрузку для кодированных аудиоданных для следующего окна анализа;
c) если буферизированная полезная нагрузка находится в пределах разрешенной полезной нагрузки для окна анализа, то упаковывают кодированные без потерь части СтР и МлР в битовый поток;
d) если буферизированная полезная нагрузка превышает разрешенную полезную нагрузку для окна анализа, то
упаковывают заголовки, хранящие параметры сигнала и кодированную без потерь часть СтР в модифицированный битовый поток;
масштабируют кодированную без потерь часть МлР в кодированную с потерями часть МлР так, чтобы буферизированная полезная нагрузка находилась в пределах разрешенной полезной нагрузки; и
упаковывают кодированную с потерями часть МлР вместе с ее информацией масштабирования в модифицированный битовый поток; и
е) повторяют этапы с b) до d) для каждого окна анализа.
21. Способ по п.20, в котором части МлР масштабируют посредством этапов, на которых:
вычисляют уменьшение битовой ширины МлР для окна анализа;
декодируют части МлР в окнах, не соответствующих требованиям;
уменьшают части МлР на уменьшение битовой ширины МлР путем отбрасывания этого количества МлР;
кодируют измененные части МлР с использованием алгоритма кодирования без потерь;
упаковывают кодированные части МлР и
упаковывают измененные битовые ширины МлР и уменьшение битовой ширины МлР в битовый поток.
22. Способ по п.21, в котором кодирование без потерь и декодирование представляет собой простое битовое копирование, при этом части МлР уменьшают посредством:
добавления случайного шума к каждой части МлР так, чтобы сглаживать следующей МлР после уменьшения битовой ширины МлР; и
сдвига части МлР вправо на уменьшение битовой ширины МлР.
23. Машиночитаемый носитель, выполненный с возможностью работы с аудиодекодером, причем носитель содержит хранящиеся на нем:
битовый поток, разделенный на последовательность окон анализа кодированных аудиоданных, хранящихся на носителе, причем аудиоданные в каждом упомянутом окне анализа кодированы без потерь, за исключением необходимого для уменьшения буферизированной полезной нагрузки упомянутого окна анализа до значения, которое не больше разрешенной полезной нагрузки.
24. Машиночитаемый носитель, выполненный с возможностью работы с аудиодекодером по п.23, в котором некоторые из окон анализа включают в себя кодированные без потерь части СтР и МлР, а остальные окна анализа включают в себя кодированные без потерь части СтР и кодированные с потерями части МлР.
25. Машиночитаемый носитель, выполненный с возможностью работы с аудиодекодером по п.24, в котором битовый поток включает в себя информацию заголовка, содержащую измененные битовые ширины частей МлР и уменьшение битовой ширины частей МлР.
26. Машиночитаемый носитель, выполненный с возможностью работы с аудиодекодером по п.25, в котором части МлР кодированы без потерь и с потерями с использованием битового копирования.
27. Машиночитаемый носитель, выполненный с возможностью работы с аудиодекодером по п.26, в котором уменьшение битовой ширины частей МлР является как раз достаточным для того, чтобы буферизированная полезная нагрузка не превышала разрешенную полезную нагрузку.
28. Способ декодирования битового потока аудиоданных, содержащий этапы, на которых:
принимают битовый поток как последовательность окон анализа, содержащих информацию заголовка, включающую в себя битовую ширину МлР и уменьшение битовой ширины МлР, и аудиоданные, включающие в себя кодированные без потерь или масштабированные части СтР, а также или кодированные без потерь или кодированные с потерями части МлР с модифицированными битовыми ширинами и масштабированием с уменьшением битовой ширины так, чтобы буферизированная полезная нагрузка каждого окна анализа находилась в пределах разрешенной полезной нагрузки;
извлекают битовую ширину МлР и уменьшение битовой ширины МлР для каждого окна анализа;
извлекают кодированные без потерь или масштабированные части СтР и декодируют их в ИКМ аудиоданные;
извлекают или кодированные без потерь или с потерями части МлР с модифицированными битовыми ширинами и масштабированием с уменьшением битовой ширины и декодируют их в ИКМ аудиоданные;
компонуют части СтР и МлР для каждой ИКМ аудиовыборки;
используют битовую ширину МлР и уменьшение битовой ширины МлР для преобразования скомпонованных ИКМ аудиоданных в слово исходной битовой ширины; и
выводят ИКМ аудиоданные для каждого окна анализа.
29. Способ по п.28, в котором кодированные без потерь и масштабированные части МлР декодируют с помощью битового копирования.
30. Декодер для приема битового потока аудио-сигналов, конфигурированный для приема битового потока и вывода ИКМ аудиоданных, указанный декодер сконфигурирован для выполнения этапов:
извлечения битовой ширины МлР и уменьшения битовой ширины МлР для каждого окна анализа в битовом потоке;
извлечения кодированных без потерь или масштабированных частей СтР и декодирования их в ИКМ аудиоданных;
извлечения или кодированных без потерь или с потерями частей МлР с модифицированными битовыми ширинами и масштабированием с уменьшением битовой ширины и декодирования их в ИКМ аудиоданные;
компоновки частей СтР и МлР для каждой ИКМ аудиовыборки;
использования битовой ширины МлР и уменьшения битовой ширины МлР для преобразования скомпонованных ИКМ аудиоданных в слово исходной битовой ширины; и
вывода ИКМ аудиоданных для каждого окна анализа.
31. Аудиодекодер, содержащий:
контроллер, предназначенный для считывания кодированных аудиоданных из битового потока на носителе;
буфер, предназначенный для буферизирования множества окон анализа кодированных аудиоданных; и
процессор цифровой обработки сигналов (ПЦОС), предназначенный для декодирования кодированных аудиоданных и вывода ИКМ аудиоданных для каждого последовательного окна анализа, причем упомянутый ПЦОС конфигурирован для декодирования окон анализа, содержащих информацию заголовка, включающую в себя битовые ширины МлР и уменьшения битовой ширины МлР, и аудиоданные, включающие в себя кодированные без потерь части СтР и кодированные без потерь или с потерями части МлР с модифицированными битовыми ширинами и масштабированием с уменьшением битовой ширины, причем буферизированная полезная нагрузка не превышает разрешенную полезную нагрузку, определенную пиковой битовой скоростью, поддерживаемой носителями, и емкостью буфера.
32. Аудиодекодер по п.31, в котором ПЦОС выполняет этапы:
извлечения битовой ширины МлР и уменьшения битовой ширины МлР для каждого окна анализа в битовом потоке;
извлечения кодированных без потерь или масштабированных частей СтР и декодирования их в ИКМ аудиоданные;
извлечения либо кодированных без потерь или с потерями частей МлР с модифицированными битовыми ширинами и масштабированием с уменьшением битовой ширины и декодирования их в ИКМ аудиоданные;
компоновки частей СтР и МлР для каждой ИКМ аудиовыборки;
использования битовой ширины МлР и уменьшения битовой ширины МлР для преобразования скомпонованных ИКМ аудиоданных в слово исходной битовой ширины; и
вывода ИКМ аудиоданных для каждого окна анализа.
33. Способ кодирования масштабируемого битового потока без потерь для М-битовых аудиоданных, который является обратно совместимым с основным декодером с потерями, содержащий этапы, на которых:
кодируют М-битовые аудиоданные в М-битовые основной поток с потерями;
упаковывают М-битовый основной поток с потерями в битовый поток;
декодируют М-битовый основной поток в восстановленный основной сигнал;
разделяют задержанные М-битовые аудиоданные на M-N битовые СтР и N-битовые МлР части;
упаковывают N-битовую часть МлР в битовый поток;
сдвигают вправо восстановленный основной сигнал на M-N бит для выравнивания его с частью СтР;
вычитают восстановленный основной M-N битовый сигнал из M-N битовой части СтР задержанных М-битовых аудиоданных для формирования M-N битового разностного сигнала;
кодируют без потерь M-N битовый разностный сигнал;
упаковывают кодированный M-N битовый разностный сигнал в битовый поток; и
упаковывают битовые ширины частей МлР, полученные разделением из М-битовых аудиоданных, в битовый поток без потерь.
34. Способ по п.33, дополнительно содержащий добавление случайного шума к восстановленному основному сигналу до сдвига вправо и упаковку параметра случайного шума в битовый поток.
RU2006137566/09A 2004-03-25 2005-03-21 Масштабируемый аудиокодер без потерь и авторское инструментальное средство RU2387022C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US55618304P 2004-03-25 2004-03-25
US60/556,183 2004-03-25
US10/911,062 US7272567B2 (en) 2004-03-25 2004-08-04 Scalable lossless audio codec and authoring tool
US10/911,067 2004-08-04
US10/911,062 2004-08-04

Publications (2)

Publication Number Publication Date
RU2006137566A RU2006137566A (ru) 2008-04-27
RU2387022C2 true RU2387022C2 (ru) 2010-04-20

Family

ID=38072128

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2006137573/09A RU2387023C2 (ru) 2004-03-25 2005-03-21 Многоканальный аудиокодер без потерь
RU2006137566/09A RU2387022C2 (ru) 2004-03-25 2005-03-21 Масштабируемый аудиокодер без потерь и авторское инструментальное средство

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2006137573/09A RU2387023C2 (ru) 2004-03-25 2005-03-21 Многоканальный аудиокодер без потерь

Country Status (7)

Country Link
US (5) US7272567B2 (ru)
JP (4) JP4934020B2 (ru)
KR (1) KR101307693B1 (ru)
CN (2) CN1961351B (ru)
ES (3) ES2537820T3 (ru)
HK (2) HK1099597A1 (ru)
RU (2) RU2387023C2 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2609102C2 (ru) * 2011-12-02 2017-01-30 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для совмещения потоков пространственного аудиокодирования на основе геометрии
US9928845B2 (en) 2013-10-18 2018-03-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
RU2659490C2 (ru) * 2013-10-22 2018-07-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция для объединенного сжатия динамического диапазона и управляемого предотвращения отсечения для аудиоустройств
RU2727968C2 (ru) * 2015-09-22 2020-07-28 Конинклейке Филипс Н.В. Обработка аудиосигнала

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7378586B2 (en) * 2002-10-01 2008-05-27 Yamaha Corporation Compressed data structure and apparatus and method related thereto
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
BRPI0514940A (pt) * 2004-09-06 2008-07-01 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável e método de codificação escalável
US7466867B2 (en) * 2004-11-26 2008-12-16 Taiwan Imagingtek Corporation Method and apparatus for image compression and decompression
US8265929B2 (en) * 2004-12-08 2012-09-11 Electronics And Telecommunications Research Institute Embedded code-excited linear prediction speech coding and decoding apparatus and method
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US20060235683A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Lossless encoding of information with guaranteed maximum bitrate
CN101167126B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
US8433581B2 (en) * 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8032240B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8319791B2 (en) * 2005-10-03 2012-11-27 Sharp Kabushiki Kaisha Display
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857115B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
EP1946302A4 (en) * 2005-10-05 2009-08-19 Lg Electronics Inc SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US7716043B2 (en) * 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
CN101385079B (zh) * 2006-02-14 2012-08-29 法国电信公司 在音频编码/解码中用于知觉加权的设备
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
CN1920947B (zh) * 2006-09-15 2011-05-11 清华大学 用于低比特率音频编码的语音/音乐检测器
US7471218B2 (en) * 2006-09-18 2008-12-30 National Semiconductor Corporation Methods and systems for efficiently storing and retrieving streaming data
JP4325657B2 (ja) * 2006-10-02 2009-09-02 ソニー株式会社 光ディスク再生装置、信号処理方法、およびプログラム
US8260070B1 (en) * 2006-10-03 2012-09-04 Adobe Systems Incorporated Method and system to generate a compressed image utilizing custom probability tables
US9053753B2 (en) * 2006-11-09 2015-06-09 Broadcom Corporation Method and system for a flexible multiplexer and mixer
US20080114478A1 (en) * 2006-11-09 2008-05-15 David Wu Method and System for Multi-Channel PCM Audio Grouping in Hardware
US7385532B1 (en) * 2007-02-16 2008-06-10 Xilinx, Inc. Extended bitstream and generation thereof for dynamically configuring a decoder
US7886303B2 (en) * 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
WO2009010674A1 (fr) * 2007-07-06 2009-01-22 France Telecom Codage hierarchique de signaux audionumeriques
KR101518507B1 (ko) * 2007-07-19 2015-05-11 한국전자통신연구원 영상신호 송수신 장치 및 방법
US9541658B2 (en) * 2007-08-02 2017-01-10 Westerngeco L. L. C. Dynamically allocating different numbers of bits to windows of a series representing a seismic trace
KR100912826B1 (ko) * 2007-08-16 2009-08-18 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법
KR101381602B1 (ko) * 2007-09-17 2014-04-04 삼성전자주식회사 계층적 부호화 및 복호화 방법 및 장치
JPWO2009050896A1 (ja) * 2007-10-16 2011-02-24 パナソニック株式会社 ストリーム合成装置、復号装置、方法
JP4893892B2 (ja) * 2007-12-04 2012-03-07 国立大学法人島根大学 可逆圧縮用符号化システム、情報記録媒体及び印刷媒体
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
US8548002B2 (en) * 2008-02-08 2013-10-01 Koolspan, Inc. Systems and methods for adaptive multi-rate protocol enhancement
US8386271B2 (en) 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
GB0817977D0 (en) * 2008-10-01 2008-11-05 Craven Peter G Improved lossy coding of signals
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
JP4784653B2 (ja) * 2009-01-23 2011-10-05 ソニー株式会社 音声データ送信装置、音声データ送信方法、音声データ受信装置および音声データ受信方法
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
JP5355690B2 (ja) * 2009-06-01 2013-11-27 三菱電機株式会社 信号処理装置
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
JP2011109172A (ja) * 2009-11-12 2011-06-02 Hitachi Kokusai Electric Inc 映像符号化装置、および、そのデータ処理方法
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
US8649521B2 (en) * 2010-01-28 2014-02-11 Cleversafe, Inc. Obfuscation of sequenced encoded data slices
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
SG184230A1 (en) * 2010-03-26 2012-11-29 Agency Science Tech & Res Methods and devices for providing an encoded digital signal
JP5714002B2 (ja) * 2010-04-19 2015-05-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
JP5688136B2 (ja) * 2010-04-23 2015-03-25 エム アンド ケー ホールディングス インコーポレイテッド 映像を符号化する装置及び方法
KR101676477B1 (ko) * 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
ES2727748T3 (es) 2010-11-22 2019-10-18 Ntt Docomo Inc Dispositivo y método de codificación de audio
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
US8639494B1 (en) * 2010-12-28 2014-01-28 Intuit Inc. Technique for correcting user-interface shift errors
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
EP2754096A4 (en) 2011-09-09 2015-08-05 Panamorph Inc IMAGE PROCESSING SYSTEM AND METHOD
US9165563B2 (en) * 2012-03-19 2015-10-20 Casio Computer Co., Ltd. Coding device, coding method, decoding device, decoding method, and storage medium
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
EP2717262A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
CA3054712C (en) 2013-01-08 2020-06-09 Lars Villemoes Model based prediction in a critically sampled filterbank
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio
PT3011555T (pt) * 2013-06-21 2018-07-04 Fraunhofer Ges Forschung Reconstrução de uma estrutura de discurso
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
CN103346949B (zh) * 2013-07-25 2016-08-17 北京大学 基于嵌入式的双通道网络数据包的拆包和组包方法及系统
US11350015B2 (en) 2014-01-06 2022-05-31 Panamorph, Inc. Image processing system and method
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
CN110970041B (zh) * 2014-07-01 2023-10-20 韩国电子通信研究院 处理多信道音频信号的方法和装置
CN105512079B (zh) * 2015-12-12 2018-07-03 中国航空工业集团公司西安航空计算技术研究所 一种1394总线多通道流数据并行组包方法
EP3408851B1 (en) 2016-01-26 2019-09-11 Dolby Laboratories Licensing Corporation Adaptive quantization
JP6977711B2 (ja) * 2016-03-28 2021-12-08 ソニーグループ株式会社 情報処理装置および情報処理方法、並びに情報処理システム
EP3264644A1 (en) 2016-07-01 2018-01-03 Nxp B.V. Multiple source receiver
US10936941B2 (en) * 2016-08-12 2021-03-02 Xilinx, Inc. Efficient data access control device for neural network hardware acceleration system
US10522155B2 (en) 2017-02-21 2019-12-31 Cirrus Logic, Inc. Pulse code modulation (PCM) data-marking
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
CN107680605A (zh) * 2017-09-29 2018-02-09 湖南国科微电子股份有限公司 一种ape格式错误数据处理方法及系统
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10727858B2 (en) * 2018-06-18 2020-07-28 Qualcomm Incorporated Error resiliency for entropy coded audio data
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN110366752B (zh) * 2019-05-21 2023-10-10 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
CN114270832A (zh) * 2019-08-14 2022-04-01 Lg电子株式会社 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
CN110827838A (zh) * 2019-10-16 2020-02-21 云知声智能科技股份有限公司 一种基于opus的语音编码方法及装置
EP4138396A4 (en) * 2020-05-21 2023-07-05 Huawei Technologies Co., Ltd. AUDIO DATA TRANSMISSION METHOD AND DEVICE ASSOCIATED
CN111641416B (zh) * 2020-06-19 2023-04-07 重庆邮电大学 一种多归一化因子的低密度奇偶校验码译码方法
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4833718A (en) * 1986-11-18 1989-05-23 First Byte Compression of stored waveforms for artificial speech
JPS6444499A (en) * 1987-08-12 1989-02-16 Fujitsu Ltd Forecast encoding system for voice
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0649557B1 (en) * 1993-05-05 1999-08-25 Koninklijke Philips Electronics N.V. Transmission system comprising at least a coder
US5589830A (en) * 1994-11-02 1996-12-31 Advanced Micro Devices, Inc. Stereo audio codec
GB9509831D0 (en) 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR19990082402A (ko) * 1996-02-08 1999-11-25 모리시타 요이찌 광대역 오디오신호 부호장치, 광대역 오디오신호 복호장치, 광대역 오디오신호 부호 복호장치 및 광대역 오디오신호 기록매체
EP0798866A2 (en) * 1996-03-27 1997-10-01 Kabushiki Kaisha Toshiba Digital data processing system
US5839100A (en) * 1996-04-22 1998-11-17 Wegener; Albert William Lossless and loss-limited compression of sampled data signals
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6016111A (en) * 1997-07-31 2000-01-18 Samsung Electronics Co., Ltd. Digital data coding/decoding method and apparatus
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6118392A (en) * 1998-03-12 2000-09-12 Liquid Audio Inc. Lossless data compression with low complexity
US6023233A (en) * 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems
US6360204B1 (en) * 1998-04-24 2002-03-19 Sarnoff Corporation Method and apparatus for implementing rounding in decoding an audio signal
TW366660B (en) * 1998-04-30 1999-08-11 Nat Science Council Method of degrouping a codeword in a computer system
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP3344581B2 (ja) * 1998-10-13 2002-11-11 日本ビクター株式会社 音声符号化装置
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
EP1087557A3 (en) * 1999-09-22 2005-01-19 Matsushita Electric Industrial Co., Ltd. Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data
US6373411B1 (en) * 2000-08-31 2002-04-16 Agere Systems Guardian Corp. Method and apparatus for performing variable-size vector entropy coding
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
WO2002071622A2 (en) * 2001-03-05 2002-09-12 Koninklijke Philips Electronics N.V. Device and method for compressing a signal
JP3690591B2 (ja) * 2001-05-28 2005-08-31 シャープ株式会社 符号化装置
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US20030231799A1 (en) * 2002-06-14 2003-12-18 Craig Schmidt Lossless data compression using constraint propagation
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7742926B2 (en) * 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
WO2004098066A1 (ja) * 2003-04-28 2004-11-11 Nippon Telegraph And Telephone Corporation 浮動小数点形式ディジタル信号可逆符号化方法、及び復号化方法と、その各装置、その各プログラム
JP4049793B2 (ja) * 2003-09-02 2008-02-20 日本電信電話株式会社 浮動小数点信号可逆符号化方法、復号化方法、及びそれらの装置、プログラム及びその記録媒体
US7009533B1 (en) * 2004-02-13 2006-03-07 Samplify Systems Llc Adaptive compression and decompression of bandlimited signals
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US7408481B2 (en) * 2004-10-15 2008-08-05 Nippon Telegraph And Telephone Corporation Information encoding method, decoding method, common multiplier estimating method, and apparatus, program, and recording medium using these methods
US8050334B2 (en) * 2005-07-07 2011-11-01 Nippon Telegraph And Telephone Corporation Signal encoder, signal decoder, signal encoding method, signal decoding method, program, recording medium and signal codec method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2609102C2 (ru) * 2011-12-02 2017-01-30 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для совмещения потоков пространственного аудиокодирования на основе геометрии
US9928845B2 (en) 2013-10-18 2018-03-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
RU2651190C2 (ru) * 2013-10-18 2018-04-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиодекодер, устройство формирования выходных кодированных аудиоданных и способы, позволяющие инициализацию декодера
US10229694B2 (en) 2013-10-18 2019-03-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US10614824B2 (en) 2013-10-18 2020-04-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US11423919B2 (en) 2013-10-18 2022-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US11670314B2 (en) 2013-10-18 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
RU2659490C2 (ru) * 2013-10-22 2018-07-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция для объединенного сжатия динамического диапазона и управляемого предотвращения отсечения для аудиоустройств
US11170795B2 (en) 2013-10-22 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for combined dynamic range compression and guided clipping prevention for audio devices
US11551703B2 (en) 2013-10-22 2023-01-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for combined dynamic range compression and guided clipping prevention for audio devices
RU2727968C2 (ru) * 2015-09-22 2020-07-28 Конинклейке Филипс Н.В. Обработка аудиосигнала

Also Published As

Publication number Publication date
JP5599913B2 (ja) 2014-10-01
US7392195B2 (en) 2008-06-24
JP4934020B2 (ja) 2012-05-16
ES2537820T3 (es) 2015-06-12
CN1961351B (zh) 2010-12-15
RU2006137573A (ru) 2008-04-27
US20050246178A1 (en) 2005-11-03
RU2387023C2 (ru) 2010-04-20
KR20120116019A (ko) 2012-10-19
US20050216262A1 (en) 2005-09-29
HK1099597A1 (en) 2007-08-17
US20080021712A1 (en) 2008-01-24
ES2363932T3 (es) 2011-08-19
JP5551677B2 (ja) 2014-07-16
US20100082352A1 (en) 2010-04-01
JP5593419B2 (ja) 2014-09-24
JP2007531012A (ja) 2007-11-01
RU2006137566A (ru) 2008-04-27
US20110106546A1 (en) 2011-05-05
CN1961351A (zh) 2007-05-09
ES2363346T3 (es) 2011-08-01
KR101307693B1 (ko) 2013-09-11
CN101027717A (zh) 2007-08-29
US7272567B2 (en) 2007-09-18
JP2013148935A (ja) 2013-08-01
HK1105475A1 (en) 2008-02-15
JP2012078865A (ja) 2012-04-19
CN101027717B (zh) 2011-09-07
US7668723B2 (en) 2010-02-23
JP2013190809A (ja) 2013-09-26

Similar Documents

Publication Publication Date Title
RU2387022C2 (ru) Масштабируемый аудиокодер без потерь и авторское инструментальное средство
US8374858B2 (en) Scalable lossless audio codec and authoring tool
EP2228791B1 (en) Scalable lossless audio codec and authoring tool
EP2250572B1 (en) Lossless multi-channel audio codec using adaptive segmentation with random access point (rap) capability
EP1484841B1 (en) DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
KR100518640B1 (ko) 라이스인코더/디코더를사용한데이터압축/복원장치및방법
JP4179639B2 (ja) マルチチャンネル情報信号の算術符号化/復号化
KR20050040441A (ko) 스케일러블 오디오 복/부호화 방법 및 장치