RU2585990C2 - Устройство и способ для выполнения кодирования методом хаффмана - Google Patents
Устройство и способ для выполнения кодирования методом хаффмана Download PDFInfo
- Publication number
- RU2585990C2 RU2585990C2 RU2013146688/08A RU2013146688A RU2585990C2 RU 2585990 C2 RU2585990 C2 RU 2585990C2 RU 2013146688/08 A RU2013146688/08 A RU 2013146688/08A RU 2013146688 A RU2013146688 A RU 2013146688A RU 2585990 C2 RU2585990 C2 RU 2585990C2
- Authority
- RU
- Russia
- Prior art keywords
- index
- frequency band
- difference
- difference index
- indices
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013139 quantization Methods 0.000 claims abstract description 39
- 238000001228 spectrum Methods 0.000 claims description 13
- 239000003607 modifier Substances 0.000 claims 3
- 239000003638 chemical reducing agent Substances 0.000 claims 2
- 239000003795 chemical substances by application Substances 0.000 claims 1
- 230000005236 sound signal Effects 0.000 abstract description 14
- 238000004891 communication Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 230000000873 masking effect Effects 0.000 description 32
- 238000010606 normalization Methods 0.000 description 23
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к беспроводной связи и предназначено для кодирования и декодирования звука/речи. Технический результат - повышение точности кодирования и декодирования звукового сигнала. Для этого таблица Хаффмана может быть создана автономно при помощи большой базы данных входных последовательностей. В способе определяют интервал значений индексов квантования (или разностных индексов) для кодирования методом Хаффмана. Для каждого значения из этого интервала собирают все входные сигналы, имеющие один и тот же интервал значений, и вычисляют распределение вероятности каждого значения индексов квантования (или разностных индексов) в пределах этого интервала. Для каждого значения из этого интервала создают одну таблицу Хаффмана в соответствии с вероятностью появления каждого возможного значения входного сигнала. 4 н. и 3 з.п. ф-лы, 14 ил.
Description
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к устройству кодирования звука/речи, к устройству декодирования звука/речи и к способам кодирования и декодирования звука/речи с использованием кодирования методом Хаффмана (Huffman).
УРОВЕНЬ ТЕХНИКИ
При сжатии сигнала для кодирования входного сигнала широко используется кодирование методом Хаффмана с использованием таблицы кодов переменной длины (VL-кодов) (таблицы Хаффмана). Кодирование методом Хаффмана является более эффективным, чем кодирование входного сигнала, имеющего неравномерное статистическое распределение, кодами фиксированной длины (FL-кодами).
При кодировании методом Хаффмана таблицу Хаффмана получают особым способом на основании оцененной вероятности появления каждого возможного значения входного сигнала. Во время кодирования каждое значение входного сигнала ставят в соответствие конкретному коду переменной длины в таблице Хаффмана.
Посредством кодирования значений сигнала, которые статистически встречаются с большей вероятностью, с использованием относительно коротких VL-кодов (с использованием относительно малого количества битов), и, наоборот, кодирования значений сигнала, которые статистически встречаются редко, с использованием относительно длинных VL-кодов (с использованием относительно большего количества битов) может быть уменьшено общее количество битов, используемых для кодирования входного сигнала.
СПИСОК ЦИТАТ
[Непатентный документ 1] ITU-T Recommendation G.719 (06/2008) “Low-complexity, full-band audio coding for high-quality, conversational applications”
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Техническая задача
Однако в некоторых применениях, например при кодировании звукового сигнала, статистика данных сигнала может существенно изменяться от одного набора звукового сигнала до другого набора звукового сигнала. И даже в пределах одного и того же набора звукового сигнала.
Если статистика звукового сигнала существенно расходится со статистикой из заранее заданной таблицы Хаффмана, то не может быть реализовано оптимальное кодирование сигнала. И происходит то, что для кодирования звукового сигнала, имеющего различную статистику, при кодировании методом Хаффмана расходуется намного больше битов, чем количество битов, расходуемое при кодировании с фиксированной длиной кода.
Одним возможным решением является включение в кодирование как кодирования методом Хаффмана, так и кодирования с фиксированной длиной кода, и выбор способа кодирования, который расходует меньше битов. К стороне декодера передают один сигнал флага для указания того, какой способ кодирования выбран в кодере. Это решение используется в недавно стандартизованном посредством ITU-T кодеке G.719 речи.
Это решение решает проблему для некоторых очень экстремальных последовательностей, в которых кодирование методом Хаффмана использует больше битов, чем кодирование с фиксированной длиной кода. Но для других входных сигналов, которые имеют статистику, отличающуюся от таблицы Хаффмана, но которые, тем не менее, выбрали кодирование методом Хаффмана, оно все же не является оптимальным.
В стандартизованном ITU-T кодеке G.719 речи кодирование методом Хаффмана используется при кодировании индексов квантования нормировочных коэффициентов.
Структура кодека G.719 проиллюстрирована на Фиг. 1.
На стороне кодера производят обработку входного сигнала, дискретизированного с частотой 48 кГц, посредством детектора (101) обнаружения нестационарного состояния. Для кадра входного сигнала применяют преобразование (102) с высокой разрешающей способностью по частоте или с низкой разрешающей способностью по частоте в зависимости от обнаружения нестационарного состояния. Полученные спектральные коэффициенты группируют в полосы частот неравной длины. Оценивают (103) норму каждой полосы частот, и выполняют квантование и кодирование (104) полученной в результате этого огибающей спектра, состоящей из норм всех полос частот. Затем нормируют коэффициенты по квантованным нормам (105). Квантованные нормы дополнительно корректируют (106) на основании адаптивного спектрального взвешивания и используют в качестве входных данных для распределения битов (107). Нормированные спектральные коэффициенты квантуют по векторам решетки и кодируют (108) на основании распределенных битов для каждой полосы частот. Производят оценку уровня незакодированных спектральных коэффициентов, выполняют его кодирование (109) и передачу в декодер. Кодирование методом Хаффмана применяют для индексов квантования как для закодированных спектральных коэффициентов, так и для закодированных норм.
На стороне декодера сначала декодируют флаг нестационарного состояния, который указывает конфигурацию кадра, то есть, является ли он стационарным или нестационарным. Декодируют огибающую спектра, и в декодере используют те же самые алгоритмы регулирования норм и распределения битов с точностью до бита для повторного вычисления распределения битов, что является существенным для декодирования индексов квантования нормированных коэффициентов преобразования. После обращения квантования (112) восстанавливают низкочастотные незакодированные спектральные коэффициенты (распределенные нулевые биты) с использованием кодовой книги с заполнением спектра, построенной из принятых спектральных коэффициентов (спектральных коэффициентов с распределением ненулевых битов) (113). Используют индекс регулирования уровня шума для регулирования уровня восстановленных коэффициентов. Высокочастотные незакодированные спектральные коэффициенты восстанавливают с использованием расширения полосы частот. Декодированные спектральные коэффициенты и восстановленные спектральные коэффициенты смешивают и приводят к нормированному спектру. Применяют декодированную огибающую спектра, что приводит к декодированному спектру во всей полосе частот (114). Наконец, применяют обратное преобразование (115) для восстановления декодированного сигнала во временной области. Это выполняют путем применения либо модифицированного обратного дискретного косинусного преобразования для стационарных режимов, либо обратного преобразования с более высоким разрешением по времени для нестационарного режима.
В кодере (104) нормировочные коэффициенты спектральных поддиапазонов подвергают скалярному квантованию логарифмическим скалярным квантователем с равномерным шагом с 40 шагами по 3 дБ. Записи кодовой книги логарифмического квантователя показаны на Фиг. 2. Из этой кодовой книги видно, что интервал значений нормировочных коэффициентов равен [2-2,5,217] и что значение уменьшается с увеличением индекса.
Кодирование индексов квантования для нормировочных коэффициентов проиллюстрировано на Фиг. 3. Всего имеется 44 поддиапазона частот и, соответственно, 44 нормировочных коэффициента. Для первого поддиапазона частот нормировочный коэффициент квантуют с использованием первых 32 записей (301) кодовой книги, тогда как другие нормировочные коэффициенты подвергают скалярному квантованию с использованием 40 записей кодовой книги (302), показанных на Фиг. 2. Индекс квантования для нормировочного коэффициента для первого поддиапазона частот непосредственно закодирован 5 битами (303), тогда как индексы для других поддиапазонов частот закодированы способом разностного кодирования. Разностные индексы получают с использованием приведенной ниже формулы (304):
А разностные индексы кодируют двумя возможными способами: кодирования с фиксированной длиной кода (305) и кодирования методом Хаффмана (306). Таблица Хаффмана для разностных индексов показана на Фиг. 4. В этой таблице имеется всего 32 записи, от 0 до 31, которые учитывают возможность резкого изменения энергии между соседними поддиапазонами частот.
Однако для входного аудиосигнала существует физическое явление, именуемое слуховой маскировкой. Слуховая маскировка происходит тогда, когда на восприятие одного звука воздействует наличие другого звука. В качестве примера, если имеются два сигнала со сходными частотами, существующие в одно и то же время: один мощный пик на частоте 1 кГц и один тональный сигнал с более низким уровнем на частоте 1,1 кГц, то тональный сигнал с более низким уровнем на частоте 1,1 кГц будет маскирован (будет неслышимым) вследствие существования мощного пика на частоте 1 кГц.
Уровень звукового давления, необходимый для того, чтобы сделать звук воспринимаемым в присутствии другого звука (маскирующего сигнала), задан в кодировании звука как порог маскирующего эффекта. Порог маскирующего эффекта зависит от частоты, уровня звукового давления маскирующего сигнала. Если два звука имеют сходную частоту, то маскирующий эффект является сильным, и порог маскирующего эффекта также является высоким. Если маскирующий сигнал имеет высокий уровень звукового давления, то он оказывает сильное маскирующее влияние на другой звук, и порог маскирующего эффекта также является высоким.
Согласно описанной выше теории слуховой маскировки, если один поддиапазон частот имеет очень большую энергию, то он оказывает сильное маскирующее влияние на другие поддиапазоны частот, в особенности, на соседние с ним поддиапазоны частот. В таком случае порог маскирующего эффекта для других поддиапазонов частот, в особенности для соседнего поддиапазона частот, является высоким.
Если составляющая аудиосигнала в соседнем поддиапазоне частот имеет малые ошибки квантования (меньшие, чем порог маскирующего эффекта), то слушатели не способны ощущать ухудшение составляющей аудио сигнала в этом поддиапазоне частот.
Отсутствует необходимость кодирования нормировочного коэффициента для этого поддиапазона частот с очень высоким разрешением, если ошибки квантования являются меньшими, чем порог маскирующего эффекта.
РЕШЕНИЕ ЗАДАЧИ
В этом изобретении предложены устройство и способы анализа свойств аудиосигнала для генерации таблиц Хаффмана и для выбора таблиц Хаффмана из набора заданных таблиц во время кодирования аудио сигнала.
В кратком изложении, исследованы свойства слуховой маскировки для сужения интервала значений разностных индексов, в результате чего может быть разработана таблица Хаффмана, имеющая меньшее количество кодовых слов, и использована для кодирования. Поскольку таблица Хаффмана имеет меньшее количество кодовых слов, то могут быть разработаны коды с более короткой длиной кода (с использованием меньшего количества битов). Посредством этого может быть сокращено общее количество битов, расходуемых для кодирования разностных индексов.
ПОЛЕЗНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ
Посредством применения кодов Хаффмана, использующих меньшее количество битов, может быть уменьшено общее количество битов, расходуемых для кодирования разностных индексов.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На Фиг. 1 проиллюстрирована структура кодека ITU-T G.719;
на Фиг. 2 показана кодовая книга для квантования нормировочных коэффициентов;
на Фиг. 3 проиллюстрирован способ квантования и кодирования нормировочных коэффициентов;
на Фиг. 4 показана таблица Хаффмана, используемая для кодирования индексов нормировочных коэффициентов;
на Фиг. 5 показана инфраструктура, в которой применено это изобретение;
на Фиг. 6A и Фиг. 6B показаны примеры заданных таблиц Хаффмана;
на Фиг. 7 проиллюстрировано получение кривой маскирования;
на Фиг. 8 проиллюстрировано то, как сужают интервал значений разностных индексов;
на Фиг. 9 показана схема последовательности операций того, как выполняют модифицирование индексов;
на Фиг. 10 проиллюстрировано то, как могут быть созданы таблицы Хаффмана;
на Фиг. 11 проиллюстрирована структура второго варианта осуществления этого изобретения;
на Фиг. 12 проиллюстрирована структура третьего варианта осуществления этого изобретения;
на Фиг. 13 проиллюстрирован кодер из четвертого варианта осуществления этого изобретения;
на Фиг. 14 проиллюстрирован декодер из четвертого варианта осуществления этого изобретения.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
В этом разделе приведено описание основного принципа из настоящего изобретения со ссылкой на чертежи с Фиг. 5 по Фиг. 12. Специалисты в данной области техники способны видоизменять и адаптировать это изобретение, не отклоняясь от сущности настоящего изобретения. Иллюстрации приведены для облегчения объяснения.
(Первый вариант осуществления изобретения)
На Фиг. 5 проиллюстрирован предложенный в изобретении кодек, который содержит кодер и декодер, в которых применяется предложенная в изобретении схема кодирования методом Хаффмана.
В кодере, проиллюстрированном на Фиг. 5, выполняют обработку значений энергии поддиапазонов частот методом психоакустического моделирования (501) для получения порога Mask(n) маскирующего эффекта. Согласно полученному Mask(n), модифицируют (502) индексы квантования нормировочных коэффициентов для тех поддиапазонов частот, ошибки квантования которых являются меньшими, чем порог маскирующего эффекта для того, чтобы интервал значений разностных индексов мог быть уменьшен.
Разностные индексы для модифицированных индексов вычисляют согласно приведенному ниже уравнению:
Интервал значений разностных индексов для кодирования методом Хаффмана определяют так, как показано в приведенном ниже уравнении (504).
Согласно величине интервала значений, из набора заданных таблиц Хаффмана выбирают (505) таблицу Хаффмана, предназначенную для конкретного интервала значений, для кодирования разностных индексов (506). В качестве примера, если среди всех разностных индексов для входного кадра минимальное значение равно 12, а максимальное значение равно 18, то в этом случае интервал значений =[12,18]. В качестве таблицы Хаффмана для кодирования выбирают таблицу Хаффмана, предназначенную для интервала [12,18].
Набор заранее заданных таблиц Хаффмана создают (подробности будут объяснены в дальнейшей части описания) и упорядочивают в соответствии с интервалом значений разностных индексов. Сигнал флага для указания выбранной таблицы Хаффмана и закодированных индексов передают в декодер.
Другим способом выбора таблицы Хаффмана является вычисление расходования всех битов с использованием каждой таблицы Хаффмана, а затем выбор той таблицы Хаффмана, которая расходует наименьшее количество битов.
В качестве примера на Фиг. 6A и Фиг. 6B показан набор из четырех заранее заданных таблиц Хаффмана. В этом примере приведены 4 заранее заданные таблицы Хаффмана, охватывающие интервал значений, соответственно, из [13,17], [12,18], [11,19] и [10,20]. В таблице 6.1 показан сигнал флага и соответствующий интервал значений для таблицы Хаффмана. В таблице 6.2 показаны коды Хаффмана для всех значений в интервале [13,17]. В таблице 6.3 показаны коды Хаффмана для всех значений в интервале [12,18]. В таблице 6.4 показаны коды Хаффмана для всех значений в интервале [11,19]. В таблице 6.5 показаны коды Хаффмана для всех значений в интервале [10,20].
Сравнивая длину кода Хаффмана на Фиг. 6A и Фиг. 6B с исходной таблицей Хаффмана, показанной на Фиг. 4, можно заметить, что длина кода Хаффмана для одних и тех же значений расходует меньше битов. Это объясняет экономию битов.
В декодере, проиллюстрированном на Фиг. 5, соответствующую таблицу Хаффмана для декодирования разностных индексов (508) выбирают (507) согласно сигналу флага. Для восстановления индексов квантования нормировочных коэффициентов используют разностные индексы согласно приведенному ниже уравнению:
На Фиг. 7 проиллюстрировано получение кривой маскирования входного сигнала. Сначала вычисляют значения энергии поддиапазонов частот, и по этим значениям энергии получают кривую маскирования входного сигнала. При получении кривой маскирования могут быть использованы некоторые существующие технологии из предшествующего уровня техники, например, способ получения кривой маскирования в кодеке MPEG AAC.
На Фиг. 8 проиллюстрировано то, как сужают интервал значений разностных индексов. Сначала производят сравнение между порогом маскирующего эффекта и энергией ошибки квантования поддиапазона частот. Для поддиапазонов частот, в которых энергия ошибок квантования является более низкой, чем порог маскирующего эффекта, их индексы модифицируют в значение, являющееся более близким к соседнему поддиапазону частот, но это модифицирование гарантирует, что соответствующая энергия ошибки квантования не превышает порог маскирующего эффекта, вследствие чего она не влияет на качество звука. После модифицирования интервал значений индексов может являться более узким. Объяснение этого приведено ниже.
Как показано на Фиг. 8, для поддиапазонов частот 0, 2 и 4 их индексы модифицируют так, чтобы они были более близкими к соседним с ними индексам, поскольку значения энергии их ошибки квантования являются более низкими, чем порог маскирующего эффекта.
Модифицирование индексов может быть выполнено так, как описано ниже (с использованием поддиапазона частот 2 в качестве примера). Как показано на Фиг. 2, большой индекс соответствует меньшей энергии, и в этом случае индекс является меньшим, чем индекс . Модифицирование индекса фактически уменьшает его значение. Это может быть выполнено так, как показано на Фиг. 9.
Для поддиапазонов частот 1 и 3 их индексы не изменяют, поскольку их значения энергии превышают порог маскирующего эффекта. В этом случае разностные индексы находятся ближе к центру. Используя поддиапазон частот 1 в качестве примера:
В этом изобретении таблица Хаффмана может быть создана автономно при помощи большой базы данных входных последовательностей. Этот способ проиллюстрирован на Фиг. 10.
Значения энергии поддиапазонов частот обрабатывают методом психоакустического моделирования (1001) для получения порога маскирующего эффекта Mask(n). Согласно полученному Mask(n), индексы квантования нормировочных коэффициентов для тех поддиапазонов частот, в которых энергия ошибок квантования является более низкой, чем порог маскирующего эффекта, модифицируют (1002) так, чтобы интервал значений разностных индексов мог быть меньшим.
Вычисляют (1003) разностные индексы для модифицированных индексов.
Определяют (1004) интервал значений разностных индексов для кодирования методом Хаффмана. Для каждого значения из этого интервала собирают все входные сигналы, имеющие один и тот же интервал значений, и вычисляют распределение вероятности каждого значения разностного индекса в пределах этого интервала.
Для каждого значения из этого интервала создают одну таблицу Хаффмана в соответствии с вероятностью. Здесь для создания таблицы Хаффмана могут использоваться некоторые традиционные методы создания таблицы Хаффмана.
(Второй вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, который может сохранять экономию битов, но восстанавливать значения разностных индексов, более близкие к исходному значению.
Как показано на Фиг. 11, после выбора таблицы Хаффмана при операции 1105, вычисляют разностные индексы между исходными индексами квантования. Исходные разностные индексы и новые разностные индексы сравнивают относительно того, расходуют ли они то же самое количество битов в выбранной таблице Хаффмана.
Если они расходуют одинаковое количество битов в выбранной таблице Хаффмана, то модифицированные разностные индексы восстанавливают равными исходным разностным индексам. Если же они не расходуют одинаковое количество битов, в качестве восстановленных разностных индексов выбирают кодовые слова из той таблицы Хаффмана, которая является ближайшей к исходным разностным индексам и расходует то же самое количество битов.
Преимуществом этого варианта осуществления изобретения является то, что ошибка квантования нормировочного коэффициента может быть меньшей, тогда как расходование битов является тем же самым, как и в первом варианте осуществления изобретения.
(Третий вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, в котором избегают использования психоакустической модели, но используют только лишь некоторый порог отношения энергий.
Как показано на Фиг. 12, вместо использования психоакустической модели для получения порога маскирующего эффекта для определения того, следует ли модифицировать индекс квантования конкретного поддиапазона частот (1201), используют значения энергии поддиапазонов частот и заранее заданный порог отношения энергий. Как показано в приведенном ниже уравнении, если отношение энергий между текущим поддиапазоном частот и соседним поддиапазоном частот является меньшим, чем порог (), то текущий поддиапазон частот считают не столь важным, и в этом случае индекс квантования текущего поддиапазона частот может быть модифицирован.
Модифицирование индекса квантования может быть выполнено так, как показано в приведенном ниже уравнении:
(уравнение 9)
где
означает нормировочный коэффициент для поддиапазона частот , декодированный с использованием модифицированного индекса квантования;
означает нормировочный коэффициент для поддиапазона частот , декодированный с использованием исходного индекса квантования;
Преимущество этого варианта осуществления изобретения состоит в том, можно избежать очень сложного и очень трудоемкого психоакустического моделирования.
(Четвертый вариант осуществления изобретения)
В этом варианте осуществления изобретения представлен способ, сужающий интервал значений разностных индексов, который способен при этом отлично восстанавливать разностные индексы.
Как показано на Фиг. 13, разностные индексы получают из исходных индексов квантования (1301) согласно приведенному ниже уравнению:
где
Для уменьшения интервала значений разностных индексов, реализован модуль, модифицирующий значения некоторых разностных индексов (1302).
Это модифицирование выполняют согласно значению разностного индекса для предыдущего поддиапазона частот и порогового значения.
Один из способов модифицирования разностного индекса (когда n≥1) может быть реализован так, как показано в приведенном ниже уравнении, первый разностный индекс не был модифицирован для обеспечения точного восстановления в декодере:
где
n≥1;
Diff_index(n) означает разностный индекс для поддиапазона частот n;
Diff_index(n-1) означает разностный индекс для поддиапазона частот n-1;
Diff_index_new(n) означает новый разностный индекс для поддиапазона частот n;
Threshold означает значение, анализируемое для определения того, следует ли выполнять модифицирование разностного индекса.
Причина того, почему это модифицирование может уменьшить интервал значений разностных индексов, объясняется следующим образом: для аудио/речевого сигнала справедливо утверждение, что энергия изменяется от одной полосы частот до другой полосы частот. Однако замечено, что обычно отсутствует какое-либо резкое изменение энергии между соседними полосами частот. Энергия постепенно увеличивается или уменьшается от одной полосы частот до другой полосы частот. Нормировочные коэффициенты, которые отображают энергию, также изменяются постепенно. Индексы квантования нормировочных коэффициентов также изменяются постепенно, и в этом случае разностные индексы изменяются в небольшом интервале.
Резкое изменение энергии происходит только тогда, когда некоторые основные составляющие аудио сигнала, которые имеют большую энергию, начинают проявлять влияние в полосе частот или их влияние начинает ослабляться. Нормировочные коэффициенты, которые отображают энергию, также имеют резкое изменение относительно предыдущей полосы частот, индексы квантования нормировочных коэффициентов также внезапно увеличиваются или уменьшаются на большую величину. Затем это приводит к очень большому или к очень малому разностному индексу.
В качестве примера предположим, что имеется одна основная составляющая звукового сигнала, которая имеет большую энергию в поддиапазоне частот . При этом, в поддиапазонах частот и основная составляющая звукового сигнала отсутствует. В этом случае согласно таблице Хаффмана, показанной на Фиг. 2, значение будет очень малым, тогда как значения и будут очень большими. В таком случае согласно уравнению (10) является очень малым (меньшим, чем ), а является очень большим. Если в Уравнении (11) произведено модифицирование, то, согласно приведенному ниже уравнению (12), верхняя граница разностных индексов, вероятно, может быть уменьшена, следовательно, интервал значений разностных индексов может быть сужен.
Как показано на Фиг. 14, для точного восстановления разностных индексов в декодере реализован один модуль, именуемый "восстановлением разностных индексов" (1403). Восстановление производят согласно значению разностного индекса для предыдущего поддиапазона частот и пороговому значению. Пороговое значение в декодере является тем же самым, что и пороговое значение, используемое в кодере.
Способ восстановления разностного индекса (когда ), который соответствует модифицированию в кодере, может быть реализован так, как показано в приведенном ниже уравнении, первый разностный индекс принимают непосредственно, поскольку он не модифицирован в кодере:
где
означает значение, анализируемое для определения того, следует ли восстанавливать разностный индекс.
Как показано в приведенных выше уравнениях: в уравнении (11) и в уравнении (13), то, следует ли выполнять модифицирование разностного индекса и насколько его следует модифицировать, полностью зависит от разностного индекса для предыдущей полосы частот. Если разностный индекс для предыдущей полосы частот может быть точно восстановлен, то текущий разностный индекс также может быть точно восстановлен.
Как показано в приведенных выше уравнении (11) и в уравнении (13), первый разностный индекс не модифицируют в кодере, его принимают непосредственно, и он может быть точно восстановлен, затем может быть восстановлен второй разностный индекс согласно значению первого разностного индекса; затем третий разностный индекс, четвертый разностный индекс и т.д., придерживаясь той же самой процедуры, могут быть точно восстановлены все разностные индексы.
Преимущество этого варианта осуществления изобретения состоит в том, что интервал значений разностных индексов может быть уменьшен, при этом разностные индексы могут быть по-прежнему точно восстановлены в декодере. Следовательно, эффективность использования битов может быть улучшена с одновременным сохранением точности битов индексов квантования.
Кроме того, несмотря на то, что в приведенных выше вариантах осуществления изобретения были описаны случаи, когда настоящее изобретение сконфигурировано аппаратными средствами, настоящее изобретение может быть реализовано при помощи программного обеспечения в комбинации с аппаратными средствами.
Каждый функциональный блок, используемый в описании вышеупомянутого варианта осуществления изобретения, обычно может быть реализован в виде большой интегральной схемы (БИС), составленной из интегральных схем. Ими могут являться отдельные микросхемы, или они могут частично или полностью содержаться на одном кристалле. Здесь применен термин "большая интегральная схема" (БИС), но она также может именоваться "интегральной схемой" (ИС), "системной БИС", "БИС со сверхвысокой степенью интеграции" или "БИС с ультравысокой степенью интеграции" в зависимости от отличающихся степеней интегрирования.
Кроме того, способ интеграции схемы не ограничен большими интегральными схемами (БИС), и также возможна реализация с использованием специализированных схем или универсальных процессоров. После изготовления БИС также возможно использование программируемой пользователем вентильной матрицы (ППВМ) или реконфигурируемого процессора, в котором может быть произведена реконфигурация соединений и установочных параметров ячеек схемы внутри БИС.
Кроме того, если в результате развития полупроводниковой технологии или иной технологии, производной от нее, на замену БИС выходит иная технология создания интегральных схем, то, естественно, что интеграция функциональных блоков также может быть выполнена с использованием этой технологии. Также возможно применение биотехнологии.
Раскрытие сущности заявок на патенты Японии № 2011-94295, поданной 20 апреля 2011 г., и № 2011-133432, поданной 15 июня 2011 г., включая описание, чертежи и реферат, включено сюда в полном объеме путем ссылки.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
Устройство кодирования, устройство декодирования и способы кодирования и декодирования согласно настоящему изобретению применимы для устройства, представляющего собой терминал беспроводной связи, устройства, представляющего собой базовую станцию в системе мобильной связи, устройства, представляющего собой терминал для телеконференций, устройства, представляющего собой терминал для видеоконференций и устройства, представляющего собой терминал речевой связи по протоколу IP (VOIP).
ПЕРЕЧЕНЬ ОБОЗНАЧЕНИЙ ССЫЛОЧНЫХ ПОЗИЦИЙ
101 - детектор обнаружения нестационарного состояния
102 - преобразование
103 - оценка нормы
104 - квантование и кодирование нормы
105 - нормировка спектра
106 - корректировка нормы
107 - распределение битов
108 - квантование и кодирование на сетке
109 - регулирование уровня шума
110 - мультиплексирование
111 - демультиплексирование
112 - декодирование на сетке
113 - генератор заполнения спектра
114 - формирование огибающей
115 - обратное преобразование
301 - скалярное квантование (32 шага)
302 - скалярное квантование (40 шагов)
303 - прямая передача (5 бит)
304 - разность
305 - кодирование с фиксированной длиной кода
306 - кодирование методом Хаффмана
501 - психоакустическая модель
502 - модифицирование индекса
503 - разность
504 - проверка интервала значений
505 - выбор таблицы кодов Хаффмана
506 - кодирование методом Хаффмана
507 - выбор таблицы Хаффмана
508 - декодирование методом Хаффмана
509 - сумма
1001 - психоакустическая модель
1002 - модифицирование индекса
1003 - разность
1004 - проверка интервала значений
1005 - вероятность
1006 - получение кода Хаффмана
1101 - психоакустическая модель
1102 - модифицирование индекса
1103 - разность
1104 - проверка интервала значений
1105 - выбор таблицы кодов Хаффмана
1106 - разность
1107 - восстановление разностных индексов
1108 - кодирование методом Хаффмана
1201 - модифицирование индекса
1202 - разность
1203 - проверка интервала значений
1204 - выбор таблицы кодов Хаффмана
1205 - кодирование методом Хаффмана
1301 - разность
1302 - модифицирование разностных индексов
1303 - проверка интервала значений
1304 - выбор таблицы кодов Хаффмана
1305 - кодирование методом Хаффмана
1401 - выбор таблицы кодов Хаффмана
1402 - кодирование методом Хаффмана
1403 - восстановление разностных индексов
1404 - сумма
Claims (7)
1. Устройство кодирования аудио/речи, содержащее:
преобразователь, который осуществляет преобразование входного сигнала аудио/речи во временной области в частотный спектр;
разделитель полосы частот, который разделяет спектр частот на множество полос частот;
вычислитель энергии, который вычисляет уровень значений энергии для каждой полосы частот;
квантователь, который выполняет квантование значений энергий для каждой полосы частот;
вычислитель разностного индекса, который вычисляет разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модификатор разностного индекса, который модифицирует диапазон разностных индексов для N-й полосы частот, когда N есть целое число, равное 2 или больше, и заменяет разностный индекс на модифицированный разностный индекс;
кодировщик Хаффмана, который кодирует разностные индексы, используя выбранную таблицу Хаффмана, из числа заранее заданных таблиц Хаффмана; и
передатчик, который передает кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи;
причем если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
преобразователь, который осуществляет преобразование входного сигнала аудио/речи во временной области в частотный спектр;
разделитель полосы частот, который разделяет спектр частот на множество полос частот;
вычислитель энергии, который вычисляет уровень значений энергии для каждой полосы частот;
квантователь, который выполняет квантование значений энергий для каждой полосы частот;
вычислитель разностного индекса, который вычисляет разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модификатор разностного индекса, который модифицирует диапазон разностных индексов для N-й полосы частот, когда N есть целое число, равное 2 или больше, и заменяет разностный индекс на модифицированный разностный индекс;
кодировщик Хаффмана, который кодирует разностные индексы, используя выбранную таблицу Хаффмана, из числа заранее заданных таблиц Хаффмана; и
передатчик, который передает кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи;
причем если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то модификатор разностного индекса модифицирует разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
2. Устройство кодирования аудио/речи по п. 1, в котором
значения верхнего предела и нижнего предела являются теми же значениями, что и сохраненные в устройстве декодирования аудио/речи.
значения верхнего предела и нижнего предела являются теми же значениями, что и сохраненные в устройстве декодирования аудио/речи.
3. Устройство декодирования аудио/речи, содержащее:
селектор таблицы Хаффмана, который выбирает таблицу Хаффмана в соответствии с сигналом флага для указания выбранной таблицы Хаффмана посредством устройства кодирования аудио/речи;
декодер Хаффмана, который декодирует разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана,
восстановитель разностных индексов, который восстанавливает N-й различный индекс, декодированный с использованием выбранной таблицы Хаффмана, когда N - целое число, равное 2 или больше, и заменяет разностный индекс на восстановленный разностный индекс;
вычислитель индекса, который вычисляет индексы квантования с использованием восстановленных разностных индексов;
деквантователь, который выполняет обратное квантование энергий для каждой полосы частот; и
преобразователь, который преобразует декодированный спектр, который генерируется с использованием энергий для каждой полосы частот в частотной области, в сигнал временной области,
при этом если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
селектор таблицы Хаффмана, который выбирает таблицу Хаффмана в соответствии с сигналом флага для указания выбранной таблицы Хаффмана посредством устройства кодирования аудио/речи;
декодер Хаффмана, который декодирует разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана,
восстановитель разностных индексов, который восстанавливает N-й различный индекс, декодированный с использованием выбранной таблицы Хаффмана, когда N - целое число, равное 2 или больше, и заменяет разностный индекс на восстановленный разностный индекс;
вычислитель индекса, который вычисляет индексы квантования с использованием восстановленных разностных индексов;
деквантователь, который выполняет обратное квантование энергий для каждой полосы частот; и
преобразователь, который преобразует декодированный спектр, который генерируется с использованием энергий для каждой полосы частот в частотной области, в сигнал временной области,
при этом если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то восстановитель разностных индексов восстанавливает разностный индекс для N-й полосы частот путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
4. Устройство декодирования аудио/речи по п. 3, в котором
значения верхнего предела и нижнего предела являются теми же, что и значения, сохраненные в устройстве кодирования аудио/речи.
значения верхнего предела и нижнего предела являются теми же, что и значения, сохраненные в устройстве кодирования аудио/речи.
5. Устройство декодирования аудио/речи по п. 3, в котором
восстановитель разностных индексов восстанавливает N-й различный индекс, начиная с меньшего, и по порядку.
восстановитель разностных индексов восстанавливает N-й различный индекс, начиная с меньшего, и по порядку.
6. Способ кодирования аудио/речи, содержащий этапы, на которых:
преобразуют посредством преобразователя входной сигнал аудио/речи во временной области в частотный спектр;
разделяют частотный спектр на множественные полосы частот;
вычисляют уровень энергий для каждой полосы частот;
квантуют энергии для каждой полосы частот;
вычисляют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модифицируют диапазон разностных индексов для N-й полосы частот, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на модифицированный разностный индекс;
кодируют разностные индексы, используя выбранную таблицу Хаффмана из числа заранее заданных таблиц Хаффмана; и
передают кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи,
при этом если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1) полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
преобразуют посредством преобразователя входной сигнал аудио/речи во временной области в частотный спектр;
разделяют частотный спектр на множественные полосы частот;
вычисляют уровень энергий для каждой полосы частот;
квантуют энергии для каждой полосы частот;
вычисляют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше);
модифицируют диапазон разностных индексов для N-й полосы частот, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на модифицированный разностный индекс;
кодируют разностные индексы, используя выбранную таблицу Хаффмана из числа заранее заданных таблиц Хаффмана; и
передают кодированные разностные индексы и сигнал флага для указания выбранной таблицы Хаффмана устройству декодирования аудио/речи,
при этом если вычисленный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если вычисленный разностный индекс (N-1) полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот модифицируется путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
7. Способ декодирования аудио/речи, содержащий этапы, на которых:
выбирают таблицу Хаффмана в соответствии с сигналом флага, чтобы указывать выбранную таблицу Хаффмана устройством кодирования аудио/речи;
декодируют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана;
восстанавливают N-й различный индекс, декодированный, используя выбранную таблицу Хаффмана, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на восстановленный разностный индекс;
вычисляют индексы квантования, используя восстановленные разностные индексы;
обратно квантуют энергии для каждой полосы частот; и
преобразуют декодированный спектр, который генерируется, используя энергии для каждой полосы частот в частотной области, в сигнал временной области,
при этом
если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
выбирают таблицу Хаффмана в соответствии с сигналом флага, чтобы указывать выбранную таблицу Хаффмана устройством кодирования аудио/речи;
декодируют разностные индексы между индексом N-й полосы частот и индексом (N-1)-й полосы частот (N - целое число, равное 1 или больше), полученные устройством кодирования аудио/речи, используя выбранную таблицу Хаффмана;
восстанавливают N-й различный индекс, декодированный, используя выбранную таблицу Хаффмана, когда N - целое число, равное 2 или больше, и заменяют разностный индекс на восстановленный разностный индекс;
вычисляют индексы квантования, используя восстановленные разностные индексы;
обратно квантуют энергии для каждой полосы частот; и
преобразуют декодированный спектр, который генерируется, используя энергии для каждой полосы частот в частотной области, в сигнал временной области,
при этом
если декодированный разностный индекс (N-1)-й полосы частот больше, чем верхний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания верхнего предела из разностного индекса для (N-1)-й полосы частот, и
если декодированный разностный индекс (N-1)-й полосы частот меньше, чем нижний предел, то разностный индекс для N-й полосы частот восстанавливается путем добавления значения вычитания, полученного от вычитания нижнего предела из разностного индекса для (N-1)-й полосы частот.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011094295 | 2011-04-20 | ||
JP2011-094295 | 2011-04-20 | ||
JP2011-133432 | 2011-06-15 | ||
JP2011133432 | 2011-06-15 | ||
PCT/JP2012/001701 WO2012144127A1 (ja) | 2011-04-20 | 2012-03-12 | ハフマン符号化を実行するための装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013146688A RU2013146688A (ru) | 2015-05-27 |
RU2585990C2 true RU2585990C2 (ru) | 2016-06-10 |
Family
ID=47041264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013146688/08A RU2585990C2 (ru) | 2011-04-20 | 2012-03-12 | Устройство и способ для выполнения кодирования методом хаффмана |
Country Status (14)
Country | Link |
---|---|
US (3) | US9881625B2 (ru) |
EP (4) | EP2701144B1 (ru) |
JP (3) | JP5937064B2 (ru) |
KR (3) | KR101859246B1 (ru) |
CN (2) | CN103415884B (ru) |
BR (1) | BR112013026850B1 (ru) |
CA (2) | CA3051552C (ru) |
ES (2) | ES2977133T3 (ru) |
MY (2) | MY193565A (ru) |
PL (2) | PL3096315T3 (ru) |
RU (1) | RU2585990C2 (ru) |
TW (2) | TWI598872B (ru) |
WO (1) | WO2012144127A1 (ru) |
ZA (1) | ZA201307316B (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100715450B1 (ko) * | 2004-02-02 | 2007-05-07 | (주)경안인더스트리 | 비석면 단열판 및 그 제조방법 |
KR101859246B1 (ko) * | 2011-04-20 | 2018-05-17 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 허프만 부호화를 실행하기 위한 장치 및 방법 |
BR112015013233B8 (pt) * | 2012-12-13 | 2021-03-16 | Fraunhofer Ges Forschung | dispositivo e método de codificação de voz/áudio |
ES2902518T3 (es) | 2013-05-24 | 2022-03-28 | Dolby Int Ab | Codificador de audio |
EP3660843B1 (en) | 2013-09-13 | 2022-11-09 | Samsung Electronics Co., Ltd. | Lossless coding method |
KR102270106B1 (ko) | 2013-09-13 | 2021-06-28 | 삼성전자주식회사 | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
US20150142345A1 (en) * | 2013-10-18 | 2015-05-21 | Alpha Technologies Inc. | Status Monitoring Systems and Methods for Uninterruptible Power Supplies |
US9876913B2 (en) | 2014-02-28 | 2018-01-23 | Dolby Laboratories Licensing Corporation | Perceptual continuity using change blindness in conferencing |
US10553228B2 (en) * | 2015-04-07 | 2020-02-04 | Dolby International Ab | Audio coding with range extension |
MX2018002967A (es) | 2015-09-13 | 2018-06-11 | Alpha Tech Inc | Sistemas y metodos de control de potencia. |
US10381867B1 (en) | 2015-10-16 | 2019-08-13 | Alpha Technologeis Services, Inc. | Ferroresonant transformer systems and methods with selectable input and output voltages for use in uninterruptible power supplies |
WO2018121887A1 (en) * | 2017-01-02 | 2018-07-05 | Huawei Technologies Duesseldorf Gmbh | Apparatus and method for shaping the probability distribution of a data sequence |
CN110383830B (zh) * | 2017-03-14 | 2022-02-18 | 索尼公司 | 记录装置、记录方法、再现装置、再现方法以及记录/再现装置 |
US20180288439A1 (en) * | 2017-03-31 | 2018-10-04 | Mediatek Inc. | Multiple Transform Prediction |
CA3069966A1 (en) | 2017-07-14 | 2019-01-17 | Alpha Technologies Services, Inc. | Voltage regulated ac power supply systems and methods |
CN109286922B (zh) * | 2018-09-27 | 2021-09-17 | 珠海市杰理科技股份有限公司 | 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备 |
WO2024012666A1 (en) * | 2022-07-12 | 2024-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2377670C2 (ru) * | 2004-03-15 | 2009-12-27 | Майкрософт Корпорейшн | Сжатие данных |
US7822601B2 (en) * | 2002-09-04 | 2010-10-26 | Microsoft Corporation | Adaptive vector Huffman coding and decoding based on a sum of values of audio data symbols |
RU2406165C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3131542B2 (ja) * | 1993-11-25 | 2001-02-05 | シャープ株式会社 | 符号化復号化装置 |
JP3186007B2 (ja) * | 1994-03-17 | 2001-07-11 | 日本電信電話株式会社 | 変換符号化方法、復号化方法 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5848195A (en) | 1995-12-06 | 1998-12-08 | Intel Corporation | Selection of huffman tables for signal encoding |
US6366614B1 (en) * | 1996-10-11 | 2002-04-02 | Qualcomm Inc. | Adaptive rate control for digital video compression |
JP3784993B2 (ja) * | 1998-06-26 | 2006-06-14 | 株式会社リコー | 音響信号の符号化・量子化方法 |
KR100844810B1 (ko) * | 2000-12-22 | 2008-07-09 | 소니 가부시끼 가이샤 | 부호화 장치 및 복호 장치 |
US6411226B1 (en) * | 2001-01-16 | 2002-06-25 | Motorola, Inc. | Huffman decoder with reduced memory size |
JP2002268693A (ja) * | 2001-03-12 | 2002-09-20 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP2003233397A (ja) | 2002-02-12 | 2003-08-22 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 |
US20040120404A1 (en) * | 2002-11-27 | 2004-06-24 | Takayuki Sugahara | Variable length data encoding method, variable length data encoding apparatus, variable length encoded data decoding method, and variable length encoded data decoding apparatus |
JP4369140B2 (ja) * | 2003-02-17 | 2009-11-18 | パナソニック株式会社 | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
US7668715B1 (en) * | 2004-11-30 | 2010-02-23 | Cirrus Logic, Inc. | Methods for selecting an initial quantization step size in audio encoders and systems using the same |
US8090587B2 (en) * | 2005-09-27 | 2012-01-03 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
US8315880B2 (en) * | 2006-02-24 | 2012-11-20 | France Telecom | Method for binary coding of quantization indices of a signal envelope, method for decoding a signal envelope and corresponding coding and decoding modules |
JP5010197B2 (ja) * | 2006-07-26 | 2012-08-29 | 株式会社東芝 | 音声符号化装置 |
KR101046982B1 (ko) * | 2006-08-15 | 2011-07-07 | 브로드콤 코포레이션 | 전대역 오디오 파형의 외삽법에 기초한 부분대역 예측코딩에 대한 패킷 손실 은닉 기법 |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
AU2007312598B2 (en) * | 2006-10-16 | 2011-01-20 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
WO2009004727A1 (ja) * | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 符号化装置、符号化方法および符号化プログラム |
KR101426788B1 (ko) * | 2007-11-20 | 2014-08-06 | 삼성전자주식회사 | 무선 통신 시스템에서 채널 품질 정보 전송 방법 및 장치 |
US8630848B2 (en) * | 2008-05-30 | 2014-01-14 | Digital Rise Technology Co., Ltd. | Audio signal transient detection |
US8463603B2 (en) * | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
JP5358818B2 (ja) | 2009-10-27 | 2013-12-04 | 株式会社ユーシン | 扉用の施解錠装置 |
JP2011133432A (ja) | 2009-12-25 | 2011-07-07 | Shizuoka Oil Service:Kk | オイル粘度チェッカー並びにこれを用いたオイル供給システム |
US9106925B2 (en) * | 2010-01-11 | 2015-08-11 | Ubiquity Holdings, Inc. | WEAV video compression system |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
KR101859246B1 (ko) * | 2011-04-20 | 2018-05-17 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 허프만 부호화를 실행하기 위한 장치 및 방법 |
-
2012
- 2012-03-12 KR KR1020137025124A patent/KR101859246B1/ko active IP Right Grant
- 2012-03-12 PL PL16175414T patent/PL3096315T3/pl unknown
- 2012-03-12 MY MYPI2018000285A patent/MY193565A/en unknown
- 2012-03-12 EP EP12774449.8A patent/EP2701144B1/en active Active
- 2012-03-12 KR KR1020187013479A patent/KR101959698B1/ko active IP Right Grant
- 2012-03-12 MY MYPI2013003592A patent/MY164987A/en unknown
- 2012-03-12 BR BR112013026850-6A patent/BR112013026850B1/pt active IP Right Grant
- 2012-03-12 EP EP19194667.2A patent/EP3594943B1/en active Active
- 2012-03-12 ES ES19194667T patent/ES2977133T3/es active Active
- 2012-03-12 CA CA3051552A patent/CA3051552C/en active Active
- 2012-03-12 CA CA2832032A patent/CA2832032C/en active Active
- 2012-03-12 EP EP16175414.8A patent/EP3096315B1/en active Active
- 2012-03-12 EP EP23217545.5A patent/EP4322161A3/en active Pending
- 2012-03-12 ES ES16175414T patent/ES2765527T3/es active Active
- 2012-03-12 RU RU2013146688/08A patent/RU2585990C2/ru active
- 2012-03-12 WO PCT/JP2012/001701 patent/WO2012144127A1/ja active Application Filing
- 2012-03-12 JP JP2013510855A patent/JP5937064B2/ja active Active
- 2012-03-12 CN CN201280012790.4A patent/CN103415884B/zh active Active
- 2012-03-12 PL PL19194667.2T patent/PL3594943T3/pl unknown
- 2012-03-12 CN CN201410725584.9A patent/CN104485111B/zh active Active
- 2012-03-12 US US14/008,732 patent/US9881625B2/en active Active
- 2012-03-12 KR KR1020197006961A patent/KR101995694B1/ko active IP Right Grant
- 2012-03-19 TW TW106100427A patent/TWI598872B/zh active
- 2012-03-19 TW TW101109432A patent/TWI573132B/zh active
-
2013
- 2013-10-01 ZA ZA2013/07316A patent/ZA201307316B/en unknown
-
2016
- 2016-05-10 JP JP2016094584A patent/JP6321072B2/ja active Active
-
2017
- 2017-12-12 US US15/839,056 patent/US10204632B2/en active Active
-
2018
- 2018-04-04 JP JP2018072367A patent/JP6518361B2/ja active Active
- 2018-12-19 US US16/225,851 patent/US10515648B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7822601B2 (en) * | 2002-09-04 | 2010-10-26 | Microsoft Corporation | Adaptive vector Huffman coding and decoding based on a sum of values of audio data symbols |
RU2377670C2 (ru) * | 2004-03-15 | 2009-12-27 | Майкрософт Корпорейшн | Сжатие данных |
RU2406165C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2585990C2 (ru) | Устройство и способ для выполнения кодирования методом хаффмана | |
JP2023169294A (ja) | 符号化及び復号化のための符号化装置、復号化装置、システム及び方法 | |
CN103069484A (zh) | 时/频二维后处理 | |
US20220130402A1 (en) | Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium | |
JP2019070823A (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 |