RU2648595C2 - Распределение битов, кодирование и декодирование аудио - Google Patents

Распределение битов, кодирование и декодирование аудио Download PDF

Info

Publication number
RU2648595C2
RU2648595C2 RU2013155482A RU2013155482A RU2648595C2 RU 2648595 C2 RU2648595 C2 RU 2648595C2 RU 2013155482 A RU2013155482 A RU 2013155482A RU 2013155482 A RU2013155482 A RU 2013155482A RU 2648595 C2 RU2648595 C2 RU 2648595C2
Authority
RU
Russia
Prior art keywords
bits
subband
distributed
zero
distributed number
Prior art date
Application number
RU2013155482A
Other languages
English (en)
Other versions
RU2013155482A (ru
Inventor
Ми-йоунг КИМ
Антон ПОРОВ
Еун-Ми ОХ
Original Assignee
Самсунг Электроникс Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Самсунг Электроникс Ко., Лтд. filed Critical Самсунг Электроникс Ко., Лтд.
Publication of RU2013155482A publication Critical patent/RU2013155482A/ru
Application granted granted Critical
Publication of RU2648595C2 publication Critical patent/RU2648595C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к средствам для распределения битов по поддиапазонам при кодировании аудио. Технический результат заключается в повышении эффективности распределения битов в области частот, важной для восприятия. Оценивают распределенное количество битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра таким образом, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля. Перераспределяют распределенное количество битов для поддиапазона, имеющего распределенное количество битов больше нуля. 5 н. и 5 з.п. ф-лы, 20 ил.

Description

Область техники
Устройства, приспособления и изделия в соответствии с настоящим изобретением относятся к кодированию и декодированию аудио и, в частности, к способу и устройству для эффективного распределения битов в область частот, важную для восприятия, на основании поддиапазонов, способу и устройству кодирования аудио, способу и устройству декодирования аудио, регистрирующей среде и мультимедийному устройству, в котором это используется.
Уровень техники
При кодировании или декодировании аудиосигнала требуется эффективно использовать ограниченное число битов для восстановления аудиосигнала, имеющего наилучшее качество звучания, в диапазоне ограниченного числа битов. В частности, при низкой скорости передачи требуется, чтобы метод кодирования и декодирования аудиосигнала равномерно распределял биты в спектральные компоненты важные для восприятия вместо сосредоточения битов в конкретной частотной области.
В частности, при низкой скорости передачи в тех случаях, когда кодирование выполняется с использованием битов, распределяемых каждому диапазону частот, например, поддиапазону, может образоваться спектральный провал из-за частотной компоненты, которая не кодируется ввиду недостаточного числа битов, тем самым приводя к ухудшению качества звучания.
Сущность изобретения
Техническая задача
Аспектом является создание способа и устройства для эффективного распределения битов в области частот, важной для восприятия, на основании поддиапазонов, способа и устройства кодирования аудио, способа и устройства декодирования аудио, регистрирующей среды и мультимедийного устройства, в котором это используется.
Аспектом является создание способа и устройства для эффективного распределения битов в области частот, важной для восприятия, с низкой сложностью на основании поддиапазонов, способа и устройства кодирования аудио, способа и устройства декодирования аудио, регистрирующей среды и мультимедийного устройства, в котором это используется.
Решение задачи
В соответствии с одним аспектом одного или более примерных вариантов осуществления предлагается способ распределения битов, включающий в себя: определение распределяемого числа битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра; и корректировку распределяемого числа битов на основании каждого диапазона частот.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство распределения битов, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; и блок распределения битов, который оценивает допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр в спектре звуковых частот, оценивает распределяемое число битов в единицах с десятичной запятой путем использования спектральной энергии и корректирует распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство кодирования аудио, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; блок распределения битов, который определяет распределяемое число битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра спектра звуковых частот, и корректирует распределяемое число битов, определяемых на основании каждого диапазона частот; и блок кодирования, который кодирует спектр звуковых частот путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство декодирования аудио, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; блок распределения битов, который определяет распределяемое число битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра спектра звуковых частот, и корректирует распределяемое число битов, определяемых на основании каждого диапазона частот; и блок кодирования, который кодирует спектр звуковых частот путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство декодирования аудио, включающее в себя: блок распределения битов, который оценивает допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр, оценивает распределяемое число битов в единицах с десятичной запятой путем использования спектральной энергии и корректирует распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов; блок декодирования, который декодирует спектр звуковых частот, входящий в битовый поток, путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии; и блок обратного преобразования, который преобразует декодированный спектр звуковых частот в аудиосигнал во временной области.
Краткое описание чертежей
Вышеизложенные и другие варианты станут более понятными благодаря подробному описанию их примеров осуществления со ссылкой на прилагаемые чертежи, на которых:
фиг. 1 представляет собой блок-схему устройства кодирования аудио в соответствии с примерным вариантом осуществления;
фиг. 2 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с примерным вариантом осуществления;
фиг. 3 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с еще одним примерным вариантом осуществления;
фиг. 4 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с еще одним примерным вариантом осуществления;
фиг. 5 представляет собой блок-схему блока кодирования в устройстве кодирования аудио на фиг. 1 в соответствии с примерным вариантом осуществления;
фиг. 6 представляет собой блок-схему устройства кодирования аудио в соответствии с еще одним примерным вариантом осуществления;
фиг. 7 представляет собой блок-схему устройства декодирования аудио в соответствии с примерным вариантом осуществления;
фиг. 8 представляет собой блок-схему блока распределения битов в устройстве декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления;
фиг. 9 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления;
фиг. 10 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления;
фиг. 11 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления;
фиг. 12 представляет собой блок-схему устройства декодирования аудио в соответствии с еще одним примерным вариантом осуществления;
фиг. 13 представляет собой блок-схему устройства декодирования аудио в соответствии с еще одним примерным вариантом осуществления;
фиг. 14 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;
фиг. 15 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;
фиг. 16 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;
фиг. 17 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;
фиг. 18 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования, в соответствии с примерным вариантом осуществления;
фиг. 19 представляет собой блок-схему мультимедийного устройства, содержащего модуль декодирования, в соответствии с примерным вариантом осуществления;
фиг. 20 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования и модуль декодирования, в соответствии с примерным вариантом осуществления.
Вариант осуществления изобретения
Настоящая идея изобретения может допускать различного рода изменения или модификации и различные изменения формы, и в описании будут проиллюстрированы на чертежах и подробно описаны конкретные примерные варианты осуществления. Однако следует понимать, что конкретные примерные варианты осуществления не ограничивают настоящую идею изобретения определенной формой описания, а включают в себя любую модифицированную, эквивалентную или замененную форму в пределах сущности и технического объема настоящей идеи изобретения. В нижеследующем описании хорошо известные функции или конструкции не описываются подробно, поскольку они могут затруднить понимание изобретения из-за ненужных деталей.
Хотя для описания различных элементов могут использоваться такие термины как «первый» и «второй», элементы не могут ограничиваться этими терминами. Эти термины могут использоваться, чтобы отличать некоторый элемент от другого элемента.
Используемая в данной заявке терминология используется лишь для описания конкретных примерных вариантов осуществления и не имеет целью ограничивать настоящую идею изобретения. Хотя общие термины, в настоящее время применяемые наиболее широко, выбраны в качестве терминов, используемых в настоящей идее изобретения на основании функций в настоящей идее изобретения, они могут варьироваться в соответствии с намерением специалистов, судебных прецедентов или появлением новой технологии. Кроме того, в отдельных случаях могут использоваться термины, специально выбираемые заявителем, и в этом случае значение терминов будет приведено в соответствующем описании изобретения. В связи с этим во всей настоящей идее изобретения термины, применяемые в настоящей идее изобретения, должны определяться не простыми названиями терминов, а значением терминов и смыслом.
Выражение в единственном числе включает в себя выражение во множественном числе кроме тех случаев, когда они явно отличаются друг от друга в некотором контексте. Следует понимать, что в данной заявке такие термины как «включать в себя» и «иметь» используются для указания на наличие реализованного признака, числа, этапа, операции, элемента, детали или их совокупности без исключения заранее возможности наличия или добавления одного или более иных признаков, чисел, этапов, операций, элементов, деталей или их совокупностей.
В дальнейшем в этом документе идея изобретения будет описываться более полно со ссылкой на прилагаемые чертежи, на которых изображены примерные варианты осуществления. Одинаковые условные обозначения на чертежах обозначают одинаковые элементы, и, следовательно, их повторное описание приводиться не будет.
Используемые в настоящем документе выражения, такие как «по меньшей мере, один из», если они предшествуют перечню элементов, изменяют весь перечень элементов и не изменяют отдельных элементов перечня.
Фиг. 1 представляет собой блок-схему устройства 100 кодирования аудио в соответствии с примерным вариантом осуществления.
Устройство 100 кодирования аудио на фиг. 1 может содержать блок 130 преобразования, блок 150 распределения битов, блок 170 кодирования и блок 190 мультиплексирования. Компоненты устройства 100 кодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора (например, центрального процессора (ЦП)). При этом аудио может означать аудиосигнал, речевой сигнал или сигнал, полученный путем их синтезирования, но в дальнейшем в этом документе для удобства описания аудио, как правило, означает аудиосигнал.
В соответствии с фиг. 1 блок 130 преобразования может генерировать спектр звуковых частот путем преобразования аудиосигнала во временной области в аудиосигнал в частотной области. Преобразование из временной области в частотную область может выполняться путем использования различных хорошо известных способов, таких как Дискретное косинусное преобразование (DCT).
Блок 150 распределения битов может определять порог маскирования, получаемый путем использования спектральной энергии или психоакустической модели в отношении спектра звуковых частот и числа битов, распределяемых на основании каждого поддиапазона путем использования спектральной энергии. При этом поддиапазон представляет собой блок группированных выборок спектра звуковых частот и может иметь постоянную или непостоянную длину за счет соответствия пороговому диапазону. В тех случаях, когда поддиапазоны имеют непостоянную длину, поддиапазоны могут определяться таким образом, что число выборок от начальной выборки до последней выборки, входящих в каждый поддиапазон, на кадр постепенно увеличивается. При этом число поддиапазонов или число выборок, входящих в каждый подкадр, может определяться заранее. В соответствии с другим вариантом после того, как один кадр делится на предварительно заданное число поддиапазонов, имеющих постоянную длину, постоянная длина может корректироваться в соответствии с распределением спектральных коэффициентов. Распределение спектральных коэффициентов может определяться с использованием показателя спектральной неравномерности, разности между максимальным значением и минимальным значением или дифференциальной величины максимального значения.
В соответствии с примерным вариантом осуществления блок 150 распределения битов может оценивать допустимое число битов путем использования величины Нормы, полученной на основании каждого поддиапазона, т.е. средней спектральной энергии, распределять биты на основе средней спектральной энергии и ограничивать распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.
В соответствии с примерным вариантом осуществления блок 150 распределения битов может оценивать допустимое число битов путем использования психоакустической модели на основании каждого поддиапазона, распределять биты на основе средней спектральной энергии и ограничивать распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.
Блок 170 кодирования может генерировать информацию в отношении кодированного спектра путем квантования спектра звуковых частот и его кодирования без потерь на основе распределяемого числа битов, окончательно определяемых на основании каждого поддиапазона.
Блок 190 мультиплексирования генерирует битовый поток путем мультиплексирования кодированной величины Нормы, выдаваемой с блока 150 распределения битов, и информации, относящейся к кодированному спектру, выдаваемому с блока 170 кодирования.
Устройство 100 кодирования аудио может генерировать уровень шума для факультативного поддиапазона и выдавать этот уровень шума в устройство декодирования аудио (700 на фиг. 7, 1200 на фиг. 12 или 1300 на фиг. 13).
Фиг. 2 представляет собой блок-схему блока 200 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с примерным вариантом осуществления.
Блок 200 распределения битов на фиг. 2 может содержать блок 210 оценки Нормы, кодер 230 Нормы и блок 250 оценки и распределения битов. Компоненты блока 200 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы, по меньшей мере, с помощью одного процессора.
В соответствии с фиг. 2, блок 210 оценки Нормы может получать величину Нормы, соответствующую средней спектральной энергии, на основании каждого поддиапазона. Например, величина Нормы может быть вычислена с помощью Уравнения 1, применяемого в ITU-T G.719, но не ограничивается им.
Мат. фиг. 1
[Мат. 1]
Figure 00000001
В Уравнении 1 в тех случаях, когда в одном кадре имеется Р поддиапазонов или подсекторов, N(P) означает величину Нормы р-го поддиапазона или подсектора, Lp означает длину р-го поддиапазона или подсектора, т.е. количество выборок или спектральных коэффициентов, sp и ep означают начальную выборку и последнюю выборку р-го поддиапазона соответственно, а y(k) означает размер выборки или спектральный коэффициент (т.е. энергию).
Величина Нормы, получаемая на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).
Кодер 230 Нормы может квантовать и кодировать без потерь величину Нормы, получаемую на основании каждого поддиапазона. Величина Нормы, квантуемая на основании каждого поддиапазона, или величина Нормы, получаемая путем деквантования квантованной величины Нормы, может выдаваться в блок 250 оценки и распределения битов. Величина Нормы, квантованная и кодированная без потерь на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).
Блок 250 оценки и распределения битов может оценивать и распределять требуемое число битов путем использования величины Нормы. Предпочтительно деквантованная величина Нормы может использоваться таким образом, что кодирующая часть и декодирующая часть могут использовать один и тот же процесс оценки и распределения битов. В этом случае может использоваться величина Нормы, скорректированная с учетом маскирующего эффекта. Например, величина Нормы может корректироваться с помощью психоакустического взвешивания, применяемого в ITU-T G.719, как в Уравнении 2, но не ограничивается им.
Мат. фиг. 2
[Мат. 2]
Figure 00000002
В Уравнении 2
Figure 00000003
означает показатель квантованной величины Нормы р-го поддиапазона,
Figure 00000004
означает показатель скорректированной величины Нормы р-го поддиапазона, а
WSpe(p)
означает спектр смещения для корректировки величины Нормы.
Блок 250 оценки и распределения битов может вычислять порог маскирования путем использования величины Нормы на основании каждого поддиапазона и оценивать требуемое для восприятия число битов путем использования порога маскирования. С этой целью величина Нормы, получаемая на основании каждого поддиапазона, в равной степени может быть представлена в виде спектральной энергии в единицах дБ, как показано в Уравнении 3.
Мат. фиг. 3
[Мат. 3]
Figure 00000005
В качестве способа получения порога маскирования могут использоваться различные хорошо известные способы. То есть, порог маскирования является величиной, соответствующей минимальному различимому искажению (JND), при этом когда шум квантования ниже порога маскирования, перцептуальный шум не может восприниматься. Таким образом, минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, может вычисляться с помощью порога маскирования. Например, Отношение сигнал-маска (SMR) может вычисляться путем использования отношения величины Нормы к порогу маскирования на основании каждого поддиапазона, а число битов, удовлетворяющее порогу маскирования, может оцениваться путем использования отношения 6,025 дБ
Figure 00000006
1 бит относительно вычисленного SMR. Хотя расчетное число битов представляет собой минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, поскольку с точки зрения сжатия нет необходимости в использовании числа битов, превышающего расчетное, расчетное число битов может рассматриваться как максимальное число битов, допустимое на основании каждого поддиапазона (в дальнейшем в этом документе - допустимое число битов). Допустимое число битов каждого поддиапазона может быть представлено в единицах с десятичной запятой.
Блок 250 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования величины Нормы на основании каждого поддиапазона. В этом случае биты последовательно распределяются из поддиапазона, имеющего большую величину Нормы, чем другие, и можно скорректировать, чтобы больше битов распределялось в важный для восприятия поддиапазон путем взвешивания в соответствии с важностью для восприятия каждого поддиапазона в отношении величины Нормы на основании каждого поддиапазона. Важность для восприятия может определяться, например, посредством психоакустического взвешивания, как в ITU-T G.719.
Блок 250 оценки и распределения битов может последовательно распределять биты в выборки из поддиапазона, имеющего большую величину Нормы, чем другие. Иными словами, в первую очередь биты на выборку распределяются для поддиапазона, имеющего максимальную величину Нормы, при этом приоритет поддиапазона, имеющего максимальную величину Нормы, изменяется путем уменьшения величины Нормы поддиапазона на предварительно заданные единицы таким образом, что биты распределяются в другой поддиапазон. Этот процесс циклически выполняется до тех пор, пока не будет явно распределено общее число В битов, допустимое в конкретном кадре.
Блок 250 оценки и распределения битов может окончательно определять распределяемое число битов путем ограничения распределяемого числа битов таким образом, чтобы оно не превышало расчетное число битов, т.е. допустимое число битов для каждого поддиапазона. Для всех поддиапазонов распределяемое число битов сравнивается с расчетным числом битов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.
Поскольку число битов, распределяемых в каждый поддиапазон, может определяться в единицах с десятичной запятой и ограничивается допустимым числом битов, общее число битов конкретного кадра может быть распределено эффективно.
В соответствии с примерным вариантом осуществления развернутый способ оценки и распределения числа битов, требуемого для каждого поддиапазона, состоит в следующем. В соответствии с этим способом ввиду того, что число битов, распределяемых в каждый поддиапазон, может определяться немедленно без повторения в течение нескольких раз, сложность может быть понижена.
Например, решение, которое может оптимизировать искажение за счет квантования и число битов, распределяемых в каждый поддиапазон, может быть получено применением функции Лагранжа, представленной Уравнением 4.
Мат. фиг. 4
[Мат. 4]
Figure 00000007
В Уравнении 4 L обозначает функцию Лагранжа, D обозначает искажение квантования, B обозначает общее число битов, допустимое в конкретном кадре, Nb обозначает число выборок b-го поддиапазона, а Lb обозначает число битов, допустимое в b-м поддиапазоне. То есть, NbLb обозначает число битов, распределяемых в b-й поддиапазон.
λ обозначает множитель Лагранжа, являющийся коэффициентом оптимизации.
Путем использования Уравнения 4 может быть определено Lb для минимизации разности между общим числом битов, распределяемых в поддиапазоны, входящие в конкретный кадр, и допустимым числом битов для конкретного кадра на основании искажения квантования.
Искажение D квантования может быть определено с помощью Уравнения 5.
Мат. фиг. 5
[Мат. 5]
Figure 00000008
В уравнении 5
Figure 00000009
означает входной спектр, а
Figure 00000010
означает декодированный спектр. То есть, искажение D квантования может быть определено как Среднеквадратическая ошибка (MSE) в отношении входного спектра
Figure 00000009
и декодированного спектра
Figure 00000010
в произвольном кадре.
Знаменатель в Уравнении 5 является постоянной величиной, определяемой конкретным входным спектром, и в связи с этим ввиду того, что знаменатель в Уравнении 5 не влияет на оптимизацию, Уравнение 7 можно упростить с помощью Уравнения 6.
Мат. фиг. 6
[Мат. 6]
Figure 00000011
Величина Нормы
Figure 00000012
,
которая является средней спектральной энергией b-го поддиапазона в отношении входного спектра
Figure 00000009
,
может быть определена с помощью Уравнения 7, величина Нормы
Figure 00000013
,
квантованной по логарифмической шкале, может быть определена с помощью Уравнения 8, а деквантованная величина Нормы
Figure 00000014
может быть определена с помощью Уравнения 9.
Мат. фиг. 7
[Мат. 7]
Figure 00000015
Мат. фиг. 8
[Мат. 8]
Figure 00000016
Мат. фиг. 9
[Мат. 9]
Figure 00000017
В уравнении 7 sb и eb обозначают начальную выборку и последнюю выборку b-го поддиапазона соответственно.
Нормированный спектр yi генерируется делением входного спектра
Figure 00000009
,
на деквантованную величину Нормы
Figure 00000014
,
как в Уравнении 10, а декодированный спектр
Figure 00000010
генерируется умножением восстановленного нормированного спектра
Figure 00000018
на деквантованную величину Нормы
Figure 00000014
,
как в Уравнении 11.
Мат. фиг. 10
[Мат. 10]
Figure 00000019
Мат. фиг. 11
[Мат. 11]
Figure 00000020
Член искажения квантования может быть изменен с помощью Уравнения 12 путем использования Уравнений 9-11.
Мат. фиг. 12
[Мат. 12]
Figure 00000021
Обычно из соотношения между искажением квантования и распределяемым числом битов определяется, что Отношение сигнал-шум (SNR) увеличивается на 6,02 дБ всякий раз, когда добавляется 1 бит на выборку, и путем использования этого искажение квантования нормированного спектра может описываться Уравнением 13.
Мат. фиг. 13
[Мат. 13]
Figure 00000022
В случае реального кодирования аудио Уравнение 14 может быть определено применением величины С по шкале в дБ, которая может варьироваться в соответствии с характеристиками сигнала без фиксации соотношения 1 бит/выборку
Figure 00000006
6,025 дБ.
Мат. фиг. 14
[Мат. 14]
Figure 00000023
В Уравнении 14 в тех случаях, когда С составляет 2, 1 бит/выборку соответствует 6,02 дБ, а когда С составляет 3, 1 бит/выборку соответствует 9,03 дБ.
Таким образом, Уравнение 6 может быть представлено Уравнением 15 по Уравнениям 12 и 14.
Мат. фиг. 15
[Мат. 15]
Figure 00000024
Для получения оптимальных Lb и Λ из Уравнения 15 для Lb и Λ выполняется частный дифференциал, как в Уравнении 16.
Мат. фиг. 16
[Мат. 16]
Figure 00000025
Figure 00000026
При упорядочивании членов Уравнения 16 Lb может быть представлено Уравнением 17.
Мат. фиг. 17
[Мат. 17]
Figure 00000027
Путем использования Уравнения 17 распределяемое число Lb битов на выборку каждого поддиапазона, которое может максимизировать SNR входного спектра, может оцениваться в диапазоне общего числа В битов, допустимого в конкретном кадре.
Распределяемое число битов на основании каждого поддиапазона, которое определяется блоком 250 оценки и распределения битов, может выдаваться в блок кодирования (170 на фиг. 1).
Фиг. 3 представляет собой блок-схему блока 300 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с еще одним примерным вариантом осуществления.
Блок 300 распределения битов на фиг. 3 может включать в себя психоакустическую модель 310, блок 330 оценки и распределения битов, блок 350 оценки масштабного коэффициента и кодер 370 масштабного коэффициента. Компоненты блока 300 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 3, психоакустическая модель 310 может получать порог маскирования для каждого поддиапазона путем приема спектра звуковых частот из блока преобразования (130 на фиг. 1).
Блок 330 оценки и распределения битов может оценивать требуемое для восприятия число битов путем использования порога маскирования на основании каждого поддиапазона. То есть, SMR может вычисляться на основании каждого поддиапазона, а число битов, удовлетворяющее порогу маскирования, может оцениваться путем использования отношения 6,025 дБ
Figure 00000006
1 бит относительно вычисленного SMR. Хотя расчетное число битов представляет собой минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, поскольку с точки зрения сжатия нет необходимости в использовании числа битов, превышающего расчетное, расчетное число битов может рассматриваться как максимальное число битов, допустимое на основании каждого поддиапазона (в дальнейшем в этом документе - допустимое число битов). Допустимое число битов каждого поддиапазона может быть представлено в единицах с десятичной запятой.
Блок 330 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.
Блок 330 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.
Блок 350 оценки масштабного коэффициента может оценивать масштабный коэффициент путем использования распределяемого числа битов, окончательно определяемого на основании каждого поддиапазона. Масштабный коэффициент, оцениваемый на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).
Кодер 370 масштабного коэффициента может квантовать и без потерь кодировать масштабный коэффициент, оцениваемый на основании каждого поддиапазона. Масштабный коэффициент, кодированный на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).
Фиг. 4 представляет собой блок-схему блока 400 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с еще одним примерным вариантом осуществления.
Блок 400 распределения битов на фиг. 4 может содержать блок 410 оценки Нормы, блок 430 оценки и распределения битов, блок 450 оценки масштабного коэффициента и кодер 470 масштабного коэффициента. Компоненты блока 400 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 4, блок 410 оценки Нормы может получать величину Нормы, соответствующую средней спектральной энергии, на основании каждого поддиапазона.
Блок 430 оценки и распределения битов может получать порог маскирования путем использования спектральной энергии на основании каждого поддиапазона и оценивать требуемое для восприятия число битов, т.е. допустимое число битов путем использования порога маскирования.
Блок 430 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.
Блок 430 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.
Блок 450 оценки масштабного коэффициента может оценивать масштабный коэффициент путем использования распределяемого числа битов, окончательно определяемого на основании каждого поддиапазона. Масштабный коэффициент, оцениваемый на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).
Кодер 470 масштабного коэффициента может квантовать и кодировать без потерь масштабный коэффициент, оцениваемый на основании каждого поддиапазона. Масштабный коэффициент, кодированный на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).
Фиг. 5 представляет собой блок-схему блока 500 кодирования, соответствующего блоку 170 кодирования в устройстве 100 кодирования аудио на фиг. 1, в соответствии с примерным вариантом осуществления.
Блок 500 кодирования на фиг. 5 может содержать блок 510 нормирования спектра и кодер 530 спектра. Компоненты блока 500 кодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 5 блок 510 нормирования спектра может нормировать спектр путем использования величины Нормы, выдаваемой с блока распределения битов (150 на фиг. 1).
Кодер 530 спектра может квантовать нормированный спектр путем использования распределяемого числа битов каждого поддиапазона и без потерь кодировать результат квантования. Например, для спектрального кодирования может использоваться факторное импульсное кодирование, но оно этим не ограничивается. В соответствии с факторным импульсным кодированием такая информация, как положение импульса, амплитуда импульса и знак импульса может быть представлена в факторной форме в пределах диапазона распределяемого числа битов.
Информация, относящаяся к спектру, кодированному с помощью кодера 530 спектра, может выдаваться в блок мультиплексирования (190 на фиг. 1).
Фиг. 6 представляет собой блок-схему устройства 600 кодирования аудио в соответствии с еще одним примерным вариантом осуществления.
Устройство 600 кодирования аудио на фиг. 6 может содержать блок 610 обнаружения переходных процессов, блок 630 преобразования, блок 650 распределения битов, блок 670 кодирования и блок 690 мультиплексирования. Компоненты блока 600 кодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора. Поскольку имеется отличие, состоящее в том, что при сравнении устройства 600 кодирования аудио на фиг. 6 с устройством 100 кодирования аудио на фиг. 1 устройство 600 кодирования аудио на фиг. 6 дополнительно содержит блок 610 обнаружения переходных процессов, подробное описание общих компонентов в данном случае не приводится.
В соответствии с фиг. 6 блок 610 обнаружения переходных процессов может обнаруживать интервал, указывающий характеристику переходного процесса путем анализа аудиосигнала. Для обнаружения интервала переходного процесса могут использоваться различные хорошо известные способы. Сигнальная информация о переходном процессе, выдаваемая с блока 610 обнаружения переходных процессов, может быть включена в битовый поток с помощью блока 690 мультиплексирования.
Блок 630 преобразования может определять размер окна, используемого для преобразования, в соответствии с результатом обнаружения интервала переходного процесса и выполнять преобразование из временной области в частотную область на основе определенного размера окна. Например, короткое окно может применяться к поддиапазону, из которого обнаруживается интервал переходного процесса, а длинное окно может применяться к поддиапазону, из которого интервал переходного процесса не обнаруживается.
Блок 650 распределения битов может быть реализован с помощью одного из блоков 200, 300 и 400 распределения битов на фиг. 2, 3 и 4 соответственно.
Блок 670 кодирования может определять размер окна, используемого для кодирования, в соответствии с результатом обнаружения интервала переходного процесса.
Устройство 600 кодирования аудио может генерировать уровень шума для факультативного поддиапазона и выдавать этот уровень шума в устройство декодирования аудио (700 на фиг. 7, 1200 на фиг. 12 или 1300 на фиг. 13).
Фиг. 7 представляет собой блок-схему устройства 700 декодирования аудио в соответствии с примерным вариантом осуществления.
Устройство 700 декодирования аудио на фиг. 7 может содержать блок 710 демультиплексирования, блок 730 распределения битов, блок 750 декодирования и блок 770 обратного преобразования. Компоненты устройства декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 7 блок 710 демультиплексирования может демультиплексировать битовый поток для извлечения квантованной и кодированной без потерь величины Нормы и информации, относящейся к кодированному спектру.
Блок 730 распределения битов может получать деквантованную величину Нормы из квантованной и кодированной без потерь величины Нормы на основании каждого поддиапазона и определять распределяемое число битов путем использования деквантованной величины Нормы. Блок 730 распределения битов может работать по существу так же, как блок 150 или 650 распределения битов устройства 100 или 600 кодирования аудио. В тех случаях, когда величина Нормы корректируется с помощью психоакустического взвешивания в устройстве 100 или 600 кодирования аудио, деквантованная величина Нормы может корректироваться с помощью устройства 700 кодирования аудио аналогичным образом.
Блок 750 декодирования может без потерь кодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока 710 демультиплексирования. Например, для декодирования спектра может использоваться импульсное декодирование.
Блок 770 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования декодированного спектра во временную область.
Фиг. 8 представляет собой блок-схему блока 800 распределения битов в устройстве 700 декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления.
Блок 800 распределения битов на фиг. 8 может содержать декодер 810 Нормы и блок 830 оценки и распределения битов. Компоненты блока 800 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы, по меньшей мере, с помощью одного процессора.
В соответствии с фиг. 8 декодер 810 Нормы может получать деквантованную величину Нормы из квантованной и кодированной без потерь величины Нормы, выдаваемой с блока демультиплексирования (710 на фиг. 7).
Блок 830 оценки и распределения битов может определять распределяемое число битов путем использования деквантованной величины Нормы. А именно, блок 830 оценки и распределения битов может получать порог маскирования путем использования спектральной энергии, т.е. величины Нормы на основании каждого поддиапазона и оценивать требуемое для восприятия число битов, т.е. допустимое число битов путем использования порога маскирования.
Блок 830 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии, т.е. величины Нормы на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.
Блок 830 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.
Фиг. 9 представляет собой блок-схему блока 900 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7, в соответствии с примерным вариантом осуществления.
Блок 900 декодирования на фиг. 9 может содержать декодер 910 спектра и блок 930 формирования огибающей. Компоненты блока 900 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 9 декодер 910 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока демультиплексирования (710 на фиг. 7), и распределяемого числа битов, выдаваемого с блока распределения битов (730 на фиг. 7). Декодированный спектр с декодера 910 спектра представляет собой нормированный спектр.
Блок 930 формирования огибающей может восстанавливать спектр перед нормированием посредством выполнения формирования огибающей по нормированному спектру, выдаваемому с декодера 910 спектра, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).
Фиг. 10 представляет собой блок-схему блока 1000 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления.
Блок 1000 декодирования на фиг. 10 может содержать декодер 1010 спектра, блок 1030 формирования огибающей и блок 1050 заполнения спектра. Компоненты блока 1000 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 10 декодер 1010 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока демультиплексирования (710 на фиг. 7), и распределяемого числа битов, выдаваемого с блока распределения битов (730 на фиг. 7). Декодированный спектр с декодера 1010 спектра представляет собой нормированный спектр.
Блок 1030 формирования огибающей может восстанавливать спектр перед нормированием посредством выполнения формирования огибающей по нормированному спектру, выдаваемому с декодера 1010 спектра, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).
В тех случаях, когда в спектре, выдаваемом с блока 1030 формирования огибающей, имеется поддиапазон, содержащий деквантованный до 0 элемент, блок 1050 заполнения спектра может заполнять составляющую шума в деквантованном до 0 элементе в этом поддиапазоне. В соответствии с примерным вариантом осуществления составляющая шума может генерироваться случайным образом или генерироваться путем копирования спектра поддиапазона, деквантованного до величины, не равной 0, который расположен рядом с поддиапазоном, содержащим деквантованный до 0 элемент, либо спектра поддиапазона, деквантованного до величины, не равной 0. В соответствии с еще одним примерным вариантом осуществления энергия составляющей шума может корректироваться путем генерирования составляющей шума для поддиапазона, содержащего деквантованный до 0 элемент, и с использованием отношения энергии составляющей шума к деквантованной величине Нормы, выдаваемой с блока распределения битов (730 на фиг. 7), т.е. спектральной энергии. В соответствии с еще одним примерным вариантом осуществления может генерироваться составляющая шума для поддиапазона, содержащего деквантованный до 0 элемент, при этом средняя энергия составляющей шума может корректироваться до 0.
Фиг. 11 представляет собой блок-схему блока 1100 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7, в соответствии с еще одним примерным вариантом осуществления.
Блок 1100 декодирования на фиг. 11 может содержать декодер 1110 спектра, блок 1130 заполнения спектра и блок 1150 формирования огибающей. Компоненты блока 1100 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора. Поскольку имеется отличие, состоящее в том, что при сравнении блока 1100 декодирования на фиг. 11 с устройством 1000 декодирования на фиг. 10 компоновка блока 1130 заполнения спектра и блока 1150 формирования огибающей различаются, подробное описание общих компонентов в данном случае не приводится.
В соответствии с фиг. 11 в тех случаях, когда в нормированном спектре, выдаваемом с декодера 1110 спектра, имеется поддиапазон, содержащий деквантованный до 0 элемент, блок 1130 заполнения спектра может заполнять составляющую шума в деквантованном до 0 элементе в этом поддиапазоне. В этом случае могут использоваться различные способы заполнения шума, применимые к блоку 1050 заполнения шума на фиг. 10. Предпочтительно может генерироваться составляющая шума для поддиапазона, содержащего деквантованный до 0 элемент, при этом средняя энергия составляющей шума может корректироваться до 1.
Блок 1150 формирования огибающей может восстанавливать спектр перед нормированием для спектра, содержащего поддиапазон, в котором заполняется составляющая шума, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).
Фиг. 12 представляет собой блок-схему устройства 1200 декодирования аудио в соответствии с еще одним примерным вариантом осуществления.
Устройство 1200 декодирования аудио на фиг. 12 может содержать блок 1210 демультиплексирования, декодер 1230 масштабного коэффициента, декодер 1250 спектра и блок 1270 обратного преобразования. Компоненты устройства 1200 декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
В соответствии с фиг. 12 блок 1210 демультиплексирования может демультиплексировать битовый поток для извлечения квантованного и кодированного без потерь масштабного коэффициента и информации, относящейся к кодированному спектру.
Декодер 1230 масштабного коэффициента может без потерь кодировать и деквантовать квантованный и кодированный без потерь масштабный коэффициент на основании каждого поддиапазона.
Декодер 1250 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру, и деквантованного масштабного коэффициента, выдаваемых с блока 1210 демультиплексирования. Блок 1250 декодирования спектра может содержать те же компоненты, что и блок 1000 декодирования на фиг. 10.
Блок 1270 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования спектра, декодированного декодером 1250 спектра, во временную область.
Фиг. 13 представляет собой блок-схему устройства 1300 декодирования аудио в соответствии с еще одним примерным вариантом осуществления.
Устройство 1300 декодирования аудио на фиг. 13 может содержать блок 1310 демультиплексирования, блок 1330 распределения битов, блок 1350 декодирования и блок 1370 обратного преобразования. Компоненты устройства 1300 декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.
Поскольку имеется отличие, состоящее в том, что при сравнении устройства 1300 декодирования аудио на фиг. 13 с устройством 700 декодирования аудио на фиг. 7 сигнальная информация о переходном процессе выдается в блок 1350 декодирования и блок 1370 обратного преобразования, подробное описание общих компонентов в данном случае не приводится.
В соответствии с фиг. 13 блок 1350 декодирования может декодировать спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока 1310 мультиплексирования. В этом случае размер окна может варьироваться в соответствии с сигнальной информацией о переходном процессе.
Блок 1370 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования декодированного спектра во временную область. В этом случае размер окна может варьироваться в соответствии с сигнальной информацией о переходном процессе.
Фиг. 14 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.
В соответствии с фиг. 14 при выполнении операции 1410 извлекается спектральная энергия каждого поддиапазона. Спектральная энергия может являться величиной Нормы.
При выполнении операции 1420 извлекается порог маскирования путем использования спектральной энергии на основании каждого поддиапазона.
При выполнении операции 1430 оценивается допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании каждого поддиапазона.
При выполнении операции 1440 биты распределяются в единицах с десятичной запятой на основе спектральной энергии на основании каждого поддиапазона.
При выполнении операции 1450 допустимое число битов сравнивается с распределяемым числом битов на основании каждого поддиапазона.
При выполнении операции 1460 в том случае, если в результате сравнения при выполнении операции 1450 распределяемое число битов больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов ограничивается допустимым числом битов.
При выполнении операции 1470 в том случае, если в результате сравнения при выполнении операции 1450 распределяемое число битов не больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов, ограниченного при выполнении операции 1460.
Хотя это и не показано, если сумма распределяемого числа битов, определяемого при выполнении операции 1470 для всех поддиапазонов в конкретном кадре, больше или меньше общего числа битов, допустимого в конкретном кадре, число битов, соответствующее разности, может быть равномерно распределено во все поддиапазоны или неравномерно распределено в соответствии с важностью для восприятия.
Фиг. 15 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.
В соответствии с фиг. 15 при выполнении операции 1500 извлекается деквантованная величина Нормы каждого поддиапазона.
При выполнении операции 1510 извлекается порог маскирования путем использования деквантованной величины Нормы на основании каждого поддиапазона.
При выполнении операции 1520 извлекается SMR путем использования порога маскирования на основании каждого поддиапазона.
При выполнении операции 1530 допустимое число битов оценивается в единицах с десятичной запятой путем использования SMR на основании каждого диапазона частот.
При выполнении операции 1540 биты распределяются в единицах с десятичной запятой на основе спектральной энергии (или деквантованной величины Нормы) на основании каждого поддиапазона.
При выполнении операции 1550 допустимое число битов сравнивается с распределяемым числом битов на основании каждого поддиапазона.
При выполнении операции 1560 в том случае, если в результате сравнения при выполнении операции 1550 распределяемое число битов больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов ограничивается допустимым числом битов.
При выполнении операции 1570 в том случае, если в результате сравнения при выполнении операции 1550 распределяемое число битов не больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов, ограниченного при выполнении операции 1560.
Хотя это и не показано, если сумма распределяемого числа битов, определяемого при выполнении операции 1570 для всех поддиапазонов в конкретном кадре, меньше или больше общего числа битов, допустимого в конкретном кадре, число битов, соответствующее разности, может быть равномерно распределено во все поддиапазоны или неравномерно распределено в соответствии с перцептуальной важностью.
Фиг. 16 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.
В соответствии с фиг. 16 при выполнении операции 1610 выполняется инициализация. В качестве примера инициализации, когда распределяемое число битов для каждого поддиапазона оценивается путем использования Уравнения 20, общая сложность может быть уменьшена путем вычисления постоянной величины:
Figure 00000028
для всех поддиапазонов.
При выполнении операции 1620 распределяемое число битов для каждого поддиапазона оценивается в единицах с десятичной запятой путем использования Уравнения 17. Распределяемое число битов для каждого поддиапазона может быть получено умножением распределяемого числа Lb битов на выборку на число выборок на каждый поддиапазон. В тех случаях, когда распределяемое число Lb битов на выборку каждого поддиапазона вычисляется путем использования Уравнения 17, Lb может иметь значение менее 0. В этом случае 0 распределяется в число Lb, имеющее значение менее 0, как в Уравнении 18.
Мат. фиг. 18
[Мат. 18]
Figure 00000029
В результате сумма распределяемого числа битов, оцениваемых для всех поддиапазонов, входящих в конкретный кадр, может быть больше, чем число В битов, допустимое в конкретном кадре.
При выполнении операции 1630 сумма распределяемого числа битов, оцениваемых для всех поддиапазонов, входящих в конкретный кадр, сравнивается с числом В битов, допустимым в конкретном кадре.
При выполнении операции 1640 биты перераспределяются для каждого поддиапазона с помощью Уравнения 19 до тех пор, пока сумма распределяемого числа битов, оцениваемого для всех поддиапазонов, входящих в конкретный кадр, не будет такой же, как число В битов, допустимое в конкретном кадре.
Мат. фиг. 19
[Мат. 19]
Figure 00000030
В Уравнении 19
Figure 00000031
означает число битов, определяемое (k-1)-м повторением, а
Figure 00000032
означает число битов, определяемое k-м повторением. Число битов, определяемое каждым повторением, должно быть не менее 0, и, соответственно, операция 1640 выполняется для всех поддиапазонов, имеющих число битов, большее 0.
При выполнении операции 1650 в том случае, если в результате сравнения при выполнении операции 1630 сумма распределяемого числа битов, оцениваемого для всех поддиапазонов, входящих в конкретный кадр, является той же, что и число В битов, допустимое в конкретном кадре, распределяемое число битов каждого поддиапазона используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов каждого поддиапазона, которое получено в результате перераспределения при выполнении операции 1640.
Фиг. 17 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.
В соответствии с фиг. 17 так же, как и при выполнении операции 1610 на фиг. 16, при выполнении операции 1710 выполняется инициализация. Так же, как и при выполнении операции 1620 на фиг. 16, при выполнении операции 1720 распределяемое число битов для каждого поддиапазона оценивается в единицах с десятичной запятой, а когда распределяемое число Lb битов на выборку для каждого поддиапазона меньше 0, 0 распределяется в число Lb, имеющее значение меньше 0, как в Уравнении 18.
При выполнении операции 1730 минимальное число битов, требуемое для каждого поддиапазона, определяется с точки зрения SNR, а распределяемое число битов при выполнении операции 1720, большее 0 и меньшее минимального числа битов, корректируется путем ограничения распределяемого числа битов минимальным числом битов. В связи с этим, благодаря ограничению распределяемого числа битов каждого поддиапазона минимальным числом битов может быть уменьшена возможность снижения качества звучания. Например, минимальное число битов, требуемое для каждого поддиапазона, определяется как минимальное число битов, требуемое для импульсного кодирования при факторном импульсном кодировании. Факторное импульсное кодирование представляет сигнал путем использования всех комбинаций положения импульса, не равного 0, амплитуды импульса и знака импульса. В этом случае случайное число N всех комбинаций, которые могут представлять импульс, может быть представлено Уравнением 20.
Мат. фиг. 20
[Мат. 20]
Figure 00000033
В Уравнении 20 2i означает случайное число знаков, представимое с помощью +/- для сигналов в i ненулевых положениях.
В Уравнении 20 F(n,i) может быть определено с помощью Уравнения 21 и означает случайное число для выбора i ненулевых положений для конкретных n выборок, т.е. положений.
Мат. фиг. 21
[Мат. 21]
Figure 00000034
В Уравнении 20 D(m,i) может быть представлено с помощью Уравнения 22 и означает случайное число для представления сигналов, выбираемых в i ненулевых положениях с помощью m амплитуд.
Мат. фиг. 22
[Мат. 22]
Figure 00000035
Число М битов, требуемое для представления N комбинаций, может быть представлено с помощью Уравнения 23.
Мат. фиг. 23
[Мат. 23]
M=[log2N]
В результате минимальное число
Figure 00000036
битов, требуемое для кодирования не менее 1 импульса для Nb выборок в конкретном b-м поддиапазоне, может быть представлено Уравнением 24.
Мат. фиг. 24
[Мат. 24]
Figure 00000037
В этом случае число битов, используемое для передачи величины коэффициента усиления, требуемой для квантования, может быть добавлено к минимальному числу битов, требуемому при факторном импульсном кодировании, и может варьироваться в соответствии со скоростью передачи битов. Минимальное число битов, требуемое на основании каждого поддиапазона, может определяться большей величиной из минимального числа битов, требуемого при факторном импульсном кодировании, и числа Nb выборок конкретного поддиапазона, как в Уравнении 25. Например, минимальное число битов, требуемое на основании каждого поддиапазона, может быть установлено равным 1 биту на выборку.
Мат. фиг. 25
[Мат. 25]
Figure 00000038
В тех случаях, когда при выполнении операции 1730 используемых битов недостаточно, поскольку целевая скорость передачи битов мала, для диапазона, для которого распределяемое число битов больше 0 и меньше минимального числа битов, распределяемое число битов удаляется и устанавливается на 0. Кроме того, для поддиапазона, для которого распределяемое число битов меньше, чем в Уравнении 24, распределяемое число битов может быть удалено, а для поддиапазона, для которого распределяемое число битов больше, чем в Уравнении 24, и меньше, чем минимальное число битов в Уравнении 25, может быть распределено минимальное число битов.
При выполнении операции 1740 сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, сравнивается с числом битов, допустимым в конкретном кадре.
При выполнении операции 1750 биты перераспределяются для поддиапазона, в который распределяется более чем минимальное число битов, до тех пор, пока сумма распределяемого числа битов, оцениваемых для всех поддиапазонов в конкретном кадре, не будет такой же, как число битов, допустимое в конкретном кадре.
При выполнении операции 1760 определяется, изменяется ли распределяемое число битов каждого поддиапазона между предыдущим повторением и текущим повторением для перераспределения битов. Если распределяемое число битов каждого поддиапазона не изменяется между предыдущим повторением и текущим повторением для перераспределения битов либо до тех пор, пока сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, не станет такой же, как число битов, допустимое в конкретном кадре, выполняются операции 1740-1760.
При выполнении операции 1770 в том случае, если в результате определения при выполнении операции 1760 распределяемое число битов каждого поддиапазона не изменяется между предыдущим повторением и текущим повторением для перераспределения битов, биты последовательно удаляются от верхнего поддиапазона до нижнего поддиапазона, и операции 1740 - 1760 выполняются до тех пор, пока число битов, допустимое в конкретном кадре не будет приемлемым. Кроме того, если распределяемое число битов не больше минимального числа битов в Уравнении 25 для всех поддиапазонов, а сумма распределяемого числа битов больше числа битов, допустимого в конкретном кадре, распределяемое число битов может быть удалено из высокочастотного диапазона в низкочастотный диапазон.
В соответствии со способами распределения битов на фиг. 16 и 17 для распределения битов в каждый поддиапазон после того, как начальные биты распределены в каждый поддиапазон в порядке спектральной энергии или взвешенной спектральной энергии, число битов, требуемое для каждого поддиапазона, может оцениваться немедленно без повторения операции поиска спектральной энергии или взвешенной спектральной энергии в течение нескольких раз. Кроме того, благодаря перераспределению битов в каждый поддиапазон до тех пор, пока сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, не станет такой же, как число битов, допустимое в конкретном кадре, возможно эффективное распределение битов. Кроме того, благодаря обеспечению минимального числа битов в произвольном поддиапазоне может быть предотвращено образование спектрального провала, возникающего из-за того, что ввиду распределения малого числа битов достаточное число спектральных выборок или импульсов не может кодироваться.
Способы на фиг. 14-17 могут программироваться и могут осуществляться с помощью, по меньшей мере, одного устройства обработки, например, центрального процессора (ЦП).
Фиг. 18 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования, в соответствии с примерным вариантом осуществления.
В соответствии с фиг. 18 мультимедийное устройство 1800 может содержать блок 1810 связи и модуль 1830 кодирования. Кроме того, мультимедийное устройство 1800 может дополнительно содержать блок 1850 памяти для хранения битового потока аудио, получаемого в результате кодирования в соответствии с применением битового потока аудио. Кроме того, мультимедийное устройство 1800 может дополнительно содержать микрофон 1870. То есть, блок 1850 памяти и микрофон 1870 могут содержаться факультативно. Мультимедийное устройство 1800 может дополнительно содержать произвольный модуль декодирования (не показан), например, модуль декодирования для выполнения общей функции декодирования или модуль декодирования в соответствии с примерным вариантом осуществления. Модуль 1830 кодирования может быть реализован с помощью, по меньшей мере, одного процессора, например, центрального процессора (не показан) посредством объединения с другими компонентами (не показаны), входящими в состав мультимедийного устройства 1800 как единого целого.
Блок 1810 связи может принимать, по меньшей мере, один из аудиосигнала или кодированного битового потока извне или передавать, по меньшей мере, один из восстановленного аудиосигнала или кодированного битового потока, получаемого в результате кодирования с помощью модуля 1830 кодирования.
Блок 1810 связи выполнен с возможностью передачи и приема данных на внешнее мультимедийное устройство и с него с помощью беспроводной сети, такой как беспроводной Интернет, беспроводной интранет, беспроводная телефонная сеть, беспроводная Локальная сеть (LAN), Wi-Fi, Wi-Fi Direct (WFD), третье поколение (3G), четвертое поколение (4G), Bluetooth, Ассоциация по инфракрасной технологии передачи данных (IrDA), Радиочастотная идентификация (RFID), Сверхширокая полоса пропускания (UWB), Zigbee, либо Беспроводной связи ближнего радиуса действия (NFC), либо проводной сети, такой как проводная телефонная сеть или проводной Интернет.
В соответствии с примерным вариантом осуществления, модуль 1830 кодирования может генерировать битовый поток путем преобразования аудиосигнала во временной области, который создается посредством блока 1810 связи или микрофона 1870, в спектр звуковых частот в частотной области, определения распределяемого числа битов в единицах с десятичной запятой на основании диапазонов частот таким образом, что SNR спектра, имеющегося в заданном диапазоне частот, максимизируется в пределах диапазона числа битов, допустимого в конкретном кадре спектра звуковых частот, корректировки распределяемого числа битов, определяемого на основании диапазонов частот, и кодирования спектра звуковых частот путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии.
В соответствии с примерным вариантом осуществления, модуль 1830 кодирования может генерировать битовый поток путем преобразования аудиосигнала во временной области, который создается посредством блока 1810 связи или микрофона 1870, в спектр звуковых частот в частотной области, оценки допустимого числа битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр спектра звуковых частот, оценки распределяемого числа битов в единицах с десятичной запятой путем использования спектральной энергии, корректировки распределяемого числа битов таким образом, чтобы оно не превышало допустимое число битов, и кодирования спектра звуковых частот путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии.
Блок 1850 памяти может хранить кодированный звуковой поток, генерируемый модулем 1830 кодирования. Кроме того, блок 1850 памяти может хранить различные программы, требуемые для работы мультимедийного устройства 1800.
Микрофон 1870 может выдавать аудиосигнал от пользователя или внешней среды в модуль 1830 кодирования.
Фиг. 19 представляет собой блок-схему мультимедийного устройства, содержащего модуль декодирования, в соответствии с примерным вариантом осуществления.
Мультимедийное устройство 1900 на фиг. 19 может содержать блок 1910 связи и модуль 1930 декодирования. Кроме того, в соответствии с использованием восстановленного аудиосигнала, получаемого в качестве результата декодирования, мультимедийное устройство 1900 на фиг. 19 может дополнительно содержать блок 1950 памяти для хранения восстановленного аудиосигнала. Кроме того, мультимедийное устройство 1800 может дополнительно содержать громкоговоритель 1970. То есть, блок 1950 памяти и громкоговоритель 1970 являются факультативными. Мультимедийное устройство 1900 на фиг. 19 может дополнительно содержать модуль кодирования (не показан), например, модуль кодирования для выполнения общей функции кодирования или модуль кодирования в соответствии с примерным вариантом осуществления. Модуль 1930 декодирования может быть объединен с другими компонентами (не показаны), входить в состав мультимедийного устройства 1900 и реализован с помощью, по меньшей мере, одного процессора, например, центрального процессора (ЦП).
В соответствии с фиг. 19 блок 1910 связи может принимать, по меньшей мере, один из аудиосигнала или кодированного битового потока извне или может передавать, по меньшей мере, один из восстановленного аудиосигнала, получаемого в результате декодирования модулем 1930 декодирования, или битового потока аудио, получаемого в результате кодирования. Блок 1910 связи может быть реализован по существу аналогично блоку 1810 связи на фиг. 18.
В соответствии с примерным вариантом осуществления модуль 1930 декодирования может генерировать восстановленный аудиосигнал путем приема битового потока, создаваемого посредством блока 1910 связи, определения распределяемого числа битов в единицах с десятичной запятой на основании диапазонов частот таким образом, что SNR спектра, имеющегося в каждом диапазоне частот, максимизируется в пределах диапазона допустимого числа битов в конкретном кадре, корректировки распределяемого числа битов, определяемого на основании диапазонов частот, декодирования спектра звуковых частот, входящего в битовый поток, путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии, и преобразования декодированного спектра звуковых частот в аудиосигнал во временной области.
В соответствии с еще одним примерным вариантом осуществления, модуль 1930 декодирования может генерировать битовый поток путем приема битового потока, создаваемого посредством блока 1910 связи, оценки допустимого числа битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр, оценки распределяемого числа битов в единицах с десятичной запятой путем использования спектральной энергии, корректировки распределяемого числа битов таким образом, чтобы оно не превышало допустимое число битов, декодирования спектра звуковых частот, входящего в битовый поток, путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии, и преобразования декодированного спектра звуковых частот в аудиосигнал во временной области.
Блок 1950 памяти может хранить восстановленный аудиосигнал, генерируемый модулем 1930 декодирования. Кроме того, блок 1950 памяти может хранить различные программы, требуемые для работы мультимедийного устройства 1900.
Громкоговоритель 1970 может выдавать восстановленный аудиосигнал, генерируемый модулем 1930 декодирования, во внешнюю среду.
Фиг. 20 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования и модуль декодирования, в соответствии с примерным вариантом осуществления.
Мультимедийное устройство 2000, изображенное на фиг. 20, может содержать блок 2010 связи, модуль 2020 кодирования и модуль 2030 декодирования. Кроме того, мультимедийное устройство 2000 может дополнительно содержать блок 2040 памяти для хранения битового потока аудио, получаемого в результате кодирования, или восстановленного аудиосигнала, получаемого в результате декодирования, в соответствии с применением битового потока аудио или восстановленного аудиосигнала. Кроме того, мультимедийное устройство 2000 может дополнительно содержать микрофон 2050 и/или громкоговоритель 2060. Модуль 2020 кодирования и модуль 2030 декодирования могут быть реализованы с помощью, по меньшей мере, одного процессора, например, центрального процессора (ЦП) (не показан) посредством объединения с другими компонентами (не показаны), входящими в состав мультимедийного устройства 2000 как единого целого.
Поскольку компоненты мультимедийного устройства 2000, изображенного на фиг. 20, соответствуют компонентам мультимедийного устройства 1800, изображенного на фиг. 18, или компонентам мультимедийного устройства 1900, изображенного на фиг. 19, их подробное описание не приводится.
Каждое из мультимедийных устройств 1800, 1900 и 2000, изображенных на фиг. 18, 19 и 20, может содержать оконечное устройство только речевой связи, такое как телефон или мобильный телефон, устройство только широковещания или передачи музыки, такое как телевизор или MP3-проигрыватель, либо гибридное оконечное устройство из оконечного устройства только речевой связи и устройства только широковещания или передачи, но не ограничивается перечисленным. Кроме того, каждое из мультимедийных устройств 1800, 1900 и 2000 может использоваться в качестве клиента, сервера или преобразователя, расположенного между клиентом и сервером.
В тех случаях, когда мультимедийное устройство 1800, 1900 или 2000 является, например, мобильным телефоном, хотя он и не показан, мультимедийное устройство 1800, 1900 или 2000 может дополнительно содержать блок ввода пользователя, такой как клавиатура, блок отображения для отображения информации, обрабатываемой пользовательским интерфейсом или мобильным телефоном, и процессор для управления функциями мобильного телефона. Кроме того, мобильный телефон может дополнительно содержать блок камеры, имеющий функцию формирования изображений, и, по меньшей мере, один компонент для выполнения функции, требуемой для мобильного телефона.
В тех случаях, когда мультимедийное устройство 1800, 1900 или 2000 является, например, телевизором, хотя он и не показан, мультимедийное устройство 1800, 1900 или 2000 может дополнительно содержать блок ввода пользователя, такой как клавиатура, блок отображения для отображения принимаемой широковещательной информации и процессор для управления всеми функциями телевизора. Кроме того, телевизор может дополнительно содержать, по меньшей мере, один компонент для выполнения функции телевизора.
Способы в соответствии с этими примерами осуществления могут быть записаны в виде компьютерных программ и могут быть реализованы в универсальных цифровых компьютерах, которые исполняют программы с помощью машиночитаемого носителя записи. Кроме того, структуры данных, программные команды или массивы данных, применимые в этих примерных вариантах осуществления, могут быть записаны на машиночитаемом носителе записи различными способами. Машиночитаемый носитель записи представляет собой любое устройство хранения данных, способное хранить данные, которые могут после этого считываться вычислительной системой. К примерам машиночитаемого носителя записи относятся магнитные носители, такие как жесткие диски, гибкие диски и магнитные ленты, оптические носители, такие как CD-ROM и DVD, и магнитооптические носители, такие как флоптические диски, и аппаратные устройства, такие как постоянное запоминающее устройство (ПЗУ), оперативное запоминающее устройство (ОЗУ) и флэш-память, в частности, выполненные с возможностью хранения и исполнения программных команд. Кроме того, машиночитаемый носитель записи может представлять собой передающую среду для передачи сигнала, в котором предусматриваются программная команда и структура данных. Программные команды могут содержать машинные коды, редактируемые компилятором, и коды на языке высокого уровня, исполнимые компьютером с помощью интерпретатора.
Несмотря на то, что настоящая идея изобретения подробно изображена и описана со ссылкой на ее примерные варианты осуществления, специалистам должно быть ясно, что в ней возможны различные изменения в форме и деталях в пределах сущности и объема настоящей идеи изобретения, определяемой нижеследующей формулой изобретения.

Claims (21)

1. Способ распределения битов, включающий в себя:
оценку распределенного количества битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра таким образом, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля; и
перераспределение распределенного количества битов для поддиапазона, для поддиапазона, имеющего распределенное количество битов больше нуля.
2. Способ по п.1, в котором перераспределение содержит установку распределенного количества битов для поддиапазона равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, больше нуля и меньше минимального количества битов, требуемого для поддиапазона.
3. Способ по п.1, в котором перераспределение содержит ограничение распределенного количества битов для поддиапазона минимальным количеством битов, требуемым для поддиапазона, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, больше нуля и меньше упомянутого минимального количества битов.
4. Компьютерно-читаемый носитель записи, хранящий компьютерно-читаемую программу для исполнения способа распределения битов, содержащего:
оценку распределенного количества битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра таким образом, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля; и
перераспределение распределенного количества битов для поддиапазона, для поддиапазона, имеющего распределенное количество битов больше нуля.
5. Устройство распределения битов, содержащее:
процессор, выполненный с возможностью:
оценивать распределенное количество битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра таким образом, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля; и
перераспределять количество распределенных битов для поддиапазона, для поддиапазона, имеющего распределенное количество битов больше нуля.
6. Устройство кодирования аудио, включающее в себя:
блок распределения битов, выполненный с возможностью оценивать распределенное количество битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля, и перераспределять количество распределенных битов для поддиапазона, имеющего распределенное количество битов больше нуля; и
блок кодирования, выполненный с возможностью кодировать кадр на основании распределенного количества битов для поддиапазона, полученного из упомянутого перераспределения.
7. Устройство декодирования аудио, включающее в себя:
блок распределения битов, выполненный с возможностью оценивать распределенное количество битов для поддиапазона в кадре аудиосигнала в виде дробных чисел с использованием предварительно определенного уравнения, включающего в себя дробные выражения, учитывая допустимые биты для кадра, чтобы получить распределенное количество битов для поддиапазона, причем распределенное количество битов для поддиапазона задается равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, меньше нуля, и перераспределять распределенное количество битов для поддиапазона, имеющего распределенное количество битов больше нуля; и
блок декодирования, выполненный с возможностью декодировать кадр на основании распределенного количества битов для поддиапазона, полученного из упомянутого перераспределения.
8. Устройство по любому из пп. 5-7, в котором блок распределения битов выполнен с возможностью оценивать распределенное количество битов для поддиапазона, на основании спектральной энергии поддиапазона.
9. Устройство по любому из пп. 5-7, в котором блок распределения битов выполнен с возможностью устанавливать распределенное количество битов для поддиапазона равным нулю, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, больше нуля и меньше минимального количества битов, требуемых для поддиапазона.
10. Устройство по любому из пп. 5-7, в котором блок распределения битов выполнен с возможностью ограничивать распределенное количество битов для поддиапазона минимальным количеством битов, требуемых для поддиапазона, когда распределенное количество битов для поддиапазона, полученное из упомянутой оценки, больше нуля и меньше упомянутого минимального количества битов.
RU2013155482A 2011-05-13 2012-05-14 Распределение битов, кодирование и декодирование аудио RU2648595C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161485741P 2011-05-13 2011-05-13
US61/485,741 2011-05-13
US201161495014P 2011-06-09 2011-06-09
US61/495,014 2011-06-09
PCT/KR2012/003777 WO2012157932A2 (en) 2011-05-13 2012-05-14 Bit allocating, audio encoding and decoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2018108586A Division RU2705052C2 (ru) 2011-05-13 2012-05-14 Распределение битов, кодирование и декодирование аудио

Publications (2)

Publication Number Publication Date
RU2013155482A RU2013155482A (ru) 2015-06-20
RU2648595C2 true RU2648595C2 (ru) 2018-03-26

Family

ID=47141906

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2013155482A RU2648595C2 (ru) 2011-05-13 2012-05-14 Распределение битов, кодирование и декодирование аудио
RU2018108586A RU2705052C2 (ru) 2011-05-13 2012-05-14 Распределение битов, кодирование и декодирование аудио

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2018108586A RU2705052C2 (ru) 2011-05-13 2012-05-14 Распределение битов, кодирование и декодирование аудио

Country Status (15)

Country Link
US (7) US9236057B2 (ru)
EP (5) EP2707874A4 (ru)
JP (3) JP6189831B2 (ru)
KR (7) KR102053900B1 (ru)
CN (3) CN105825859B (ru)
AU (3) AU2012256550B2 (ru)
BR (1) BR112013029347B1 (ru)
CA (1) CA2836122C (ru)
MX (3) MX337772B (ru)
MY (2) MY186720A (ru)
RU (2) RU2648595C2 (ru)
SG (1) SG194945A1 (ru)
TW (5) TWI562133B (ru)
WO (2) WO2012157931A2 (ru)
ZA (1) ZA201309406B (ru)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100266989A1 (en) 2006-11-09 2010-10-21 Klox Technologies Inc. Teeth whitening compositions and methods
KR102053900B1 (ko) 2011-05-13 2019-12-09 삼성전자주식회사 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
EP2728577A4 (en) 2011-06-30 2016-07-27 Samsung Electronics Co Ltd APPARATUS AND METHOD FOR GENERATING A BANDWIDTH EXTENSION SIGNAL
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
US11116841B2 (en) 2012-04-20 2021-09-14 Klox Technologies Inc. Biophotonic compositions, kits and methods
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
KR102200643B1 (ko) 2012-12-13 2021-01-08 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음성 음향 부호화 장치, 음성 음향 복호 장치, 음성 음향 부호화 방법 및 음성 음향 복호 방법
CN103107863B (zh) * 2013-01-22 2016-01-20 深圳广晟信源技术有限公司 一种分段平均码率的数字音频信源编码方法及装置
KR101757347B1 (ko) * 2013-01-29 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 지각적 변환 오디오 코딩에서의 노이즈 채움
US20140276354A1 (en) 2013-03-14 2014-09-18 Klox Technologies Inc. Biophotonic materials and uses thereof
CN108198564B (zh) 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
EP3614381A1 (en) * 2013-09-16 2020-02-26 Samsung Electronics Co., Ltd. Signal encoding method and device and signal decoding method and device
CA2927990C (en) * 2013-10-31 2018-08-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
CN111370008B (zh) 2014-02-28 2024-04-09 弗朗霍弗应用研究促进协会 解码装置、编码装置、解码方法、编码方法、终端装置、以及基站装置
CN106409300B (zh) 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
US9361899B2 (en) * 2014-07-02 2016-06-07 Nuance Communications, Inc. System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN111968656B (zh) 2014-07-28 2023-11-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
CN106782608B (zh) * 2016-12-10 2019-11-05 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN108174031B (zh) * 2017-12-26 2020-12-01 上海展扬通信技术有限公司 一种音量调节方法、终端设备及计算机可读存储介质
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN108833324B (zh) * 2018-06-08 2020-11-27 天津大学 一种基于时域限幅噪声消除的haco-ofdm系统接收方法
CN108922556B (zh) * 2018-07-16 2019-08-27 百度在线网络技术(北京)有限公司 声音处理方法、装置及设备
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
CN114514575A (zh) 2019-11-01 2022-05-17 三星电子株式会社 集线器装置、包括集线器装置和多个装置的多装置系统以及集线器装置和多装置系统的操作方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0591061A (ja) * 1991-09-30 1993-04-09 Sony Corp オーデイオ信号処理方法
JPH05114863A (ja) * 1991-08-27 1993-05-07 Sony Corp 高能率符号化装置及び復号化装置
JPH09214355A (ja) * 1996-01-30 1997-08-15 Sony Corp 信号符号化方法
RU2224302C2 (ru) * 1997-04-02 2004-02-20 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
RU2289858C2 (ru) * 2002-06-27 2006-12-20 Самсунг Электроникс Ко., Лтд. Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник
US7457742B2 (en) * 2003-01-08 2008-11-25 France Telecom Variable rate audio encoder via scalable coding and enhancement layers and appertaining method
US7734053B2 (en) * 2005-12-06 2010-06-08 Fujitsu Limited Encoding apparatus, encoding method, and computer product
US7752041B2 (en) * 2004-05-28 2010-07-06 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding digital signal
JP5114863B2 (ja) * 2006-04-11 2013-01-09 横浜ゴム株式会社 空気入りタイヤおよび空気入りタイヤの組立方法

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
JPH03181232A (ja) 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP2560873B2 (ja) * 1990-02-28 1996-12-04 日本ビクター株式会社 直交変換符号化復号化方法
JPH0414355A (ja) 1990-05-08 1992-01-20 Matsushita Electric Ind Co Ltd 構内交換機のリンガ信号送出方法
JPH04168500A (ja) * 1990-10-31 1992-06-16 Sanyo Electric Co Ltd 信号符号化方法
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH06348294A (ja) * 1993-06-04 1994-12-22 Sanyo Electric Co Ltd 帯域分割符号化装置
US5893065A (en) * 1994-08-05 1999-04-06 Nippon Steel Corporation Apparatus for compressing audio data
TW271524B (ru) 1994-08-05 1996-03-01 Qualcomm Inc
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3181232B2 (ja) 1996-12-19 2001-07-03 立川ブラインド工業株式会社 ロールブラインドのスクリーン取付装置
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP4168500B2 (ja) 1998-11-04 2008-10-22 株式会社デンソー 半導体装置およびその実装方法
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
JP2000293199A (ja) * 1999-04-05 2000-10-20 Nippon Columbia Co Ltd 音声符号化方法および記録再生装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP2002006895A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
JP4055336B2 (ja) * 2000-07-05 2008-03-05 日本電気株式会社 音声符号化装置及びそれに用いる音声符号化方法
JP4190742B2 (ja) * 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
DE60209888T2 (de) * 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
US7979721B2 (en) * 2004-11-15 2011-07-12 Microsoft Corporation Enhanced packaging for PC security
CN1780278A (zh) * 2004-11-19 2006-05-31 松下电器产业株式会社 子载波通信系统中自适应调制与编码方法和设备
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
DE202005010080U1 (de) 2005-06-27 2006-11-09 Pfeifer Holding Gmbh & Co. Kg Verbindungsvorrichtung
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
KR101291672B1 (ko) * 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
PT2186089T (pt) * 2007-08-27 2019-01-10 Ericsson Telefon Ab L M Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais
ATE535904T1 (de) * 2007-08-27 2011-12-15 Ericsson Telefon Ab L M Verbesserte transformationskodierung von sprach- und audiosignalen
CN101239368A (zh) 2007-09-27 2008-08-13 骆立波 异型盖整平模具及其整平方法
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8364471B2 (en) * 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
EP2561508A1 (en) * 2010-04-22 2013-02-27 Qualcomm Incorporated Voice activity detection
CN101957398B (zh) 2010-09-16 2012-11-28 河北省电力研究院 一种基于机电与电磁暂态混合仿真技术检测计算电网一次时间常数的方法
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
EP2975611B1 (en) * 2011-03-10 2018-01-10 Telefonaktiebolaget LM Ericsson (publ) Filling of non-coded sub-vectors in transform coded audio signals
JP5648123B2 (ja) * 2011-04-20 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、およびこれらの方法
KR102053900B1 (ko) * 2011-05-13 2019-12-09 삼성전자주식회사 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
US8731949B2 (en) * 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05114863A (ja) * 1991-08-27 1993-05-07 Sony Corp 高能率符号化装置及び復号化装置
JPH0591061A (ja) * 1991-09-30 1993-04-09 Sony Corp オーデイオ信号処理方法
JPH09214355A (ja) * 1996-01-30 1997-08-15 Sony Corp 信号符号化方法
RU2224302C2 (ru) * 1997-04-02 2004-02-20 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
RU2289858C2 (ru) * 2002-06-27 2006-12-20 Самсунг Электроникс Ко., Лтд. Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник
US7457742B2 (en) * 2003-01-08 2008-11-25 France Telecom Variable rate audio encoder via scalable coding and enhancement layers and appertaining method
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
US7752041B2 (en) * 2004-05-28 2010-07-06 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding digital signal
US7734053B2 (en) * 2005-12-06 2010-06-08 Fujitsu Limited Encoding apparatus, encoding method, and computer product
JP5114863B2 (ja) * 2006-04-11 2013-01-09 横浜ゴム株式会社 空気入りタイヤおよび空気入りタイヤの組立方法

Also Published As

Publication number Publication date
EP3937168A1 (en) 2022-01-12
AU2016262702B2 (en) 2017-10-19
EP3346465A1 (en) 2018-07-11
JP2014514617A (ja) 2014-06-19
US20120290307A1 (en) 2012-11-15
ZA201309406B (en) 2021-05-26
TWI604437B (zh) 2017-11-01
KR102284106B1 (ko) 2021-07-30
US20160035354A1 (en) 2016-02-04
EP2707874A4 (en) 2014-12-03
JP6726785B2 (ja) 2020-07-22
KR20210011482A (ko) 2021-02-01
KR20120127334A (ko) 2012-11-21
US20170316785A1 (en) 2017-11-02
JP6189831B2 (ja) 2017-08-30
MX345963B (es) 2017-02-28
KR20120127335A (ko) 2012-11-21
TW201705124A (zh) 2017-02-01
WO2012157931A2 (en) 2012-11-22
TW201705123A (zh) 2017-02-01
BR112013029347A2 (pt) 2017-02-07
US9236057B2 (en) 2016-01-12
CN105825858B (zh) 2020-02-14
CN105825859A (zh) 2016-08-03
MY186720A (en) 2021-08-12
EP2707874A2 (en) 2014-03-19
RU2013155482A (ru) 2015-06-20
CN103650038A (zh) 2014-03-19
SG194945A1 (en) 2013-12-30
WO2012157931A3 (en) 2013-01-24
CA2836122A1 (en) 2012-11-22
AU2018200360A1 (en) 2018-02-08
CA2836122C (en) 2020-06-23
KR20220004778A (ko) 2022-01-11
JP2019168699A (ja) 2019-10-03
RU2018108586A3 (ru) 2019-04-24
US20160099004A1 (en) 2016-04-07
KR20200143332A (ko) 2020-12-23
AU2012256550B2 (en) 2016-08-25
JP2017194690A (ja) 2017-10-26
TWI576829B (zh) 2017-04-01
KR102409305B1 (ko) 2022-06-15
KR20190139172A (ko) 2019-12-17
MX337772B (es) 2016-03-18
MX2013013261A (es) 2014-02-20
US10276171B2 (en) 2019-04-30
US9711155B2 (en) 2017-07-18
KR102193621B1 (ko) 2020-12-21
KR20190138767A (ko) 2019-12-16
TW201250672A (en) 2012-12-16
KR102053899B1 (ko) 2019-12-09
KR102491547B1 (ko) 2023-01-26
EP2707875A2 (en) 2014-03-19
EP3385949A1 (en) 2018-10-10
AU2018200360B2 (en) 2019-03-07
US10109283B2 (en) 2018-10-23
RU2018108586A (ru) 2019-02-26
CN105825858A (zh) 2016-08-03
US9159331B2 (en) 2015-10-13
WO2012157932A3 (en) 2013-01-24
TWI562132B (en) 2016-12-11
US20120288117A1 (en) 2012-11-15
EP2707875A4 (en) 2015-03-25
CN103650038B (zh) 2016-06-15
MY164164A (en) 2017-11-30
KR102209073B1 (ko) 2021-01-28
TW201715512A (zh) 2017-05-01
AU2012256550A1 (en) 2014-01-16
AU2016262702A1 (en) 2016-12-15
BR112013029347B1 (pt) 2021-05-11
CN105825859B (zh) 2020-02-14
TWI562133B (en) 2016-12-11
US20180012605A1 (en) 2018-01-11
TW201301264A (zh) 2013-01-01
US9773502B2 (en) 2017-09-26
WO2012157932A2 (en) 2012-11-22
TWI606441B (zh) 2017-11-21
RU2705052C2 (ru) 2019-11-01
US20170061971A1 (en) 2017-03-02
KR102053900B1 (ko) 2019-12-09
US9489960B2 (en) 2016-11-08

Similar Documents

Publication Publication Date Title
RU2648595C2 (ru) Распределение битов, кодирование и декодирование аудио