RU2669706C2 - Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала - Google Patents

Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала Download PDF

Info

Publication number
RU2669706C2
RU2669706C2 RU2017102311A RU2017102311A RU2669706C2 RU 2669706 C2 RU2669706 C2 RU 2669706C2 RU 2017102311 A RU2017102311 A RU 2017102311A RU 2017102311 A RU2017102311 A RU 2017102311A RU 2669706 C2 RU2669706 C2 RU 2669706C2
Authority
RU
Russia
Prior art keywords
subband
subbands
bits
spectrum
encoded information
Prior art date
Application number
RU2017102311A
Other languages
English (en)
Other versions
RU2017102311A (ru
RU2017102311A3 (ru
Inventor
Такуя КАВАСИМА
Хироюки ЭХАРА
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2017102311A publication Critical patent/RU2017102311A/ru
Publication of RU2017102311A3 publication Critical patent/RU2017102311A3/ru
Application granted granted Critical
Publication of RU2669706C2 publication Critical patent/RU2669706C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования. Формируют спектр посредством выполнения преобразования над входным аудиосигналом в частотную область. Разделяют спектр на подполосы, которые являются заданными полосами частот. Получают для каждой из подполос квантованную энергию подполосы. Анализируют тональность спектров подполос и выводят результат анализа. Выбирают вторую подполосу из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы. Определяют первое количество битов, подлежащих выделению первой подполосе, среди подполос. Формируют первую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов. Формируют вторую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона. 8 н. и 6 з.п. ф-лы, 9 ил.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0001]
Настоящее изобретение относится к методике кодирования и методике декодирования для улучшения качества звука аудиосигналов, таких как речевые сигналы и музыкальные сигналы.
УРОВЕНЬ ТЕХНИКИ
[0002]
Методика кодирования для сжатия аудиосигналов на низкой битовой скорости является методикой, важной для осуществления эффективного использования радиоволн и им подобного в мобильной связи. При этом в последнее время увеличивается потребность в улучшении качества звука в телефонной связи, и ожидается реализация услуг телефонной связи, которые будут создавать большее ощущение присутствия. Для реализации таких услуг необходимо кодировать аудиосигналы, имеющие широкую полосу частот, на более высокой битовой скорости. Однако данный подход вступает в противоречие с эффективным использованием радиоволн и полос частот.
[0003]
Теперь в качестве примера будет рассмотрена методика кодирования аудиосигнала, внедренная Стандартом G.719 (NPL 1).
[0004]
В Стандарте G.719, после кодирования аудиосигнала, частотное преобразование выполняется над аудиосигналом, и заданные биты выделяются спектру, полученному в результате частотного преобразования. В частности, спектр разделяется на подполосы, имеющие заданные ширины полос частот, и блок (блок, имеющий необходимое количество битов), используемый при квантовании, на основании квантования вектора решетки выделяется каждой из подполос в порядке убывания энергии следующим образом.
[0005]
(1)
Один блок выделяется подполосе, имеющей самую большую энергию среди всех подполос.
[0006]
Один бит выделяется на спектр. Поэтому, если количество спектральных дискретных отсчетов в подполосе восемь, например, то один блок содержит восемь битов (следует отметить, что максимальное количество битов, которые могут быть выделены на спектр, составляет девять битов, и поэтому, если количество спектральных дискретных отсчетов в подкадре составляет восемь, то может быть выделено вплоть до 72 битов).
[0007]
(2)
Квантованная энергия подполосы той подполосы, которой был выделен один блок, уменьшается на два уровня (6 дБ). Если некоторое количество битов, выделенных подполосе, которой был выделен один блок, превышает максимальное значение (девять битов), то подполоса исключается из квантования в последующих циклах.
[0008]
(3)
Возвращаясь к (1) выше, тот же самый процесс повторяется.
[0009]
На Фиг.6 показана энергия подполосы каждой подполосы. На горизонтальной оси представлена частота, а на вертикальной оси представлена амплитуда в логарифмической шкале. На данном чертеже энергия подполосы каждой подполосы представлена горизонтальной линией вместо точки. Длина каждой горизонтальной линии представляет собой ширину полосы частот каждой подполосы.
[0010]
На Фиг.7 и Фиг.8 показаны схемы, изображающие примеры результатов выделения битов каждой подполосе в случае использования способа кодирования, определенного в Стандарте G.719. На этих чертежах на горизонтальной оси представлена частота, а на вертикальной оси представлено выделенное количество битов. На Фиг.7 показан случай битовой скорости в 128 Кбит/с, а на Фиг.8 показан случай битовой скорости в 64 Кбит/с.
[0011]
В случае 128 Кбит/с для выделения доступен большой запас битов, и поэтому, девять битов, которые являются максимальным значением, могут быть выделены большому количеству подполос (спектрам), и качество аудиосигналов может поддерживаться на высоком уровне.
[0012]
Напротив, в случае 64 Кбит/с никакой подполосе не выделяется девяти битов, которые являются максимальным значением, однако каждой подполосе выделяются некоторые биты. Соответственно, считается, что ухудшение качества аудиосигналов может быть устранено, и может быть реализовано эффективное использование радиоволн и полосы частот.
Список цитируемых документов
Патентная литература
[0013]
PTL 1: Публикация нерассмотренной заявки на патент Японии (перевод заявки PCT) № 2013-534328
PTL 2: Международная публикация № 2005/027095
Непатентная литература
[0014]
NPL 1: Стандарт G.719 ITU-T, 2008
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0015]
Однако необходимо дальнейшее способствование эффективному использованию радиоволн и полос частот. В данном случае, при кодировании аудиосигнала, имеющего частоту дискретизации приблизительно 32 кГц на низкой битовой скорости в 20 Кбит/с или менее посредством использования вышеописанного способа, внедренного Стандартом G.719, оказывается не возможным резервирование блока (некоторого количества битов), используемого при квантовании всех подполос, что является проблемой.
[0016]
На Фиг.9 показана схема, изображающая пример результата выделения битов каждой подполосе в случае использования способа кодирования, определенного в Стандарте G.719, при 20 Кбит/с. Как изображено, выделение битов оказывается безуспешным не только в высокочастотном диапазоне, но также и, в зависимости от ситуации, в низкочастотном диапазоне, который важен для слуха. Следовательно, кодирование спектров в соответствующих подполосах не возможно, что в результате приводит к значительному ухудшению качества аудиосигналов.
[0017]
Для решения такой проблемы может быть использован способ динамического изменения способа выделения битов (PTL 1).
[0018]
Однако способ выделения битов изменяется, в то время как использован единый способ кодирования (способ квантования) без изменения способа кодирования (способа квантования), и поэтому данный подход к ухудшению качества аудиосигналов имеет ограниченное действие.
[0019]
В настоящем изобретении предложена методика кодирования и методика декодирования для реализации высококачественных аудиосигналов с уменьшением общей битовой скорости.
[0020]
Устройство кодирования аудиосигнала согласно настоящему изобретению включает в себя временно-частотный преобразователь, который формирует спектр посредством выполнения преобразования над входным аудиосигналом в частотную область, разделяет спектр на подполосы, которые являются заданными полосами частот, и выводит спектры подполос; квантователь энергии подполосы, который получает, для каждой из подполос, квантованную энергию подполосы; вычислитель тональности, который анализирует тональность спектров подполос и выводит результат анализа; выделитель битов, который выбирает вторую подполосу, для которой квантование выполняется вторым квантователем, из числа упомянутых подполос, на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос, для которой квантование выполняется первым квантователем; и мультиплексор, который мультиплексирует в информацию кодированную информацию, выводимую из первого квантователя и из второго квантователя, квантованную энергию подполосы и результат анализа тональности, и выводит мультиплексированную информацию. Первый квантователь выполняет импульсное кодирование спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов, и второй квантователь кодирует спектр подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона.
[0021]
Следует отметить, что общие или частные варианты осуществления могут быть реализованы в качестве системы, способа, интегральной схемы или компьютерной программы, или любого выборочного сочетания системы, устройства, способа, интегральной схемы и компьютерной программы.
[0022]
С помощью устройства кодирования, устройства декодирования, и так далее согласно настоящему изобретению, возможно кодировать и декодировать высококачественные аудиосигналы с уменьшением общей битовой скорости.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0023]
[Фиг.1] На Фиг.1 показана блок-схема устройства кодирования согласно первому варианту осуществления настоящего изобретения.
[Фиг.2] На Фиг.2 показана подробная блок-схема выделителя битов устройства кодирования согласно первому варианту осуществления настоящего изобретения.
[Фиг.3] На Фиг.3 показана схема для описания функционирования, выполняемого устройством кодирования согласно первому варианту осуществления настоящего изобретения.
[Фиг.4] На Фиг.4 показана блок-схема устройства декодирования согласно второму варианту осуществления настоящего изобретения.
[Фиг.5] На Фиг.5 показана подробная блок-схема выделителя битов устройства декодирования согласно второму варианту осуществления настоящего изобретения.
[Фиг.6] На Фиг.6 показана схема для описания энергии подполосы в устройстве кодирования согласно уровню техники.
[Фиг.7] На Фиг.7 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.
[Фиг.8] На Фиг.8 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.
[Фиг.9] На Фиг.9 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0024]
Далее конфигурации и функционирование в вариантах осуществления настоящего изобретения будут описаны со ссылкой на чертежи. Аудиосигналы, которые являются входными сигналами в устройство кодирования настоящего изобретения и выходными сигналами из устройства декодирования настоящего изобретения, концептуально включают в себя речевые сигналы, музыкальные сигналы, имеющие более широкую полосу, и сигналы, в которых смешаны эти типы сигналов.
[0025]
В настоящем изобретении «входные аудиосигналы» концептуально включают в себя музыкальные сигналы, речевые сигналы, и сигналы, в которых смешаны оба типа сигналов. Термин «квантованная энергия подполосы» означает энергию, полученную посредством квантования энергии подполосы, которая является суммой или средним значением энергии спектров подполос в подполосе, а энергия подполосы может быть получена посредством вычисления суммы квадратов спектров подполос в некоторой подполосе, например. Термин «тональность» означает степень, до которой создается пик спектра в конкретной частотной составляющей, и результат анализа тональности может быть представлен численным значением, кодированием или чем-либо им подобным. Термин «импульсное кодирование» означает кодирование, при котором спектр приблизительно представлен с использованием импульсов.
[0026]
Термин «относительно низкий» означает случай нахождения ниже в результате сравнения между подполосами и соответствует случаю нахождения ниже среднего значения всех подполос или случаю нахождения ниже заданного значения. Термин «подполоса в высокочастотном диапазоне» означает подполосу, которая расположена ближе к высокочастотной стороне среди множества подполос.
[0027]
Следует отметить, что первый квантователь (спектра), второй квантователь (спектра), первый декодер (спектра), второй декодер (спектра), первая подполоса, вторая подполоса, третья подполоса, четвертая подполоса, первое количество битов, второе количество битов, третье количество битов и четвертое количество битов, описанные в вариантах осуществления и формуле изобретения, отличаются друг от друга для обозначения не их порядка, а их категории.
[0028]
(Первый вариант осуществления)
На Фиг.1 показана блок-схема, изображающая конфигурацию и функционирование устройства 100 кодирования аудиосигнала согласно первому варианту осуществления. Устройство 100 кодирования аудиосигнала, изображенное на Фиг.1, включает в себя временно-частотный преобразователь 101, квантователь 102 энергии подполосы, вычислитель 103 тональности, выделитель 104 битов, нормализатор 105, первый квантователь 106 спектра, второй квантователь 107 спектра и мультиплексор 108. С мультиплексором 108 соединена антенна A. Устройство 100 кодирования аудиосигнала и антенна вместе составляют устройство терминала или устройство базовой станции.
[0029]
Временно-частотный преобразователь 101 выполняет преобразование над входным аудиосигналом во временной области в частотную область и формирует спектр входного аудиосигнала (именуемый в дальнейшем «спектром»). Временно-частотное преобразование выполняется посредством использования MDCT (измененного дискретного косинусного преобразования), например, но не ограничено данным преобразованием. Временно-частотное преобразование может быть выполнено посредством использования DCT (дискретного косинусного преобразования), DFT (дискретного преобразования Фурье) или преобразования Фурье, например.
[0030]
Временно-частотный преобразователь 101 разделяет спектр на подполосы, которые являются заданными полосами частот. Заданные полосы частот могут быть расположены на равных интервалах или могут быть расположены на различных интервалах, в частности, на длинных интервалах в высокочастотном диапазоне и на коротких интервалах в низкочастотном диапазоне, например.
[0031]
Временно-частотный преобразователь 101 выводит спектры, полученные делением на подполосы, в квантователь 102 энергии подполосы, в вычислитель 103 тональности и в нормализатор 105 в качестве спектров подполос.
[0032]
Квантователь 102 энергии подполосы получает, для каждой подполосы, энергию подполосы, которая является энергией спектра подполосы, квантует энергию подполосы и получает квантованную энергию подполосы. В частности, энергия подполосы может быть получена посредством вычисления суммы квадратов спектров подполос в подполосе; однако, данное вычисление не ограничивается этим. Энергия подполосы может быть получена посредством выполнения интегрирования над амплитудами спектров подполос для каждой подполосы, например. В случае усреднения энергии подполосы сумма квадратов разделяется на количество спектров (ширины подполосы) в подполосе. Энергия подполосы, полученная таким образом, квантуется в соответствии с заданной шириной шага.
[0033]
Квантователь 102 энергии подполосы выводит полученную квантованную энергию подполосы в нормализатор 105 и в выделитель 104 битов и выводит кодированную квантованную энергию подполосы, полученную посредством кодирования квантованной энергии подполосы, в мультиплексор 108.
[0034]
Вычислитель 103 тональности анализирует спектры подполос, включенные в каждую подполосу, и определяет тональность подполосы. Тональность является степенью, до которой создается пик спектра в конкретной частотной составляющей, и концептуально включает в себя пиковость, что означает, что присутствует заметное пиковое значение. Тональность может быть получена посредством квантования через вычисление соотношения между амплитудой среднего спектра в целевой подполосе и амплитудой максимального спектра, присутствующего в подполосе, например. Считается, что спектры подполос имеют тональность (пиковость), если полученное значение превышает заданную пороговую величину. В данном варианте осуществления вычислитель 103 тональности формирует пиковый/тональный флаг, установленный в единицу, если полученное значение превышает заданное значение, или формирует пиковый/тональный флаг, установленный в ноль, если полученное значение равно или меньше заданной пороговой величины, и выводит пиковый/тональный флаг в выделитель 104 битов и в мультиплексор 108 в качестве результата анализа. Вычислитель 103 тональности может вывести в качестве результата анализа вышеописанное соотношение.
[0035]
Вычислитель тональности функционирует следующим образом.
[0036]
В условиях низкой битовой скорости для эффективного квантования спектра, в котором спектральная энергия распределена по всей подполосе, в частности, шумоподобного спектра, эффективен способ на основании фильтра основного тона (то есть способ, в котором спектр высокочастотного диапазона выражается посредством использования спектра низкочастотного диапазона). Поэтому, степень распределения энергии внутри подполосы определяется из меры пиковости/тональности (соотношения между мощностью пика и средней мощностью или чего-либо тому подобного) спектра в подполосе, и если пиковость/тональность спектра не выше, то подполоса подвергается квантованию на основании фильтра основного тона.
[0037]
Выделитель 104 битов обращается к квантованной энергии подполосы и пиковому/тональному флагу каждой подполосы и выделяет биты из запаса битов, который соответствует общему количеству битов, доступных для кодирования, спектру подполосы в каждой подполосе. В частности, выделитель 104 битов вычисляет и определяет первое количество битов, которое является некоторым количеством битов, подлежащих выделению первым подполосам, которые являются подполосами, для которых квантование выполняется первым квантователем спектра, и выводит результат в первый квантователь 106 спектра в качестве информации о выделенных битах. Дополнительно, выделитель 104 битов выбирает и идентифицирует вторые подполосы, которые являются подполосами, для которых квантование выполняется вторым квантователем 107 спектра, и выводит результат во второй квантователь 107 спектра в качестве режима квантования.
[0038]
Конфигурация и функционирование выделителя 104 битов подробно описаны ниже.
[0039]
Следует отметить, что в данном варианте осуществления выделитель 104 битов обращается к пиковому/тональному флагу и квантованной энергии подполосы каждой подполосы в данном порядке; однако, порядок обращения может быть любым порядком.
[0040]
Относительно вторых подполос, которые подвергаются квантованию вторым квантователем 107 спектра, подполосы во всей полосе могут быть потенциальными вторыми подполосами. В целом, полоса, имеющая низкую квантованную энергию подполосы, и полоса, имеющая низкую тональность, главным образом, присутствуют в высокочастотном диапазоне, и, поэтому, целевыми могут быть только подполосы, присутствующие в конкретном высокочастотном диапазоне. Например, только четыре или пять подполос в высокочастотном диапазоне могут быть целевыми.
[0041]
Аудиосигнал обычно имеет более высокую тональность в низкочастотном диапазоне и низкую тональность в высокочастотном диапазоне, и поэтому подполосы в высокочастотном диапазоне по существу подвергаются квантованию на основании фильтра основного тона. Соответственно, может использоваться альтернативный способ, в котором все подполосы в более высоком частотном диапазоне по сравнению с подполосой, выбранной на основании тональности, могут быть подвергнуты квантованию на основании фильтра основного тона, и в качестве режима квантования могут быть переданы только номера подполос.
[0042]
Нормализатор 105 нормализует (разделяет) каждый спектр подполосы по входной квантованной энергии подполосы для формирования нормализованного спектра подполосы. В результате разность в амплитудах амплитуды между подполосами нормализуется. Нормализатор 105 выводит нормализованный спектр подполосы в первый квантователь 106 спектра и во второй квантователь 107 спектра.
[0043]
Следует отметить, что нормализатор 105 может иметь любую конфигурацию.
[0044]
Несмотря на то, что нормализатор 105 выполнен в виде одного компонента в данном варианте осуществления, нормализатор 105 может быть выполнен в предыдущем каскаде первого квантователя 106 спектра и в предыдущем каскаде второго квантователя 107 спектра, то есть может быть выполнен в виде двух компонентов.
[0045]
Первый квантователь 106 спектра является примером первого квантователя и квантует спектры подполос, принадлежащие первым подполосам, для которых квантование должно быть выполнено первым квантователем 106 спектра, среди входных нормализованных спектров подполос посредством использования первого количества битов, выделенных выделителем 104 битов. Первый квантователь 106 спектра выводит результат квантования во второй квантователь 107 спектра в качестве квантованных спектров и выводит первую кодированную информацию, полученную посредством кодирования квантованных спектров, в мультиплексор 108.
[0046]
Первый квантователь 106 спектра использует импульсный кодер. Примеры импульсного кодера включают в себя квантователь вектора решетки, который выполняет квантование вектора решетки, и импульсный кодер, который выполняет импульсное кодирование, при котором спектр подполосы приблизительно представлен малым количеством импульсов. То есть любой квантователь может использоваться, пока квантователь использует способ квантования, подходящий для квантования спектра, имеющего высокую тональность, или способ квантования с использованием малого количества импульсов.
[0047]
Следует отметить, что при чрезвычайно низкой битовой скорости, более высокий результат от поддержания качества звука может ожидаться при помощи квантования с использованием импульсного кодирования, при котором спектр подполосы приблизительно представлен малым количеством импульсов в сравнении с квантованием вектора решетки.
[0048]
Второй квантователь 107 спектра является примером второго квантователя и может использовать способ квантования с использованием расширенной полосы (модель предсказания с использованием фильтра основного тона), как описано ниже, например.
[0049]
В данном случае, фильтр основного тона является блоком обработки, который выполняет обработку, представленную выражением 1 ниже.
[0050]
[Уравнение 1]
y[i]=x[i]+β×y[i-T]
[0051]
В общем случае, фильтр основного тона относится к фильтру, который выделяет цикл (T) основного тона для сигнала на оси времени (выделяет составляющую основного тона на оси частоты) и является, например, цифровым фильтром, представленным выражением 1 для дискретного сигнала x[i], если количество отводов составляет один. Однако фильтр основного тона в данном варианте осуществления задан в качестве блока обработки, который выполняет обработку, представленную выражением 1, и не выполняет обязательно выделение основного тона на сигнале на оси времени.
[0052]
В данном варианте осуществления фильтр основного тона (блок обработки, представленный выражением 1) применяется к последовательности Mq[i] MDCT-коэффициентов квантования. В частности, в выражении 1 выполнены установки, в частности, x[i]=0 (i≥K, где K является нижней граничной частотой MDCT-коэффициента, который подвергнут кодированию) и y[i]=Mq[i] (i<K), и вычисляется y [i] (K≤i≤Kʹ, где Kʹ является верхней граничной частотой MDCT-коэффициента, который подвергнут кодированию). Значение T, с помощью которого минимизируется ошибка между MDCT-коэффициентом Mt[i], который подвергнут кодированию, и вычисленным y[i], кодируется в качестве информации о запаздывании. Такое кодирование спектра на основании фильтра основного тона раскрыто в PTL 2, например.
[0053]
Второй квантователь 107 спектра относится к режиму квантования и идентифицирует вторые подполосы (нормализованные спектры подполос), для которых квантование должно быть выполнено вторым квантователем 107 спектра. В результате, идентифицируются значения вышеописанных K и Kʹ. Затем, осуществляется поиск подполосы или полосы квантованного спектра, для которой нормализованный спектр подполосы (соответствующий вышеописанному Mt[i], где K≤i≤Kʹ), относящийся к идентифицированным вторым подполосам (частоте в диапазоне от K до Kʹ), имеет максимальную корреляцию с квантованным спектром (соответствующим вышеописанному Mq[i], где i<K), и положение подполосы или полосы используется для формирования информации о запаздывании (соответствующей вышеописанному T). Примеры информации о запаздывании включают в себя абсолютное положение или относительное положение подполосы или полосы, или номер подполосы. Второй квантователь 107 спектра кодирует и выводит информацию о запаздывании в мультиплексор 108 в качестве второй кодированной информации.
[0054]
Следует отметить, что в данном варианте осуществления кодированная квантованная энергия подполосы мультиплексируется и передается мультиплексором 108, а коэффициент усиления может быть сформирован декодером. Поэтому коэффициент усиления не кодируется. Однако коэффициент усиления может быть кодирован и передан. В данном случае, вычисляется коэффициент усиления между вторыми подполосами, для которых должно быть выполнено квантование, и подполосой квантованного спектра, который имеет максимальную корреляцию, и второй квантователь 107 спектра кодирует и выводит информацию о запаздывании и коэффициент усиления в мультиплексор 108 в качестве второй кодированной информации.
[0055]
Следует отметить, что в общем случае ширина полосы пропускания подполосы в высокочастотном диапазоне устанавливается шире подполосы в низкочастотном диапазоне. Однако, некоторые подполосы в низкочастотном диапазоне, подвергающиеся копированию, имеют низкую энергию и не могут быть подвергнуты квантованию вектора решетки. В данном случае, может предполагаться, что такие подполосы являются нулевыми спектрами, или могут быть добавлены помехи, чтобы избежать внезапного изменения спектра между подполосами.
[0056]
Мультиплексор 108 мультиплексирует и выводит квантованную энергию подполосы, первую кодированную информацию, вторую кодированную информацию и пиковые/тональные флаги в антенну в качестве кодированной информации.
[0057]
Антенна A передает кодированную информацию в устройство декодирования аудиосигнала. Кодированная информация достигает устройства декодирования аудиосигнала через различные узлы и базовые станции.
[0058]
Теперь ниже подробно описан выделитель 104 битов.
[0059]
На Фиг.2 показана блок-схема, изображающая подробную конфигурацию и функционирование выделителя 104 битов устройства 100 кодирования аудиосигнала согласно первому варианту осуществления. Выделитель 104 битов, изображенный на Фиг.2, включает в себя резервуар 111 битов, резервуар 112 битов, вычислитель 113 выделения битов и определитель 114 режима квантования.
[0060]
Резервуар 111 битов обращается к пиковым/тональным флагам, которые выводятся из вычислителя 103 тональности, и резервирует некоторое количество битов, необходимое для второго квантования спектра, выполняемого вторым квантователем 107 спектра, если какой-либо из пиковых/тональных флагов установлен нулевым.
[0061]
В данном варианте осуществления количество битов, необходимых для кодирования информации о запаздывании, резервируется на основании фильтра основного тона. Зарезервированное количество битов исключается из запаса битов, который соответствует общему количеству битов, доступных для квантования, и оставшийся запас битов выводится в резервуар 112 битов. Следует отметить, что запас битов поставляется квантователем 102 энергии подполосы, что означает, что биты, которые остаются после исключения количества битов, необходимых для переменного кодирования квантованной энергии подполосы, доступны первому квантователю 106 спектра, второму квантователю 107 спектра и для квантования (кодирования) пиковых/тональных флагов. Квантователь 102 энергии подполосы не формирует обязательно информацию о запасе битов.
[0062]
Резервуар 112 битов резервирует количество битов, используемых для пиковых/тональных флагов. В данном варианте осуществления пиковые/тональные флаги передаются посредством использования пяти подполос в высокочастотном диапазоне, и поэтому, резервуар 112 битов резервирует пять битов, например.
[0063]
Резервуар 112 битов выводит, в вычислитель 113 выделения битов, который находится в адаптивном выделителе битов, количество битов, которые остаются после исключения количества битов, зарезервированных резервуаром 112 битов, из запаса битов, введенного из резервуара 111 битов. Сумма количества битов, зарезервированных резервуаром 111 битов, и количества битов, зарезервированных резервуаром 112 битов, соответствует третьему количеству битов. Подполоса, для которой пиковый/тональный флаг установлен нулевым, соответствует третьей подполосе.
[0064]
Следует отметить, что порядок резервуара 111 битов и резервуара 112 битов может быть изменен. В данном варианте осуществления резервуар 111 битов и резервуар 112 битов являются отдельными блоками; однако, действия этих резервуаров могут быть выполнены одновременно в единственном блоке. Альтернативно, действия могут быть выполнены внутри вычислителя 113 выделения битов.
[0065]
Вычислитель 113 выделения битов вычисляет выделение битов для подполосы, для которых квантование выполняется первым квантователем 106 спектра. В частности, вычислитель 113 выделения битов сначала выделяет количество битов, выведенных из резервуара 112 битов, каждой подполосе с обращением к квантованной энергии подполосы. Выделение выполняется с помощью способа, описанного в разделе с уровнем техники, в котором определение в отношении того, важна ли подполоса для слуха, выполняется на основании амплитуды квантованной энергии подполосы, и подполосе, которая определена важной, отдается приоритет, и выделение битов выполняется на данной подполосе. В результате подполосе, имеющей квантованную энергию подполосы, равную нулю, ниже нуля или ниже заданного значения, никаких битов не выделяется.
[0066]
После выделения вычислитель 113 выделения битов обращается к введенным пиковым/тональным флагам и исключает подполосы (третьи подполосы), для которых пиковые/тональные флаги установлены нулевыми, из выделения битов. То есть вычислитель 113 выделения битов идентифицирует только подполосы, имеющие высокую пиковость (подполосы, для которых пиковые/тональные флаги установлены в единицу), в качестве целевых подполос для выделения битов и выделяет биты подполосам. Вычислитель 113 выделения битов идентифицирует подполосы (первые подполосы), которым биты должны быть выделены, создает информацию о выделенных битах, которая указывает количество битов, подлежащих выделению подполосам, и выводит эту информацию в определитель 114 режима квантования сначала.
[0067]
Определитель 114 режима квантования принимает информацию о выделенных битах, выводимую из вычислителя 113 выделения битов, и пиковые/тональные флаги. В случае, при котором присутствует подполоса в высокочастотном диапазоне, которая имеет высокую тональность (которая подвергается квантованию первым квантователем 106 спектра) и которой никаких битов выделено не было, определитель 114 режима квантования повторно задает подполосу в качестве некоторой подполосы (четвертой подполосы), для которой квантование выполняется вторым квантователем 107 спектра, и выводит количество битов (четвертое количество битов), необходимых для квантования вторым квантователем спектра, в вычислитель 113 выделения битов для вычитания этого количества битов из информации о выделенных битах. То есть определитель 114 режима квантования выделяет количество битов, необходимое для квантования вторым квантователем 107 спектра, интересующей полосе и выводит это количество выделенных битов (четвертое количество битов). Альтернативно, определитель 114 режима квантования может вычесть это количество выделенных битов из запаса битов, доступного первому квантователю 106 спектра, и вывести результат в вычислитель 113 выделения битов.
[0068]
Определитель 114 режима квантования идентифицирует подполосы, для которых квантование выполняется вторым квантователем 107 спектра, и выводит результат во второй квантователь 107 спектра в качестве режима квантования. В частности, определитель 114 режима квантования задает подполосы (третьи подполосы) в высокочастотном диапазоне, которые имеют низкую тональность (для которой пиковые/тональные флаги установлены нулевыми), и подполосы (четвертые подполосы) в высокочастотном диапазоне, которым никаких битов выделено не было, в качестве подполос (вторых подполос), для которых квантование выполняется вторым квантователем 107 спектра, и выводит эти подполосы в качестве режима квантования.
[0069]
Вновь вычислитель 113 выделения битов обновляет запас битов посредством вычитания количества битов (четвертого количества битов), принятых от определителя 114 режима квантования, из количества битов (запаса битов), введенных от резервуара 112 битов, и повторно вычисляет выделение битов для подполосы, для которой квантование выполняется первым квантователем 106 спектра. В случае приема обновленного запаса битов от определителя режима квантования вычислитель 113 выделения битов повторно вычисляет выделение битов для подполосы, для которой квантование выполняется первым квантователем 106 спектра, посредством использования обновленного запаса битов. Следовательно, первое количество битов равно значению, полученному посредством вычитания третьего количества битов и четвертого количества битов из общего количества битов (запаса битов).
[0070]
Вычислитель 113 выделения битов выводит количество битов (первое количество битов), полученное после повторного вычисления, и информацию о подполосах (первых подполосах), для которых квантование выполняется первым квантователем 106 спектра, в первый квантователь спектра 106 в этот раз в качестве информации о выделенных битах.
[0071]
В случае, при котором повторное вычисление не нужно выполнять, потому что всем подполосам выделены биты в результате первого вычисления выделения битов вычислителем 113 выделения битов, например, вычислитель 113 выделения битов может вывести информацию о выделенных битах непосредственно в первый квантователь 106 спектра.
[0072]
На Фиг.3 показана блок-схема последовательности операций способа функционирования, выполняемого устройством 100 кодирования аудиосигнала согласно первому варианту осуществления, в частности, функционирование, выполняемое выделителем 104 битов.
[0073]
Сначала выделитель 104 битов получает квантованную энергию подполосы от квантователя 102 энергии подполосы (S1).
[0074]
Затем, выделитель 104 битов получает пиковые/тональные флаги в высокочастотном диапазоне от вычислителя 103 тональности (S2).
[0075]
Выделитель 104 битов после этого идентифицирует подполосы (третьи подполосы), для которых квантование должно быть выполнено вторым квантователем 107 спектра, на основании пиковых/тональных флагов, и резервуар 111 битов и резервуар 112 битов резервируют там биты (третье количество битов), используемые при квантовании вторым квантователем 107 спектра (S3).
[0076]
Вычислитель 113 выделения битов в выделителе 104 битов определяет количество битов, подлежащих выделению подполосам, которые подвергаются квантованию первым квантователем 106 спектра, на основании квантованной энергии подполосы (S4).
[0077]
Определитель 114 режима квантования в выделителе 104 битов проверяет данное количество битов, выделенных подполосам в высокочастотном диапазоне, определенном вычислителем 113 выделения битов, снова идентифицирует подполосы (вторые подполосы), для которых квантование должно быть выполнено вторым квантователем 107 спектра, в качестве необходимых, и обновляет запас битов для первого квантователя 106 подполосы (S5).
[0078]
Наконец, вычислитель 113 выделения битов в выделителе 104 битов повторно вычисляет выделение битов (первое количество битов) для первого квантователя 106 спектра посредством использования обновленного запаса битов (S6).
[0079]
С помощью устройства кодирования аудиосигнала согласно данному варианту осуществления возможно реализовать кодирование высококачественных аудиосигналов с уменьшением общей битовой скорости.
[0080]
В частности, с помощью конфигураций и функционирования на Фиг.2 и Фиг.3, возможно реализовать выделение битов, которое не создает подполосу, для которых квантование не выполняется (количество выделенных битов становится нулевым) в высокочастотном диапазоне, в котором ширина подполосы особенно широка, и которое максимизирует количество подполос, для которых квантование выполняется первым квантователем. Соответственно, возможно реализовать адаптивное выделение битов, которое может достигать лучшей производительности при ограниченной битовой скорости.
[0081]
(Второй вариант осуществления)
На Фиг.4 показана блок-схема, изображающая конфигурацию и функционирование устройства декодирования 200 аудиосигнала согласно второму варианту осуществления. Устройство декодирования 200 аудиосигнала, изображенное на Фиг.4, включает в себя демультиплексор 201, декодер 202 энергии подполосы, выделитель 203 битов, первый декодер 204 спектра, второй декодер 205 спектра, денормализатор 206 и частотно-временной преобразователь 207. С демультиплексором 201 соединена антенна A. Устройство декодирования 200 аудиосигнала и антенна вместе составляют устройство терминала или устройство базовой станции.
[0082]
Демультиплексор 201 принимает кодированную информацию, принятую антенной A, и демультиплексирует кодированную информацию в кодированную квантованную энергию подполосы, первую кодированную информацию, вторую кодированную информацию и пиковые/тональные флаги. Демультиплексор 201 выводит кодированную квантованную энергию подполосы в декодер 202 энергии подполосы, первую кодированную информацию в первый декодер 204 спектра, вторую кодированную информацию во второй декодер 205 спектра и пиковые/тональные флаги в выделитель 203 битов.
[0083]
Декодер 202 энергии подполосы декодирует кодированную квантованную энергию подполосы, формирует декодированную квантованную энергию подполосы и выводит декодированную квантованную энергию подполосы в выделитель 203 битов и в денормализатор 206.
[0084]
Выделитель 203 битов обращается к декодированной квантованной энергии подполосы каждой подполосы и пиковым/тональным флагам и определяет выделение битов, которые выделены первым декодером 204 спектра, и битов, которые выделены вторым декодером 205 спектра. В частности, выделитель 203 битов определяет количество битов (первое количество битов), подлежащих выделению при декодировании первой кодированной информации первым декодером 204 спектра, и подполосы (первые подполосы), которым выделены биты, и выводит результат в качестве информации о выделенных битах. Дополнительно, выделитель 203 битов идентифицирует и выбирает подполосы (вторые подполосы), для которых вторая кодированная информация должна быть декодирована вторым декодером 205 спектра, и выводит результат во второй декодер 205 спектра в качестве режима квантования.
[0085]
Выделитель 203 битов имеет ту же самую конфигурацию и выполняет тоже самое действие, что и выделитель 104 битов, изображенный на Фиг.5 и описанный в описании устройства кодирования. Поэтому, за подробностями функционирования следует обращаться к описанию выделителя 104 битов в устройстве кодирования.
[0086]
Первый декодер 204 спектра декодирует первую кодированную информацию посредством использования первого количества битов, указанных информацией о выделенных битах, формирует первый декодированный спектр и выводит первый декодированный спектр во второй декодер 205 спектра.
[0087]
Второй декодер 205 спектра использует первый декодированный спектр для подполос, идентифицированных с помощью режима квантования, декодирует вторую кодированную информацию, формирует второй декодированный спектр, формирует восстановленный спектр посредством объединения второго декодированного спектра с первым декодированным спектром и выводит восстановленный спектр.
[0088]
Денормализатор 206 регулирует амплитуду (коэффициент усиления) восстановленного спектра c обращением к декодированной квантованной энергии подполосы и выводит результат в частотно-временной преобразователь 207.
[0089]
Частотно-временной преобразователь 207 преобразовывает восстановленный спектр в частотной области в выходной аудиосигнал во временной области и выводит выходной аудиосигнал. Примеры частотно-временного преобразования включают в себя преобразование, которое является обратным преобразованию, описанному в описании частотно-временного преобразования.
[0090]
С помощью устройства декодирования аудиосигнала согласно данному варианту осуществления возможно реализовать декодирование высококачественных аудиосигналов с уменьшением общей битовой скорости.
[0091]
(Заключение)
Устройство кодирования аудиосигнала и устройство декодирования аудиосигнала согласно настоящему изобретению были описаны в первом и втором вариантах осуществления. Устройство кодирования и устройство декодирования согласно настоящему изобретению могут концептуально быть выполнены в виде промежуточного изделия или некоторого компонента, в частности, системной платы или полупроводникового устройства, или в виде готового изделия, такого как устройство терминала или устройство базовой станции. В случае, при котором устройство кодирования и устройство декодирования согласно настоящему изобретению выполнены в виде промежуточного изделия или компонента, устройство кодирования и устройство декодирования объединяются с антенной, DA/AD-преобразователем, усилителем, громкоговорителем, микрофоном и так далее для образования готового изделия.
[0092]
Следует отметить, что в блок-схемах на Фиг.1, Фиг.2, Фиг.4 и Фиг.5 показаны конфигурации и функционирование (способы) исключительно разработанных устройств и могут быть применимы к случаю, при котором программа для выполнения функционирования (способов) настоящего изобретения устанавливается на аппаратном устройстве общего назначения и исполняется процессором, чтобы тем самым реализовать данное функционирование (способы). Примеры аппаратного устройства общего назначения, которое является вычислительным устройством, включают в себя различные портативные информационные терминалы, такие как персональный компьютер и смартфон, и различные портативные телефоны.
[0093]
Примеры исключительно разработанных устройств включают в себя не только готовые изделия (потребительские электронные изделия), такие как переносной телефон и стационарный телефон, но также и промежуточные изделия и компоненты, такие как системная плата и полупроводниковое устройство.
Промышленная применимость
[0094]
Устройство кодирования аудиосигнала и устройство декодирования аудиосигнала согласно настоящему изобретению применимы в устройстве или компоненте, участвующих в записи, передаче и воспроизведении аудиосигналов.
Список условных обозначений
[0095]
100 устройство кодирования аудиосигнала
101 временно-частотный преобразователь
102 квантователь энергии подполосы
103 вычислитель тональности
104 выделитель битов
105 нормализатор
106 первый квантователь спектра
107 второй квантователь спектра
108 мультиплексор
111 резервуар битов
112 резервуар битов
113 вычислитель выделения битов
114 определитель режима квантования
200 устройство декодирования аудиосигнала
201 демультиплексор
202 декодер энергии подполосы
203 выделитель битов
204 первый декодер спектра
205 второй декодер спектра
206 денормализатор
207 частотно-временной преобразователь
211 резервуар битов
212 резервуар битов
213 вычислитель выделения битов
214 определитель режима квантования

Claims (51)

1. Устройство кодирования аудиосигнала, содержащее:
временно-частотный преобразователь, который формирует спектр посредством выполнения преобразования над входным аудиосигналом в частотную область, разделяет спектр на подполосы, которые являются заданными полосами частот, и выводит спектры подполос;
квантователь энергии подполосы, который получает для каждой из подполос квантованную энергию подполосы;
вычислитель тональности, который анализирует тональность спектров подполос и выводит результат анализа;
выделитель битов, который выбирает вторую подполосу, для которой квантование выполняется вторым квантователем, из числа упомянутых подполос, на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе среди упомянутых подполос, для которой квантование выполняется первым квантователем; и
мультиплексор, который мультиплексирует в информацию кодированную информацию, выводимую из первого квантователя и из второго квантователя, квантованную энергию подполосы и результат анализа тональности и выводит мультиплексированную информацию, при этом
первый квантователь выполняет импульсное кодирование спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов, и
второй квантователь кодирует спектр подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона.
2. Устройство кодирования аудиосигнала по п.1, в котором выделитель битов выбирает вторую подполосу из числа упомянутых подполос, которые находятся в высокочастотном диапазоне.
3. Устройство кодирования аудиосигнала по п.2, в котором выделитель битов выбирает подполосу среди упомянутых подполос, в которой тональность ниже заданной пороговой величины, в качестве второй подполосы.
4. Устройство кодирования аудиосигнала по п.2, в котором выделитель битов выбирает подполосу среди подполос, у которой квантованная энергия подполосы равна нулю или ниже заданного значения, в качестве второй подполосы.
5. Устройство кодирования аудиосигнала по п.1, в котором выделитель битов определяет первое количество битов посредством вычитания второго количества битов, подлежащих выделению второй подполосе, из общего количества битов, доступных для квантования.
6. Устройство кодирования аудиосигнала по п.5, в котором выделитель битов вычисляет третье количество битов среди общего количества битов, подлежащих выделению третьей подполосе, выбранной из числа упомянутых подполос на основании результата анализа тональности,
выбирает в качестве четвертой подполосы подполосу среди упомянутых подполос, которой не выделено никакого бита, когда количество битов, полученных посредством вычитания третьего количества битов из общего количества битов, выделены первой подполосе на основании квантованной энергии подполосы, и вычисляет четвертое количество битов, подлежащих выделению, в случае, при котором кодирование выполняется на четвертой подполосе вторым квантователем, и
выбирает третью подполосу и четвертую подполосу в качестве других вторых подполос, для которых квантование выполняется вторым квантователем, и определяет количество битов, полученных посредством вычитания третьего количества битов и четвертого количества битов из общего количества битов, в качестве первого количества битов, подлежащих выделению первой подполосе, для которой квантование выполняется первым квантователем.
7. Устройство кодирования аудиосигнала по п.1, в котором результат анализа от вычислителя тональности выводится в качестве флага, указывающего, превышает ли тональность заданную пороговую величину.
8. Устройство декодирования аудиосигнала для декодирования кодированной информации, выводимой из устройства кодирования аудиосигнала, при этом устройство декодирования аудиосигнала содержит:
демультиплексор, который демультиплексирует кодированную информацию в первую кодированную информацию, вторую кодированную информацию, квантованную энергию подполосы, полученную посредством квантования энергии каждой подполосы среди подполос, и результат анализа тональности, вычисленный для каждой подполосы среди упомянутых подполос;
выделитель битов, который выбирает вторую подполосу, для которой декодирование выполняется вторым декодером, из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос, для которых декодирование выполняется первым декодером; и
частотно-временной преобразователь, который формирует и выводит выходной аудиосигнал посредством выполнения преобразования над спектром, выводимым из второго декодера во временную область, при этом
первый декодер формирует первый декодированный спектр посредством декодирования первой кодированной информации с использованием первого количества битов, и
второй декодер формирует второй декодированный спектр посредством декодирования второй кодированной информации и формирует восстановленный спектр посредством выполнения декодирования с использованием второго декодированного спектра и первого декодированного спектра.
9. Устройство терминала, содержащее:
устройство кодирования аудиосигнала по п.1 и
антенну, которая передает кодированную информацию.
10. Устройство базовой станции, содержащее:
устройство кодирования аудиосигнала по п.1 и
антенну, которая передает кодированную информацию.
11. Устройство терминала, содержащее:
антенну, которая принимает и выводит в демультиплексор кодированную информацию; и
устройство декодирования аудиосигнала по п.8.
12. Устройство базовой станции, содержащее:
антенну, которая принимает и выводит в демультиплексор кодированную информацию; и
устройство декодирования аудиосигнала по п.8.
13. Способ кодирования аудиосигнала, содержащий этапы, на которых:
формируют спектр посредством выполнения преобразования над входным аудиосигналом в частотную область;
разделяют спектр на подполосы, которые являются заданными полосами частот, и выводят спектры подполос;
получают для каждой из подполос квантованную энергию подполосы;
анализируют тональность спектров подполос и выводят результат анализа;
выбирают вторую подполосу из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы;
определяют первое количество битов, подлежащих выделению первой подполосе, среди подполос;
формируют первую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов;
формируют вторую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона; и
мультиплексируют вместе и выводят первую кодированную информацию и вторую кодированную информацию.
14. Способ декодирования аудиосигнала для декодирования кодированной информации, выводимой из устройства кодирования аудиосигнала, причем способ декодирования аудиосигнала содержит этапы, на которых:
демультиплексируют кодированную информацию в первую кодированную информацию, вторую кодированную информацию, квантованную энергию подполосы, полученную посредством квантования энергии каждой подполосы среди подполос, и результат анализа тональности, вычисленный для каждой подполосы среди упомянутых подполос;
выбирают вторую подполосу из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы;
определяют первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос;
формируют первый декодированный спектр посредством декодирования первой кодированной информации с использованием первого количества битов;
формируют второй декодированный спектр посредством декодирования второй кодированной информации и формируют восстановленный спектр посредством выполнения декодирования с использованием второго декодированного спектра и первого декодированного спектра; и
формируют и выводят выходной аудиосигнал посредством выполнения преобразования для восстановленного спектра во временную область.
RU2017102311A 2014-07-25 2015-07-03 Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала RU2669706C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462028805P 2014-07-25 2014-07-25
US62/028,805 2014-07-25
JP2014219214 2014-10-28
JP2014-219214 2014-10-28
PCT/JP2015/003358 WO2016013164A1 (ja) 2014-07-25 2015-07-03 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法

Publications (3)

Publication Number Publication Date
RU2017102311A RU2017102311A (ru) 2018-08-27
RU2017102311A3 RU2017102311A3 (ru) 2018-08-27
RU2669706C2 true RU2669706C2 (ru) 2018-10-15

Family

ID=55162710

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017102311A RU2669706C2 (ru) 2014-07-25 2015-07-03 Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала

Country Status (13)

Country Link
US (3) US10311879B2 (ru)
EP (3) EP3723086A1 (ru)
JP (1) JP6717746B2 (ru)
KR (1) KR102165403B1 (ru)
CN (2) CN114023341A (ru)
AU (1) AU2015291897B2 (ru)
BR (1) BR112017000629B1 (ru)
CA (1) CA2958429C (ru)
MX (1) MX356371B (ru)
PL (2) PL3413307T3 (ru)
RU (1) RU2669706C2 (ru)
SG (1) SG11201701197TA (ru)
WO (1) WO2016013164A1 (ru)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312278B (zh) 2014-03-03 2023-08-15 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
WO2015162500A2 (ko) 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CA3145045A1 (en) * 2019-07-08 2021-01-14 Voiceage Corporation Method and system for coding metadata in audio streams and for flexible intra-object and inter-object bitrate adaptation
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
WO2007011657A2 (en) * 2005-07-15 2007-01-25 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7627469B2 (en) * 2004-05-28 2009-12-01 Sony Corporation Audio signal encoding apparatus and audio signal encoding method
WO2011086924A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 音声符号化装置および音声符号化方法
RU2012120850A (ru) * 2008-01-04 2013-12-10 Долби Интернэшнл Аб Аудиокодер и декодер

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
US7389227B2 (en) * 2000-01-14 2008-06-17 C & S Technology Co., Ltd. High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
AU2007332508B2 (en) * 2006-12-13 2012-08-16 Iii Holdings 12, Llc Encoding device, decoding device, and method thereof
JP5403949B2 (ja) 2007-03-02 2014-01-29 パナソニック株式会社 符号化装置および符号化方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
CN101853663B (zh) * 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
CN102194458B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 频带复制方法、装置及音频解码方法、系统
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US8660195B2 (en) * 2010-08-10 2014-02-25 Qualcomm Incorporated Using quantized prediction memory during fast recovery coding
PL2916318T3 (pl) 2012-11-05 2020-04-30 Panasonic Intellectual Property Corporation Of America Urządzenie do kodowania dźwięku mowy, urządzenie do dekodowania dźwięku mowy, sposób kodowania dźwięku mowy oraz sposób dekodowania dźwięku mowy
MX341885B (es) * 2012-12-13 2016-09-07 Panasonic Ip Corp America Dispositivo de codificacion de sonido de voz, dispositivo de decodificacion de sonido de voz, metodo de codificacion de sonido de voz y metodo de decodificacion de sonido de voz.
EP2981961B1 (en) * 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
DK2981958T3 (en) * 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
CN111710342B (zh) 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
US7627469B2 (en) * 2004-05-28 2009-12-01 Sony Corporation Audio signal encoding apparatus and audio signal encoding method
WO2007011657A2 (en) * 2005-07-15 2007-01-25 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
RU2012120850A (ru) * 2008-01-04 2013-12-10 Долби Интернэшнл Аб Аудиокодер и декодер
WO2011086924A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 音声符号化装置および音声符号化方法

Also Published As

Publication number Publication date
PL3174050T3 (pl) 2019-04-30
RU2017102311A (ru) 2018-08-27
EP3174050A1 (en) 2017-05-31
AU2015291897A1 (en) 2017-03-09
US20170069328A1 (en) 2017-03-09
AU2015291897B2 (en) 2019-02-21
WO2016013164A1 (ja) 2016-01-28
EP3413307A1 (en) 2018-12-12
KR102165403B1 (ko) 2020-10-14
BR112017000629B1 (pt) 2021-02-17
CN106133831A (zh) 2016-11-16
EP3174050B1 (en) 2018-11-14
CA2958429C (en) 2020-03-10
EP3723086A1 (en) 2020-10-14
US20200219518A1 (en) 2020-07-09
US20190228783A1 (en) 2019-07-25
US10643623B2 (en) 2020-05-05
EP3413307B1 (en) 2020-07-15
PL3413307T3 (pl) 2021-01-11
CA2958429A1 (en) 2016-01-28
EP3174050A4 (en) 2017-05-31
KR20170035827A (ko) 2017-03-31
MX2016015786A (es) 2017-02-27
JP6717746B2 (ja) 2020-07-01
US10311879B2 (en) 2019-06-04
CN106133831B (zh) 2021-10-26
SG11201701197TA (en) 2017-03-30
BR112017000629A2 (pt) 2017-11-14
US11521625B2 (en) 2022-12-06
CN114023341A (zh) 2022-02-08
RU2017102311A3 (ru) 2018-08-27
MX356371B (es) 2018-05-25
JPWO2016013164A1 (ja) 2017-04-27

Similar Documents

Publication Publication Date Title
RU2669706C2 (ru) Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала
RU2579663C2 (ru) Устройство кодирования и способ кодирования
EP1939862B1 (en) Encoding device, decoding device, and method thereof
EP2933799B1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
US10446159B2 (en) Speech/audio encoding apparatus and method thereof
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP6957444B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
US20170061977A1 (en) Method and a Decoder for Attenuation of Signal Regions Reconstructed with Low Accuracy