RU2658892C2 - Устройство и способ для расширения диапазона частот для акустических сигналов - Google Patents

Устройство и способ для расширения диапазона частот для акустических сигналов Download PDF

Info

Publication number
RU2658892C2
RU2658892C2 RU2015151169A RU2015151169A RU2658892C2 RU 2658892 C2 RU2658892 C2 RU 2658892C2 RU 2015151169 A RU2015151169 A RU 2015151169A RU 2015151169 A RU2015151169 A RU 2015151169A RU 2658892 C2 RU2658892 C2 RU 2658892C2
Authority
RU
Russia
Prior art keywords
frequency
spectrum
harmonic
low
section
Prior art date
Application number
RU2015151169A
Other languages
English (en)
Other versions
RU2015151169A3 (ru
RU2015151169A (ru
Inventor
Срикантх НАГИСЕТТИ
Цзунсянь ЛЮ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015151169A publication Critical patent/RU2015151169A/ru
Publication of RU2015151169A3 publication Critical patent/RU2015151169A3/ru
Application granted granted Critical
Publication of RU2658892C2 publication Critical patent/RU2658892C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам для расширения диапазона частот для акустических сигналов. Технический результат заключается в повышении эффективности расширения диапазон частот входных сигналов для повышения качества аудио. Настоящее изобретение устанавливается в устройстве, которое расширяет диапазон частот для кодирования и декодирования аудиосигналов. Это новое кодирование расширения диапазона частот идентифицирует составляющую низкочастотного спектра, имеющую наивысшую корреляцию с сигналом высокочастотного диапазона среди входных сигналов, дублирует высокочастотный спектр посредством регулировки энергии упомянутой составляющей и поддерживает гармоническое отношение между низкочастотным спектром и дублированным высокочастотным спектром посредством регулировки положения спектрального пика дублированного высокочастотного спектра на основе гармонической частоты, оцененной из составного низкочастотного спектра. 4 н. и 3 з.п. ф-лы, 14 ил.

Description

Область техники, к которой относится изобретение
[0001] Настоящее изобретение относится к обработке аудиосигналов, и, конкретно, к обработке кодирования и декодирования аудиосигналов для расширения диапазона частот аудиосигналов.
Уровень техники
[0002] В передаче данных, чтобы использовать сетевые ресурсы более эффективно, используются аудиокодеки, чтобы сжимать аудиосигналы при низких битрейтах с приемлемым диапазоном субъективного качества. Соответственно, имеется необходимость в увеличении эффективности сжатия, чтобы преодолевать ограничения битрейта при кодировании аудиосигнала.
[0003] Расширение диапазона частот (BWE) является широко используемым техническим приемом в кодировании аудиосигнала, чтобы эффективно сжимать широкополосные (WB) или суперширокополосные (SWB) аудиосигналы при низком битрейте. При кодировании, BWE параметрически представляет сигнал высокочастотного диапазона с использованием декодированного сигнала низкочастотного диапазона. То есть, BWE ищет и идентифицирует часть, подобную поддиапазону сигнала высокочастотного диапазона, из сигнала низкочастотного диапазона для аудиосигнала, и кодирует параметры, которые идентифицируют подобную часть, и передают параметры, при этом BWE обеспечивает возможность осуществлять повторный синтез сигнала высокочастотного диапазона с использованием сигнала низкочастотного диапазона на стороне приема сигнала. Является возможным уменьшать объем информации параметров, подлежащей передаче, посредством использования подобной части сигнала низкочастотного диапазона, вместо прямого кодирования сигнала высокочастотного диапазона, что, таким образом, увеличивает эффективность сжатия.
[0004] Одним из кодеков аудио/речи, который использует функциональную возможность BWE, является G.718-SWB, чьими целевыми применениями являются устройства VoIP, оборудования видеоконференций, оборудования телеконференций и мобильные телефоны.
[0005] Конфигурация G.718-SWB [1] проиллюстрирована на фиг. 1 и 2 (см. например, непатентную литературу (в дальнейшем, упоминаемую как "NPL") 1).
[0006] На стороне устройства кодирования, проиллюстрированной на фиг. 1, аудиосигнал (в дальнейшем, упоминаемый как входной сигнал), дискретизированный при 32 кГц, сначала дискретизируется с понижением в 16 кГц (101). Дискретизированный с понижением сигнал кодируется посредством секции (102) базового кодирования G.718. Расширение диапазона частот SWB выполняется в области MDCT. Входной сигнал 32 кГц преобразуется в область MDCT (103) и обрабатывается посредством секции (104) оценки тональности. На основе оцененной тональности входного сигнала (105), общий режим (106) или синусоидальный режим (108) используется для кодирования первого слоя SWB. Более высокие слои SWB кодируются с использованием дополнительных синусоид (107 и 109).
[0007] Общий режим используется, когда входной сигнал кадра не рассматривается как тональный. В общем режиме, коэффициенты MDCT (спектр) сигнала WB, кодированного посредством секции базового кодирования G.718, используются, чтобы кодировать коэффициенты MDCT (спектр) SWB. Частотный диапазон SWB (7 до 14 кГц) разделяется на несколько поддиапазонов, и наиболее коррелированная часть ищется для каждого поддиапазона из кодированных и нормализованных коэффициентов MDCT WB. Затем, усиление наиболее коррелированной части вычисляется в терминах масштаба, так что воспроизводится уровень амплитуды поддиапазона SWB, чтобы получать параметрическое представление высокочастотной составляющей сигнала SWB.
[0008] Кодирование синусоидального режима используется в кадрах, которые классифицируются как тональные. В синусоидальном режиме, сигнал SWB генерируется посредством добавления конечного набора синусоидальных составляющих к спектру SWB.
[0009] На стороне устройства декодирования, проиллюстрированной на фиг. 2, базовый кодек G.718 декодирует сигнал WB при частоте дискретизации 16 кГц (201). Сигнал WB подвергается постобработке (202), и затем дискретизируется с повышением (203) в частоту дискретизации 32 кГц. Частотные составляющие SWB восстанавливаются посредством расширения диапазона частот SWB. Расширение диапазона частот SWB главным образом выполняется в области MDCT. Общий режим (204) и синусоидальный режим (205) используются для декодирования первого слоя SWB. Более высокие слои SWB декодируются с использованием дополнительного синусоидального режима (206 и 207). Восстановленные коэффициенты MDCT SWB преобразуются во временную область (208), за этим следует постобработка (209), и затем добавляются к сигналу WB, декодированному посредством секции базового декодирования G.718, чтобы восстанавливать выходной сигнал SWB во временной области.
Список ссылочных материалов
Непатентная литература
[0010] NPL 1: ITU-T Recommendation G.718 Amendment 2, New Annex B on super wideband scalable extension for ITU-T G.718 and corrections to main body fixed-point C-code and description text, March 2010.
Сущность изобретения
Техническая проблема
[0011] Как можно видеть в конфигурации G.718-SWB, расширение диапазона частот SWB входного сигнала выполняется посредством либо синусоидального режима, либо общего режима.
[0012] Для механизма общего кодирования, например, высокочастотные составляющие генерируются (получаются) посредством поиска наиболее коррелированной части из спектра WB. Этот тип подхода обычно страдает от проблем качества функционирования особенно для сигналов с гармониками. Этот подход не поддерживает гармоническое отношение между гармоническими составляющими низкочастотного диапазона (тональными составляющими) и дублированными тональными составляющими высокочастотного диапазона вовсе, что становится причиной неоднозначных спектров, что ухудшает слуховое качество.
[0013] Поэтому, чтобы подавлять воспринимаемый шум (или артефакты), который генерируется вследствие неоднозначных спектров или вследствие возмущения в дублированном спектре сигнала высокочастотного диапазона (высокочастотном спектре), является желательным поддерживать гармоническое отношение между спектром сигнала низкочастотного диапазона (низкочастотным спектром) и высокочастотным спектром.
[0014] Чтобы решить эту проблему, конфигурация G.718-SWB оснащается синусоидальным режимом. Синусоидальный режим кодирует важные тональные составляющие с использованием синусоидальной волны, и, таким образом, он может хорошо поддерживать гармоническую структуру. Однако результирующее качество звука не является достаточно хорошим только за счет простого кодирования составляющей SWB с искусственными тональными сигналами.
Решение проблемы
[0015] Цель настоящего изобретения состоит в том, чтобы улучшить качество функционирования кодирования сигнала с гармониками, который вызывает проблемы качества функционирования в вышеописанном общем режиме, и чтобы обеспечить эффективный способ для поддержки гармонической структуры тональной составляющей между низкочастотным спектром и дублированным высокочастотным спектром, при поддержании тонкой структурой спектров. Сначала, отношение между тональной составляющей низкочастотного спектра и тональной составляющей высокочастотного спектра получается посредством оценки значения гармонической частоты из спектра WB. Затем, низкочастотный спектр, кодированный на стороне устройства кодирования, декодируется, и, согласно индексной информации, часть, которая является наиболее коррелированной с поддиапазоном высокочастотного спектра, копируется в высокочастотный диапазон при регулировке в энергетических уровнях, тем самым, дублируя высокочастотный спектр. Частота тональной составляющей в дублированном высокочастотном спектре идентифицируется или регулируется на основе значения оцененной гармонической частоты.
[0016] Гармоническое отношение между тональными составляющими низкочастотного спектра и тональными составляющими дублированного высокочастотного спектра могут поддерживаться, только когда оценка гармонической частоты является точной. Поэтому, чтобы улучшать точность оценки, до оценки гармонической частоты выполняется коррекция спектральных пиков, составляющих тональные составляющие.
Преимущества изобретения
[0017] Согласно настоящему изобретению, является возможным точно дублировать тональную составляющую в высокочастотном спектре, восстановленном посредством расширения диапазона частот, для входного сигнала с гармонической структурой, и эффективно получать хорошее качество звука при низком битрейте.
Краткое описание чертежей
[0018] Фиг. 1 иллюстрирует конфигурацию устройства кодирования G.718-SWB;
Фиг. 2 иллюстрирует конфигурацию устройства декодирования G.718-SWB;
Фиг. 3 является блок-схемой, иллюстрирующей конфигурацию устройства кодирования согласно варианту 1 осуществления настоящего изобретения;
Фиг. 4 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования согласно варианту 1 осуществления настоящего изобретения;
Фиг. 5 является диаграммой, иллюстрирующей подход для корректировки обнаружения спектральных пиков;
Фиг. 6 является диаграммой, иллюстрирующей пример способа регулировки гармонической частоты;
Фиг. 7 является диаграммой, иллюстрирующей другой пример способа регулировки гармонической частоты;
Фиг. 8 является блок-схемой, иллюстрирующей конфигурацию устройства кодирования согласно варианту 2 осуществления настоящего изобретения;
Фиг. 9 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования согласно варианту 2 осуществления настоящего изобретения;
Фиг. 10 является блок-схемой, иллюстрирующей конфигурацию устройства кодирования согласно варианту 3 осуществления настоящего изобретения;
Фиг. 11 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования согласно варианту 3 осуществления настоящего изобретения;
Фиг. 12 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования согласно варианту 4 осуществления настоящего изобретения;
Фиг. 13 является диаграммой, иллюстрирующей пример способа регулировки гармонической частоты для синтезированного низкочастотного спектра; и
Фиг. 14 является диаграммой, иллюстрирующей пример подхода для вставки отсутствующих гармоник в синтезированный низкочастотный спектр.
Описание вариантов осуществления
[0019] Основной принцип настоящего изобретения описывается в этом разделе с использованием фиг. 3 по 14. Специалисты в данной области техники должны быть способны модифицировать или адаптировать настоящее изобретение без отклонения от сущности изобретения.
[0020] (Вариант 1 осуществления)
Конфигурация кодека согласно настоящему изобретению проиллюстрирована на фиг. 3 и 4.
[0021] На стороне устройства кодирования, проиллюстрированной на фиг. 3, дискретизированный входной сигнал сначала дискретизируется с понижением (301). Дискретизированный с понижением сигнал низкочастотного диапазона (низкочастотный сигнал) кодируется посредством секции (302) базового кодирования. Параметры базового кодирования посылаются в мультиплексор (307), чтобы формировать битовый поток. Входной сигнал преобразуется в сигнал частотной области с использованием секции (303) время-частотного (T/F) преобразования, и его сигнал высокочастотного диапазона (высокочастотный сигнал) разделяется на множество поддиапазонов. Секция кодирования может быть существующим узкополосным или широкополосным аудио или речевым кодеком, и одним примером является G.718. Секция (302) базового кодирования не только выполняет кодирование, но также имеет секцию локального декодирования и секцию время-частотного преобразования, чтобы выполнять локальное декодирование и время-частотное преобразование декодированного сигнала (синтезированного сигнала), чтобы обеспечивать синтезированный низкочастотный сигнал в секцию (304) нормализации энергии. Синтезированный низкочастотный сигнал нормализованной частотной области используется для расширения диапазона частот следующим образом. Сначала, секция (305) поиска подобия идентифицирует часть, которая является наиболее коррелированной с каждым поддиапазоном высокочастотного сигнала входного сигнала, с использованием нормализованного синтезированного низкочастотного сигнала, и посылает индексную информацию в качестве результатов поиска в секцию (307) мультиплексирования. Далее, информация коэффициентов масштаба между наиболее коррелированной частью и каждым поддиапазоном высокочастотного сигнала входного сигнала оценивается (306), и кодированная информация коэффициентов масштаба посылается в секцию (307) мультиплексирования.
[0022] В заключение, секция (307) мультиплексирования объединяет параметры базового кодирования, индексную информацию и информацию коэффициентов масштаба в битовый поток.
[0023] В устройстве декодирования, проиллюстрированном на фиг. 4, секция (401) демультиплексирования распаковывает битовый поток, чтобы получать параметры базового кодирования, индексную информацию и информацию коэффициентов масштаба.
[0024] Секция базового декодирования восстанавливает синтезированные низкочастотные сигналы с использованием параметров базового кодирования (402). Синтезированный низкочастотный сигнал дискретизируется с повышением (403), и используется для расширения диапазона частот (410).
[0025] Это расширение диапазона частот выполняется следующим образом. То есть, синтезированный низкочастотный сигнал является нормализованным по энергии (404), и низкочастотный сигнал, идентифицированный согласно индексной информации, которая идентифицирует часть, которая является наиболее коррелированной с каждым поддиапазоном высокочастотного сигнала входного сигнала, выведенной на стороне устройства кодирования, копируется в высокочастотный диапазон (405), и энергетический уровень регулируется согласно информации коэффициентов масштаба, чтобы достигать того же уровня энергетического уровня высокочастотного сигнала входного сигнала (406).
[0026] Дополнительно, гармоническая частота оценивается из синтезированного низкочастотного спектра (407). Оцененная гармоническая частота используется, чтобы регулировать частоту тональной составляющей в спектре высокочастотного сигнала (408).
[0027] Восстанавливаемый высокочастотный сигнал преобразуется из частотной области во временную область (409), и добавляется к дискретизированному с повышением синтезированному низкочастотному сигналу, чтобы генерировать выходной сигнал во временной области.
[0028] Детальная обработка схемы оценки гармонической частоты будет описываться следующим образом:
1) Из спектра синтезированного низкочастотного сигнала (LF), выбирается часть для оценки гармонической частоты. Выбранная часть должна иметь ясную гармоническую структуру, так что гармоническая частота, оцененная из выбранной части, является надежной. Обычно, для каждой гармоники, ясная гармоническая структура наблюдается от 1 до 2 кГц до приблизительно обрезающей частоты.
2) Выбранная часть разделяется на множество блоков с шириной, близкой к частоте основного тона речи человека (приблизительно 100 до 400 Гц).
3) Ищутся спектральные пики, которые являются спектром, чья амплитуда является максимумом внутри каждого блока, и частоты спектральных пиков, которые являются частотами этих спектральных пиков.
4) Выполняется постобработка над идентифицированными спектральными пиками, чтобы избегать ошибок или улучшать точность в оценке гармонической частоты.
[0029] Спектр, проиллюстрированный на фиг. 5 используется, чтобы описывать пример постобработки.
[0030] На основе спектра синтезированного низкочастотного сигнала, вычисляются спектральные пики и частоты спектральных пиков. Однако спектральный пик с малой амплитудой и в высшей степени коротким расстоянием частоты спектрального пика по отношению к смежному спектральному пику отбрасывается, что избегает ошибок оценки в вычислении значения гармонической частоты.
1) Вычисляется расстояние между идентифицированными частотами спектральных пиков.
2) Гармоническая частота оценивается на основе расстояния между идентифицированными частотами спектральных пиков. Один из способов для оценки гармонической частоты представляется следующим образом:
[1] Расстояниепик(n)=Положениепик(n+1)-Положениепик(n), n∈[1,N-1]
Figure 00000001
где
ОценкаГармоника является вычисленной гармонической частотой;
Расстояниепик является частотным расстоянием между положениями обнаруженных пиков;
N является количеством положений обнаруженных пиков;
Положениепик является положением обнаруженного пика;
[0031] Оценка гармонической частоты также выполняется согласно способу, описанному следующим образом:
1) В спектре синтезированного низкочастотного сигнала (LF), чтобы оценивать гармоническую частоту, выбирается часть, имеющая ясную гармоническую структуру, так что оцененная гармоническая частота является надежной. Обычно, для каждой гармоники, ясная гармоническая структура может рассматриваться от 1 до 2 кГц до приблизительно обрезающей частоты.
2) Спектр и его частота, имеющая максимальную амплитуду (абсолютное значение), идентифицируются внутри выбранной части вышеупомянутого синтезированного низкочастотного сигнала (спектра).
3) Идентифицируется набор спектральных пиков, имеющих, по существу, равное частотное расстояние от спектральной частоты спектра с максимальной амплитудой и в которых абсолютное значение амплитуды превосходит предварительно определенный порог. В качестве предварительно определенного порога, является возможным применять, например, значение, равное удвоенному стандартному отклонению спектральных амплитуд, содержащихся в вышеупомянутой выбранной части.
4) Вычисляется расстояние между вышеупомянутыми частотами спектральных пиков.
5) Гармоническая частота оценивается на основе расстояния между вышеупомянутыми частотами спектральных пиков. Также в этом случае, способ в Уравнении (1) может использоваться, чтобы оценивать гармоническую частоту.
[0032] Имеется случай, где гармоническая составляющая в спектре синтезированного низкочастотного сигнала не кодируется хорошо, при очень низком битрейте. В этом случае, имеется возможность, что некоторые из идентифицированных спектральных пиков могут не соответствовать гармоническим составляющим входных сигналов вовсе. Поэтому, в вычислении гармонической частоты, расстояние между частотами спектральных пиков, которые в значительной степени отличаются от среднего значения, должно исключаться из цели вычисления.
[0033] Также, имеется случай, где не все гармонические составляющие могут кодироваться (означая, что некоторые из гармонических составляющих отсутствуют в спектре синтезированного низкочастотного сигнала) вследствие относительно низкой амплитуды спектрального пика, ограничений битрейта для кодирования, или подобного. В этих случаях, расстояние между частотами спектральных пиков, извлеченными в отсутствующей гармонической части, рассматривается как удвоенное или умноженное на несколько раз расстояние между частотами спектральных пиков, извлеченными в части, которая сохраняет хорошую гармоническую структуру. В этом случае, среднее значение извлеченных значений расстояния между частотами спектральных пиков, где значения включены в предварительно определенный диапазон, включающий в себя максимальное расстояние между частотами спектральных пиков, определяется как значение оцененной гармонической частоты. Таким образом, становится возможным должным образом дублировать высокочастотный спектр. Конкретная процедура содержит следующие этапы:
1) Идентифицируются минимальное и максимальное значения расстояния между частотами спектральных пиков;
[2] Расстояниепик(n)=Положениепик(n+1)-Положениепик(n), n∈[1, N-1]
Расстояниеmin=min({Расстояниепик(n)});
Расстояниеmax=max({Расстояниепик(n)}); (Уравнение 2)
где;
Расстояниепик является частотным расстоянием между положениями обнаруженных пиков;
Расстояниеmin является минимальным частотным расстоянием между положениями обнаруженных пиков;
Расстояниеmax является максимальным частотным расстоянием между положениями обнаруженных пиков;
N является количеством положений обнаруженных пиков;
Положениепик является положением обнаруженного пика;
[0034] 2) Каждое расстояние между частотами спектральных пиков идентифицируется в диапазоне:
[3] [k*Расстояниеmin, Расстояниеmax], k∈[1, 2]
[0035] 3) Среднее значение идентифицированных значений расстояния между частотами спектральных пиков в вышеупомянутом диапазоне определяется как значение оцененной гармонической частоты.
[0036] Далее, ниже будет описываться один пример схем регулировки гармонической частоты.
[0037] 1) Последний кодированный спектральный пик и его частота спектрального пика идентифицируются в спектре синтезированного низкочастотного сигнала (LF).
2) Спектральный пик и частота спектрального пика идентифицируются внутри высокочастотного спектра, дублированного посредством расширения диапазона частот.
3) С использованием наивысшей частоты спектрального пика в качестве эталона, среди спектральных пиков спектра синтезированного низкочастотного сигнала, регулируются частоты спектральных пиков, так что значения расстояния между частотами спектральных пиков равны оцененному значению расстояния между гармоническими частотами. Эта обработка проиллюстрирована на фиг. 6. Как проиллюстрировано на фиг. 6, сначала, идентифицируются наивысшая частота спектрального пика в спектре синтезированного низкочастотного сигнала и спектральные пики в дублированном высокочастотном спектре. Затем, наименьшая частота спектрального пика в дублированном высокочастотном спектре сдвигается на частоту, имеющую расстояние ОценкаГармоника от наивысшей частоты спектрального пика спектра синтезированного низкочастотного сигнала. Вторая наименьшая частота спектрального пика в дублированном высокочастотном спектре сдвигается на частоту, имеющую расстояние ОценкаГармоника от вышеупомянутой сдвинутой наименьшей частоты спектрального пика. Обработка повторяется до тех пор, когда такая регулировка завершается для каждой частоты спектрального пика спектрального пика в дублированном высокочастотном спектре.
[0038] Также являются возможными схемы регулировки гармонической частоты, как описано ниже.
1) Идентифицируется спектр синтезированного низкочастотного сигнала (LF), имеющий наивысшую частоту спектрального пика.
2) Идентифицируются спектральный пик и частота спектрального пика внутри высокочастотного (HF) спектра, расширенного в терминах диапазона частот посредством расширения диапазона частот.
3) С использованием наивысшей частоты спектрального пика спектра синтезированного низкочастотного сигнала в качестве эталона, вычисляются возможные частоты спектральных пиков в спектре HR. Каждый спектральный пик в высокочастотном спектре, дублированном посредством расширения диапазона частот, сдвигается на частоту, которая является самой близкой к каждой частоте спектрального пика, среди вычисленных частот спектральных пиков. Эта обработка проиллюстрирована на фиг. 7. Как проиллюстрировано на фиг. 7, сначала, извлекаются синтезированный низкочастотный спектр, имеющий наивысшую частоту спектрального пика, и спектральные пики в дублированном высокочастотном спектре. Затем, вычисляется возможная частота спектрального пика в дублированном высокочастотном спектре. Частота, имеющая расстояние ОценкаГармоника от наивысшей частоты спектрального пика спектра синтезированного низкочастотного сигнала, определяется как частота спектрального пика, которая может быть первой частотой спектрального пика в дублированном высокочастотном спектре. Далее, частота, имеющая расстояние ОценкаГармоника от вышеупомянутой частоты спектрального пика, которая может быть первой частотой спектрального пика, определяется как частота спектрального пика, которая может быть второй частотой спектрального пика. Обработка повторяется до тех пор, пока вычисление является возможным в высокочастотном спектре.
[0039] После этого, спектральный пик, извлеченный в дублированном высокочастотном спектре, сдвигается на частоту, которая является самой близкой к частоте спектрального пика, среди возможных частот спектральных пиков, вычисленных, как описано выше.
[0040] Также имеется случай, когда оцененное гармоническое значение ОценкаГармоника не соответствует целочисленному частотному интервалу. В этом случае, частота спектрального пика выбирается, чтобы быть частотным интервалом, который является самым близким к частоте, выведенной на основе ОценкаГармоника.
[0041] Также может быть способ оценки гармонической частоты, в котором предыдущий спектр кадра используется, чтобы оценивать гармоническую частоту, и способ регулировки частот тональных составляющих, в котором учитывается предыдущий спектр кадра, так что переход между кадрами является гладким при регулировке тональной составляющей. Также является возможным регулировать амплитуду, так что, даже когда частоты тональных составляющих сдвигаются, энергетический уровень исходного спектра поддерживается. Все такие незначительные изменения находятся в пределах объема настоящего изобретения.
[0042] Вышеизложенные описания все даны в качестве примеров, и идеи настоящего изобретения не ограничены данными примерами. Специалисты в данной области техники должны быть способны модифицировать и адаптировать настоящее изобретение без отклонения от сущности изобретения.
[0043] Эффект
Способ расширения диапазона частот согласно настоящему изобретению дублирует высокочастотный спектр с использованием спектра синтезированного низкочастотного сигнала, который является наиболее коррелированным с высокочастотным спектром, и сдвигает спектральные пики на оцененные гармонические частоты. Таким образом, становится возможным поддерживать как тонкую структуру спектра, так и гармоническую структуру между спектральными пиками низкочастотного диапазона и дублированного спектральными пиками высокочастотного диапазона.
[0044] (Вариант 2 осуществления)
Вариант 2 осуществления настоящего изобретения проиллюстрирован на фиг. 8 и 9.
[0045] Устройство кодирования согласно варианту 2 осуществления, по существу, является таким же как устройство кодирования из варианта 1 осуществления, за исключением секций (708 и 709) оценки гармонической частоты и секции (710) сравнения гармонических частот.
[0046] Гармоническая частота оценивается отдельно от синтезированного низкочастотного спектра (708) и высокочастотного спектра (709) входного сигнала, и на основе результата сравнения между этими оцененными значениями (710) передается флаговая информация. В качестве одного из примеров, флаговая информация может выводиться как в следующем уравнении:
[4] если
ОценкаГармоника_LF∈[ОценкаГармоника_HF-Порог, ОценкаГармоника_HF+Порог]
Флаг=1
Иначе
Флаг=0 (Уравнение 3)
где
ОценкаГармоника_LF является оцененной гармонической частотой из синтезированного низкочастотного спектра;
ОценкаГармоника_HF является оцененной гармонической частотой из исходного высокочастотного спектра;
Порог является предварительно определенным порогом для разности между ОценкаГармоника_LF и ОценкаГармоника_HF;
Флаг является сигналом флага, чтобы указывать, должна ли гармоническая регулировка применяться;
[0047] То есть, гармоническая частота, оцененная из спектра синтезированного низкочастотного сигнала (синтезированного низкочастотного спектра), ОценкаГармоника_LF сравнивается с гармонической частотой, оцененной из высокочастотного спектра входного сигнала, ОценкаГармоника_HF. Когда разность между упомянутыми двумя значениями является достаточно малой, считается, что оценка из синтезированного низкочастотного спектра является достаточно точной, и устанавливается флаг (Флаг=1), что означает, что она может использоваться для регулировки гармонической частоты. С другой стороны, когда разность между упомянутыми двумя значениями не является малой, считается, что оцененное значение из синтезированного низкочастотного спектра не является точным, и устанавливается флаг (Флаг=0), что означает, что оно не должно использоваться для регулировки гармонической частоты.
[0048] На стороне устройства декодирования, проиллюстрированной на фиг. 9, значение флаговой информации определяет, применяется ли или нет регулировка (810) гармонической частоты к дублированному высокочастотному спектру. То есть, в случае Флаг=1, устройство декодирования выполняет регулировку гармонической частоты, тогда как в случае Флаг=0, оно не выполняет регулировку гармонической частоты.
[0049] Эффект
Для нескольких входных сигналов, имеется случай, где гармоническая частота, оцененная из синтезированного низкочастотного спектра, отличается от гармонической частоты высокочастотного спектра входного сигнала. Особенно при низком битрейте, гармоническая структура низкочастотного спектра не поддерживается хорошо. Посредством отправки флаговой информации, становится возможным в избегать регулировки тональной составляющей с использованием неправильно оцененного значения гармонической частоты.
[0050] (Вариант 3 осуществления)
Вариант 3 осуществления настоящего изобретения проиллюстрирован на фиг. 10 и 11.
[0051] Устройство кодирования согласно варианту 3 осуществления, по существу, является таким же как устройство кодирования из варианта 2 осуществления, за исключением дифференциального устройства (910).
[0052] Гармоническая частота оценивается отдельно от синтезированного низкочастотного спектра (908) и высокочастотного спектра (909) входного сигнала. Разность между упомянутыми двумя оцененными гармоническими частотами (Разность) вычисляется (910), и передается стороне устройства декодирования.
[0053] На стороне устройства декодирования, проиллюстрированной на фиг. 11, значение разности (Разность) добавляется к оцененному значению гармонической частоты из синтезированного низкочастотного спектра (1010), и заново вычисленное значение гармонической частоты используется для регулировки гармонической частоты в дублированном высокочастотном спектре.
[0054] Вместо значения разности, гармоническая частота, оцененная из высокочастотного спектра входного сигнала, также может напрямую передаваться в секцию декодирования. Затем, принятое значение гармонической частоты высокочастотного спектра входного сигнала используется, чтобы выполнять регулировку гармонической частоты. Таким образом, становится излишним оценивать гармоническую частоту из синтезированного низкочастотного спектра на стороне устройства декодирования.
[0055] Эффект
Имеется случай, где, для нескольких сигналов, гармоническая частота, оцененная из синтезированного низкочастотного спектра, отличается от гармонической частоты высокочастотного спектра входного сигнала. Поэтому, посредством отправки значения разности, или значения гармонической частоты, выведенного из высокочастотного спектра входного сигнала, становится возможным регулировать тональную составляющую высокочастотного спектра, дублированного посредством расширения диапазона частот, посредством устройства декодирования на стороне приема более точно.
[0056] (Вариант 4 осуществления)
Вариант 4 осуществления настоящего изобретения проиллюстрирован на фиг. 12.
[0057] Устройство кодирования согласно варианту 4 осуществления является таким же как любые другие стандартные устройства кодирования, или является таким же как устройство кодирования в варианте 1, 2 или 3 осуществления.
[0058] На стороне устройства декодирования, проиллюстрированной на фиг. 12, гармоническая частота оценивается из синтезированного низкочастотного спектра (1103). Оцененное значение этой гармонической частоты используется для вставки гармоники (1104) в низкочастотный спектр.
[0059] Особенно когда доступный битрейт является низким, имеется случай, где некоторые из гармонических составляющих низкочастотного спектра жестко кодированы, или не кодированы вовсе. В этом случае, значение оцененной гармонической частоты может использоваться, чтобы вставлять отсутствующие гармонические составляющие.
[0060] Это будет проиллюстрировано на фиг. 13. Можно видеть, из фиг. 13, что имеется отсутствующая гармоническая составляющая в синтезированном низкочастотном (LF) спектре. Ее частота может выводиться с использованием значения оцененной гармонической частоты. Дополнительно, что касается ее амплитуды, например, является возможным использовать среднее значение амплитуд других существующих спектральных пиков или среднее значение амплитуд существующих спектральных пиков, соседних с отсутствующей гармонической составляющей на оси частот. Гармоническая составляющая, сгенерированная согласно частоте и амплитуде, вставляется для восстановления отсутствующей гармонической составляющей.
[0061] Другой подход для вставки отсутствующей гармонической составляющей описывается следующим образом:
1. Гармоническая частота оценивается с использованием кодированного спектра LF (1103).
1.1 Гармоническая частота оценивается с использованием расстояния между частотами спектральных пиков, идентифицированными в кодированном низкочастотном спектре.
1.2 Значения расстояния между частотами спектральных пиков, которые выводятся из отсутствующей гармонической части, становятся удвоенными или умноженными на несколько раз значениями расстояния между частотами спектральных пиков, которые выводятся из части, которая имеет хорошую гармоническую структуру. Такие значения расстояния между частотами спектральных пиков группируются в разные категории, и среднее значение расстояния между частотами спектральных пиков оценивается для каждой из категорий. Подробности этого описываются следующим образом:
a. Идентифицируются минимальное значение и максимальное значение для значения расстояния между частотами спектральных пиков.
[5] Расстояниепик(n)=Положениепик(n+1)-Положениепик(n), n∈[1, N-1]
Расстояниеmin=min({Расстояниепик(n)});
Расстояниеmax=max({Расстояниепик(n)}); (Уравнение 4)
где;
Расстояниепик является частотным расстоянием между положениями обнаруженных пиков;
Расстояниеmin является минимальным частотным расстоянием между положениями обнаруженных пиков;
Расстояниеmax является максимальным частотным расстоянием между положениями обнаруженных пиков;
N является количеством положений обнаруженных пиков;
Положениепик является положением обнаруженного пика;
b. Каждое значение расстояния идентифицируется в диапазоне:
[6] r1=[Расстояниеmin, k*Расстояниеmin)
r2=[k*Расстояниеmin, Расстояниеmax], 1<k≤2
c. Средние значения для значений расстояния, идентифицированных в вышеупомянутых диапазонах, вычисляются как значения оцененных гармонических частот.
[7]
Figure 00000002
Figure 00000003
(Уравнение 5)
где
Figure 00000004
являются оцененными гармоническими частотами
N1 является количеством положений обнаруженных пиков, принадлежащих r1
N2 является количеством положений обнаруженных пиков, принадлежащих r2
2. С использованием значений оцененных гармонических частот, вставляются отсутствующие гармонические составляющие.
2.1 Выбранный спектр LF разделяется на несколько областей.
2.2 Отсутствующие гармоники идентифицируются посредством использования информации области и оцененных частот.
Например, предположим, что выбранный спектр LF разделяется на три области r1, r2, и r3.
На основе информации области, гармоники идентифицируются и вставляются.
Вследствие характеристик сигнала для гармоник, спектральный промежуток между гармониками равняется
Figure 00000005
в областях r1 и r2, и равняется
Figure 00000006
в области r3. Эта информация может использоваться для расширения спектра LF. Это иллюстрируется дополнительно на фиг. 14. Можно видеть, из фиг. 14, что имеется отсутствующая гармоническая составляющая в области r2 спектра LF. Эта частота может выводиться с использованием значения оцененной гармонической частоты
Figure 00000007
.
Аналогично,
Figure 00000006
используется для отслеживания и вставки отсутствующей гармоники в области r3.
Дополнительно, что касается ее амплитуды, является возможным использовать среднее значение амплитуд всех гармонических составляющих, которые не отсутствуют, или среднее значение амплитуд гармонических составляющих, предшествующих и следующих за отсутствующей гармонической составляющей. Альтернативно, что касается амплитуды, может использоваться спектральный пик с минимальной амплитудой в спектре WB. Гармоническая составляющая, сгенерированная с использованием частоты и амплитуды, вставляется в спектр LF для восстановления отсутствующей гармонической составляющей.
[0062] Эффект
Имеется случай, где синтезированный низкочастотный спектр не поддерживается для нескольких сигналов. Особенно при низком битрейте, имеется возможность, что могут отсутствовать несколько гармонических составляющих. Посредством вставки отсутствующих гармонических составляющих в спектр LF, становится возможным не только расширять LF, но также улучшать гармонические характеристики восстановленных гармоник. Это может подавлять слуховое воздействие вследствие отсутствующих гармоник, чтобы дополнительно улучшать качество звука.
[0063] Раскрытие японской патентной заявки, номер 2013-122985, поданной 11 июня, 2013, включающей в себя описание, чертежи и реферат, включается сюда по ссылке в ее полноте.
Промышленная применимость
[0064] Устройство кодирования, устройство декодирования и способы кодирования и декодирования согласно настоящему изобретению являются применимыми к терминальному устройству беспроводной связи, устройству базовой станции в системе мобильной связи, терминальному устройству телеконференций, терминальному устройству видеоконференций, и терминальному устройству передачи речи по протоколу Интернет (VOIP).

Claims (51)

1. Устройство декодирования аудиосигналов, содержащее:
секцию демультиплексирования, которая демультиплексирует параметры кодирования низкого диапазона, индексную информацию и информацию коэффициентов масштаба из кодированной информации, переданной от устройства кодирования, которое кодирует аудиосигнал;
секцию декодирования низкого диапазона, которая декодирует параметры кодирования низкого диапазона, чтобы получать синтезированный низкочастотный спектр;
секцию дублирования спектра, которая дублирует спектр высокочастотного поддиапазона на основе индексной информации с использованием синтезированного низкочастотного спектра; и
секцию регулировки огибающей спектра, которая регулирует амплитуду дублированного спектра высокочастотного поддиапазона с использованием информации коэффициентов масштаба,
секцию оценки гармонической частоты, которая оценивает частоту гармонической составляющей в синтезированном низкочастотном спектре; и
секцию регулировки гармонической частоты, которая регулирует частоту гармонической составляющей в спектре высокочастотного поддиапазона с использованием гармонической частоты, оцененной с использованием синтезированного низкочастотного спектра; и
секцию вывода, которая генерирует выходной сигнал, используя синтезированный низкочастотный спектр и спектр высокочастотного поддиапазона.
2. Устройство декодирования аудиосигналов по п. 1,
в котором
секция оценки гармонической частоты содержит:
секцию разделения, которая разделяет предварительно выбранную часть синтезированного низкочастотного спектра на предварительно определенное количество блоков;
секцию идентификации спектральных пиков, которая определяет спектр (спектральный пик), имеющий максимальную амплитуду в каждом блоке, и частоту спектрального пика;
секцию вычисления расстояния, которая вычисляет расстояние между идентифицированными частотами спектральных пиков; и
секцию вычисления гармонической частоты, которая вычисляет гармоническую частоту с использованием расстояния между идентифицированными частотами спектральных пиков.
3. Устройство декодирования аудиосигналов по п. 1,
в котором
секция оценки гармонической частоты содержит:
секцию идентификации спектральных пиков, которая идентифицирует спектр, имеющий максимальное абсолютное значение амплитуды в предварительно выбранной части синтезированного низкочастотного спектра, и спектры, которые располагаются на, по существу, регулярном расстоянии от спектра на оси частот и которые имеют амплитуду, у которой абсолютное значение равняется или больше, чем предварительно определенный порог;
секцию вычисления расстояния, которая вычисляет расстояние между частотами идентифицированных спектральных пиков; и
секцию вычисления гармонической частоты, которая вычисляет гармоническую частоту с использованием расстояния между частотами идентифицированных спектров.
4. Устройство декодирования аудиосигналов по п. 2,
в котором
секция регулировки содержит:
секцию идентификации низкочастотных спектральных пиков, которая идентифицирует наивысшую частоту спектральных пиков в синтезированном низкочастотном спектре;
секцию идентификации высокочастотных спектральных пиков, которая идентифицирует множество частот спектральных пиков в дублированном спектре высокочастотного поддиапазона; и
вторую секцию регулировки, которая использует, в качестве эталона, наивысшую частоту спектральных пиков в синтезированном низкочастотном спектре для регулировки множества частот спектральных пиков, так что расстояние между множеством частот спектральных пиков равняется оцененной гармонической частоте.
5. Устройство кодирования аудиосигналов, содержащее:
секцию кодирования низкого диапазона, которая кодирует низкочастотный аудиосигнал, и выводит синтезированный низкочастотный спектр, и генерирует параметры низкого диапазона, и выводит параметры;
секцию разделения поддиапазона, которая преобразовывает высокочастотный аудиосигнал в частотный спектр и разделяет высокочастотный спектр на множество поддиапазонов (в дальнейшем, высокочастотных поддиапазонов), причем высокочастотный спектр получают, используя время-частотное преобразование входного аудиосигнала;
секцию поиска, которая идентифицирует наиболее коррелированную часть из синтезированного низкочастотного спектра для каждого из высокочастотных поддиапазонов и выводит результат идентификации в качестве индексной информации;
секцию оценки коэффициентов масштаба, которая оценивает коэффициент масштаба энергии между каждым из высокочастотных поддиапазонов и наиболее коррелированной частью, идентифицированной из синтезированного низкочастотного спектра, и выводит коэффициент масштаба в качестве информации коэффициентов масштаба; и
секцию оценки гармонической частоты, которая оценивает и выводит гармоническую частоту синтезированного низкочастотного спектра и гармоническую частоту преобразованного входного сигнала; и
секцию мультиплексирования, которая мультиплексирует низкочастотный параметр, индексную информацию и информацию коэффициента масштаба.
6. Способ декодирования аудиосигналов, содержащий:
демультиплексирование параметров кодирования низкого диапазона, индексной информации и информации коэффициента масштаба из кодированной информации, переданной от устройства кодирования, которое кодирует аудиосигнал;
декодирование параметров кодирования низкого диапазона для получения синтезированного низкочастотного спектра;
дублирование спектра высокочастотного поддиапазона на основании индексной информации, используя синтезированный низкочастотный спектр; и
регулирование амплитуды дублированного спектра высокочастотного поддиапазона, используя информацию коэффициентов масштаба;
оценку частоты гармонической составляющей в синтезированном низкочастотном спектре;
регулирование частоты гармонической составляющей в спектре высокочастотного поддиапазона, используя оцененный спектр гармонической частоты; и
генерирование выходного сигнала, используя синтезированный низкочастотный спектр и спектр высокочастотного поддиапазона.
7. Способ кодирования аудиосигналов, содержащий:
кодирование низкочастотного аудиосигнала, и вывод синтезированного низкочастотного спектра, и генерирование параметров низкого диапазона, и вывод упомянутых параметров;
преобразование высокочастотного аудиосигнала в частотный спектр;
разделение высокочастотного спектра на множество поддиапазонов (в дальнейшем высокочастотные поддиапазоны), при этом высокочастотный спектр получают, используя время-частотное преобразование входного аудиосигнала;
идентификацию наиболее коррелированной части из синтезированного низкочастотного спектра для каждого из высокочастотных диапазонов;
вывод результатов идентификации в качестве индексной информации;
оценку коэффициентов масштаба энергии между каждым из высокочастотных поддиапазонов и наиболее коррелированной частью, идентифицированной из синтезированного низкочастотного спектра, и вывод коэффициента масштаба в качестве информации коэффициента масштаба;
оценку гармонической частоты синтезированного низкочастотного спектра и гармонической частоты преобразованного входного аудиосигнала; и
мультиплексирование параметра низкого диапазона, индексной информации и информации коэффициента масштаба.
RU2015151169A 2013-06-11 2014-06-10 Устройство и способ для расширения диапазона частот для акустических сигналов RU2658892C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013122985 2013-06-11
JP2013-122985 2013-06-11
PCT/JP2014/003103 WO2014199632A1 (ja) 2013-06-11 2014-06-10 音響信号の帯域幅拡張を行う装置及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2018121035A Division RU2688247C2 (ru) 2013-06-11 2014-06-10 Устройство и способ для расширения диапазона частот для акустических сигналов

Publications (3)

Publication Number Publication Date
RU2015151169A RU2015151169A (ru) 2017-06-05
RU2015151169A3 RU2015151169A3 (ru) 2018-03-02
RU2658892C2 true RU2658892C2 (ru) 2018-06-25

Family

ID=52021944

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2015151169A RU2658892C2 (ru) 2013-06-11 2014-06-10 Устройство и способ для расширения диапазона частот для акустических сигналов
RU2018121035A RU2688247C2 (ru) 2013-06-11 2014-06-10 Устройство и способ для расширения диапазона частот для акустических сигналов

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2018121035A RU2688247C2 (ru) 2013-06-11 2014-06-10 Устройство и способ для расширения диапазона частот для акустических сигналов

Country Status (11)

Country Link
US (4) US9489959B2 (ru)
EP (2) EP3731226A1 (ru)
JP (4) JP6407150B2 (ru)
KR (1) KR102158896B1 (ru)
CN (2) CN111477245B (ru)
BR (2) BR122020016403B1 (ru)
ES (1) ES2836194T3 (ru)
MX (1) MX353240B (ru)
PT (1) PT3010018T (ru)
RU (2) RU2658892C2 (ru)
WO (1) WO2014199632A1 (ru)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
RU2658892C2 (ru) * 2013-06-11 2018-06-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для расширения диапазона частот для акустических сигналов
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
CN105280189B (zh) * 2015-09-16 2019-01-08 深圳广晟信源技术有限公司 带宽扩展编码和解码中高频生成的方法和装置
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10346126B2 (en) 2016-09-19 2019-07-09 Qualcomm Incorporated User preference selection for audio encoding
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
EP3435376B1 (en) 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN111386568B (zh) * 2017-10-27 2023-10-13 弗劳恩霍夫应用研究促进协会 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
WO2020041497A1 (en) * 2018-08-21 2020-02-27 2Hz, Inc. Speech enhancement and noise suppression systems and methods
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
CN113192517B (zh) 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备
CN113362837B (zh) * 2021-07-28 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频信号处理方法、设备及存储介质
CN114550732B (zh) * 2022-04-15 2022-07-08 腾讯科技(深圳)有限公司 一种高频音频信号的编解码方法和相关装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1351401A1 (en) * 2001-07-13 2003-10-08 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
US20100063806A1 (en) * 2008-09-06 2010-03-11 Yang Gao Classification of Fast and Slow Signal
WO2010081892A2 (en) * 2009-01-16 2010-07-22 Dolby Sweden Ab Cross product enhanced harmonic transposition
US20110282675A1 (en) * 2009-04-09 2011-11-17 Frederik Nagel Apparatus and Method for Generating a Synthesis Audio Signal and for Encoding an Audio Signal
WO2012050023A1 (ja) * 2010-10-15 2012-04-19 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2221808B1 (en) * 2003-10-23 2012-07-11 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
WO2012111767A1 (ja) * 2011-02-18 2012-08-23 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、及び音声符号化プログラム
RU2483368C2 (ru) * 2007-11-06 2013-05-27 Нокиа Корпорейшн Кодер

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP2003108197A (ja) 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
CN101656076B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
ES2476992T3 (es) * 2004-11-05 2014-07-15 Panasonic Corporation Codificador, descodificador, método de codificación y método de descodificaci�n
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
CN101548318B (zh) * 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010036061A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
JP5511785B2 (ja) * 2009-02-26 2014-06-04 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
WO2011048820A1 (ja) 2009-10-23 2011-04-28 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method
CN102473417B (zh) * 2010-06-09 2015-04-08 松下电器(美国)知识产权公司 频带扩展方法、频带扩展装置、集成电路及音频解码装置
ES2942867T3 (es) * 2010-07-19 2023-06-07 Dolby Int Ab Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN103718240B (zh) * 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
JP2013122985A (ja) 2011-12-12 2013-06-20 Toshiba Corp 半導体記憶装置
RU2658892C2 (ru) * 2013-06-11 2018-06-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для расширения диапазона частот для акустических сигналов

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1351401A1 (en) * 2001-07-13 2003-10-08 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
EP2221808B1 (en) * 2003-10-23 2012-07-11 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
RU2483368C2 (ru) * 2007-11-06 2013-05-27 Нокиа Корпорейшн Кодер
US20100063806A1 (en) * 2008-09-06 2010-03-11 Yang Gao Classification of Fast and Slow Signal
WO2010081892A2 (en) * 2009-01-16 2010-07-22 Dolby Sweden Ab Cross product enhanced harmonic transposition
US20110282675A1 (en) * 2009-04-09 2011-11-17 Frederik Nagel Apparatus and Method for Generating a Synthesis Audio Signal and for Encoding an Audio Signal
WO2012050023A1 (ja) * 2010-10-15 2012-04-19 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012111767A1 (ja) * 2011-02-18 2012-08-23 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、及び音声符号化プログラム

Also Published As

Publication number Publication date
BR122020016403B1 (pt) 2022-09-06
CN111477245A (zh) 2020-07-31
RU2018121035A (ru) 2019-03-05
CN105408957B (zh) 2020-02-21
JPWO2014199632A1 (ja) 2017-02-23
ES2836194T3 (es) 2021-06-24
US9489959B2 (en) 2016-11-08
CN105408957A (zh) 2016-03-16
RU2018121035A3 (ru) 2019-03-05
RU2688247C2 (ru) 2019-05-21
US20170025130A1 (en) 2017-01-26
WO2014199632A1 (ja) 2014-12-18
US20170323649A1 (en) 2017-11-09
RU2015151169A3 (ru) 2018-03-02
JP2021002069A (ja) 2021-01-07
JP6407150B2 (ja) 2018-10-17
MX2015016109A (es) 2016-10-26
JP2019008317A (ja) 2019-01-17
JP7330934B2 (ja) 2023-08-22
EP3010018A4 (en) 2016-06-15
US10157622B2 (en) 2018-12-18
US20160111103A1 (en) 2016-04-21
EP3010018B1 (en) 2020-08-12
RU2015151169A (ru) 2017-06-05
KR102158896B1 (ko) 2020-09-22
US10522161B2 (en) 2019-12-31
CN111477245B (zh) 2024-06-11
BR112015029574A2 (pt) 2017-07-25
MX353240B (es) 2018-01-05
EP3731226A1 (en) 2020-10-28
US9747908B2 (en) 2017-08-29
JP2019008316A (ja) 2019-01-17
BR112015029574B1 (pt) 2021-12-21
EP3010018A1 (en) 2016-04-20
US20190122679A1 (en) 2019-04-25
KR20160018497A (ko) 2016-02-17
JP6773737B2 (ja) 2020-10-21
PT3010018T (pt) 2020-11-13

Similar Documents

Publication Publication Date Title
RU2658892C2 (ru) Устройство и способ для расширения диапазона частот для акустических сигналов
CN110660410B (zh) 音频编码器、音频解码器及相关方法
KR101680953B1 (ko) 인지 오디오 코덱들에서의 고조파 신호들에 대한 위상 코히어런스 제어
KR101398189B1 (ko) 음성수신장치 및 음성수신방법
JP2011100158A (ja) スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法
JPWO2012169133A1 (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
KR102121642B1 (ko) 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
CA3118121C (en) Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
Lin et al. Adaptive bandwidth extension of low bitrate compressed audio based on spectral correlation

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant