RU2015136223A - Низкочастотное акцентирование для основанного на lpc кодирования в частотной области - Google Patents

Низкочастотное акцентирование для основанного на lpc кодирования в частотной области Download PDF

Info

Publication number
RU2015136223A
RU2015136223A RU2015136223A RU2015136223A RU2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A
Authority
RU
Russia
Prior art keywords
spectrum
linear prediction
spectral line
spectral
prediction coding
Prior art date
Application number
RU2015136223A
Other languages
English (en)
Other versions
RU2612589C2 (ru
Inventor
Штефан ДЕЛА
Бернхард ГРИЛЛ
Кристиан ХЕЛЬМРИХ
Николаус РЕТТЕЛЬБАХ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015136223A publication Critical patent/RU2015136223A/ru
Application granted granted Critical
Publication of RU2612589C2 publication Critical patent/RU2612589C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (45)

1. Аудиокодер для кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем аудиокодер (1) включает в себя:
комбинацию (2, 3) фильтра (2) кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя (3) из временной области в частотную область, причем эта комбинация (2, 3) выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;
блок (4) низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), в котором спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы;
управляющее устройство (5), выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока (4) низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;
устройство (6) квантования, выполненное с возможностью производства квантованного спектра (QS), на основе обработанного спектра (PS);
а также генератор (7) потока битов, выполненный с возможностью встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.
2. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на фильтр (2) кодирования с линейным предсказанием, причем фильтрованный фрейм (FF) выводится фильтром (2) кодирования с линейным предсказанием и при этом преобразователь (3) из временной области в частотную область выполнен с возможностью оценки спектра (SP) на основе фильтрованного фрейма (FF).
3. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на преобразователь (3) из временной области в частотную область, причем преобразованный фрейм (FC) выводится преобразователем (3) из временной области в частотную область и при этом фильтр (2) кодирования с линейным предсказанием выполнен с возможностью оценки спектра (SP) на основе преобразованного фрейма (FC).
4. Аудиокодер по п. 1, в котором управляющее устройство (5) включает в себя спектральный анализатор (8), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (9) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (10, 11) вычисления коэффициента акцентирования, выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии для вычисления спектральных линий (SL) обработанного спектра (PS), представляющих более низкую частоту, чем референсная спектральная линия (RSL), на основе минимума (MI) и максимума (MA), причем спектральные линии (SL) обработанного спектра (PS) акцентируются путем применения коэффициентов (SEF) акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма.
5. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициенты (SEF) акцентирования спектральной линии увеличиваются в направлении от референсной спектральной линии (RSL) к спектральной линии (SL), представляющей самую низкую частоту спектра (SP).
6. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования включает в себя первый каскад (10), выполненный с возможностью вычисления базисного коэффициента (BEF) акцентирования в соответствии с первой формулой γ=(α·min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и γ является базисным коэффициентом (BEF) акцентирования, и причем блок (10, 11) вычисления коэффициента акцентирования включает в себя второй каскад (11), выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии в соответствии со второй формулой εii’-i, в которой i’ является количеством спектральных линий (SL), которые будут акцентированы, i является индексом соответствующей спектральной линии (SL), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, γ является базисным коэффициентом (BEF) акцентирования, и εi является коэффициентом (SEF) акцентирования спектральной линии с индексом i.
7. Аудиокодер по п. 6, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.
8. Аудиокодер по п. 6, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.
9. Аудиокодер по п. 1, в котором референсная спектральная линия (RSL) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.
10. Аудиокодер по п. 4, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSL).
11. Аудиокодер по п. 1, в котором управляющее устройство (5) конфигурируется таким образом, что спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.
12. Аудиодекодер (12) для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного аудиокодером (1) по пп. 1-12, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем аудиодекодер (12) включает в себя:
приемник (13) потока битов, выполненный с возможностью извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;
устройство (14) деквантования, выполненное с возможностью производства деквантованного спектра (DQ) на основе квантованного спектра (QS);
блок (15) низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и
управляющее устройство (16), выполненное с возможностью управления вычислением обратно обработанного спектра (RS) с помощью блока (15) низкочастотного деакцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.
13. Аудиодекодер (12) по п. 12, который включает в себя комбинацию (17, 18) преобразователя (17) из частотной области во временную область и фильтра (18) обратного кодирования с линейным предсказанием, получающего множество коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов, причем эта комбинация (17, 18) выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра (RS) во временную область для того, чтобы вывести выходной сигнал (OS), основанный на обратно обработанном спектре (RS) и на коэффициентах (LC) кодирования с линейным предсказанием.
14. Аудиодекодер по п. 13, в котором преобразователь (17) из частотной области во временную область выполнен с возможностью оценки временного сигнала (TS), на основе обратно обработанного спектра (RS), и причем обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала (OS), на основе временного сигнала (TS).
15. Аудиодекодер по п. 13, в котором обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала (IFS), на основе обратно обработанного спектра (RS), и причем преобразователь (17) из частотной области во временную область выполнен с возможностью вывода выходного сигнала (OS), на основе обратно фильтрованного сигнала (IFS).
16. Аудиодекодер по п. 12, в котором управляющее устройство (16) включает в себя спектральный анализатор (19), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (20) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (21, 22) вычисления коэффициента деакцентирования, выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии для вычисления спектральных линий (SLD) обратно обработанного спектра (RS), представляющих более низкую частоту, чем референсная спектральная линия (RSLD), на основе минимума (MI) и максимума (MA), причем спектральные линии (SLD) обратно обработанного спектра (RS) деакцентируются путем применения коэффициентов (SDF) деакцентирования спектральной линии к спектральным линиям деквантованного спектра (DQ).
17. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты (SDF) деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии (RSLD) к спектральной линии (SL), представляющей самую низкую частоту обратно обработанного спектра (RS).
18. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования включает в себя первый каскад (21), выполненный с возможностью вычисления базисного коэффициента (BDF) деакцентирования в соответствии с первой формулой δ=(α·min/max), где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и δ является базисным коэффициентом (BDF) деакцентирования, и причем блок (21, 22) вычисления коэффициента деакцентирования включает в себя второй каскад (22), выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии в соответствии со второй формулой
Figure 00000001
ii’-i, в которой i’ является количеством спектральных линий (SLD), которые будут деакцентированы, i является индексом соответствующей спектральной линии (SLD), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, δ является базисным коэффициентом (BDF) деакцентирования, и
Figure 00000001
i является коэффициентом (SDF) деакцентирования спектральной линии с индексом i.
19. Аудиодекодер по п. 18, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.
20. Аудиодекодер по п. 18, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий (SLD), θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.
21. Аудиодекодер по п. 12, в котором референсная спектральная линия (RSLD) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.
22. Аудиодекодер по п. 16, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSLD).
23. Аудиодекодер по п. 12, в котором управляющее устройство (16) конфигурируется таким образом, что спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкую частоту, чем референсная спектральная линия (RSLD), деакцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.
24. Система, включающая в себя декодер (12) и кодер (1), в которой кодер (1) спроектирован в соответствии с одним из пп. 1-11 и/или декодер спроектирован в соответствии с одним из пп. 12-23.
25. Способ кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем способ включает в себя этапы:
фильтрования с фильтром (2) кодирования с линейным предсказанием, имеющим множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;
вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и
управления вычислением обработанного спектра (PS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;
производства квантованного спектра (QS), на основе обработанного спектра (PS); и
встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.
26. Способ для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного с помощью способа по предшествующему пункту, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем способ включает в себя этапы:
извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;
производства деквантованного спектра (DQ), на основе квантованного спектра (QS);
вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и
управления вычислением обратно обработанного спектра (RS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.
27. Компьютерная программа, которая при ее выполнении на компьютере или процессоре выполняет способ по п. 25 или 26.
RU2015136223A 2013-01-29 2014-01-28 Низкочастотное акцентирование для основанного на lpc кодирования в частотной области RU2612589C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758103P 2013-01-29 2013-01-29
US61/758,103 2013-01-29
PCT/EP2014/051585 WO2014118152A1 (en) 2013-01-29 2014-01-28 Low-frequency emphasis for lpc-based coding in frequency domain

Publications (2)

Publication Number Publication Date
RU2015136223A true RU2015136223A (ru) 2017-03-06
RU2612589C2 RU2612589C2 (ru) 2017-03-09

Family

ID=50030281

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015136223A RU2612589C2 (ru) 2013-01-29 2014-01-28 Низкочастотное акцентирование для основанного на lpc кодирования в частотной области

Country Status (20)

Country Link
US (5) US10176817B2 (ru)
EP (1) EP2951814B1 (ru)
JP (1) JP6148811B2 (ru)
KR (1) KR101792712B1 (ru)
CN (2) CN105122357B (ru)
AR (2) AR094682A1 (ru)
AU (1) AU2014211520B2 (ru)
BR (1) BR112015018040B1 (ru)
CA (1) CA2898677C (ru)
ES (1) ES2635142T3 (ru)
HK (1) HK1218018A1 (ru)
MX (1) MX346927B (ru)
MY (1) MY178306A (ru)
PL (1) PL2951814T3 (ru)
PT (1) PT2951814T (ru)
RU (1) RU2612589C2 (ru)
SG (1) SG11201505911SA (ru)
TW (1) TWI536369B (ru)
WO (1) WO2014118152A1 (ru)
ZA (1) ZA201506314B (ru)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101792712B1 (ko) 2013-01-29 2017-11-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
US9338627B1 (en) 2015-01-28 2016-05-10 Arati P Singh Portable device for indicating emergency events
US11380340B2 (en) * 2016-09-09 2022-07-05 Dts, Inc. System and method for long term prediction in audio codecs
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3701527B1 (en) * 2017-10-27 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating a bandwidth-enhanced audio signal using a neural network processor
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
JP7130878B2 (ja) * 2019-01-13 2022-09-05 華為技術有限公司 高分解能オーディオコーディング
TWI789577B (zh) * 2020-04-01 2023-01-11 同響科技股份有限公司 音訊資料重建方法及系統
GB2613033B (en) * 2021-11-17 2024-07-17 Cirrus Logic Int Semiconductor Ltd Controlling slew rate

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4139732A (en) * 1975-01-24 1979-02-13 Larynogograph Limited Apparatus for speech pattern derivation
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
US5548647A (en) * 1987-04-03 1996-08-20 Texas Instruments Incorporated Fixed text speaker verification method and apparatus
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US5173941A (en) * 1991-05-31 1992-12-22 Motorola, Inc. Reduced codebook search arrangement for CELP vocoders
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3360423B2 (ja) * 1994-06-21 2002-12-24 三菱電機株式会社 音声強調装置
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
CA2356869C (en) * 1998-12-28 2004-11-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
US6278972B1 (en) * 1999-01-04 2001-08-21 Qualcomm Incorporated System and method for segmentation and recognition of speech signals
JP3526776B2 (ja) * 1999-03-26 2004-05-17 ローム株式会社 音源装置及び携帯機器
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
JP2001117573A (ja) * 1999-10-20 2001-04-27 Toshiba Corp 音声スペクトル強調方法/装置及び音声復号化装置
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2002318594A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
US20040153313A1 (en) * 2001-05-11 2004-08-05 Roland Aubauer Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
BR0305556A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar pelo menos parte de um sinal de áudio a fim de obter um sinal codificado, sinal codificado representando pelo menos parte de um sinal de áudio, meio de armazenamento, método e decodificador para decodificar um sinal codificado, transmissor, receptor, e, sistema
US8019598B2 (en) * 2002-11-15 2011-09-13 Texas Instruments Incorporated Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition
SG135920A1 (en) * 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
US6988064B2 (en) * 2003-03-31 2006-01-17 Motorola, Inc. System and method for combined frequency-domain and time-domain pitch extraction for speech signals
DE60330715D1 (de) * 2003-05-01 2010-02-04 Fujitsu Ltd Sprachdecodierer, sprachdecodierungsverfahren, programm,aufzeichnungsmedium
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
US7640157B2 (en) * 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
ATE373302T1 (de) * 2004-05-14 2007-09-15 Loquendo Spa Rauschminderung für die automatische spracherkennung
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
WO2006030865A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
SG160390A1 (en) * 2005-03-11 2010-04-29 Agency Science Tech & Res Predictor
US7599833B2 (en) * 2005-05-30 2009-10-06 Electronics And Telecommunications Research Institute Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
RU2414009C2 (ru) * 2006-01-18 2011-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ для кодирования и декодирования сигнала
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
EP2118892B1 (en) * 2007-02-12 2010-07-14 Dolby Laboratories Licensing Corporation Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US20110022924A1 (en) * 2007-06-14 2011-01-27 Vladimir Malenovsky Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
EP4235660B1 (en) * 2008-07-11 2024-06-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder
PT2410522T (pt) * 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador
MX2011000369A (es) * 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2471061B1 (en) 2009-10-08 2013-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
BR112013026452B1 (pt) * 2012-01-20 2021-02-17 Fraunhofer-Gellschaft Zur Förderung Der Angewandten Forschung E.V. aparelho e método para codificação e decodificação de áudio empregando substituição sinusoidal
KR101792712B1 (ko) 2013-01-29 2017-11-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
US20140358529A1 (en) * 2013-05-29 2014-12-04 Tencent Technology (Shenzhen) Company Limited Systems, Devices and Methods for Processing Speech Signals

Also Published As

Publication number Publication date
CN110047500B (zh) 2023-09-05
EP2951814A1 (en) 2015-12-09
US20180240467A1 (en) 2018-08-23
CA2898677A1 (en) 2014-08-07
CN110047500A (zh) 2019-07-23
CN105122357B (zh) 2019-04-23
US10176817B2 (en) 2019-01-08
US11854561B2 (en) 2023-12-26
US20180293993A9 (en) 2018-10-11
RU2612589C2 (ru) 2017-03-09
PT2951814T (pt) 2017-07-25
AU2014211520A1 (en) 2015-09-17
CN105122357A (zh) 2015-12-02
US11568883B2 (en) 2023-01-31
EP2951814B1 (en) 2017-05-10
ES2635142T3 (es) 2017-10-02
AR115901A2 (es) 2021-03-10
AR094682A1 (es) 2015-08-19
AU2014211520B2 (en) 2017-04-06
US10692513B2 (en) 2020-06-23
US20150332695A1 (en) 2015-11-19
MX2015009752A (es) 2015-11-06
JP6148811B2 (ja) 2017-06-14
TW201435861A (zh) 2014-09-16
WO2014118152A1 (en) 2014-08-07
JP2016508618A (ja) 2016-03-22
HK1218018A1 (zh) 2017-01-27
SG11201505911SA (en) 2015-08-28
ZA201506314B (en) 2016-07-27
BR112015018040A2 (ru) 2017-07-11
MY178306A (en) 2020-10-07
PL2951814T3 (pl) 2017-10-31
TWI536369B (zh) 2016-06-01
US20240119953A1 (en) 2024-04-11
CA2898677C (en) 2017-12-05
KR20150110708A (ko) 2015-10-02
US20230087652A1 (en) 2023-03-23
KR101792712B1 (ko) 2017-11-02
MX346927B (es) 2017-04-05
US20200327896A1 (en) 2020-10-15
BR112015018040B1 (pt) 2022-01-18

Similar Documents

Publication Publication Date Title
RU2015136223A (ru) Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
KR100958144B1 (ko) 오디오 압축
AU2014336097B2 (en) Coding of spectral coefficients of a spectrum of an audio signal
US20240233739A1 (en) Linear prediction analysis device, method, program, and storage medium
RU2010132643A (ru) Аудиокодер и декодер
RU2763848C2 (ru) Улучшенное расширение диапазона частот в декодере звукового сигнала
RU2656681C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ, и устройство для декодирования аудиосигналов
WO2011086924A1 (ja) 音声符号化装置および音声符号化方法
KR101794149B1 (ko) Celp 같은 코더들을 위한 부가정보 없는 잡음 충전 장치 및 방법
RU2608447C1 (ru) Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов
CN107221334B (zh) 一种音频带宽扩展的方法及扩展装置
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
JP2015184470A5 (ru)
TWI701658B (zh) 時間雜訊成形技術
JP2014531063A (ja) 音声信号の帯域選択的量子化方法及び装置
KR101108955B1 (ko) 오디오 신호 처리 방법 및 장치
US9640191B2 (en) Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal
KR101170466B1 (ko) Mdct 영역에서의 후처리 방법, 및 장치
Lee et al. Pre-echo control using an improved post-filter in the frequency domain
RU2019122302A (ru) Аудиокодер и декодер
JP2006201375A (ja) オーディオ符号化方法およびオーディオ符号化装置
TH1501004235A (th) การเน้นย้ำความสำคัญของความถี่ต่ำสำหรับการลงรหัสที่มีแอลพีซีเป็นพื้นฐานในโดเมนความถี่