RU2015136223A - Низкочастотное акцентирование для основанного на lpc кодирования в частотной области - Google Patents
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области Download PDFInfo
- Publication number
- RU2015136223A RU2015136223A RU2015136223A RU2015136223A RU2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A RU 2015136223 A RU2015136223 A RU 2015136223A
- Authority
- RU
- Russia
- Prior art keywords
- spectrum
- linear prediction
- spectral line
- spectral
- prediction coding
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 claims 62
- 238000001228 spectrum Methods 0.000 claims 55
- 230000005236 sound signal Effects 0.000 claims 18
- 238000004364 calculation method Methods 0.000 claims 10
- 238000000034 method Methods 0.000 claims 6
- 230000009849 deactivation Effects 0.000 claims 4
- 238000004519 manufacturing process Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (45)
1. Аудиокодер для кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем аудиокодер (1) включает в себя:
комбинацию (2, 3) фильтра (2) кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя (3) из временной области в частотную область, причем эта комбинация (2, 3) выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;
блок (4) низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), в котором спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы;
управляющее устройство (5), выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока (4) низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;
устройство (6) квантования, выполненное с возможностью производства квантованного спектра (QS), на основе обработанного спектра (PS);
а также генератор (7) потока битов, выполненный с возможностью встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.
2. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на фильтр (2) кодирования с линейным предсказанием, причем фильтрованный фрейм (FF) выводится фильтром (2) кодирования с линейным предсказанием и при этом преобразователь (3) из временной области в частотную область выполнен с возможностью оценки спектра (SP) на основе фильтрованного фрейма (FF).
3. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на преобразователь (3) из временной области в частотную область, причем преобразованный фрейм (FC) выводится преобразователем (3) из временной области в частотную область и при этом фильтр (2) кодирования с линейным предсказанием выполнен с возможностью оценки спектра (SP) на основе преобразованного фрейма (FC).
4. Аудиокодер по п. 1, в котором управляющее устройство (5) включает в себя спектральный анализатор (8), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (9) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (10, 11) вычисления коэффициента акцентирования, выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии для вычисления спектральных линий (SL) обработанного спектра (PS), представляющих более низкую частоту, чем референсная спектральная линия (RSL), на основе минимума (MI) и максимума (MA), причем спектральные линии (SL) обработанного спектра (PS) акцентируются путем применения коэффициентов (SEF) акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма.
5. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициенты (SEF) акцентирования спектральной линии увеличиваются в направлении от референсной спектральной линии (RSL) к спектральной линии (SL), представляющей самую низкую частоту спектра (SP).
6. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования включает в себя первый каскад (10), выполненный с возможностью вычисления базисного коэффициента (BEF) акцентирования в соответствии с первой формулой γ=(α·min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и γ является базисным коэффициентом (BEF) акцентирования, и причем блок (10, 11) вычисления коэффициента акцентирования включает в себя второй каскад (11), выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии в соответствии со второй формулой εi=γi’-i, в которой i’ является количеством спектральных линий (SL), которые будут акцентированы, i является индексом соответствующей спектральной линии (SL), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, γ является базисным коэффициентом (BEF) акцентирования, и εi является коэффициентом (SEF) акцентирования спектральной линии с индексом i.
7. Аудиокодер по п. 6, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.
8. Аудиокодер по п. 6, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.
9. Аудиокодер по п. 1, в котором референсная спектральная линия (RSL) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.
10. Аудиокодер по п. 4, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSL).
11. Аудиокодер по п. 1, в котором управляющее устройство (5) конфигурируется таким образом, что спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.
12. Аудиодекодер (12) для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного аудиокодером (1) по пп. 1-12, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем аудиодекодер (12) включает в себя:
приемник (13) потока битов, выполненный с возможностью извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;
устройство (14) деквантования, выполненное с возможностью производства деквантованного спектра (DQ) на основе квантованного спектра (QS);
блок (15) низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и
управляющее устройство (16), выполненное с возможностью управления вычислением обратно обработанного спектра (RS) с помощью блока (15) низкочастотного деакцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.
13. Аудиодекодер (12) по п. 12, который включает в себя комбинацию (17, 18) преобразователя (17) из частотной области во временную область и фильтра (18) обратного кодирования с линейным предсказанием, получающего множество коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов, причем эта комбинация (17, 18) выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра (RS) во временную область для того, чтобы вывести выходной сигнал (OS), основанный на обратно обработанном спектре (RS) и на коэффициентах (LC) кодирования с линейным предсказанием.
14. Аудиодекодер по п. 13, в котором преобразователь (17) из частотной области во временную область выполнен с возможностью оценки временного сигнала (TS), на основе обратно обработанного спектра (RS), и причем обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала (OS), на основе временного сигнала (TS).
15. Аудиодекодер по п. 13, в котором обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала (IFS), на основе обратно обработанного спектра (RS), и причем преобразователь (17) из частотной области во временную область выполнен с возможностью вывода выходного сигнала (OS), на основе обратно фильтрованного сигнала (IFS).
16. Аудиодекодер по п. 12, в котором управляющее устройство (16) включает в себя спектральный анализатор (19), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (20) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (MA) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (21, 22) вычисления коэффициента деакцентирования, выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии для вычисления спектральных линий (SLD) обратно обработанного спектра (RS), представляющих более низкую частоту, чем референсная спектральная линия (RSLD), на основе минимума (MI) и максимума (MA), причем спектральные линии (SLD) обратно обработанного спектра (RS) деакцентируются путем применения коэффициентов (SDF) деакцентирования спектральной линии к спектральным линиям деквантованного спектра (DQ).
17. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты (SDF) деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии (RSLD) к спектральной линии (SL), представляющей самую низкую частоту обратно обработанного спектра (RS).
18. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования включает в себя первый каскад (21), выполненный с возможностью вычисления базисного коэффициента (BDF) деакцентирования в соответствии с первой формулой δ=(α·min/max)-β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (MA) спектрального представления (SR), и δ является базисным коэффициентом (BDF) деакцентирования, и причем блок (21, 22) вычисления коэффициента деакцентирования включает в себя второй каскад (22), выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии в соответствии со второй формулой i=δi’-i, в которой i’ является количеством спектральных линий (SLD), которые будут деакцентированы, i является индексом соответствующей спектральной линии (SLD), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 ... i’-1, δ является базисным коэффициентом (BDF) деакцентирования, и i является коэффициентом (SDF) деакцентирования спектральной линии с индексом i.
19. Аудиодекодер по п. 18, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.
20. Аудиодекодер по п. 18, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ·i’), в которой i’ является количеством акцентируемых спектральных линий (SLD), θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.
21. Аудиодекодер по п. 12, в котором референсная спектральная линия (RSLD) представляет частоту между 600 и 1000 Гц, в частности между 700 и 900 Гц, более конкретно между 750 и 850 Гц.
22. Аудиодекодер по п. 16, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSLD).
23. Аудиодекодер по п. 12, в котором управляющее устройство (16) конфигурируется таким образом, что спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкую частоту, чем референсная спектральная линия (RSLD), деакцентируются только в том случае, если максимум (MA) меньше минимума (MI), умноженного на первую заданную величину.
24. Система, включающая в себя декодер (12) и кодер (1), в которой кодер (1) спроектирован в соответствии с одним из пп. 1-11 и/или декодер спроектирован в соответствии с одним из пп. 12-23.
25. Способ кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем способ включает в себя этапы:
фильтрования с фильтром (2) кодирования с линейным предсказанием, имеющим множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;
вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и
управления вычислением обработанного спектра (PS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;
производства квантованного спектра (QS), на основе обработанного спектра (PS); и
встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.
26. Способ для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного с помощью способа по предшествующему пункту, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем способ включает в себя этапы:
извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;
производства деквантованного спектра (DQ), на основе квантованного спектра (QS);
вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и
управления вычислением обратно обработанного спектра (RS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.
27. Компьютерная программа, которая при ее выполнении на компьютере или процессоре выполняет способ по п. 25 или 26.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758103P | 2013-01-29 | 2013-01-29 | |
US61/758,103 | 2013-01-29 | ||
PCT/EP2014/051585 WO2014118152A1 (en) | 2013-01-29 | 2014-01-28 | Low-frequency emphasis for lpc-based coding in frequency domain |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2015136223A true RU2015136223A (ru) | 2017-03-06 |
RU2612589C2 RU2612589C2 (ru) | 2017-03-09 |
Family
ID=50030281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015136223A RU2612589C2 (ru) | 2013-01-29 | 2014-01-28 | Низкочастотное акцентирование для основанного на lpc кодирования в частотной области |
Country Status (20)
Country | Link |
---|---|
US (5) | US10176817B2 (ru) |
EP (1) | EP2951814B1 (ru) |
JP (1) | JP6148811B2 (ru) |
KR (1) | KR101792712B1 (ru) |
CN (2) | CN105122357B (ru) |
AR (2) | AR094682A1 (ru) |
AU (1) | AU2014211520B2 (ru) |
BR (1) | BR112015018040B1 (ru) |
CA (1) | CA2898677C (ru) |
ES (1) | ES2635142T3 (ru) |
HK (1) | HK1218018A1 (ru) |
MX (1) | MX346927B (ru) |
MY (1) | MY178306A (ru) |
PL (1) | PL2951814T3 (ru) |
PT (1) | PT2951814T (ru) |
RU (1) | RU2612589C2 (ru) |
SG (1) | SG11201505911SA (ru) |
TW (1) | TWI536369B (ru) |
WO (1) | WO2014118152A1 (ru) |
ZA (1) | ZA201506314B (ru) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101792712B1 (ko) | 2013-01-29 | 2017-11-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
US9338627B1 (en) | 2015-01-28 | 2016-05-10 | Arati P Singh | Portable device for indicating emergency events |
US11380340B2 (en) * | 2016-09-09 | 2022-07-05 | Dts, Inc. | System and method for long term prediction in audio codecs |
EP3382701A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3701527B1 (en) * | 2017-10-27 | 2023-08-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating a bandwidth-enhanced audio signal using a neural network processor |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
JP7130878B2 (ja) * | 2019-01-13 | 2022-09-05 | 華為技術有限公司 | 高分解能オーディオコーディング |
TWI789577B (zh) * | 2020-04-01 | 2023-01-11 | 同響科技股份有限公司 | 音訊資料重建方法及系統 |
GB2613033B (en) * | 2021-11-17 | 2024-07-17 | Cirrus Logic Int Semiconductor Ltd | Controlling slew rate |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4139732A (en) * | 1975-01-24 | 1979-02-13 | Larynogograph Limited | Apparatus for speech pattern derivation |
JPH0738118B2 (ja) * | 1987-02-04 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
US5548647A (en) * | 1987-04-03 | 1996-08-20 | Texas Instruments Incorporated | Fixed text speaker verification method and apparatus |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US5173941A (en) * | 1991-05-31 | 1992-12-22 | Motorola, Inc. | Reduced codebook search arrangement for CELP vocoders |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3360423B2 (ja) * | 1994-06-21 | 2002-12-24 | 三菱電機株式会社 | 音声強調装置 |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
CA2356869C (en) * | 1998-12-28 | 2004-11-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
US6278972B1 (en) * | 1999-01-04 | 2001-08-21 | Qualcomm Incorporated | System and method for segmentation and recognition of speech signals |
JP3526776B2 (ja) * | 1999-03-26 | 2004-05-17 | ローム株式会社 | 音源装置及び携帯機器 |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
JP2001117573A (ja) * | 1999-10-20 | 2001-04-27 | Toshiba Corp | 音声スペクトル強調方法/装置及び音声復号化装置 |
US6754618B1 (en) * | 2000-06-07 | 2004-06-22 | Cirrus Logic, Inc. | Fast implementation of MPEG audio coding |
US6748363B1 (en) * | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
JP2002318594A (ja) * | 2001-04-20 | 2002-10-31 | Sony Corp | 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体 |
US20040153313A1 (en) * | 2001-05-11 | 2004-08-05 | Roland Aubauer | Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
BR0305556A (pt) * | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar pelo menos parte de um sinal de áudio a fim de obter um sinal codificado, sinal codificado representando pelo menos parte de um sinal de áudio, meio de armazenamento, método e decodificador para decodificar um sinal codificado, transmissor, receptor, e, sistema |
US8019598B2 (en) * | 2002-11-15 | 2011-09-13 | Texas Instruments Incorporated | Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition |
SG135920A1 (en) * | 2003-03-07 | 2007-10-29 | St Microelectronics Asia | Device and process for use in encoding audio data |
US6988064B2 (en) * | 2003-03-31 | 2006-01-17 | Motorola, Inc. | System and method for combined frequency-domain and time-domain pitch extraction for speech signals |
DE60330715D1 (de) * | 2003-05-01 | 2010-02-04 | Fujitsu Ltd | Sprachdecodierer, sprachdecodierungsverfahren, programm,aufzeichnungsmedium |
DE10321983A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
US7640157B2 (en) * | 2003-09-26 | 2009-12-29 | Ittiam Systems (P) Ltd. | Systems and methods for low bit rate audio coders |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
ATE373302T1 (de) * | 2004-05-14 | 2007-09-15 | Loquendo Spa | Rauschminderung für die automatische spracherkennung |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
WO2006030865A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
SG160390A1 (en) * | 2005-03-11 | 2010-04-29 | Agency Science Tech & Res | Predictor |
US7599833B2 (en) * | 2005-05-30 | 2009-10-06 | Electronics And Telecommunications Research Institute | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same |
RU2414009C2 (ru) * | 2006-01-18 | 2011-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Устройство и способ для кодирования и декодирования сигнала |
US20090018824A1 (en) * | 2006-01-31 | 2009-01-15 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method |
EP2118892B1 (en) * | 2007-02-12 | 2010-07-14 | Dolby Laboratories Licensing Corporation | Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US20110022924A1 (en) * | 2007-06-14 | 2011-01-27 | Vladimir Malenovsky | Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
EP4235660B1 (en) * | 2008-07-11 | 2024-06-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder |
PT2410522T (pt) * | 2008-07-11 | 2018-01-09 | Fraunhofer Ges Forschung | Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador |
MX2011000369A (es) * | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2471061B1 (en) | 2009-10-08 | 2013-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
EP3693963B1 (en) * | 2009-10-15 | 2021-07-21 | VoiceAge Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
MY166169A (en) * | 2009-10-20 | 2018-06-07 | Fraunhofer Ges Forschung | Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation |
EP2362375A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
US9536534B2 (en) * | 2011-04-20 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof |
US9934780B2 (en) * | 2012-01-17 | 2018-04-03 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch |
BR112013026452B1 (pt) * | 2012-01-20 | 2021-02-17 | Fraunhofer-Gellschaft Zur Förderung Der Angewandten Forschung E.V. | aparelho e método para codificação e decodificação de áudio empregando substituição sinusoidal |
KR101792712B1 (ko) | 2013-01-29 | 2017-11-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 |
US20140358529A1 (en) * | 2013-05-29 | 2014-12-04 | Tencent Technology (Shenzhen) Company Limited | Systems, Devices and Methods for Processing Speech Signals |
-
2014
- 2014-01-28 KR KR1020157022714A patent/KR101792712B1/ko active IP Right Grant
- 2014-01-28 CN CN201480006543.2A patent/CN105122357B/zh active Active
- 2014-01-28 WO PCT/EP2014/051585 patent/WO2014118152A1/en active Application Filing
- 2014-01-28 MY MYPI2015001900A patent/MY178306A/en unknown
- 2014-01-28 PL PL14701984T patent/PL2951814T3/pl unknown
- 2014-01-28 CN CN201910222132.1A patent/CN110047500B/zh active Active
- 2014-01-28 BR BR112015018040-0A patent/BR112015018040B1/pt active IP Right Grant
- 2014-01-28 RU RU2015136223A patent/RU2612589C2/ru active
- 2014-01-28 EP EP14701984.8A patent/EP2951814B1/en active Active
- 2014-01-28 PT PT147019848T patent/PT2951814T/pt unknown
- 2014-01-28 JP JP2015554192A patent/JP6148811B2/ja active Active
- 2014-01-28 ES ES14701984.8T patent/ES2635142T3/es active Active
- 2014-01-28 SG SG11201505911SA patent/SG11201505911SA/en unknown
- 2014-01-28 MX MX2015009752A patent/MX346927B/es active IP Right Grant
- 2014-01-28 CA CA2898677A patent/CA2898677C/en active Active
- 2014-01-28 AU AU2014211520A patent/AU2014211520B2/en active Active
- 2014-01-29 TW TW103103509A patent/TWI536369B/zh active
- 2014-01-29 AR ARP140100298A patent/AR094682A1/es active IP Right Grant
-
2015
- 2015-07-28 US US14/811,716 patent/US10176817B2/en active Active
- 2015-08-28 ZA ZA2015/06314A patent/ZA201506314B/en unknown
-
2016
- 2016-05-24 HK HK16105887.7A patent/HK1218018A1/zh unknown
-
2018
- 2018-04-18 US US15/956,591 patent/US10692513B2/en active Active
-
2019
- 2019-08-02 AR ARP190102203A patent/AR115901A2/es active IP Right Grant
-
2020
- 2020-06-11 US US16/899,328 patent/US11568883B2/en active Active
-
2022
- 2022-11-22 US US17/992,496 patent/US11854561B2/en active Active
-
2023
- 2023-12-05 US US18/529,840 patent/US20240119953A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2015136223A (ru) | Низкочастотное акцентирование для основанного на lpc кодирования в частотной области | |
KR100958144B1 (ko) | 오디오 압축 | |
AU2014336097B2 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
US20240233739A1 (en) | Linear prediction analysis device, method, program, and storage medium | |
RU2010132643A (ru) | Аудиокодер и декодер | |
RU2763848C2 (ru) | Улучшенное расширение диапазона частот в декодере звукового сигнала | |
RU2656681C1 (ru) | Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ, и устройство для декодирования аудиосигналов | |
WO2011086924A1 (ja) | 音声符号化装置および音声符号化方法 | |
KR101794149B1 (ko) | Celp 같은 코더들을 위한 부가정보 없는 잡음 충전 장치 및 방법 | |
RU2608447C1 (ru) | Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов | |
CN107221334B (zh) | 一种音频带宽扩展的方法及扩展装置 | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
JP2015184470A5 (ru) | ||
TWI701658B (zh) | 時間雜訊成形技術 | |
JP2014531063A (ja) | 音声信号の帯域選択的量子化方法及び装置 | |
KR101108955B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
US9640191B2 (en) | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal | |
KR101170466B1 (ko) | Mdct 영역에서의 후처리 방법, 및 장치 | |
Lee et al. | Pre-echo control using an improved post-filter in the frequency domain | |
RU2019122302A (ru) | Аудиокодер и декодер | |
JP2006201375A (ja) | オーディオ符号化方法およびオーディオ符号化装置 | |
TH1501004235A (th) | การเน้นย้ำความสำคัญของความถี่ต่ำสำหรับการลงรหัสที่มีแอลพีซีเป็นพื้นฐานในโดเมนความถี่ |