RU2016118979A - Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации - Google Patents
Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации Download PDFInfo
- Publication number
- RU2016118979A RU2016118979A RU2016118979A RU2016118979A RU2016118979A RU 2016118979 A RU2016118979 A RU 2016118979A RU 2016118979 A RU2016118979 A RU 2016118979A RU 2016118979 A RU2016118979 A RU 2016118979A RU 2016118979 A RU2016118979 A RU 2016118979A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- gain
- parameter
- excitation
- information
- Prior art date
Links
- 230000005284 excitation Effects 0.000 claims 44
- 230000005236 sound signal Effects 0.000 claims 10
- 238000001228 spectrum Methods 0.000 claims 10
- 238000004364 calculation method Methods 0.000 claims 8
- 230000015572 biosynthetic process Effects 0.000 claims 5
- 238000000034 method Methods 0.000 claims 4
- 230000003595 spectral effect Effects 0.000 claims 2
- 230000003321 amplification Effects 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 238000003199 nucleic acid amplification method Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/932—Decision in previous or following frames
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (62)
1. Кодер для кодирования аудиосигнала, причем кодер содержит:
- анализатор (120; 320), выполненный с возможностью извлечения коэффициентов (122; 322) прогнозирования и остаточного сигнала из невокализованного кадра аудиосигнала (102);
- модуль (550; 550') вычисления параметров усиления, выполненный с возможностью вычисления информации первого параметра (gc) усиления для задания первого сигнала (c(n)) возбуждения, связанного с детерминированной таблицей кодирования, и вычисления информации второго параметра (gn) усиления для задания второго сигнала (n(n)) возбуждения, связанного с шумоподобным сигналом для невокализованного кадра; и
- модуль (690) формирования потоков битов, выполненный с возможностью формирования выходного сигнала (692) на основе информации (142), связанной с вокализованным кадром сигнала, информации первого параметра (gc) усиления и информации второго параметра (gn) усиления.
2. Кодер по п. 1, в котором модуль (550; 550') вычисления параметров усиления выполнен с возможностью вычисления первого параметра (gc) усиления и второго параметра (gn) усиления, при этом модуль (690) формирования потоков битов выполнен с возможностью формирования выходного сигнала (692) на основе первого параметра (gc) усиления и второго параметра (gn) усиления; или
- при этом модуль (550; 550') вычисления параметров усиления содержит квантователь (170-1, 170-2), выполненный с возможностью квантования первого параметра (gc) усиления для получения первого параметра ( ) квантованного усиления, и квантования второго параметра (gn) усиления для получения второго параметра ( ) квантованного усиления, при этом модуль (690) формирования потоков битов выполнен с возможностью формирования выходного сигнала (692) на основе первого параметра ( ) квантованного усиления и второго параметра ( ) квантованного усиления.
3. Кодер по п. 1 или 2, дополнительно содержащий модуль (160) вычисления информации формант, выполненный с возможностью вычисления информации (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования, при этом модуль (550; 550') вычисления параметров усиления выполнен с возможностью вычислять информацию (gc) первых параметров усиления и информацию (gn) вторых параметров усиления на основе информации (162) формирования речевого спектра.
4. Кодер по одному из предшествующих пунктов, в котором модуль (550') вычисления параметров усиления содержит:
- первый усилитель (550e), выполненный с возможностью усиления первого сигнала (c(n)) возбуждения посредством применения первого параметра gc усиления, чтобы получать первый усиленный сигнал (550f) возбуждения;
- второй усилитель (350e; 550g), выполненный с возможностью усиления второго сигнала (n(n)) возбуждения, отличающегося от первого сигнала возбуждения (c(n)), посредством применения второго параметра (gn) усиления, чтобы получать второй усиленный сигнал (350g; 550h) возбуждения;
- модуль (550i) комбинирования, выполненный с возможностью комбинирования первого усиленного сигнала (550f) возбуждения и второго усиленного сигнала (350g; 550h) возбуждения, чтобы получать комбинированный сигнал (550k; 550k') возбуждения;
- контроллер (550n), выполненный с возможностью фильтрации комбинированного сигнала (550k; 550k') возбуждения с помощью синтезирующего фильтра, чтобы получать синтезированный сигнал (350l'), сравнения синтезированного сигнала (350l') и кадра (102) аудиосигнала, чтобы получать результат сравнения, адаптировать первый параметр (gc) усиления или второй параметр (gn) усиления на основе результата сравнения; и
5. Кодер по одному из предшествующих пунктов, в котором контроллер (550; 550') параметров усиления дополнительно содержит, по меньшей мере, один формирователь (350; 550b), выполненный с возможностью придания определенной формы спектру первого сигнала (c(n)) возбуждения или сигнала, извлекаемого из него, или второго сигнала (n(n)) возбуждения или сигнала, извлекаемого из него, на основе информации (162) формирования спектра.
6. Кодер по одному из предшествующих пунктов, в котором кодер выполнен с возможностью кодирования аудиосигнала (102) покадрово в последовательности кадров, при этом модуль (550; 550') вычисления параметров усиления выполнен с возможностью определения первого параметра (gc) усиления и второго параметра (gn) усиления для каждого из множества субкадров обработанного кадра, при этом контроллер (550; 550') параметров усиления выполнен с возможностью определения среднего значения энергии, ассоциированного с обработанным кадром.
7. Кодер по одному из предшествующих пунктов, дополнительно содержащий:
- модуль (160) вычисления информации формант, выполненный с возможностью вычисления, по меньшей мере, первой информации формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- решающий модуль (130), выполненный с возможностью определения того, определен или нет остаточный сигнал из аудиокадра невокализованного сигнала.
8. Кодер по одному из предшествующих пунктов, в котором контроллер (550; 550') параметров усиления содержит контроллер (550n), выполненный с возможностью определения первого параметра (gc) усиления на основе следующего:
- при этом cw(n) является фильтрованным сигналом возбуждения изобретаемой таблицы кодирования, и xw(n) является целевым перцепционным возбуждением, вычисленным в CELP-кодере;
- при этом Lsf является размером субкадра в выборках.
9. Кодер по одному из предшествующих пунктов, дополнительно содержащий квантователь (170-1, 170-2), выполненный с возможностью квантования первого параметра (gc) усиления, чтобы получать квантованный первый параметр усиления (), при этом контроллер (550n) параметров усиления выполнен с возможностью определения первого параметра (gc) усиления на основе следующего:
- при этом gc является первым параметром усиления, Lsfis является размером субкадра в выборках, cw(n) обозначает первый сигнал возбуждения определенной формы, xw(n) обозначает сигнал кодирования на основе линейного прогнозирования с возбуждением по коду,
- при этом контроллер (550n) параметров усиления или квантователь (170-1, 170-2) дополнительно выполнен с возможностью нормализации первого параметра (gc) усиления, чтобы получать нормализованный первый параметр усиления на основе следующего:
10. Кодер по п. 9, в котором квантователь (170-1, 170-2) выполнен с возможностью квантования второго параметра (gn) усиления, чтобы получать квантованный второй параметр ( ) усиления, при этом контроллер (550; 550') параметров усиления выполнен с возможностью определять второй параметр (gn) усиления посредством определения значения ошибки на основе следующего:
- при этом переменный коэффициент ослабления в диапазоне между 0,5 и 1, Lsf соответствует размеру субкадра обработанного аудиокадра, cw(n) обозначает первый сигнал (c(n)) возбуждения определенной формы, xw(n) обозначает сигнал кодирования на основе линейного прогнозирования с возбуждением по коду, gn обозначает второй параметр усиления, и обозначает квантованный первый параметр усиления;
- при этом контроллер (550; 550') параметров усиления выполнен с возможностью определения ошибки для текущего субкадра, при этом квантователь (170-1, 170-2) выполнен с возможностью определения квантованного второго усиления ( ), которое минимизирует ошибку, и получения квантованного второго усиления ( ) на основе следующего:
11. Кодер по п. 10, в котором модуль (550i) комбинирования выполнен с возможностью комбинирования первого параметра (gc) усиления и второго параметра (gn) усиления, чтобы получать комбинированный сигнал (e(n)) возбуждения на основе следующего:
12. Декодер (1000) для декодирования принимаемого аудиосигнала (1002), содержащего информацию, связанную с коэффициентами (122) прогнозирования, причем декодер (1000) содержит:
- генератор (1010) первых сигналов, выполненный с возможностью формирования первого сигнала (1012) возбуждения из детерминированной таблицы кодирования для части синтезированного сигнала (1062);
- генератор (1020) вторых сигналов, выполненный с возможностью формирования второго сигнала (1022) возбуждения из шумоподобного сигнала для части синтезированного сигнала (1062);
- модуль (1050) комбинирования, выполненный с возможностью комбинирования первого сигнала (1012) возбуждения и второго сигнала (1022) возбуждения для формирования комбинированного сигнала (1052) возбуждения для части синтезированного сигнала (1062); и
- синтезатор (1060), выполненный с возможностью синтезирования части синтезированного сигнала (1062) из комбинированного сигнала (1052) возбуждения и коэффициентов (122) прогнозирования.
13. Декодер по п. 12, в котором принимаемый аудиосигнал (1002) содержит информацию, связанную с первым параметром (gc) усиления и со вторым параметром (gn) усиления, при этом декодер дополнительно содержит:
- первый усилитель (254; 350e; 550e), выполненный с возможностью усиления первого сигнала (1012) возбуждения или сигнала, извлекаемого из него, посредством применения первого параметра (gc) усиления, чтобы получать первый усиленный сигнал (1012') возбуждения;
- второй усилитель (254; 350e; 550e), выполненный с возможностью усиления второго сигнала (1022) возбуждения или извлекаемого сигнала посредством применения второго параметра усиления, чтобы получать второй усиленный сигнал (1022') возбуждения;
14. Декодер по п. 12 или 13, дополнительно содержащий:
- модуль (160; 1090) вычисления информации формант, выполненный с возможностью вычисления первой информации (1092a) формирования спектра и второй информации (1092b) формирования спектра из коэффициентов (122; 322) прогнозирования;
- первый формирователь (1070) для придания определенной спектральной формы спектру первого сигнала (1012) возбуждения или сигнала, извлекаемого из него, с использованием первой информации (1092a) формирования спектра; и
- второй формирователь (1080) для придания определенной спектральной формы спектру второго сигнала (1022) возбуждения или сигнала, извлекаемого из него, с использованием второй информации (1092b) формирования.
15. Кодированный аудиосигнал (692; 1002), содержащий информацию, связанную с коэффициентами (122; 322) прогнозирования, информацию, связанную с детерминированной таблицей кодирования, информацию, связанную с первым параметром (gc) усиления и вторым параметром (gn) усиления, и информацию (142), связанную с вокализованным и невокализованным кадром сигнала.
16. Способ (1400) для кодирования аудиосигнала (102), при этом способ содержит этапы, на которых:
- извлекают (1410) коэффициенты (122; 322) прогнозирования и остаточный сигнал из невокализованного кадра аудиосигнала(102);
- вычисляют (1420) информацию () первых параметров усиления для задания первого сигнала (c(n)) возбуждения, связанного с детерминированной таблицей кодирования, и вычисляют информацию ( ) вторых параметров усиления для задания второго сигнала (n(n)) возбуждения, связанного с шумоподобным сигналом (n(n)) для невокализованного кадра; и
17. Способ (1500) для декодирования принимаемого аудиосигнала (692; 1002), содержащего информацию, связанную с коэффициентами (122; 322) прогнозирования, причем декодер (1000) содержит:
- формируют (1510) первый сигнал (1012, 1012') возбуждения из детерминированной таблицы кодирования для части синтезированного сигнала (1062);
- формируют (1520) второй сигнал (1022, 1022') возбуждения из шумоподобного сигнала (n(n)) для части синтезированного сигнала (1062);
- комбинируют (1530) первый сигнал (1012, 1012') возбуждения и второй сигнал (1022, 1022') возбуждения для формирования комбинированного сигнала (1052) возбуждения для части синтезированного сигнала (1062); и
- синтезируют (1540) часть синтезированного сигнала (1062) из комбинированного сигнала (1052) возбуждения и коэффициентов (122; 322) прогнозирования.
18. Компьютерная программа, имеющая программный код для осуществления способа по п. 16 или 17 при выполнении на компьютере.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13189392 | 2013-10-18 | ||
EP13189392.7 | 2013-10-18 | ||
EP14178785.3 | 2014-07-28 | ||
EP14178785 | 2014-07-28 | ||
PCT/EP2014/071769 WO2015055532A1 (en) | 2013-10-18 | 2014-10-10 | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2016118979A true RU2016118979A (ru) | 2017-11-23 |
RU2644123C2 RU2644123C2 (ru) | 2018-02-07 |
Family
ID=51752102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016118979A RU2644123C2 (ru) | 2013-10-18 | 2014-10-10 | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации |
Country Status (16)
Country | Link |
---|---|
US (3) | US10304470B2 (ru) |
EP (2) | EP3058569B1 (ru) |
JP (1) | JP6366705B2 (ru) |
KR (2) | KR20160070147A (ru) |
CN (1) | CN105723456B (ru) |
AU (1) | AU2014336357B2 (ru) |
BR (1) | BR112016008544B1 (ru) |
CA (1) | CA2927722C (ru) |
ES (1) | ES2839086T3 (ru) |
MX (1) | MX355258B (ru) |
MY (1) | MY187944A (ru) |
PL (1) | PL3058569T3 (ru) |
RU (1) | RU2644123C2 (ru) |
SG (1) | SG11201603041YA (ru) |
TW (1) | TWI576828B (ru) |
WO (1) | WO2015055532A1 (ru) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX347316B (es) * | 2013-01-29 | 2017-04-21 | Fraunhofer Ges Forschung | Aparato y método para sintetizar una señal de audio, decodificador, codificador, sistema y programa de computación. |
EP3058569B1 (en) * | 2013-10-18 | 2020-12-09 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
CN105745705B (zh) * | 2013-10-18 | 2020-03-20 | 弗朗霍夫应用科学研究促进协会 | 编码和解码音频信号的编码器、解码器及相关方法 |
EP3934203A1 (en) | 2016-12-30 | 2022-01-05 | INTEL Corporation | Decentralized data storage and processing for iot devices |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
DE102018112215B3 (de) * | 2018-04-30 | 2019-07-25 | Basler Ag | Quantisiererbestimmung, computerlesbares Medium und Vorrichtung, die mindestens zwei Quantisierer implementiert |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
JP3099852B2 (ja) | 1993-01-07 | 2000-10-16 | 日本電信電話株式会社 | 励振信号の利得量子化方法 |
US5864797A (en) * | 1995-05-30 | 1999-01-26 | Sanyo Electric Co., Ltd. | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
JP3747492B2 (ja) | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
JPH1020891A (ja) * | 1996-07-09 | 1998-01-23 | Sony Corp | 音声符号化方法及び装置 |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
JPH11122120A (ja) * | 1997-10-17 | 1999-04-30 | Sony Corp | 符号化方法及び装置、並びに復号化方法及び装置 |
KR100527217B1 (ko) | 1997-10-22 | 2005-11-08 | 마츠시타 덴끼 산교 가부시키가이샤 | 확산 벡터 생성 방법, 확산 벡터 생성 장치, celp형 음성 복호화 방법 및 celp형 음성 복호화 장치 |
CN1737903A (zh) | 1997-12-24 | 2006-02-22 | 三菱电机株式会社 | 声音译码方法以及声音译码装置 |
US6415252B1 (en) * | 1998-05-28 | 2002-07-02 | Motorola, Inc. | Method and apparatus for coding and decoding speech |
CN1167048C (zh) * | 1998-06-09 | 2004-09-15 | 松下电器产业株式会社 | 语音编码设备和语音解码设备 |
US6067511A (en) * | 1998-07-13 | 2000-05-23 | Lockheed Martin Corp. | LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech |
US6192335B1 (en) | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
US6463410B1 (en) | 1998-10-13 | 2002-10-08 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6311154B1 (en) | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
JP3451998B2 (ja) | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
US6615169B1 (en) | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
US6871176B2 (en) * | 2001-07-26 | 2005-03-22 | Freescale Semiconductor, Inc. | Phase excited linear prediction encoder |
KR101000345B1 (ko) | 2003-04-30 | 2010-12-13 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 |
CN1820306B (zh) | 2003-05-01 | 2010-05-05 | 诺基亚有限公司 | 可变比特率宽带语音编码中增益量化的方法和装置 |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP5188990B2 (ja) * | 2006-02-22 | 2013-04-24 | フランス・テレコム | Celp技術における、デジタルオーディオ信号の改善された符号化/復号化 |
US8712766B2 (en) * | 2006-05-16 | 2014-04-29 | Motorola Mobility Llc | Method and system for coding an information signal using closed loop adaptive bit allocation |
MX2009013519A (es) | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
JP5148414B2 (ja) | 2008-08-29 | 2013-02-20 | 株式会社東芝 | 信号帯域拡張装置 |
RU2400832C2 (ru) * | 2008-11-24 | 2010-09-27 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) | Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
DK2676271T3 (da) * | 2011-02-15 | 2020-08-24 | Voiceage Evs Llc | Anordning og fremgangsmåde til kvantisering af forstærkninger af adaptive og faste bidrag fra excitationen i en celp-koder-dekoder |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
CN103295578B (zh) * | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
EP3058569B1 (en) * | 2013-10-18 | 2020-12-09 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
CN105745705B (zh) | 2013-10-18 | 2020-03-20 | 弗朗霍夫应用科学研究促进协会 | 编码和解码音频信号的编码器、解码器及相关方法 |
PT3058568T (pt) | 2013-10-18 | 2021-03-04 | Fraunhofer Ges Forschung | Conceito para codificar um sinal de áudio e descodificar um sinal de áudio usando informação de modelação espectral relacionada com a fala |
-
2014
- 2014-10-10 EP EP14786471.4A patent/EP3058569B1/en active Active
- 2014-10-10 BR BR112016008544-2A patent/BR112016008544B1/pt active IP Right Grant
- 2014-10-10 RU RU2016118979A patent/RU2644123C2/ru active
- 2014-10-10 MY MYPI2016000654A patent/MY187944A/en unknown
- 2014-10-10 JP JP2016524410A patent/JP6366705B2/ja active Active
- 2014-10-10 AU AU2014336357A patent/AU2014336357B2/en active Active
- 2014-10-10 SG SG11201603041YA patent/SG11201603041YA/en unknown
- 2014-10-10 CN CN201480057351.4A patent/CN105723456B/zh active Active
- 2014-10-10 WO PCT/EP2014/071769 patent/WO2015055532A1/en active Application Filing
- 2014-10-10 CA CA2927722A patent/CA2927722C/en active Active
- 2014-10-10 MX MX2016004922A patent/MX355258B/es active IP Right Grant
- 2014-10-10 PL PL14786471T patent/PL3058569T3/pl unknown
- 2014-10-10 KR KR1020167012955A patent/KR20160070147A/ko active Application Filing
- 2014-10-10 KR KR1020187004831A patent/KR101931273B1/ko active IP Right Grant
- 2014-10-10 EP EP20197471.4A patent/EP3779982A1/en active Pending
- 2014-10-10 ES ES14786471T patent/ES2839086T3/es active Active
- 2014-10-16 TW TW103135840A patent/TWI576828B/zh active
-
2016
- 2016-04-18 US US15/131,773 patent/US10304470B2/en active Active
-
2019
- 2019-04-01 US US16/372,030 patent/US10607619B2/en active Active
-
2020
- 2020-03-17 US US16/821,883 patent/US11798570B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20190228787A1 (en) | 2019-07-25 |
JP6366705B2 (ja) | 2018-08-01 |
BR112016008544A2 (pt) | 2017-08-01 |
US10607619B2 (en) | 2020-03-31 |
EP3779982A1 (en) | 2021-02-17 |
SG11201603041YA (en) | 2016-05-30 |
KR20160070147A (ko) | 2016-06-17 |
CA2927722C (en) | 2018-08-07 |
BR112016008544B1 (pt) | 2021-12-21 |
US20160232908A1 (en) | 2016-08-11 |
ES2839086T3 (es) | 2021-07-05 |
CA2927722A1 (en) | 2015-04-23 |
AU2014336357B2 (en) | 2017-04-13 |
TWI576828B (zh) | 2017-04-01 |
AU2014336357A1 (en) | 2016-05-19 |
WO2015055532A1 (en) | 2015-04-23 |
US10304470B2 (en) | 2019-05-28 |
CN105723456A (zh) | 2016-06-29 |
PL3058569T3 (pl) | 2021-06-14 |
MY187944A (en) | 2021-10-30 |
EP3058569B1 (en) | 2020-12-09 |
KR101931273B1 (ko) | 2018-12-20 |
KR20180021906A (ko) | 2018-03-05 |
MX2016004922A (es) | 2016-07-11 |
TW201523588A (zh) | 2015-06-16 |
MX355258B (es) | 2018-04-11 |
US11798570B2 (en) | 2023-10-24 |
EP3058569A1 (en) | 2016-08-24 |
US20200219521A1 (en) | 2020-07-09 |
CN105723456B (zh) | 2019-12-13 |
RU2644123C2 (ru) | 2018-02-07 |
JP2016537667A (ja) | 2016-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2016118979A (ru) | Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации | |
JP6366706B2 (ja) | スピーチ関連のスペクトル整形情報を使用したオーディオ信号符号化と復号化の概念 | |
JP2008503786A (ja) | オーディオ信号の符号化及び復号化 | |
CN101266798A (zh) | 一种在语音解码器中进行增益平滑的方法及装置 | |
JP2011237826A (ja) | 復号装置およびスペクトル整形方法 |