RU2586597C2 - Кодирование и декодирование позиций импульсов дорожек аудиосигнала - Google Patents

Кодирование и декодирование позиций импульсов дорожек аудиосигнала Download PDF

Info

Publication number
RU2586597C2
RU2586597C2 RU2013142068/08A RU2013142068A RU2586597C2 RU 2586597 C2 RU2586597 C2 RU 2586597C2 RU 2013142068/08 A RU2013142068/08 A RU 2013142068/08A RU 2013142068 A RU2013142068 A RU 2013142068A RU 2586597 C2 RU2586597 C2 RU 2586597C2
Authority
RU
Russia
Prior art keywords
track
positions
pulse
pulses
tracks
Prior art date
Application number
RU2013142068/08A
Other languages
English (en)
Other versions
RU2013142068A (ru
Inventor
Гийом ФУКС
Том БЯКСТРЕМ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2013142068A publication Critical patent/RU2013142068A/ru
Application granted granted Critical
Publication of RU2586597C2 publication Critical patent/RU2586597C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Abstract

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала. Устройство содержит декодер информации импульсов и декодер сигналов. Декодер информации импульсов выполнен с возможностью декодировать множество позиций импульсов, причем каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер информации импульсов выполнен с возможностью декодировать множество позиций импульса посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния. 6 н. и 9 з.п. ф-лы, 7 ил.

Description

Настоящее изобретение имеет отношение к области обработки аудиосигнала и кодирования аудиосигнала и, в частности, к кодированию и декодированию позиций импульсов дорожек в аудиосигнале.
Обработка и/или кодирование аудиоданных совершенствовались многими способами. При кодировании аудиосигнала важную роль играют кодеры с линейным предсказанием. Когда кодируется аудиосигнал, например аудиосигнал, содержащий речь, кодеры с линейным предсказанием обычно кодируют представление огибающей спектра аудиосигнала. С этой целью кодеры с линейным предсказанием могут определять коэффициенты фильтра с предсказанием для представления огибающей спектра звука в закодированной форме. Коэффициенты фильтра затем могут использоваться декодером с линейным предсказанием для декодирования закодированного аудиосигнала посредством формирования синтезированного аудиосигнала с использованием коэффициентов фильтра с предсказанием.
Важными примерами для кодеров с линейным предсказанием являются кодеры ACELP (ACELP = линейное предсказание с возбуждением по алгебраической кодовой книге). Кодеры ACELP широко используются, например, в кодировании USAC (USAC = объединенное кодирование речи и аудиосигналов) и могут иметь дополнительные области применения, например в LD-USAC (объединенное кодирование речи и аудиосигналов с малой задержкой).
Кодеры ACELP обычно кодируют аудиосигнал, определяя коэффициенты фильтра с предсказанием. Чтобы достигнуть лучшего кодирования, кодеры ACELP определяют разностный сигнал, также называемый целевым сигналом, на основе аудиосигнала, который должен быть закодирован, и на основе уже определенных коэффициентов фильтра с предсказанием. Разностный сигнал, например, может быть сигналом разности, представляющим разность между аудиосигналом, который должен быть закодирован, и частями сигнала, которые закодированы посредством коэффициентов фильтра с предсказанием и, возможно, посредством коэффициентов адаптивного фильтра, полученных в результате анализа высоты звука. Затем кодер ACELP стремится закодировать разностный сигнал. Для этого кодер кодирует параметры алгебраической кодовой книги, которые используются для кодирования разностного сигнала.
Для кодирования разностного сигнала используются алгебраические кодовые книги. Обычно алгебраические кодовые книги содержат множество дорожек, например четыре дорожки, каждая из которых содержит 16 позиций дорожки. В такой конфигурации в общей сложности 4·16=64 типовых позиции могут быть представлены соответствующей алгебраической кодовой книгой, например, в соответствии с количеством отсчетов субкадра аудиосигнала, который должен быть закодирован.
Дорожки кодовой книги могут быть чередованы таким образом, что дорожка 0 кодовой книги может представлять отсчеты 0, 4, 8,..., 60 субкадра, дорожка 1 кодовой книги может представлять отсчеты 1, 5, 9,..., 61 субкадра, дорожка 2 кодовой книги может представлять отсчеты 2, 6, 10,..., 62 субкадра, и дорожка 3 кодовой книги может представлять отсчеты 3, 7, 11,..., 63 субкадра. Каждая дорожка может иметь постоянное количество импульсов. Или количество импульсов на каждую дорожку может меняться, например, в зависимости от других условий. Импульс может быть положительным или отрицательным и, например, может быть представлен как +1 (положительный импульс) или 0 (отрицательный импульс).
Для кодирования разностного сигнала при кодировании может быть выбрана конфигурация кодовой книги, которая лучше всего представляет оставшиеся части разностного сигнала. Для этого доступные импульсы могут быть расположены в подходящие позиции дорожки, которые лучше всего отражают части сигнала, которые должны быть закодированы. Кроме того, может быть указано, является ли соответствующий импульс положительным или отрицательным.
На стороне декодера декодер ACELP сначала декодирует параметры алгебраической кодовой книги. Декодер ACELP также может декодировать адаптивные параметры кодовой книги. Чтобы определить алгебраические параметры кодовой книги, декодер ACELP может определить множество позиций импульсов для каждой дорожки алгебраической кодовой книги. Кроме того, декодер ACELP также может декодировать информацию о том, является ли импульс в позиции дорожки положительным или отрицательным импульсом. Кроме того, декодер ACELP также может декодировать адаптивные параметры кодовой книги. На основе этой информации декодер ACELP обычно формирует сигнал возбуждения. Затем декодер ACELP применяет коэффициенты фильтра с предсказанием к сигналу возбуждения, чтобы сформировать синтезированный аудиосигнал для получения декодированного аудиосигнала.
В ACELP импульсы на дорожке обычно закодированы следующим образом. Если дорожка имеет длину 16, и если количество импульсов на этой дорожке равно одному, то мы можем закодировать позицию импульса ее позицией (4 бита) и знаком (1 бит), всего 5 битов. Если дорожка имеет длину 16 и количество импульсов равно двум, то первый импульс кодируется его позицией (4 бита) и знаком (1 бит). Для второго импульса мы должны закодировать позицию (только 4 бита), поскольку можем решить, что знак второго импульса положителен, если он находится слева от первого импульса, отрицателен, если он находится справа от первого импульса, и имеет такой же знак, как первый импульс, если он находится в такой же позиции, как первый импульс. Таким образом нам нужны только 9 битов, чтобы закодировать 2 импульса. Таким образом, по сравнению с кодированием позиций импульсов отдельно по 5 битов на каждый мы экономим 1 бит для каждой пары импульсов.
Кодируя более чем два импульса, мы можем закодировать импульсы попарно, и если количество импульсов нечетное, закодировать последний импульс отдельно. Так, например, для дорожки из 5 импульсов, нам понадобится 9+9+5=23 бита. Если у нас есть 4 дорожки, то 4×23=92 бита потребуется для кодирования субкадра длиной 64 с 4 дорожками и 5 импульсами на каждую дорожку. Однако будет очень ценно, если количество битов могло бы быть еще больше сокращено.
Было бы очень желательно обеспечить устройство для кодирования и соответствующее устройство для декодирования с улучшенной концепцией кодирования или декодирования, которые имеют средства кодирования или декодирования информации импульсов улучшенным образом с использованием меньшего количества битов для представления информации импульсов, поскольку это, например, уменьшило бы скорость передачи соответствующим образом закодированного аудиосигнала, и, кроме того, это, например, уменьшило бы размер памяти для хранения соответствующим образом закодированного аудиосигнала.
Таким образом, задача настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для кодирования и декодирования импульсов дорожек аудиосигнала. Задачи настоящего изобретения достигаются посредством устройства для декодирования по п. 1 формулы изобретения, устройства для кодирования по п. 9 формулы изобретения, способа декодирования по п. 13 формулы изобретения, способа кодирования по п. 14 формулы изобретения и компьютерной программы по п. 15 формулы изобретения.
В соответствии с вариантами осуществления предполагается, что один номер состояния доступен для устройства для декодирования. Кроме того, предполагается, что количество позиций дорожки, указывающее общее количество позиций дорожки по меньшей мере одной из дорожек, соответствующей закодированному аудиосигналу, и общее количество импульсов, указывающее количество импульсов по меньшей мере одной из дорожек, доступны для устройства декодирования настоящего изобретения. Предпочтительно количество позиций дорожки и общее количество импульсов доступны для каждой дорожки, соответствующей закодированному аудиосигналу.
Например, каждая из 4 дорожек с 5 импульсами может достигнуть примерно 6,6×10^21 состояний, которые в соответствии с вариантами осуществления могут быть закодированы посредством 73 битов, что приблизительно на 21% более эффективно, чем кодирование описанного выше кодера текущего уровня техники, использующего 92 бита.
Сначала обеспечивается концепция, каким образом следует эффективно кодировать множество позиций импульсов дорожки аудиосигнала. В дальнейшем концепция расширяется, чтобы позволить кодировать не только позицию импульсов дорожки, но также и информацию о том, является ли импульс положительным или отрицательным. Кроме того, затем концепция расширяется, чтобы позволить эффективно кодировать информацию импульсов для множества дорожек. Концепции соответствующим образом применимы на стороне декодера.
Кроме того, варианты осуществления основаны на том факте, что если стратегия кодирования использует предопределенное количество битов, то любая конфигурация с таким же количеством импульсов на каждой дорожке требует того же количества битов. Если количество доступных битов фиксировано, то возможно непосредственно выбрать, сколько импульсов может быть закодировано с помощью заданного количества битов, и тем самым дать возможность кодирования с предопределенным качеством. Кроме того, с помощью этого подхода не требуется пробовать разное количество импульсов, пока не будет достигнута требуемая битовая скорость, а мы можем непосредственно выбрать правильное количество импульсов, тем самым уменьшая сложность.
На основе приведенных выше предположений может быть закодировано и/или декодировано множество позиций импульсов дорожки кадра аудиосигнала.
Хотя настоящее изобретение может использоваться для кодирования или декодирования аудиосигналов любого типа, например речевых сигналов или музыкальных сигналов, настоящее изобретение особенно полезно для кодирования или декодирования речевых сигналов.
В другом варианте осуществления декодер информации импульсов дополнительно выполнен с возможностью декодировать множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый из знаков импульсов указывает знак одного из множества импульсов. Декодер сигналов может быть выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнал с дополнительным использованием множества знаков импульсов.
В соответствии с дополнительным вариантом осуществления, в котором одна или более дорожек могут содержать по меньшей мере последнюю дорожку и одну или более других дорожек, декодер информации импульсов может быть выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния из номера состояния. Декодер информации импульсов может быть выполнен с возможностью декодировать первую группу позиций импульсов на основе номера первого подсостояния, и декодер информации импульсов также может быть выполнен с возможностью декодировать вторую группу позиций импульсов на основе номера второго подсостояния. Вторая группа позиций импульсов может состоять только из позиций импульсов, указывающих позиции последней дорожки. Первая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции дорожки одной или более других дорожек.
В соответствии с другим вариантом осуществления декодер информации импульсов может быть выполнен с возможностью разделять номер состояния на номер первого подсостояния и номер второго подсостояния посредством деления номера состояния на f(pk, N) для получения целочисленной части и остатка в качестве результата деления, причем целочисленная часть представляет собой номер первого подсостояния, и остаток представляет собой номер второго подсостояния, причем pk указывает для каждой одной или более дорожек количество импульсов, и N указывает для каждой одной или более дорожек количество позиций дорожки. Здесь f(pk, N) является функцией, возвращающей количество состояний, которые могут быть достигнуты на дорожке длины N с pk импульсами.
В другом варианте осуществления декодер информации импульсов может быть выполнен с возможностью проводить проверку, сравнивая номер состояния или обновленный номер состояния с пороговым значением.
Декодер информации импульсов может быть выполнен с возможностью проводить проверку, сравнивая, является ли номер состояния или обновленный номер состояния больше, больше или равен, меньше или меньше или равен пороговому значению, причем блок анализа дополнительно выполнен с возможностью обновлять номер состояния или обновленный номер состояния в зависимости от результата проверки.
В варианте осуществления декодер информации импульсов может быть выполнен с возможностью сравнивать номер состояния или обновленный номер состояния с пороговым значением для каждой позиции дорожки одной из множества дорожек.
В соответствии с вариантом осуществления декодер информации импульсов может быть выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере одну позицию дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий оставшиеся другие позиции дорожки из множества позиций дорожки. Декодер информации импульсов может быть выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния. Кроме того, декодер информации импульсов может быть выполнен с возможностью декодировать первую группу позиций импульсов, ассоциированных с первым разделом дорожки, на основе номера первого подсостояния. Кроме того, декодер информации импульсов может быть выполнен с возможностью декодировать вторую группу позиций импульсов, ассоциированных со вторым разделом дорожки, на основе номера второго подсостояния.
В соответствии с вариантом осуществления обеспечено устройство для кодирования аудиосигнала. Устройство содержит процессор сигналов, выполненный с возможностью определять множество коэффициентов фильтра с предсказанием, ассоциированных с аудиосигналом, для формирования разностного сигнала на основе аудиосигнала и множества коэффициентов фильтра с предсказанием. Кроме того, устройство содержит кодер информации импульсов, выполненный с возможностью кодировать множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал, одна или более дорожек ассоциированы с разностным сигналом. Каждая из дорожек имеет множество позиций дорожки и множество импульсов. Каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки. Кодер информации импульсов выполнен с возможностью кодировать множество позиций импульсов, формируя номер состояния таким образом, что позиции импульса могут быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек.
В соответствии с другим вариантом осуществления кодер информации импульсов может быть выполнен с возможностью кодировать множество знаков импульсов, причем каждый из знаков импульсов указывает знак одного из множества импульсов. Кодер информации импульсов дополнительно может быть выполнен с возможностью кодировать множество знаков импульсов, формируя номер состояния таким образом, что знаки импульсов могут быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов.
В варианте осуществления кодер информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получать номер состояния.
В соответствии с другим вариантом осуществления кодер информации импульсов может быть выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере одну позицию дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий оставшиеся другие позиции дорожки из множества позиций дорожки. Кроме того, кодер информации импульсов может быть выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу. Кроме того, кодер информации импульсов может быть выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу. Кроме того, кодер информации импульсов может быть выполнен с возможностью объединить номер первого подсостояния и номер второго подсостояния для получения номера состояния.
Далее варианты осуществления настоящего изобретения будут описаны более подробно со ссылкой на фигуры.
Фиг. 1 иллюстрирует устройство для декодирования закодированного аудиосигнала в соответствии с вариантом осуществления,
Фиг. 2 иллюстрирует устройство для кодирования аудиосигнала в соответствии с вариантом осуществления,
Фиг. 3 иллюстрирует все возможные конфигурации для дорожки, имеющей два импульса без знака и три позиции дорожки,
Фиг. 4 иллюстрирует все возможные конфигурации для дорожки, имеющей один импульс со знаком и две позиции дорожки,
Фиг. 5 иллюстрирует все возможные конфигурации для дорожки, имеющей два импульса со знаком и две позиции дорожки,
Фиг. 6 - блок-схема последовательности операций, иллюстрирующая вариант осуществления, изображающая этапы обработки, проводимые декодером информации импульсов в соответствии с вариантом осуществления, и
Фиг. 7 - блок-схема последовательности операций, иллюстрирующая вариант осуществления, блок-схема изображает этапы обработки, проводимые кодером информации импульсов в соответствии с вариантом осуществления.
Фиг. 1 иллюстрирует устройство для декодирования закодированного аудиосигнала, причем одна или более дорожек ассоциированы с закодированным аудиосигналом, каждая из дорожек имеет множество позиций дорожки и множество импульсов.
Устройство содержит декодер 110 информации импульсов и декодер 120 сигналов. Декодер 110 информации импульсов выполнен с возможностью декодировать множество позиций импульсов. Каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки.
Декодер 110 информации импульсов выполнен с возможностью декодировать множество позиций импульсов посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общее количество импульсов, указывающее общее количество импульсов по меньшей мере одной из дорожек, и один номер состояния.
Декодер 120 сигналов выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов фильтра с предсказанием, ассоциированных с закодированным аудиосигналом.
Номер состояния - это число, которое может быть закодировано кодером в соответствии с вариантами осуществления, которые будут описаны ниже. Номер состояния, например, содержит информацию о множестве позиций импульсов в компактном представлении, например в представлении, которое требует небольшого количества битов, и оно может быть декодировано, когда в кодере доступна информация о количестве позиций дорожки и общем количестве импульсов.
В варианте осуществления количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала могут быть доступны в декодере, поскольку количество позиций дорожки и/или общее количество импульсов являются статическими значениями, которые не изменяются и известны приемнику. Например, количество позиций дорожки может всегда быть равно 16 для каждой дорожки, и общее количество импульсов может всегда быть равно 4.
В другом варианте осуществления количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала могут быть явно переданы устройству для декодирования, например, устройством для кодирования.
В дополнительном варианте осуществления декодер может определить количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала посредством анализа других параметров, которые явно не указывают количество позиций дорожки и/или общее количество импульсов, но из которых могут быть получены количество позиций дорожки и/или общее количество импульсов.
В других вариантах осуществления декодер может анализировать другие доступные данные, чтобы получить количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала.
В дополнительном варианте осуществления декодер информации импульсов может быть также выполнен с возможностью декодировать, является ли импульс положительным импульсом или отрицательным импульсом.
В другом варианте осуществления декодер информации импульсов, кроме того, может быть выполнен с возможностью декодировать информацию импульсов, которая содержит информацию об импульсах для множества дорожек. Информация импульсов, например, может являться информацией о позиции импульсов в дорожке и/или информацией о том, является ли импульс положительным импульсом или отрицательным импульсом.
Фиг. 2 иллюстрирует устройство для кодирования аудиосигнала, содержащее процессор 210 сигналов и кодер 220 информации импульсов.
Процессор 210 сигналов выполнен с возможностью определять множество коэффициентов фильтра с предсказанием, ассоциированных с аудиосигналом, для формирования разностного сигнала на основе аудиосигнала и множества коэффициентов фильтра с предсказанием.
Кодер 220 информации импульсов выполнен с возможностью кодировать множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал. Одна или более дорожек ассоциированы с разностным сигналом, сформированному процессором 210 сигналов. Каждая из дорожек имеет множество позиций дорожки и множество импульсов. Кроме того, каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки.
Кодер 220 информации импульсов выполнен с возможностью кодировать множество позиций импульсов посредством формирования номера состояния, с тем чтобы позиции импульсов могли быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек.
Далее представлены основные концепции вариантов осуществления настоящего изобретения, имеющие отношение к кодированию позиций импульсов и, возможно, знака импульса (положительного импульса или отрицательного импульса) посредством формирования номера состояния.
Принципы кодирования вариантов осуществления настоящего изобретения основаны на том факте, что если рассматривается перечисление состояний всех возможных конфигураций из k импульсов в дорожке с n позициями дорожки, достаточно закодировать фактическое состояние импульсов дорожки. Кодирование такого состояния посредством по возможности наименьшего количества битов обеспечивает желаемое компактное кодирование. Посредством этого представлена концепция перечисления состояний, в которой каждая совокупность позиций импульсов и, возможно, также знаков импульсов представляют одно состояние, и каждое состояние уникально нумеруется.
Фиг. 3 иллюстрирует это для простого случая, для которого изображены все возможные конфигурации, когда рассматривается дорожка, имеющая два импульса и три позиции дорожки. Два импульса могут быть расположены в одной и той же позиции дорожки. В примере на фиг. 3 знак импульсов (например, является ли импульс положительным или отрицательным) не рассматривается, в таком примере все импульсы могут полагаться, например, положительными.
На фиг. 3 проиллюстрированы все возможные состояния для двух ненаправленных импульсов, расположенных на дорожке с тремя позициями дорожки (на фиг. 3: позиции дорожки 1, 2 и 3). Имеется только шесть разных возможных состояний (на фиг. 3, пронумерованы от 0 до 5), которые описывают, каким образом импульсы могут быть распределены на дорожке. Таким образом, достаточно использовать номер состояния в диапазоне от 0 до 5, чтобы описать фактическую существующую конфигурацию. Например, если номер состояния в примере на фиг. 3 имеет значение (4), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния =4 означает, что дорожка имеет один импульс в позиции 0 дорожки и другой импульс в позиции 2 дорожки. Таким образом, в примере на фиг. 3 достаточно трех битов для кодирования номера состояния, чтобы идентифицировать одно из шести различных состояний примера на фиг. 3.
Фиг. 4 иллюстрирует случай, изображающий все возможные состояния для одного направленного импульса, расположенного на дорожке с двумя позициями дорожки (на фиг. 4: позиции 1 и 2 дорожки). На фиг. 4 учитывается знак импульсов (например, является ли импульс положительным или отрицательным). Имеется четыре различных возможных состояния (на фиг. 4 пронумерованы от 0 до 3), которые описывают, каким образом импульс может быть распределен на дорожке, а также его знак (положительный или отрицательный). Достаточно использовать номер состояния в диапазоне от 0 до 3, чтобы описать фактическую существующую конфигурацию. Например, если номер состояния в примере на фиг. 4 имеет значение (2), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния = 2 означает, что дорожка имеет один импульс в позиции 1 дорожки, и что импульс является положительным импульсом.
Фиг. 5 иллюстрирует все еще дополнительный случай, в котором изображены все возможные конфигурации, когда рассматривается дорожка, имеющая два импульса и две позиции дорожки. Импульсы могут быть расположены в одной и той же позиции дорожки. В примере, показанном на фиг. 5, учитывается знак импульсов (например, является ли импульс положительным или отрицательным). Предполагается, что импульсы в одной и той же позиции дорожки имеют один и тот же знак (например, дорожки в одной и той же позиции дорожки либо все являются положительными, либо все являются отрицательными).
На фиг. 5 проиллюстрированы все возможные состояния для двух импульсов со знаком (например, импульсов, которые являются либо положительными, либо отрицательными), расположенных на дорожке с двумя позициями дорожки (на фиг. 5: позиции 1 и 2 дорожки). Имеется только восемь различных возможных состояний (на фиг. 5 пронумерованы от 0 до 7), которые описывают, каким образом импульсы могут быть распределены на дорожке. Таким образом, достаточно использовать номер состояния в диапазоне от 0 до 7, чтобы описать фактическую конфигурацию. Например, если номер состояния в примере на фиг. 5 имеет значение (3), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния =3 обозначает, что дорожка имеет один импульс в позиции 0 дорожки, который является положительным, и другой импульс в позиции 1 дорожки, который является отрицательным. Таким образом, в примере на фиг. 5 достаточно трех битов для кодирования номера состояния, чтобы идентифицировать одно из восьми различных состояний примера на фиг. 5.
В ACELP разностный сигнал может быть закодирован посредством фиксированного количества импульсов со знаком. Как описано выше, импульсы могут быть распределены, например, на четырех чередующихся дорожках таким образом, что дорожка 0 содержит позиции mod(n, 4)==0, дорожка 1 содержит позиции mod(n, 4)==1, и так далее. Каждая дорожка может иметь предопределенное количество единичных импульсов со знаком, которые могут накладываться, но когда они накладываются, импульсы имеют один и тот же знак.
Посредством кодирования импульсов должно быть достигнуто отображение позиций импульсов и их знаков в представление, которое использует наименьшее возможное количество битов. Кроме того, кодирование импульсов должно иметь расход битов, который является фиксированным, то есть любая совокупность импульсов имеет одно и то же количество битов.
Каждая дорожка сначала независимо кодируется, и затем состояния каждой дорожки объединены в одно число, которое представляет состояние целого субкадра. Этот подход дает математически оптимальный расход битов, если все состояния имеют равную вероятность, и расход битов является фиксированным.
Концепция перечисления состояний также может быть объяснена с использованием компактного представления различных совокупностей состояний.
Пусть xn - разностный сигнал, который мы хотим закодировать. Предположим, что рассматриваются, например, четыре чередованных дорожки алгебраической кодовой книги, тогда первая дорожка имеет отсчеты x0, x4, x8,..., xN-4, вторая дорожка имеет отсчеты x1, x5, x9,..., xN-3, и т.д. Предположим, что первая дорожка квантована с помощью одного единичного импульса со знаком и что T=8, посредством чего длина дорожки равна 2 (T= длина (отсчеты) разностного сигнала, который должен быть закодирован). Если T=8, и если для кодирования разностного сигнала используются 4 дорожки, каждая из 4 дорожек имеет 2 позиции дорожки. Например, можно рассмотреть первую дорожку, которая имеет две позиции x0 и x4 дорожки. Тогда импульс первой дорожки может появиться в любой из следующих совокупностей:
x0 +1 -1 0 0
x4 0 0 +1 -1
Для этой конфигурации имеется четыре разных состояния.
Аналогичным образом, если на первой дорожке имеется два импульса и первая дорожка имеет две позиции x0 и x4, то импульсы могут быть присвоены в следующих совокупностях:
x0 +2 -2 +1 +1 -1 -1 0 0
x4 0 0 +1 -1 +1 -1 +2 -2
Таким образом, эта конфигурация имеет 8 состояний.
Если длина разностного сигнала расширена до T=12, то каждая из 4 дорожек имеет 3 позиции дорожки. Первая дорожка получает еще один отсчет и теперь имеет позиции x0, x4 и x8 дорожки, таким образом, мы имеем:
x0, x4 2 импульса 8 состояний 1 импульс 4 состояния 1 импульс 4 состояния 0 импульсов 1 состояние 0 импульсов 1 состояние
x8 0 +1 -1 +2 -2
Приведенная выше таблица означает, что имеется 8 различных состояний для x0 и x4, если x8=0 (x8 не имеет импульса); 4 различных состояния для x0 и x4, если x8=1 (x8 имеет положительный импульс); 4 различных состояния для x0 и x4, если x8=-1 (x8 имеет отрицательный импульс); 1 состояние для x0 и x4, если x8=2 (x8 имеет два положительных импульса); и 1 состояние для x0 и x4, если x8=-2 (x8 имеет два отрицательных импульса).
При этом количество состояний для первой строки было получено из двух предыдущих таблиц. Посредством сложения количества состояний в первой строке мы видим, что эта конфигурация имеет 18 состояний.
В примере с T=2 достаточно 5 битов для кодирования всех 18 различных возможных состояний. Тогда кодер, например, выбирает номер состояния из диапазона [0, 17], чтобы определить одну из этих 18 конфигураций. Если декодер знает о схеме кодирования, например, если он знает, какой номер состояния какую конфигурацию представляет, он может декодировать позиции импульсов и знаки импульсов для дорожки.
Ниже будут представлены подходящие способы кодирования и соответствующие способы декодирования в соответствии с вариантами осуществления. В соответствии с вариантами осуществления обеспечено устройство для кодирования, которое выполнено с возможностью исполнять один из представленных ниже способов кодирования. Кроме того, в соответствии с дополнительным вариантам осуществления представлено устройство для декодирования, которое выполнено с возможностью исполнять один из представленных ниже способов декодирования.
В вариантах осуществления для формирования номера состояния или декодирования номера состояния может быть вычислено количество возможных конфигураций для N позиций дорожки, имеющей p импульсов.
Импульсы могут иметь знак, и может использоваться рекурсивная формула, которая вычисляет количество состояний f(p, N) для дорожки, имеющей N позиций дорожки и p импульсов со знаком (импульсы могут быть положительными или отрицательными, но импульсы в одной и той же позиции дорожки имеют один и тот же знак), причем рекурсивная формула f(p, N) задана следующим образом:
Формула 1:
Figure 00000001
Начальные условия:
Figure 00000002
поскольку единственная позиция с одним или более импульсами требует одного бита (двух состояний) для знака. Рекурсивная формула предназначена для суммирования всех различных совокупностей.
А именно, если имеется p импульсов, текущая позиция может иметь от qN=0 до p импульсов, посредством чего оставшиеся N-1 позиций имеют p-qN импульсов. Количество состояний в текущей позиции и в оставшихся N-1 позициях перемножаются для получения количества состояний с этими комбинациями импульсов, и комбинации суммируются для получения общего количества состояний.
В вариантах осуществления рекурсивная функция может быть вычислена посредством итеративного алгоритма, причем рекурсия заменяется итерацией.
Поскольку оценка f(p, N) является относительно сложной в вычислительном отношении для приложений реального времени, в соответствии с некоторыми вариантами осуществления для вычисления f(p, N) может использоваться поиск по таблице. В соответствии с некоторыми вариантами осуществления таблица может быть вычислена автономно.
Далее представлены дополнительные концепции для кодирования и декодирования номера состояния.
Пусть f(p, N) обозначает количество возможных конфигураций для дорожки, имеющей N позиций дорожки и p импульсов со знаком.
Кодер информации импульсов может теперь проанализировать дорожку: если первая позиция на дорожке не имеет импульса, то оставшиеся N-1 позиций имеют p импульсов со знаком, и чтобы описать эту совокупность, нам нужно только f(p, N-1) состояний.
Иначе, если первая позиция имеет один или более импульсов, кодер информации импульсов определяет, что общее количество состояний больше, чем f(p, N-1).
Затем декодер информации импульсов, например, может начать с последней позиции и сравнить состояние с пороговым значением, например с f(p, N-1). Если оно больше, то декодер информации импульсов может решить, что последняя позиция имеет по меньшей мере один импульс. Декодер информации импульсов может тогда обновить состояние, чтобы получить обновленный номер состояния, посредством вычитания f(p, N-1) из состояния и уменьшить количество оставшихся импульсов на один.
Иначе, если в последней позиции нет импульса, декодер информации импульсов может сократить количество оставшихся позиций на одну. Повторение этой процедуру, пока не останется импульсов, обеспечит позиции импульсов без знака.
Чтобы также принять во внимание знаки импульсов, кодер информации импульсов может закодировать импульсы в самом нижнем бите состояния. В альтернативном варианте осуществления кодер информации импульсов может закодировать знак в самом высоком оставшемся бите состояния. Однако предпочтительно закодировать знак импульс в самом нижнем бите, поскольку его легче обработать относительно целочисленных вычислений.
Если в декодере информации импульсов найден первый импульс данной позиции, знак импульса определен последним битом. Затем оставшееся состояние смещается на один шаг вправо для получения обновленного номера состояния.
В варианте осуществления декодер информации импульсов выполнен с возможностью применять следующий алгоритм декодирования. В этом алгоритме декодирования при пошаговом подходе для каждой позиции дорожки, например одна позиция за другой, номер состояния или обновленный номер состояния сравнивается с пороговым значением, например с f(p, k-1).
В соответствии с вариантом осуществления обеспечен алгоритм декодера информации импульсов.
Для каждой позиции на дорожке, от k=N до 1
Пока состояние s>=f(p, k-1)
Поместить импульс в k
Присвоить s:=s-f(p, k-1)
Если это первый импульс в k
Если самый нижний бит состояния s установлен, установить знак в минус
Иначе, установить знак в плюс
Сдвинуть состояние вправо на один шаг s:=s/2
Уменьшить количество оставшихся импульсов p:=p-1
Относительно информации импульсов в соответствии с вариантом осуществления кодер информации импульсов выполнен с возможностью применять следующий алгоритм кодирования. Кодер информации импульсов выполняет такие же этапы, как декодер информации импульсов, но в обратном порядке.
В соответствии с вариантом осуществления обеспечен алгоритм кодера информации импульсов.
Установить количество найденных импульсов равным нулю, p:=0, и состояние равным нулю s:=0
Для каждой позиции на дорожке, от k=1 до N
Для каждого импульса в этой позиции
Если текущий импульс является последним в этой позиции
Сдвинуть состояние влево на один шаг s:=s*2
Если знак минус, установить самый нижний бит равным одному, s:=s+1
Иначе установить самый нижний бит равным нулю (то есть ничего не делать)
Обновите состояние s:=s+f(p, k-1)
Увеличить количество найденных импульсов p:=p+1
Кодируя номер состояния посредством использования этого алгоритма, кодер информации импульсов добавляет целочисленное значение к промежуточному числу (например, номеру промежуточного состояния), например номеру состояния, прежде чем алгоритм будет завершен, для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния (значение номера состояния).
Подход для кодирования и декодирование информации импульсов, например позиций импульса и знаков импульсов, может называться "пошаговым кодированием" и "пошаговым декодированием", поскольку позиции дорожки рассматриваются посредством способов кодирования и декодирования одна за другой, пошагово.
Фиг. 6 является блок-схемой последовательности операций, иллюстрирующей вариант осуществления, изображающей этапы обработки, проводимые декодером информации импульсов в соответствии с вариантом осуществления.
На этапе 610 текущая позиция k дорожки устанавливается равной N. Здесь N представляет количество позиций дорожки, причем позиции дорожки пронумерованы от 1 до N.
На этапе 620 проверяется, является ли k больше или равно 1, то есть остаются ли нерассмотренные позиции дорожки. Если k не больше или равно 1, все позиции дорожки рассмотрены, и процесс заканчивается.
В ином случае на этапе 630 проверяется, является ли состояние больше или равно f(p, k-1). Если это так, в позиции k присутствует по меньшей мере один импульс. Если это не так, никакой (дополнительный) импульс не присутствует в позиции дорожки, k и процесс переходит на этап 640, где k уменьшается на 1, и, таким образом, будет рассматриваться следующая позиция.
Однако если состояние больше или равно f(p, k-1), процесс переходит на этап 642, импульс помещается в позицию k дорожки, и затем на этапе 644, состояние обновляется посредством уменьшения состояния f(p, k-1). Затем на этапе 650 проверяется, является ли текущий импульс первым обнаруженным импульсом в позиции k дорожки. Если это не так, количество оставшихся импульсов уменьшается на 1 на этапе 680, и процесс переходит на этап 630.
Однако если это первый обнаруженный импульс в позиции k дорожки, процесс переходит на этап 660, на котором проверяется, установлен ли самый нижний бит s. Если это так, знак импульсов в этой позиции дорожки устанавливается в минус (этап 662), иначе знак импульсов в этой позиции дорожки устанавливается в плюс (этап 664). В обоих случаях состояние затем сдвигается на один шаг вправо на этапе 670 (s:=s/2). Затем также количество оставшихся импульсов сокращается на один (этап 680), и процесс переходит на этап 630.
Фиг. 7 является блок-схемой последовательности операций, иллюстрирующей вариант осуществления, блок-схема изображает этапы обработки, проводимые кодером информации импульсов в соответствии с вариантом осуществления.
На этапе 710 количество найденных импульсов p устанавливается равным 0, состояние s устанавливается равным 0, и рассматриваемая позиция k дорожки устанавливается равной 1.
На этапе 720 проверяется, является ли k меньше или равно N, то есть имеются ли оставшиеся нерассмотренные позиции дорожки (здесь N обозначает количество позиций дорожки). Если k не меньше или равно N, все позиции дорожки рассмотрены, и процесс заканчивается.
В ином случае на этапе 730 проверяется, присутствует ли по меньшей мере один импульс в позиции k. Если это не так, процесс переходит на этап 740, на котором k увеличивается на 1, таким образом, чтобы была рассмотрена следующая позиция дорожки.
Однако если по меньшей мере один импульс присутствует в позиции k дорожки, на этапе 750 проверяется, является ли рассматриваемый в настоящий момент импульс последним импульсом в позиции k дорожки. Если это не так, то на этапе 770 состояние s обновляется посредством добавления f(p, k-1) к состоянию s, количество найденных импульсов p увеличивается на 1, и процесс переходит на этап 780.
Если рассматриваемый в настоящий момент импульс является последним импульсом в позиции k дорожки, то после этапа 750 процесс переходит на этап 755, и состояние смещается на один шаг влево (s:=s*2). Затем на этапе 760 проверяется, имеет ли импульс знак минус. Если это так, самый нижний бит s устанавливается равным 1 (этап 762); в ином случае самый нижний бит s устанавливается равным 0 (или ничего не делается) (этап 764). Затем в обоих случаях выполняется этап 770, на котором состояние s обновляется посредством добавления f(p, k-1) к состоянию s, количество найденных импульсов p увеличивается на 1, и процесс переходит на этап 780.
На этапе 780 проверяется, имеется ли другой импульс в позиции k. Если это так, процесс переходит на этап 750; в ином случае процесс переходит на этап 740.
Далее обеспечивается концепция для формирования кодирования состояния множества дорожек с объединенным номером кодирования.
К сожалению, во многих случаях диапазон возможных состояний единственной дорожки не является кратным 2, и, таким образом, двоичное представление каждого состояния является неэффективным. Например, если количество возможных состояний равно 5, то нам нужно 3 бита для их представления с помощью двоичного числа. Однако если мы имеем четыре дорожки, каждая из которых имеет 5 состояний, то мы имеем 5x5x5x5=625 состояний для всего субкадра, которые могут быть представлены посредством 10 битов (вместо 4×3=12 битов). Это соответствует 2,5 битам на дорожку вместо 3, и, таким образом, мы получаем экономию 0,5 бита на дорожку или, эквивалентно, 2 бита на субкадр (20% от всего расхода битов). Поэтому важно объединить состояния каждой дорожки в одно объединенное состояние, поскольку посредством этого неэффективность двоичного представления может быть уменьшена. Следует отметить, что такой же подход может быть использован для любых передаваемых номеров. Например, поскольку каждый субкадр может иметь состояние, представляющее позиции импульсов, и каждый кадра может иметь, например, четыре субкадра, эти состояния могут быть объединены в один объединенный номер состояния.
При условии, что субкадр имеет, например, 4 дорожки, расход битов может быть уменьшен для увеличения эффективности совместно кодирования состояния каждой дорожки. Например, при условии, что каждая дорожка имеет pk импульсов, и каждая дорожка имеет длину N, например имеет N позиций дорожки, тогда состояние каждой дорожки находится в диапазоне от 0 до f(pk, N)-1. Состояния sk каждой из дорожек тогда могут быть объединены в объединенное состояние s субкадра с помощью формулы (предполагающей, что мы имеет 4 дорожки на субкадр),
Формула 2:
Figure 00000003
Состояния каждой дорожки тогда могут быть определены в декодере посредством деления объединенного состояния f(pk, N), посредством чего остаток представляет собой состояние последней дорожки, а целочисленная часть представляет собой объединенное состояние оставшихся дорожек. Если количество дорожек отличается от 4, мы можем с легкостью соответствующим образом добавить или сократить количество членов в приведенном выше уравнении.
Следует отметить, что когда количество импульсов на дорожку является большим, количество возможных состояний становится большим. Например, при 6 импульсах на дорожку с четырьмя дорожками и длиной дорожки N=16 состояние представляет собой 83-битное число, что превышает максимальную длину двоичных чисел на регулярных процессорах. Из этого следует, что некоторые дополнительные этапы должны быть сделаны для оценки приведенной выше формулы с использованием стандартных способов работы с очень длинными целыми числами.
Также следует заметить, что этот подход эквивалентен арифметическому кодированию состояний дорожки, когда вероятности состояния предполагаются равными.
Выше был представлен пошаговый подход для кодирования и декодирования информации импульсов дорожки, например позиций и, возможно, знаков импульсов дорожки. Другие варианты осуществления обеспечивают другой подход, который будет называться подходом "разбиения и подчинения".
Кодер информации импульсов, выполненный с возможностью применять подход разбиения и подчинения, делит дорожку на два раздела x1 и x2, которые можно рассматривать как два вектора, причем x=[x1 x2]. Основная идея состоит в том, чтобы закодировать оба вектора x1 и x2 отдельно и затем объединить их оба с помощью формулы.
Формула 3:
Figure 00000004
В приведенном выше уравнении следует отметить, что s(x1) и s(x2) являются состояниями векторов x1 и x2, когда количество импульсов уже известно, то есть когда векторы имеют, соответственно, p1 и p2=p-p1 импульсов. Чтобы принять во внимание все состояния, которые имеют от 0 до p1-1 импульсов в векторе x1, мы должны добавить знак суммирования в приведенном выше уравнении.
Приведенные выше алгоритм и формула могут быть применены для кодирования импульсов чередованных дорожек посредством применения следующих двух этапов предварительной обработки. Во-первых, положим, что векторы xtrack k состоят из всех отсчетов в дорожке k, и объединим эти векторы, определяя x=[xtrack 1, xtrack 2, xtrack 3, xtrack 4]. Заметим, что это просто такое переупорядочение отсчетов, в котором все отсчеты из дорожки 1 помещены в первую группу, и так далее.
Во-вторых, отметим, что количество импульсов на дорожку обычно является фиксированным числом. Из этого следует, что если дорожка 1 всегда имеет p1 импульсов, то количество состояний на дорожке 1 равно f(k, N1])=0 для всех значений k≠p1. Это лишь другой способ сказать, что для дорожи 1 нет состояний, которые не имеют p1 импульсов. Тогда мы можем формально определить формулу количества состояний как:
Формула 4:
Для полной дорожки xtrack с pk импульсами количество состояний равно (N=Ntrack k)
Figure 00000005
Иначе, для N>1
Figure 00000006
И для N=1:
Figure 00000007
Посредством переупорядочения отсчетов и использования приведенного выше определения для количества состояний (формула 4) мы можем вычислить объединенное состояние всех дорожек с помощью формулы 3. Следует отметить, что поскольку количество состояний содержат главным образом нули, сумма в формуле 3 представляет собой нуль при слиянии состояния дорожек. Поэтому слияние двух дорожек идентично формуле 2. Аналогичным образом, мы можем легко показать, что слияние всех четырех (или пяти) дорожек также дает идентичные результаты с помощью обоих подходов.
В соответствии с вариантом осуществления переупорядочение может использоваться в качестве этапа предварительной обработки для кодера. В другом варианте осуществления переупорядочение может быть интегрировано в кодер. Аналогичным образом, в соответствии с вариантом осуществления переупорядочение может использоваться в качестве этапа последующей обработки для декодера. В другом варианте осуществления переупорядочение может быть интегрировано в декодер.
Если количество импульсов на дорожке не фиксировано, мы можем легко соответствующим образом изменить формулу количества состояний и по-прежнему использовать тот же самый алгоритм кодирования.
Следует заметить, что подход, представленный в разделе "Комбинирование данных дорожки" и приведенный выше способ дают эквивалентные результаты, если порядок слияния дорожек выбран соответствующим образом. Аналогично, также пошаговый подход и подход разбиения и подчинения дают эквивалентные результаты. Поэтому мы можем независимо выбрать подход для использования в декодере и кодере, согласно которому реализация является более практичной или который наилучшим образом удовлетворяет вычислительным ограничениям платформы.
В соответствии с вариантом осуществления обеспечен алгоритм кодера информации импульсов, который может быть описан на псевдокоде следующим образом.
функция состояние = encode(x)
1. если длина x равна 1
a. если x не имеет импульсов
i. состояние =0
ii. возврат
b. иначе (x имеет по меньшей мере один импульс)
i. если импульс(ы) в x положителен
состояние =0
возврат
ii. иначе (импульс(ы) в x отрицателен)
состояние =1
возврат
iii. конец
c. конец
2. иначе (то есть когда длина x>1)
a. разделить x на два вектора x1 и x2 с длиной N1 и N2 соответственно
b. определить состояние вектора x1 как s1=encode(x1)
c. определить состояние вектора x2 как s2=encode(x2)
d. Пусть p - количество импульсов в x, и pi - количество импульсов в x1
e. Присвоить n0=0
f. для k от 0 до p1-1
i. Присвоить n0:=n0+f(k, N1)*f(p-k, N2)
g. конец
h. вычислить состояние как s:=s1+f(p1, N1)*s2+n0
i. возврат
3. конец
Используя такой алгоритм кодирования в соответствии с вариантом осуществления, кодер информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки и во второй раздел дорожки. Кодер информации импульсов выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу. Кроме того, кодер информации импульсов выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу. Кроме того, кодер информации импульсов выполнен с возможностью объединять номер первого подсостояния и номер второго подсостояния для получения номера состояния.
Аналогичным образом, в соответствии с вариантом осуществления обеспечен алгоритм декодера информации импульсов, который может быть описан на псевдокоде следующим образом.
функция x=decode(s, p, N)
1. если количество импульсов p равно 0
a. возвратить вектор x из нулей
2. иначе
a. если len равно 1
i. если s==0
1. Вектор x имеет p положительные импульсов в своей первой позиции
ii. иначе
1. Вектор x имеет p отрицательных импульсов в своей первой позиции
iii. конец
b. иначе
i. Выбрать длины N1 и N2 разделов
ii. Присвоить n0:=0 и p1:=0
iii. Пока n0+f(p1, N1)*f(p-p1)<s
1. присвоить p1:=p1+1
2. присвоить n0:=n0+f(p1, N1)*f(p-p1)
iv. конец
v. присвоить s:=s-n0 и p2:=p-p1
vi. присвоить s1:=s/f(p1, N1) и установить остаток равным s2
vii. декодировать первый раздел x1=decode(s1, p1, N1)
viii. декодировать второй раздел x2=decode(s2, p2, N2)
ix. слить разделы x1 и x2 в x
c. конец
3. конец
В варианте осуществления, реализующем подход разбиения и подчинения, декодер информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния. Декодер информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов первого раздела одной из дорожек на основе номера первого подсостояния. Кроме того, декодер информации импульсов выполнен с возможностью декодировать вторую группу позиций импульсов второго раздела одной из дорожек на основе номера второго подсостояния.
Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют описание соответствующего способа, в котором блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.
В зависимости от некоторых требований реализации варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с использованием цифрового носителя, например гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные на нем электронно-читаемые управляющие сигналы, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.
Некоторые варианты осуществления в соответствии с изобретением содержат носитель данных, имеющий электронно-читаемые управляющие сигналы, которые способны к взаимодействию с программируемой компьютерной системой таким образом, что выполняется один из описанных здесь способов.
В общем случае варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, который выполнен с возможностью выполнять один из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных здесь способов, сохраненную на машиночитаемом носителе или непереходном носителе.
Другими словами, вариант осуществления способа изобретения, таким образом, является компьютерной программой, имеющей программный код для выполнения одного из описанных здесь способов, когда компьютерная программа работает на компьютере.
Дополнительный вариант осуществления способов изобретения, таким образом, является носителем информации (или цифровым носителем, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных здесь способов.
Дополнительный вариант осуществления способа изобретения, таким образом, является потоком данных или последовательностью сигналов, представляющими компьютерную программу для выполнения одного из описанных здесь способов. Поток данных или последовательность сигналов, например, могут быть выполнены с возможностью быть переданными через соединение передачи данных, например через Интернет или по радиоканалу.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, выполненное с возможностью выполнять один из описанных здесь способов.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из описанных здесь способов.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторой или всей функциональности описанных здесь способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнить один из описанных здесь способов. В общем случае способы предпочтительно выполняются любым аппаратным устройством.
Описанные выше варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Подразумевается, что модификации и изменения описанных здесь устройств и деталей будут очевидны для специалистов в данной области техники. Таким образом, изобретение ограничено только объемом нижеследующей формулы изобретения, а не конкретными деталями, представленными здесь посредством описания и разъяснения вариантов осуществления.

Claims (15)

1. Устройство для декодирования закодированного аудиосигнала, в котором одна или более дорожек ассоциированы с закодированным аудиосигналом, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем устройство содержит:
декодер (110) информации импульсов для декодирования множества позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер (110) информации импульсов выполнен с возможностью декодировать множество позиций импульсов посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния; и
декодер (120) сигналов для декодирования закодированного аудиосигнала посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодер (110) информации импульсов дополнительно выполнен с возможностью декодировать множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
при этом декодер (120) сигналов выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
2. Устройство по п. 1, в котором одна или более дорожек содержат по меньшей мере последнюю дорожку и одну или более других дорожек, и
в котором декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния из номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульсов на основе номера второго подсостояния,
причем вторая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции последней дорожки, и
при этом первая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции одной или более других дорожек.
3. Устройство по п. 2, в котором декодер информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния посредством деления номера состояния на f (pk, N) для получения целочисленной части и остатка в качестве результата деления, причем целочисленная часть является номером первого подсостояния, и остаток является номером второго подсостояния, причем pk указывает для каждой из одной или более дорожек количество импульсов, и N указывает для каждой из одной или более дорожек количество позиций дорожки, причем f (pk, N) является функцией, возвращающей количество состояний, которые могут быть достигнуты на дорожке длины N с рk импульсами.
4. Устройство по п. 1, в котором декодер (110) информации импульсов выполнен с возможностью проводить проверку, сравнивая номер состояния или обновленный номер состояния с пороговым значением.
5. Устройство по п. 4, в котором декодер (110) информации импульсов выполнен с возможностью проводить проверку, сравнивая, является ли номер состояния или обновленный номер состояния большим, большим или равным, меньшим, меньшим или равным порогового значения, и в котором декодер (110) информации импульсов дополнительно выполнен с возможностью обновлять номер состояния или обновленный номер состояния в зависимости от результата проверки.
6. Устройство по п. 5, в котором декодер (110) информации импульсов выполнен с возможностью сравнивать номер состояния или обновленный номер состояния с пороговым значением для каждой позиции дорожки одной из множества дорожек.
7. Устройство по п. 1,
в котором декодер (110) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов, ассоциированных с первым разделом дорожки, на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульса, ассоциированных с вторым разделом дорожки, на основе номера второго подсостояния.
8. Устройство для кодирования аудиосигнала, содержащее:
процессор (210) сигналов для определения множества коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодер (220) информации импульсов для кодирования множества позиций импульсов, относящихся к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем кодер (220) информации импульсов выполнен с возможностью кодировать множество позиций импульсов, формируя номер состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
при этом кодер (220) информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек для получения номера состояния.
9. Устройство для кодирования по п. 8, в котором кодер (220) информации импульсов выполнен с возможностью кодировать множество знаков импульсов, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, причем кодер (220) информации импульсов выполнен с возможностью кодировать множество знаков импульсов, формируя номер состояния таким образом, что знаки импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов.
10. Устройство по п. 8, в котором кодер (220) информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния, причем целочисленное значение определяется посредством f (р, k-1), причем р указывает количество найденных импульсов, k указывает позицию дорожки, и f (Р, N) указывает количество возможных конфигураций для дорожки, имеющей N позиций дорожки и p импульсов со знаком.
11. Устройство по п. 8,
в котором кодер (220) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу, и
при этом кодер (220) информации импульсов выполнен с возможностью объединять номер первого подсостояния и номер второго подсостояния для получения номера состояния.
12. Способ декодирования закодированного аудиосигнала, в котором одна или более дорожек ассоциированы с закодированным аудиосигналом, при этом каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем способ содержит этапы, на которых:
декодируют множество позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем множество позиций импульсов декодируется посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния;
декодируют множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
декодируют закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодирование закодированного аудиосигнала проводится посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
13. Способ кодирования аудиосигнала, содержащий этапы, на которых:
определяют множество коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодируют множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем множество позиций импульсов закодировано посредством формирования номера состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
причем кодирование множества позиций импульсов проводится посредством добавления целочисленного значения к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния.
14. Компьютерно-читаемый носитель, содержащий компьютерную программу, реализующую способ по п. 12, при выполнении на компьютере или в процессоре сигналов.
15. Компьютерно-читаемый носитель, содержащий компьютерную программу, реализующую способ по п. 13, при выполнении на компьютере или в процессоре сигналов.
RU2013142068/08A 2011-02-14 2012-02-10 Кодирование и декодирование позиций импульсов дорожек аудиосигнала RU2586597C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052294 WO2012110416A1 (en) 2011-02-14 2012-02-10 Encoding and decoding of pulse positions of tracks of an audio signal

Publications (2)

Publication Number Publication Date
RU2013142068A RU2013142068A (ru) 2015-03-27
RU2586597C2 true RU2586597C2 (ru) 2016-06-10

Family

ID=71943601

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013142068/08A RU2586597C2 (ru) 2011-02-14 2012-02-10 Кодирование и декодирование позиций импульсов дорожек аудиосигнала

Country Status (19)

Country Link
US (1) US9595263B2 (ru)
EP (3) EP3471092B1 (ru)
JP (1) JP5800915B2 (ru)
KR (1) KR101643450B1 (ru)
CN (1) CN103460284B (ru)
AR (1) AR085361A1 (ru)
AU (1) AU2012217184B2 (ru)
BR (1) BR112013020700B1 (ru)
CA (1) CA2827156C (ru)
ES (2) ES2639646T3 (ru)
HK (1) HK1245987B (ru)
MX (1) MX2013009345A (ru)
PL (3) PL3239978T3 (ru)
PT (2) PT2676267T (ru)
RU (1) RU2586597C2 (ru)
SG (1) SG192747A1 (ru)
TR (1) TR201903388T4 (ru)
WO (1) WO2012110416A1 (ru)
ZA (1) ZA201306841B (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978970B (zh) 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
AU2020299973A1 (en) 2019-07-02 2022-01-27 Dolby International Ab Methods, apparatus and systems for representation, encoding, and decoding of discrete directivity data
US11088784B1 (en) 2020-12-24 2021-08-10 Aira Technologies, Inc. Systems and methods for utilizing dynamic codes with neural networks
US11575469B2 (en) 2020-12-28 2023-02-07 Aira Technologies, Inc. Multi-bit feedback protocol systems and methods
US11368251B1 (en) 2020-12-28 2022-06-21 Aira Technologies, Inc. Convergent multi-bit feedback system
US11483109B2 (en) 2020-12-28 2022-10-25 Aira Technologies, Inc. Systems and methods for multi-device communication
US11489624B2 (en) 2021-03-09 2022-11-01 Aira Technologies, Inc. Error correction in network packets using lookup tables
US11489623B2 (en) 2021-03-15 2022-11-01 Aira Technologies, Inc. Error correction in network packets
US11496242B2 (en) 2021-03-15 2022-11-08 Aira Technologies, Inc. Fast cyclic redundancy check: utilizing linearity of cyclic redundancy check for accelerating correction of corrupted network packets

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0784846A1 (en) * 1994-04-29 1997-07-23 Sherman, Jonathan, Edward A multi-pulse analysis speech processing system and method
JPH11502318A (ja) * 1995-03-22 1999-02-23 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 分析/合成線形予測音声コーダ
RU2003118444A (ru) * 2000-11-22 2004-12-10 Войсэйдж Корпорейшн (Ca) Индексирование положений и знаков импульсов в алгебраических кодовых книгах для кодирования широкополосных сигналов
RU2004138289A (ru) * 2002-05-31 2005-06-10 Войсэйдж Корпорейшн (Ca) Способ и система для многоскоростного решетчатого векторного квантования сигнала
RU2302665C2 (ru) * 2001-12-14 2007-07-10 Нокиа Корпорейшн Способ модификации сигнала для эффективного кодирования речевых сигналов
US7587312B2 (en) * 2002-12-27 2009-09-08 Lg Electronics Inc. Method and apparatus for pitch modulation and gender identification of a voice signal
CA2730239A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Family Cites Families (210)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69232202T2 (de) 1991-06-11 2002-07-25 Qualcomm Inc Vocoder mit veraendlicher bitrate
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
KR100419545B1 (ko) 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
DE10084675T1 (de) 1999-06-07 2002-06-06 Ericsson Inc Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) * 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
CN1266674C (zh) 2000-02-29 2006-07-26 高通股份有限公司 闭环多模混合域线性预测语音编解码器和处理帧的方法
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20050130321A1 (en) 2001-04-23 2005-06-16 Nicholson Jeremy K. Methods for analysis of spectral data and their applications
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) * 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
DE10200653B4 (de) 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7302387B2 (en) * 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463559B1 (ko) * 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100463419B1 (ko) * 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) * 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
US7876966B2 (en) 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
CN100508030C (zh) 2003-06-30 2009-07-01 皇家飞利浦电子股份有限公司 一种编码/解码音频信号的方法及相应设备
DE10331803A1 (de) 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US6987591B2 (en) 2003-07-17 2006-01-17 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Volume hologram
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7418396B2 (en) 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
WO2005073959A1 (en) 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
BRPI0418527A (pt) 2004-02-12 2007-05-15 Nokia Corp método para relatar uma qualidade de transmissão em fluxo, programa de computação com instruções operáveis, produto de programa de computação, sistema de transmissão em fluxo, cliente em um sistema de transmissão em fluxo, servidor em um sistema de transmissão em fluxo, e, protocolo para um sistema de transmissão em fluxo
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
EP1852851A1 (en) 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
ES2338117T3 (es) 2004-05-17 2010-05-04 Nokia Corporation Codificacion de audio con diferentes longitudes de trama de codificacion.
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) * 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
US9047860B2 (en) 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
WO2006082636A1 (ja) 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
MX2007012187A (es) 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
ES2629727T3 (es) 2005-06-18 2017-08-14 Nokia Technologies Oy Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
EP1852848A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
JP5052514B2 (ja) 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
US8255213B2 (en) 2006-07-12 2012-08-28 Panasonic Corporation Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN102592303B (zh) 2006-07-24 2015-03-11 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8005678B2 (en) 2006-08-15 2011-08-23 Broadcom Corporation Re-phasing of decoder states after packet loss
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
PT2109098T (pt) 2006-10-25 2020-12-18 Fraunhofer Ges Forschung Aparelho e método para gerar amostras de áudio de domínio de tempo
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
BRPI0808202A8 (pt) 2007-03-02 2016-11-22 Panasonic Corp Dispositivo de codificação e método de codificação.
DE102007013811A1 (de) 2007-03-22 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
DK2827327T3 (da) * 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
CN101388210B (zh) * 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
PT2165328T (pt) 2007-06-11 2018-04-24 Fraunhofer Ges Forschung Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2658942T3 (es) 2007-08-27 2018-03-13 Telefonaktiebolaget Lm Ericsson (Publ) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) * 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
RU2562395C2 (ru) 2008-03-04 2015-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Микширование входящих информационных потоков
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8423852B2 (en) 2008-04-15 2013-04-16 Qualcomm Incorporated Channel decoding-based error detection
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2301020B1 (en) 2008-07-11 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP3002750B1 (en) 2008-07-11 2017-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8380498B2 (en) 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
BRPI0914056B1 (pt) 2008-10-08 2019-07-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificação/decodificação de áudio comutado multi-resolução
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
MY180550A (en) 2009-01-16 2020-12-02 Dolby Int Ab Cross product enhanced harmonic transposition
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
CA2750795C (en) 2009-01-28 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8805694B2 (en) 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
WO2010148516A1 (en) 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
JP5267362B2 (ja) 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
US8635357B2 (en) 2009-09-08 2014-01-21 Google Inc. Dynamic selection of parameter sets for transcoding media data
PL2473995T3 (pl) 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
CN102884574B (zh) 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
WO2011048094A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec and celp coding adapted therefore
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
WO2011127832A1 (en) 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
FR2963254B1 (fr) 2010-07-27 2012-08-24 Maurice Guerin Dispositif et procede pour laver des surfaces internes d?une enceinte
RU2585999C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование шума в аудиокодеках
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP2721610A1 (en) 2011-11-25 2014-04-23 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0784846A1 (en) * 1994-04-29 1997-07-23 Sherman, Jonathan, Edward A multi-pulse analysis speech processing system and method
JPH11502318A (ja) * 1995-03-22 1999-02-23 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 分析/合成線形予測音声コーダ
RU2003118444A (ru) * 2000-11-22 2004-12-10 Войсэйдж Корпорейшн (Ca) Индексирование положений и знаков импульсов в алгебраических кодовых книгах для кодирования широкополосных сигналов
RU2302665C2 (ru) * 2001-12-14 2007-07-10 Нокиа Корпорейшн Способ модификации сигнала для эффективного кодирования речевых сигналов
RU2004138289A (ru) * 2002-05-31 2005-06-10 Войсэйдж Корпорейшн (Ca) Способ и система для многоскоростного решетчатого векторного квантования сигнала
US7587312B2 (en) * 2002-12-27 2009-09-08 Lg Electronics Inc. Method and apparatus for pitch modulation and gender identification of a voice signal
CA2730239A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Also Published As

Publication number Publication date
CA2827156C (en) 2017-07-18
EP3471092B1 (en) 2020-07-08
PL2676267T3 (pl) 2017-12-29
CA2827156A1 (en) 2012-08-23
EP2676267B1 (en) 2017-07-19
ES2639646T3 (es) 2017-10-27
ES2715191T3 (es) 2019-06-03
AU2012217184B2 (en) 2015-07-30
MX2013009345A (es) 2013-10-01
RU2013142068A (ru) 2015-03-27
WO2012110416A1 (en) 2012-08-23
US20130339036A1 (en) 2013-12-19
TR201903388T4 (tr) 2019-04-22
BR112013020700B1 (pt) 2021-07-13
PL3239978T3 (pl) 2019-07-31
JP5800915B2 (ja) 2015-10-28
EP3471092A1 (en) 2019-04-17
SG192747A1 (en) 2013-09-30
CN103460284A (zh) 2013-12-18
PT3239978T (pt) 2019-04-02
PT2676267T (pt) 2017-09-26
BR112013020700A2 (pt) 2018-07-10
KR101643450B1 (ko) 2016-08-10
PL3471092T3 (pl) 2020-12-28
EP3239978B1 (en) 2018-12-26
US9595263B2 (en) 2017-03-14
CN103460284B (zh) 2016-05-18
EP3239978A1 (en) 2017-11-01
EP2676267A1 (en) 2013-12-25
HK1245987B (zh) 2020-01-03
ZA201306841B (en) 2014-05-28
AU2012217184A1 (en) 2013-09-19
JP2014510302A (ja) 2014-04-24
AR085361A1 (es) 2013-09-25
KR20130133847A (ko) 2013-12-09

Similar Documents

Publication Publication Date Title
RU2586597C2 (ru) Кодирование и декодирование позиций импульсов дорожек аудиосигнала
TWI488176B (zh) 音訊信號音軌脈衝位置之編碼與解碼技術
KR101790463B1 (ko) 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치
MX2011003815A (es) Decodificador de audio, codificador de audio, metodo para decodificar una señal de audio, metodo para codificar una señal de audio, programa de computadora y señal de audio.
EP3074970B1 (en) Audio encoder and decoder
EP3467824A1 (en) Method and system for inter-channel coding
KR20060131781A (ko) 디지털 신호 압축 시의 코딩에 사용되는 멀티펄스딕셔너리의 인덱스간 트랜스 코딩
JP2019091075A (ja) 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム
CN106796804A (zh) 用于对话增强的解码方法和解码器
ES2428572T3 (es) Dispositivo de codificación de audio y método de codificación de audio
EP2727106B1 (en) Multiple scale codebook search
RU2662921C2 (ru) Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
ES2821725T3 (es) Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
JP2004120623A (ja) 符号化装置、符号化方法、復号装置及び復号方法
EP2665060B1 (en) Apparatus for coding a speech/sound signal
US20210279037A1 (en) Temporal computing
JP5762636B2 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
WO2023198862A1 (en) Time-domain gain modeling in the qmf domain
JP3068689B2 (ja) 音声符号化方法