RU2586597C2 - Кодирование и декодирование позиций импульсов дорожек аудиосигнала - Google Patents
Кодирование и декодирование позиций импульсов дорожек аудиосигнала Download PDFInfo
- Publication number
- RU2586597C2 RU2586597C2 RU2013142068/08A RU2013142068A RU2586597C2 RU 2586597 C2 RU2586597 C2 RU 2586597C2 RU 2013142068/08 A RU2013142068/08 A RU 2013142068/08A RU 2013142068 A RU2013142068 A RU 2013142068A RU 2586597 C2 RU2586597 C2 RU 2586597C2
- Authority
- RU
- Russia
- Prior art keywords
- track
- positions
- pulse
- pulses
- tracks
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Abstract
Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала. Устройство содержит декодер информации импульсов и декодер сигналов. Декодер информации импульсов выполнен с возможностью декодировать множество позиций импульсов, причем каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер информации импульсов выполнен с возможностью декодировать множество позиций импульса посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния. 6 н. и 9 з.п. ф-лы, 7 ил.
Description
Настоящее изобретение имеет отношение к области обработки аудиосигнала и кодирования аудиосигнала и, в частности, к кодированию и декодированию позиций импульсов дорожек в аудиосигнале.
Обработка и/или кодирование аудиоданных совершенствовались многими способами. При кодировании аудиосигнала важную роль играют кодеры с линейным предсказанием. Когда кодируется аудиосигнал, например аудиосигнал, содержащий речь, кодеры с линейным предсказанием обычно кодируют представление огибающей спектра аудиосигнала. С этой целью кодеры с линейным предсказанием могут определять коэффициенты фильтра с предсказанием для представления огибающей спектра звука в закодированной форме. Коэффициенты фильтра затем могут использоваться декодером с линейным предсказанием для декодирования закодированного аудиосигнала посредством формирования синтезированного аудиосигнала с использованием коэффициентов фильтра с предсказанием.
Важными примерами для кодеров с линейным предсказанием являются кодеры ACELP (ACELP = линейное предсказание с возбуждением по алгебраической кодовой книге). Кодеры ACELP широко используются, например, в кодировании USAC (USAC = объединенное кодирование речи и аудиосигналов) и могут иметь дополнительные области применения, например в LD-USAC (объединенное кодирование речи и аудиосигналов с малой задержкой).
Кодеры ACELP обычно кодируют аудиосигнал, определяя коэффициенты фильтра с предсказанием. Чтобы достигнуть лучшего кодирования, кодеры ACELP определяют разностный сигнал, также называемый целевым сигналом, на основе аудиосигнала, который должен быть закодирован, и на основе уже определенных коэффициентов фильтра с предсказанием. Разностный сигнал, например, может быть сигналом разности, представляющим разность между аудиосигналом, который должен быть закодирован, и частями сигнала, которые закодированы посредством коэффициентов фильтра с предсказанием и, возможно, посредством коэффициентов адаптивного фильтра, полученных в результате анализа высоты звука. Затем кодер ACELP стремится закодировать разностный сигнал. Для этого кодер кодирует параметры алгебраической кодовой книги, которые используются для кодирования разностного сигнала.
Для кодирования разностного сигнала используются алгебраические кодовые книги. Обычно алгебраические кодовые книги содержат множество дорожек, например четыре дорожки, каждая из которых содержит 16 позиций дорожки. В такой конфигурации в общей сложности 4·16=64 типовых позиции могут быть представлены соответствующей алгебраической кодовой книгой, например, в соответствии с количеством отсчетов субкадра аудиосигнала, который должен быть закодирован.
Дорожки кодовой книги могут быть чередованы таким образом, что дорожка 0 кодовой книги может представлять отсчеты 0, 4, 8,..., 60 субкадра, дорожка 1 кодовой книги может представлять отсчеты 1, 5, 9,..., 61 субкадра, дорожка 2 кодовой книги может представлять отсчеты 2, 6, 10,..., 62 субкадра, и дорожка 3 кодовой книги может представлять отсчеты 3, 7, 11,..., 63 субкадра. Каждая дорожка может иметь постоянное количество импульсов. Или количество импульсов на каждую дорожку может меняться, например, в зависимости от других условий. Импульс может быть положительным или отрицательным и, например, может быть представлен как +1 (положительный импульс) или 0 (отрицательный импульс).
Для кодирования разностного сигнала при кодировании может быть выбрана конфигурация кодовой книги, которая лучше всего представляет оставшиеся части разностного сигнала. Для этого доступные импульсы могут быть расположены в подходящие позиции дорожки, которые лучше всего отражают части сигнала, которые должны быть закодированы. Кроме того, может быть указано, является ли соответствующий импульс положительным или отрицательным.
На стороне декодера декодер ACELP сначала декодирует параметры алгебраической кодовой книги. Декодер ACELP также может декодировать адаптивные параметры кодовой книги. Чтобы определить алгебраические параметры кодовой книги, декодер ACELP может определить множество позиций импульсов для каждой дорожки алгебраической кодовой книги. Кроме того, декодер ACELP также может декодировать информацию о том, является ли импульс в позиции дорожки положительным или отрицательным импульсом. Кроме того, декодер ACELP также может декодировать адаптивные параметры кодовой книги. На основе этой информации декодер ACELP обычно формирует сигнал возбуждения. Затем декодер ACELP применяет коэффициенты фильтра с предсказанием к сигналу возбуждения, чтобы сформировать синтезированный аудиосигнал для получения декодированного аудиосигнала.
В ACELP импульсы на дорожке обычно закодированы следующим образом. Если дорожка имеет длину 16, и если количество импульсов на этой дорожке равно одному, то мы можем закодировать позицию импульса ее позицией (4 бита) и знаком (1 бит), всего 5 битов. Если дорожка имеет длину 16 и количество импульсов равно двум, то первый импульс кодируется его позицией (4 бита) и знаком (1 бит). Для второго импульса мы должны закодировать позицию (только 4 бита), поскольку можем решить, что знак второго импульса положителен, если он находится слева от первого импульса, отрицателен, если он находится справа от первого импульса, и имеет такой же знак, как первый импульс, если он находится в такой же позиции, как первый импульс. Таким образом нам нужны только 9 битов, чтобы закодировать 2 импульса. Таким образом, по сравнению с кодированием позиций импульсов отдельно по 5 битов на каждый мы экономим 1 бит для каждой пары импульсов.
Кодируя более чем два импульса, мы можем закодировать импульсы попарно, и если количество импульсов нечетное, закодировать последний импульс отдельно. Так, например, для дорожки из 5 импульсов, нам понадобится 9+9+5=23 бита. Если у нас есть 4 дорожки, то 4×23=92 бита потребуется для кодирования субкадра длиной 64 с 4 дорожками и 5 импульсами на каждую дорожку. Однако будет очень ценно, если количество битов могло бы быть еще больше сокращено.
Было бы очень желательно обеспечить устройство для кодирования и соответствующее устройство для декодирования с улучшенной концепцией кодирования или декодирования, которые имеют средства кодирования или декодирования информации импульсов улучшенным образом с использованием меньшего количества битов для представления информации импульсов, поскольку это, например, уменьшило бы скорость передачи соответствующим образом закодированного аудиосигнала, и, кроме того, это, например, уменьшило бы размер памяти для хранения соответствующим образом закодированного аудиосигнала.
Таким образом, задача настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для кодирования и декодирования импульсов дорожек аудиосигнала. Задачи настоящего изобретения достигаются посредством устройства для декодирования по п. 1 формулы изобретения, устройства для кодирования по п. 9 формулы изобретения, способа декодирования по п. 13 формулы изобретения, способа кодирования по п. 14 формулы изобретения и компьютерной программы по п. 15 формулы изобретения.
В соответствии с вариантами осуществления предполагается, что один номер состояния доступен для устройства для декодирования. Кроме того, предполагается, что количество позиций дорожки, указывающее общее количество позиций дорожки по меньшей мере одной из дорожек, соответствующей закодированному аудиосигналу, и общее количество импульсов, указывающее количество импульсов по меньшей мере одной из дорожек, доступны для устройства декодирования настоящего изобретения. Предпочтительно количество позиций дорожки и общее количество импульсов доступны для каждой дорожки, соответствующей закодированному аудиосигналу.
Например, каждая из 4 дорожек с 5 импульсами может достигнуть примерно 6,6×10^21 состояний, которые в соответствии с вариантами осуществления могут быть закодированы посредством 73 битов, что приблизительно на 21% более эффективно, чем кодирование описанного выше кодера текущего уровня техники, использующего 92 бита.
Сначала обеспечивается концепция, каким образом следует эффективно кодировать множество позиций импульсов дорожки аудиосигнала. В дальнейшем концепция расширяется, чтобы позволить кодировать не только позицию импульсов дорожки, но также и информацию о том, является ли импульс положительным или отрицательным. Кроме того, затем концепция расширяется, чтобы позволить эффективно кодировать информацию импульсов для множества дорожек. Концепции соответствующим образом применимы на стороне декодера.
Кроме того, варианты осуществления основаны на том факте, что если стратегия кодирования использует предопределенное количество битов, то любая конфигурация с таким же количеством импульсов на каждой дорожке требует того же количества битов. Если количество доступных битов фиксировано, то возможно непосредственно выбрать, сколько импульсов может быть закодировано с помощью заданного количества битов, и тем самым дать возможность кодирования с предопределенным качеством. Кроме того, с помощью этого подхода не требуется пробовать разное количество импульсов, пока не будет достигнута требуемая битовая скорость, а мы можем непосредственно выбрать правильное количество импульсов, тем самым уменьшая сложность.
На основе приведенных выше предположений может быть закодировано и/или декодировано множество позиций импульсов дорожки кадра аудиосигнала.
Хотя настоящее изобретение может использоваться для кодирования или декодирования аудиосигналов любого типа, например речевых сигналов или музыкальных сигналов, настоящее изобретение особенно полезно для кодирования или декодирования речевых сигналов.
В другом варианте осуществления декодер информации импульсов дополнительно выполнен с возможностью декодировать множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый из знаков импульсов указывает знак одного из множества импульсов. Декодер сигналов может быть выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнал с дополнительным использованием множества знаков импульсов.
В соответствии с дополнительным вариантом осуществления, в котором одна или более дорожек могут содержать по меньшей мере последнюю дорожку и одну или более других дорожек, декодер информации импульсов может быть выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния из номера состояния. Декодер информации импульсов может быть выполнен с возможностью декодировать первую группу позиций импульсов на основе номера первого подсостояния, и декодер информации импульсов также может быть выполнен с возможностью декодировать вторую группу позиций импульсов на основе номера второго подсостояния. Вторая группа позиций импульсов может состоять только из позиций импульсов, указывающих позиции последней дорожки. Первая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции дорожки одной или более других дорожек.
В соответствии с другим вариантом осуществления декодер информации импульсов может быть выполнен с возможностью разделять номер состояния на номер первого подсостояния и номер второго подсостояния посредством деления номера состояния на f(pk, N) для получения целочисленной части и остатка в качестве результата деления, причем целочисленная часть представляет собой номер первого подсостояния, и остаток представляет собой номер второго подсостояния, причем pk указывает для каждой одной или более дорожек количество импульсов, и N указывает для каждой одной или более дорожек количество позиций дорожки. Здесь f(pk, N) является функцией, возвращающей количество состояний, которые могут быть достигнуты на дорожке длины N с pk импульсами.
В другом варианте осуществления декодер информации импульсов может быть выполнен с возможностью проводить проверку, сравнивая номер состояния или обновленный номер состояния с пороговым значением.
Декодер информации импульсов может быть выполнен с возможностью проводить проверку, сравнивая, является ли номер состояния или обновленный номер состояния больше, больше или равен, меньше или меньше или равен пороговому значению, причем блок анализа дополнительно выполнен с возможностью обновлять номер состояния или обновленный номер состояния в зависимости от результата проверки.
В варианте осуществления декодер информации импульсов может быть выполнен с возможностью сравнивать номер состояния или обновленный номер состояния с пороговым значением для каждой позиции дорожки одной из множества дорожек.
В соответствии с вариантом осуществления декодер информации импульсов может быть выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере одну позицию дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий оставшиеся другие позиции дорожки из множества позиций дорожки. Декодер информации импульсов может быть выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния. Кроме того, декодер информации импульсов может быть выполнен с возможностью декодировать первую группу позиций импульсов, ассоциированных с первым разделом дорожки, на основе номера первого подсостояния. Кроме того, декодер информации импульсов может быть выполнен с возможностью декодировать вторую группу позиций импульсов, ассоциированных со вторым разделом дорожки, на основе номера второго подсостояния.
В соответствии с вариантом осуществления обеспечено устройство для кодирования аудиосигнала. Устройство содержит процессор сигналов, выполненный с возможностью определять множество коэффициентов фильтра с предсказанием, ассоциированных с аудиосигналом, для формирования разностного сигнала на основе аудиосигнала и множества коэффициентов фильтра с предсказанием. Кроме того, устройство содержит кодер информации импульсов, выполненный с возможностью кодировать множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал, одна или более дорожек ассоциированы с разностным сигналом. Каждая из дорожек имеет множество позиций дорожки и множество импульсов. Каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки. Кодер информации импульсов выполнен с возможностью кодировать множество позиций импульсов, формируя номер состояния таким образом, что позиции импульса могут быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек.
В соответствии с другим вариантом осуществления кодер информации импульсов может быть выполнен с возможностью кодировать множество знаков импульсов, причем каждый из знаков импульсов указывает знак одного из множества импульсов. Кодер информации импульсов дополнительно может быть выполнен с возможностью кодировать множество знаков импульсов, формируя номер состояния таким образом, что знаки импульсов могут быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов.
В варианте осуществления кодер информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получать номер состояния.
В соответствии с другим вариантом осуществления кодер информации импульсов может быть выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере одну позицию дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий оставшиеся другие позиции дорожки из множества позиций дорожки. Кроме того, кодер информации импульсов может быть выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу. Кроме того, кодер информации импульсов может быть выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу. Кроме того, кодер информации импульсов может быть выполнен с возможностью объединить номер первого подсостояния и номер второго подсостояния для получения номера состояния.
Далее варианты осуществления настоящего изобретения будут описаны более подробно со ссылкой на фигуры.
Фиг. 1 иллюстрирует устройство для декодирования закодированного аудиосигнала в соответствии с вариантом осуществления,
Фиг. 2 иллюстрирует устройство для кодирования аудиосигнала в соответствии с вариантом осуществления,
Фиг. 3 иллюстрирует все возможные конфигурации для дорожки, имеющей два импульса без знака и три позиции дорожки,
Фиг. 4 иллюстрирует все возможные конфигурации для дорожки, имеющей один импульс со знаком и две позиции дорожки,
Фиг. 5 иллюстрирует все возможные конфигурации для дорожки, имеющей два импульса со знаком и две позиции дорожки,
Фиг. 6 - блок-схема последовательности операций, иллюстрирующая вариант осуществления, изображающая этапы обработки, проводимые декодером информации импульсов в соответствии с вариантом осуществления, и
Фиг. 7 - блок-схема последовательности операций, иллюстрирующая вариант осуществления, блок-схема изображает этапы обработки, проводимые кодером информации импульсов в соответствии с вариантом осуществления.
Фиг. 1 иллюстрирует устройство для декодирования закодированного аудиосигнала, причем одна или более дорожек ассоциированы с закодированным аудиосигналом, каждая из дорожек имеет множество позиций дорожки и множество импульсов.
Устройство содержит декодер 110 информации импульсов и декодер 120 сигналов. Декодер 110 информации импульсов выполнен с возможностью декодировать множество позиций импульсов. Каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки.
Декодер 110 информации импульсов выполнен с возможностью декодировать множество позиций импульсов посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общее количество импульсов, указывающее общее количество импульсов по меньшей мере одной из дорожек, и один номер состояния.
Декодер 120 сигналов выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов фильтра с предсказанием, ассоциированных с закодированным аудиосигналом.
Номер состояния - это число, которое может быть закодировано кодером в соответствии с вариантами осуществления, которые будут описаны ниже. Номер состояния, например, содержит информацию о множестве позиций импульсов в компактном представлении, например в представлении, которое требует небольшого количества битов, и оно может быть декодировано, когда в кодере доступна информация о количестве позиций дорожки и общем количестве импульсов.
В варианте осуществления количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала могут быть доступны в декодере, поскольку количество позиций дорожки и/или общее количество импульсов являются статическими значениями, которые не изменяются и известны приемнику. Например, количество позиций дорожки может всегда быть равно 16 для каждой дорожки, и общее количество импульсов может всегда быть равно 4.
В другом варианте осуществления количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала могут быть явно переданы устройству для декодирования, например, устройством для кодирования.
В дополнительном варианте осуществления декодер может определить количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала посредством анализа других параметров, которые явно не указывают количество позиций дорожки и/или общее количество импульсов, но из которых могут быть получены количество позиций дорожки и/или общее количество импульсов.
В других вариантах осуществления декодер может анализировать другие доступные данные, чтобы получить количество позиций дорожки и/или общее количество импульсов одной или каждой дорожки аудиосигнала.
В дополнительном варианте осуществления декодер информации импульсов может быть также выполнен с возможностью декодировать, является ли импульс положительным импульсом или отрицательным импульсом.
В другом варианте осуществления декодер информации импульсов, кроме того, может быть выполнен с возможностью декодировать информацию импульсов, которая содержит информацию об импульсах для множества дорожек. Информация импульсов, например, может являться информацией о позиции импульсов в дорожке и/или информацией о том, является ли импульс положительным импульсом или отрицательным импульсом.
Фиг. 2 иллюстрирует устройство для кодирования аудиосигнала, содержащее процессор 210 сигналов и кодер 220 информации импульсов.
Процессор 210 сигналов выполнен с возможностью определять множество коэффициентов фильтра с предсказанием, ассоциированных с аудиосигналом, для формирования разностного сигнала на основе аудиосигнала и множества коэффициентов фильтра с предсказанием.
Кодер 220 информации импульсов выполнен с возможностью кодировать множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал. Одна или более дорожек ассоциированы с разностным сигналом, сформированному процессором 210 сигналов. Каждая из дорожек имеет множество позиций дорожки и множество импульсов. Кроме того, каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки.
Кодер 220 информации импульсов выполнен с возможностью кодировать множество позиций импульсов посредством формирования номера состояния, с тем чтобы позиции импульсов могли быть декодированы на основе только номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек.
Далее представлены основные концепции вариантов осуществления настоящего изобретения, имеющие отношение к кодированию позиций импульсов и, возможно, знака импульса (положительного импульса или отрицательного импульса) посредством формирования номера состояния.
Принципы кодирования вариантов осуществления настоящего изобретения основаны на том факте, что если рассматривается перечисление состояний всех возможных конфигураций из k импульсов в дорожке с n позициями дорожки, достаточно закодировать фактическое состояние импульсов дорожки. Кодирование такого состояния посредством по возможности наименьшего количества битов обеспечивает желаемое компактное кодирование. Посредством этого представлена концепция перечисления состояний, в которой каждая совокупность позиций импульсов и, возможно, также знаков импульсов представляют одно состояние, и каждое состояние уникально нумеруется.
Фиг. 3 иллюстрирует это для простого случая, для которого изображены все возможные конфигурации, когда рассматривается дорожка, имеющая два импульса и три позиции дорожки. Два импульса могут быть расположены в одной и той же позиции дорожки. В примере на фиг. 3 знак импульсов (например, является ли импульс положительным или отрицательным) не рассматривается, в таком примере все импульсы могут полагаться, например, положительными.
На фиг. 3 проиллюстрированы все возможные состояния для двух ненаправленных импульсов, расположенных на дорожке с тремя позициями дорожки (на фиг. 3: позиции дорожки 1, 2 и 3). Имеется только шесть разных возможных состояний (на фиг. 3, пронумерованы от 0 до 5), которые описывают, каким образом импульсы могут быть распределены на дорожке. Таким образом, достаточно использовать номер состояния в диапазоне от 0 до 5, чтобы описать фактическую существующую конфигурацию. Например, если номер состояния в примере на фиг. 3 имеет значение (4), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния =4 означает, что дорожка имеет один импульс в позиции 0 дорожки и другой импульс в позиции 2 дорожки. Таким образом, в примере на фиг. 3 достаточно трех битов для кодирования номера состояния, чтобы идентифицировать одно из шести различных состояний примера на фиг. 3.
Фиг. 4 иллюстрирует случай, изображающий все возможные состояния для одного направленного импульса, расположенного на дорожке с двумя позициями дорожки (на фиг. 4: позиции 1 и 2 дорожки). На фиг. 4 учитывается знак импульсов (например, является ли импульс положительным или отрицательным). Имеется четыре различных возможных состояния (на фиг. 4 пронумерованы от 0 до 3), которые описывают, каким образом импульс может быть распределен на дорожке, а также его знак (положительный или отрицательный). Достаточно использовать номер состояния в диапазоне от 0 до 3, чтобы описать фактическую существующую конфигурацию. Например, если номер состояния в примере на фиг. 4 имеет значение (2), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния = 2 означает, что дорожка имеет один импульс в позиции 1 дорожки, и что импульс является положительным импульсом.
Фиг. 5 иллюстрирует все еще дополнительный случай, в котором изображены все возможные конфигурации, когда рассматривается дорожка, имеющая два импульса и две позиции дорожки. Импульсы могут быть расположены в одной и той же позиции дорожки. В примере, показанном на фиг. 5, учитывается знак импульсов (например, является ли импульс положительным или отрицательным). Предполагается, что импульсы в одной и той же позиции дорожки имеют один и тот же знак (например, дорожки в одной и той же позиции дорожки либо все являются положительными, либо все являются отрицательными).
На фиг. 5 проиллюстрированы все возможные состояния для двух импульсов со знаком (например, импульсов, которые являются либо положительными, либо отрицательными), расположенных на дорожке с двумя позициями дорожки (на фиг. 5: позиции 1 и 2 дорожки). Имеется только восемь различных возможных состояний (на фиг. 5 пронумерованы от 0 до 7), которые описывают, каким образом импульсы могут быть распределены на дорожке. Таким образом, достаточно использовать номер состояния в диапазоне от 0 до 7, чтобы описать фактическую конфигурацию. Например, если номер состояния в примере на фиг. 5 имеет значение (3), и если декодер знает о схеме кодирования, декодер может прийти к заключению, что номер состояния =3 обозначает, что дорожка имеет один импульс в позиции 0 дорожки, который является положительным, и другой импульс в позиции 1 дорожки, который является отрицательным. Таким образом, в примере на фиг. 5 достаточно трех битов для кодирования номера состояния, чтобы идентифицировать одно из восьми различных состояний примера на фиг. 5.
В ACELP разностный сигнал может быть закодирован посредством фиксированного количества импульсов со знаком. Как описано выше, импульсы могут быть распределены, например, на четырех чередующихся дорожках таким образом, что дорожка 0 содержит позиции mod(n, 4)==0, дорожка 1 содержит позиции mod(n, 4)==1, и так далее. Каждая дорожка может иметь предопределенное количество единичных импульсов со знаком, которые могут накладываться, но когда они накладываются, импульсы имеют один и тот же знак.
Посредством кодирования импульсов должно быть достигнуто отображение позиций импульсов и их знаков в представление, которое использует наименьшее возможное количество битов. Кроме того, кодирование импульсов должно иметь расход битов, который является фиксированным, то есть любая совокупность импульсов имеет одно и то же количество битов.
Каждая дорожка сначала независимо кодируется, и затем состояния каждой дорожки объединены в одно число, которое представляет состояние целого субкадра. Этот подход дает математически оптимальный расход битов, если все состояния имеют равную вероятность, и расход битов является фиксированным.
Концепция перечисления состояний также может быть объяснена с использованием компактного представления различных совокупностей состояний.
Пусть xn - разностный сигнал, который мы хотим закодировать. Предположим, что рассматриваются, например, четыре чередованных дорожки алгебраической кодовой книги, тогда первая дорожка имеет отсчеты x0, x4, x8,..., xN-4, вторая дорожка имеет отсчеты x1, x5, x9,..., xN-3, и т.д. Предположим, что первая дорожка квантована с помощью одного единичного импульса со знаком и что T=8, посредством чего длина дорожки равна 2 (T= длина (отсчеты) разностного сигнала, который должен быть закодирован). Если T=8, и если для кодирования разностного сигнала используются 4 дорожки, каждая из 4 дорожек имеет 2 позиции дорожки. Например, можно рассмотреть первую дорожку, которая имеет две позиции x0 и x4 дорожки. Тогда импульс первой дорожки может появиться в любой из следующих совокупностей:
x0 | +1 | -1 | 0 | 0 |
x4 | 0 | 0 | +1 | -1 |
Для этой конфигурации имеется четыре разных состояния.
Аналогичным образом, если на первой дорожке имеется два импульса и первая дорожка имеет две позиции x0 и x4, то импульсы могут быть присвоены в следующих совокупностях:
x0 | +2 | -2 | +1 | +1 | -1 | -1 | 0 | 0 |
x4 | 0 | 0 | +1 | -1 | +1 | -1 | +2 | -2 |
Таким образом, эта конфигурация имеет 8 состояний.
Если длина разностного сигнала расширена до T=12, то каждая из 4 дорожек имеет 3 позиции дорожки. Первая дорожка получает еще один отсчет и теперь имеет позиции x0, x4 и x8 дорожки, таким образом, мы имеем:
x0, x4 | 2 импульса 8 состояний | 1 импульс 4 состояния | 1 импульс 4 состояния | 0 импульсов 1 состояние | 0 импульсов 1 состояние |
x8 | 0 | +1 | -1 | +2 | -2 |
Приведенная выше таблица означает, что имеется 8 различных состояний для x0 и x4, если x8=0 (x8 не имеет импульса); 4 различных состояния для x0 и x4, если x8=1 (x8 имеет положительный импульс); 4 различных состояния для x0 и x4, если x8=-1 (x8 имеет отрицательный импульс); 1 состояние для x0 и x4, если x8=2 (x8 имеет два положительных импульса); и 1 состояние для x0 и x4, если x8=-2 (x8 имеет два отрицательных импульса).
При этом количество состояний для первой строки было получено из двух предыдущих таблиц. Посредством сложения количества состояний в первой строке мы видим, что эта конфигурация имеет 18 состояний.
В примере с T=2 достаточно 5 битов для кодирования всех 18 различных возможных состояний. Тогда кодер, например, выбирает номер состояния из диапазона [0, 17], чтобы определить одну из этих 18 конфигураций. Если декодер знает о схеме кодирования, например, если он знает, какой номер состояния какую конфигурацию представляет, он может декодировать позиции импульсов и знаки импульсов для дорожки.
Ниже будут представлены подходящие способы кодирования и соответствующие способы декодирования в соответствии с вариантами осуществления. В соответствии с вариантами осуществления обеспечено устройство для кодирования, которое выполнено с возможностью исполнять один из представленных ниже способов кодирования. Кроме того, в соответствии с дополнительным вариантам осуществления представлено устройство для декодирования, которое выполнено с возможностью исполнять один из представленных ниже способов декодирования.
В вариантах осуществления для формирования номера состояния или декодирования номера состояния может быть вычислено количество возможных конфигураций для N позиций дорожки, имеющей p импульсов.
Импульсы могут иметь знак, и может использоваться рекурсивная формула, которая вычисляет количество состояний f(p, N) для дорожки, имеющей N позиций дорожки и p импульсов со знаком (импульсы могут быть положительными или отрицательными, но импульсы в одной и той же позиции дорожки имеют один и тот же знак), причем рекурсивная формула f(p, N) задана следующим образом:
Формула 1:
Начальные условия:
поскольку единственная позиция с одним или более импульсами требует одного бита (двух состояний) для знака. Рекурсивная формула предназначена для суммирования всех различных совокупностей.
А именно, если имеется p импульсов, текущая позиция может иметь от qN=0 до p импульсов, посредством чего оставшиеся N-1 позиций имеют p-qN импульсов. Количество состояний в текущей позиции и в оставшихся N-1 позициях перемножаются для получения количества состояний с этими комбинациями импульсов, и комбинации суммируются для получения общего количества состояний.
В вариантах осуществления рекурсивная функция может быть вычислена посредством итеративного алгоритма, причем рекурсия заменяется итерацией.
Поскольку оценка f(p, N) является относительно сложной в вычислительном отношении для приложений реального времени, в соответствии с некоторыми вариантами осуществления для вычисления f(p, N) может использоваться поиск по таблице. В соответствии с некоторыми вариантами осуществления таблица может быть вычислена автономно.
Далее представлены дополнительные концепции для кодирования и декодирования номера состояния.
Пусть f(p, N) обозначает количество возможных конфигураций для дорожки, имеющей N позиций дорожки и p импульсов со знаком.
Кодер информации импульсов может теперь проанализировать дорожку: если первая позиция на дорожке не имеет импульса, то оставшиеся N-1 позиций имеют p импульсов со знаком, и чтобы описать эту совокупность, нам нужно только f(p, N-1) состояний.
Иначе, если первая позиция имеет один или более импульсов, кодер информации импульсов определяет, что общее количество состояний больше, чем f(p, N-1).
Затем декодер информации импульсов, например, может начать с последней позиции и сравнить состояние с пороговым значением, например с f(p, N-1). Если оно больше, то декодер информации импульсов может решить, что последняя позиция имеет по меньшей мере один импульс. Декодер информации импульсов может тогда обновить состояние, чтобы получить обновленный номер состояния, посредством вычитания f(p, N-1) из состояния и уменьшить количество оставшихся импульсов на один.
Иначе, если в последней позиции нет импульса, декодер информации импульсов может сократить количество оставшихся позиций на одну. Повторение этой процедуру, пока не останется импульсов, обеспечит позиции импульсов без знака.
Чтобы также принять во внимание знаки импульсов, кодер информации импульсов может закодировать импульсы в самом нижнем бите состояния. В альтернативном варианте осуществления кодер информации импульсов может закодировать знак в самом высоком оставшемся бите состояния. Однако предпочтительно закодировать знак импульс в самом нижнем бите, поскольку его легче обработать относительно целочисленных вычислений.
Если в декодере информации импульсов найден первый импульс данной позиции, знак импульса определен последним битом. Затем оставшееся состояние смещается на один шаг вправо для получения обновленного номера состояния.
В варианте осуществления декодер информации импульсов выполнен с возможностью применять следующий алгоритм декодирования. В этом алгоритме декодирования при пошаговом подходе для каждой позиции дорожки, например одна позиция за другой, номер состояния или обновленный номер состояния сравнивается с пороговым значением, например с f(p, k-1).
В соответствии с вариантом осуществления обеспечен алгоритм декодера информации импульсов.
Для каждой позиции на дорожке, от k=N до 1
Пока состояние s>=f(p, k-1)
Поместить импульс в k
Присвоить s:=s-f(p, k-1)
Если это первый импульс в k
Если самый нижний бит состояния s установлен, установить знак в минус
Иначе, установить знак в плюс
Сдвинуть состояние вправо на один шаг s:=s/2
Уменьшить количество оставшихся импульсов p:=p-1
Относительно информации импульсов в соответствии с вариантом осуществления кодер информации импульсов выполнен с возможностью применять следующий алгоритм кодирования. Кодер информации импульсов выполняет такие же этапы, как декодер информации импульсов, но в обратном порядке.
В соответствии с вариантом осуществления обеспечен алгоритм кодера информации импульсов.
Установить количество найденных импульсов равным нулю, p:=0, и состояние равным нулю s:=0
Для каждой позиции на дорожке, от k=1 до N
Для каждого импульса в этой позиции
Если текущий импульс является последним в этой позиции
Сдвинуть состояние влево на один шаг s:=s*2
Если знак минус, установить самый нижний бит равным одному, s:=s+1
Иначе установить самый нижний бит равным нулю (то есть ничего не делать)
Обновите состояние s:=s+f(p, k-1)
Увеличить количество найденных импульсов p:=p+1
Кодируя номер состояния посредством использования этого алгоритма, кодер информации импульсов добавляет целочисленное значение к промежуточному числу (например, номеру промежуточного состояния), например номеру состояния, прежде чем алгоритм будет завершен, для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния (значение номера состояния).
Подход для кодирования и декодирование информации импульсов, например позиций импульса и знаков импульсов, может называться "пошаговым кодированием" и "пошаговым декодированием", поскольку позиции дорожки рассматриваются посредством способов кодирования и декодирования одна за другой, пошагово.
Фиг. 6 является блок-схемой последовательности операций, иллюстрирующей вариант осуществления, изображающей этапы обработки, проводимые декодером информации импульсов в соответствии с вариантом осуществления.
На этапе 610 текущая позиция k дорожки устанавливается равной N. Здесь N представляет количество позиций дорожки, причем позиции дорожки пронумерованы от 1 до N.
На этапе 620 проверяется, является ли k больше или равно 1, то есть остаются ли нерассмотренные позиции дорожки. Если k не больше или равно 1, все позиции дорожки рассмотрены, и процесс заканчивается.
В ином случае на этапе 630 проверяется, является ли состояние больше или равно f(p, k-1). Если это так, в позиции k присутствует по меньшей мере один импульс. Если это не так, никакой (дополнительный) импульс не присутствует в позиции дорожки, k и процесс переходит на этап 640, где k уменьшается на 1, и, таким образом, будет рассматриваться следующая позиция.
Однако если состояние больше или равно f(p, k-1), процесс переходит на этап 642, импульс помещается в позицию k дорожки, и затем на этапе 644, состояние обновляется посредством уменьшения состояния f(p, k-1). Затем на этапе 650 проверяется, является ли текущий импульс первым обнаруженным импульсом в позиции k дорожки. Если это не так, количество оставшихся импульсов уменьшается на 1 на этапе 680, и процесс переходит на этап 630.
Однако если это первый обнаруженный импульс в позиции k дорожки, процесс переходит на этап 660, на котором проверяется, установлен ли самый нижний бит s. Если это так, знак импульсов в этой позиции дорожки устанавливается в минус (этап 662), иначе знак импульсов в этой позиции дорожки устанавливается в плюс (этап 664). В обоих случаях состояние затем сдвигается на один шаг вправо на этапе 670 (s:=s/2). Затем также количество оставшихся импульсов сокращается на один (этап 680), и процесс переходит на этап 630.
Фиг. 7 является блок-схемой последовательности операций, иллюстрирующей вариант осуществления, блок-схема изображает этапы обработки, проводимые кодером информации импульсов в соответствии с вариантом осуществления.
На этапе 710 количество найденных импульсов p устанавливается равным 0, состояние s устанавливается равным 0, и рассматриваемая позиция k дорожки устанавливается равной 1.
На этапе 720 проверяется, является ли k меньше или равно N, то есть имеются ли оставшиеся нерассмотренные позиции дорожки (здесь N обозначает количество позиций дорожки). Если k не меньше или равно N, все позиции дорожки рассмотрены, и процесс заканчивается.
В ином случае на этапе 730 проверяется, присутствует ли по меньшей мере один импульс в позиции k. Если это не так, процесс переходит на этап 740, на котором k увеличивается на 1, таким образом, чтобы была рассмотрена следующая позиция дорожки.
Однако если по меньшей мере один импульс присутствует в позиции k дорожки, на этапе 750 проверяется, является ли рассматриваемый в настоящий момент импульс последним импульсом в позиции k дорожки. Если это не так, то на этапе 770 состояние s обновляется посредством добавления f(p, k-1) к состоянию s, количество найденных импульсов p увеличивается на 1, и процесс переходит на этап 780.
Если рассматриваемый в настоящий момент импульс является последним импульсом в позиции k дорожки, то после этапа 750 процесс переходит на этап 755, и состояние смещается на один шаг влево (s:=s*2). Затем на этапе 760 проверяется, имеет ли импульс знак минус. Если это так, самый нижний бит s устанавливается равным 1 (этап 762); в ином случае самый нижний бит s устанавливается равным 0 (или ничего не делается) (этап 764). Затем в обоих случаях выполняется этап 770, на котором состояние s обновляется посредством добавления f(p, k-1) к состоянию s, количество найденных импульсов p увеличивается на 1, и процесс переходит на этап 780.
На этапе 780 проверяется, имеется ли другой импульс в позиции k. Если это так, процесс переходит на этап 750; в ином случае процесс переходит на этап 740.
Далее обеспечивается концепция для формирования кодирования состояния множества дорожек с объединенным номером кодирования.
К сожалению, во многих случаях диапазон возможных состояний единственной дорожки не является кратным 2, и, таким образом, двоичное представление каждого состояния является неэффективным. Например, если количество возможных состояний равно 5, то нам нужно 3 бита для их представления с помощью двоичного числа. Однако если мы имеем четыре дорожки, каждая из которых имеет 5 состояний, то мы имеем 5x5x5x5=625 состояний для всего субкадра, которые могут быть представлены посредством 10 битов (вместо 4×3=12 битов). Это соответствует 2,5 битам на дорожку вместо 3, и, таким образом, мы получаем экономию 0,5 бита на дорожку или, эквивалентно, 2 бита на субкадр (20% от всего расхода битов). Поэтому важно объединить состояния каждой дорожки в одно объединенное состояние, поскольку посредством этого неэффективность двоичного представления может быть уменьшена. Следует отметить, что такой же подход может быть использован для любых передаваемых номеров. Например, поскольку каждый субкадр может иметь состояние, представляющее позиции импульсов, и каждый кадра может иметь, например, четыре субкадра, эти состояния могут быть объединены в один объединенный номер состояния.
При условии, что субкадр имеет, например, 4 дорожки, расход битов может быть уменьшен для увеличения эффективности совместно кодирования состояния каждой дорожки. Например, при условии, что каждая дорожка имеет pk импульсов, и каждая дорожка имеет длину N, например имеет N позиций дорожки, тогда состояние каждой дорожки находится в диапазоне от 0 до f(pk, N)-1. Состояния sk каждой из дорожек тогда могут быть объединены в объединенное состояние s субкадра с помощью формулы (предполагающей, что мы имеет 4 дорожки на субкадр),
Формула 2:
Состояния каждой дорожки тогда могут быть определены в декодере посредством деления объединенного состояния f(pk, N), посредством чего остаток представляет собой состояние последней дорожки, а целочисленная часть представляет собой объединенное состояние оставшихся дорожек. Если количество дорожек отличается от 4, мы можем с легкостью соответствующим образом добавить или сократить количество членов в приведенном выше уравнении.
Следует отметить, что когда количество импульсов на дорожку является большим, количество возможных состояний становится большим. Например, при 6 импульсах на дорожку с четырьмя дорожками и длиной дорожки N=16 состояние представляет собой 83-битное число, что превышает максимальную длину двоичных чисел на регулярных процессорах. Из этого следует, что некоторые дополнительные этапы должны быть сделаны для оценки приведенной выше формулы с использованием стандартных способов работы с очень длинными целыми числами.
Также следует заметить, что этот подход эквивалентен арифметическому кодированию состояний дорожки, когда вероятности состояния предполагаются равными.
Выше был представлен пошаговый подход для кодирования и декодирования информации импульсов дорожки, например позиций и, возможно, знаков импульсов дорожки. Другие варианты осуществления обеспечивают другой подход, который будет называться подходом "разбиения и подчинения".
Кодер информации импульсов, выполненный с возможностью применять подход разбиения и подчинения, делит дорожку на два раздела x1 и x2, которые можно рассматривать как два вектора, причем x=[x1 x2]. Основная идея состоит в том, чтобы закодировать оба вектора x1 и x2 отдельно и затем объединить их оба с помощью формулы.
Формула 3:
В приведенном выше уравнении следует отметить, что s(x1) и s(x2) являются состояниями векторов x1 и x2, когда количество импульсов уже известно, то есть когда векторы имеют, соответственно, p1 и p2=p-p1 импульсов. Чтобы принять во внимание все состояния, которые имеют от 0 до p1-1 импульсов в векторе x1, мы должны добавить знак суммирования в приведенном выше уравнении.
Приведенные выше алгоритм и формула могут быть применены для кодирования импульсов чередованных дорожек посредством применения следующих двух этапов предварительной обработки. Во-первых, положим, что векторы xtrack k состоят из всех отсчетов в дорожке k, и объединим эти векторы, определяя x=[xtrack 1, xtrack 2, xtrack 3, xtrack 4]. Заметим, что это просто такое переупорядочение отсчетов, в котором все отсчеты из дорожки 1 помещены в первую группу, и так далее.
Во-вторых, отметим, что количество импульсов на дорожку обычно является фиксированным числом. Из этого следует, что если дорожка 1 всегда имеет p1 импульсов, то количество состояний на дорожке 1 равно f(k, N1])=0 для всех значений k≠p1. Это лишь другой способ сказать, что для дорожи 1 нет состояний, которые не имеют p1 импульсов. Тогда мы можем формально определить формулу количества состояний как:
Формула 4:
Для полной дорожки xtrack с pk импульсами количество состояний равно (N=Ntrack k)
Иначе, для N>1
И для N=1:
Посредством переупорядочения отсчетов и использования приведенного выше определения для количества состояний (формула 4) мы можем вычислить объединенное состояние всех дорожек с помощью формулы 3. Следует отметить, что поскольку количество состояний содержат главным образом нули, сумма в формуле 3 представляет собой нуль при слиянии состояния дорожек. Поэтому слияние двух дорожек идентично формуле 2. Аналогичным образом, мы можем легко показать, что слияние всех четырех (или пяти) дорожек также дает идентичные результаты с помощью обоих подходов.
В соответствии с вариантом осуществления переупорядочение может использоваться в качестве этапа предварительной обработки для кодера. В другом варианте осуществления переупорядочение может быть интегрировано в кодер. Аналогичным образом, в соответствии с вариантом осуществления переупорядочение может использоваться в качестве этапа последующей обработки для декодера. В другом варианте осуществления переупорядочение может быть интегрировано в декодер.
Если количество импульсов на дорожке не фиксировано, мы можем легко соответствующим образом изменить формулу количества состояний и по-прежнему использовать тот же самый алгоритм кодирования.
Следует заметить, что подход, представленный в разделе "Комбинирование данных дорожки" и приведенный выше способ дают эквивалентные результаты, если порядок слияния дорожек выбран соответствующим образом. Аналогично, также пошаговый подход и подход разбиения и подчинения дают эквивалентные результаты. Поэтому мы можем независимо выбрать подход для использования в декодере и кодере, согласно которому реализация является более практичной или который наилучшим образом удовлетворяет вычислительным ограничениям платформы.
В соответствии с вариантом осуществления обеспечен алгоритм кодера информации импульсов, который может быть описан на псевдокоде следующим образом.
функция состояние = encode(x)
1. если длина x равна 1
a. если x не имеет импульсов
i. состояние =0
ii. возврат
b. иначе (x имеет по меньшей мере один импульс)
i. если импульс(ы) в x положителен
состояние =0
возврат
ii. иначе (импульс(ы) в x отрицателен)
состояние =1
возврат
iii. конец
c. конец
2. иначе (то есть когда длина x>1)
a. разделить x на два вектора x1 и x2 с длиной N1 и N2 соответственно
b. определить состояние вектора x1 как s1=encode(x1)
c. определить состояние вектора x2 как s2=encode(x2)
d. Пусть p - количество импульсов в x, и pi - количество импульсов в x1
e. Присвоить n0=0
f. для k от 0 до p1-1
i. Присвоить n0:=n0+f(k, N1)*f(p-k, N2)
g. конец
h. вычислить состояние как s:=s1+f(p1, N1)*s2+n0
i. возврат
3. конец
Используя такой алгоритм кодирования в соответствии с вариантом осуществления, кодер информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки и во второй раздел дорожки. Кодер информации импульсов выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу. Кроме того, кодер информации импульсов выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу. Кроме того, кодер информации импульсов выполнен с возможностью объединять номер первого подсостояния и номер второго подсостояния для получения номера состояния.
Аналогичным образом, в соответствии с вариантом осуществления обеспечен алгоритм декодера информации импульсов, который может быть описан на псевдокоде следующим образом.
функция x=decode(s, p, N)
1. если количество импульсов p равно 0
a. возвратить вектор x из нулей
2. иначе
a. если len равно 1
i. если s==0
1. Вектор x имеет p положительные импульсов в своей первой позиции
ii. иначе
1. Вектор x имеет p отрицательных импульсов в своей первой позиции
iii. конец
b. иначе
i. Выбрать длины N1 и N2 разделов
ii. Присвоить n0:=0 и p1:=0
iii. Пока n0+f(p1, N1)*f(p-p1)<s
1. присвоить p1:=p1+1
2. присвоить n0:=n0+f(p1, N1)*f(p-p1)
iv. конец
v. присвоить s:=s-n0 и p2:=p-p1
vi. присвоить s1:=s/f(p1, N1) и установить остаток равным s2
vii. декодировать первый раздел x1=decode(s1, p1, N1)
viii. декодировать второй раздел x2=decode(s2, p2, N2)
ix. слить разделы x1 и x2 в x
c. конец
3. конец
В варианте осуществления, реализующем подход разбиения и подчинения, декодер информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния. Декодер информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов первого раздела одной из дорожек на основе номера первого подсостояния. Кроме того, декодер информации импульсов выполнен с возможностью декодировать вторую группу позиций импульсов второго раздела одной из дорожек на основе номера второго подсостояния.
Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют описание соответствующего способа, в котором блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.
В зависимости от некоторых требований реализации варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с использованием цифрового носителя, например гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные на нем электронно-читаемые управляющие сигналы, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.
Некоторые варианты осуществления в соответствии с изобретением содержат носитель данных, имеющий электронно-читаемые управляющие сигналы, которые способны к взаимодействию с программируемой компьютерной системой таким образом, что выполняется один из описанных здесь способов.
В общем случае варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, который выполнен с возможностью выполнять один из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных здесь способов, сохраненную на машиночитаемом носителе или непереходном носителе.
Другими словами, вариант осуществления способа изобретения, таким образом, является компьютерной программой, имеющей программный код для выполнения одного из описанных здесь способов, когда компьютерная программа работает на компьютере.
Дополнительный вариант осуществления способов изобретения, таким образом, является носителем информации (или цифровым носителем, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных здесь способов.
Дополнительный вариант осуществления способа изобретения, таким образом, является потоком данных или последовательностью сигналов, представляющими компьютерную программу для выполнения одного из описанных здесь способов. Поток данных или последовательность сигналов, например, могут быть выполнены с возможностью быть переданными через соединение передачи данных, например через Интернет или по радиоканалу.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, выполненное с возможностью выполнять один из описанных здесь способов.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из описанных здесь способов.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторой или всей функциональности описанных здесь способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнить один из описанных здесь способов. В общем случае способы предпочтительно выполняются любым аппаратным устройством.
Описанные выше варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Подразумевается, что модификации и изменения описанных здесь устройств и деталей будут очевидны для специалистов в данной области техники. Таким образом, изобретение ограничено только объемом нижеследующей формулы изобретения, а не конкретными деталями, представленными здесь посредством описания и разъяснения вариантов осуществления.
Claims (15)
1. Устройство для декодирования закодированного аудиосигнала, в котором одна или более дорожек ассоциированы с закодированным аудиосигналом, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем устройство содержит:
декодер (110) информации импульсов для декодирования множества позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер (110) информации импульсов выполнен с возможностью декодировать множество позиций импульсов посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния; и
декодер (120) сигналов для декодирования закодированного аудиосигнала посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодер (110) информации импульсов дополнительно выполнен с возможностью декодировать множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
при этом декодер (120) сигналов выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
декодер (110) информации импульсов для декодирования множества позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер (110) информации импульсов выполнен с возможностью декодировать множество позиций импульсов посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния; и
декодер (120) сигналов для декодирования закодированного аудиосигнала посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодер (110) информации импульсов дополнительно выполнен с возможностью декодировать множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
при этом декодер (120) сигналов выполнен с возможностью декодировать закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
2. Устройство по п. 1, в котором одна или более дорожек содержат по меньшей мере последнюю дорожку и одну или более других дорожек, и
в котором декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния из номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульсов на основе номера второго подсостояния,
причем вторая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции последней дорожки, и
при этом первая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции одной или более других дорожек.
в котором декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния из номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульсов на основе номера второго подсостояния,
причем вторая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции последней дорожки, и
при этом первая группа позиций импульсов состоит только из позиций импульсов, указывающих позиции одной или более других дорожек.
3. Устройство по п. 2, в котором декодер информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния посредством деления номера состояния на f (pk, N) для получения целочисленной части и остатка в качестве результата деления, причем целочисленная часть является номером первого подсостояния, и остаток является номером второго подсостояния, причем pk указывает для каждой из одной или более дорожек количество импульсов, и N указывает для каждой из одной или более дорожек количество позиций дорожки, причем f (pk, N) является функцией, возвращающей количество состояний, которые могут быть достигнуты на дорожке длины N с рk импульсами.
4. Устройство по п. 1, в котором декодер (110) информации импульсов выполнен с возможностью проводить проверку, сравнивая номер состояния или обновленный номер состояния с пороговым значением.
5. Устройство по п. 4, в котором декодер (110) информации импульсов выполнен с возможностью проводить проверку, сравнивая, является ли номер состояния или обновленный номер состояния большим, большим или равным, меньшим, меньшим или равным порогового значения, и в котором декодер (110) информации импульсов дополнительно выполнен с возможностью обновлять номер состояния или обновленный номер состояния в зависимости от результата проверки.
6. Устройство по п. 5, в котором декодер (110) информации импульсов выполнен с возможностью сравнивать номер состояния или обновленный номер состояния с пороговым значением для каждой позиции дорожки одной из множества дорожек.
7. Устройство по п. 1,
в котором декодер (110) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов, ассоциированных с первым разделом дорожки, на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульса, ассоциированных с вторым разделом дорожки, на основе номера второго подсостояния.
в котором декодер (110) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом декодер (110) информации импульсов выполнен с возможностью формировать номер первого подсостояния и номер второго подсостояния на основе номера состояния,
при этом декодер (110) информации импульсов выполнен с возможностью декодировать первую группу позиций импульсов, ассоциированных с первым разделом дорожки, на основе номера первого подсостояния, и
при этом декодер (110) информации импульсов выполнен с возможностью декодировать вторую группу позиций импульса, ассоциированных с вторым разделом дорожки, на основе номера второго подсостояния.
8. Устройство для кодирования аудиосигнала, содержащее:
процессор (210) сигналов для определения множества коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодер (220) информации импульсов для кодирования множества позиций импульсов, относящихся к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем кодер (220) информации импульсов выполнен с возможностью кодировать множество позиций импульсов, формируя номер состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
при этом кодер (220) информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек для получения номера состояния.
процессор (210) сигналов для определения множества коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодер (220) информации импульсов для кодирования множества позиций импульсов, относящихся к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем кодер (220) информации импульсов выполнен с возможностью кодировать множество позиций импульсов, формируя номер состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
при этом кодер (220) информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек для получения номера состояния.
9. Устройство для кодирования по п. 8, в котором кодер (220) информации импульсов выполнен с возможностью кодировать множество знаков импульсов, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, причем кодер (220) информации импульсов выполнен с возможностью кодировать множество знаков импульсов, формируя номер состояния таким образом, что знаки импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов.
10. Устройство по п. 8, в котором кодер (220) информации импульсов выполнен с возможностью добавлять целочисленное значение к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния, причем целочисленное значение определяется посредством f (р, k-1), причем р указывает количество найденных импульсов, k указывает позицию дорожки, и f (Р, N) указывает количество возможных конфигураций для дорожки, имеющей N позиций дорожки и p импульсов со знаком.
11. Устройство по п. 8,
в котором кодер (220) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу, и
при этом кодер (220) информации импульсов выполнен с возможностью объединять номер первого подсостояния и номер второго подсостояния для получения номера состояния.
в котором кодер (220) информации импульсов выполнен с возможностью разделять одну из дорожек на первый раздел дорожки, содержащий по меньшей мере две позиции дорожки из множества позиций дорожки, и на второй раздел дорожки, содержащий по меньшей мере две другие позиции дорожки из множества позиций дорожки,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер первого подсостояния, соответствующий первому разделу,
при этом кодер (220) информации импульсов выполнен с возможностью кодировать номер второго подсостояния, соответствующий второму разделу, и
при этом кодер (220) информации импульсов выполнен с возможностью объединять номер первого подсостояния и номер второго подсостояния для получения номера состояния.
12. Способ декодирования закодированного аудиосигнала, в котором одна или более дорожек ассоциированы с закодированным аудиосигналом, при этом каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем способ содержит этапы, на которых:
декодируют множество позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем множество позиций импульсов декодируется посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния;
декодируют множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
декодируют закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодирование закодированного аудиосигнала проводится посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
декодируют множество позиций импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем множество позиций импульсов декодируется посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния;
декодируют множество знаков импульсов с использованием количества позиций дорожки, общего количества импульсов и номера состояния, причем каждый один из знаков импульсов указывает знак одного из множества импульсов, и
декодируют закодированный аудиосигнал посредством формирования синтезированного аудиосигнала с использованием множества позиций импульсов и множества коэффициентов линейного предсказания, ассоциированных с закодированным аудиосигналом,
причем декодирование закодированного аудиосигнала проводится посредством формирования синтезированного аудиосигнала с дополнительным использованием множества знаков импульсов.
13. Способ кодирования аудиосигнала, содержащий этапы, на которых:
определяют множество коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодируют множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем множество позиций импульсов закодировано посредством формирования номера состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
причем кодирование множества позиций импульсов проводится посредством добавления целочисленного значения к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния.
определяют множество коэффициентов линейного предсказания, ассоциированных с аудиосигналом, для формирования разностного сигнала линейного предсказания на основе аудиосигнала и множества коэффициентов линейного предсказания; и
кодируют множество позиций импульсов, имеющих отношение к одной или более дорожкам, чтобы закодировать аудиосигнал, причем одна или более дорожек ассоциированы с разностным сигналом линейного предсказания, причем каждая одна из дорожек имеет множество позиций дорожки и множество импульсов, причем каждая одна из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, причем множество позиций импульсов закодировано посредством формирования номера состояния таким образом, что позиции импульсов могут быть декодированы только на основе номера состояния, количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, и общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек,
причем кодирование множества позиций импульсов проводится посредством добавления целочисленного значения к промежуточному числу для каждого импульса в позиции дорожки для каждой позиции дорожки одной из дорожек, чтобы получить номер состояния.
14. Компьютерно-читаемый носитель, содержащий компьютерную программу, реализующую способ по п. 12, при выполнении на компьютере или в процессоре сигналов.
15. Компьютерно-читаемый носитель, содержащий компьютерную программу, реализующую способ по п. 13, при выполнении на компьютере или в процессоре сигналов.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052294 WO2012110416A1 (en) | 2011-02-14 | 2012-02-10 | Encoding and decoding of pulse positions of tracks of an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013142068A RU2013142068A (ru) | 2015-03-27 |
RU2586597C2 true RU2586597C2 (ru) | 2016-06-10 |
Family
ID=71943601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013142068/08A RU2586597C2 (ru) | 2011-02-14 | 2012-02-10 | Кодирование и декодирование позиций импульсов дорожек аудиосигнала |
Country Status (19)
Country | Link |
---|---|
US (1) | US9595263B2 (ru) |
EP (3) | EP3471092B1 (ru) |
JP (1) | JP5800915B2 (ru) |
KR (1) | KR101643450B1 (ru) |
CN (1) | CN103460284B (ru) |
AR (1) | AR085361A1 (ru) |
AU (1) | AU2012217184B2 (ru) |
BR (1) | BR112013020700B1 (ru) |
CA (1) | CA2827156C (ru) |
ES (2) | ES2639646T3 (ru) |
HK (1) | HK1245987B (ru) |
MX (1) | MX2013009345A (ru) |
PL (3) | PL3239978T3 (ru) |
PT (2) | PT2676267T (ru) |
RU (1) | RU2586597C2 (ru) |
SG (1) | SG192747A1 (ru) |
TR (1) | TR201903388T4 (ru) |
WO (1) | WO2012110416A1 (ru) |
ZA (1) | ZA201306841B (ru) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
US10553228B2 (en) * | 2015-04-07 | 2020-02-04 | Dolby International Ab | Audio coding with range extension |
AU2020299973A1 (en) | 2019-07-02 | 2022-01-27 | Dolby International Ab | Methods, apparatus and systems for representation, encoding, and decoding of discrete directivity data |
US11088784B1 (en) | 2020-12-24 | 2021-08-10 | Aira Technologies, Inc. | Systems and methods for utilizing dynamic codes with neural networks |
US11575469B2 (en) | 2020-12-28 | 2023-02-07 | Aira Technologies, Inc. | Multi-bit feedback protocol systems and methods |
US11368251B1 (en) | 2020-12-28 | 2022-06-21 | Aira Technologies, Inc. | Convergent multi-bit feedback system |
US11483109B2 (en) | 2020-12-28 | 2022-10-25 | Aira Technologies, Inc. | Systems and methods for multi-device communication |
US11489624B2 (en) | 2021-03-09 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets using lookup tables |
US11489623B2 (en) | 2021-03-15 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets |
US11496242B2 (en) | 2021-03-15 | 2022-11-08 | Aira Technologies, Inc. | Fast cyclic redundancy check: utilizing linearity of cyclic redundancy check for accelerating correction of corrupted network packets |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0784846A1 (en) * | 1994-04-29 | 1997-07-23 | Sherman, Jonathan, Edward | A multi-pulse analysis speech processing system and method |
JPH11502318A (ja) * | 1995-03-22 | 1999-02-23 | テレフオンアクチーボラゲツト エル エム エリクソン(パブル) | 分析/合成線形予測音声コーダ |
RU2003118444A (ru) * | 2000-11-22 | 2004-12-10 | Войсэйдж Корпорейшн (Ca) | Индексирование положений и знаков импульсов в алгебраических кодовых книгах для кодирования широкополосных сигналов |
RU2004138289A (ru) * | 2002-05-31 | 2005-06-10 | Войсэйдж Корпорейшн (Ca) | Способ и система для многоскоростного решетчатого векторного квантования сигнала |
RU2302665C2 (ru) * | 2001-12-14 | 2007-07-10 | Нокиа Корпорейшн | Способ модификации сигнала для эффективного кодирования речевых сигналов |
US7587312B2 (en) * | 2002-12-27 | 2009-09-08 | Lg Electronics Inc. | Method and apparatus for pitch modulation and gender identification of a voice signal |
CA2730239A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
Family Cites Families (210)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69232202T2 (de) | 1991-06-11 | 2002-07-25 | Qualcomm Inc | Vocoder mit veraendlicher bitrate |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
DE10084675T1 (de) | 1999-06-07 | 2002-06-06 | Ericsson Inc | Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) * | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
CN1266674C (zh) | 2000-02-29 | 2006-07-26 | 高通股份有限公司 | 闭环多模混合域线性预测语音编解码器和处理帧的方法 |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) * | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20050130321A1 (en) | 2001-04-23 | 2005-06-16 | Nicholson Jeremy K. | Methods for analysis of spectral data and their applications |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7302387B2 (en) * | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
KR100711280B1 (ko) | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100463419B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) * | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
US7876966B2 (en) | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
CN100508030C (zh) | 2003-06-30 | 2009-07-01 | 皇家飞利浦电子股份有限公司 | 一种编码/解码音频信号的方法及相应设备 |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US6987591B2 (en) | 2003-07-17 | 2006-01-17 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada | Volume hologram |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
WO2005073959A1 (en) | 2004-01-28 | 2005-08-11 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
BRPI0418527A (pt) | 2004-02-12 | 2007-05-15 | Nokia Corp | método para relatar uma qualidade de transmissão em fluxo, programa de computação com instruções operáveis, produto de programa de computação, sistema de transmissão em fluxo, cliente em um sistema de transmissão em fluxo, servidor em um sistema de transmissão em fluxo, e, protocolo para um sistema de transmissão em fluxo |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
EP1852851A1 (en) | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
ES2338117T3 (es) | 2004-05-17 | 2010-05-04 | Nokia Corporation | Codificacion de audio con diferentes longitudes de trama de codificacion. |
JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US9047860B2 (en) | 2005-01-31 | 2015-06-02 | Skype | Method for concatenating frames in communication system |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
WO2006082636A1 (ja) | 2005-02-02 | 2006-08-10 | Fujitsu Limited | 信号処理方法および信号処理装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
MX2007012187A (es) | 2005-04-01 | 2007-12-11 | Qualcomm Inc | Sistemas, metodos y aparatos para deformacion en tiempo de banda alta. |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
ES2629727T3 (es) | 2005-06-18 | 2017-08-14 | Nokia Technologies Oy | Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
US8255213B2 (en) | 2006-07-12 | 2012-08-28 | Panasonic Corporation | Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102592303B (zh) | 2006-07-24 | 2015-03-11 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8005678B2 (en) | 2006-08-15 | 2011-08-23 | Broadcom Corporation | Re-phasing of decoder states after packet loss |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
PT2109098T (pt) | 2006-10-25 | 2020-12-18 | Fraunhofer Ges Forschung | Aparelho e método para gerar amostras de áudio de domínio de tempo |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8364472B2 (en) | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
BRPI0808202A8 (pt) | 2007-03-02 | 2016-11-22 | Panasonic Corp | Dispositivo de codificação e método de codificação. |
DE102007013811A1 (de) | 2007-03-22 | 2008-09-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
DK2827327T3 (da) * | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CN101388210B (zh) * | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
PT2165328T (pt) | 2007-06-11 | 2018-04-24 | Fraunhofer Ges Forschung | Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
ES2658942T3 (es) | 2007-08-27 | 2018-03-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
RU2562395C2 (ru) | 2008-03-04 | 2015-09-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Микширование входящих информационных потоков |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8423852B2 (en) | 2008-04-15 | 2013-04-16 | Qualcomm Incorporated | Channel decoding-based error detection |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2301020B1 (en) | 2008-07-11 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP3002750B1 (en) | 2008-07-11 | 2017-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
MY180550A (en) | 2009-01-16 | 2020-12-02 | Dolby Int Ab | Cross product enhanced harmonic transposition |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CA2750795C (en) | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
WO2010148516A1 (en) | 2009-06-23 | 2010-12-29 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
PL2473995T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
CN102884574B (zh) | 2009-10-20 | 2015-10-14 | 弗兰霍菲尔运输应用研究公司 | 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法 |
WO2011048094A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec and celp coding adapted therefore |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
WO2011127832A1 (en) | 2010-04-14 | 2011-10-20 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
FR2963254B1 (fr) | 2010-07-27 | 2012-08-24 | Maurice Guerin | Dispositif et procede pour laver des surfaces internes d?une enceinte |
RU2585999C2 (ru) | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Генерирование шума в аудиокодеках |
CA2827249C (en) | 2011-02-14 | 2016-08-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
EP2721610A1 (en) | 2011-11-25 | 2014-04-23 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-10 PL PL17171964T patent/PL3239978T3/pl unknown
- 2012-02-10 KR KR1020137024213A patent/KR101643450B1/ko active IP Right Grant
- 2012-02-10 RU RU2013142068/08A patent/RU2586597C2/ru active
- 2012-02-10 ES ES12703123.5T patent/ES2639646T3/es active Active
- 2012-02-10 TR TR2019/03388T patent/TR201903388T4/tr unknown
- 2012-02-10 EP EP18209670.1A patent/EP3471092B1/en active Active
- 2012-02-10 AR ARP120100443A patent/AR085361A1/es active IP Right Grant
- 2012-02-10 CN CN201280016442.4A patent/CN103460284B/zh active Active
- 2012-02-10 MX MX2013009345A patent/MX2013009345A/es active IP Right Grant
- 2012-02-10 SG SG2013061379A patent/SG192747A1/en unknown
- 2012-02-10 AU AU2012217184A patent/AU2012217184B2/en active Active
- 2012-02-10 EP EP12703123.5A patent/EP2676267B1/en active Active
- 2012-02-10 ES ES17171964T patent/ES2715191T3/es active Active
- 2012-02-10 PL PL18209670T patent/PL3471092T3/pl unknown
- 2012-02-10 WO PCT/EP2012/052294 patent/WO2012110416A1/en active Application Filing
- 2012-02-10 PL PL12703123T patent/PL2676267T3/pl unknown
- 2012-02-10 CA CA2827156A patent/CA2827156C/en active Active
- 2012-02-10 EP EP17171964.4A patent/EP3239978B1/en active Active
- 2012-02-10 BR BR112013020700-0A patent/BR112013020700B1/pt active IP Right Grant
- 2012-02-10 JP JP2013553882A patent/JP5800915B2/ja active Active
- 2012-02-10 PT PT127031235T patent/PT2676267T/pt unknown
- 2012-02-10 PT PT17171964T patent/PT3239978T/pt unknown
-
2013
- 2013-08-14 US US13/966,635 patent/US9595263B2/en active Active
- 2013-09-11 ZA ZA2013/06841A patent/ZA201306841B/en unknown
-
2018
- 2018-04-24 HK HK18105291.5A patent/HK1245987B/zh unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0784846A1 (en) * | 1994-04-29 | 1997-07-23 | Sherman, Jonathan, Edward | A multi-pulse analysis speech processing system and method |
JPH11502318A (ja) * | 1995-03-22 | 1999-02-23 | テレフオンアクチーボラゲツト エル エム エリクソン(パブル) | 分析/合成線形予測音声コーダ |
RU2003118444A (ru) * | 2000-11-22 | 2004-12-10 | Войсэйдж Корпорейшн (Ca) | Индексирование положений и знаков импульсов в алгебраических кодовых книгах для кодирования широкополосных сигналов |
RU2302665C2 (ru) * | 2001-12-14 | 2007-07-10 | Нокиа Корпорейшн | Способ модификации сигнала для эффективного кодирования речевых сигналов |
RU2004138289A (ru) * | 2002-05-31 | 2005-06-10 | Войсэйдж Корпорейшн (Ca) | Способ и система для многоскоростного решетчатого векторного квантования сигнала |
US7587312B2 (en) * | 2002-12-27 | 2009-09-08 | Lg Electronics Inc. | Method and apparatus for pitch modulation and gender identification of a voice signal |
CA2730239A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2586597C2 (ru) | Кодирование и декодирование позиций импульсов дорожек аудиосигнала | |
TWI488176B (zh) | 音訊信號音軌脈衝位置之編碼與解碼技術 | |
KR101790463B1 (ko) | 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치 | |
MX2011003815A (es) | Decodificador de audio, codificador de audio, metodo para decodificar una señal de audio, metodo para codificar una señal de audio, programa de computadora y señal de audio. | |
EP3074970B1 (en) | Audio encoder and decoder | |
EP3467824A1 (en) | Method and system for inter-channel coding | |
KR20060131781A (ko) | 디지털 신호 압축 시의 코딩에 사용되는 멀티펄스딕셔너리의 인덱스간 트랜스 코딩 | |
JP2019091075A (ja) | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム | |
CN106796804A (zh) | 用于对话增强的解码方法和解码器 | |
ES2428572T3 (es) | Dispositivo de codificación de audio y método de codificación de audio | |
EP2727106B1 (en) | Multiple scale codebook search | |
RU2662921C2 (ru) | Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения | |
ES2821725T3 (es) | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio | |
JP2004120623A (ja) | 符号化装置、符号化方法、復号装置及び復号方法 | |
EP2665060B1 (en) | Apparatus for coding a speech/sound signal | |
US20210279037A1 (en) | Temporal computing | |
JP5762636B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 | |
WO2023198862A1 (en) | Time-domain gain modeling in the qmf domain | |
JP3068689B2 (ja) | 音声符号化方法 |