BR112013020700B1 - Codificação e decodificação de posições de pulso de faixas de um sinal de áudio - Google Patents
Codificação e decodificação de posições de pulso de faixas de um sinal de áudio Download PDFInfo
- Publication number
- BR112013020700B1 BR112013020700B1 BR112013020700-0A BR112013020700A BR112013020700B1 BR 112013020700 B1 BR112013020700 B1 BR 112013020700B1 BR 112013020700 A BR112013020700 A BR 112013020700A BR 112013020700 B1 BR112013020700 B1 BR 112013020700B1
- Authority
- BR
- Brazil
- Prior art keywords
- pulse
- positions
- pulses
- band
- audio signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 claims description 44
- 238000012360 testing method Methods 0.000 claims description 11
- 239000000758 substrate Substances 0.000 claims 16
- 238000005192 partition Methods 0.000 claims 8
- 238000013459 approach Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 238000004590 computer program Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008521 reorganization Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 210000000707 wrist Anatomy 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
codificação e decodificação de posições de pulso de faixas de um sinal de áudio. um aparelho para decodificar um sinal de áudio codificado, caracterizado por uma ou mais faixas estarem associadas ao sinal de áudio codificado, cada uma das faixas tendo uma pluralidade de posições da faixa e uma pluralidade de pulsos é fornecida. o aparelho compreende um decodificador de informação de pulso (110) e um decodificador de sinal (120). o decodificador de informação de pulso (110) é adaptado para decodificar uma pluralidade de posições de pulso, em que cada uma das posições de pulso indica uma das posições da faixa de uma das faixas para indicar uma posição de um dos pulsos da faixa, e em que o decodificador de informação de pulso é configurado para decodificar a pluralidade de posições de pulso utilizando um número de posições da faixa indicando um número total das posições da faixa de, pelo menos, uma das faixas, um número de pulsos total que indica um número total dos pulsos de, pelo menos, uma das faixas e um número de estado. o decodificador de sinal (120) é adaptado para decodificar o sinal de áudio codificado gerando um sinal de áudio sintetizado utilizando a pluralidade de posições de pulso e uma pluralidade de coeficientes do filtro preditivo estando associado com o sinal de áudio codificado.
Description
A presente invenção está relacionada ao campo de processamento de áudio e codificação de áudio, em particular, à codificação e decodificação de posições de pulso de faixas no sinal de áudio.
O processamento e/ou codificação de áudio tem avançado de muitas maneiras. Na codificação de áudio, os codificadores preditivos lineares desempenham um papel importante. Ao codificar um sinal de áudio, por exemplo, um sinal de áudio abrangendo a fala, os codificadores preditivos lineares normalmente codificam uma representação de um envelope espectral do sinal de áudio. Para este fim, os codificadores preditivos lineares podem determinar os coeficientes de filtro preditivo para representar o envelope espectral do som de forma codificada. Os coeficientes do filtro podem, então, ser usados por um decodificador preditivo linear para decodificar o sinal de áudio gerando um sinal de áudio sintetizado usando os coeficientes de filtro preditivo.
Exemplos importantes para os codificadores preditivos lineares são os codificadores de Previsão Linear de Excitação por Código Algébrico [ACELP | Algebraic Code-Exited Linear Prediction coders]. Os codificadores ACELP são amplamente utilizados, por exemplo, em Codificação de Áudio e Fala Unificada [USAC I Unified Speech and Audio Coding], e podem ter campos de aplicações adicionais, por exemplo, em Codificação de Áudio e Fala Unificada de Baixo Atraso [LD-USAC | Low Delay Unified Speech and Audio Coding].
Os codificadores ACELP normalmente codificam um sinal de áudio determinando os coeficientes de filtro preditivo. Para conseguir uma melhor codificação, os codificadores ACELP determinam um sinal residual, também referido como sinal alvo, com base no sinal de áudio a ser codificado, e com base nos já determinados coeficientes de filtro preditivo. O sinal residual pode, por exemplo, ser um sinal diferente representando uma diferença entre o sinal de áudio a ser codificado, e as partes do sinal que são codificadas pelos coeficientes de filtro preditivo, e, possivelmente, através dos coeficientes de filtro adaptativo resultantes da análise do tom. 0 codificador ACELP, então, visa codificar o sinal residual. Para isso, o codificador codifica os parâmetros de codebook [livro de códigos] algébrico, que são usados para codificar o sinal residual.
Para codificar o sinal residual, são usados os codebooks algébricos. Normalmente, os codebooks algébricos abrangem uma pluralidade de faixas, por exemplo, quatro faixas, cada uma compreendendo 16 posições de faixas. Em tal configuração, um total de 4 • 16 = 64 posições de amostras podem ser representadas por um codebook algébrico respectivo, por exemplo, correspondendo ao número de amostras de uma subestrutura do sinal de áudio a ser codificado.
As faixas do codebook podem ser intercaladas de modo que a faixa 0 do codebook possa representar as amostras 0, 4, 8 ..., 60 da subestrutura, para que a faixa 1 do codebook possa representar as amostras 1, 5, 9 ..., 61 da subestrutura; a faixa 2 do codebook possa representar as amostras 2, 6, 10 ..., 62 da subestrutura, e para que a faixa 3 do codebook possa representar as amostras 3, 7, 11 63 da subestrutura. Cada faixa pode ter um número fixo de pulsos. Ou, o numero de pulsos por faixa pode variar, por exemplo, dependendo de outras condições. Um pulso pode, por exemplo, ser positivo ou negativo, ou seja, pode ser representado por +1 (pulso positivo) ou 0 (pulso negativo).
Para a codificação do sinal residual, na codificação, uma configuração de codebook que melhor represente as partes do sinal remanescente do sinal residual pode ser escolhida. Para tal, os pulsos disponíveis podem ser posicionados nas posições de faixa adequadas que melhor reflitam as partes do sinal a ser codificado. Ademais, pode-se especificar, se um pulso correspondente é negativo ou positivo.
No lado do decodificador, um decodificador ACELP decodificaria primeiramente os parâmetros de codebook algébricos. 0 decodificador ACELP pode também decodificar os parâmetros de codebook adaptativos. Para determinar os parâmetros de codebook algébricos, o decodificador ACELP pode determinar a pluralidade das partes do pulso para cada faixa de codebook algébrico. Ademais, o decodificador ACELP pode também decodificar, se um pulso em uma posição de faixa é um pulso positivo ou negativo. Além disso, o decodificador ACELP pode também decodificar os parâmetros de codebook adaptativos. Com base nestas informações, o decodificador ACELP normalmente gera um sinal de excitação. O decodificador ACELP, então, filtra os coeficientes de filtro preditivo no sinal de excitação para gerar um sinal de áudio sintetizado para obter o sinal de áudio decodificado.
No ACELP, os pulsos em uma faixa são geralmente codificados como se segue: se a faixa é de dimensão 16, e se o número de pulsos desta faixa é um, então podemos codificar as partes do pulso por sua posição (4 bits) e sinal (1 bit), totalizando 5 bits, Se a faixa é de dimensão 16, e o número de pulsos desta faixa é dois, então, o primeiro pulso é codificado por sua posição (4 bits) e sinal (1 bit) . Para o segundo pulso, precisamos codificar por posição somente (4 bits), uma vez que podemos escolher que o sinal do segundo pulso seja positivo se é para a esquerda do primeiro pulso, negativo se é para a direita do primeiro pulso e o mesmo sinal como o primeiro pulso se estiver na mesma posição do primeiro pulso. No total, precisamos assim de 9 bits para codificar 2 pulsos. Em comparação com a codificação das posições do pulso separadamente, por 5 bits cada, salvamos assim 1 bit para cada par de pulsos.
Codificando um número de pulsos maior que 2, podemos codificar pares de pulsos e se o número de pulsos for impar, codificar o último pulso separadamente. Então, por exemplo, para a faixa de 5 pulsos, precisaríamos de 9+9+5 = 23 bits. Se tivermos 4 faixas, então 4 x 23 = 92 bits seriam necessários para a codificação de uma subestrutura de dimensão 64 com 4 faixas, e 5 pulsos por faixa. No entanto, seria bastante apreciado se o número de bits pudesse, além disso, for reduzido.
Seria bastante apreciado se um aparelho para a codificação e um aparelho respectivo para a decodificação com a codificação melhorada ou os conceitos de decodificação fosse fornecido, que tem meios de codificar ou decodificar as informações de pulso de modo aprimorado usando menos bits por representação de informação de pulso, como, por exemplo, reduziria a taxa de transmissão para transmitir um sinal de áudio respectivamente codificado, e como, ademais, por exemplo, reduziria o armazenamento necessário para armazenar um sinal de áudio respectivamente codificado.
Assim, é um objetivo da presente invenção fornecer os conceitos aprimorados para a codificação e decodificação dos pulsos das faixas de um sinal de áudio. Os objetivos da presente invenção são alcançados por um aparelho para decodificação de acordo com a reivindicação 1, um aparelho para a codificação de acordo com a reivindicação 9, um método para a decodificação de acordo com a reivindicação 13, um método para codificação de acordo com a reivindicação 14, e um programa de computador de acordo com a reivindicação 15.
De acordo com as aplicações, assume-se que um número de estado está disponível para um aparelho para a decodificação. Além do mais, assume-se que um número de posições das faixas, indicando o número total das posições das faixas de ao menos uma das faixas associadas com o sinal de áudio codificado, e o número de pulsos total, indicando o número de pulsos de ao menos uma das faixas, está disponível para um aparelho de decodificação da presente invenção. Preferivelmente, o número de posições das faixas e o número de pulsos totais estão disponíveis para cada faixa associada com o sinal de áudio codificado.
Por exemplo, com 4 faixas com 5 pulsos, cada uma pode atingir cerca de 6.6 x lO^∑l estados, que podem, de acordo com as aplicações, ser codificados por 73 bits, que é aproximadamente 21% mais eficiente que a codificação do codificador do estado da técnica supracitado usando 92 bits.
Primeiramente, um conceito é fornecido sobre como codificar uma pluralidade de posições de pulsos de uma faixa de um sinal de áudio de maneira eficiente. A seguir, o conceito é estendido para permitir a codificação não somente da posição dos pulsos de uma faixa, mas também de se o pulso é positivo ou negativo. Além disso, o conceito é então estendido para permitir a codificação das informações do pulso para a pluralidade das faixas de modo eficiente. Os conceitos são consequentemente aplicáveis sobre um lado do decodificador.
Ademais, as aplicações são, portanto, baseadas nas descobertas de que se a estratégia de codificação usa um número pré-determinado de bits, tais como qualquer configuração com o número de pulsos em cada faixa, e requer o mesmo número de bits. Se o número de bits disponivel é fixo, então é possivel escolher diretamente quantos pulsos podem ser codificados com uma dada quantidade de bits, permitindo assim a codificação com uma qualidade pré-determinada. Portando, com esta abordagem, não é necessário tentar quantidades diferentes de pulsos até que a taxa de bits desejada seja alcançada, mas podemos escolher diretamente a quantidade correta de pulsos, reduzindo deste modo a complexidade.
Com base nas suposições acima, a pluralidade de posições de pulsos de uma faixa de uma estrutura de sinal de áudio pode ser codificada e/ou decodificada.
Enquanto a presente invenção pode ser empregada para a codificação ou decodificação de qualquer tipo de sinais de áudio, por exemplo, sinais de fala ou sinais de música, a presente invenção é particularmente útil para a codificação e decodificação de sinais de fala.
Em outra aplicação, o decodificador de informação de pulso é ademais adaptado para decodificar uma pluralidade de sinais de pulso usando o número de posições de faixas, o número de pulsos total e o número de estado, caracterizado por cada um dos sinais de pulso indicar um sinal de um da pluralidade de pulsos. O decodificador de sinal pode ser adaptado para decodificar o sinal de áudio codificado gerando um sinal de áudio sintetizado ademais do uso da pluralidade dos sinais de pulso.
Conforme a aplicação adicional, caracterizada por uma ou mais faixas poder abranger ao menos a última faixa e uma ou mais outras faixas, o decodificador de informações de pulso pode ser adaptado para gerar um primeiro número de subestado e um segundo número de subestado a partir do número de estado. O decodificador da informação do pulso pode ser configurado para decodificar um primeiro grupo de posições de pulso com base no primeiro número de subestado, e o decodificador de informação de pulso pode ademais ser configurado para decodificar um segundo grupo de posições de pulso com base em um segundo número de subestado. O segundo grupo de posições de pulso pode somente consistir de posições de pulso indicando posições de faixas da última faixa. O primeiro grupo de posições de pulso pode somente consistir de posições de pulso indicando posições de uma ou mais outras faixas.
De acordo com outra aplicação, o decodificador de informação de pulso pode ser configurado para separar o número de estado dentro do primeiro número de subestado, e o segundo número de subestado dividindo o número de estado por f (pk, N) para obter uma totalidade da parte e um remanescente como resultado da divisão caracterizado pela parte total ser o primeiro número de subestado e em que o restante é o segundo número de subestado, em que pk indica para cada uma de uma ou mais faixas de número de pulsos, e em que N indica para cada uma de uma ou mais faixas o número de posições das faixas. Aqui, f (pk, N) é uma função que retorna o número de estados que pode ser alcançado em uma faixa de dimensão N com pulsos pk.
Em outra aplicação, o decodificador de informação do pulso pode ser adaptado para conduzir um teste comparando o número de estado ou um número de estado atualizado com um valor limiar.
O decodificador de informação de pulso pode ser adaptado para conduzir o teste comprando se o número de estado ou um número de estado atualizado é maior que, maior que ou igual a, menor que, ou menor que ou igual ao valor limiar, e se a unidade em análise é, ademais, adaptada para atualizar o número de estado ou um número de estado atualizado, dependendo do resultado do teste.
Em uma aplicação, o decodificador de informação de pulso pode ser configurado para comparar o número de estado ou o número de estado atualizado com o valor limiar para cada posição de faixa de uma da pluralidade de faixas.
De acordo com uma aplicação, o decodificador de informação de pulso pode ser configurado para dividir uma das faixas dentro da primeira divisão de faixas, abrangendo ao menos uma posição de faixa da pluralidade de posições das faixas, e dentro de uma segunda divisão das faixas, compreendendo as outras posições de faixas remanescente da pluralidade das posições de faixas. O decodificador de informação de pulso pode ser configurado para gerar um primeiro número de subestados e um segundo número de subestados com base no número de estados. Além disso, o decodificador de informação de pulso pode ser configurado para decodificar um primeiro grupo de posições de pulso associados com a primeira divisão de faixas com base no primeiro número de subestado. Além disso, o decodificador de informação de pulso pode ser configurado para decodificar um segundo grupo de posições de pulso associados com a segunda divisão de faixas com base no segundo número de subestado.
De acordo com a aplicação, um aparelho para a codificação de um sinal de áudio é fornecido. O aparelho compreende um processador de sinal adaptado para determinar uma pluralidade de coeficientes de filtro preditivo sendo associado com o sinal de áudio, para a geração de um sinal residual com base no sinal de áudio e na pluralidade dos coeficientes de filtro preditivo. Ademais, o aparelho compreende um codificador de informações de pulso adaptado para codificar uma pluralidade de posições de pulso relacionada com uma ou mais faixas para codificar o sinal de áudio, uma ou mais faixas sendo associadas com o sinal residual. Cada uma das faixas tem uma pluralidade de posições de faixas e uma pluralidade de pulsos. Cada uma das posições do pulso indica uma das posições da faixa de uma das faixas para indicar uma posição de um ou mais pulsos da faixa. O codificador de informação de pulso é configurado para codificar a pluralidade das posições de pulso gerando um número de estado, de modo que as posições de pulso possam ser decodificadas somente com base no número de estado, um número das posições da faixa indicando um número total de posições da faixa de pelo menos uma das faixas, e um número total de pulsos indicando um número total de pulsos de pelo menos uma das faixas.
Conforme outra aplicação, o codificador de informação de pulso pode ser adaptado para codificar uma pluralidade de sinais de pulso, caracterizado por cada um dos sinais de pulso indicar um sinal de um da pluralidade de pulsos. O codificador de informação de pulso pode, além disso, ser configurado para codificar a pluralidade dos sinais de pulso gerando um número de estado, de modo que os sinais de pulso possam ser decodificados somente com base no número de estado, um número das posições da faixa indicando um número total de posições da faixa de pelo menos uma das faixas, e um número total de pulsos.
Em uma aplicação, o codificador de informação de pulso é adaptado para adicionar um valor integral a um número intermediário para cada pulso em uma posição de faixa para cada posição de faixa de uma das faixas, para obter o número de estado.
De acordo com outra aplicação, o codificador de informação de pulso pode ser configurado para dividir uma das faixas dentro da primeira divisão de faixas, abrangendo ao menos uma posição de faixa da pluralidade de posições das faixas, e dentro de uma segunda divisão das faixas, compreendendo as outras posições de faixas remanescente da pluralidade das posições de faixas. Ademais, o codificador de informação de pulso pode ser configurado para codificar um primeiro número de subestado associado com a primeira divisão. Além disso, o codificador de informação de pulso pode ser configurado para codificar um segundo número de subestado associado com a segunda divisão. Adicionalmente, o codificador de informação de pulso pode ser configurado para gerar um primeiro número de subestados e um segundo número de subestados com base no número de estados.
Na sequência, as aplicações da presente invenção são descritas em maiores detalhes com respeito às figuras, em que:
A Fig. 1 ilustra um aparelho para a decodificação de um sinal de áudio codificado de acordo com uma aplicação,
A Fig. 2 ilustra um aparelho para a codificação de um sinal de áudio de acordo com uma aplicação,
A Fig. 3 ilustra todas as configurações possiveis para uma faixa com dois pulsos não sinalizados e três posições de faixa,
A Fig. 4 ilustra todas as configurações possiveis para uma faixa com um pulso sinalizado e duas posições de faixa,
A Fig. 5 ilustra todas as configurações possiveis para uma faixa com dois pulsos sinalizados e duas posições de faixa,
A Fig. 6 é um fluxograma que ilustra uma aplicação descrevendo as etapas de processamento conduzidas por um decodificador de informação de pulso de acordo com uma aplicação, e
A Fig. 7 é um fluxograma que ilustra uma aplicação descrevendo as etapas de processamento conduzidas por um codificador de informação de pulso de acordo com uma aplicação.
A Fig. 1 ilustra um aparelho para decodificação de um sinal de áudio codificado, caracterizado por uma ou mais faixas serem associadas com o sinal de áudio codificado, cada uma das faixas tendo uma pluralidade de posições de faixas e uma pluralidade de pulsos.
O aparelho compreende um decodificador de informação de pulso 110 e um decodificador de sinal 120. O decodificador de informação de pulso 110 é adaptado para decodificar uma pluralidade de posições de pulso. Cada uma das posições do pulso indica uma das posições da faixa de uma das faixas para indicar uma posição de um ou mais pulsos da faixa.
O decodificador de informação de pulso 110 é configurado para decodificar a pluralidade das posições de pulso usando um número de posições da faixa indicando um número total de posições da faixa de pelo menos uma das faixas, e um número total de pulsos indicando um número total de pulsos de pelo menos uma das faixas, e um número de estado.
O decodificador de sinal 120 é adaptado para decodificar o sinal de áudio codificado gerando um sinal de áudio sintetizado usando a pluralidade de posições de pulso e uma pluralidade de coeficientes de filtro preditivo sendo associados com o sinal de áudio codificado.
O número de estado é um número que pode ter sido codificado por um codificador conforme as aplicações que serão descritas abaixo. O número de estado, por exemplo, abrange as informações sobre a pluralidade de posições de pulso em uma representação compacta, ou seja, uma representação que exige poucos bits, e que pode ser decodificadas, quando a informação sobre o número de posições das faixas e o número de pulsos totais está disponível no decodificador.
Em uma aplicação, o número de posições da faixa e/ou o número de pulsos total de uma ou de cada faixa de sinal de áudio pode estar disponível no decodificador, pois o número de posições da faixa e/ou o número de pulsos total é um valor estático que não muda, e é conhecido pelo receptor. Por exemplo, o número das posições da faixa pode ser sempre 16 para cada faixa, e o número de pulsos total pode ser sempre 4.
Em outra aplicação, o número de posições da faixa e/ou o número de pulsos total de uma ou de cada faixa de sinal de áudio pode ser explicitamente transmitido pelo aparelho por decodificação, p. ex., pelo aparelho por codificação.
Em aplicações adicionais, o decodificador pode determinar o número de posições da faixa e/ou o número de pulsos total de um ou de cada faixa de sinal de áudio analisando outros parâmetros que não exprimem explicitamente o número de posições de faixa e/ou o número de pulsos total, mas a partir do qual o número de posições da faixa e/ou número de pulsos total pode ser derivado.
Em outras aplicações, o decodificador pode analisar outros dados disponíveis para derivar o número de posições da faixa e/ou o número total de pulsos de uma ou de cada faixa de sinal de áudio.
Em aplicações adicionais, o decodificador de informações de pulso pode ser adaptado para também decodificar, se um pulso é um pulso positivo ou um pulso negativo.
Em outra aplicação, o decodificador de informação de pulso pode, além disso, ser adaptado para decodificar a informação do pulso que retém a informação sobre os pulsos para uma pluralidade de faixas. A informação de pulso pode, por exemplo, ser informações sobre a posição dos pulsos em uma faixa e/ou informações de se um pulso é um pulso positivo ou um pulso negativo.
A Fig. 2 ilustra um aparelho para a codificação de um sinal de áudio abrangendo um processador de sinal 201 e um codificador de informação de pulso 220.
O processador de sinal 210 é adapcado para determinar uma pluralidade de coeficientes de filtro preditivo sendo associado com o sinal de áudio para a geração de um sinal residual, com base no sinal de áudio e na pluralidade dos coeficientes de filtro preditivo.
O codificador de informações de pulso 220 é adaptado para codificar uma pluralidade de posições de pulso relacionadas com uma ou mais faixas para codificar o sinal de áudio. Esta uma ou mais faixas são associadas com o sinal residual gerado pelo processador de sinal 210. Cada uma das faixas tem uma pluralidade de posições de faixas e uma pluralidade de pulsos. Ademais, cada uma das posições do pulso indica uma das posições da faixa de uma das faixas para indicar uma posição de um ou mais pulsos da faixa.
O codificador de informação de pulso 220 é configurado para codificar a pluralidade das posições de pulso gerando um número de estado, de modo que as posições de pulso possam ser decodificadas somente com base no número de estado, um número das posições da faixa indicando um número total de posições da faixa de pelo menos uma das faixas, e um número total de pulsos indicando um número total de pulsos de pelo menos uma das faixas.
A seguir, os conceitos básicos das aplicações da presente invenção relacionados à codificação das posições do pulso e possivelmente o sinal de pulso (pulso positivo ou pulso negativo) gerando um número de estado são apresentados.
Os princípios de codificação das aplicações da presente invenção são baseados na descoberta de que se uma numeração de estado de todas as configurações possíveis de k pulsos em uma faixa com n posições de faixa é considerada, é suficiente codificar o estado real dos pulsos de uma faixa. Ao codificar tal estado pelo menor número de bits possível, fornece- se a codificação compacta desejável. Por isso, um conceito de numeração de estado é apresentado, caracterizado por cada constelação de posições de pulso, e possivelmente também de sinal de pulso representar um estado, e cada estado é numerado de maneira única.
A Fig. 3 ilustra isso para um caso simples, onde todas as configurações possíveis são apresentadas, quando uma faixa com dois pulsos e três posições de faixa é considerada. Dois pulsos podem estar localizados na mesma posição da faixa. No exemplo da Fig. 3, o sinal dos pulsos (p. ex.: se o pulso é positivo ou negativo) não é considerado, por exemplo, em tal caso, todos os pulsos podem, por exemplo, ser considerados como positivo.
Na Fig. 3, todos os estados possíveis para dois pulsos não direcionados localizados em uma faixa com três posições de faixa (na Fig. 3; as posições da faixa 1, 2 e 3) são ilustrados. Há somente seis possíveis estados diferentes (na Fig. 3 enumerada de 1 a 5) que descrevem como os pulsos podem ser distribuídos na faixa. Por isso, é suficiente o uso do número de estado na faixa de 0 a 5 para descrever a presente configuração real. Por exemplo, se o número de estado no exemplo da Fig. 3 tem o valor (4) , e se o decodificador esta ciente do esquema de codificação, o decodificador pode concluir que o número de estado = 4 significa que a faixa tem um pulso na posição da faixa 0, e outro pulso na posição da faixa 2. Por isso, no exemplo da Fig. 3, três bits são suficientes para codificar o número de estado para identificar um de seis diferentes estados do exemplo da Fig. 3.
A Fig. 4 ilustra um caso apresentando todos os estados possiveis para um pulso direcionado localizado em uma faixa com duas posições de faixa (na Fig. 4: posições das faixas 1 e 2). Na Fig. 4, o sinal dos pulsos (p. ex.: se o pulso é positivo ou negativo) é considerado. Há quatro possiveis estados diferentes (na Fig. 3 enumerada de 0 a 3) que descrevem como os pulsos podem ser distribuídos na faixa e também em seu sinal (positivo ou negativo) . É suficiente o uso do número de estado na faixa de 0 a 3 para descrever a presente configuração real. Por exemplo, se o número de estado no exemplo da Fig. 4 tem o valor (2), e se o decodificador esta ciente do esquema de codificação, o decodificador pode concluir que o número de estado = 2 significa que a faixa tem um pulso na posição da faixa 1, e que o outro pulso é um pulso positivo.
A Fig. 5 ilustra ainda outro caso, onde todas as configurações possiveis são apresentadas, quando uma faixa com dois pulsos e duas posições de faixa é considerada. Os pulsos podem estar localizados na mesma posição da faixa. No exemplo mostrado na Fig. 5, o sinal dos pulsos (p. ex.: se o pulso é positivo ou negativo) é considerado. Assume-se que os pulsos na mesma posição de faixa têm o mesmo sinal (p. ex.: as faixas na mesma posição de faixa são ou todos positivos ou todos negativos).
Na Fig. 5, todos os estados possiveis para dois pulsos sinalizados (p. ex.: pulsos que são ou positivos ou negativos) localizados em uma faixa com duas posições de faixa (na Fig. 5; as posições da faixa 1 e 2) são ilustradas. Há somente oito possiveis estados diferentes (na Fig. 5 enumerada de 0 a 7) que descrevem como os pulsos podem ser distribuídos na faixa. Por isso, é suficiente o uso do número de estado na faixa de 0 a 7 para descrever a presente configuração real. Por exemplo, se o número de estado no exemplo da Fig. 5 tem o valor (3), e se o decodificador esta ciente do esquema de codificação, o decodificador pode concluir que o número de estado = 3 significa que a faixa tem um pulso na posição da faixa 0 que é positivo, e o outro pulso na posição de faixa 1 que é negativo. Assim, no exemplo da Fig. 5, três bits são suficientes para codificar o número de estado para identificar um de oito diferentes estados do exemplo da Fig. 5.
Na ACELP, o sinal residual pode ser codificado por um número fixo de pulsos sinalizados. Conforme descrito acima, os pulsos podem, por exemplo, ser distribuídos em quatro faixas entrelaçadas, de modo que a faixa 0 contém as posições mod(n,4)==0, a faixa = 1 contém as posições mod (n, 4) ==1, e assim por diante. Cada faixa pode ter um número pré-definido de pulsos unitários sinalizados, que pode sobrepor-se, mas quando se sobrepõem, os pulsos têm o mesmo sinal.
Ao codificar os pulsos, um mapeamento a partir das posições do pulso e seus sinais, dentro de uma representação que usa a menor quantidade possível de bits, deve ser alcançado. Ademais, a codificação do pulso deve ter um consumo de bits que seja fixo, ou seja, nenhuma constelação de pulso tem o mesmo número de bits.
Cada faixa é primeiramente codificada de modo independente, e, então, os estados de cada faixa são combinados com um número que representa o estado de toda subestrutura. Esta abordagem fornece o consumo de bits otimizado matematicamente, dado que todos os estados têm probabilidade igual, e o consumo de bits é fixo.
O conceito de numeração de estado pode também ser explicado usando uma representação compacta de diferentes constelações de estado:
Deixe o sinal residual, que queremos codificar, como xn. Assumindo que quatro faixas intercaladas, p. ex., de um codebook algébrico, são consideradas, então, a primeira faixa tem amostras x0,x4,x8...xN~4 , a segunda faixa tem amostras xpx5,x9,..xN_3 , etc. Suponha que a primeira faixa é quantizada com um pulso unitário sinalizado e que T=8, enquanto que a dimensão da faixa é 2 (T = dimensão (amostras) do sinal residual que será codificado). Se T = 8, e se 4 faixas são usadas para codificar o sinal residual, cada uma das 4 faixas tem 2 posições de faixa. Por exemplo, a primeira faixa pode ser considerada, que tem duas posições de faixa x0 e x4. O pulso da primeira faixa pode, então, aparecer em qualquer uma das seguintes constelações. Há quatro diferentes estados para esta configuração.
Similarmente, se houvesse dois pulsos na primeira faixa, a primeira faixa com duas posições de faixa x0 e x4, os pulsos poderiam então ser designados nas seguintes constelações:
Assim, esta configuração tem 8 estados. Se a dimensão do sinal residual é estendido para T = 12, então cada uma das 4 faixas tem 3 posições de faixa. A primeira faixa ganha mais amostras e tem agora posições de faixa x0, x4 e x8, de modo que temos:
A tabela acima significa que há 8 diferentes estados para x0 e x4, se x8 - 0 (x8 não tem nenhum pulso); 4 diferentes estados para x0 e x4, se x8 =1 (x8 com um pulso positivo); 4 diferentes estados para x0 e x4, se x8 = -1 (x8 com um pulso negativo); 1 estado para x0 e x4, se x8 = 2 (x8 com dois pulsos positivos) ; e 1 estado para x0 e x4, se x8 = -2 (x8 com dois pulsos negativos).
Aqui, o número de estados para a primeira linha foi obtido a partir das duas tabelas anteriores. Ao adicionar os números de estados na primeira linha, vemos que esta configuração tem 18 estados.
No exemplo T = 12, 5 bits são suficientes para codificar todos os 18 possiveis estados diferentes. O codificador então, por exemplo, seleciona o número de estados a partir do intervalo [0, 17] para especificar uma das 18 configurações. Se o decodificador está ciente do esquema de codificação, por exemplo, se estiver ciente de qual número de estados representa qual configuração, este pode decodificar as posições de pulso e o pulso sinaliza para uma faixa.
Abaixo, os métodos de codificação adequados correspondentes aos métodos de decodificação de acordo com as aplicações serão fornecidos. Conforme as aplicações, um aparelho para a codificação é fornecido, que é configurado para executar um dos métodos de codificação apresentados abaixo. Além disso, conforme as aplicações adicionais, um aparelho para a decodificação é fornecido, que é configurado para executar um dos métodos de decodificação apresentados abaixo.
Nas aplicações, para gerar o número de estado ou para decodificar o número de estado, o número de configurações possiveis para N posições de faixas com p pulsos pode ser calculado.
Os pulsos podem ser sinalizados, e uma fórmula recursiva pode ser empregada, que calcula o número de estados f(p, N) para uma faixa com N posições de faixa e p pulsos sinalizados (os pulsos podem ser positivos ou negativos, mas os pulsos na mesma posição de faixa têm o mesmo sinal), caracterizados pela fórmula recursiva f(p, N) ser definida por: Fórmula 1: uma vez que uma posição simples com um ou mais pulsos requer um bit (dois estados) para o sinal. A fórmula recursiva é para a soma de todas as constelações diferentes.
A saber, dado p pulsos, a posição atual pode ter qN = 0 para p pulsos, onde as posições N-l remanescentes têm p-qN pulsos. O número de estados na posição atual e as posições N-l remanescentes são multiplicados para obter o número de estados com estas combinações dos pulsos, e as combinações são somadas para obter o número total de estados.
Nas aplicações, a função recursiva pode ser calculada por um algoritmo interativo, onde a recursão é substituída pela iteração.
Como a avaliação de f(p>N) é numérica e relativamente complexa para aplicações em tempo real, de acordo com algumas aplicações, uma tabela de referência pode ser empregada para calcular f(p,N) . Consoantes algumas aplicações, a tabela pode ter sido computada off-line.
A seguir, conceitos adicionais são fornecidos para a codificação e decodificação do número de estado: Deixe f(p,N) denotar o número de configurações possíveis para a faixa com N posições de faixa e p pulsos sinalizados.
O codificador da informação de pulso pode agora analisar a faixa: se a primeira posição na faixa não tem um pulso, então as posições N-l remanescente tem p pulsos sinalizados, e para descrever esta constelação, teremos somente f(p,N-\) estados.
Em contrapartida, se a primeira posição tem um ou mais pulsos, o codificador de informação do pulso pode definir que o estado geral é maior que f(p,N-i) .
Então, no decodificador de informação do pulso, o decodificador de informação do pulso pode, por exemplo, começar com a última posição e comparar o estado com o valor limiar, por exemplo, com f(p,N-\) . Se for maior, então, o decodificador de informação de pulso pode determinar que a última posição tem, pelo menos, um pulso. O decodificador de informação do pulso pode então atualizar o estado para obter um número de estado atualizado pela subtração f(p,N-l) a partir do estado, e reduzir o número de pulsos remanescente por um.
Em contrapartida, se não houver pulso na última posição, o decodificador de informação de pulso pode reduzir o número de posições remanescentes por um. Repetir este procedimento até que não haja pulsos remanescentes, forneceria as posições não sinalizadas dos pulsos.
Para também tomar os sinais dos pulsos dentro de uma conta, o codificador de informações de pulso pode codificar os pulsos no menor bit do estado. Em uma aplicação alternativa, o codificador de informação do pulso pode codificar o sinal do bit remanescente mais alto do estado. Prefere-se, entretanto, codificar o sinal de pulso no menor bit, uma vez que é mais fácil de lidar com respeito às comutações integrais.
Se no decodificador de informação do pulso, o primeiro pulso de uma dada posição for encontrado, o sinal do pulso é determinado pelo último bit. Então, o estado remanescente é deslocado uma etapa à direita para obter um número de estado atualizado.
Em uma aplicação, um decodificador de informação de pulso é configurado para aplicar o seguinte algoritmo de decodificação. Neste algoritmo de decodificação, em uma abordagem de passo a passo, para cada posição de faixa, por exemplo, uma após a outra, o número de estado ou o número de estado atualizado é comparado com o valor limiar, p. ex., com f(p,k-l) .
De acordo com uma aplicação, um algoritmo do decodificador de informação de pulso é fornecido: Para cada posição na faixa, k=N para 1 Enquanto o estado s >= f(p,k-l) Coloque um pulso em k Estabeleça s := s-f(p,k-l)
Se este for o primeiro pulso em k Se o menos bit de s for configurado, configure o sinal para menos; Do contrário, configure o sinal para mais. Desloque o estado uma etapa para a direita s:= s/2 Reduza o número de pulsos remanescentes p:=p-\
Com relação à informação de pulso, de acordo com uma aplicação, um codificador de informação de pulso é configurado para aplicar o seguinte algoritmo de codificação. O codificador de informação de pulso passa pela mesma etapa do decodificador de informação de pulso, mas em ordem inversa.
De acordo com uma aplicação, um algoritmo do codificador de informação de pulso é fornecido: Estabeleça o número de pulsos conhecidos para zero, p:=0 e estado para zero, s:=0.
Para cada posição na faixa, k=l para N Para cada pulso nesta posição Se o pulso atual for o último nesta posição Desloque o estado uma etapa para a esquerda s:= s * 2 Se o sinal for menos, estabeleça o menor bit para um, s : = s + 1
Do contrário, estabeleça o menor bit para zero (ou seja, não faça nada) Atualize o estado s := s +f(p,k-l) Aumente o número de pulsos descobertos p:=p+l
Codificando o número de estado utilizando este algoritmo, o codificador de informação de pulso adiciona um valor integral para um número intermediário (p. ex. : um número de estado intermediário), por exemplo, o número de estado antes de o algoritmo ser completado, para cada pulso na posição da faixa para cada posição da faixa de uma das faixas, para obter (o valor de) o número de estado.
A abordagem para a codificação e decodificação da informação de pulso, p. ex., as posições do pulso e sinais de pulso podem ser referidas como "codificação passo a passo" e "decodificação passo a passo", uma vez que as posições são consideradas pelos métodos de codificação e decodificação um após o outro, passo a passo.
A Fig. 6 é um fluxograma que ilustra uma aplicação descrevendo uma etapa de processamento conduzida por um decodificador de informação de pulso de acordo com uma aplicação.
Na etapa 610, a posição atual da faixa k é estabelecida como N. Aqui, N representa o número de posições de faixas de uma faixa, caracterizada pelas posições da faixa serem numeradas de 1 a N.
Na etapa 620, testa-se se k é maior ou igual a 1, ou seja, se as posições da faixa remanescentes não foram consideradas. Se k não for maior ou igual a 1, todas as posições da faixa foram consideradas e o processo termina.
Em contrapartida, testa-se na etapa 630 se o estado é maior ou igual a f(p, k-1). Se for este o caso, ao menos um pulso está presente na posição k. Se não for este o caso, nenhum pulso (adicional) está presente na posição da faixa k e o processo continua em 640, onde k é reduzido por 1, de modo que a próxima posição da faixa será considerada.
Se, contudo, o estado é manor ou igual a f (p, k- 1) , o processo continua com a etapa 642, um pulso é colocado na posição da faixa k, e então, na etapa 644, o estado é atualizado reduzindo o estado por f(p, k-1). Então, na etapa 650 testa-se se o pulso atual é o primeiro pulso descoberto na posição da faixa k. Se não for este o caso, o número de pulsos remanescentes é reduzido por 1 na etapa 680, e o processo continua na etapa 630.
Se, no entanto, este for o primeiro pulso descoberto na posição da faixa k, o processo continua com a etapa 660, onde se testa se o menor bit de s está configurado. Se for este o caso, o sinal dos pulsos nesta posição de faixa é configurado para menos (etapa 662), contrariamente, o sinal de pulsos na posição da faixa é estabelecido para mais (etapa 664) . Em ambos os casos, o estado é então deslocado uma etapa para a direita 670 (s: = s/2). Então, também o número de pulsos remanescentes é reduzido por um (etapa 680) e o processo continua na etapa 630.
A Fig. 7 é um fluxograma que ilustra uma aplicação, em que o fluxograma descreve uma etapa de processamento conduzida por um codificador de informação de pulso de acordo com uma aplicação.
Na etapa 710, o número de pulsos descobertos p é estabelecido para 0, o estado s é estabelecido para 0 e a posição da faixa considerada k é estabelecida para 1.
Na etapa 720, testa-se se k é menor ou igual a N, ou seja, se as posições da faixa remanescentes não foram consideradas (aqui, N significa: número de posições da faixa de uma faixa) . Se k não for menor ou igual a N, todas as posições da faixa foram consideradas e o processo termina.
Em contrapartida, testa-se na etapa 7 se ao menos um pulso está presente na posição k. Se não for este o caso, o processo continua em 740, onde k é aumentado por 1, de modo que a próxima posição da faixa será considerada.
No entanto, se pelo menos um pulso estiver presente na posição da faixa k, testa-se na etapa 750 se o pulso atualmente considerado for o último pulso na posição de faixa k. Se este não for o caso, então, na etapa 770 o estado s é atualizado adicionando f (p, k-1) para o estado s, o número de pulsos encontrados p é aumentado por 1, e o processo continua com a etapa 780.
Se o pulso atualmente considerado for o último pulso na posição da faixa k, então depois da etapa 750, o processo continua com a etapa 7 55 e o estado é deslocado uma etapa para a esquerda (s: = s * 2) . Então, testa—se na etapa 760 se o sinal do pulso é de menos. Se for este o caso, o menor bit de s é estabelecido para 1 (etapa 762); em contrapartida, o menor bit de s é estabelecido para 0 (ou nada é feito) (etapa 764) . Então, em ambos os casos, a etapa 770 é conduzida, onde o estado s é atualizado adicionando f(p, k-1) para o estado s, o número de pulsos encontrados p é aumentado por 1, e o processo continua com a etapa 780.
Na etapa 780, testa-se se há algum outro pulso na posição k. Se for este o caso, o processo continua com a etapa 750; de outro modo, o processo continua com a etapa 740.
Na sequência, um conceito é fornecido para gerar um número de estado em conjunto codificando o estado de uma pluralidade de faixas.
Infelizmente, em muitos casos a gama de estados possíveis de uma única faixa não é um múltiplo de 2, e a representação binária de cada estado é, deste modo, ineficiente. Por exemplo, se o número de estados possíveis é 5, então teremos 3 bits para representá-lo com um número binário. Entretanto, se temos quatro faixas, cada uma com 5 estados, então temos 5x5x5x5=625 estados para uma subestrutura completa que pode ser representada por 10 bits (ao invés de 4x3=12 bits) . Isso corresponde a 2,5 bits por faixa, ao invés de 3 e, assim obtemos uma economia de 0,5 bits por faixa ou equivalentemente, 2 bits por subestrutura (20% do consumo total de bits). Portanto, é importante combinar os estados de cada faixa com um estado combinado, uma vez que através deste a ineficiência da representação binária pode ser reduzida. Observe que a mesma abordagem poderia ser usada com quaisquer números que são transmitidos. Por exemplo, desde que cada subestrutura pode ter um estado representando as posições dos pulsos, e cada estrutura pode, por exemplo, ter quatro subestruturas, estes estados poderiam ser combinados com um número de estado combinado.
Devido a uma subestrutura ter, por exemplo, 4 faixas, o consumo de bits pode ser reduzido para melhorar a eficiência pela codificação combinada dos estados de cada faixa. Por exemplo, dado que cada faixa tem pulsos e cada faixa é de dimensão N, ou seja, tem N posições de faixa, então o estado de 10 cada faixa é o intervalo de 0 a f(pk,N)-\ . Os estados de cada faixa sjç pode, então ser combinado com o estado combinado s da subestrutura com a fórmula (assumindo que temos 4 faixas por subestrutura). Fórmula 2:
Os estados de cada faixa podem, então, ser determinados no decodificador dividindo o estado de junção por f(pk,N) , onde o restante é o estado da última faixa e a parte com o número inteiro é o estado de junção das faixas restantes. Se 20 o número de faixas for outro que não seja 4, nós podemos adicionar imediatamente ou reduzir o número de termos na equação acima apropriadamente.
Observe que quando o número de pulsos por faixa for grande, então, o número de possiveis estados se torna maior.
Por exemplo, com 6 pulsos por faixa com quatro faixas e um comprimento da faixa N=16, então, o estado é um número 83-bit, que excede o comprimento máximo de números binários nas CPU' s regulares. Segue que algumas etapas extras têm que ser feitas para avaliar a fórmula acima usando métodos padrão com números inteiros muito longos.
Observe também que esta abordagem é igual à codificação aritmética dos estados da faixa, quando as probabilidades do estado são assumidas como iguais.
Acima, uma abordagem passo a passo foi apresentada para codificar e decodificar a informação dos pulsos de uma faixa, por exemplo, as posições, e possivelmente sinais, de pulsos de uma faixa. Outras aplicações fornecem outra abordagem, que será referida como a abordagem "dividir para conquistar [split-and-conquer]".
Um codificador de informação de pulso sendo configurado para aplicar a abordagem dividir para conquistar divide uma faixa em duas divisões da faixa Xx e x2, que poderiam ser consideradas como dois vetores, em que x = [x2 x2] . A ideia básica é codificar ambos os vetores x2 e x2 separadamente, e, então, combinar os dois com a fórmula: Fórmula 3:
Na equação acima, deve ser observado que s(x,) e s(x2) são os estados dos vetores x2 e -x2, quando o número de pulsos já é conhecido, ou seja, quando os vetores têm, respectivamente, Pi e P2 =P~Pi pulsos. Para considerar todos os estados que têm 0 a p2-l pulsos no vetor x2, nós temos que adicionar o termo soma na equação acima.
O algoritmo/fórmula acima pode ser aplicado para codificar os pulsos das faixas entrelaçadas aplicando as duas seguintes etapas de pré-processamento. Primeiramente, deixe os vetores xfalxa k consistir em todas as amostras na faixa k e combine estes vetores definindo x= [xfalxa lr xfalxa 2, xfalxa 3r xfalxa 4] . Observe que isso é meramente uma reorganização das amostras de modo que todas as amostras da faixa 1 sejam colocadas no primeiro grupo e assim por diante.
Depois, observe que o número de pulsos por faixa é geralmente um número fixo. Segue-se que se a faixa 1 sempre tiver p2 pulsos, então, o número de estados na faixa 1 é f(k, N}) = Opara todos os valores k Φ px . Essa é apenas outra forma de fizer que não há estados para a faixa 1 que não tem p2 pulsos. Formalmente, nós, então, definimos a fórmula número-de-estados como: número de Fórmula 4:
Para uma faixa completa xfalxa k com pk pulsos, o estados é (N=Nfaixa k) Pela reorganização de amostras e utilizando a acima para o número de estados (Fórmula 4), nós podemos calcular o estado de junção de todas as faixas pela Fórmula 3.
Observe que visto que o número de estados contém a maior parte de zeros, a soma na Fórmula 3 é zero, quando combina o estado das faixas. Assim, combinando as duas faixas é idêntico à Fórmula 2. Semelhantemente, podemos mostrar que a combinação das quatro faixas (ou cinco) também fornece resultados idênticos com ambas as abordagens.
De acordo com uma aplicação, a reorganização pode ser utilizada como uma etapa de pré-processamento ao codificador. Em outra aplicação, a reorganização pode ser integrada à codificação. Semelhantemente, de acordo com uma aplicação, reorganização pode ser usada como uma etapa de pós-processamento à decodificação. Em outra aplicação, a reorganização pode ser integrada ao decodificador.
Se o número de pulsos em uma faixa não for fixo, podemos modificar a fórmula do número de estados apropriadamente, e ainda usar o mesmo algoritmo de codificação.
Observe que a abordagem apresentada na seção "Combinando os dados da faixa" e o método acima fornecem resultados iguais se a ordem de combinação de faixas é apropriadamente escolhida. Assim, ainda as abordagens passo a passo e redução de problemas fornecem resultados iguais. Podemos então independentemente escolher qual abordagem usar no decodificador e codificador, de acordo com o qual é mais prático para implementar ou qual abordagem melhor encaixa as restrições computacionais da plataforma.
De acordo com uma aplicação, um codificador de algoritmo da informação de pulso é fornecido, que pode ser descrito em pseudocódigo por
Estado da função = codificar(x) 1. se o comprimento de x for 1 a. se x não tiver pulsos i. estado = 0 ii . retornar b. outro (x tem, pelo menos, um pulso) i . se o pulso(s) em x for positivo estado = 0 retornar ii . outro (pulso(s) em x for negativo) estado = 1 retornar iii .. fim 2. outro (ou seja, quando o comprimento de x for > 1) o dividir x em dois vetores xl e x2 de comprimento N1 e N2 respectivamente b. determinar o estado do vetor xl por sl = codificar (xl) c. determinar o estado do vetor x2 por s2 = codificar (x2) d. deixar p ser o número de pulsos em x e pl o número de pulsos em xl e. estabelecer nO = 0 f. para k de 0 a pl-1 i. definir n0 := n0 + f(k,NI)*f (p-k,N2) g. fim h. calcular estado como s:= sl + f(pl,Nl)*s2 + n0 3. fim Empregar tal algoritmo de codificação, de acordo com uma aplicação, o codificador de informação de pulso é configurado para dividir uma das faixas em uma primeira divisão da faixa e em uma segunda divisão da faixa. O codificador de informação de pulso é configurado para codificar um primeiro número de subestado associado com a primeira divisão. Além disso, o codificador de informação de pulso é configurado para codificar um segundo número de subestado associado com a segunda divisão. Além disso, o codificador de informação de pulso é configurado para combinar o primeiro número de subestado e o segundo número de subestado para obter o número de estado. Semelhantemente, de acordo com uma aplicação, o decodificador do algoritmo da informação de pulso pode ser descrito em pseudocódigo por: função x = decodificar(s, p, N) 1. se o número de pulsos p for 0 a. retornar vetor x completo de zeros 2. outro a. se o comp. for 1 i. se s == 0 1. Vetor x tem pulsos positivos p em sua primeira posição ii. outro 1. Vetor x tem pulsos negativos p em sua primeira posição iii. fim b. Outro i. Escolher os comprimentos da divisão NI e N2 ii. Set n0: = 0 e pl: = 0 iii. Enquanto n0 + f(pl,NI)*f (p-pl) < s 1. definir pl:= pl + 1 2. definir n0:= n0 + f(pl,Nl)*f(p-pl) iv. fim v. definir s: = s - n0 e p2 := p - pl vi. definir sl:= s / f(pl,Nl) e o restante em s2 vii. decodificar a primeira divisão xl = decodificar(s1, pl, Nl) viii. decodificar a segunda divisão x2 = decodificar(s2, p2, N2) ix. combinar as divisões xl e x2 em x c. fim 3. fim
Em uma aplicação que realiza a abordagem dividir para conquistar, o decodificador de informação de pulso é configurado para gerar a primeiro número de subestado e um segundo número de subestado com base no número de estado. O decodificador de informação de pulso é configurado para decodificar um primeiro grupo de posições de pulso de uma primeira divisão de uma das faixas com base no primeiro número de subestado. Além disso, o decodificador de informação de pulso é configurado para decodificar um segundo grupo de posições de pulso de uma segunda divisão de uma das faixas com base no segundo número de subestado.
Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos representam também uma descrição do método correspondente, onde um bloco ou um dispositivo corresponde a uma etapa do método ou de uma caracteristica de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou caracteristica de um aparelho correspondente.
Dependendo dos requisitos de certas implementações, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio digital de armazenamento, por exemplo, um Disquete, um DVD, um CD, uma memória ROM, PROM, EPROM, EEPROM ou uma memória FLASH, possuindo sinais de controle eletronicamente legiveis nela armazenados, que cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado.
Algumas aplicações de acordo com a invenção compreendem um suporte de dados não transitório com sinais de controle legiveis eletronicamente, os quais são capazes de cooperar com um sistema de computador programável, de tal forma que um dos métodos aqui descritos seja realizado.
De forma geral, as aplicações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para a realização de um dos métodos quando o produto de programa de computador operar em um computador. O código de programa pode, por exemplo, ser armazenado em um suporte mecanicamente legivel.
Outras aplicações incluem o programa de computador para executar um dos métodos aqui descritos, armazenado em um suporte mecanicamente legível ou em um meio de armazenamento não transitório.
Em outras palavras, uma aplicação do método da invenção é, portanto, um programa de computador com um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador for executado em um computador.
Uma aplicação adicional do método da invenção é, portanto, um suporte de dados (ou um meio de armazenamento digital ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para a realização de um dos métodos aqui descritos.
Uma aplicação adicional do método da invenção é, portanto, um fluxo de dados ou de uma sequência de sinais que representam o programa de computador para a realização de um dos métodos aqui descritos. 0 fluxo de dados ou a sequência de sinais podem, por exemplo, ser configurados para serem transferidos através de uma conexão para comunicação de dados, por exemplo, através da Internet.
Uma aplicação adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado para ou adaptado para executar um dos métodos aqui descritos.
Uma aplicação adicional compreende um computador, tendo instalado nele o programa de computador para a execução de um dos métodos aqui descritos.
Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de portas programáveis em campo) pode ser utilizado para executar uma parte ou todas as funcionalidades dos métodos aqui descritos. Em algumas aplicações, um arranjo de portas programáveis em campo pode cooperar com um microprocessador de modo a executar um dos métodos aqui descritos. De forma geral, os métodos são de preferência realizados por 5 qualquer aparelho de hardware.
As aplicações acima descritas são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações dos arranjos e detalhes aqui descritos serão evidentes para outros especialistas na técnica. É 10 intenção, portanto, ser limitada apenas pelo escopo das reivindicações de patente pendente e não pelos detalhes específicos apresentados a titulo de descrição e explicação das aplicações da presente invenção.
Claims (13)
1. Aparelho para decodificar um sinal de áudio codificado, caracterizado por uma ou mais trilhas são associadas ao sinal de áudio codificado, cada uma das trilhas compreendendo uma pluralidade de posições da trilha e uma pluralidade de pulsos, em que o aparelho compreende: um decodificador de informações de pulso para decodificar uma pluralidade de posições de pulso, em que cada uma das posições de pulso é uma das posições da faixa, em que um dos pulsos está localizado e em que o decodificador de informações de pulso está configurado para decodificar a pluralidade de posições de pulso por usando apenas um número de posição da faixa, um número total de pulsos e um número de estado, em que o número da posição da faixa indica um número total de posições da faixa de pelo menos uma das faixas e em que o número total de pulsos indica um número total de pulsos de pelo menos uma das faixas; e um decodificador de sinal para decodificar o sinal de áudio codificado, gerando um sinal de áudio sintetizado usando a pluralidade de posições de pulso e uma pluralidade de coeficientes preditivos de filtro sendo associados ao sinal de áudio codificado, em que pelo menos um do decodificador de informações de pulso e o decodificador de sinal compreende uma implementação de hardware, em que o decodificador de informações de pulso é ainda adaptado para decodificar uma pluralidade de sinais de pulso usando apenas o número da posição da faixa, o número total de pulsos e o número do estado, em que cada um dos sinais de pulsos indica um sinal de uma dentre a pluralidade de pulsos, e em que o decodificador de sinal é adaptado para decodificar o sinal de áudio codificado, gerando um sinal de áudio sintetizado, além disso, usando a pluralidade de sinais de pulso.
2. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que pelo menos uma última faixa e uma ou mais outras faixas estão associadas ao sinal de áudio codificado, e em que o decodificador de informações de pulso é adaptado para gerar um primeiro número de substrato e um segundo número de substrato a partir do número de estado, em que o decodificador de informações de pulso está configurado para decodificar um primeiro grupo das posições de pulso com base no primeiro número de substrato, e em que o decodificador de informações de pulso está configurado para decodificar um segundo grupo de posições de pulso com base no segundo número de substrato, em que o segundo grupo das posições de pulso compreende apenas posições de pulso indicando as posições da faixa da última faixa, e em que o primeiro grupo das posições de pulso compreende apenas posições de pulso indicando as posições da faixa de uma ou mais outras faixas.
3. Aparelho, de acordo com a reivindicação 2, caracterizado pelo fato de que o decodificador de informações de pulso é configurado para gerar o primeiro número de substrato e o segundo número de substrato dividindo o número de estado por f (pk, N) para adquirir uma parte inteira e o restante como uma divisão resultado, em que a parte inteira é o primeiro número de substrato e em que o restante é o segundo número de substrato, em que pk indica para cada um dos um ou mais rastreia o número de pulsos e em que N indica para cada um dos um ou mais rastreia o número de posições da faixa.
4. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o decodificador de informações de pulso é adaptado para realizar um teste comparando o número do estado ou um número de estado atualizado com um valor limite.
5. Aparelho, de acordo com a reivindicação 4, caracterizado pelo fato de que o decodificador de informações de pulso é adaptado para realizar o teste comparando se o número de estado ou um número de estado atualizado é maior que, maior que ou igual a, menor que ou menor que ou igual a ao valor limite, e em que o decodificador de informações de pulso é adaptado para atualizar o número do estado ou um número de estado atualizado, dependendo do resultado do teste.
6. Aparelho, de acordo com a reivindicação 5, caracterizado pelo fato de que o decodificador de informações de pulso é configurado para comparar o número de estado ou o número de estado atualizado com o valor limite para cada posição da trilha de uma dentre a pluralidade de trilhas.
7. Aparelho, de acordo com a reivindicação 1, caracterizado por o decodificador de informações de pulso é configurado para dividir uma das faixas em uma primeira partição de faixa, compreendendo pelo menos duas posições de faixa da pluralidade de posições de faixa e em uma segunda partição de faixa compreendendo pelo menos duas outras posições de faixa da pluralidade de posições de faixa , em que o decodificador de informações de pulso está configurado para gerar um primeiro número de substrato e um segundo número de substrato com base no número do estado, em que o decodificador de informações de pulso está configurado para decodificar um primeiro grupo de posições de pulso associadas à primeira partição de faixa com base no primeiro número de substrato, e em que o decodificador de informações de pulso está configurado para decodificar um segundo grupo de posições de pulso associadas à segunda partição de faixa com base no segundo número de substrato.
8. Aparelho para codificação de um sinal de áudio, caracterizado pelo fato de que compreende: um processador de sinal para determinar uma pluralidade de coeficientes preditivos de filtro associados ao sinal de áudio, para gerar um sinal residual com base no sinal de áudio e com base na pluralidade de coeficientes preditivos de filtro; e um codificador de informações de pulso para codificar uma pluralidade de posições de pulso relacionadas a uma ou mais faixas, para codificar o sinal de áudio, as uma ou mais faixas sendo associadas ao sinal residual, cada uma das faixas compreendendo uma pluralidade de posições de faixa e uma pluralidade de pulsos, em que cada uma das posições de pulso é uma das posições da faixa, em que um dos pulsos está localizado, em que o codificador de informações de pulso é configurado para codificar a pluralidade de posições de pulso, gerando um número de estado, de modo que as posições de pulso são decodificáveis apenas com base no número do estado, um número de posição da trilha e um número total de pulsos, em que o número da posição da trilha indica um número total de posições da trilha de pelo menos uma das trilhas e em que o número total de pulsos indica um total número de pulsos de pelo menos uma das faixas, em que pelo menos um do processador de sinal e o codificador de informações de pulso compreende uma implementação de hardware, em que o codificador de informações de pulso está configurado para determinar o número do estado, dependendo de uma soma intermediária, em que, para cada pulso em uma posição de faixa para cada posição de faixa de uma das faixas, o codificador de informações de pulso é configurado para adicionar um valor inteiro à soma intermediária, para atualizar a soma intermediária.
9. Aparelho para codificação, de acordo com a reivindicação 8, caracterizado pelo fato de que o codificador de informações de pulso é adaptado para codificar uma pluralidade de sinais de pulso, em que cada um dos sinais de pulso indica um sinal de um dentre a pluralidade de pulsos, em que o codificador de informações de pulso é configurado para codificar a pluralidade de sinais de pulso, gerando o número do estado, de modo que os sinais de pulso possam ser decodificados apenas com base no número do estado, o número da posição da faixa indicando um número total de posições da faixa de pelo menos uma das faixas, e o número total de pulsos.
10. Aparelho, de acordo com a reivindicação 8, caracterizado pelo fato de que o codificador de informações de pulso é configurado para adicionar o valor inteiro ao número intermediário de cada pulso em uma posição de faixa para cada posição de faixa de uma das faixas, para adquirir o número de estado, em que o valor inteiro é definido por f (p, k - 1), em que p indica um número de pulsos encontrados, em que k indica uma posição da faixa e em que f (p, N) indica o número de configurações possíveis para uma faixa que compreende N faixa posições ep pulsos assinados.
11. Aparelho, de acordo com a reivindicação 8, caracterizado por o codificador de informações de pulso é configurado para dividir uma das faixas em uma primeira partição de faixa, compreendendo pelo menos duas posições de faixa da pluralidade de posições de faixa e em uma segunda partição de faixa, compreendendo pelo menos duas outras posições de faixa da pluralidade de rastrear posições, em que o codificador de informações de pulso está configurado para codificar um primeiro número de substrato associado à primeira partição, em que o codificador de informações de pulso está configurado para codificar um segundo número de substrato associado à segunda partição, e em que o codificador de informações de pulso está configurado para combinar o primeiro número de substrato e o segundo número de substrato para adquirir o número de estado.
12. Método para decodificar um sinal de áudio codificado, caracterizado por uma ou mais trilhas são associadas ao sinal de áudio codificado, cada uma das trilhas compreendendo uma pluralidade de posições da trilha e uma pluralidade de pulsos, em que o método compreende: decodificar uma pluralidade de posições de pulso, em que cada uma das posições de pulso é uma das posições da faixa, onde um dos pulsos está localizado, e em que a pluralidade de posições de pulso é decodificada usando apenas um número de posição da faixa, um número total de pulsos e um número de estado, em que o número da posição da faixa indica um número total de posições da faixa de pelo menos uma das faixas e em que o número total de pulsos indica um número total dos pulsos de pelo menos uma das faixas, decodificar uma pluralidade de sinais de pulso usando apenas o número da posição da faixa, o número total de pulsos e o número do estado, em que cada um dos sinais de pulsos indica um sinal de um dentre a pluralidade de pulsos, e decodificar o sinal de áudio codificado gerando um sinal de áudio sintetizado usando apenas a pluralidade de posições de pulso e uma pluralidade de coeficientes preditivos de filtro associados ao sinal de áudio codificado, em que a decodificação do sinal de áudio codificado é conduzida gerando um sinal de áudio sintetizado, além disso, usando a pluralidade de sinais de pulso.
13. Método para codificação de um sinal de áudio, caracterizado pelo fato de que compreende: determinar uma pluralidade de coeficientes preditivos de filtro associados ao sinal de áudio, para gerar um sinal residual com base no sinal de áudio e com base na pluralidade de coeficientes preditivos de filtro; e codificar uma pluralidade de posições de pulso relacionadas a uma ou mais faixas, para codificar o sinal de áudio, sendo uma ou mais faixas associadas ao sinal residual, cada uma das faixas compreendendo uma pluralidade de posições de faixa e uma pluralidade de pulsos, em que cada uma das posições de pulso é uma das posições da faixa, em que um dos pulsos está localizado, em que a pluralidade de posições de pulso é codificada pela geração de um número de estado, de modo que as posições de pulso possam ser decodificadas apenas com base no número de estado, um número da posição da faixa e um número total de pulsos, em que o número da posição da faixa indica um número total de posições da faixa de pelo menos uma das faixas e em que o número total de pulsos indica um número total dos pulsos de pelo menos um dos trilhas, em que determinar o número do estado dependendo de uma soma intermediária, em que, para cada pulso em uma posição de trilha para cada posição de trilha de uma das trilhas, um valor inteiro é adicionado à soma intermediária, para atualizar a soma intermediária.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052294 WO2012110416A1 (en) | 2011-02-14 | 2012-02-10 | Encoding and decoding of pulse positions of tracks of an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112013020700A2 BR112013020700A2 (pt) | 2018-07-10 |
BR112013020700B1 true BR112013020700B1 (pt) | 2021-07-13 |
Family
ID=71943601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112013020700-0A BR112013020700B1 (pt) | 2011-02-14 | 2012-02-10 | Codificação e decodificação de posições de pulso de faixas de um sinal de áudio |
Country Status (19)
Country | Link |
---|---|
US (1) | US9595263B2 (pt) |
EP (3) | EP3471092B1 (pt) |
JP (1) | JP5800915B2 (pt) |
KR (1) | KR101643450B1 (pt) |
CN (1) | CN103460284B (pt) |
AR (1) | AR085361A1 (pt) |
AU (1) | AU2012217184B2 (pt) |
BR (1) | BR112013020700B1 (pt) |
CA (1) | CA2827156C (pt) |
ES (2) | ES2639646T3 (pt) |
HK (1) | HK1245987B (pt) |
MX (1) | MX2013009345A (pt) |
PL (3) | PL3239978T3 (pt) |
PT (2) | PT2676267T (pt) |
RU (1) | RU2586597C2 (pt) |
SG (1) | SG192747A1 (pt) |
TR (1) | TR201903388T4 (pt) |
WO (1) | WO2012110416A1 (pt) |
ZA (1) | ZA201306841B (pt) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
CN114127843B (zh) | 2019-07-02 | 2023-08-11 | 杜比国际公司 | 用于离散指向性数据的表示、编码和解码的方法、设备和系统 |
US11088784B1 (en) | 2020-12-24 | 2021-08-10 | Aira Technologies, Inc. | Systems and methods for utilizing dynamic codes with neural networks |
US11483109B2 (en) | 2020-12-28 | 2022-10-25 | Aira Technologies, Inc. | Systems and methods for multi-device communication |
US11575469B2 (en) | 2020-12-28 | 2023-02-07 | Aira Technologies, Inc. | Multi-bit feedback protocol systems and methods |
US11368250B1 (en) | 2020-12-28 | 2022-06-21 | Aira Technologies, Inc. | Adaptive payload extraction and retransmission in wireless data communications with error aggregations |
US11489624B2 (en) | 2021-03-09 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets using lookup tables |
US11489623B2 (en) | 2021-03-15 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets |
US11496242B2 (en) | 2021-03-15 | 2022-11-08 | Aira Technologies, Inc. | Fast cyclic redundancy check: utilizing linearity of cyclic redundancy check for accelerating correction of corrupted network packets |
Family Cites Families (217)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9206143A (pt) | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) * | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
SE506379C3 (sv) * | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
DE69926821T2 (de) | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
WO2000075919A1 (en) | 1999-06-07 | 2000-12-14 | Ericsson, Inc. | Methods and apparatus for generating comfort noise using parametric noise model statistics |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) * | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ATE341074T1 (de) | 2000-02-29 | 2006-10-15 | Qualcomm Inc | Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) * | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20050130321A1 (en) | 2001-04-23 | 2005-06-16 | Nicholson Jeremy K. | Methods for analysis of spectral data and their applications |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7302387B2 (en) * | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
WO2004034379A2 (en) | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100465316B1 (ko) * | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) * | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
AU2003208517A1 (en) | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
ATE486348T1 (de) | 2003-06-30 | 2010-11-15 | Koninkl Philips Electronics Nv | Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US6987591B2 (en) | 2003-07-17 | 2006-01-17 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada | Volume hologram |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
EP1711938A1 (en) | 2004-01-28 | 2006-10-18 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
EP2770694A1 (en) | 2004-02-12 | 2014-08-27 | Core Wireless Licensing S.a.r.l. | Classified media quality of experience |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
WO2005086138A1 (ja) | 2004-03-05 | 2005-09-15 | Matsushita Electric Industrial Co., Ltd. | エラー隠蔽装置およびエラー隠蔽方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
EP1747554B1 (en) | 2004-05-17 | 2010-02-10 | Nokia Corporation | Audio encoding with different coding frame lengths |
JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
JP5420175B2 (ja) | 2005-01-31 | 2014-02-19 | スカイプ | 通信システムにおける隠蔽フレームの生成方法 |
CN100593197C (zh) | 2005-02-02 | 2010-03-03 | 富士通株式会社 | 信号处理方法和装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
AU2006232361B2 (en) | 2005-04-01 | 2010-12-23 | Qualcomm Incorporated | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
JP2008546341A (ja) | 2005-06-18 | 2008-12-18 | ノキア コーポレイション | 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法 |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
WO2008007700A1 (fr) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102592303B (zh) | 2006-07-24 | 2015-03-11 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
DE602007004502D1 (de) | 2006-08-15 | 2010-03-11 | Broadcom Corp | Neuphasierung des status eines dekodiergerätes nach einem paketverlust |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
EP3288027B1 (en) | 2006-10-25 | 2021-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
BRPI0718738B1 (pt) | 2006-12-12 | 2023-05-16 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
SG179433A1 (en) | 2007-03-02 | 2012-04-27 | Panasonic Corp | Encoding device and encoding method |
JP5596341B2 (ja) | 2007-03-02 | 2014-09-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声符号化装置および音声符号化方法 |
DE102007063635A1 (de) | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) * | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
ES2529292T3 (es) * | 2007-04-29 | 2015-02-18 | Huawei Technologies Co., Ltd. | Método de codificación y de decodificación |
PL2165328T3 (pl) | 2007-06-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
ES2658942T3 (es) | 2007-08-27 | 2018-03-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
EP2250641B1 (en) | 2008-03-04 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for mixing a plurality of input data streams |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
RU2515704C2 (ru) | 2008-07-11 | 2014-05-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала |
AU2009267518B2 (en) | 2008-07-11 | 2012-08-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
CN102150201B (zh) * | 2008-07-11 | 2013-04-17 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
JP5555707B2 (ja) | 2008-10-08 | 2014-07-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチ分解能切替型のオーディオ符号化及び復号化スキーム |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
EP3598446B1 (en) | 2009-01-16 | 2021-12-22 | Dolby International AB | Cross product enhanced harmonic transposition |
TWI459375B (zh) | 2009-01-28 | 2014-11-01 | Fraunhofer Ges Forschung | 音訊編碼器、音訊解碼器、包含經編碼音訊資訊之數位儲存媒體、用以將音訊信號編碼及解碼之方法及電腦程式 |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
KR101441474B1 (ko) | 2009-02-16 | 2014-09-17 | 한국전자통신연구원 | 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
RU2557455C2 (ru) | 2009-06-23 | 2015-07-20 | Войсэйдж Корпорейшн | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
PL2491555T3 (pl) | 2009-10-20 | 2014-08-29 | Fraunhofer Ges Forschung | Wielotrybowy kodek audio |
RU2591011C2 (ru) | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) |
BR112012009032B1 (pt) | 2009-10-20 | 2021-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8793126B2 (en) | 2010-04-14 | 2014-07-29 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
FR2963254B1 (fr) | 2010-07-27 | 2012-08-24 | Maurice Guerin | Dispositif et procede pour laver des surfaces internes d?une enceinte |
SG192745A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
WO2013075753A1 (en) | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-10 ES ES12703123.5T patent/ES2639646T3/es active Active
- 2012-02-10 PL PL17171964T patent/PL3239978T3/pl unknown
- 2012-02-10 CN CN201280016442.4A patent/CN103460284B/zh active Active
- 2012-02-10 CA CA2827156A patent/CA2827156C/en active Active
- 2012-02-10 RU RU2013142068/08A patent/RU2586597C2/ru active
- 2012-02-10 WO PCT/EP2012/052294 patent/WO2012110416A1/en active Application Filing
- 2012-02-10 KR KR1020137024213A patent/KR101643450B1/ko active IP Right Grant
- 2012-02-10 AR ARP120100443A patent/AR085361A1/es active IP Right Grant
- 2012-02-10 AU AU2012217184A patent/AU2012217184B2/en active Active
- 2012-02-10 PT PT127031235T patent/PT2676267T/pt unknown
- 2012-02-10 EP EP18209670.1A patent/EP3471092B1/en active Active
- 2012-02-10 TR TR2019/03388T patent/TR201903388T4/tr unknown
- 2012-02-10 PL PL12703123T patent/PL2676267T3/pl unknown
- 2012-02-10 ES ES17171964T patent/ES2715191T3/es active Active
- 2012-02-10 SG SG2013061379A patent/SG192747A1/en unknown
- 2012-02-10 BR BR112013020700-0A patent/BR112013020700B1/pt active IP Right Grant
- 2012-02-10 JP JP2013553882A patent/JP5800915B2/ja active Active
- 2012-02-10 EP EP17171964.4A patent/EP3239978B1/en active Active
- 2012-02-10 PT PT17171964T patent/PT3239978T/pt unknown
- 2012-02-10 PL PL18209670T patent/PL3471092T3/pl unknown
- 2012-02-10 EP EP12703123.5A patent/EP2676267B1/en active Active
- 2012-02-10 MX MX2013009345A patent/MX2013009345A/es active IP Right Grant
-
2013
- 2013-08-14 US US13/966,635 patent/US9595263B2/en active Active
- 2013-09-11 ZA ZA2013/06841A patent/ZA201306841B/en unknown
-
2018
- 2018-04-24 HK HK18105291.5A patent/HK1245987B/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112013020700B1 (pt) | Codificação e decodificação de posições de pulso de faixas de um sinal de áudio | |
TWI488176B (zh) | 音訊信號音軌脈衝位置之編碼與解碼技術 | |
CN105453173B (zh) | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 | |
ES2401171T3 (es) | Procedimiento, aparato y producto de programa de ordenador para reconstruir una trama de voz borrada | |
PT1719116E (pt) | A comutação de acelp para o modo de codificação tcx | |
ES2704901T3 (es) | Corrección de pérdida de trama por inyección de ruido ponderado | |
ES2821432T3 (es) | Cuantificación de audio mediante indexación de vectores de complejidad reducida | |
MX2011003815A (es) | Decodificador de audio, codificador de audio, metodo para decodificar una señal de audio, metodo para codificar una señal de audio, programa de computadora y señal de audio. | |
US20220108681A1 (en) | Deep neural network based non-autoregressive speech synthesizer method and system using multiple decoder | |
KR20150099770A (ko) | 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측 | |
BR112014032735B1 (pt) | Codificador e decodificador de áudio com base em predição linear e respectivos métodos para codificar e decodificar | |
JP2019091075A (ja) | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム | |
ES2821725T3 (es) | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio | |
US6785646B2 (en) | Method and system for performing a codebook search used in waveform coding | |
US7031407B1 (en) | Apparatus and method for decoding and trace back of convolution codes using the viterbi decoding algorithm | |
ES2627410T3 (es) | Aparato para codificar una señal de voz/sonido | |
WO2023198862A1 (en) | Time-domain gain modeling in the qmf domain | |
US20210279037A1 (en) | Temporal computing | |
JP2019124951A (ja) | 快適雑音生成モード選択のための装置および方法 | |
JP4191502B2 (ja) | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム | |
Mohammadi | Combined scalar-vector quantization: a new spectral coding method for low rate speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B06A | Notification to applicant to reply to the report for non-patentability or inadequacy of the application [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 10/02/2012, OBSERVADAS AS CONDICOES LEGAIS. |