BR122021019877B1 - Aparelho para gerar um sinal estendido de largura de banda - Google Patents

Aparelho para gerar um sinal estendido de largura de banda Download PDF

Info

Publication number
BR122021019877B1
BR122021019877B1 BR122021019877-2A BR122021019877A BR122021019877B1 BR 122021019877 B1 BR122021019877 B1 BR 122021019877B1 BR 122021019877 A BR122021019877 A BR 122021019877A BR 122021019877 B1 BR122021019877 B1 BR 122021019877B1
Authority
BR
Brazil
Prior art keywords
unit
encoding
signal
high frequency
mode
Prior art date
Application number
BR122021019877-2A
Other languages
English (en)
Inventor
Ki-hyun Choo
Original Assignee
Samsung Electronics Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co., Ltd filed Critical Samsung Electronics Co., Ltd
Publication of BR122021019877B1 publication Critical patent/BR122021019877B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Error Detection And Correction (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

Um aparelho para gerar um sinal estendido de largura de banda inclui uma unidade de processamento antidispersão para executar processamento antidispersão em um espectro de baixa frequência; e uma unidade de decodificação de extensão de frequência elevada de domínio de frequência para executar codificação de extensão de frequência elevada no domínio de frequência no espectro de baixa frequência no qual o processamento antidispersão é executado.

Description

CAMPO TÉCNICO
[0001] Aparelhos e métodos compatíveis com modalidades exemplares se referem à codificação e decodificação de áudio, e mais particularmente a um aparelho e a um método para gerar um sinal estendido de largura de banda, capaz de reduzir ruído semelhante a metal de um sinal estendido de largura de banda para uma banda de frequência elevada, um aparelho e um método para codificar um sinal de áudio, um aparelho e um método para decodificar um sinal de áudio e um terminal, que emprega o mesmo.
Técnica antecedente
[0002] Um sinal correspondendo a uma banda de frequência elevada é menos sensível a uma estrutura fina de frequências em comparação com um sinal correspondendo a uma banda de baixa frequência. Por conseguinte, para aumentar a eficiência de codificação para lidar com restrições de bits permissíveis quando um sinal de áudio é codificado, um sinal correspondendo a uma banda de baixa frequência é codificado por alocar um número relativamente grande de bits e um sinal correspondendo a uma banda de frequência elevada é codificado por alocar um número de bits relativamente pequeno.
[0003] O método descrito acima é utilizado em replicação de banda espectral (na sigla em inglês para spectral band replication, SBR). Em SBR, uma banda mais baixa de um espectro, por exemplo, uma banda de baixa frequência ou uma banda de núcleo, é codificada e uma banda superior, por exemplo, uma banda de frequência elevada, é codificada por utilizar parâmetros, por exemplo, um envelope. SBR utiliza correlações entre bandas inferior e superior de tal modo que características da banda inferior são extraída para prever a banda superior.
[0004] Em SBR, um método aperfeiçoado para gerar um sinal estendido de largura de anda para uma banda de frequência elevada é exigido.
Revelação Problema técnico
[0005] Aspectos de uma ou mais modalidades exemplares fornecem um aparelho e um método para gerar um sinal estendido de largura de banda, capaz de reduzir ruído semelhante a metal de um sinal estendido de largura de banda para uma banda de frequência elevada, um aparelho e um método para codificar um sinal de áudio, um aparelho e um método para decodificar um sinal de áudio e um terminal, que emprega o mesmo.
Solução técnica
[0006] De acordo com um aspecto de uma ou mais modalidades exemplares, é fornecido um método de gerar um sinal estendido de largura de banda, o método incluindo executar processamento antidispersão em um espectro de baixa frequência; e executar codificação de extensão de frequência elevada no domínio de frequência no espectro de baixa frequência no qual o processamento antidispersão é realizado.
[0007] De acordo com outro aspecto de uma ou mais modalidades exemplares, é fornecido um aparelho para gerar um sinal estendido de largura de banda, o aparelho incluindo uma unidade de processamento antidispersão para executar processamento antidispersão em um espectro de baixa frequência; e uma unidade de decodificação de extensão de frequência elevada de domínio de frequência para executar codificação de extensão de frequência elevada no domínio de frequência no espectro de baixa frequência no qual o processamento antidispersão é executado.
Efeitos vantajosos
[0008] Ruídos metálicos causados por ênfase de componentes de tom podem ser reduzidos por executar um processamento antidispersão em um sinal utilizado para extensão de uma banda de frequência elevada, que resulta na redução de furos de espectro gerados no sinal de extensão de frequência elevada.
Descrição de desenhos
[0009] A figura 1 mostra um diagrama de blocos de um aparelho de codificação de áudio de acordo com uma modalidade exemplar;
[00010] A figura 2 mostra um diagrama de blocos de um exemplo de uma unidade de codificação de domínio de frequência (FD) ilustrada na figura 1;
[00011] A figura 3 mostra um diagrama de blocos de outro exemplo da unidade de codificação FD ilustrada na figura 1;
[00012] A figura 4 mostra um diagrama de blocos de uma unidade de processamento antidispersão de acordo com uma modalidade exemplar;
[00013] A figura 5 mostra um diagrama de blocos de uma unidade de codificação de extensão de frequência elevada FD de acordo com uma modalidade exemplar;
[00014] As figuras 6A e 6B são gráficos que mostram uma região onde codificação de extensão é realizada por um módulo de codificação FD ilustrado na figura 1;
[00015] A figura 7 mostra um diagrama de blocos de um aparelho de codificação de áudio de acordo com outra modalidade exemplar;
[00016] A figura 8 mostra um diagrama de blocos de um aparelho de codificação de áudio de acordo com outra modalidade exemplar;
[00017] A figura 9 mostra um diagrama de blocos de um aparelho de decodificação de áudio de acordo com uma modalidade exemplar;
[00018] A figura 10 mostra um diagrama de blocos de um exemplo de uma unidade de decodificação FD ilustrada na figura 9;
[00019] A figura 11 mostra um diagrama de blocos de um exemplo de uma unidade de decodificação de extensão de frequência elevada FD ilustrada na figura 10;
[00020] A figura 12 mostra um diagrama de blocos de um aparelho de decodificação de áudio de acordo com outra modalidade exemplar;
[00021] A figura 13 mostra um diagrama de blocos de um aparelho de decodificação de áudio de acordo com outra modalidade exemplar;
[00022] A figura 14 mostra um diagrama para descrever um método de partilha de livro-código de acordo com uma modalidade exemplar; e
[00023] A figura 15 mostra um diagrama para descrever um método de sinalização de modo de codificação de acordo com uma modalidade exemplar.
Modo para invenção
[00024] Embora modalidades exemplares do presente conceito inventivo sejam suscetíveis a várias modificações e formas alternativas, modalidades específicas do mesmo são mostradas por meio de exemplo nos desenhos e serão descritas aqui em detalhe. Deve ser entendido, entretanto, que não há intenção de limitar modalidades exemplares às formas específicas reveladas, porém inversamente, modalidades exemplares devem cobrir todas as modificações, equivalentes, e alternativas que estejam compreendidas no espírito e escopo do conceito inventivo. Na descrição a seguir do presente conceito inventivo, uma descrição detalhada de funções e configurações conhecidas incorporadas aqui será omitida quando a mesma pode tornar a matéria do presente conceito inventivo confusa.
[00025] Será entendido que embora os termos primeiro, segundo, etc., possam ser utilizados aqui para descrever vários elementos, esses elementos não devem ser limitados por esses termos. Esses termos são somente utilizados para distinguir um elemento do outro.
[00026] A terminologia utilizada aqui é para fins de descrever modalidades específicas e não pretende limitar o conceito inventivo. Embora termos gerais sejam utilizados o máximo possível em consideração das funções do presente conceito inventivo seus significados podem variar de acordo com as intenções de uma pessoa com conhecimentos comuns na técnica, precedentes, ou surgimento de novas tecnologias. Além disso, em casos específicos, termos podem ser arbitrariamente selecionados pelo requerente e, nesse caso, seus significados serão descritos em detalhe na descrição detalhada do conceito inventivo. Por conseguinte, definições dos termos devem ser entendidos com base na descrição inteira do presente relatório descritivo.
[00027] Como utilizado aqui, as formas singulares “um”, “uma” e “o, a” são destinadas a incluir as formas plurais também, a menos que o contexto claramente indique de outro modo. Será entendido adicionalmente que os termos “compreende” e/ou “compreendendo”, quando utilizado nesse relatório descritivo, especificam a presença de características, números inteiros, etapas, operações, elementos e/ou componentes mencionados, porém não impede a presença ou adição de uma ou mais outras características, números inteiros, etapas, operações, elementos, componentes e/ou grupos dos mesmos.
[00028] A seguir, o presente conceito inventivo será descrito em detalhe por explicar modalidades do conceito inventivo com referência aos desenhos em anexo. Nos desenhos, numerais de referência similares indicam elementos similares e os tamanhos ou espessuras de elementos podem ser exageradas para clareza de explicação.
[00029] A figura 1 é um diagrama de blocos de um aparelho de codificação de áudio 100 de acordo com uma modalidade exemplar. O aparelho de codificação de áudio 100 ilustrado na figura 1 pode formar um dispositivo de multimídia e pode ser, porém não limitado a, um dispositivo de comunicação de voz como um telefone ou um telefone celular, um dispositivo de broadcasting ou de música como uma TV ou um tocador MP3, ou um dispositivo combinado do dispositivo de comunicação de voz e o dispositivo de broadcasting ou música. Além disso, o aparelho de codificação de áudio 100 pode ser utilizado como um conversor incluído em um dispositivo de cliente ou um servidor, ou disposto entre o dispositivo de cliente e o servidor.
[00030] O aparelho de codificação de áudio 100 ilustrado na figura 1 pode incluir uma unidade de determinação de modo de codificação 110, uma unidade de comutação 130, um módulo de codificação de predição linear excitado por código (na sigla em inglês para code excited linear prediction, CELP) 150 e um módulo de codificação de domínio de frequência (na sigla em inglês para frequency domain, FD) 170. O módulo de codificação CELP 150 pode incluir uma unidade de codificação CELP 151 e uma unidade de codificação de extensão de domínio de tempo (na sigla em inglês para time domain, TD) 153, e o módulo de codificação FD 170 pode incluir uma unidade de transformação 171 e uma unidade de decodificação FD 173. Os elementos acima podem ser integrados em pelo menos um módulo e podem ser implementados por pelo menos um processador (não mostrado).
[00031] Com referência à figura 1, a unidade de determinação de modo de codificação 110 pode determinar um modo de codificação de um sinal de entrada com referência a características de sinal. De acordo com as características de sinal, a unidade de determinação de modo de codificação 110 pode determinar se um quadro atual está em um modo de voz ou um modo de música, e pode também determinar se um modo de codificação eficiente para o quadro atual é um modo TD ou um modo FD. Nesse caso, as características de sinal podem ser obtidas utilizando, porém não são limitadas a, características de curta duração de um quadro ou características de longa duração de uma pluralidade de quadros. A unidade de determinação de modo de codificação 110 pode determinar um modo CELP se as características de sinal corresponderem a um modo de voz ou um modo TD, e pode determinar um modo FD se as características de sinal corresponderem a um modo de música ou um modo FD.
[00032] De acordo com uma modalidade, o sinal de entrada da unidade de determinação de modo de codificação 110 pode ser um sinal que é amostrado descendentemente por uma unidade de amostragem descendente (não mostrada). Por exemplo, o sinal de entrada pode ser um sinal tendo uma taxa de amostragem de 12.8 kHz ou 16 kHz, que é obtido por reamostragem ou amostragem descendente de um sinal tendo uma taxa de amostragem de 32 kHz ou 48 kHz. Aqui, um sinal tendo uma taxa de amostragem de 32 kHz é um sinal de banda super larga (na sigla em inglês para super wide band, SWB) e pode ser mencionado como um sinal de banda total (na sigla em inglês para full band, FB), e um sinal tendo uma taxa de amostragem de 16 kHz pode ser mencionado como um sinal de banda larga (na sigla em inglês para wide band, WB).
[00033] De acordo com outra modalidade, a unidade de determinação de modo de codificação 110 pode executar a operação de reamostragem ou amostragem descendente.
[00034] Como tal, a unidade de determinação de modo de codificação 110 pode determinar um modo de codificação do sinal reamostrado ou amostrado descendente.
[00035] Informações em relação ao modo de codificação determinado pela unidade de determinação de modo de codificação 110 podem ser fornecidas para a unidade de comutação 130 e podem ser incluídas em um fluxo de bits em unidades de quadros de modo a serem armazenadas ou transmitidas.
[00036] De acordo com as informações referentes ao modo de codificação, que são fornecidas a partir da unidade de determinação de modo de codificação 110, a unidade de comutação 130 pode fornecer o sinal de entrada para o módulo de codificação CELP 150 ou o módulo de codificação FD 170. Aqui, o sinal de entrada pode ser um sinal reamostrado ou amostrado descendente e pode ser um sinal de baixa frequência tendo uma taxa de amostragem de 12.8 kHz ou 16 kHz. Especificamente, a unidade de comutação 130 provê o sinal de entrada para o módulo de codificação CELP 150 se o modo de codificação for um modo CELP, e provê o sinal de entrada para o módulo de codificação FD 170 se o modo de codificação for um modo FD.
[00037] O módulo de codificação CELP 150 pode operar se o modo de codificação for um modo CELP, e a unidade de codificação CELP 151 pode executar codificação CELP no sinal de entrada. De acordo com uma modalidade, a unidade de codificação CELP 151 pode extrair um sinal de excitação a partir do sinal reamostrado ou amostrado descendente, e pode quantizar o sinal de excitação extraído em consideração de cada de um vetor de código adaptável filtrado (isto é, uma contribuição de livro-código adaptável) e um vetor de código fixo filtrado (isto é, uma contribuição de livro-código de inovação ou fixo) correspondendo a informações de passo. De acordo com outra modalidade, a unidade de codificação CELP 151 pode extrair coeficientes de predição linear (na sigla em inglês para linear prediction coefficients, LPCs), pode quantizar os LPCs extraídos, pode extrair um sinal de excitação por utilizar os LPCs quantizados, e pode quantizar o sinal de excitação extraído em consideração de cada de um vetor de código adaptável filtrado (isto é, uma contribuição de livro-código adaptável) e um vetor de código fixo filtrado (isto é, uma contribuição de livro-código de inovação ou fixa) correspondendo a informações de passo.
[00038] Enquanto isso, a unidade de codificação CELP 151 pode aplicar modos de codificação diferentes de acordo com as características de sinal. Os modos de codificação aplicados podem incluir, porém não são limitados a, um modo de codificação de voz, um modo de codificação sem voz, um modo de codificação transiente, e um modo de codificação genérico.
[00039] O sinal de excitação de baixa frequência obtido pela codificação da unidade de codificação CELP 151, isto é, informações CELP, pode ser fornecido à unidade de codificação de extensão TD 153 e pode ser incluído no fluxo de bits de modo a ser armazenado ou transmitido.
[00040] No módulo de codificação CELP 150, a unidade de codificação de extensão TD 153 pode executar codificação de extensão de frequência elevada por dobrar ou replicar o sinal de excitação de baixa frequência fornecido a partir da unidade de codificação CELP 151. Informações de extensão de frequência elevada obtidas pela codificação de extensão da unidade de codificação de extensão TD 153 podem ser incluídas no fluxo de bits de modo a serem armazenadas ou transmitidas. A unidade de codificação de extensão TD 153 quantiza LPCs correspondendo a uma banda de frequência elevada do sinal de entrada. Nesse caso, a unidade de codificação de extensão TD 153 pode extrair LPCs de uma banda de frequência elevada do sinal de entrada e pode quantizar os LPCs extraídos. Além disso, a unidade de codificação de extensão TD 153 pode gerar LPCs da banda de frequência elevada do sinal de entrada por utilizar o sinal de excitação de baixa frequência do sinal de entrada. Aqui, os LPCs da banda de frequência elevada podem ser utilizados para representar informações de envelope da banda de frequência elevada.
[00041] Enquanto isso, o módulo de codificação FD 170 pode operar se o modo de codificação for um modo FD, e a unidade de transformação 171 pode transformar o sinal reamostrado ou amostrado descendente a partir do domínio de tempo até o domínio de frequência. Nesse caso, a unidade de transformação 171 pode executar, porém não é limitado a, transformação de cosseno discreta modificada (na sigla em inglês para modified discrete cosine transformation, MDCT). No módulo de codificação FD 170, a unidade de codificação FD 173 pode executar codificação FD no espectro reamostrado ou amostrado descendente fornecido a partir da unidade de transformação 171. A codificação FD pode ser executada por utilizar, porém não é limitada a, um algoritmo aplicado ao Codec de áudio avançado (na sigla em inglês para advanced audio codec, AAC). Informações FD obtidas pela codificação de FD da unidade de codificação FD 173 podem ser incluídas no fluxo de bits de modo a serem armazenadas ou transmitidas. Enquanto isso, se modos de codificação de quadros vizinhos forem alterados de um modo CELP para um modo FD, dados de predição podem ser adicionalmente incluídos no fluxo de bits obtido devido à codificação FD da unidade de codificação FD 173. Especificamente, uma vez que se codificação baseada em um modo CELP for realizada em um N° quadro e codificação baseada em um modo FD for realizada em um quadro (N+1)°, o quadro (N+1)° não pode ser codificado utilizando somente um resultado da codificação baseada em um modo FD, dados de predição a serem mencionados em um processo de decodificação necessitam ser adicionalmente incluídos.
[00042] No aparelho de codificação de áudio 100 ilustrado na figura 1, dois tipos de um fluxo de bits podem ser gerados de acordo com o modo de codificação determinado pela unidade de determinação de modo de codificação 110. Aqui, o fluxo de bits pode incluir um cabeçalho e uma carga útil.
[00043] Especificamente, se o modo de codificação for um modo CELP, informações em relação ao modo de codificação podem ser incluídas no cabeçalho, e informações de CELP e informações de extensão TD podem ser incluídas na carga útil. Do mesmo modo, se o modo de codificação for um modo FD, informações em relação ao modo de codificação podem ser incluídas no cabeçalho, e informações de FD e dados de predição podem ser incluídos na carga útil. Aqui, as informações de FD podem incluir informações de extensão de frequência elevada FD.
[00044] Enquanto isso, para ser preparado para um caso quando um erro de quadro ocorre, um cabeçalho de cada fluxo de bits pode incluir ainda informações em relação a um modo de codificação de um quadro anterior. Por exemplo, se um modo de codificação de um quadro atual for determinado como um modo FD, o cabeçalho do fluxo de bits pode incluir ainda informações referentes a um modo de codificação de um quadro anterior.
[00045] O aparelho de codificação de áudio 100 ilustrado na figura 1 pode ser comutado para um modo CELP ou um modo FD de acordo com características de sinal e desse modo pode eficientemente executar codificação adaptável com relação às características de sinal. Enquanto isso, a estrutura de comutação ilustrada na figura 1 pode ser aplicada a um ambiente de taxa de bits elevada.
[00046] A figura 2 é um diagrama de blocos de um exemplo da unidade de codificação FD 173 ilustrada na figura 1.
[00047] Com referência à figura 2, uma unidade de codificação FD 200 pode incluir uma unidade de codificação de norma 210, uma unidade de codificação de pulso fatorial (na sigla em inglês para factorial pulse coding, FPC) 230, uma unidade de codificação de extensão de baixa frequência FD 240, uma unidade de geração de informação de ruído 250, uma unidade de processamento antidispersão 270, e uma unidade de codificação de extensão de frequência elevada FD 290.
[00048] A unidade de codificação de normal 210 estima ou calcula um valor de norma de cada banda de frequência, por exemplo, cada sub-banda, de um espectro de frequência fornecido a partir da unidade de transformação 171 ilustrada na figura 1, e quantiza o valor de norma estimado ou calculado. Aqui, o valor de norma pode se referir a uma média de energia calculada espectral em unidades de sub-bandas, e também podem ser mencionado como força. O valor de norma pode ser utilizado para normalizar o espectro de frequência em unidades de sub-bandas. Além disso, com relação a um número total de bits de acordo com uma taxa de bits alvo, a unidade de codificação de norma 210 pode calcular um valor de limite de máscara utilizando o valo de norma de cada sub-banda, e pode determinar o número de bits a serem alocados para executar codificação perceptual em cada sub-banda utilizando o valor de limite de máscara. Aqui, o número de bits pode ser determinado em unidades de um número inteiro ou um decimal. O valor de norma quantizado pela unidade de codificação de norma 210 pode ser fornecido à unidade de codificação FPC 230, e pode ser incluído em um fluxo de bits de modo a ser armazenado ou transmitido.
[00049] A unidade de codificação FPC 230 pode quantizar o espectro normalizado por utilizar o número de bits alocados a cada sub-banda, e pode executar codificação FPC em um resultado da quantização. Devido à codificação FPC, informações como a posição, amplitude, e sinal de um pulso podem ser representadas na forma de um fatorial em uma faixa do número de bits alocados. Informações FPC obtidas pela unidade de codificação FPC 230 podem ser incluídas no fluxo de bits de modo a serem armazenadas ou transmitidas.
[00050] A unidade de geração de informação de ruído 250 pode gerar informações de ruído, isto é, um nível de ruído, em unidades de sub-bandas de acordo com um resultado da codificação FPC. Especificamente, devido à falta de bits, o espectro de frequência codificado pela unidade de codificação FPC 230 pode ter uma parte não codificada, isto é, um furo, em unidades de sub-bandas. De acordo com uma modalidade, o nível de ruído pode ser gerado utilizando uma média de níveis de coeficientes espectrais não codificados. O nível de ruído gerado pela unidade de geração de informações de ruído 250 pode ser incluído no fluxo de bits de modo a ser armazenado ou transmitido. Além disso, o nível de ruído pode ser gerado em unidades de quadros.
[00051] A unidade de processamento antidispersão 270 determina a localização e a amplitude de ruído a ser adicionado a partir de um espectro de baixa frequência reconstruído. A unidade de processamento antidispersão 270 executa processamento antidispersão de acordo com a localização e a amplitude determinadas do ruído no espectro de frequência no qual enchimento de ruído foi realizado utilizando o nível de ruído, e provê o espectro resultante para a unidade de codificação de extensão de frequência elevada FD 290. De acordo com uma modalidade, o espectro de baixa frequência reconstruído pode se referir a um espectro obtido por estender uma banda de baixa frequência a partir de um resultado da decodificação de FPC, executar enchimento de ruído e então executar processamento antidispersão.
[00052] A unidade de codificação de extensão de frequência elevada FD 290 pode executar codificação de extensão de frequência elevada por utilizar o espectro de baixa frequência fornecido a partir da unidade de processamento antidispersão 270. Nesse caso, um espectro de frequência elevada original pode ser também fornecido à unidade de codificação de extensão de frequência elevada FD 290. De acordo com uma modalidade, a unidade de codificação de extensão de frequência elevada FD 290 pode obter um espectro de frequência elevada estendido por dobrar ou replicar o espectro de baixa frequência, e extrai energia em unidades de sub-bandas com relação ao espectro de frequência elevada original, ajusta a energia extraída e quantiza a energia ajustada.
[00053] De acordo com uma modalidade, energia pode ser ajustada para corresponder a uma razão entre uma primeira tonalidade calculada em unidades de sub-bandas com relação a um espectro de frequência elevada original, e uma segunda tonalidade calculada em unidades de sub-bandas com relação a um sinal de excitação de frequência elevada estendido a partir do espectro de baixa frequência. Alternativamente, de acordo com outra modalidade, energia pode ser ajustada para corresponder a uma razão entre um primeiro fator de ruído calculado utilizando a primeira tonalidade, e um segundo fator de ruído calculado por utilizar a segunda tonalidade. Aqui, cada dos primeiro e segundo fatores de ruído representa a quantidade de componentes de ruído em um sinal. Como tal, se a segunda tonalidade for maior do que a primeira tonalidade, ou se o primeiro fator de ruído for maior do que o segundo fator de ruído aumentado de ruído em um processo de reconstrução pode ser evitado por reduzir a energia de uma sub-banda correspondente. Em um caso oposto, a energia de uma sub-banda correspondente pode ser aumentada.
[00054] Além disso, para executar quantização de vetor por coletar informações de energia, a unidade de codificação de extensão de frequência elevada FD 290 pode simular um método de gerar um sinal de excitação em uma banda de frequência predeterminada, e pode controlar energia quando características do sinal de excitação de acordo com um resultado da simulação é diferente das características do sinal original na banda de frequência predeterminada. Nesse caso, as características do sinal de excitação de acordo com o resultado da simulação e as características do sinal original podem incluir pelo menos uma de uma tonalidade e um fator de ruído, porém não são limitados aos mesmos. Desse modo, é possível evitar que o ruído aumente quando um lado de decodificação decodifica energia efetiva.
[00055] Enquanto isso, a energia pode ser quantizada por utilizar, porém não é limitada a, um método de quantização de vetor de multiestágios (na sigla em inglês para multistage vector quantization, MSVQ). Especificamente, a unidade de codificação de extensão de frequência elevada FD 290 pode coletar e executar quantização de vetor na energia de subbandas de número ímpar entre um número predeterminado de subbandas em um estágio atual pode obter erros de predição de sub-bandas de número par utilizando um resultado de executar quantização de vetor nas sub-bandas de número ímpar, e pode executar quantização de vetor nos erros de predição obtidos em um próximo estágio. Enquanto isso, um caso oposto ao acima também é possível. Isto é, a unidade de codificação de extensão de frequência elevada FD 290 obtém um erro de predição de uma sub-banda (n+1)° utilizando resultados de executar quantização de vetor em uma na sub-banda e uma sub-banda (n+2)°.
[00056] Enquanto isso, quando a quantização de vetor é executada em energia, um peso de acordo com significância de cada vetor de energia ou um sinal obtido por subtrair um valor médio de cada vetor de energia pode ser calculado. Nesse caso, o peso de acordo com significância pode ser calculado para maximizar a qualidade de um som sintetizado. Se o peso de acordo com significância for calculado, um índice de quantização otimizado para um vetor de energia pode ser calculado utilizando um erro de quadrado médio ponderal (na sigla em inglês para weighted mean square error, WMSE) ao qual o peso é aplicado.
[00057] A unidade de codificação de extensão de frequência elevada FD 290 pode utilizar um método de extensão de largura de banda de multímodos para gerar vários sinais de excitação de acordo com características de um sinal de frequência elevada. O método de extensão de largura de banda de multímodos pode fornecer, por exemplo, um modo transiente, um modo normal, um modo harmônico ou um modo de ruído de acordo com características de um sinal de frequência elevada. Uma vez que a unidade de codificação de extensão de frequência elevada FD 290 opera com relação a um quadro estacionário, um sinal de excitação de cada quadro pode ser gerado utilizando um modo normal, um modo harmônico, ou um modo de ruído de acordo com características de um sinal de frequência elevada.
[00058] Além disso, a unidade de codificação de extensão de frequência elevada FD 290 pode gerar sinais de bandas de frequência elevada diferentes de acordo com uma taxa de bits. Isto é, uma banda de frequência elevada na qual a unidade de codificação de extensão de frequência elevada FD 290 executa codificação de extensão pode ser definida diferentemente de acordo com uma taxa de bits. Por exemplo, a unidade de codificação de extensão de frequência elevada FD 290 pode executar codificação de extensão em uma banda de frequência de aproximadamente 6.4 a 14.4 kHz em uma taxa de bits de 16 kbps, e pode executar codificação de extensão em uma banda de frequência de aproximadamente 8 a 16 kHz em uma taxa de bis maior do que 16 kbps.
[00059] Para isso, a unidade de codificação de extensão de frequência elevada 290 pode executar quantização de energia por compartilhar o mesmo livro-código com relação a taxas de bit diferentes.
[00060] Enquanto isso, na unidade de codificação FD 200, se um quadro estacionário for entrado, a unidade de codificação de norma 210, a unidade de codificação FPC 230, a unidade de geração de informações de ruído 250, a unidade de processamento antidispersão 270, e a unidade de codificação de extensão FD 290 podem operar. Em particular, a unidade de processamento antidispersão 270 pode operar com relação a um modo normal de um quadro estacionário. Enquanto isso se um quadro não estacionário, isto é, um quadro transiente, é entrado, a unidade de geração de informação de ruído 250, a unidade de processamento antidispersão 270, e a unidade de codificação de extensão FD 290 não operam. Nesse caso, em comparação com um caso quando um quadro estacionário é entrado, a unidade de codificação FPC 230 pode aumentar uma banda de frequência superior alocada para executar FPC, isto é, uma banda de frequência de núcleo Fcore, a uma banda de frequência mais elevada Fend.
[00061] A figura 3 é um diagrama de blocos de outro exemplo da unidade de codificação FD ilustrada na figura 1.
[00062] Com referência à figura 3, a unidade de codificação FD 300 pode incluir uma unidade de codificação de normal 310, uma unidade de codificação FPC 330, uma unidade de codificação de extensão de baixa frequência FD 340, uma unidade de processamento antidispersão 370, e uma unidade de codificação de extensão de frequência elevada FD 390. Aqui, operações da unidade de codificação de norma 310, a unidade de codificação FPC 330, e a unidade de codificação de extensão de frequência elevada FD 390 são substancialmente iguais àquelas da unidade de codificação de norma 210, a unidade de codificação FPC 230, e a unidade de codificação de extensão de frequência elevada FD 290 ilustradas na figura 2, e desse modo descrições detalhadas das mesmas não são fornecidas aqui.
[00063] Uma diferença da figura 2 é que a unidade de processamento antidispersão 370 não utiliza um nível de ruído adicional e utiliza um valor de norma obtido em unidades de sub-bandas a partir da unidade de codificação de norma 310. Isto é, a unidade de processamento antidispersão 370 determina a localização e a amplitude de ruído a ser adicionado em um espectro de baixa frequência reconstruído, executa processamento antidispersão de acordo com a localização e a amplitude determinadas de ruído no espectro de frequência no qual enchimento de ruído foi realizado por utilizar o valor de norma, e provê o espectro resultante à unidade de codificação de extensão de frequência elevada FD 390. Especificamente, com relação a uma sub-banda incluindo uma parte que é inversamente quantizada para 0, um componente de ruído pode ser gerado e a energia do componente de ruído pode ser ajustada utilizando uma razão entre a energia do componente de ruído e um valor de norma inversamente quantizado, isto é, energia espectral. De acordo com outra modalidade, com relação a uma sub-banda incluindo uma parte que é inversamente quantizada para 0, um componente de ruído pode ser gerado e ajustado de tal modo que uma energia média do componente de ruído é 1.
[00064] A figura 4 é um diagrama de blocos de uma unidade de processamento antidispersão de acordo com uma modalidade exemplar.
[00065] Com referência à figura 4, a unidade de processamento antidispersão 400 pode incluir uma unidade de geração de espectro reconstruída 410, uma unidade de determinação de localização de ruído 430, uma unidade de determinação de amplitude de ruído 440, e uma unidade de adicionar ruído 450.
[00066] A unidade de geração de espectro reconstruído 410 gerar um espectro de baixa frequência reconstruído utilizando informações FPC fornecidas a partir da unidade de codificação FPC 230 ou 330 ilustrada na figura 2 ou 3 e informações de enchimento de ruído como um nível de ruído ou um valor de norma. Nesse caso, se Fcore e Ffpc forem diferentes, o espectro de baixa frequência reconstruído pode ser gerado por executar adicionalmente codificação de extensão de baixa frequência FD.
[00067] A unidade de determinação de localização de ruído 430 pode determinar um espectro recuperado para 0 no espectro de baixa frequência reconstruído como o local de ruído. De acordo com outra modalidade, o local de ruído a ser adicionado pode ser determinado entre espectros recuperados para 0, em consideração da amplitude de um espectro vizinho. Por exemplo, se a amplitude de um espectro vizinho de um espectro recuperado para 0 for igual a ou maior do que um valor predeterminado, o espectro recuperado para 0 pode ser determinado como o local de ruído. Aqui, o valor predeterminado pode ser anteriormente definido como um valor ótimo que é definido através de simulação ou experimento para minimizar perda de informações de um espectro vizinho de um espectro recuperado para 0.
[00068] A unidade de determinação de amplitude de ruído 440 pode determinar a amplitude de ruído a ser adicionado ao local determinado de ruído. De acordo com uma modalidade, a amplitude de ruído pode ser determinada com base em um nível de ruído. Por exemplo, a amplitude de ruído pode ser determinada por alterar um nível de ruído por uma razão predeterminada. Especificamente, a amplitude de ruído pode ser determinada como, porém não é limitada a (0,5 x nível de ruído). De acordo com outra modalidade, a amplitude de ruído pode ser determinada por alterar adaptavelmente um nível de ruído em consideração da amplitude de um espectro vizinho no local determinado de ruído. Se a amplitude de um espectro vizinho for menor do que a amplitude de ruído a ser adicionado, a amplitude do ruído pode ser alterada para ser menor do que a amplitude do espectro vizinho.
[00069] A unidade de adicionar ruído 450 pode adicionar ruído com base no local determinado e a amplitude de ruído por utilizar ruído aleatório. De acordo com uma modalidade, um sinal aleatório pode ser aplicado. A amplitude de ruído pode ter um valor fixo e o sinal do valor pode ser alterado de acordo com se um sinal aleatório gerado por utilizar uma semente aleatória tem um valor ímpar ou par. Por exemplo, um sinal + pode ser dado se o sinal aleatório tiver um valor par, e um sinal - pode ser dado se o sinal aleatório tiver um valor ímpar. O espectro de baixa frequência ao qual ruído é adicionado pela unidade de adicionar ruído 470 é fornecido à unidade de codificação de extensão de frequência elevada FD 290 ilustrada na figura 2. O espectro de baixa frequência que é fornecido à unidade de codificação de extensão de frequência elevada FD 290 pode indicar um sinal decodificado de núcleo que é obtido por executar um processamento de enchimento de ruído, uma extensão de banda de baixa frequência e um processamento antidispersão, em um espectro de baixa frequência obtido de uma decodificação FPC.
[00070] A figura 5 é um diagrama de blocos de uma unidade de codificação de extensão de frequência elevada FD de acordo com uma modalidade exemplar.
[00071] Com referência à figura 5, a unidade de codificação de extensão de frequência elevada FD 500 pode incluir uma unidade de copiar espectro 510, uma primeira unidade de cálculo de tonalidade 520, uma segunda unidade de cálculo de tonalidade 530, uma unidade de determinação de método de gerar sinal de excitação 540, uma unidade de ajustar energia 550, e uma unidade de quantização de energia 560. Enquanto isso, se um aparelho de codificação exigir um espectro de frequência elevada reconstruído, um módulo de geração de espectro de frequência elevada reconstruído 570 pode ser incluído adicionalmente. O módulo de geração de espectro de frequência elevada reconstruído 570 pode incluir uma unidade de geração de sinal de excitação de frequência elevada 571 e uma unidade de geração de espectro de frequência elevada 573. Em particular, se a unidade de codificação FD 173 ilustrada na figura 1 utilizar um método de transformação, por exemplo, MDCT, capaz de permitir recuperação por executar um método de adicionar-sobrepor em um quadro anterior, e se um modo CELP e um modo FD forem comutados entre quadros, o módulo de geração de espectro de frequência elevada reconstruído 570 necessita ser adicionado.
[00072] A unidade de copiar espectro 510 pode dobrar ou replicar o espectro de baixa frequência fornecido a partir da unidade de processamento antidispersão 270 ou 370 ilustrada na figura 2 ou 3 de modo a estender o espectro de baixa frequência até uma banda de frequência elevada. Por exemplo, uma banda de frequência elevada de 8 a 16 kHz pode ser estendida utilizando um espectro de baixa frequência de 0 a 8 kHz. De acordo com uma modalidade, em vez do espectro de baixa frequência fornecido a partir da unidade de processamento antidispersão 270 ou 370, um espectro de baixa frequência original pode ser estendido até uma banda de frequência elevada por dobrar ou replicar o espectro de baixa frequência original.
[00073] A primeira unidade de cálculo de tonalidade 520 calcula uma primeira tonalidade em unidades de sub-bandas predeterminadas com relação a um espectro de frequência elevada original.
[00074] A segunda unidade de cálculo de tonalidade 530 calcula uma segunda tonalidade em unidades de sub-bandas com relação ao espectro de frequência elevada estendido por utilizar o espectro de baixa frequência pela unidade de copiar espectro 510.
[00075] Cada das primeira e segunda tonalidades pode ser calculada utilizando planura espectral com base em uma razão entre uma amplitude média e uma amplitude máxima de um espectro de uma sub-banda. Especificamente, a planura espectral pode ser calculada por utilizar correlações entre uma média geométrica e uma média aritmética de um espectro de frequência. Isto é, as primeira e segunda tonalidades representam se um espectro tem características de pico ou planas. As primeira e segunda unidades de cálculo de tonalidade 520 e 530 podem operar utilizando o mesmo método em unidades da mesma sub-banda.
[00076] A unidade de determinação de método de geração de sinal de excitação 540 pode determinar um método de gerar um sinal de excitação de frequência elevada por comparar as primeira e segunda tonalidades. O método de gerar um sinal de excitação de frequência elevada pode ser determinado utilizando o espectro de frequência elevada gerado por modificar o espectro de baixa frequência e um peso adaptável de ruído aleatório. Nesse caso, um valor correspondendo ao peso adaptável pode ser informação do tipo de sinal de excitação, e a informação do tipo de sinal de excitação pode ser incluída em um fluxo de bits de modo a ser armazenada ou transmitida. De acordo com uma modalidade, a informação do tipo de sinal de excitação pode ser formada em 2 bits. Aqui, os 2 bits podem ser formados em quatro etapas com referência a um peso a ser aplicado ao ruído aleatório. A informação do tipo sinal de excitação pode ser transmitida uma vez para cada quadro. Além disso, uma pluralidade de sub-bandas pode formar um grupo e a informação do tipo de sinal de excitação pode ser definida em cada grupo e pode ser transmitida para cada grupo.
[00077] De acordo com uma modalidade, a unidade de determinação de método de geração de sinal de excitação 540 pode determinar o método de gerar um sinal de excitação de frequência elevada em consideração somente de características de um sinal de frequência elevada original. Especificamente, o método de gerar o sinal de excitação pode ser determinado por identificar uma região incluindo uma média de primeiras tonalidades calculadas em unidades de sub-bandas e de acordo com uma região correspondendo ao valor de uma primeira tonalidade com referência ao número de trechos de informação do tipo sinal de excitação. De acordo com o método acima, se o valor de uma tonalidade for elevado, isto é, se um espectro tiver características de pico, um peso a ser aplicado a ruído aleatório pode ser definido como sendo pequeno.
[00078] De acordo com outra modalidade, a unidade de determinação de método de geração de sinal de excitação 540 pode determinar o método de gerar o sinal de excitação de frequência elevada em consideração das duas características do sinal de frequência elevada original e características de um sinal de frequência elevada a ser gerado por executar extensão de banda. Por exemplo, se as características do sinal de frequência elevada original e as características do sinal de frequência elevada a ser gerado por executar extensão de banda forem similares, um peso de ruído aleatório pode ser definido como sendo pequeno. De outro modo, se as características do sinal de frequência elevada original e as características do sinal de frequência elevada a ser gerado por executar extensão de banda forem diferentes, um peso de ruído aleatório pode ser ajustado como sendo grande. Enquanto isso pode ser definido com referência a uma média de diferenças entre as primeira e segunda tonalidades para cada sub-banda. Se a média de diferenças entre as primeira e segunda tonalidades para cada sub-banda for grande, um peso de ruído aleatório pode ser definido como sendo grande. De outro modo, se a média de diferenças entre as primeira e segunda tonalidades para cada sub-banda for pequena, um peso de ruído aleatório pode ser ajustado para ser pequeno. Enquanto isso, se a informação do tipo de sinal de excitação for transmitida para cada grupo, a média de diferenças entre as primeira e segunda tonalidades para cada sub-banda é calculada utilizando uma média de subbandas incluídas em um grupo.
[00079] A unidade de ajuste de energia 550 pode calcular energia em unidades de sub-bandas com relação ao espectro de frequência elevada original, e ajuste a energia utilizando as primeira e segunda tonalidades. Por exemplo, se a primeira tonalidade for grande e a segunda tonalidade for pequena, isto é, se o espectro de frequência elevada original for de pico e um espectro de saída de uma unidade de processamento antidispersão 270 ou 370 for plano, a energia é ajustada com base em uma razão das primeira e segunda tonalidades.
[00080] A unidade de quantização de energia 560 pode executar quantização de vetor na energia ajustada e pode calcular no fluxo de bits um índice de quantização gerado devido à quantização de vetor de modo a armazenar ou transmitir o fluxo de bits.
[00081] Enquanto isso, no módulo de geração de espectro de frequência elevada reconstruído 570, as operações da unidade de geração de sinal de excitação de frequência elevada 571 e a unidade de geração de espectro de frequência elevada 573 são substancialmente iguais àquelas de uma unidade de geração de sinal de excitação de frequência elevada 1130 e uma unidade de geração de espectro de frequência elevada 1170 ilustrada na figura 11, e desse modo descrições detalhadas da mesma não serão fornecidas aqui.
[00082] As figuras 6A e 6B são gráficos que mostram uma região onde a codificação de extensão é realizada pelo módulo de codificação FD 170 ilustrado na figura 1. A figura 6A mostra um caso quando uma banda de frequência superior Ffpc na qual FPC foi na realidade realizado é igual a uma banda de baixa frequência alocada para executar FPC, isto é, uma banda de frequência de núcleo Fcore. Nesse caso, FPC e enchimento de ruído são executados em uma banda de frequência baixa para Fcore, e codificação de extensão é executada utilizando um sinal da banda de baixa frequência em uma banda de frequência elevada correspondendo a Fend-Fcore. Aqui, Fend pode ser uma frequência máxima que é obtenível devido à extensão de frequência elevada.
[00083] Enquanto isso, a figura 6B mostra um caso quando uma banda de frequência superior Ffpc na qual FPC foi na realidade executado é menor do que uma banda de frequência de núcleo Fcore. FPC e enchimento de ruído são realizados em uma banda de frequência baixa correspondendo a Ffpc, codificação de extensão é executada em uma banda de baixa frequência correspondendo a Fcore-Ffpc utilizando um sinal de banda de frequência baixa na qual FPC e enchimento de ruído foram realizados, e codificação de extensão é executada em uma banda de frequência elevada correspondendo a Fend-Fcore utilizando um sinal da banda de frequência baixa inteira. De modo semelhante, Fend pode ser uma frequência máxima que é obtenível devido à extensão de frequência elevada.
[00084] Aqui, Fcore e Fend podem ser variavelmente definidos de acordo com uma taxa de bits. Por exemplo, de acordo com uma taxa de bits, Fcore pode ser, porém não é limitado a, 6.4 kHz, 8 kHz, ou 9.6 kHz, e Fend pode ser estendido a, porém não é limitado a, 14 kHz, 14.4 kHz, ou 16 kHz. Enquanto isso, a banda de frequência superior Ffpc na qual FPC foi na realidade executado corresponde a uma banda de frequência na qual enchimento de ruído é executado.
[00085] A figura 7 é um diagrama de blocos de um aparelho de codificação de áudio de acordo com outra modalidade exemplar.
[00086] O aparelho de codificação de áudio 700 ilustrado na figura 7 pode incluir uma unidade de determinação de modo de codificação 710, uma unidade de codificação LPC 705, uma unidade de comutação 730, um módulo de codificação CELP 750, e um módulo de codificação de áudio 770. O módulo de codificação CELP 750 pode incluir uma unidade de codificação CELP 751 e uma unidade de codificação de extensão TD 753, e o módulo de codificação de áudio 770 pode incluir uma unidade de codificação de áudio 771 e uma unidade de codificação de extensão FD 773. Os elementos acima podem ser integrados pelo menos em um módulo e podem ser acionados por pelo menos um processador (não mostrado).
[00087] Com referência à figura 7, a unidade de codificação LPC 705 pode extrair LPCs de um sinal de entrada e pode quantizar os LPCs extraídos. Por exemplo, a unidade de codificação LPC 705 pode quantizar os LPCs utilizando, porém não é limitado a, um método de quantização codificado em treliça (na sigla em inglês para trellis coded quantization, TCQ), um método de quantização de vetor de multiestágios (na sigla em inglês para multiusage vector quantization, MSVQ), ou um método de quantização de vetor de treliça (na sigla em inglês para lattice vector quantization, LVQ). Os LPCs quantizados pela unidade de codificação de LPC 705 podem ser incluídos em um fluxo de bits de modo a ser armazenado ou transmitido.
[00088] Especificamente, a unidade de codificação de LPC 705 pode extrair LPCs de um sinal tendo uma taxa de amostragem de 12.8kHz ou 16 kHz, que é obtido por reamostragem ou amostragem descendente de um sinal tendo uma taxa de amostragem de 32 kHz ou 48 kHz.
[00089] Como a unidade de determinação de modo de codificação 110 ilustrada na figura 1, a unidade de determinação de modo de codificação 710 pode determinar um modo de codificação do sinal de entrada com referência às características de sinal. De acordo com as características de sinal, a unidade de determinação de modo de codificação 710 pode determinar se um quadro atual está em um modo de voz ou um modo de música, e também pode determinar se um modo de codificação eficiente para o quadro atual é um modo TD ou um modo TD.
[00090] O sinal de entrada da unidade de determinação de modo de codificação 710 pode ser um sinal que é amostrado descendente por uma unidade de amostragem descendente (não mostrada). Por exemplo, o sinal de entrada pode ser um sinal tendo uma taxa de amostragem de 12.8 kHz ou 16 kHz, que é obtido por reamostragem ou amostragem descendente de um sinal tendo uma taxa de amostragem de 32 kHz ou 48 kHz. Aqui, um sinal tendo uma taxa de amostragem de 32 kHz é um sinal SWB e pode ser mencionado como um sinal FB, e um sinal tendo uma taxa de amostragem de 16 kHz pode ser mencionado como um sinal WB.
[00091] De acordo com outra modalidade, a unidade de determinação de modo de codificação 710 pode executar a operação de reamostragem ou amostragem descendente.
[00092] Como tal, a unidade de determinação de modo de codificação 710 pode determinar um modo de codificação do sinal reamostrado ou amostrado descendente.
[00093] Informações referentes ao modo de codificação determinado pela unidade de determinação de modo de codificação 710 podem ser fornecidos para a unidade de comutação 730 e podem ser incluídos em um fluxo de bits em unidades de quadros de modo a serem armazenados ou transmitidos.
[00094] De acordo com as informações referentes ao modo de codificação, que são fornecidas a partir da unidade de determinação de modo de codificação 710, a unidade de comutação 730 pode fornecer os LPCs de uma banda de baixa frequência fornecida a partir da unidade de codificação de LPC 705 para o módulo de codificação CELP 750 ou o módulo de codificação de áudio 770. Especificamente, a unidade de comutação 730 provê os LPCs da banda de baixa frequência para o módulo de codificação CELP 750 se o modo de codificação for um modo CELP, e provê os LPCs da banda de baixa frequência para o módulo de codificação de áudio 770 se o modo de codificação for um modo de áudio.
[00095] O módulo de codificação CELP 750 pode operar se o modo de codificação for um modo CELP, e a unidade de codificação CELP 751 pode executar codificação CELP em um sinal de excitação obtido por utilizar os LPCs da banda de baixa frequência. De acordo com uma modalidade, a unidade de codificação CELP 751 pode quantizar o sinal de excitação extraído em consideração de cada de um vetor de código adaptável filtrado (isto é, uma contribuição de livro-código adaptável) e um vetor de código fixo filtrado (isto é, uma contribuição de livro-código de inovação ou fixo) correspondendo a informações de passo. Aqui, o sinal de excitação pode ser gerado pela unidade de codificação LPC 705 e pode ser fornecido para a unidade de codificação CELP 751, ou pode ser gerado pela unidade de codificação CELP 751.
[00096] Enquanto isso, a unidade de codificação CELP 751 pode aplicar modos de codificação diferentes de acordo com as características de sinal. Os modos de codificação aplicados podem incluir, porém não são limitados a, um modo de codificação com voz, um modo de codificação sem voz, um modo de codificação transiente, e um modo de codificação genérico.
[00097] O sinal de excitação de baixa frequência obtido devido à codificação da unidade de codificação CELP 751, isto é, informações CELP, pode ser fornecido à unidade de codificação de extensão TD 753 e pode ser incluído no fluxo de bits.
[00098] No módulo de codificação CELP 750, a unidade de codificação de extensão TD 753 pode executar codificação de extensão de frequência elevada por dobrar ou replicar o sinal de excitação de baixa frequência fornecido a partir da unidade de codificação CELP 751. Informações de extensão de frequência elevada obtidas devido à codificação de extensão da unidade de codificação de extensão TD 753 podem ser incluídas no fluxo de bits.
[00099] Enquanto isso, o módulo de codificação de áudio 770 pode operar se o modo de codificação for um modo de áudio, e a unidade de codificação de áudio 771 pode executar codificação de áudio por transformar para o domínio de frequência o sinal de excitação obtido por utilizar os LPCs da banda de baixa frequência. De acordo com uma modalidade, a unidade de codificação de áudio 771 pode utilizar um método de transformação, por exemplo, transformação de cosseno discreto (na sigla em inglês para discrete cosene transformation, DCT), capaz de evitar uma região de sobreposição entre quadros. Além disso, a unidade de codificação de áudio 771 pode executar codificação LVQ e FPC no sinal de excitação transformado para o domínio de frequência. Adicionalmente, se bits extras forem disponíveis, quando a unidade de codificação de áudio 771 quantiza o sinal de excitação, informações TD como um vetor de código adaptável filtrado (isto é, uma contribuição de livro- código adaptável) e um vetor de código fixo filtrado (isto é, uma contribuição de livro-código de inovação ou fixo) podem ser adicionalmente consideradas.
[000100] No módulo de codificação de áudio 770, a unidade de codificação de extensão FD 773 pode executar codificação de extensão de frequência elevada por utilizar o sinal de excitação de baixa frequência fornecido a partir da unidade de codificação de áudio 771. A operação da unidade de codificação de extensão FD 773 é similar àquela da unidade de codificação de extensão de frequência elevada FD 290 ou 390 ilustrada na figura 2 ou 3 exceto por seus sinais de saída, e desse modo descrições detalhadas da mesma não são fornecidas aqui.
[000101] No aparelho de codificação de áudio 700 ilustrado na figura 7, dois tipos de um fluxo de bits podem ser gerados de acordo com o modo de codificação determinado pela unidade de determinação de modo de codificação 710. Aqui, o fluxo de bits pode incluir um cabeçalho e uma carga útil.
[000102] Especificamente, se o modo de codificação for um modo CELP, informações referentes ao modo de codificação podem ser incluídas no cabeçalho, e informações CELP e informações de extensão de frequência elevada TD podem ser incluídas na carga útil. De outro modo, se o modo de codificação for um modo de áudio, informações referentes ao modo de codificação podem ser incluídas no cabeçalho, e informações referentes à codificação de áudio, isto é, informações de áudio e informações de extensão de frequência elevada FD podem ser incluídas na carga útil.
[000103] O aparelho de codificação de áudio 700 ilustrado na figura 7 pode ser comutado para um modo CELP ou um modo de áudio de acordo com características de sinal e desse modo pode executar eficientemente codificação adaptável com relação às características de sinal. Enquanto isso, a estrutura de comutação ilustrada na figura 1 pode ser aplicada a um ambiente de taxa de bit baixa.
[000104] A figura 8 é um diagrama de blocos de um aparelho de codificação de áudio de acordo com outra modalidade exemplar.
[000105] O aparelho de codificação de áudio 800 ilustrado na figura 8 pode incluir uma unidade de determinação de modo de codificação 810, uma unidade de comutação 830, um módulo de codificação CELP 850, um módulo de codificação FD 870, e um módulo de codificação de áudio 890. O módulo de codificação CELP 850 pode incluir uma unidade de codificação CELP 851 e uma unidade de codificação de extensão TD 853, o módulo de codificação FD 870 pode incluir uma unidade de transformação 871 e uma unidade de codificação FD 873, e o módulo de codificação de áudio 890 pode incluir uma unidade de codificação de áudio 891 e uma unidade de codificação de extensão FD 893. Os elementos acima podem ser integrados em pelo menos um módulo e podem ser acionados por pelo menos um processador (não mostrado).
[000106] Com referência à figura 8, a unidade de determinação de modo de codificação 810 pode determinar um modo de codificação de um sinal de entrada com referência a características de sinal e uma taxa de bit. De acordo com as características de sinal, a unidade de determinação de modo de codificação 810 pode determinar um modo CELP ou outro modo com base em se um quadro atual está em um modo de voz ou um modo de música, e se um modo de codificação eficiente para o quadro atual é um modo TD ou um modo FD. Um modo CELP é determinado se o quadro atual estiver em um modo de voz, um modo FD é determinado se o quadro atual estiver em um modo de música e tiver uma taxa de bit elevada, e um modo de áudio é determinado se o quadro atual estiver em um modo de música e tiver uma taxa de bit baixa.
[000107] De acordo com informações referentes ao modo de codificação, que são fornecidas a partir da unidade de determinação de modo de codificação 810, a unidade de comutação 830 pode fornecer o sinal de entrada para o módulo de codificação CELP 850, o módulo de codificação FD 870, ou o módulo de codificação de áudio 890.
[000108] Enquanto isso, o aparelho de codificação de áudio 800 ilustrado na figura 8 é similar a uma combinação dos aparelhos de codificação de áudio 100 e 700 ilustrados nas figuras 1 e 7, exceto que a unidade de codificação CELP 851 extrai LPCs a partir do sinal de entrada e que a unidade de codificação de áudio 891 também extrai LPCs partir do sinal de entrada.
[000109] O aparelho de codificação de áudio 800 ilustrado na figura 8 pode ser comutado para operar em um modo CELP, um modo FD, ou um modo de áudio de acordo com características de sinal, e desse modo pode executar eficientemente codificação adaptável com relação às características de sinal. Enquanto isso, a estrutura de comutação ilustrada na figura 8 pode ser aplicada independente de uma taxa de bits.
[000110] A figura 9 é um diagrama de blocos de um aparelho de decodificação de áudio 900 de acordo com uma modalidade exemplar. O aparelho de decodificação de áudio 900 ilustrado na figura 9 pode formar um dispositivo de multimídia unicamente ou juntamente com o aparelho de codificação de áudio 100 ilustrado na figura 1, e pode ser, porém não é limitado a, um dispositivo de comunicação de voz como um telefone ou um telefone celular, um dispositivo de broadcasting ou música como uma TV ou um tocador de MP3, ou um dispositivo combinado do dispositivo de comunicação de voz e o dispositivo de broadcasting ou música. além disso, o aparelho de decodificação de áudio 900 pode ser um conversor incluído em um dispositivo de cliente ou um servidor, ou disposto entre o dispositivo de cliente e o servidor.
[000111] O aparelho de decodificação de áudio 900 ilustrado na figura 9 pode incluir uma unidade de comutação 910, um módulo de decodificação CELP 930, e um módulo de decodificação FD 950. O módulo de decodificação CELP 930 pode incluir uma unidade de decodificação CELP 931 e uma unidade de decodificação de extensão TD 933, e o módulo de decodificação FD 950 pode incluir uma unidade de decodificação 951 e uma unidade de transformação inversa 953. Os elementos acima podem ser integrados pelo menos em um módulo e podem ser acionados por pelo menos um processador (não mostrado).
[000112] Com referência à figura 9, a unidade de comutação 910 pode fornecer um fluxo de bits ao módulo de decodificação CELP 930 ou o módulo de decodificação FD 950 com referência a informações referentes a um modo de codificação, que são incluídas no fluxo de bits. Especificamente, o fluxo de bits é fornecido para o módulo de decodificação CELP 930 se o modo de codificação for um modo CELP, e é fornecido para o módulo de decodificação FD 950 se o modo de codificação for um modo FD.
[000113] No módulo de decodificação CELP 930, a unidade de decodificação CELP 931 decodifica LPCs incluídos no fluxo de bit, decodifica um vetor de código adaptável filtrado e um vetor de código fixo filtrado, e gera um sinal de frequência baixa reconstruído por combinar resultados da decodificação.
[000114] A unidade de decodificação de extensão TD 933 gera um sinal de frequência elevada reconstruído por executar decodificação de extensão de frequência elevada por utilizar pelo menos um de um resultado da decodificação CELP e um sinal de excitação de baixa frequência. Nesse caso, o sinal de excitação de baixa frequência pode ser incluído no fluxo de bits. Além disso, a unidade de decodificação de extensão TD 933 pode utilizar informações LPC de uma banda de baixa frequência, que são incluídas no fluxo de bit, para gerar o sinal de frequência elevada reconstruído.
[000115] Enquanto isso, a unidade de decodificação de extensão TD 933 pode gerar um sinal SWB reconstruído por combinar o sinal de frequência elevada reconstruído com o sinal de baixa frequência reconstruído a partir da unidade de decodificação CELP 931. Nesse caso, para gerar o sinal SWB reconstruído, a unidade de decodificação de extensão TD 933 pode transformar o sinal de baixa frequência reconstruído e o sinal de frequência elevada reconstruído para ter a mesma taxa de amostragem.
[000116] No módulo de decodificação FD 950, a unidade de decodificação FD 951 executa decodificação FD em um quadro codificado-FD. A unidade de decodificação FD 951 pode gerar um espectro de frequência por decodificar o fluxo de bits. Além disso, a unidade de decodificação FD 951 pode executar decodificação com referência a informações referentes a um modo de codificação de um quadro anterior, que é incluído no fluxo de bits. Isto é, a unidade de decodificação FD 951 pode executar decodificação FD em um quadro codificado-FD com referência a informações referentes a um modo de codificação de um quadro anterior, que é incluído no fluxo de bits.
[000117] A unidade de transformação inversa 953 transforma inversamente um resultado da decodificação FD para um domínio de tempo. A unidade de transformação inversa 953 gera um sinal reconstruído por executar transformação inversa no espectro de frequência decodificado-FD. Por exemplo, a unidade de transformação inversa 953 pode executar, porém não é limitada a, MDCT inversa (IMDCT).
[000118] Como tal, o aparelho de decodificação de áudio 900 pode decodificar um fluxo de bits com referência a um modo de codificação em unidades de quadros do fluxo de bits.
[000119] A figura 10 é um diagrama de blocos de um exemplo da unidade de decodificação FD ilustrada na figura 9.
[000120] Uma unidade de decodificação FD 1000 ilustrada na figura 10 pode incluir uma unidade de decodificação de norma 1010, uma unidade de decodificação FPC 1020, uma unidade de enchimento de ruído 1030, uma unidade de decodificação de extensão de baixa frequência FD 1040, uma unidade de processamento antidispersão 1050, uma unidade de decodificação de extensão de frequência elevada FD 1060, e uma unidade de combinação 1070.
[000121] A unidade de decodificação de norma 1010 pode calcular um valor de norma recuperado por decodificar um valor de norma incluído em um fluxo de bits.
[000122] A unidade de decodificação FPC 1020 pode determinar o número de bits alocados por utilizar o valor de norma recuperado, e pode executar decodificação FPC em um espectro codificado por FPC utilizando o número de bits alocados. Aqui, o número de bits alocados pode ser determinado pela unidade de codificação FPC 230 ou 330 ilustrado na figura 2 ou 3.
[000123] A unidade de enchimento de ruído 1030 pode executar enchimento de ruído por utilizar um nível de ruído que é adicionalmente gerado e fornecido por um aparelho de codificação de áudio, ou por utilizar o valor de norma recuperado, com referência a um resultado da decodificação FPC executada pela unidade de decodificação FPC 1020. Isto é, a unidade de enchimento de ruído 1030 pode executar processamento de enchimento de ruído até a última sub-banda na qual a decodificação FPC foi realizada.
[000124] A unidade de decodificação de extensão de baixa frequência FD 1040 pode operar quando uma banda de frequência superior Ffpc na qual decodificação FPC foi na realidade executada é menor do que uma banda de frequência de núcleo Fcore. A decodificação FPC e enchimento de ruído pode ser realizada em uma banda de baixa frequência até Ffpc e a decodificação de extensão pode ser realizada em uma banda de baixa frequência correspondendo a Fcore-Ffpc utilizando um sinal de uma banda de baixa frequência na qual a decodificação FPC e o enchimento de ruído foram realizados.
[000125] A unidade de processamento antidispersão 1050 pode evitar que um ruído metálico seja gerado após executar a decodificação de extensão de frequência elevada FD, por adicionar ruído em um espectro reconstruído para zero embora o processamento de enchimento de ruído tenha sido executado no sinal decodificado FPC. Especificamente, a unidade de processamento antidispersão 1050 pode determinar a localização e a amplitude de ruído a ser adicionado a partir do espectro de baixa frequência fornecido a partir da unidade de decodificação de extensão de baixa frequência FD 1040, executar processamento antidispersão no espectro de baixa frequência de acordo com a localização determinada e a amplitude de ruído, e fornecer o espectro resultante para a unidade de decodificação de extensão de frequência elevada FD 1060. A unidade de processamento antidispersão 1050 pode incluir a unidade de determinação de localização de ruído 430, a unidade de determinação de amplitude de ruído 450, e a unidade de adicionar ruído 470 ilustradas na figura 4, exceto pela unidade de geração de espectro reconstruído 410.
[000126] De acordo com uma modalidade, quando o processamento de enchimento de ruído é executado em uma sub-banda na qual todos os espectros são quantizados para zero na decodificação FPC, o processamento antidispersão pode ser executado por adicionar ruído em uma sub-banda na qual o processamento de enchimento de ruído não é executado e incluindo um espectro reconstruído para zero. De acordo com outra modalidade, o processamento antidispersão pode ser executado por adicionar ruído em uma sub-banda na qual a decodificação de extensão de baixa frequência FD é executada e incluindo um espectro reconstruído para zero.
[000127] A unidade de decodificação de extensão de frequência elevada FD 1060 pode executar decodificação de extensão de frequência elevada no ruído de espectro de baixa frequência adicionada pela unidade de processamento antidispersão 1050. A unidade de decodificação de extensão de frequência elevada FD 1060 pode executar quantização de energia inversa por compartilhar o mesmo livro-código com relação a taxas de bit diferentes.
[000128] A unidade de combinação 1070 pode gerar um espectro SWB reconstruído por combinar o espectro de baixa frequência fornecido a partir de uma unidade de decodificação de extensão de baixa frequência FD 1040 e o espectro de frequência elevada fornecido a partir da unidade de decodificação de extensão de frequência elevada 1060.
[000129] A figura 11 é um diagrama de blocos de um exemplo da unidade de decodificação de extensão de frequência elevada FD ilustrada na figura 10.
[000130] Uma unidade de codificação de extensão de frequência elevada FD 1100 ilustrada na figura 11 pode incluir uma unidade de copiar espectro 1110, uma unidade de geração de sinal de excitação de frequência elevada 1130, uma unidade de quantização de energia inversa 1150, e uma unidade de geração de espectro de frequência elevada 1170.
[000131] Como a unidade de copiar espectro 510 ilustrada na figura 5, a unidade de copiar espectro 1110 pode estender um espectro de baixa frequência fornecido a partir da unidade de processamento antidispersão 1050 ilustrada na figura 10, até uma banda de frequência elevada por dobrar ou replicar o espectro de baixa frequência.
[000132] A unidade de geração de sinal de excitação de frequência elevada 1130 pode gerar um sinal de excitação de frequência elevada utilizando o espectro de frequência elevada estendido fornecido a partir da unidade de copiar espectro 1110, e informação do tipo de sinal de excitação extraída a partir de um fluxo de bits.
[000133] A unidade de geração de sinal de excitação de frequência elevada 1130 pode gerar um sinal de excitação de frequência elevada por aplicar um peso entre ruído aleatório R(n) e um espectro G(n) transformado a partir do espectro de frequência elevada estendido fornecido a partir da unidade de copiar espectro 1110. Aqui, o espectro transformado pode ser obtido por calcular uma amplitude média em unidades de subbandas recentemente definidas da saída da unidade de copiar espectro 1110, e normalizar um espectro na amplitude média. O espectro transformado é casado em nível com ruído aleatório em unidades de sub-bandas predeterminadas. O casamento em nível é um processo de permitir que amplitudes médias do ruído aleatório e o espectro transformado sejam iguais em unidades de sub-bandas. De acordo com uma modalidade, a amplitude do espectro transformado pode ser definida para ser levemente maior do que aquele do ruído aleatório. O sinal de excitação de frequência elevada finalmente gerado pode ser calculado como E(n) = G(n) x (1-w(n)) + R(n) x w(n). Aqui, w(n) representa um valor determinado de acordo com as informações do tipo de sinal de excitação, e n representa um índice de um Bin de espectro. W(n) pode ser um valor constante, e pode ser definido como o mesmo valor em todas as sub-bandas se transmissão for executada em unidades de sub-bandas.
[000134] Quando a informação do tipo de sinal de excitação é definida utilizando 2 bits de 0, 1, 2 ou 3, w(n) pode ser alocado para ter um valor máximo se a informação do tipo de sinal de excitação representar 0, e ter um valor mínimo se a informação do tipo de sinal de excitação representar 3.
[000135] A unidade de quantização de energia inversa 1150 pode recuperar energia por quantizar inversamente um índice de quantização incluído no fluxo de bits.
[000136] A unidade de geração de espectro de frequência elevada 1170 pode reconstruir um espectro de frequência elevada a partir do sinal de excitação de frequência elevada com base em uma razão entre energia do sinal de excitação de frequência elevada e energia recuperada de tal modo que a energia do sinal de excitação de frequência elevada casa com a energia recuperada.
[000137] Enquanto isso, se um espectro de frequência elevada original for com pico ou incluir um componente de harmônica para ter características tonais fortes, a unidade de geração de espectro de frequência elevada 1170 pode gerar o espectro de frequência elevada utilizando uma entrada da unidade de copiar espectro 1110 em vez do espectro de baixa frequência fornecido a partir da unidade de processamento antidispersão 1050 ilustrada na figura 10.
[000138] A figura 12 é um diagrama de blocos de um aparelho de decodificação de áudio de acordo com outra modalidade exemplar.
[000139] O aparelho de decodificação de áudio 1200 ilustrado na figura 12 pode incluir uma unidade de decodificação LPC 1205, uma unidade de comutação 1210, um módulo de decodificação CELP 1230, e um módulo de decodificação de áudio 1250. O módulo de decodificação CELP 1230 pode incluir uma unidade de decodificação CELP 1231 e uma unidade de decodificação de extensão TD 1233, e o módulo de decodificação de áudio 1250 pode incluir uma unidade de decodificação de áudio 1251 e uma unidade de decodificação de extensão FD 1253. Os elementos acima podem ser integrados em pelo menos um módulo e podem ser acionados por pelo menos um processador (não mostrado).
[000140] Com referência à figura 12, a unidade de decodificação LPC 1205 executa decodificação LPC em um fluxo de bits em unidades de quadros.
[000141] A unidade de comutação 1210 pode fornecer uma saída da unidade de decodificação LPC 1205 ao módulo de decodificação CELP 1230 ou o módulo de decodificação de áudio 1250 com referência às informações referentes a um modo de codificação, que são incluídas no fluxo de bits. Especificamente, a saída da unidade de decodificação LPC 1204 é fornecida para o módulo de decodificação CELP 1230 se o modo de codificação for um modo CELP, e é fornecido para o módulo de decodificação de áudio 1250 se o modo de codificação for um modo de áudio.
[000142] No módulo de decodificação CELP 1230, a unidade de decodificação CELP 1231 pode executar decodificação CELP em um quadro codificado para CELP. Por exemplo, a unidade de decodificação CELP 1231 decodifica um vetor de código adaptável filtrado e um vetor de código fixo filtrado, e gera um sinal de baixa frequência reconstruído por combinar resultados da decodificação.
[000143] A unidade de decodificação de extensão TD 1233 pode gerar um sinal de frequência elevada reconstruído por executar decodificação de extensão de frequência elevada utilizando pelo menos um de um resultado da decodificação CELP e um sinal de excitação de baixa frequência. Nesse caso, o sinal de excitação de baixa frequência pode ser incluído no fluxo de bits. Além disso, a unidade de decodificação de extensão TD 1233 pode utilizar informações LPC de uma banda de baixa frequência, que é incluída no fluxo de bits, para gerar o sinal de frequência elevada reconstruído.
[000144] Enquanto isso, a unidade de decodificação de extensão TD 1233 pode gerar um sinal SWB reconstruído por combinar o sinal de frequência elevada reconstruído com o sinal de baixa frequência reconstruído gerado pela unidade de decodificação CELP 1231. Nesse caso, para gerar o sinal SWB reconstruído, a unidade de decodificação de extensão TD 1233 pode transformar o sinal de baixa frequência reconstruído e o sinal de frequência elevada reconstruído para ter a mesma taxa de amostragem.
[000145] No módulo de decodificação de áudio 1250, a unidade de decodificação de áudio 1251 pode executar decodificação de áudio em um quadro codificado em áudio. Por exemplo, com referência ao fluxo de bits, se uma contribuição TD existir, a unidade de decodificação de áudio 1251 executa decodificação em consideração de contribuições TD e FD. De outro modo, se uma contribuição TD não existir, a unidade de decodificação de áudio 1251 executa decodificação em consideração de uma contribuição FD.
[000146] Além disso, a unidade de decodificação de áudio 1251 pode gerar um sinal de excitação de baixa frequência decodificado por executar transformação de frequência inversa em um sinal quantizado FPC ou LVQ por utilizar, por exemplo, DCT inverso (IDCT), e pode gerar um sinal de baixa frequência reconstruído por combinar o sinal de excitação gerado e um coeficiente LPC quantizado inversamente.
[000147] A unidade de decodificação de extensão FD 1253 executa decodificação de extensão em um resultado da decodificação de áudio. Por exemplo, a unidade de decodificação de extensão FD 1253 transforma o sinal de baixa frequência decodificado para ter uma taxa de amostragem apropriada para decodificação de extensão de frequência elevada, e executa transformação de frequência como MDCT no sinal transformado. A unidade de decodificação de extensão FD 1253 pode quantizar inversamente energia de uma banda de frequência elevada quantizada, pode gerar um sinal de excitação de frequência elevada utilizando um sinal de baixa frequência de acordo com vários modos de extensão de frequência elevada, e pode aplicar um ganho de tal modo que energia do sinal de excitação gerado casa inversamente com energia quantizada, desse modo gerando um sinal de frequência elevada reconstruído. Por exemplo, vários modos de extensão de frequência elevada podem ser um modo normal, um modo transiente, um modo harmônico ou um modo de ruído.
[000148] Além disso, a unidade de decodificação de extensão FD 1253 gera um sinal reconstruído final por executar transformação de frequência inversa como IMDCT no sinal de frequência elevada reconstruído e sinal de baixa frequência reconstruído.
[000149] Adicionalmente, se um modo transiente for aplicado em extensão de largura de banda, a unidade de decodificação de extensão FD 1253 pode aplicar um ganho calculado no domínio de tempo de tal modo que um sinal decodificado após executar transformação de frequência inversa casa com um envelope temporal decodificado, e pode sintetizar o sinal aplicado de ganho.
[000150] Como tal, o aparelho de decodificação de áudio 1200 pode decodificar um fluxo de bits com referência a um modo de codificação em unidades de quadros do fluxo de bit.
[000151] A figura 13 é um diagrama de blocos de um aparelho de decodificação de áudio de acordo com outra modalidade exemplar.
[000152] O aparelho de decodificação de áudio 1300 ilustrado na figura 13 pode incluir uma unidade de comutação 1310, um módulo de decodificação CELP 1330, um módulo de decodificação FD 1350, e um módulo de decodificação de áudio 1370. O módulo de decodificação CELP 1330 pode incluir uma unidade de decodificação CELP 1331 e uma unidade de decodificação de extensão TD 1333, o módulo de decodificação FD 1350 pode incluir uma unidade de decodificação FD 1351 e uma unidade de transformação inversa 1353, e o módulo de decodificação de áudio 1370 pode incluir uma unidade de decodificação de áudio 1371 e uma unidade de decodificação de extensão FD 1373. Os elementos acima podem ser integrados pelo menos em um módulo e podem ser acionados por pelo menos um processador (não mostrado).
[000153] Com referência à figura 13, a unidade de comutação 1310 pode fornecer um fluxo de bits para o módulo de decodificação CELP 1330, o módulo de decodificação FD 1350, ou o módulo de decodificação de áudio 1370 com referência a informações referentes a um modo de codificação, que são incluídas no fluxo de bits. Especificamente, o fluxo de bits é fornecido ao módulo de decodificação CELP 1330 se o modo de codificação for um modo CELP, é fornecido para o módulo de decodificação FD 1350 se o modo de codificação for um modo FD, e é fornecido para o módulo de decodificação de áudio 1370 se o modo de codificação for um modo de áudio.
[000154] Aqui, operações do módulo de decodificação CELP 1330, o módulo de decodificação FD 1350, e o módulo de decodificação de áudio 1370 são meramente invertidas a partir daquelas do módulo de codificação CELP 850, módulo de codificação FD 870, e o módulo de codificação de áudio 890 ilustrado na figura 8, e desse modo descrições detalhadas das mesmas não serão fornecidas aqui.
[000155] A figura 14 é um diagrama para descrever um método de partilha de livro-código de acordo com uma modalidade exemplar.
[000156] A unidade de codificação de extensão FD 773 ou 893 ilustrada na figura 7 ou 8 pode executar quantização de energia por partilha do mesmo livro-código com relação a taxas de bit diferentes. Como tal, quando um espectro de frequência correspondendo a um sinal de entrada é dividido em um número predeterminado de sub-bandas, a unidade de codificação de extensão FD 773 ou 893 tem a mesma largura de banda de uma sub-banda com relação a taxas de bit diferentes.
[000157] Um caso 1410 quando uma faixa de frequência de aproximadamente 6.4 a 14.4 kHz é dividida em uma taxa de bits de 16 kbps e um caso 1420 quando uma faixa de frequência de aproximadamente 8 a 16 kHz é dividida em uma taxa de bit maior do que 16 kpbs serão descritos agora como exemplos.
[000158] Especificamente, uma largura de banda 1430 de uma primeira sub-banda na taxa de bits de 16 kbps e a taxa de bit maior do que 16 kbps pode ser 0.4 kHz, e uma largura de banda 1440 de uma segunda sub-banda na taxa de bits de 16 kbps e a taxa de bits maior do que 16 kbps pode ser 0,6 kHz.
[000159] Como tal, se uma sub-banda tiver a mesma largura de banda com relação a taxas de bit diferentes, a unidade de codificação de extensão FD 773 ou 893 pode executar quantização de energia por partilhar o mesmo livro-código com relação a taxas de bit diferentes.
[000160] Consequentemente, em uma configuração quando um modo CELP e um modo FD são comutados, um modo CELP e um modo de áudio são comutados, ou um modo CELP, um modo FD, e um modo de áudio são comutados, um método de extensão de largura d banda de multímodo pode ser utilizado e um livro-código para suportar várias taxas de bit pode ser partilhado, desse modo reduzindo o tamanho de memória (por exemplo, ROM) e também reduzindo a complexidade de implementação.
[000161] A figura 15 é um diagrama para descrever um método de sinalização de modo de codificação de acordo com uma modalidade exemplar.
[000162] Com referência à figura 15, em operação 1510, é determinado se um sinal de entrada corresponde a um componente transiente utilizando vários métodos bem conhecidos.
[000163] Em operação 1520, se for determinado que o sinal de entrada corresponda a um componente transiente em operação 1510, bits são alocados em unidades de um decimal.
[000164] Em operação 1530, o sinal de entrada é codificado em um modo transiente, e é sinalizado que a codificação foi realizada em um modo transiente, utilizando um indicador transiente de 1 bit.
[000165] Enquanto isso, na operação 1540, se for determinado que o sinal de entrada não corresponda a um componente transiente em operação 1510, é determinado se o sinal de entrada corresponde a um componente harmônico utilizando vários métodos bem conhecidos.
[000166] Em operação 1550, se for determinado que o sinal de entrada corresponda a um componente de harmônica em operação 1540, o sinal de entrada é codificado em um modo de harmônica e é sinalizado que codificação foi realizada em um modo harmônico, por utilizar um indicador harmônico de 1 bit juntamente com um indicador transiente de 1 bit.
[000167] Enquanto isso, em operação 1560, se for determinado que o sinal de entrada não corresponder a um componente harmônico em operação 1540, bits são alocados em unidades de decimal.
[000168] Em operação 1570, o sinal de entrada é codificado em um modo normal e é sinalizado que codificação foi realizada em um modo normal, utilizando um indicador harmônico de 1 bit juntamente com um indicador transiente de 1 bit.
[000169] Isto é, três modos, isto é, um modo transiente, um modo harmônico, e um modo normal, podem ser sinalizados utilizando um indicador de 2 bits.
[000170] Métodos executados pelos aparelhos acima podem ser gravados como programas de computador e podem ser implementados em computadores digitais de uso geral que executam os programas utilizando um meio de gravação legível em computador incluindo instruções de programa para executar várias operações realizadas por um computador. O meio de gravação legível em computador pode incluir instruções de programa, um arquivo de dados, e uma estrutura de dados separadamente ou cooperativamente. As instruções de programa e a mídia podem ser aqueles especialmente projetados e construídos para fins do presente conceito inventivo, ou podem ser do tipo bem conhecido e disponível para uma pessoa com conhecimentos comuns na técnica de software de computador. Os exemplos da mídia legível em computador incluem mídia magnética (por exemplo, discos rígidos, discos flexíveis, e fitas magnéticas), mídia óptica (por exemplo, CD-ROMs ou DVD), mídia magneto-óptico, por exemplo, discos floptical e dispositivos de hardware (por exemplo, ROMS, RAMs, ou memórias flash, etc.) que são especialmente configurados para armazenar e executar instruções de programa. A mídia ser também mídia de transmissão como linhas ópticas ou metálicas, guias de onda, etc. especificando as instruções de programa, estruturas de dados, etc. os exemplos das instruções de programa incluem tanto código de maquia, como produzido por um compilador, como arquivos contendo códigos de linguagem de nível elevado que podem ser executados pelo computador utilizando um intérprete. [000171] Embora o presente conceito inventivo tenha sido particularmente mostrado e descrito com referência a modalidades exemplares do mesmo, será entendido por uma pessoa com conhecimentos comuns na técnica que várias alterações em forma e detalhes podem ser feitas na mesma sem se afastar do espírito e escopo do conceito inventivo como definido pelas seguintes reivindicações e seus equivalentes.

Claims (5)

1. APARELHO PARA GERAR UM SINAL ESTENDIDO DE LARGURA DE BANDA, caracterizado por compreender: pelo menos um dispositivo de processamento configurado para: - executar enchimento de ruído (1030) em um espectro de baixa frequência decodificado, e - executar processamento antidispersão (1050) mediante o qual um valor constante é inserido em coeficientes espectrais reconstruído à zero no espectro de baixa frequência decodificado no qual o enchimento de ruído é executado, e - gerar um espectro de alta frequência (1060) mediante usar espectro de baixa frequência decodificado no qual o processamento antidispersão é realizado, - no qual a amplitude constante é inserida baseada em uma semente aleatória.
2. Aparelho, de acordo com a reivindicação 1, caracterizado por a amplitude constante possuir um sinal aleatório
3. Aparelho, de acordo com a reivindicação 1, caracterizado por o dispositivo de processamento ser configurado para gerar o espectro de alta frequência baseada em um tipo de excitação incluído em um fluxo de bits
4. Aparelho, de acordo com a reivindicação 3, caracterizado por o tipo de excitação ser determinado em unidades de quadro.
5. Aparelho, de acordo com a reivindicação 3, caracterizado por o tipo de excitação ser gerado mediante a utilização de 2 bits.
BR122021019877-2A 2011-06-30 2012-07-02 Aparelho para gerar um sinal estendido de largura de banda BR122021019877B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161503241P 2011-06-30 2011-06-30
US61/503,241 2011-06-30
PCT/KR2012/005258 WO2013002623A2 (ko) 2011-06-30 2012-07-02 대역폭 확장신호 생성장치 및 방법

Publications (1)

Publication Number Publication Date
BR122021019877B1 true BR122021019877B1 (pt) 2022-07-19

Family

ID=47424723

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122021019883-7A BR122021019883B1 (pt) 2011-06-30 2012-07-02 Método de gerar um sinal estendido de largura de banda, e mídia não transitória legível por computador
BR122021019877-2A BR122021019877B1 (pt) 2011-06-30 2012-07-02 Aparelho para gerar um sinal estendido de largura de banda
BR112013033900-4A BR112013033900B1 (pt) 2011-06-30 2012-07-02 Método para gerar um sinal estendido de largura de banda para decodificação de áudio

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR122021019883-7A BR122021019883B1 (pt) 2011-06-30 2012-07-02 Método de gerar um sinal estendido de largura de banda, e mídia não transitória legível por computador

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR112013033900-4A BR112013033900B1 (pt) 2011-06-30 2012-07-02 Método para gerar um sinal estendido de largura de banda para decodificação de áudio

Country Status (12)

Country Link
US (3) US9349380B2 (pt)
EP (1) EP2728577A4 (pt)
JP (3) JP6001657B2 (pt)
KR (3) KR102078865B1 (pt)
CN (3) CN103843062B (pt)
AU (3) AU2012276367B2 (pt)
BR (3) BR122021019883B1 (pt)
CA (2) CA2840732C (pt)
MX (3) MX350162B (pt)
TW (3) TWI619116B (pt)
WO (1) WO2013002623A2 (pt)
ZA (1) ZA201400704B (pt)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122021019883B1 (pt) * 2011-06-30 2023-03-14 Samsung Electronics Co., Ltd Método de gerar um sinal estendido de largura de banda, e mídia não transitória legível por computador
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
PT2951818T (pt) * 2013-01-29 2019-02-25 Fraunhofer Ges Forschung Conceito de preenchimento de ruído
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6633547B2 (ja) * 2014-02-17 2020-01-22 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法
JP6383000B2 (ja) 2014-03-03 2018-08-29 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張のための高周波復号方法及びその装置
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
KR102653849B1 (ko) * 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
KR102121642B1 (ko) * 2014-03-31 2020-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
CN105336336B (zh) * 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3435376B1 (en) * 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
KR102457573B1 (ko) * 2021-03-02 2022-10-21 국방과학연구소 잡음 신호 생성 장치 및 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램
KR102473886B1 (ko) 2021-11-25 2022-12-06 한국프리팩 주식회사 친환경 발포 다층시트, 이를 이용한 아이스팩 및 그의 제조방법
KR102574372B1 (ko) 2023-01-26 2023-09-05 한국프리팩 주식회사 공압출된 친환경 발포 다층필름 및 이를 이용한 아이스팩

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5857759B2 (ja) * 1979-10-01 1983-12-21 日本電信電話株式会社 駆動音源信号発生装置
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer
US6029125A (en) 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
CA2417499A1 (en) * 2000-07-27 2002-02-07 Activated Content Corporation Stegotext encoder and decoder
KR100510434B1 (ko) * 2001-04-09 2005-08-26 니폰덴신뎅와 가부시키가이샤 Ofdm신호전달 시스템, ofdm신호 송신장치 및ofdm신호 수신장치
US20050004803A1 (en) * 2001-11-23 2005-01-06 Jo Smeets Audio signal bandwidth extension
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
NZ562182A (en) 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
DK3401907T3 (da) * 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
EP2410522B1 (en) * 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
PL2304719T3 (pl) * 2008-07-11 2017-12-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, sposoby dostarczania strumienia audio oraz program komputerowy
TWI419148B (zh) * 2008-10-08 2013-12-11 Fraunhofer Ges Forschung 多解析度切換音訊編碼/解碼方案
CA3076203C (en) * 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
ES2758370T3 (es) * 2011-03-10 2020-05-05 Ericsson Telefon Ab L M Relleno de subvectores no codificados en señales de audio codificadas por transformada
CN105825859B (zh) * 2011-05-13 2020-02-14 三星电子株式会社 比特分配、音频编码和解码
BR122021019883B1 (pt) * 2011-06-30 2023-03-14 Samsung Electronics Co., Ltd Método de gerar um sinal estendido de largura de banda, e mídia não transitória legível por computador

Also Published As

Publication number Publication date
WO2013002623A2 (ko) 2013-01-03
AU2016202120A1 (en) 2016-04-28
KR102343332B1 (ko) 2021-12-24
MX340386B (es) 2016-07-07
CA2840732A1 (en) 2013-01-03
JP2018025830A (ja) 2018-02-15
US10037766B2 (en) 2018-07-31
EP2728577A2 (en) 2014-05-07
BR112013033900A2 (pt) 2017-12-12
EP2728577A4 (en) 2016-07-27
US9349380B2 (en) 2016-05-24
KR20200019164A (ko) 2020-02-21
TW201715513A (zh) 2017-05-01
AU2017202211B2 (en) 2018-01-18
JP2014523548A (ja) 2014-09-11
CN106128473A (zh) 2016-11-16
MX370012B (es) 2019-11-28
CN103843062B (zh) 2016-10-05
TWI576832B (zh) 2017-04-01
TW201401268A (zh) 2014-01-01
JP6247358B2 (ja) 2017-12-13
US20160247519A1 (en) 2016-08-25
CN106157968A (zh) 2016-11-23
CN103843062A (zh) 2014-06-04
CN106128473B (zh) 2019-12-10
CA2966987A1 (en) 2013-01-03
US20170345443A1 (en) 2017-11-30
MX350162B (es) 2017-08-29
CA2840732C (en) 2017-06-27
JP6001657B2 (ja) 2016-10-05
AU2012276367A1 (en) 2014-01-30
CA2966987C (en) 2019-09-03
JP6599419B2 (ja) 2019-10-30
TW201743320A (zh) 2017-12-16
ZA201400704B (en) 2021-05-26
WO2013002623A4 (ko) 2013-06-06
CN106157968B (zh) 2019-11-29
KR102240271B1 (ko) 2021-04-14
WO2013002623A3 (ko) 2013-04-11
KR102078865B1 (ko) 2020-02-19
BR112013033900B1 (pt) 2022-03-15
AU2012276367B2 (en) 2016-02-04
MX2014000161A (es) 2014-02-19
KR20200143665A (ko) 2020-12-24
TWI605448B (zh) 2017-11-11
AU2016202120B2 (en) 2017-01-05
US9734843B2 (en) 2017-08-15
TWI619116B (zh) 2018-03-21
BR122021019883B1 (pt) 2023-03-14
AU2017202211C1 (en) 2018-08-02
KR20130007485A (ko) 2013-01-18
US20140188464A1 (en) 2014-07-03
AU2017202211A1 (en) 2017-04-27
JP2016197271A (ja) 2016-11-24

Similar Documents

Publication Publication Date Title
US10037766B2 (en) Apparatus and method for generating bandwith extension signal
US8527265B2 (en) Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
ES2644967T3 (es) Extensión adaptativa del ancho de banda y aparato para la misma
ES2967508T3 (es) Aparato y procedimiento de codificación de extensión de ancho de banda de alta frecuencia
BRPI0607691B1 (pt) método e equipamento para codificação de fala em banda larga
BR112015025009B1 (pt) Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 02/07/2012, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.