BRPI0707135A2

BRPI0707135A2 - apparatus and method for signal coding and decoding

Info

Publication number: BRPI0707135A2
Application number: BRPI0707135-3A
Authority: BR
Inventors: Won Jung Yang; O Oh Hyun; Jin Kim Hyo; Jong Choi Seung; Geum Lee Dong; Goo Kang Hong; Seong Lee Jae
Original assignee: Lg Electronics Inc.
Priority date: 2006-01-18
Filing date: 2007-01-18
Publication date: 2011-04-19
Also published as: KR20080101872A; US20110057818A1; EP1984911A1; AU2007206167B2; JP2009524100A; WO2007083934A1; KR20080097178A; JP2009524099A; EP1989703A1; US20090222261A1; US20090281812A1; JP2009524101A; WO2007083933A1; EP1989702A4; TW200746051A; MX2008009088A; CA2636493A1; WO2007083931A1; EP1989703A4; TWI318397B

Abstract

APARELHO E MéTODO PARA CODIFICAçãO E DECODIFICAçãO DE SINAL. São fornecidos aparelhos de codificação e de decodificação e métodos para codificação e decodificação. O método de decodificação inclui extrair uma pluralidade de sinais codificados de um fluxo contínuo de bits de entrada, determinar qual de uma pluralidade de métodos de decodificação deve ser usado para decodificar cada um dos sinais codificados, decodificar os sinais codificados usando os métodos de decodificação determinados e sintetizar os sinais decodificados. Dessa maneira, é possível codificar sinais com diferentes características em uma taxa de bits ideal pela classificação dos sinais em uma ou mais classes de acordo com as características dos sinais e é possível codificar cada um dos sinais usando uma unidade de codificação que pode mais bem servir à classe à qual um sinal correspondente pertence. Além do mais, é possível codificar eficientemente vários sinais que incluem sinais de áudio e de fala.APPARATUS AND METHOD FOR SIGNAL CODING AND DECODING. Encoding and decoding devices and methods for encoding and decoding are provided. The decoding method includes extracting a plurality of encoded signals from a continuous stream of input bits, determining which of a plurality of decoding methods should be used to decode each of the encoded signals, decoding the encoded signals using the determined decoding methods and synthesize the decoded signals. In this way, it is possible to encode signals with different characteristics at an ideal bit rate by classifying the signals into one or more classes according to the characteristics of the signals and it is possible to encode each of the signals using a coding unit that can best serve to the class to which a corresponding signal belongs. Furthermore, it is possible to efficiently encode various signals including audio and speech signals.

Description

"APARELHO E MÉTODO PARA CODIFICAÇÃO EDECODIFICAÇÃO DE SINAL""APPARATUS AND METHOD FOR SIGNAL coding and coding"

CAMPO TÉCNICOTECHNICAL FIELD

A presente invenção diz respeito a aparelhos decodificação e de decodificação e a métodos para codificaçãoe decodificação e, mais particularmente, a aparelhos de co-dificação e de decodificação e métodos para codificação edecodificação que podem codificar ou decodificar sinais emuma taxa de bits ideal de acordo com as características dossinais.The present invention relates to decoding and decoding apparatus and methods for encoding and decoding, and more particularly to coding and decoding apparatus and methods for encoding and decoding which can encode or decode signals at an optimal bit rate according to the characteristics of the signs.

ANTECEDENTES DA INVENÇÃOBACKGROUND OF THE INVENTION

Codificadores de áudio convencionais podem forne-cer sinais de áudio de alta qualidade em uma alta taxa debits de 48 kbps ou mais, mas são ineficientes para processarsinais de fala. Por outro lado, codificadores de fala con-vencionais podem codificar efetivamente sinais de fala emuma baixa taxa de bits de 12 kbps ou menos, mas são insufi-cientes para codificar vários sinais de áudio.Conventional audio encoders can provide high quality audio signals at a high rate of 48 kbps or higher, but are inefficient for speech processing. Conversely, conventional speech encoders can effectively encode speech signals at a low bit rate of 12 kbps or less, but are insufficient to encode various audio signals.

DIVULGAÇÃO DA INVENÇÃODISCLOSURE OF INVENTION

PROBLEMA TÉCNICOTECHNICAL PROBLEM

A presente invenção fornece aparelhos de codifica-ção e de decodificação e métodos para codificação e decodi-ficação que podem codificar ou decodificar sinais (por exem-plo, sinais de fala e de áudio) com diferentes característi-cas em uma taxa de bits ideal.The present invention provides encoding and decoding apparatus and methods for encoding and decoding which can encode or decode signals (e.g., speech and audio signals) with different characteristics at an optimal bit rate. .

SOLUÇÃO TÉCNICATECHNICAL SOLUTION

De acordo com um aspecto da presente invenção, éfornecido um método para decodificação que inclui extrairuma pluralidade de sinais codificados de um fluxo continuode bits de entrada, determinar qual de uma pluralidade demétodos para decodificação deve ser usado para decodificarcada um dos sinais codificados, decodificar os sinais codi-ficados usando os métodos para decodificação determinados esintetizar os sinais decodificados.According to one aspect of the present invention, there is provided a method for decoding which includes extracting a plurality of encoded signals from a continuous stream of input bits, determining which of a plurality of decoding methods should be used to decode each of the encoded signals, to decode the signals. encoded using the decoding methods determined to synthesize the decoded signals.

De acordo com um outro aspecto da presente inven-ção, é fornecido um aparelho de decodificação que inclui ummódulo de desempacotamento de bits que extrai uma pluralida-de de sinais codificados de um fluxo continuo de bits de en-trada, um módulo de determinação do decodificador que deter-mina qual de uma pluralidade de unidades de decodificaçãodeve ser usada para decodificar cada um dos sinais codifica-dos, um módulo de decodificação que inclui as unidades dedecodificação e decodifica os sinais codificados usando asunidades de decodificação determinadas, e um módulo de sin-tetização que sintetiza os sinais decodificados.According to another aspect of the present invention, a decoding apparatus is provided which includes a bit unwrapping module that extracts a plurality of encoded signals from a continuous stream of input bits, a module for determining decoder which determines which of a plurality of decoding units should be used to decode each of the encoded signals, a decoding module that includes the decoding units and decodes the encoded signals using the determined decoding units, and a sync module. -testing that synthesizes the decoded signals.

De acordo com um outro aspecto da presente inven-ção, é fornecido um método para codificação que inclui divi-dir um sinal de entrada em uma pluralidade de sinais dividi-dos, determinar qual de uma pluralidade de métodos para co-dificação deve ser usado para codificar cada um dos sinaisdivididos com base nas características de cada um dos sinaisdivididos, codificar os sinais divididos usando os métodosde codificação determinados, e gerar um fluxo contínuo debits com base nos sinais divididos codificados.In accordance with another aspect of the present invention, there is provided a method for encoding which includes splitting an input signal into a plurality of divided signals, determining which of a plurality of co-diffusion methods should be used. To encode each of the split signals based on the characteristics of each of the split signals, encode the split signals using the determined encoding methods, and generate a continuous stream debits based on the encoded split signals.

De acordo com um outro aspecto da presente inven-ção, é fornecido um aparelho de codificação que inclui ummódulo de divisão de sinal que divide um sinal de entrada emuma pluralidade de sinais divididos, um módulo de determina-ção do codificador que determina qual de uma pluralidade deunidades de codificação deve ser usada para codificar cadaum dos sinais divididos com base nas características de cadaum dos sinais divididos, um módulo de codificação que incluias unidades de codificação e codifica os sinais divididosusando as unidades de codificação determinadas, e um módulode empacotamento de bits que gera um fluxo contínuo de bitscom base nos sinais divididos codificados.According to another aspect of the present invention, there is provided a coding apparatus including a signal splitting module that splits an input signal into a plurality of divided signals, an encoder determining module which determines which of a A plurality of coding units shall be used to encode each of the split signals based on the characteristics of each of the split signals, a coding module which includes coding units and coding the divided signals using the given coding units, and a bit wrapping module which generates a continuous stream of bits based on the coded split signals.

EFEITOS VANTAJOSOSADVANTABLE EFFECTS

Dessa maneira, é possível codificar sinais com di-ferentes características em uma taxa de bits ideal pelaclassificação dos sinais em uma ou mais classes de acordocom as características dos sinais, e codificar cada um dossinais usando uma unidade de codificação que pode mais bemservir à classe à qual um sinal correspondente pertence. A-lém do mais, é possível codificar eficientemente vários si-nais, incluindo sinais de áudio e de fala.In this way, it is possible to encode signals with different characteristics at an optimal bit rate by classifying the signals into one or more classes according to the characteristics of the signals, and encode each signal using a coding unit that can best suit the class at the same time. which a corresponding signal belongs. Moreover, it is possible to efficiently encode various signals, including audio and speech signals.

DESCRIÇÃO RESUMIDA DOS DESENHOSBRIEF DESCRIPTION OF DRAWINGS

A figura 1 é um diagrama de blocos de um aparelhode codificação de acordo com uma modalidade da presente in-venção;Figure 1 is a block diagram of a coding apparatus in accordance with one embodiment of the present invention;

a figura 2 é um diagrama de blocos de uma modali-dade de um módulo de classificação ilustrado na figura 1;Fig. 2 is a block diagram of one embodiment of a classification module illustrated in Fig. 1;

a figura 3 é um diagrama de blocos de uma modali-dade de uma unidade de pré-processamento ilustrada na figura2;a figura 4 é um diagrama de blocos de um aparelhopara calcular a entropia perceptiva de um sinal de entrada,de acordo com uma modalidade da presente invenção;Figure 3 is a block diagram of a embodiment of a preprocessing unit illustrated in Figure 2. Figure 4 is a block diagram of an apparatus for calculating the perceptual entropy of an input signal according to one embodiment. of the present invention;

a figura 5 é um diagrama de blocos de uma outramodalidade do módulo de classificação ilustrado na figura 1;Fig. 5 is a block diagram of another embodiment of the classification module shown in Fig. 1;

a figura 6 é um diagrama de blocos de uma modali-dade de uma unidade de divisão de sinal ilustrada na figura 5;Fig. 6 is a block diagram of one embodiment of a signal division unit shown in Fig. 5;

as figuras 7 e 8 são diagramas para explicar méto-dos para mesclar uma pluralidade de sinais divididos, de a-cordo com modalidades da presente invenção;Figures 7 and 8 are diagrams for explaining methods for merging a plurality of split signals in accordance with embodiments of the present invention;

a figura 9 é um diagrama de blocos de uma outramodalidade da unidade de divisão de sinal ilustrada na figura 5 ;Figure 9 is a block diagram of another mode of the signal splitting unit shown in Figure 5;

a figura 10 é um diagrama para explicar um métodopara dividir um sinal de entrada em uma pluralidade de si-nais divididos, de acordo com uma modalidade da presente in-venção;Figure 10 is a diagram for explaining a method for dividing an input signal into a plurality of divided signals according to one embodiment of the present invention;

a figura 11 é um diagrama de blocos de uma modali-dade de uma unidade de determinação ilustrada na figura 5;Fig. 11 is a block diagram of one embodiment of a unit of determination illustrated in Fig. 5;

a figura 12 é um diagrama de blocos de uma modali-dade de uma unidade de codificação ilustrada na figura 1;Fig. 12 is a block diagram of one embodiment of a coding unit illustrated in Fig. 1;

a figura 13 é um diagrama de blocos de uma outramodalidade da unidade de codificação ilustrada na figura 1;Figure 13 is a block diagram of another embodiment of the coding unit shown in Figure 1;

a figura 14 é um diagrama de blocos de um aparelhode codificação de acordo com uma outra modalidade da presen-te invenção;Fig. 14 is a block diagram of a coding apparatus according to another embodiment of the present invention;

a figura 15 é um diagrama de blocos de um aparelhode decodificação de acordo com uma modalidade da presenteinvenção; eFigure 15 is a block diagram of a decoding apparatus according to one embodiment of the present invention; and

a figura 16 é um diagrama de blocos de uma modali-dade de uma unidade de sintetização ilustrada na figura 15.Figure 16 is a block diagram of one embodiment of a synthesizer unit shown in Figure 15.

MELHOR MODO PARA REALIZAR A INVENÇÃOBEST MODE FOR CARRYING OUT THE INVENTION

A seguir, a presente invenção será descrita maiscompletamente em relação aos desenhos anexos, nos quais mo-dalidades exemplares da invenção são mostradas.In the following, the present invention will be described more fully with reference to the accompanying drawings, in which exemplary embodiments of the invention are shown.

A figura 1 é um diagrama de blocos de um aparelhode codificação de acordo com uma modalidade da presente in-venção. Em relação à figura 1, o aparelho de codificação in-clui um módulo de classificação 100, um módulo de codifica-ção 200 e um módulo de empacotamento de bits 300.Figure 1 is a block diagram of a coding apparatus in accordance with one embodiment of the present invention. Referring to Figure 1, the coding apparatus includes a rating module 100, a coding module 200 and a bit wrapping module 300.

O módulo de codificação 200 inclui uma pluralidadeda primeira até m-ésima unidades de codificação 210 e 220que realiza diferentes métodos de codificação.The coding module 200 includes a plurality of the first through m-th coding units 210 and 220 which performs different coding methods.

O módulo de classificação 100 divide um sinal deentrada em uma pluralidade de sinais divididos e casa cadaum dos sinais divididos com uma da primeira até m-ésima uni-dades de codificação 210 e 220. Algumas da primeira até m-ésima unidades de codificação 210 e 220 podem ser casadascom dois ou mais sinais divididos ou sinais não divididos.The classification module 100 splits an input signal into a plurality of split signals and each of the split signals has one of the first to the most coding units 210 and 220. Some of the first to the most coding units 210 and 220 may be married to two or more divided signals or undivided signals.

O módulo de classificação 100 pode alocar umaquantidade de bits para codificar cada um dos sinais dividi-dos ou pode determinar a ordem na qual os sinais divididosdevem ser codificados.The rating module 100 may allocate a number of bits to encode each of the divided signals or may determine the order in which the divided signals shall be encoded.

O módulo de codificação 200 codifica cada um dossinais divididos usando qualquer uma da primeira até m-ésimaunidades de codificação 210 e 220 que esteja casada com umsinal dividido correspondente. O módulo de classificação 100analisa as características de cada um dos sinais divididos eescolhe uma da primeira até m-ésima unidades de codificação210 e 220 que pode codificar mais eficientemente cada um dossinais divididos de acordo com os resultados da análise.The coding module 200 encodes each split signal using any of the first up to m-coding units 210 and 220 which is matched to a corresponding split signal. The rating module 100 analyzes the characteristics of each of the divided signals and chooses one of the first to mth coding units 210 and 220 which can more efficiently encode each divided signal according to the results of the analysis.

Uma unidade de codificação que pode codificar maiseficientemente um sinal dividido pode ser considerada capazde alcançar uma maior eficiência de compressão.A coding unit that can more efficiently encode a divided signal can be considered capable of achieving higher compression efficiency.

Por exemplo, um sinal dividido que pode ser facil-mente modelado como um coeficiente e um resíduo pode ser e-ficientemente codificados por um codificador de fala, e umsinal dividido que não pode ser modelado facilmente como umcoeficiente e um resíduo pode ser eficientemente codificadopor um codificador de áudio.For example, a divided signal that can easily be modeled as a coefficient and a residue can be effectively coded by a speech coder, and a divided signal that cannot be easily modeled as a coefficient and a residue can be efficiently coded by a audio encoder.

Se a proporção da energia de um resíduo obtido pe-la modelagem de um sinal dividido em relação à energia dosinal dividido for menor do que um limite pré-definido, osinal dividido pode ser considerado um sinal que pode serfacilmente modelado.If the ratio of the energy of a residue obtained by modeling a divided signal to the divided signal energy is less than a predefined limit, the divided signal can be considered a signal that can be easily modeled.

Já que um sinal dividido que exibe uma alta redun-dância em um eixo geométrico de tempo pode ser bem modeladousando um método de prognóstico linear no qual um sinal atu-al é prognosticado com base em um sinal anterior, ele podeser codificado mais eficientemente por um codificador de fa-la que usa um método de codificação de prognóstico linear.Since a divided signal that exhibits a high redundancy on a time axis can be well modeled using a linear prediction method in which an actual signal is predicted based on an earlier signal, it can be more efficiently encoded by a do it using a linear prognostic coding method.

0 módulo de empacotamento de bits 300 gera um flu-xo contínuo de bits a ser transmitido com base em sinais di-vididos codificados fornecidos pelo módulo de codificação200 e em informação de codificação adicional que consideraos sinais divididos codificados. 0 módulo de empacotamentode bits 300 pode gerar um fluxo continuo de bits com uma ta-xa de bits variável usando um método do bit plano ou um mé-todo de codificação aritmética fatiada de bits.Bit wrapping module 300 generates a continuous stream of bits to be transmitted based on coded split signals provided by coding module 200 and additional coding information which considers coded split signals. Bit packaging module 300 can generate a continuous stream of bits with a variable bit rate using a flat bit method or a sliced arithmetic coding method.

Sinais ou larguras de banda divididos que não sãocodificados em função das restrições da taxa de bits podemser restaurados a partir de sinais ou de larguras de bandadecodificados fornecidos por um decodificador que usa um mé-todo de interpolação, de extrapolação ou de replicação. Tam-bém, informação de compensação que considera sinais dividi-dos que não são codificados pode ser incluída em um fluxocontínuo de bits a ser transmitido.Divided signals or bandwidths that are not coded due to bit rate constraints may be restored from decoded signals or bandwidths provided by a decoder using an interpolation, extrapolation or replication method. Also, compensation information that considers split signals that are not encoded can be included in a continuous bit stream to be transmitted.

Em relação à figura 1, o módulo de classificação110 pode incluir uma pluralidade da primeira até n-ésima u-nidades de classificação 110 e 120. Cada uma da primeira atén-ésima unidades de classificação 110 e 120 pode dividir osinal de entrada em uma pluralidade de sinais divididos,converter um domínio dos sinal de entrada, extrair as carac-terísticas do sinal de entrada, classificar o sinal de en-trada de acordo com as características do sinal de entrada,ou casar o sinal de entrada com uma da primeira até m-ésimaunidades de codificação 210 e 220.Referring to Figure 1, the classification module 110 may include a plurality of the first to nth grading units 110 and 120. Each of the first to the nth grading units 110 and 120 may divide the input signals into a plurality. split signal, convert a domain of the input signal, extract the characteristics of the input signal, classify the input signal according to the characteristics of the input signal, or match the input signal with one of the first to m-es coding units 210 and 220.

Uma da primeira até n-ésima unidades de classifi-cação 110 e 120 pode ser uma unidade de pré-processamentoque realiza uma operação de pré-processamento no sinal deentrada para que o sinal de entrada possa ser convertido emum sinal que pode ser eficientemente codificado. A unidadede pré-processamento pode dividir o sinal de entrada em umapluralidade de componentes, por exemplo, um componente decoeficiente e um componente de sinal, e pode realizar umaoperação de pré-processamento no sinal de entrada antes queas outras unidades de classificação realizem suas operações.One of the first through nth grading units 110 and 120 may be a preprocessing unit which performs a preprocessing operation on the input signal so that the input signal can be converted into an efficiently encoding signal. The preprocessing unit may divide the input signal into a plurality of components, for example, an efficient component and a signal component, and may perform a preprocessing operation on the input signal before other rating units perform their operations.

O sinal de entrada pode ser pré-processado seleti-vamente de acordo com as características do sinal de entra-da, de acordo com fatores ambientais externos e de acordocom a taxa de bits alvo, e somente parte de uma pluralidadede sinais divididos obtidos a partir do sinal de entrada po-de ser seletivamente pré-processada.The input signal may be preprocessed selectively according to the characteristics of the input signal, according to external environmental factors and according to the target bit rate, and only part of a plurality of split signals obtained from the input signal. input signal can be selectively preprocessed.

O módulo de classificação 100 pode classificar osinal de entrada de acordo com a informação de caracter!sti-ca perceptiva do sinal de entrada fornecida por um módulo demodelagem psicoacústica 400. Exemplos da informação de ca-racterística perceptiva incluem um limite de mascaramento,uma proporção de sinal por máscara (SMR) e entropia percep-tiva.The rating module 100 may classify the input signals according to the perceptual characteristic information of the input signal provided by a psychoacoustic modeling module 400. Examples of the perceptive characteristic information include a masking limit, a ratio Signal Mask (SMR) and Perceptual Entropy.

Em outras palavras, o módulo de classificação 100pode dividir o sinal de entrada em uma pluralidade de sinaisdivididos ou pode.casar cada um dos sinais divididos com umaou mais da primeira até m-ésima unidades de codificação 210até 220 de acordo com a informação de característica percep-tiva do sinal de entrada, por exemplo, um limite de mascara-mento e uma SNR do sinal de entrada.In other words, the classification module 100 may divide the input signal into a plurality of split signals or may match each of the split signals with one or more of the first to mth coding units 210 to 220 according to the perceptual characteristic information. -activating the input signal, for example a masking limit and an SNR of the input signal.

Além do mais, o módulo de classificação 100 podereceber informação, tais como a tonalidade, taxa de cruza-mento de zero (ZCR) e coeficiente de prognóstico linear dosinal de entrada, e informação de classificação dos quadrosanteriores, e pode classificar o sinal de entrada de acordocom a informação recebida.In addition, the rating module 100 can receive information such as tone, zero crossing rate (ZCR) and input signal linear prognostic coefficient, and previous frame rating information, and can classify the input signal. according to the information received.

Em relação à figura 1, a informação de resultadocodificada transmitida pelo módulo de codificação 200 podeser realimentada no módulo de classificação 100.Referring to Figure 1, the coded result information transmitted by the coding module 200 may be fed back to the rating module 100.

Já que o sinal de entrada é dividido em uma plura-lidade de sinais divididos pelo módulo de classificação 100e determina-se por qual da primeira até m-ésima unidades decodificação 210 e 220, com qual quantidade de bits, e emqual ordem os sinais divididos devem ser codificados, os si-nais divididos são codificados de acordo com os resultadosda determinação. Uma quantidade de bits realmente usada paracodificar cada um dos sinais divididos pode não ser, neces-sariamente, a mesma quantidade de bits alocada pelo módulode classificação 100.Since the input signal is divided into a plurality of signals divided by the classification module 100e, it is determined by which of the first to mth decoding units 210 and 220, by what amount of bits, and in what order the divided signals. must be encoded, the divided signals are encoded according to the results of the determination. An amount of bits actually used to encode each of the divided signals may not necessarily be the same amount of bits allocated by the rating module 100.

Informação que especifica a diferença entre aquantidade de bits realmente usada e a quantidade de bitsalocada pode ser realimentada no módulo de classificação 100para que o módulo de classificação 100 possa aumentar aquantidade de bits alocada para outros sinais divididos. Sea quantidade de bits realmente usada for maior do que aquantidade de bits alocada, o módulo de classificação 100pode reduzir a quantidade de bits alocada para outros sinaisdivididos.Information that specifies the difference between the actual amount of bits used and the amount of bits allocated can be fed back to the rating module 100 so that the rating module 100 can increase the amount of bits allocated to other split signals. If the amount of bits actually used is larger than the allocated bit size, the rating module 100 can reduce the amount of bits allocated to other split signals.

Uma unidade de codificação que realmente codificaum sinal dividido pode não ser, necessariamente, a mesma u-nidade de codificação que é casada com o sinal dividido pelomódulo de classificação 100. Neste caso, a informação podeser realimentada no módulo de classificação 100, indicandoque uma unidade de codificação que realmente codifica um si-nal dividido é diferente de uma unidade de codificação casa-da com o sinal dividido pelo módulo de classificação 100.Então, o módulo de classificação 100 pode casar o sinal di-vidido com uma unidade de codificação diferente da unidadede codificação anteriormente casada com o sinal dividido.A coding unit that actually encodes a split signal may not necessarily be the same coding unit that is matched to the split signal by rating module 100. In this case, information may be fed back into rating module 100, indicating that a unit coding that actually encodes a divided signal is different from a coding unit matched by the signal divided by the rating module 100. Then, the rating module 100 can match the divided signal with a different coding unit of the coding unit previously married to the divided signal.

O módulo de classificação 100 pode dividir nova-mente o sinal de entrada em uma pluralidade de sinais divi-didos de acordo com a informação de resultado codificada ne-le realimentada. Neste caso, o módulo de classificação 100pode obter uma pluralidade de sinais divididos com uma es-trutura diferente daquela dos sinais divididos previamenteobtidos.The rating module 100 may further divide the input signal into a plurality of divided signals according to the newly encoded result information and feedback. In this case, the classification module 100 can obtain a plurality of split signals with a different structure than the previously obtained split signals.

Se uma operação de codificação escolhida pelo mó-dulo de classificação 100 diferir de uma operação de codifi-cação que é realmente realizada, informação que considera asdiferenças entre elas pode ser realimentada no módulo declassificação 100 para que o módulo de classificação 100possa determinar novamente a informação relacionada à opera-ção de codificação.If a coding operation chosen by the rating module 100 differs from a coding operation that is actually performed, information that considers the differences between them may be fed back to the rating module 100 so that the rating module 100 can redetermine the information. related to the coding operation.

A figura 2 é um diagrama de blocos de uma modali-dade de um módulo de classificação 100 ilustrado na figura1. Em relação à figura 2, a primeira unidade de classifica-ção pode ser uma unidade de pré-processamento que realizauma operação de pré-processamento em um sinal de entrada pa-ra que o sinal de entrada possa ser efetivamente codificado.Fig. 2 is a block diagram of one embodiment of a rating module 100 illustrated in Fig. 1. Referring to Figure 2, the first sorting unit may be a preprocessing unit that performs a preprocessing operation on an input signal so that the input signal can be effectively encoded.

Em relação à figura 2, a primeira unidade de clas-sificação 110 pode incluir uma pluralidade do primeiro atén-ésimo pré-processadores 111 e 112 que realiza diferentesmétodos de pré-processamento. A primeira unidade de classi-ficação 110 pode usar um do primeiro até n-ésimo pré-processadores 111 e 112 para realizar o pré-processamento emum sinal de entrada de acordo com as características do si-nal de entrada, de acordo com fatores ambientais externos ede acordo com uma taxa de bits alvo. Também, a unidade declassificação 110 pode realizar duas ou mais operações depré-processamento no sinal de entrada usando o primeiro atén-ésimo pré-processadores 111 e 112.Referring to Figure 2, the first classification unit 110 may include a plurality of the first to the 11th preprocessors 111 and 112 which perform different preprocessing methods. The first rating unit 110 may use one of the first through nth preprocessors 111 and 112 to preprocess an input signal according to input signal characteristics according to environmental factors. and according to a target bitrate. Also, the downgrading unit 110 may perform two or more preprocessing operations on the input signal using the first through 11th preprocessors 111 and 112.

A figura 3 é um diagrama de blocos de uma modali-dade do primeiro até n-ésimo pré-processadores 111 e 112 i-lustrados na figura 2. Em relação à figura 3, um pré-processador inclui um extrator de coeficiente 113 e um ex-trator de resíduo 114.Figure 3 is a block diagram of a modality of the first through nth preprocessors 111 and 112 shown in Figure 2. Referring to Figure 3, a preprocessor includes a coefficient puller 113 and a waste extractor 114.

0 extrator de coeficiente 113 analisa um sinal deentrada e extrai do sinal de entrada um coeficiente que re-presenta as características do sinal de entrada. 0 extratorde resíduo 114 extrai do sinal de entrada um resíduo comcomponentes redundantes removidos usando o coeficiente ex-traído .The coefficient puller 113 analyzes an input signal and extracts from the input signal a coefficient that represents the characteristics of the input signal. Residue extractor 114 extracts from the input signal a residue with redundant components removed using the extracted coefficient.

O pré-processador pode realizar uma operação decodificação de prognóstico linear no sinal de entrada. Nestecaso, o extrator de coeficiente 113 extrai um coeficiente deprognóstico linear do sinal de entrada pela realização deanálise de prognóstico linear no sinal de entrada, e o ex-trator de resíduo 114 extrai um resíduo do sinal de entradausando o coeficiente de prognóstico linear fornecido peloextrator de coeficiente 113. 0 resíduo com redundância remo-vida pode ter o mesmo formato do ruído branco.The preprocessor can perform a linear prognostic decoding operation on the input signal. In this case, the coefficient extractor 113 extracts a linear prognostic coefficient from the input signal by performing linear prognostic analysis on the input signal, and the residual extractor 114 extracts a residue from the input signal using the linear prognostic coefficient provided by the input extractor. coefficient 113. The residual life-span redundancy may have the same shape as white noise.

A seguir, um método de análise de prognóstico li-near de acordo com uma modalidade da presente invenção serádescrito com detalhes.In the following, a li-near prognostic analysis method according to one embodiment of the present invention will be described in detail.

Um sinal prognosticado obtido pela análise deprognóstico linear pode ser composto por uma combinação li-near dos sinais de entrada anteriores, como indicado pelaEquação (1) :A predicted signal obtained by linear deprognostic analysis can be composed of a li-near combination of the previous input signals, as indicated by Equation (1):

Valor matemático 1Mathematical value 1

<formula>formula see original document page 13</formula><formula> formula see original document page 13 </formula>

em que ρ indica uma ordem do prognóstico linear, ιaté ρ indicam coeficientes de prognóstico linear que são ob-tidos pela minimização de um erro quadrático médio (MSE) en-tre um sinal de entrada e um sinal estimado.where ρ indicates a linear prognostic order, ιaté ρ indicates linear prognostic coefficients that are obtained by minimizing an average square error (MSE) between an input signal and an estimated signal.

Uma função de transferência P(z) para análise deprognóstico linear pode ser representada pela Equação (2):A transfer function P (z) for linear deprognostic analysis can be represented by Equation (2):

Valor matemático 2Em relação à figura 3, o pré-processador pode ex-trair um coeficiente de prognóstico linear e um resíduo deum sinal de entrada usando um método de codificação de prog-nóstico linear distorcido (WLPC), que é um outro tipo de a-5 nálise de prognóstico linear. 0 método WLPC pode ser reali-zado pela substituição de um atraso de unidade Z-1 por umfiltro passa tudo com uma função de transferência A(z). Afunção de transferência A(z) pode ser representada pela E-quação (3):Mathematical value 2In relation to Figure 3, the preprocessor can extract a linear prognostic coefficient and a residual of an input signal using a distorted linear prognostic (WLPC) coding method, which is another type of a -5 linear prognostic analysis. The WLPC method can be performed by replacing a Z-1 unit delay with an all-pass filter with a transfer function A (z). Transfer function A (z) can be represented by E-quation (3):

Valor matemático 3Mathematical value 3

<formula>formula see original document page 14</formula><formula> formula see original document page 14 </formula>

em que indica o coeficiente de um filtro passa tu-do. Pela variação do coeficiente do filtro passa tudo, épossível variar a resolução de um sinal a ser analisado. Porexemplo, se um sinal a ser analisado for altamente concen-trado em uma certa banda de freqüência, por exemplo, se osinal a ser analisado for um sinal de áudio que é altamenteconcentrado em uma banda de baixa freqüência, o sinal a seranalisado pode ser codificado eficientemente pelo ajuste docoeficiente passa tudo de maneira tal que a resolução dossinais da banda de baixa freqüência possa aumentar.where it indicates the coefficient of a filter passed all. By varying the filter coefficient passes everything, it is possible to vary the resolution of a signal to be analyzed. For example, if a signal to be analyzed is highly concentrated in a certain frequency band, for example, if the signal to be analyzed is an audio signal that is highly concentrated in a low frequency band, the signal to be analyzed can be encoded. efficiently by setting the efficient pass everything goes so that the resolution of low frequency band signals can increase.

No método WLPC, os sinais de baixa freqüência sãoanalisados com maior resolução do que os sinais de alta fre-qüência. Assim, o método WLPC pode alcançar alto desempenhode prognóstico para sinais de baixa freqüência e pode mode-lar melhor os sinais de baixa freqüência.In the WLPC method, low frequency signals are analyzed with higher resolution than high frequency signals. Thus, the WLPC method can achieve high prognostic performance for low frequency signals and can better model low frequency signals.

0 coeficiente passa tudo pode variar ao longo deum eixo geométrico de tempo de acordo com as característicasde um sinal de entrada, de acordo com os fatores ambientaisexternos e de acordo com uma taxa de bits alvo. Se o coefi-ciente passa tudo variar durante o tempo, um sinal de áudioobtido pela decodificação pode ser consideravelmente distor-cido. Assim, quando o coeficiente passa tudo varia, um méto-do de alisamento pode ser aplicado no coeficiente passa tudopara que o coeficiente passa tudo possa variar gradualmente,e aquela distorção de sinal pode ser minimizada. A faixa devalores que pode ser determinada como um valor de coeficien-te passa tudo atual pode ser determinada por valores de coe-ficiente passa tudo anteriores.The pass-all coefficient may vary along a geometric axis of time according to the characteristics of an input signal, according to external environmental factors and according to a target bit rate. If the coefficient passes everything varies over time, an audio signal obtained by decoding can be considerably distorted. Thus, when the pass-all coefficient varies, a smoothing method can be applied to the pass-all coefficient so that the pass-all coefficient can vary gradually, and that signal distortion can be minimized. The devalue range that can be determined as a current pass-all coefficient value can be determined by previous all-pass coefficient values.

Um limite de mascaramento, em vez de um sinal ori-ginal, pode ser usado como uma entrada para a estimação deum coeficiente de prognóstico linear. Mais especificamente,um limite de mascaramento pode ser convertido em um sinal dedomínio temporal, e WLPC pode ser realizada usando o sinalde domínio temporal como uma entrada. O prognóstico de umcoeficiente de prognóstico linear pode ser adicionalmenterealizado usando um resíduo como uma entrada. Em outras pa-lavras, a análise de prognóstico linear pode ser realizadamais de uma vez, desse modo, obtendo um resíduo adicional-mente embranquecido.A masking threshold, instead of an original signal, can be used as an input for estimating a linear prognostic coefficient. More specifically, a masking threshold can be converted to a time domain signal, and WLPC can be performed using the time domain signal as an input. The prognosis of a linear prognostic coefficient can be further accomplished using a residue as an input. In other words, linear prognostic analysis may be performed more than once, thereby obtaining an additionally whitened residue.

Em relação à figura 2, a primeira unidade de clas-sificação 110 pode incluir um primeiro pré-processador 111que realiza a análise de prognóstico linear supradescrita emrelação às Equações (1) e (2) e um segundo pré-processador(não mostrado) que realiza a WLPC. A primeira unidade declassificação 100 pode escolher um do primeiro processador111 e do segundo pré-processador, ou pode decidir não reali-zar a análise de prognóstico linear em um sinal de entradade acordo com as características do sinal de entrada, de a-cordo com os fatores ambientais externos e de acordo com umataxa de bits alvo.Referring to Figure 2, the first classification unit 110 may include a first preprocessor 111 which performs the above-described linear prognostic analysis with respect to Equations (1) and (2) and a second preprocessor (not shown) which performs the WLPC. The first declassification unit 100 may choose one from the first processor11 and the second preprocessor, or may decide not to perform linear prognostic analysis on an input signal according to the characteristics of the input signal according to the characteristics of the input. external environmental factors and according to a target bit rate.

Se o coeficiente passa tudo tiver um valor de 0, osegundo pré-processador pode ser o mesmo primeiro pré-processador 111. Neste caso, a primeira unidade de classifi-cação 110 pode incluir somente o segundo pré-processador eescolher um do método de análise de prognóstico linear e dométodo WLPC, de acordo com o valor do coeficiente passa tu-do. Também, a primeira unidade de classificação 110 pode re-alizar a análise de prognóstico linear ou qualquer um do mé-todo de análise de prognóstico linear e do método WLPC é es-colhido em unidades de quadros.If the pass-all coefficient has a value of 0, the second preprocessor may be the same as the first preprocessor 111. In this case, the first rating unit 110 may include only the second preprocessor and choose one of the analysis method. prediction method and WLPC method, according to the value of the passed coefficient. Also, the first classification unit 110 may perform linear prognostic analysis or any of the linear prognostic analysis method and the WLPC method is chosen in frame units.

Informação que indica se deve ser realizada análi-se de prognóstico linear e informação que indica qual do mé-todo de análise de prognóstico linear e dos métodos WLPC éescolhido podem ser incluídas em um fluxo contínuo de bits aser transmitido.Information indicating whether linear prognostic analysis should be performed and information indicating which of the linear prognostic analysis method and WLPC methods is chosen can be included in a continuous stream of bits to be transmitted.

O módulo de empacotamento de bits 300 recebe daprimeira unidade de classificação 110 um coeficiente deprognóstico linear, informação que indica se deve ser reali-zada codificação de prognóstico linear e informação que i-dentifica um codificador de prognóstico linear que é real-mente usado. Então, o módulo de empacotamento de bits 300insere todas as informações recebidas em um fluxo continuode bits a ser transmitido.Bit packaging module 300 receives from the first classification unit 110 a linear prediction coefficient, information indicating whether linear prediction coding should be performed and information indicating a linear prediction coder that is actually used. Then the bit marshaling module 300 inserts all information received into a stream of bits to be transmitted.

Uma quantidade de bits necessária para codificarum sinal de entrada em um sinal com uma qualidade de somquase indistinguivel daquela do sinal de entrada originalpode ser determinada pelo cálculo da entropia perceptiva dosinal' de entrada.The amount of bits required to encode an input signal into a signal with a sound quality almost indistinguishable from that of the original input signal can be determined by calculating the input dosing perceptual entropy.

A figura 4 é um diagrama de blocos de um aparelhopara calcular a entropia perceptiva de acordo com uma moda-lidade da presente invenção. Em relação à figura 4, o apare-lho inclui um banco de filtro 115, uma unidade de prognósti-co linear 116, uma unidade de modelagem psicoacústica 117,uma primeira unidade de cálculo de bits 118 e uma segundaunidade de cálculo de bits 119.Figure 4 is a block diagram of an apparatus for calculating perceptual entropy according to one embodiment of the present invention. Referring to Figure 4, the apparatus includes a filter bank 115, a linear prognostic unit 116, a psychoacoustic modeling unit 117, a first bit calculation unit 118 and a second bit calculation unit 119.

A entropia perceptiva PE de um sinal de entradapode ser calculada usando a Equação (4) :PE perceptual entropy of an input signal can be calculated using Equation (4):

Valor matemático 4:Mathematical value 4:

<formula>formula see original document page 17</formula><formula> formula see original document page 17 </formula>

em que X(ejw) incida o nivel de energia do sinal deentrada original, e T(ejw) indica um limite de mascaramento. .where X (ejw) affects the energy level of the original input signal, and T (ejw) indicates a masking limit. .

Em um método WLPC que envolve o uso de um filtropassa tudo, a entropia perceptiva de um sinal de entrada po-de ser calculada usando a proporção da energia de um resíduodo sinal de entrada por um limite de mascaramento do resí-duo. Mais especificamente, um aparelho de codificação queusa o método WLPC pode calcular a entropia perceptiva PE deum sinal de entrada usando a Equação (5) :In a WLPC method that involves the use of an all-pass filter, the perceptual entropy of an input signal can be calculated using the proportion of the energy of an input signal residue by a residue masking threshold. More specifically, a coding apparatus using the WLPC method can calculate the perceptual entropy PE of an input signal using Equation (5):

Valor matemático 5Mathematical value 5

<formula>formula see original document page 18</formula><formula> formula see original document page 18 </formula>

em que R(Qjw) indica a energia de um resíduo do si-nal de entrada e T(Qjw) indica um limite de mascaramento deum resíduo.where R (Qjw) indicates the energy of a input signal residue and T (Qjw) indicates a masking limit of a residue.

0 limite de mascaramento T(Qjw) pode ser represen-tado pela Equação (6):The masking limit T (Qjw) can be represented by Equation (6):

Valor matemático 6Mathematical value 6

em que T(Qjw) indica um limite de mascaramento deum sinal original e H(Qjw) indica uma função de transferên-cia para WLPC. A unidade de modelagem psicoacústica 320 podecalcular o limite de mascaramento T(Qjw) usando o limite demascaramento T(Qjw) em um domínio de banda de fator de esca-la e usando a função de transferência H(Qjw).where T (Qjw) indicates a masking limit of an original signal and H (Qjw) indicates a transfer function for WLPC. The psychoacoustic modeling unit 320 can calculate the masking limit T (Qjw) using the T oversize limit (Qjw) in a scaling factor band domain and using the H (Qjw) transfer function.

Em relação à figura 4, a primeira unidade de cál-culo de bits 118 recebe um resíduo obtido pela WLPC realiza-da pela unidade de prognóstico linear 116 e um limite demascaramento transmitido pela unidade de modelagem psicoa-cústica 117. 0 banco de filtro 116 pode realizar conversãode freqüência em um sinal original, e o resultado da conver-são de freqüência pode ser inserido na unidade de modelagempsicoacústica 117 e na segunda unidade de cálculo de bits119. O banco de filtro 115 pode realizar a transformada deFourier no sinal original.Referring to Fig. 4, the first bit calculation unit 118 receives a residue obtained by the WLPC realized by the linear predictor unit 116 and an over-limit transmitted by the psycho-acoustic modeling unit 117. The filter bank 116 It can perform frequency conversion on an original signal, and the result of frequency conversion can be entered into the acoustic-psycho-modeling unit 117 and the second bit calculation unit119. Filter bank 115 can perform the deFourier transform on the original signal.

A primeira unidade de cálculo de bits 118 podecalcular a entropia perceptiva usando a proporção de um li-mite de mascaramento do sinal original dividido por um es-pectro de uma função de transferência de um filtro de sínte-se WLPC pela energia do resíduo.The first bit computation unit 118 can calculate perceptual entropy using the ratio of an original signal masking limit divided by a spectrum of a WLPC synthesis filter transfer function by the energy of the residue.

A entropia perceptiva distorcida WPE de um sinalque é dividido em 60 ou mais bandas de partição não unifor-mes com diferentes larguras de banda pode ser calculada u-sando WLPC, como indicado pela Equação (7):WPE distorted perceptual entropy of a signal that is divided into 60 or more non-uniform partition bands with different bandwidths can be calculated using WLPC, as indicated by Equation (7):

Valor matemático 7Mathematical value 7

<formula>formula see original document page 19</formula><formula> formula see original document page 19 </formula>

em que b indica um índice de uma banda de partiçãoobtida usando um modelo psicoacústico, eres(b) indica a somadas energias dos resíduos na banda de partição b, w_low(b) ew_high (b) indicam, respectivamente, freqüências mais baixa emais alta na banda de partição b, Hbunear (w) indica um limitede mascaramento de uma banda de partição linearmente mapea-da, h(w)2 indica um espectro de energia de codificação deprognóstico linear (LPC) de um quadro e nbres(w) indica umlimite de mascaramento linear correspondente ao resíduo.where b indicates an index of a partition band obtained using a psychoacoustic model, eres (b) indicates the summed energies of the residuals in the partition band b, w_low (b) and w_high (b) respectively indicate lower and higher frequencies in the partition band b, Hbunear (w) indicates a limitede masking of a linearly mapped partition band, h (w) 2 indicates a linear deprognostic encoding energy spectrum (LPC) of a frame and nbres (w) indicates a limit of linear masking corresponding to the residue.

Por outro lado, a entropia perceptiva distorcidaWPEsub de um sinal que é dividido em 60 ou mais bandas departição uniformes com a mesma largura de banda pode sercalculada usando WLPC, como indicado pela Equação (8):Valor matemático 8On the other hand, the distorted perceptual entropyWPEsub of a signal that is divided into 60 or more uniform department bands with the same bandwidth can be calculated using WLPC, as indicated by Equation (8): Mathematical value 8

<formula>formula see original document page 20</formula><formula> formula see original document page 20 </formula>

em que s indica um índice de uma sub-banda linear-mente particionada, slow(w) e shigh (w) indicam, respectivamen-te, freqüências mais baixas e mais altas nas sub-bandas Ii-nearmente particionadas s, nbsub(s) indica um limite de mas-caramento da sub-banda linearmente particionada s, e Gsub (s)indica a energia da sub-banda s linearmente particionada,isto é, a soma das freqüências na sub-banda s linearmenteparticionada. O limite de mascaramento nbsub(s) é um mínimode uma pluralidade de limites de mascaramento na sub-banda slinearmente particionada.where s indicates an index of a linearly partitioned subband, slow (w) and shigh (w) respectively indicate lower and higher frequencies in the closely partitioned subbands s, nbsub (s). ) indicates a masking limit of the linearly partitioned subband s, and Gsub (s) indicates the energy of the linearly partitioned subband s, that is, the sum of the frequencies in the linearly partitioned subband s. The nbsub masking threshold (s) is a minimum of a plurality of masking thresholds in the thinly partitioned subband.

A entropia perceptiva pode não ser calculada parabandas com a mesma largura de banda e com limites mais altosdo que a soma dos espectros de entrada. Assim, a entropiaperceptiva distorcida WPEsab da Equação (8) pode ser menor doque a entropia perceptiva distorcida WPE da Equação (7), quefornece alta resolução para bandas de baixa freqüência.A entropia perceptiva distorcida WPESf pode sercalculada para bandas de fator de escala com diferentes lar-guras de banda usando WLPC, como indicado pela Equação (9):Perceptual entropy may not be calculated for bands with the same bandwidth and higher limits than the sum of the input spectra. Thus, the WPEsab distorted perceptual entropy of Equation (8) may be smaller than the WPE distorted perceptual entropy of Equation (7), which provides high resolution for low frequency bands. bandwidth using WLPC, as indicated by Equation (9):

Valor matemático 9Mathematical value 9

<formula>formula see original document page 21</formula><formula> formula see original document page 21 </formula>

em que / indica um índice de uma banda de fator deescala, nbSf(f) indica um limite de mascaramento mínimo dabanda de fator de escala f, WPEsf indica a proporção de umsinal de entrada da banda de fator de escala / por um limitede mascaramento da banda de fator de escala /, e esf(s) in—dica a soma de todas as freqüências na banda de fator de es-cala /, isto é, a energia da banda de fator de escala /.where / indicates an index of a scaling factor band, nbSf (f) indicates a minimum masking limit of the scaling factor f, WPEsf indicates the proportion of an input of the scaling factor band / by a limitede masking of the scaling factor. scaling factor band /, and sp (s) - indicates the sum of all frequencies in the scaling factor band /, ie the energy of the scaling factor band /.

A figura 5 é um diagrama de blocos de uma outramodalidade do módulo de classificação 100 ilustrado na figu-ra 1. Em relação à figura 5, um módulo de classificação in-clui uma unidade de divisão de sinal 121 e uma unidade dedeterminação 122.Fig. 5 is a block diagram of another embodiment of the rating module 100 shown in Fig. 1. Referring to Fig. 5, a rating module includes a signal division unit 121 and a determination unit 122.

Mais especificamente, a unidade de divisão de si-nal 121 divide um sinal de entrada em uma pluralidade de si-nais divididos. Por exemplo, a unidade de divisão de sinal121 pode dividir o sinal de entrada em uma pluralidade debandas de freqüência usando um filtro de sub-banda. As ban-das de freqüência podem ter a mesma largura de banda ou di-ferentes larguras de banda. Como exposto, um sinal divididopode ser codificado separadamente dos outros sinais dividi-dos por uma unidade de codificação que pode mais bem serviràs características do sinal dividido.More specifically, the signal division unit 121 divides an input signal into a plurality of divided signals. For example, signal division unit 121 may divide the input signal into a plurality of frequency bands using a subband filter. Frequency bands can have the same bandwidth or different bandwidths. As explained, a split signal may be encoded separately from the other divided signals by a coding unit which may best serve the characteristics of the split signal.

A unidade de divisão de sinal 121 pode dividir osinal de entrada em uma pluralidade de sinais divididos, porexemplo, uma pluralidade de sinais de banda, para que a in-terferência entre os sinais de banda possa ser minimizada. Aunidade de divisão de sinal 121 pode ter uma estrutura debanco de filtro dual. Neste caso, a unidade de divisão desinal 121 pode dividir adicionalmente cada um dos sinais di-vididos.Signal division unit 121 may divide the input signals into a plurality of divided signals, for example a plurality of band signals, so that interference between the band signals can be minimized. Signal splitting unit 121 may have a dual filter bank structure. In this case, the signal division unit 121 may further divide each of the divided signals.

Informação de divisão considerando os sinais divi-didos obtidos pela unidade de divisão de sinal 121, por e-xemplo, o número total de sinais divididos e informação debanda de cada um dos sinais divididos, pode ser incluída emum fluxo contínuo de bits a ser transmitido. Um aparelho dedecodificação pode decodificar o sinal dividido separadamen-te e sintetizar os sinais decodificados em relação à infor-mação de divisão, desse modo, restaurando o sinal de entradaoriginal.Division information considering the split signals obtained by signal division unit 121, for example, the total number of split signals and information from each of the split signals can be included in a continuous stream of bits to be transmitted. . A decoding apparatus can decode the split signal separately and synthesize the decoded signals relative to the split information, thereby restoring the original input signal.

A informação de divisão pode ser armazenada comouma tabela. Um fluxo contínuo de bits pode incluir informa-ção de identificação de uma tabela usada para dividir o si-nal de entrada original.Division information can be stored as a table. A stream of bits may include identifying information from a table used to split the original input signal.

A importância de cada um dos sinais divididos (porexemplo, uma pluralidade de sinais de banda de freqüência)para a qualidade do som pode ser determinada, e a taxa debits pode ser ajustada para cada um dos sinais divididos deacordo com os resultados da determinação. Mais especifica-mente, a importância de um sinal dividido pode ser definidacomo um valor fixo ou como um valor não fixo que varia deacordo com as características de um sinal de entrada paracada quadro.The importance of each of the split signals (for example, a plurality of frequency band signals) for sound quality can be determined, and the rate of debits can be adjusted for each of the split signals according to the results of the determination. More specifically, the importance of a divided signal can be defined as a fixed value or as a non-fixed value that varies according to the characteristics of a frame input signal.

Se os sinais de fala e de áudio forem misturadosno sinal de entrada, a unidade de divisão de sinal 121 podedividir o sinal de entrada em um sinal de fala e em um sinalde áudio, de acordo còm as características dos sinais de fa-la e de acordo com as características dos sinais de áudio.If the speech and audio signals are mixed into the input signal, the signal splitting unit 121 may divide the input signal into a speech signal and an audio signal according to the characteristics of the speak and audio signals. according to the characteristics of the audio signals.

A unidade de determinação 122 pode determinar qualda primeira até m-ésima unidades de codificação 210 e 220 nomódulo de codificação 200 pode codificar mais eficientementecada um dos sinais divididos.The determining unit 122 may determine which of the first to mth coding units 210 and 220 coding code 200 may more efficiently encode one of the divided signals.

A unidade de determinação 122 classifica os sinaisdivididos em inúmeros grupos. Por exemplo, a unidade de de-terminação 122 pode classificar os sinais em N classes e po-de determinar qual da primeira até m-ésima unidades de codi-ficação 210 e 220 deve ser usada para codificar cada um dossinais divididos pelo casamento de cada uma das N classescom uma da primeira até m-ésima unidades de codificação 210e 220.Determination unit 122 classifies the divided signals into numerous groups. For example, the terminating unit 122 may classify the signals into N classes and may determine which of the first through mth coding units 210 and 220 should be used to encode each signal divided by the matching of each one of the N classes with one of the first through m-th coding units 210 and 220.

Mais especificamente, dado que o módulo de codifi-cação 200 inclui as primeira até m-ésima unidades de codifi-cação 210 e 220, a unidade de determinação 122 pode classi-ficar os sinais divididos na primeira até m-ésima classes,que podem ser codificados mais eficientemente pela primeiraaté m-ésima unidades de codificação 210 e 220, respectiva-mente .More specifically, since the coding module 200 includes the first to mth coding units 210 and 220, the determining unit 122 can classify the signals divided into the first to mth classes, which can be encoded most efficiently by the first to the nth coding units 210 and 220, respectively.

Para isto, as características dos sinais que podemser codificados mais eficientemente por cada uma da primeiraaté m-ésima unidades de codificação 210 e 220 podem ser de-terminadas antecipadamente, e as características da primeiraaté m-ésima classes podem ser definidas de acordo com os re-sultados da determinação. Posteriormente, a unidade de de-terminação 122 pode extrair as caracterí sticas de cada umdos sinais divididos e classificar cada um dos sinais divi-didos em uma da primeira até m-ésima classes que comparti-lham as mesmas características de um sinal dividido corres-pondente, de acordo com os resultados da extração.For this, the characteristics of the signals that can be encoded most efficiently by each of the first to the mth coding units 210 and 220 may be determined in advance, and the characteristics of the first to the mth class may be defined according to the requirements of the present invention. -results of determination. Subsequently, the terminating unit 122 can extract the characteristics of each of the divided signals and classify each of the divided signals into one of the first to the mth classes that share the same characteristics as a corresponding divided signal. according to the extraction results.

Exemplos da primeira até m-ésima classes incluemuma classe de fala em voz, uma classe de fala sem voz, umaclasse de ruído de fundo, uma classe de silêncio, uma classede áudio tonai, uma classe de áudio não tonai e uma classede mistura de fala em voz / áudio.Examples of the first through mth classes include a speech-to-speech class, a speechless class, a background noise class, a silence class, a tonal audio class, a non-tonal audio class, and a speech mix class. in voice / audio.

A unidade de determinação 122 pode determinar qualda primeira até m-ésima unidades de codificação 210 e 220deve ser usada para codificar cada um dos sinais divididospela referência da informação de característica perceptivaque considera os sinais divididos fornecidos pelo módulo demodelagem psicoacústica 400, por exemplo, os limites de mas-caramento, SMRs ou níveis de entropia perceptiva dos sinaisdivididos.The determining unit 122 may determine which of the first to mth coding units 210 and 220 should be used to encode each of the divided signals by the perceptual characteristic information reference which considers the divided signals provided by the psychoacoustic modeling module 400, for example, the limits masking, SMRs or perceptual entropy levels of split signals.

A unidade de determinação 122 pode determinar umaquantidade de bits para codificar cada um dos sinais dividi-dos ou para determinar a ordem na qual os sinais divididosdevem ser codificados pela referência da informação de ca-racterística perceptiva que considera os sinais divididos.The determining unit 122 may determine a number of bits to encode each of the divided signals or to determine the order in which the divided signals are to be encoded by reference to the perceptual characteristic information that considers the divided signals.

A informação obtida pela determinação realizadapela unidade de determinação 122, por exemplo, informaçãoque indica por qual da primeira até m-ésima unidades de co-dificação 210 e 220 e com qual quantidade de bits cada umdos sinais divididos deve ser codificado e informação queindica a ordem na qual os sinais divididos devem ser codifi-cados, pode ser incluída em um fluxo contínuo de bits a sertransmitido.The information obtained by the determination performed by the determination unit 122, for example, indicates by which of the first to the mth coding units 210 and 220 and by what amount of bits each of the divided signals must be encoded and information indicates the order. in which the divided signals must be encoded, may be included in a continuous stream of bits to be transmitted.

A figura 6 é um diagrama de blocos de uma modali-dade da unidade de divisão de sinal 122 ilustrada na figura5. Em relação à figura 6, uma unidade de divisão de sinalinclui um divisor 123 e um mesclador 124.Fig. 6 is a block diagram of one embodiment of signal division unit 122 illustrated in Fig. 5. Referring to Figure 6, a signal division unit includes a divider 123 and a merger 124.

O divisor 123 pode dividir um sinal de entrada emuma pluralidade de sinais divididos. O mesclador 124 podemesclar sinais divididos com características similares em umúnico sinal. Para isto, o mesclador 124 pode incluir um ban-co de filtro de síntese.Splitter 123 may divide an input signal into a plurality of divided signals. The merger 124 can merge split signals with similar characteristics into a single signal. For this, the blender 124 may include a synthesis filter bank.

Por exemplo, o divisor 123 pode dividir um sinalde entrada em 256 bandas. Das 256 bandas, aquelas com carac-terísticas similares podem ser mescladas em uma única bandapelo mesclador 124.For example, splitter 123 can split an input signal into 256 bands. Of the 256 bands, those with similar characteristics can be merged into a single merger bandap 124.

Em relação à figura 7, o mesclador 124 pode .mes-clar uma pluralidade de sinais divididos que são adjacentesuns aos outros em um único sinal mesclado. Neste caso, omesclador 124 pode mesclar uma pluralidade de sinais dividi-dos adjacentes em um único sinal mesclado de acordo com umaregra pré-definida sem considerar as características dos si-nais divididos adjacentes.Referring to Fig. 7, the merger 124 may even have a plurality of split signals that are adjacent to each other in a single merged signal. In this case, merge 124 may merge a plurality of adjacent split signals into a single merged signal according to a predefined rule without regard to the characteristics of adjacent split signals.

Alternativamente, em relação à figura 8, o mescla-dor 124 pode mesclar uma pluralidade de sinais divididos comcaracterísticas similares em um único sinal mesclado, inde-pendentemente se os sinais divididos são adjacente uns aosoutros. Neste caso, o mesclador 124 pode mesclar uma plura-lidade de sinais divididos que pode ser eficientemente codi-ficada pela mesma unidade de codificação em um único sinalmesclado.Alternatively, with respect to Fig. 8, the merger 124 may merge a plurality of split signals with similar characteristics into a single merged signal, regardless of whether the split signals are adjacent to each other. In this case, the merger 124 may merge a plurality of split signals that can be efficiently encoded by the same coding unit into a single merged signal.

A figura 9 é um diagrama de blocos de uma outramodalidade da unidade de divisão de sinal 121 ilustrada nafigura 5. Em relação à figura 9, uma unidade de divisão desinal inclui um primeiro divisor 125, um segundo divisor 126e um terceiro divisor 127.Fig. 9 is a block diagram of another mode of signal division unit 121 illustrated in Figure 5. Referring to Fig. 9, a desinal division unit includes a first divider 125, a second divider 126, and a third divider 127.

Mais especificamente, a unidade de divisão de si-nal 121 pode dividir hierarquicamente um sinal de entrada.More specifically, the signal division unit 121 may hierarchically divide an input signal.

Por exemplo, o sinal de entrada pode ser dividido em doissinais divididos pelo primeiro divisor 125, um dos dois si-nais divididos pode ser dividido em três sinais divididospelo segundo divisor 126 e um dos três sinais divididos podeser dividido em três sinais divididos pelo terceiro divisor127. Desta maneira, o sinal de entrada pode ser dividido emum total de 6 sinais divididos. A unidade de divisão de si-nal 121 pode dividir hierarquicamente o sinal de entrada emuma pluralidade de bandas com diferentes larguras de banda.For example, the input signal may be divided into two signals divided by the first divider 125, one of the two divided signals may be divided into three signals divided by the second divider 126 and one of the three divided signals may be divided into three signals divided by the third divider127 . In this way, the input signal can be divided into a total of 6 divided signals. The signal division unit 121 may hierarchically divide the input signal into a plurality of bands with different bandwidths.

Na modalidade ilustrada na figura 9, um sinal deentrada é dividido de acordo com uma hierarquia de 3 níveis,mas a presente invenção não é restrita a ela. Em outras pa-lavras, um sinal de entrada pode ser dividido em uma plura-lidade de sinais divididos de acordo com uma hierarquia de 2níveis ou de 4 ou mais níveis.In the embodiment illustrated in Figure 9, an input signal is divided according to a 3-level hierarchy, but the present invention is not restricted to it. In other words, an input signal may be divided into a plurality of signals divided according to a hierarchy of 2 levels or 4 or more levels.

Um do primeiro até terceiro divisores 125 até 127na unidade de divisão de sinal 121 pode dividir um sinal deentrada em uma pluralidade de sinais de domínio temporal.One of the first to third splitters 125 to 127 in signal division unit 121 may divide an input signal into a plurality of time domain signals.

A figura 10 explica uma modalidade da divisão deum sinal de entrada em uma pluralidade de sinais divididospela unidade de divisão de sinal 121.Fig. 10 explains an embodiment of splitting an input signal into a plurality of signals divided by signal splitting unit 121.

No geral, sinais de fala ou de áudio são estacio-nários durante um curto período de comprimento de quadro.Entretanto, algumas vezes, sinais de fala ou de áudio podemter características não estacionárias, por exemplo, duranteum período de transição.In general, speech or audio signals are stationary for a short frame length period. However, sometimes speech or audio signals may have non-stationary characteristics, for example, during a transitional period.

A fim de analisar efetivamente sinais não estacio-nários e de melhorar a eficiência da codificação de tais si-nais não estacionários, o aparelho de codificação de acordocom a presente modalidade pode usar um método de ondeleta oude decomposição em modo empírico (EMD). Em outras palavras,o aparelho de codificação de acordo com a presente modalida-de pode analisar as características de um sinal de entradausando uma função de transformação não fixa. Por exemplo, aunidade de divisão de sinal 121 pode dividir um sinal de en-trada em uma pluralidade de bandas com larguras de banda va-riáveis usando um método de filtragem de sub-banda de bandade freqüência não fixa.A seguir, um método para dividir um sinal de en-trada em uma pluralidade de sinais divididos por meio de EMDserá descrito com detalhes.In order to effectively analyze non-stationary signals and to improve the coding efficiency of such non-stationary signals, the coding apparatus according to the present embodiment may use an empirical mode wavelength or decomposition (EMD) method. In other words, the coding apparatus according to the present embodiment may analyze the characteristics of an input signal using an unfixed transform function. For example, signal division unit 121 may divide an input signal into a plurality of bands with varying bandwidths using a non-fixed frequency band subband filtering method. Here is a method for splitting an input signal into a plurality of signals divided by EMD will be described in detail.

No método EMD, um sinal de entrada pode ser decom-posto em uma ou mais funções de modo intrínseco (IMFs) . UmaIMF deve satisfazer as seguintes condições: o número de pon-tos extremos e o número de zeros cruzados devem ser iguaisou diferir, no máximo, em um; e o valor médio de um envelopedeterminado pelo local máximo e de um envelope determinadopelo local mínimo é zero.In the EMD method, an input signal can be decomposed into one or more intrinsic mode functions (IMFs). An IMF must meet the following conditions: the number of endpoints and the number of crossed zeros must be equal to or differ by at most one; and the average value of an envelope determined by the maximum location and an envelope determined by the minimum location is zero.

Uma IMF representa um único modo oscilatório simi-lar a um componente em uma única função harmônica, desse mo-do, tornando possível decompor efetivamente um sinal de en-trada usando o método EMD.An MFI represents a single oscillatory mode similar to a component in a single harmonic function, thus making it possible to effectively decompose an input signal using the EMD method.

Mais especificamente, a fim de extrair uma IMF deum sinal de entrada s (t), um envelope superior pode ser pro-duzido pela conexão de todos os pontos extremos locais de-terminados pelo local máximo do sinal de entrada s (t) usandoum método de interpolação cúbica de curva matematicamentedefinida por nós de controle, e um envelope inferior podeser produzido pela conexão de todos os pontos extremos lo-cais determinados pelo local mínimo do sinal de entrada s (t)usando o método de interpolação cúbica de curva matematica-mente definida por nós de controle. Todos os valores que osinal de entrada s(t) pode ter podem estar entre o envelopesuperior e o envelope inferior.More specifically, in order to extract an MFI from an input signal s (t), an upper envelope may be produced by connecting all local endpoints terminated by the maximum location of the input signal s (t) using a method. mathematically defined cubic curve interpolation control nodes, and a lower envelope can be produced by connecting all local extreme points determined by the minimum location of the input signal s (t) using the mathematically cubic curve interpolation method. defined by control nodes. All values that the input sign s (t) can have can be between the upper envelope and the lower envelope.

Posteriormente, o valor médio m(t) do envelope su-perior e do envelope inferior pode ser calculado. Posterior-mente, um primeiro componente Ii1 (t) pode ser calculado pelasubtração do valor médio m(t) do sinal de entrada s (t) , comoindicado pela Equação (10):Subsequently, the mean value m (t) of the upper envelope and the lower envelope can be calculated. Subsequently, a first component Ii1 (t) can be calculated by subtracting the mean value m (t) from the input signal s (t), as indicated by Equation (10):

Valor matemático 10Mathematical value 10

s(t)-m1(t)=h1(t)s (t) -m1 (t) = h1 (t)

Se o primeiro componente hi(t) não satisfizer assupramencionadas condições da IMF, pode-se determinar que oprimeiro componente h]_(t) é igual ao sinal de entrada s (t),e a supramencionada operação pode ser realizada novamenteaté que um primeiro Ci(t) da IMF que satisfaz as supramen-cionadas condições da IMF seja obtido.If the first component hi (t) does not satisfy the above conditions of the MFI, it can be determined that the first component h] _ (t) is equal to the input signal s (t), and the above operation can be performed again until a first Ci (t) from the MFI meeting the above mentioned MFI conditions is obtained.

Uma vez que o primeiro C1It) da IMF é obtido, umresíduo ri(t) é obtido pela subtração do primeiro C1 (t) daIMF, como indicado pela Equação (11):Since the first MFI C1It) is obtained, a residue ri (t) is obtained by subtracting the first MFI C1 (t), as indicated by Equation (11):

Valor matemático 11Mathematical value 11

s(t)-c1(t)=r1(t)s (t) -c1 (t) = r1 (t)

Posteriormente, a supramencionada operação de ex-tração da IMF pode ser novamente realizada usando o resíduor!(t) como o novo sinal de entrada, desse modo, obtendo umsegundo C2 (t) da IMF e um resíduo r2(t).Subsequently, the aforementioned MFI extraction operation can be performed again using residue! (T) as the new input signal, thereby obtaining a second MFI C2 (t) and a residue r2 (t).

Se um resíduo rn(t) obtido durante a supramencio-nada operação de extração IMF tiver um valor constante, oufor uma função monotonamente crescente ou uma função de pe-ríodo simples com somente um ponto extremo ou sem nenhumponto extremo, a supramencionada operação de extração da IMFpode ser terminada.If a residue rn (t) obtained during the above mentioned IMF extraction operation has a constant value, either a monotonically increasing function or a simple period function with only one extreme point or no extreme point, the above-mentioned extraction operation IMF can be terminated.

Em decorrência da supramencionada operação de ex-tração da IMF, o sinal de entrada s (t) pode ser representadopela soma de uma pluralidade de Co (t) até Cm (t) da IMF e deum resíduo final rm(t), como indicado pela Equação (12):As a result of the aforementioned MFI extraction operation, the input signal s (t) can be represented by the sum of a plurality of MFI Co (t) to Cm (t) and a final residue rm (t) as indicated. by Equation (12):

Valor matemático 12Mathematical value 12

<formula>formula see original document page 30</formula><formula> formula see original document page 30 </formula>

em que M indica o número total das IMFs extraídas.where M indicates the total number of extracted MFIs.

0 resíduo final rm(t) pode refletir as características ge-rais do sinal de entrada s (t).The final residue rm (t) may reflect the general characteristics of the input signal s (t).

A figura 10 ilustra onze IMFs e um resíduo finalobtido pela decomposição de um sinal de entrada original u-sando o método EMD. Em relação à figura 10, a freqüência deuma IMF obtida do sinal de entrada original em um estágioinicial da extração da IMF é mais alta do que a freqüênciade uma IMF obtida do sinal de entrada original em um estágioposterior da extração da IMF.Figure 10 illustrates eleven MFIs and a final residue obtained by decomposing an original input signal using the EMD method. Referring to Figure 10, the frequency of an MFI obtained from the original input signal at an early stage of MFI extraction is higher than the frequency of an MFI obtained from the original input signal at a later stage of MFI extraction.

A extração da IMF pode ser simplificada usando umdesvio padrão SD entre um resíduo anterior hl(k-D e um resí-duo atual hlk, como indicado pela Equação (13) :Extraction of the MFI can be simplified by using a SD standard deviation between a previous residue hl (k-D and a current residue hlk, as indicated by Equation (13):

Valor matemático 13Mathematical value 13

<formula>formula see original document page 30</formula>Se o desvio padrão SD for menor do que um valor dereferência, por exemplo, 0,3, o resíduo atual hlk pode serconsiderado como uma IMF.<formula> formula see original document page 30 </formula> If the SD standard deviation is less than a reference value, for example 0.3, the current residue hlk can be considered as an MFI.

Neste ínterim, um sinal x(t) pode ser transformadoem um sinal analítico pela transformada de Hilbert, como in-dicado pela Equação (14):In the meantime, a signal x (t) can be transformed into an analytical signal by the Hilbert transform, as indicated by Equation (14):

Valor matemático 14Mathematical value 14

<formula>formula see original document page 31</formula><formula> formula see original document page 31 </formula>

em que (t) indica uma amplitude instantânea, (t)indica uma fase instantânea, e H{} indica a transformada deHilbert.where (t) indicates an instantaneous amplitude, (t) indicates an instantaneous phase, and H {} indicates theHilbert transform.

Em decorrência da transformada de Hilbert, um si-nal de entrada pode ser convertido em um sinal analítico queconsiste em um componente real e um componente imaginário.As a result of the Hilbert transform, an input signal can be converted into an analytical signal that consists of a real component and an imaginary component.

Pela aplicação da transformada de Hilbert em umsinal com uma média de 0, podem ser obtidos os componentesda freqüência que podem fornecer alta resolução tanto para odomínio temporal quanto para o domínio de freqüência.By applying the Hilbert transform on a signal with a mean of 0, frequency components can be obtained that can provide high resolution for both the time domain and the frequency domain.

A seguir, será descrito com detalhes como a unida-de de determinação 112 ilustrada na figura 4 determina qualde uma pluralidade de unidades de codificação deve ser usadapara codificar cada um de uma pluralidade de sinais dividi-dos obtidos pela decomposição de um sinal de entrada.In the following, it will be described in detail how the determining unit 112 illustrated in Fig. 4 determines which of a plurality of coding units should be used to encode each of a plurality of split signals obtained by decomposing an input signal.

A unidade de determinação "122 pode determinar qualde um codificador de fala e de um codificador de áudio podecodificar mais eficientemente cada um dos sinais divididos.Em outras palavras, a unidade de determinação 122 pode deci-dir codificar sinais divididos que podem ser eficientementecodificados por um codificador de fala usando qualquer umada primeira até m-ésima unidades de codificação 210 e 220 emum codificador de fala e decidir codificar sinais divididosque podem ser eficientemente codificados por um codificadorde áudio usando qualquer uma da primeira até m-ésima unida-des de codificação 210 e 220 em um codificador de áudio.Determination unit 122 can determine which speech encoder and audio encoder can most efficiently decode each of the split signals. In other words, determination unit 122 can decode to encode split signals that can be efficiently encoded by a speech encoder using any of the first to mth coding units 210 and 220 in a speech coder and deciding to encode split signals which can be efficiently encoded by an audio coder using any of the first to mrth coding units 210 and 220 in an audio encoder.

A seguir, será descrito com detalhes como a unida-de de determinação 122 determina qual de um codificador defala e de um codificador de áudio pode codificar mais efici-entemente um sinal dividido.In the following, it will be described in detail how determining unit 122 determines which of a deflector encoder and an audio encoder can most efficiently encode a divided signal.

A unidade de determinação 122 pode medir a varia-ção em um sinal dividido e pode determinar que o sinal divi-dido pode ser codificado mais eficientemente por um codifi-cador de fala do que por um codificador de áudio se o resul-tado da medição for maior do que um valor de referência pré-definido.The determining unit 122 can measure the change in a split signal and can determine that the split signal can be encoded more efficiently by a speech coder than by an audio coder if the result of the measurement. is greater than a predefined reference value.

Alternativamente, a unidade de determinação 122pode medir um componente tonai incluído em uma certa partede um sinal dividido e pode determinar que o sinal divididopode ser codificado mais eficientemente por um codificadorde áudio do que por um codificador de fala se o resultado damedição for maior do que um valor de referência pré-definido.Alternatively, the determining unit 122 may measure a tonal component included in a certain part of a split signal and may determine that the split signal may be encoded more efficiently by an audio encoder than by a speech encoder if the measurement result is greater than one. preset reference value.

A figura 11 é um diagrama de blocos de uma modali-dade da unidade de determinação 122 ilustrada na figura 5.Em relação à figura 11, uma unidade de determinação incluiuma unidade de codificação / decodificação de fala 500, umprimeiro banco de filtro 510, um segundo banco de filtro520, uma unidade de determinação 530 e uma unidade de mode-lagem psicoacústica 540.Figure 11 is a block diagram of one embodiment of the determination unit 122 illustrated in Figure 5. Referring to Figure 11, a determination unit includes a speech coding / decoding unit 500, a first filter bank 510, a second filter bank520, a determination unit 530 and a psychoacoustic modeling unit 540.

A unidade de determinação ilustrada na figura 11pode determinar qual de um codificador de fala e de um codi-ficador de áudio pode codificar mais eficientemente cada si-nal dividido.The unit of determination illustrated in Fig. 11 can determine which of a speech encoder and an audio encoder can most efficiently encode each divided signal.

Em relação à figura 11, um sinal de entrada é co-dificado pela unidade de codificação / decodificação de fala500, e o sinal codificado é decodificado pela unidade de co-dificação / decodificação de fala 500, desse modo, restau-rando o sinal de entrada original. A unidade de codificação/ decodificação de fala 500 pode incluir um codificador /decodificador de fala em banda larga multitaxas (AMR-WB), eo codificador / decodif icador de fala AMR-WB pode ter umaestrutura de prognóstico linear estimulado por código(CELP).Referring to Fig. 11, an input signal is coded by the speech coding / decoding unit 500, and the coded signal is decoded by the speech coding / decoding unit 500, thereby restoring the speech signal. original entry. The speech encoding / decoding unit 500 may include a multi-rate broadband speech encoder / decoder (AMR-WB), and the AMR-WB speech encoder / decoder may have a code-stimulated linear prediction (CELP) structure.

0 sinal de entrada pode ser amostrado descendente-mente antes de ser inserido na unidade de codificação / de-codif icação de fala 500. Um sinal transmitido pela unidadede codificação / decodificação de fala 500 pode ser amostra-do ascendentemente, desse modo, restaurando o sinal de en-trada .The input signal may be sampled downstream before being inserted into the speech coding / decoding unit 500. A signal transmitted by the speech coding / decoding unit 500 may be ascended, thereby restoring the input signal. input signal.

0 sinal de entrada pode ser sujeito à conversão defreqüência pelo primeiro banco de filtro 510.The input signal may be subjected to frequency conversion by the first filter bank 510.

O sinal transmitido pela unidade de codificação /decodificação de fala 500 é convertido em um sinal de domi-nio de freqüência pelo segundo banco de filtro 520. O pri-meiro banco de filtro 510 ou o segundo banco de filtro 520podem realizar transformada cosseno, por exemplo, transfor-mada discreta modificada (MDCT), em um sinal neles inserido.The signal transmitted by speech coding / decoding unit 500 is converted to a frequency domain signal by the second filter bank 520. The first filter bank 510 or the second filter bank 520 may perform cosine transform, for example. for example, modified discrete transform (MDCT) into a signal inserted therein.

Tanto um componente de freqüência do sinal de en-trada original transmitido pelo primeiro banco de filtro 510quanto um componente de freqüência do sinal de entrada res-taurado transmitido pelo segundo banco de filtro 520 são in-seridos na unidade de determinação 530. A unidade de deter-minação 530 pode determinar qual de um codificador de fala ede um codificador de áudio pode codificar o sinal de entradamais eficientemente com base nos componentes de freqüêncianela inseridos.Both a frequency component of the original input signal transmitted by the first filter bank 510 and a frequency component of the restored input signal transmitted by the second filter bank 520 are inserted into the determining unit 530. Determination 530 can determine which of a speech encoder and an audio encoder can encode the input signal most efficiently based on the frequency components inserted therein.

Mais especificamente, a unidade de determinação530 pode determinar qual de um codificador de fala e de umcodificador de áudio pode codificar mais eficientemente osinal de entrada com base nos componentes de freqüência nelainseridos pelo cálculo da entropia perceptiva PE± de cada umdos componentes de freqüência, usando a Equação (15):More specifically, determining unit 530 can determine which of a speech encoder and an audio encoder can most efficiently encode the input signals based on the frequency components nelain by calculating the PE ± perceptual entropy of each of the frequency components, using the Equation (15):

Valor matemático 15Mathematical value 15

<formula>formula see original document page 34</formula><formula> formula see original document page 34 </formula>

em queon what

<formula>formula see original document page 34</formula>em que x(j) indica um coeficiente de um componentede freqüência, j indica um índice do componente de freqüên-cia, indica o tamanho da etapa de quantização, nint() é umafunção que retorna o número inteiro mais próximo do seu ar-gumento, e jlow<i> e jhigh(i) são um índice de freqüência inici-al e um índice de freqüência final, respectivamente, de umabanda de fator de escala.<formula> formula see original document page 34 </formula> where x (j) indicates a coefficient of a frequency component, j indicates an index of the frequency component, indicates the size of the quantization step, nint () is a function that returns the nearest integer of its argument, and jlow <i> and jhigh (i) are an initial frequency index and an end frequency index, respectively, of a scale factor band.

A unidade de determinação 530 pode calcular a en-tropia perceptiva do componente de freqüência do sinal deentrada original e a entropia perceptiva do componente defreqüência do sinal de entrada restaurado usando a Equação(15), e pode determinar qual de um codificador de áudio e deum codificador de fala é mais eficiente para uso na codifi-cação do sinal de entrada com base nos resultados do cálculo.The determining unit 530 can calculate the perceptual entropy of the frequency component of the original input signal and the perceptual entropy of the frequency component of the restored input signal using Equation (15), and can determine which of an audio encoder and deum Speech encoder is most efficient for use in coding the input signal based on the calculation results.

Por exemplo, se a entropia perceptiva do componen-te de freqüência do sinal de entrada original for menor doque a entropia perceptiva do componente de freqüência do si-nal de entrada restaurado, a unidade de determinação 530 po-de determinar que o sinal de entrada pode ser mais eficien-temente codificado por um codificador de áudio do que por umcodificador de fala. Por outro lado, se a entropia percepti-va do componente de freqüência do sinal de entrada restaura-do for menor do que a entropia perceptiva do componente defreqüência do sinal de entrada original, a unidade de deter-minação 530 pode determinar que o sinal de entrada pode sercodificado mais eficientemente por um codificador de fala doque por um codificador de áudio.A figura 12 é um diagrama de blocos de uma modali-dade de uma da primeira até m-ésima unidades de codificação210 e 220 ilustradas na figura 1. A unidade de codificaçãoilustrada na figura 12 pode ser um codificador de fala.For example, if the perceptual entropy of the frequency component of the original input signal is lower than the perceptual entropy of the frequency component of the restored input signal, the determining unit 530 may determine that the input signal may be more efficiently encoded by an audio encoder than by a speech encoder. On the other hand, if the perceptual entropy of the restored input signal frequency component is less than the perceptual entropy of the original input signal frequency component, the determining unit 530 may determine that the input signal frequency The input can be encoded more efficiently by a speech encoder than by an audio encoder. Figure 12 is a block diagram of a modality from one of the first to the seventh coding units 210 and 220 illustrated in Figure 1. The encoding code illustrated in FIG. 12 may be a speech encoder.

No geral, codificadores de fala podem realizar LPCem um sinal de entrada em unidades dos quadros e extrair umcoeficiente da LPC, por exemplo, um coeficiente LPC de 16aordem, de cada quadro do sinal de entrada usando o algoritmoLevinson-Durbin. Um sinal de estimulo pode ser quantizadopor meio de uma busca de livro de código adaptativo ou deuma busca de livro de código fixa. O sinal de estimulo podeser quantizado usando um método de prognóstico linear esti-mulado por código algébrico. A quantização de vetor pode serrealizada no ganho do sinal de estimulo usando uma tabela dequantização com uma estrutura conjugada.In general, speech coders can perform LPC on an input signal in frame units and extract a coefficient from LPC, for example, an order 16PC LPC coefficient, from each input signal frame using the Levinson-Durbin algorithm. A stimulus signal may be quantized by means of an adaptive codebook search or a fixed codebook search. The stimulus signal can be quantized using an algebraic code-stimulated linear prognostic method. Vector quantization can be performed on stimulus signal gain using a quantization table with a conjugate structure.

O codificador de fala ilustrado na figura 12 in-clui uma unidade de análise de prognóstico linear 600, umaunidade de estimativa de afastamento 610, uma unidade debusca de livro de código 620, uma unidade de par de espectrolinear (LSP) 630 e uma unidade de quantização 640.The speech coder illustrated in FIG. 12 includes a linear prediction analysis unit 600, a spacing estimation unit 610, a codebook debug unit 620, a spectrolinear pair (LSP) unit 630 and a quantization 640.

A unidade de análise de prognóstico linear 600 re-aliza análise de prognóstico linear em um sinal de entradaque usa um coeficiente de autocorrelação que é obtido usandouma janela assimétrica. Se um período de antecipação, istoé, a janela assimétrica, tiver um comprimento de 30 ms, aunidade de análise de prognóstico linear 600 pode realizar aanálise de prognóstico linear usando um período de antecipa-ção de 5 ms.O coeficiente de autocorrelação é convertido em umcoeficiente de prognóstico linear usando um algoritmo Levin-son-Durbin. Para a quantização e a interpolação linear, aunidade LSP 630 converte o coeficiente de prognóstico linearem um LSP. A unidade de quantização 64 quantiza o LSP.Linear prognostic analysis unit 600 performs linear prognostic analysis on an input signal that uses an autocorrelation coefficient that is obtained using an asymmetric window. If an anticipation period, that is, the asymmetric window, has a length of 30 ms, then the linear prediction analysis unit 600 can perform the linear prediction analysis using a 5 ms anticipation period. The autocorrelation coefficient is converted to a linear prognostic coefficient using a Levin-son-Durbin algorithm. For quantization and linear interpolation, the LSP 630 unit converts the linear prognostic coefficient into an LSP. Quantization unit 64 quantizes the LSP.

A unidade de estimativa de afastamento 610 estimao afastamento do laço aberto a fim de reduzir a complexidadede uma busca de livro de código adaptativa. Mais especifica-mente, a unidade de estimativa de afastamento 610 estima umperíodo de afastamento do laço aberto usando um domínio desinal de fala ponderado de cada quadro. Posteriormente, umfiltro de modelagem de ruído harmônico é configurado usandoo afastamento do laço aberto estimado. Posteriormente, umaresposta de impulso é calculada usando o filtro de modelagemde ruído harmônico, um filtro de síntese de prognóstico li-near e um filtro de ponderação de pico da freqüência acústi-ca perceptivo. A resposta de impulso pode ser usada para ge-rar um sinal alvo para a quantização de um sinal de estímulo.Offset estimation unit 610 is open loop offset estimation in order to reduce the complexity of an adaptive codebook search. More specifically, the offset estimation unit 610 estimates an open loop offset period using a weighted desinal speech domain of each frame. Subsequently, a harmonic noise modeling filter is configured using the estimated open loop offset. Subsequently, an impulse response is calculated using the harmonic noise modeling filter, a li-near prognostic synthesis filter, and a perceptual acoustic frequency peak weighting filter. The impulse response can be used to generate a target signal for the quantization of a stimulus signal.

A unidade de busca de livro de código 620 realizauma busca de livro de código adaptativa e uma busca de livrode código fixa. A busca de livro de código adaptativa podeser realizada em unidades de subquadros pelo cálculo de umvetor de livro de código adaptativo por meio de uma busca deafastamento do laço fechado e por meio da interpolação dossinais de estímulo anteriores. O sinal de estímulo pode sergerado por um filtro de síntese de prognóstico linear a fimde simplificar uma busca de laço fechado.Uma estrutura de livro de código fixo é estabele-cida com base no desenho de permutação de pulso simples en-trelaçado (ISSP). Um vetor de livro de código que compreende64 posições, em que 64 pulsos são respectivamente localiza-dos, é dividido em quatro trilhas, cada trilha compreendendo16 posições. Um número pré-determinado de pulsos pode serlocalizado em cada uma das quatro trilhas de acordo com ataxa de transmissão. Já que um índice de livro de código in-dica o local da trilha e o sinal de um pulso, não há neces-sidade de armazenar um livro de código, e um sinal de estí-mulo pode ser gerado simplesmente usando do índice de livrode código.The codebook search unit 620 performs an adaptive codebook search and a fixed code book search. The adaptive codebook search can be performed in subframe units by calculating an adaptive codebook vector by means of a closed loop spacing search and by interpolating the anterior stimulus signals. The stimulus signal can be generated by a linear prognostic synthesis filter to simplify a closed loop search. A fixed codebook structure is established based on the interlaced single pulse permutation (ISSP) design. A codebook vector comprising 64 positions, where 64 pulses are respectively located, is divided into four tracks, each track comprising 16 positions. A predetermined number of pulses can be located on each of the four tracks according to the transmission rate. Since a codebook index indicates the location of the track and the signal of a pulse, there is no need to store a codebook, and a stimulus signal can be generated simply by using the book index. code.

0 codificador de fala ilustrado na figura 12 poderealizar os supramencionados processos de codificação em umdomínio temporal. Também, se um sinal de entrada for codifi-cado usando um método de codificação de prognóstico linearpelo módulo de classificação 100 ilustrado na figura 1, aunidade de análise de prognóstico linear 600 pode ser opcional.The speech coder illustrated in FIG. 12 may perform the above coding processes in a temporal domain. Also, if an input signal is encoded using a linear prognostic coding method by the classification module 100 illustrated in Figure 1, the linear prognostic analysis unit 600 may be optional.

A presente invenção não é restrita ao codificadorde fala ilustrado na figura 12. Em outras palavras, várioscodificadores de fala diferentes do codificador de fala i-lustrado na figura 12, que podem codificar eficientementesinais de fala, podem ser usados no escopo da presente in-venção.The present invention is not restricted to the speech encoder illustrated in FIG. 12. In other words, various speech encoders other than the i-polished speech encoder in FIG. 12, which can encode speech signals efficiently, may be used within the scope of the present invention. .

A figura 13 é um diagrama de blocos de uma outramodalidade de uma da primeira até m-ésima unidades de codi-ficação 210 e 220 ilustradas na figura 1. A unidade de codi-ficação ilustrada na figura 13 pode ser um codificador deáudio.Fig. 13 is a block diagram of another mode from one of the first to mrth coding units 210 and 220 shown in Fig. 1. The coding unit shown in Fig. 13 may be an audio coder.

Em relação à figura 13, o codificador de áudio in-clui um primeiro banco de filtro 700, uma unidade de modela-gem psicoacústica 710 e uma unidade de quantização 720.Referring to Figure 13, the audio encoder includes a first filter bank 700, a psychoacoustic modeling unit 710, and a quantization unit 720.

O banco de filtro 700 converte um sinal de entradaem um sinal de domínio de freqüência. O banco de filtro 700pode realizar transformada cosseno, por exemplo, transforma-da discreta modificada (MDCT), no sinal de entrada.Filter bank 700 converts an input signal into a frequency domain signal. Filter bank 700 may perform cosine transform, for example modified discrete transform (MDCT), on the input signal.

A unidade de modelagem psicoacústica 710 calculaum limite de mascaramento do sinal de entrada da SMR do si-nal de entrada. A unidade de quantização 720 quantiza os co-eficientes da MDCT transmitidos pelo banco de filtro 700 u-sando o limite de mascaramento calculado pela unidade de mo-delagem psicoacústica 710. Alternativamente, a fim de mini-mizar a distorção audível em uma dada faixa de taxa de bits,a unidade de quantização 720 pode usar a SMR do sinal de en-trada.The psychoacoustic modeling unit 710 calculates an input signal SMR input signal masking threshold. The quantization unit 720 quantifies the co-efficient MDCT transmitted by the filter bank 700 using the masking limit calculated by the psychoacoustic modeling unit 710. Alternatively, to minimize the audible distortion in a given range. bit rate, the quantization unit 720 can use the input signal SMR.

O codificador de áudio ilustrado na figura 13 poderealizar os supramencionados processos de codificação em umdomínio de freqüência.The audio encoder illustrated in FIG. 13 may perform the above coding processes on a frequency domain.

A presente invenção não é restrita ao codificadorde áudio ilustrado na figura 13. Em outras palavras, várioscodificadores de áudio (por exemplo, codificadores de áudioavançados) diferentes do codificador de áudio ilustrado nafigura 13, que podem codificar eficientemente sinais de áu-dio, podem ser usados no escopo da presente invenção.The present invention is not restricted to the audio encoder illustrated in Figure 13. In other words, various audio encoders (e.g., advanced audio encoders) other than the audio encoder illustrated in Figure 13, which can efficiently encode audio signals, can be used in the scope of the present invention.

Codificadores de áudio avançados realizam modela-gem de ruído temporal (TNS), intensidade / acoplamento,prognóstico e codificação estéreo meio / lado. TNS é uma o-peração de distribuir apropriadamente o ruído da quantizaçãode domínio temporal em uma janela do banco de filtro paraque o ruído da quantização possa ficar inaudível. Intensida-de / acoplamento é uma operação que pode reduzir a quantida-de de informação espacial a ser transmitida pela codificaçãode um sinal de áudio e que pode transmitir a energia do si-nal de áudio somente com base no fato de que a percepção dadireção do som em uma banda alta depende principalmente daescala temporária da energia.Advanced audio encoders perform temporal noise (TNS), intensity / coupling, prognosis and mid / side stereo coding modeling. TNS is an operation of properly distributing the time domain quantization noise in a filter bank window so that the quantization noise can be inaudible. Intensity / coupling is an operation that can reduce the amount of spatial information to be transmitted by encoding an audio signal and that can transmit audio signal energy only based on the fact that the perception of the direction of the Sound in a high band depends mainly on the temporary scale of the energy.

O prognóstico é uma operação de remover redundân-cia de um sinal cujas características estatísticas não vari-am pelo uso da correlação entre os componentes do espectrodos quadros. Codificação estéreo M/S é uma operação detransmitir a soma normalizada (isto é, meio) e a diferença(isto é, lado) de um sinal estéreo em vez de sinais de canalesquerdo e direito.Prognosis is an operation of removing redundancy from a signal whose statistical characteristics do not vary by using the correlation between the frame spectral components. Stereo M / S encoding is an operation of transmitting the normalized sum (ie, middle) and the difference (ie, side) of a stereo signal instead of left and right channel signals.

Um sinal que passa por TNS, intensidade / acopla-mento, prognóstico e codificação estéreo M/S é quantizadopor um quantizador que realiza Análise por Síntese (AbS) u-sando uma SMR obtida de um modelo psicoacústico.A signal passing through TNS, intensity / coupling, prognosis, and M / S stereo coding is quantized by a quantizer performing Synthesis Analysis (AbS) using an SMR obtained from a psychoacoustic model.

Como exposto, já que um codificador de áudio codi-fica um sinal de entrada usando um método de modelagem, talcomo um método de codificação de prognóstico linear, a uni-dade de determinação 122 ilustrada na figura 5 pode determi-nar se o sinal de entrada pode ser facilmente modelado deacordo com um conjunto pré-determinado de regras. Posterior-mente, se for determinado que o sinal de entrada pode serfacilmente modelado, a unidade de determinação 122 pode de-cidir codificar o sinal de entrada usando um codificador defala. Por outro lado, se for determinado que o sinal de en-trada não pode ser facilmente modelado, a unidade de deter-minação 122 pode decidir codificar o sinal de entrada usandoum codificador de áudio.As explained, since an audio encoder encodes an input signal using a modeling method, such as a linear prognostic coding method, the determination unit 122 illustrated in FIG. 5 can determine whether the audio signal is coded. Input can be easily modeled according to a predetermined set of rules. Subsequently, if it is determined that the input signal can be easily modeled, the determining unit 122 may decide to encode the input signal using a deflector encoder. On the other hand, if it is determined that the input signal cannot be easily modeled, the determining unit 122 may decide to encode the input signal using an audio encoder.

A figura 14 é um diagrama de blocos de um aparelhode codificação de acordo com uma outra modalidade da presen-te invenção. Nas figuras 1 até 14, números de referência i-guais representam elementos iguais e, assim, suas descriçõesdetalhadas serão omitidas.Figure 14 is a block diagram of a coding apparatus according to another embodiment of the present invention. In Figures 1 through 14, reference numerals are equal elements and thus their detailed descriptions will be omitted.

Em relação à figura 14, um módulo de classificação100 divide um sinal de entrada em uma pluralidade do primei-ro até n-ésimo sinais divididos e determina qual de uma plu-ralidade de unidades de codificação 230, 240, 250, 260 e 270deve ser usada para codificar cada um do primeiro até n-ésimo sinais divididos.Referring to Figure 14, a rating module 100 splits an input signal in a plurality of the first to nth divided signals and determines which of a plurality of coding units 230, 240, 250, 260 and 270 should be used to encode each of the first to nth split signals.

Em relação à figura 14, as unidades de codificação230, 240, 250, 260 e 270 podem codificar seqüencialmente oprimeiro até n-ésimo sinais divididos, respectivamente. Tam-bém, se o sinal de entrada for dividido em uma pluralidadede sinais de banda de freqüência, os sinais de banda de fre-qüência podem ser codificados na ordem de um sinal de bandade freqüência mais baixo até um sinal de banda de freqüênciamais alto.Referring to Figure 14, coding units 230, 240, 250, 260 and 270 can sequentially encode the first to nth divided signals, respectively. Also, if the input signal is divided into a plurality of frequency band signals, the frequency band signals can be encoded in the order of a lower frequency band signal to a higher frequency band signal.

Em um caso em que os sinais divididos são seqüen-cialmente codificados, um erro de codificação de um sinalanterior pode ser usado para codificar um sinal atual. Emdecorrência disto, é possível codificar os sinais divididosusando diferentes métodos de codificação e, assim, impedir adistorção de sinal e fornecer escalabilidade de largura debanda.In a case where split signals are sequentially encoded, a coding error of a previous signal may be used to encode a current signal. As a result of this, it is possible to encode the divided signals using different encoding methods and thus prevent signal distortion and provide bandwidth scaling.

Em relação à figura 14, a unidade de codificação230 codifica o primeiro sinal dividido, decodifica o primei-ro sinal dividido codificado e transmite um erro entre o si-nal decodificado e o primeiro sinal dividido para a unidadede codificação 240. A unidade de codificação 240 codifica osegundo sinal dividido usando o erro transmitido pela unida-de de codificação 230. Desta maneira, o segundo até m-ésimosinais divididos são codificados em consideração dos errosde codificação dos seus respectivos sinais divididos anteri-ores. Portanto, é possível realizar codificação sem erro emelhorar a qualidade do som.Referring to Figure 14, coding unit 230 encodes the first split signal, decodes the first coded split signal, and transmits an error between the decoded signal and the first divided signal to coding unit 240. Coding unit 240 it encodes the second split signal using the error transmitted by coding unit 230. In this way, the second to split mths are coded in consideration of the coding errors of their respective previous split signals. Therefore, you can perform encoding without error and improve sound quality.

O aparelho de codificação ilustrado na figura 14pode restaurar um sinal de um fluxo contínuo de bits de en-trada realizando inversamente as operações realizadas peloaparelho de codificação ilustrado nas figuras 1 até 14.The coding apparatus illustrated in FIG. 14 may restore a signal from a continuous stream of input bits by inversely performing the operations performed by the coding apparatus illustrated in FIGS. 1 through 14.

A figura 15 é um diagrama de blocos de um aparelhode decodificação de acordo com uma modalidade da presenteinvenção. Em relação à figura 15, o aparelho de decodifica-ção inclui um módulo de desempacotamento de bits 800, um mó-dulo de determinação do decodificador 810, um módulo de de-codif icação 820 e um módulo de sintetização 830.Figure 15 is a block diagram of a decoding apparatus according to one embodiment of the present invention. Referring to Figure 15, the decoding apparatus includes a bit unwrapping module 800, a decoder determination module 810, a decoding module 820 and a synthesizer module 830.

0 módulo de desempacotamento de bits 800 extrai,de um fluxo contínuo de bits de entrada, um ou mais sinaiscodificados e informação adicional que são necessários paradecodificar os sinais codificados.Bit unpacking module 800 extracts from a continuous stream of input bits one or more encoded signals and additional information that is required to decode the encoded signals.

O módulo de decodificação 820 inclui uma plurali-dade da primeira até m-ésima unidades de decodificação 821 e822 que realiza diferentes métodos de decodificação.The decoding module 820 includes a plurality of the first to mth decoding units 821 and 822 which perform different decoding methods.

O módulo de determinação do decodificador 810 de-termina qual da primeira até m-ésima unidades de decodifica-ção 821 e 822 pode decodificar mais eficientemente cada umdos sinais codificados. O módulo de determinação do decodi-ficador 810 pode usar um método similar àquele do módulo declassificação 100 ilustrado na figura 1 para determinar qualda primeira até m-ésima unidades de decodificação 821 e 822pode decodificar mais eficientemente cada um dos sinais co-dificados. Em outras palavras, o módulo de determinação dodecodificador 810 pode determinar qual da primeira até m-ésíma unidades de decodificação 821 e 822 pode decodificarmais eficientemente cada um dos sinais codificados com basenas características de cada um dos sinais codificados. Pre-ferivelmente, o módulo de determinação do decodificador 810pode determinar qual da primeira até m-ésima unidades de de-codificação 821 e 822 pode decodificar mais eficientementecada um dos sinais codificados com base na informação adi-cional extraída do fluxo contínuo de bits de entrada.The decoder determination module 810 terminates which of the first to mth decoding units 821 and 822 can most effectively decode each of the encoded signals. The decoder determination module 810 may use a method similar to that of the decoder module 100 illustrated in Figure 1 to determine which of the first to mth decoding units 821 and 822 can most efficiently decode each of the coded signals. In other words, the decoder determination module 810 can determine which of the first to most decoding units 821 and 822 can most effectively decode each of the encoded signals based on characteristics of each of the encoded signals. Preferably, the decoder determination module 810 can determine which of the first to mth decoding units 821 and 822 can most efficiently decode one of the encoded signals based on the additional information extracted from the input bit stream. .

A informação adicional pode incluir informação declasse que identifica que uma classe na qual um sinal codi-ficado é classificado pertence a um aparelho de codificação,informação da unidade de codificação que identifica uma uni-dade de codificação usada para produzir o sinal codificado,e informação da unidade de decodificação que identifica umaunidade decodificação a ser usada para decodificar o sinalcodificado.Additional information may include information that identifies that a class in which a coded signal is classified belongs to a coding apparatus, coding unit information identifying a coding unit used to produce the coded signal, and information of the decoding unit that identifies a decoding unit to be used to decode the encoded signal.

Por exemplo, o módulo de determinação do decodifi-cador 810 pode determinar a qual classe um sinal codificadopertence com base na informação adicional e escolher, para osinal codificado, qualquer uma da primeira até m-ésima uni-dades de decodificação 821 e 822 correspondente à classe dosinal codificado. Neste caso, a unidade de decodificação es-colhida pode ter uma estrutura tal que ela possa decodificarmais eficientemente sinais que pertencem à mesma classe dosinal codificado.For example, the decoder determination module 810 may determine which class an encoded signal belongs to based on the additional information and choose, for the encoded signals, any one of the first to the nth decoding units 821 and 822 corresponding to coded dosinal class. In this case, the chosen decoding unit may have a structure such that it can more efficiently decode signals belonging to the same encoded signal class.

Alternativamente, o módulo de determinação do de-codificador 810 pode identificar uma unidade de codificaçãousada para produzir um sinal codificado com base na informa-ção adicional e para escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 correspondente à unidade de codificação iden-tificada. Por exemplo, se o sinal codificado foi produzidopor um codificador de fala, o módulo de determinação do de-codificador 810 pode escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 em um decodificador de fala.Alternatively, the decoder determination module 810 may identify a coding unit used to produce a coded signal based on the additional information and to select for the coded signal any of the first to the most decoding units. 821 and 822 corresponding to the identified coding unit. For example, if the encoded signal was produced by a speech encoder, the decoder determination module 810 may choose, for the encoded signal, any of the first to mth decoding units 821 and 822 in a decoder Speech

Alternativamente, o módulo de determinação do de-codificador 810 pode identificar uma unidade de decodifica-ção que pode decodificar um sinal codificado com base na in-formação adicional e pode escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 correspondente à unidade de decodificação i-dentifiçada.Alternatively, the decoder determination module 810 may identify a decoding unit that can decode a coded signal based on further information and may choose, for the coded signal, any of the first to mth units. 821 and 822 corresponding to the i-dentified decoding unit.

Alternativamente, o módulo de determinação do de-codificador 810 pode obter as características de um sinalcodificado da informação adicional e pode escolher qualqueruma da primeira até m-ésima unidades de decodificação 821 e822 que pode decodificar mais eficientemente os sinais comas mesmas características do sinal codificado.Alternatively, the decoder determination module 810 may obtain the characteristics of a coded signal from the additional information and may choose any one of the first to mighty decoding units 821 and 822 that can most efficiently decode signals with the same characteristics as the coded signal.

Desta maneira, determina-se que cada um dos sinaiscodificados extraídos do fluxo contínuo de bits de entradaque é codificado por qualquer uma da primeira até m-ésimaunidades de decodificação 821 e 822 pode decodificar maiseficientemente um sinal codificado correspondente. Os sinaisdecodificados são sintetizados pelo módulo de sintetização830, desse modo, restaurando um sinal original.In this manner, it is determined that each of the encoded signals extracted from the input bit stream that is encoded by any one of the first up to m-decoding units 821 and 822 may more efficiently decode a corresponding encoded signal. The decoded signals are synthesized by the synthesizer module 830, thereby restoring an original signal.

O módulo de desempacotamento de bits 800 extraiinformação de divisão considerando os sinais codificados,por exemplo, o número de sinais codificados e informação debanda de cada um dos sinais codificados, e o módulo de sin-tetização 830 pode sintetizar os sinais decodificados forne-cidos pelo módulo de decodificação 820 em relação à informa-ção de divisão.Bit unpacking module 800 extracts division information by considering the encoded signals, for example, the number of encoded signals and information from each of the encoded signals, and the synthesizing module 830 can synthesize the decoded signals provided by the decoding module 820 in relation to the division information.

O módulo de sintetização 830 pode incluir uma plu-ralidade da primeira até n-ésima unidades de sintetização831 e 832. Cada uma da primeira até n-ésima unidades de sin-tetização 831 e 832 pode sintetizar os sinais decodificadosfornecidos pelo módulo de decodificação 820 ou pode realizara conversão de domínio ou decodificação adicional no mesmosinal codificado ou em todos eles.The synthesizer module 830 may include a plurality of the first to nth synthesizer units 831 and 832. Each of the first to nth synthesizer units 831 and 832 may synthesize the decoded signals provided by the decode module 820 or You can perform additional domain conversion or decoding on the same or all of the encoded signals.

Uma da primeira até n-ésima unidades de sintetiza-ção 831 e 832 pode realizar uma operação pós-processamento,que é o inverso de uma operação pré-processamento realizadapor um aparelho de codificação, em um sinal sintetizado. In-formação que indica se deve ser realizada uma operação depós-processamento e informação de decodificação usada pararealizar a operação de pós-processamento podem ser extraídasdo fluxo contínuo de bits de entrada.One of the first through nth synthesizing units 831 and 832 may perform a postprocessing operation, which is the inverse of a preprocessing operation performed by a coding apparatus, on a synthesized signal. Information indicating whether a postprocessing operation should be performed and decoding information used to perform the postprocessing operation can be extracted from the continuous stream of input bits.

Em relação à figura 16, uma da primeira até n-ésima unidades de sintetização 831 e 832, particularmente,uma segunda unidade de sintetização 833, pode incluir umapluralidade do primeiro até n-ésimo pós-processadores 834 e835. A primeira unidade de sintetização 831 sintetiza umapluralidade de sinais decodificados em um único sinal, e umdo primeiro até n-ésimo pós-processadores 834 e 835 realizauma operação de pós-processamento no único sinal obtido pelasintetização.Referring to Figure 16, one of the first to nth synthesizer units 831 and 832, particularly a second synthesizer unit 833, may include a plurality of the first to nth postprocessors 834 and 835. The first synthesizer unit 831 synthesizes a plurality of decoded signals into a single signal, and one of the first through nth postprocessors 834 and 835 performs a postprocessing operation on the single signal obtained by the synthesizers.

Informação que indica qual do primeiro até n-ésimopós-processadores 834 e 835 deve realizar uma operação depós-processamento no único sinal obtido pela sintetizaçãopode ser incluída no fluxo contínuo de bits de entrada.Information that indicates which of the first through nth postprocessors 834 and 835 should perform a postprocessing operation on the single signal obtained by synthesization can be included in the continuous stream of input bits.

Um do primeiro até n-ésimo sintetizadores 831 e832 pode realizar decodificação de prognóstico linear no ú-nico sinal obtido pela unidade de sintetização usando um co-eficiente de prognóstico linear extraído do fluxo contínuode bits de entrada, desse modo, restaurando um sinal original.A presente invenção pode ser realizada como códigolegível por computador escrito em uma mídia de gravação le-gível por computador. A mídia de gravação legível por compu-tador pode ser qualquer tipo de dispositivo de gravação noqual dados são armazenados de uma maneira legível por compu-tador. Exemplos de mídia de gravação legível por computadorincluem uma ROM, uma RAM, um CD-ROM, uma fita magnética, umdisco flexível, um armazenamento ótico de dados e uma ondaportadora (por exemplo, transmissão de dados por meio da In-ternet). A mídia de gravação legível por computador pode serdistribuída em uma pluralidade de sistemas de computador co-nectados em uma rede para que o código legível por computa-dor seja nela escrito e executado a partir dela de uma ma-neira descentralizada. Programas funcionais, código e seg-mentos de código necessários para realizar a presente inven-ção podem ser facilmente entendidos pelos versados na técnica.One of the first to nth synthesizers 831 and 832 can perform linear prognostic decoding on the single signal obtained by the synthesizer unit using a linear prognostic co-efficient extracted from the input bit stream, thereby restoring an original signal. The present invention may be embodied as computer code readable written on a computer readable recording medium. Computer readable recording media can be any type of recording device in which data is stored in a computer readable manner. Examples of computer readable recording media include a ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and carrier (for example, data transmission over the Internet). Computer readable recording media may be distributed on a plurality of computer systems connected to a network so that computer readable code is written to it and executed from it in a decentralized manner. Functional programs, code and code segments necessary to carry out the present invention can be readily understood by those skilled in the art.

Embora a presente invenção tenha sido particular-mente mostrada e descrita em relação às suas modalidades e-xemplares, versados na técnica entendem que várias mudançasnà forma e nos detalhes podem ser feitas sem fugir do espí-rito e do escopo da presente invenção definidos pelas se-guintes reivindicações.While the present invention has been particularly shown and described with respect to its exemplary embodiments, those skilled in the art understand that various changes in shape and detail can be made without departing from the spirit and scope of the present invention defined by the following. -few claims.

APLICABILIDADE INDUSTRIALINDUSTRIAL APPLICABILITY

Como exposto, de acordo com a presente invenção, épossível codificar sinais com diferentes características emuma taxa de bits ideal pela classificação dos sinais em umaou mais classes de acordo com as características dos sinaise é possível codificar cada um dos sinais usando uma unidadede codificação que pode mais bem servir à classe à qual umsinal correspondente pertence. Portanto, é possível codifi-car eficientemente vários sinais, incluindo sinais de áudioe de fala.As stated, according to the present invention, it is possible to encode signals with different characteristics at an optimal bit rate by classifying the signals into one or more classes according to the characteristics of the signals and it is possible to encode each signal using a coding unit that can well serve the class to which a corresponding sign belongs. Therefore, it is possible to efficiently encode various signals, including audio and speech signals.

Claims

1. Decoding method, characterized in that it comprises: extracting a plurality of encoded signals from a continuous stream of input bits, determining which of a plurality of decoding methods should be used to decode each of the encoded signals; signals encoded using the determined decoding methods; synthesize the decoded signals.

The decoding method according to claim 1, characterized in that it further comprises extracting the information from the decoding method which considers how to decode each of the encoded signals, wherein the determination comprises determining why of the plurality of the methods. The decoded signals must be decoded using the information of the decoding method.

3. The decoding method according to claim 1, characterized in that the information of the decoding method comprises at least one of the information of the encoding unit that identifies a coding unit that produced a coded signal, of which decoding unit information identifying a decoding unit which shall decode the encoded signal and the information indicating a characteristic of the encoded signal.

4. Decoding method according to claim 1, characterized by the fact that determination comprises choosing any of the decoding methods which can most effectively decode each of the encoded signals.

5. A decoding method according to claim 1, characterized in that it further comprises extracting splitting information from the encoded signals of the continuous stream of input bits, wherein the synthesizing comprises synthesizing the signals. -decoded into a single signal with respect to division information.

6. The method of decoding according to claim 5, characterized in that the split information comprises numerous coded signals or frequency band information of the coded signals.

A decoding method according to claim 1, characterized in that it further comprises extracting bit-quantity information from encoded signals from the continuous stream of input bits, wherein decoding comprises decoding. signals encoded according to the bit quantity information.

A method of decoding according to claim 1, characterized in that it further comprises extracting encoded order decoding information from the continuous stream of input bits, wherein decoding comprises decoding encoded signals from according to the order-information of the decoding.

A decoder apparatus, characterized in that it comprises: a bit unwrapping module that extracts a plurality of encoded signals from a continuous stream of input bits, a decoder determining module which determines which of a plurality of input units. The decoding must be used to decode each of the encoded signals, a decoding module comprising the decoding unit and decoding each of the coded signals using the determined decoding units, and a synthesizing module which synthesizes the decoding units. decoded signals.

Decoding apparatus according to claim 9, characterized in that the bit-decoding module extracts information from the decoding unit of each of the encoded signals from the continuous stream of input bits, wherein the module The decoding determination parameter determines by which of the plurality of decoding units the encoded signals are to be decoded using the decoding unit information.

11. Decoder according to claim 9, characterized in that the decoder determination module chooses any of the decoding units which can most effectively decode the encoded signals.

12. A decoding apparatus according to claim 9, characterized in that the bit-wrapping module extracts coded signal division information from the continuous stream of input bits, wherein the synthesizer module synthesizes the decoded signals into one. single signal in relation to the division information.

A coding method, characterized in that it comprises: dividing an input signal into a plurality of divided signals, determining which of a plurality of decoding methods should be used to encode each of the divided signals based on the characteristics of each of the divided signals; encode the divided signals using decoding methods; and generate a continuous stream of bits using the coded split signals.

A coding method according to claim 13, characterized in that the determination comprises choosing any of the coding methods which can most efficiently encode the divided signals.

An encoding method according to claim 13, characterized in that it further comprises allocating a number of bits to encode each of the divided signals.

A coding method according to claim 13, characterized in that it further comprises determining an order in which the divided signals are to be coded.

A coding method according to claim 13, characterized in that it further comprises splitting the input signal into a plurality of split signals, determining again which coding method is to be used for coding. each of the split signals, again determine a number of bits to encode the split signals or an order in which the split signals must be encoded.

A coding apparatus, characterized in that it comprises: a signal division module that divides an input signal into a plurality of divided signals, an encoder determining module which determines which of a plurality of coding units must be used to encode each of the divided signals: a coding module comprising coding units and coding the divided signals using the determined coding units; It is a bit wrapping module that generates a continuous stream of bits using the encoded split signals.

Coding apparatus according to Claim 18, characterized in that the encoder determining module chooses any of the coding units that can most efficiently encode the split signals.

Computer readable recording media, characterized by the fact that you have a program for performing the decoding method of any one of claims 1 to 8 or the encoding method of any of claims 13 to 17.