ES2224121T3 - Metodo y dispositivo para codificar y descodificar informacion. - Google Patents
Metodo y dispositivo para codificar y descodificar informacion.Info
- Publication number
- ES2224121T3 ES2224121T3 ES95913405T ES95913405T ES2224121T3 ES 2224121 T3 ES2224121 T3 ES 2224121T3 ES 95913405 T ES95913405 T ES 95913405T ES 95913405 T ES95913405 T ES 95913405T ES 2224121 T3 ES2224121 T3 ES 2224121T3
- Authority
- ES
- Spain
- Prior art keywords
- components
- signal
- tonal
- information
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 75
- 238000001228 spectrum Methods 0.000 claims abstract description 21
- 238000013139 quantization Methods 0.000 claims abstract description 19
- 238000000926 separation method Methods 0.000 claims abstract description 15
- 230000003595 spectral effect Effects 0.000 claims description 160
- 238000011002 quantification Methods 0.000 claims description 65
- 230000036961 partial effect Effects 0.000 claims description 62
- 230000002441 reversible effect Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 description 36
- 238000010606 normalization Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000000470 constituent Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 239000013256 coordination polymer Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/935—Mixed voiced class; Transitions
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Dc Digital Transmission (AREA)
Abstract
LAS SEÑALES DE ENTRADA SE CONVIERTEN EN COMPONENTES DE FRECUENCIA, LOS COMPONENTES DE FRECUENCIA SE SEPARAN EN PRIMERAS SEÑALES COMPUESTAS DE COMPONENTES TONALES Y SEGUNDAS SEÑALES COMPUESTAS DE OTROS COMPONENTES. LAS PRIMERAS Y LAS SEGUNDAS SEÑALES SON RESPECTIVAMENTE CODIFICADAS Y SE GENERA LA CADENA DE CODIGO A TRASMITIR O A GRABAR. POR EJEMPLO, SOLAMENTE LAS PRIMERAS SEÑALES ESTAN CODIFICADAS, Y UNA SUBCADENA DE INFORMACION GENERADA, POR EJEMPLO, CADA INFORMACION DE CUANTIFICACION DE EXACTITUD QUE TENGA UN VALOR COMUN Y UN PARAMETRO RELACIONADO CON LA CODIFICACION DE LA PRIMERA SEÑAL SE INCLUYE EN LA CADENA DE CODIGO, UTILIZANDO AL MENOS CUALQUIERA, POR EJEMPLO, EL NUMERO DE COMPONENTES DEL ESPECTRO QUE CONSTITUYEN LOS COMPONENTES TONALES QUE ES EL PARAMETRO RELACIONADO CON LA SEPARACION O, POR EJEMPLO, LA INFORMACION DE CUANTIFICACION DE EXACTITUD QUE ES EL PARAMETRO RELACIONADO CON LA CODIFICACION DE LAS PRIMERAS SEÑALES COMO PARAMETRO DE REFERENCIA. DE ESTA FORMA, LAS SEÑALES INTRODUCIDAS PUEDEN SER CODIFICADAS DE MANERA MAS EFICIENTE QUE LA MANERA CONVENCIONAL.
Description
Método y dispositivo para codificar y
descodificar información.
Esta invención se refiere a un método y un
aparato de codificación para codificar información, tal como datos
digitales de entrada, mediante codificación altamente eficiente, y
a un método y aparato descodificadores de información, para
descodificar la información codificada.
Existe una cierta variedad de técnicas de
codificación altamente eficientes de señales de audio o voz.
Ejemplos de estas técnicas incluyen la codificación de
transformación, en la que un cuadro de señales digitales que
representa la señal de audio sobre el eje de tiempo es convertida
mediante transformación ortogonal en un bloque de coeficientes
espectrales que representa la señal de audio sobre el eje de
frecuencia, y una codificación de sub-banda (SBC) en
la que la banda de frecuencia de la señal de audio es dividida por
un banco de filtros en una pluralidad de sub-bandas
sin formar la señal en cuadros a lo largo del eje de tiempo antes
de la codificación. Se conoce también una combinación de
codificación de sub-banda y codificación de
transformación, en la que las señales que representan la señal de
audio sobre el eje de tiempo son divididas en bandas por división
en bandas, y luego son transformadas en señales sobre el eje de
frecuencia mediante transformación espectral, y los componentes de
frecuencia obtenidos por la transformación espectral son codificados
en cada banda.
Entre los filtros para dividir un espectro de
frecuencia en una pluralidad de campos de frecuencia de igual
anchura se incluye el filtro de espejo de cuadratura (QMF), como se
expone por R.R.Crochiere en "Digital Coding of Speech in
Sub-bands" (Codificación digital de habla en
sub-bandas), 55 Bell Syst. Techn. J., núm. 8
(1978), Con el filtro QMF, el espectro de frecuencia de la señal es
dividido en dos bandas de igual anchura. Con dicho filtro QMF, no se
produce la aparición de señales espurias cuando las bandas
resultantes de la división son subsiguientemente combinadas
juntas.
En la publicación "Polyphase Quadrature
Filters, A New Subband Technique" (Filtros de cuadratura
polifásica, una nueva técnica de sub-banda). Joseph
H. Rothweiler, ICASSP 83, Boston, muestra una técnica de división
del espectro de frecuencia de la señal en bandas de frecuencia de
igual anchura. Con el presente QMF polifásico, el espectro de
frecuencia de las señales puede ser dividido en un momento en
bandas de frecuencia plurales de igual anchura.
Se conoce también una técnica de transformación
ortogonal que incluye dividir la señal de audio de entrada digital
en cuadros de duración de tiempo predeterminada, y tratar los
cuadros resultantes con el uso de una transformación de Fourier
diferente (DFT), transformación de coseno diferente (DCT), y DCT
modificada para convertir la señal del eje de tiempo al eje de
frecuencia. Exposiciones sobre MDCT pueden ser halladas en la
publicación de J.P.Princen y A.B.Bradley "Subband Transform
Coding Using Filter Bank Based on Time Domain Aliasing
Cancellation" (Codificación de Transformación de
sub-banda con el uso de banco de filtros, basada en
la cancelación de señales espurias en el dominio del tiempo),
ICASSP, 1987.
Mediante la cuantificación de las señales
divididas sobre la base de banda por la conversión de filtro o
espectro, se hace posible controlar la banda sujeta a ruido de
cuantificación, y psicoacústicamente puede ser conseguida una
codificación más eficiente mediante la utilización de los efectos
denominados de enmascaramiento. Si los componentes de la señal
están normalizados de banda a banda con el valor máximo de los
valores absolutos de dichos componentes de señal, se hace posible
efectuar una codificación más eficiente.
En una técnica de cuantificación de los
coeficientes espectrales que resultan de una transformación
ortogonal, es conocido el uso de sub-bandas, que
aprovecha las ventajas de las características psicoacústicas del
sistema de audición humano. Es decir, que los coeficientes
espectrales que representan una señal de audio sobre el eje de
frecuencia pueden estar divididos en una pluralidad de bandas de
frecuencia críticas, por ejemplo, 25 bandas críticas. La anchura de
las bandas críticas aumenta al aumentar la frecuencia. En dicho
sistema de cuantificación, son asignados bitios de modo adaptable
entre las diversas bandas críticas. Por ejemplo, cuando se aplica
una asignación de bitios adaptables a los datos del coeficiente
espectral resultante del MDCT, los datos del coeficiente espectral
generados por el MDCT dentro de cada una de las bandas críticas son
cuantificados con el uso de asignación adaptable de cierto número de
bitios.
Se conocen en la actualidad las siguientes dos
técnicas de asignación de bitios. Por ejemplo, en la publicación
del Instituto de Ingenieros Eléctricos y Electrónicos
"Transactios of Acustics, Speech and Signal Processing"
(Informes sobre tratamiento de señales de voz y acústicas) vol.
ASSP-25, núm. 4, Agosto de 1977, la asignación de
bitios es llevada a cabo sobre la base de la amplitud de la señal
en cada banda crítica. Esta técnica produce un espectro de ruido de
cuantificación plana y reduce al mínimo la energía ruidosa, pero el
nivel de ruido percibido por el oyente no es óptimo, debido a que
esta técnica no aprovecha de manera efectiva el efecto de
enmascaramiento psicoacústico.
En la técnica de asignación de bitios descrita en
el documento de M.A.Krassner "The critical Band Encoder, Digital
Encoding of the Perceptual Requirements of the Auditory System"
(Codificador de banda crítica, Codificación digital de los
requerimientos perceptuales del sistema de audición), ICASSP 1980,
el mecanismo de enmascaramiento psicoacústico es utilizado para
determinar la asignación de un bitio fijo que produce la necesaria
relación entre señal y ruido para cada banda crítica. No obstante,
si la relación entre señal y ruido de dicho sistema es medida con
el uso de una onda senoidal, se obtienen resultados no óptimos
debido a la asignación fija de bitios entre las bandas
críticas.
Para evitar estos inconvenientes, se ha propuesto
un aparato codificador de alta eficiencia en el que el número total
de bitios disponibles para la asignación de ellos, es dividido
entre un patrón de asignación de bitio fijo preestablecido por cada
bloque pequeño, y una asignación de bitios que depende de la
magnitud de la señal basada en el bloque, y la relación de la
división se establece en dependencia de una señal correspondiente a
la señal de entrada, de modo que cuanto más liso es el espectro de
la señal más alta es la relación de la división para el patrón de
asignación de bitio fijo.
Con este aparato, si la energía es concentrada en
un componente espectral particular, como en el caso de una entrada
de onda senoidal, un número mayor de bitios son asignados al bloque
que contiene el componente espectral, para mejora significativa de
las características de la relación señal-ruido sobre
la totalidad. Dado que el sistema de audición humano es altamente
sensible a una señal que tenga componentes espectrales agudos,
dicha técnica puede ser empleada para mejorar la relación de
señal-ruido, con la mejora no sólo de los valores
medidos sino también de la calidad del sonido percibido por el
oído.
Además de las técnicas anteriores, se ha
propuesto una cierta variedad de otras, y el modelo que simula el
sistema de audición humano ha sido refinado, de modo que si el
dispositivo de codificación es mejorado en su capacidad, la
codificación puede ser hecha con una eficiencia más alta, a la luz
de dicho sistema de audición humano.
La fig. 1 muestra una constitución básica de un
dispositivo codificador convencional para codificar señales
acústicas como señales de forma de onda sobre el eje de tiempo.
Con referencia a la fig. 1, la forma de onda de
señal acústica suministrada en un terminal 100 es convertida
mediante un circuito de conversión 101 en componentes de frecuencia
de señales acústicas que son luego codificadas por un circuito
codificador 102 de componente de señal. Los códigos son dispuestos
por un circuito generador 103 de cadena de código como una cadena
de código a la que se da salida en un terminal 104.
La fig. 2 es una constitución ilustrativa del
circuito de conversión 101 mostrado en la fig. 1.
Con referencia a la fig. 2, la señal acústica
suministrada en un terminal 200, que corresponde al terminal 100
mostrado en la fig. 1, es dividida en cuatro bandas por un circuito
201 de división de espectro de frecuencia, que puede ser el filtro
de cuadratura de polifase antes mencionado. Las señales acústicas
de las respectivas bandas, obtenidas por el filtro 201 de división
de espectro de frecuencia, son convertidas en componentes
espectrales mediante los circuito 211 a 214 de conversión ortogonal
directa para efectuar la transformación ortogonal, tal como los
circuitos MDCT. Es decir, que las señales acústicas introducidas en
los circuitos 211 a 214 de conversión directa de espectro, tienen
cada una de ellas una anchura de banda igual a un cuarto de la
anchura de banda de la señal suministrada en el terminal 200, de
modo que las señales acústicas suministradas a través del terminal
200 son submuestreadas a una velocidad de 1 a 4. Las salidas de los
circuitos de conversión directa 211 a 214 de espectro son enviadas a
través de los terminales 221 a 224 al circuito 102 de codificación
de componente de señal mostrado en la fig. 1. Por supuesto que el
circuito de conversión 101 mostrado en la fig. 1 puede ser
modificado de la manera deseada. Por ejemplo, la señal acústica de
entrada puede ser convertida directamente por el MDCT en
componentes espectrales, mientras que dicho MDCT puede ser
reemplazado por DFT o DCT.
La fig. 3 muestra una constitución ilustrativa
del circuito codificador 102 de componente de señal mostrado en la
fig. 1.
Con referencia a la fig. 3, una salida del
circuito codificador 102 de componente de señal suministrada a un
terminal 300 es normalizada por un circuito de normalización 301
sobre la base de banda, antes de ser transmitido a un circuito de
cuantificación 303. La señal de entrada al terminal 300 es enviada
también a un circuito de decisión 302 de operación de
cuantificación. El circuito de cuantificación 303 cuantifica los
componentes espectrales normalizados procedentes del circuito de
normalización 301, en base a las operaciones de cuantificación
calculadas por el circuito de decisión 303 de la operación de
cuantificación a partir de los componentes espectrales suministrados
a través del terminal 300. Los componentes espectrales
cuantificados procedentes del circuito 303 de cuantificación son
enviados a través del terminal 304 al circuito generador 103 de
cadena de código de la fig. 1. Una señal que sale por el terminal
304 contiene la información de coeficiente de normalización en el
circuito de normalización 301, y la información de la operación de
cuantificación en el circuito de decisión 302, además de los
componentes espectrales cuantificados procedentes del circuito 303
de cuantificación.
La fig. 4 muestra una constitución básica de un
dispositivo descodificador de señal para descodificar la señal
acústica procedente de la cadena de código generada por el
dispositivo codificador mostrado en la fig. 1, y dar salida a la
señal acústica descodificada.
Con referencia a la fig. 4, los códigos de los
respectivos componentes de señal son extraídos por un circuito 401
de resolución de cadena de señal procedente de la cadena de código
generada por la constitución mostrada en la fig. 1 y suministrada a
través del terminal 400. A partir de estos códigos, los componentes
de señal son restaurados por el circuito descodificador 402 de
componente de señal. Los componentes de la señal descodificada son
tratados por un circuito 403 de transformación inversa, con una
transformación inversa que es una operación inversa a la ejecutada
por el circuito de transformación 101 de la fig. 1. Esto produce
una señal de forma de onda acústica a la que se da salida en el
terminal 404.
La fig. 5 muestra una constitución ilustrativa de
un circuito 403 de transformación inversa mostrado en la fig.
4.
La fig. 5 muestra una constitución ilustrativa de
un circuito equivalente del circuito de transformación mostrado en
la fig. 2. Las señales suministradas desde el circuito
descodificador 402 de componente de señal a través de los
terminales 501 a 504 son tratados por los circuitos 511 a 514 de
conversión de espectro inverso que ejecutan la transformación de
espectro inversa, que es el reverso de la transformación de
espectro directa mostrada en la fig. 2. Las señales de las bandas
respectivas producidas por los circuitos 511 a 514 de
transformación ortogonal inversa son combinadas por un filtro 515 de
combinación de banda, que ejecuta una operación que es el reverso de
la división de espectro de frecuencia ejecutada por el filtro 201
de división de espectro de frecuencia mostrado en la fig. 2. Una
salida del filtro 515 sintetizador de banda se produce por el
terminal 521, que corresponde al terminal 404 mostrado en la fig.
4.
La fig. 6 ilustra un ejemplo de un método de
codificación convencional. En el ejemplo mostrado en la fig. 6, las
señales del componente espectral son las producidas por el circuito
de transformación mostrado en la fig. 2. En la fig. 6, los niveles
de los valores absolutos de las señales espectrales por medio de
MDCT son mostradas después de la conversión a los correspondientes
valores de dB.
En la fig. 6, la señal de entrada es transformada
en 64 señales espectrales, desde un bloque de tiempo preestablecido
a otro. Estas 64 señales espectrales son agrupadas en cinco bandas
preestablecidas, citadas aquí como unidades de codificación b_{1}
a b_{5} en la fig. 8, de modo que sean normalizadas y
cuantificadas sobre la base del grupo de codificación. Las anchuras
de banda de las respectivas unidades de codificación b_{1} a
b_{5} son más estrechas hacia el margen inferior, y más anchas
hacia el margen alto, con objeto de permitir el control de la
generación del ruido de cuantificación conforme a las
características del sistema de audición humano.
No obstante, y como puede verse en la fig. 6, si
la normalización es efectuada por cada una de las bandas
preestablecidas, la señal de normalización en la unidad de
codificación b3 que contiene los componentes tonales es ejecutada
sobre la base de un mayor coeficiente de normalización, como se
determine por dichos componentes tonales. Con el uso de este valor
de coeficiente de normalización, son normalizados todos los
componentes espectrales contenidos en la unidad de codificación
b_{3}. El ruido contenido en la señal acústica tonal es
obstructivo para el oído. Además, si los componentes tonales no son
cuantificados con alta precisión, se produce una considerable
distorsión en la conexión cuando los componentes tonales son
sintetizados con las señales de forma de onda del bloque de tiempo
vecino. Por esta razón, el componente tonal necesita ser
cuantificado con un número suficiente de bitios. No obstante, si la
operación de cuantificación es determinada en base a las bandas de
frecuencia preestablecidas, es necesario asignar un número mayor de
bitios a un gran número de componentes espectrales en la unidad de
codificación que contiene los componentes tonales, lo que desciende
la eficiencia de la codificación.
Con el método convencional antes descrito, son
fijadas las bandas de frecuencia para la cuantificación de los
componentes de frecuencia con la misma operación de cuantificación.
Por esta razón, si los componentes espectrales son concentrados
cerca de varias frecuencias específicas, y si estos componentes
espectrales han de ser cuantificados con operaciones de
cuantificación suficientemente finas, es necesario asignar un gran
número de bitios a un número grande de componentes espectrales que
pertenecen a la misma banda que éstos.
En general, el ruido contenido en la señal
acústica tonal en la que está concentrada la energía espectral a
frecuencias especificadas es más ofensiva para el oído que el ruido
contenido en la señal acústica en la que la energía es distribuida
uniformemente sobre un campo de frecuencia ancho. Dicho ruido es
extremadamente molesto para el oído. Por otra parte, si los
componentes espectrales que tienen energías mayores, es decir,
componentes tonales, no son cuantificados en operaciones de
cuantificación extremadamente finas, la distorsión de bloque a
bloque se hace mayor cuando los componentes espectrales son
restaurados en las señales de forma de onda sobre el eje de tiempo,
y las señales de forma de onda resultantes son sintetizadas con
bloques temporalmente vecinos. Dicho en otros términos, se produce
una distorsión de conexión mayor cuando las señales de forma de
onda resultantes son sintetizadas con señales de forma de onda de
los bloques temporales vecinos, lo que presenta de nuevo una
dificultad para el sistema de audición humano. Por tanto, ha
existido la dificultad con el método convencional de elevar la
eficiencia de la codificación para la señal acústica tonal sin
deteriorar la calidad de la señal.
Para evitar dicho inconveniente, los presentes
cesionarios propusieron en el Registro Internacional núm. PCT/JP94
/ 00880 (Publicación internacional núm. WO94/28633, de fecha 8 de
Diciembre de 1994) un método para realizar codificación de alta
eficiencia por separación de la señal de entrada en componentes
tonales en los que la energía de la señal es concentrada en una
frecuencia especificada, y componentes no tonales en los que la
energía de la señal es distribuida uniformemente sobre un campo de
frecuencia amplio. Con el método propuesto anteriormente, la
codificación puede ser lograda más eficientemente que con el método
antes citado de cuantificación de componentes de frecuencia en base
a bandas fijas, por cuantificación de los componentes tonales con
operaciones de cuantificación finas dentro de un margen de
frecuencia extremadamente estrecho sobre el eje de frecuencia, y
por registro de los datos resultantes sobre el medio de grabación
junto con la posición del eje de frecuencia. Como ejemplo
ilustrativo de la codificación de alta eficiencia, fue propuesto un
método para normalizar y cuantificar un número preestablecido de
señales espectrales, centrado en torno a un componente espectral de
energía máxima de cada uno de los componentes tonales, y codificar
las señales espectrales resultantes.
No obstante, el método propuesto en el documento
PCT/JP/00880 consiste, de acuerdo con la información concerniente a
las operaciones de cuantificación para cuantificar los componentes
tonales en cada componente tonal, o cuantificar todos los
componentes tonales con las mismas operaciones de cuantificación. Si
se emplea el primer método, es necesario utilizar un número de
bitios grande para codificar la información sobre las mismas
operaciones de cuantificación, lo que no es deseable para la
realización de codificación de alta eficiencia. Por otra parte, si
se utiliza el último método, las operaciones de cuantificación no
pueden ser establecidas en valores óptimos para los respectivos
componentes tonales.
El documento WO 89 10661 A enseña que el
contenido de energía de los datos de voz no aparece de modo
aleatorio a través de la banda de frecuencia audible, y cuando la
señal de entrada es transferida a los componentes de frecuencia, y
éstos son agrupados en una pluralidad de bandas, la información
espectral importante queda sólo dentro de las pocas bandas de
filtro seleccionadas frecuentemente. En particular, este documento
describe un método para transmitir una señal de información sobre un
canal de comunicaciones en el que las muestras tratadas
digitalmente producidas por un codificador de
sub-banda son moduladas sobre el canal de
comunicaciones, para crear símbolos de canal que tengan una
magnitud de modulación proporcional a una característica de la
respectiva muestra tratada digitalmente.
El documento
EP-A-0 525 809 describe un aparato
codificador en el que coeficientes espectrales de una señal de
entrada digital son agrupados en bandas críticas, y el número tonal
de bitios disponible para cuantificar los coeficientes espectrales
es asignado entre las bandas críticas, con lo que bitios fijos son
asignados entre las bandas críticas de acuerdo con uno seleccionado
de una pluralidad de patrones de asignación de bitios
predeterminados, y bitios variables son asignados entre las bandas
críticas de acuerdo con la energía en dichas bandas críticas.
Un objeto de la presente invención es
proporcionar un método y aparato de codificación de información, un
método y aparato de descodificación de información, con lo que las
señales acústicas tonales, sobre todo, puedan ser codificadas
eficientemente, y las operaciones de cuantificación puedan ser
establecidas de modo óptimo para los respectivos componentes
tonales.
Este objeto se logra con un método de
codificación, un aparato codificador, un método de descodificación y
un aparato descodificador, de acuerdo con las reivindicaciones
independientes adjuntas. Características ventajosas de la presente
invención se definen en las correspondientes
subreivindicaciones.
Con la presente invención puede ser conseguida
una codificación de alta eficiencia mediante la clasificación de
una primera señal como componentes tonales dentro de secuencias
ordenadas de información parcial de acuerdo con una información
común, sin codificar los huecos de las secuencias ordenadas de
información parcial, y codificando de modo unido la información que
indica las secuencias ordenadas de información parcial codificada,
es decir, por separación de los componentes tonales en grupos, sin
codificar los grupos que no contengan los componentes tonales, y
codificando el número de grupos codificados.
Además, una transmisión eficiente puede ser
conseguida por transmisión de la información codificada con el
método de codificación de dicha información y el aparato de la
presente invención.
Con el método y aparato de descodificación de
acuerdo con esta invención, la información que indica las cadenas de
información parcial codificada, excepto los huecos no codificados
de cadenas de información parcial, es descodificada, y en base a
los resultados descodificados se efectúa la descodificación de las
cadenas de información parcial, que consisten en la primera señal
de componentes tonales clasificados de acuerdo con la información
común.
La fig. 1 es diagrama de bloques que muestra la
disposición básica de un aparato codificador convencional.
La fig. 2 es un diagrama de bloques que muestra
una disposición ilustrativa de un circuito de transformación de un
aparato codificador convencional.
La fig. 3 es un diagrama de bloques que muestra
una disposición ilustrativa de un circuito codificador de
componente de señal convencional.
La fig. 4 es un diagrama de bloques de un
circuito, que muestra una disposición típica de un circuito
descodificador convencional.
La fig. 5 es un diagrama de bloques de un
circuito que muestra una disposición ilustrativa de un circuito de
transformación inversa de un circuito descodificador
convencional.
La fig. 6 ilustra un método de codificación de
acuerdo con una técnica convencional, como comparación con la
presente invención.
La fig. 7 es un diagrama de bloques que muestra
una disposición de un aparato codificador de información que
materializa la presente invención.
La fig. 8 es un diagrama de bloques que muestra
una disposición de un aparato descodificador de información que
materializa la presente invención.
La fig. 9 ilustra señales espectrales que
contienen componentes tonales.
La fig. 10 ilustra señales espectrales que
excluyen los componentes tonales.
La fig. 11 es una tabla de flujo de acciones para
ilustrar el flujo de tratamiento para la separación de los
componentes tonales.
La fig. 12 es una tabla de flujo de acciones para
ilustrar el flujo del tratamiento para determinar el número de
señales espectrales que forman los componentes tonales
registrados.
La fig. 13 ilustra un ejemplo de cadena de
código.
La fig. 14 ilustra una cadena de código producida
con el método de codificación de la presente invención.
La fig. 15 ilustra otro ejemplo de cadena de
código.
La fig. 16 ilustra otro ejemplo más de cadena de
código.
La fig. 17 es un diagrama de bloques de un
circuito que muestra otro ejemplo de una unidad de restauración de
acuerdo con la presente invención.
La fig. 18 es una tabla de flujo de acciones que
muestra el flujo del tratamiento durante el agrupamiento de los
componentes tonales.
La fig. 19 es una tabla de flujo de acciones que
ilustra el flujo del tratamiento del método de descodificación de
información de acuerdo con la presente invención.
Con referencia ahora a los dibujos, se explicarán
en detalle realizaciones ilustrativas preferidas de la presente
invención.
La fig. 7 muestra una disposición de un aparato
codificador de información que materializa la presente
invención.
Con referencia a dicha fig. 7, una señal de forma
de onda acústica es suministrada a un terminal 600. Dicha señal de
forma de onda acústica es transferida por medio de un circuito de
transformación 601 dentro de los componentes de frecuencia de señal,
y que luego es encaminada a un circuito separador 602 de componente
de señal. En dicho circuito separador 602 de componente de señal,
los componentes de frecuencia de señal producidos por el circuito
de transformación 601 son separados en componentes tonales que
tienen una distribución espectral progresiva y los restantes
componentes de frecuencia de señal, es decir, los componentes
ruidosos que tienen una distribución espectral plana. De los
componentes de frecuencia resultantes, los componentes tonales que
presentan la distribución espectral progresiva son codificados por
medio de un circuito 603 codificador de componente tonal, mientras
que los componentes de frecuencia de señal restantes, es decir, los
componentes ruidosos, son codificados por medio de un circuito
codificador 604 de componente ruidoso. La salida del circuito
codificador 603 de componente tonal y del circuito codificador 604
de componente ruidoso son formadas mediante un circuito 605
generador de cadena de código, en una cadena a la que se da salida
hacia un codificador ECC 606.
El codificador ECC 606 añade códigos de
corrección de error a la cadena de código a la que da salida el
circuito 605 generador de cadena de código. Una salida del
codificador ECC 606 es modulada por un circuito EFM 607, antes de
ser transmitida a una cabeza grabadora 608. La cabeza grabadora 608
registra la cadena de código de salida del circuito EFM 607 sobre
un disco 609. El circuito separador 602 de componente de señal da
salida al número de datos de información del componente tonal, a la
información de posición, y la información sobre el número de
componentes espectrales, hacia el circuito 605 generador de cadena
de código.
Para el circuito de transformación 601 puede ser
empleada una disposición similar a la mostrada en la fig. 22.
Por supuesto, puede ser utilizada otra
constitución distinta a la mostrada en la fig. 2 para el circuito
de transformación 601. Por ejemplo, la señal de salida puede ser
transformada directamente por el MDCT en señales espectrales, o la
transformación en señales espectrales por DFT o DCT puede ser
empleada en lugar del MDCT. El circuito codificador 603 de
componente tonal y el circuito codificador 604 de componente
ruidoso pueden ser puestos en práctica básicamente con disposición
igual a la mostrada en la fig. 3.
La fig. 8 muestra una constitución de un circuito
descodificador para descodificar la cadena obtenida con el circuito
codificador mostrado en la fig. 7.
Con referencia a la fig. 8, la cadena de código
reproducida desde el disco 609 por la cabeza reproductora 708 es
encaminada hacia un circuito 709 EFM, que desmodula la cadena de
código de entrada. Dicha cadena de código desmodulada es encaminada
hacia un descodificador ECC 710, para corrección de error. En base
al número de datos de información sobre los componentes tonales
contenidos en la cadena de código corregida de error, un circuito
701 de resolución de cadena de código reconoce la parte de la
cadena de código que es el código de componente tonal, y separa la
cadena de código de entrada en los códigos de componente tonales y
en los códigos de componentes ruidosos. Por otra parte, el circuito
701 separador de cadena de código separa la información de posición
de componente tonal y la información del número de componente
espectral, de la cadena de código de entrada, y da salida a la
información separada hacia un lado de aguas abajo del circuito de
síntesis 704. El código de componente tonal y el código de
componente ruidoso son encaminados respectivamente hacia un circuito
702 de descodificación de componente tonal y un circuito 703 de
descodificación de componente ruidoso, donde son cuantificados
inversamente y desnormalizados para la descodificación. Las señales
descodificadas procedentes de los circuitos 702 y 703 son encaminas
hacia un circuito de síntesis 704, que ejecuta una síntesis que es
la operación inversa de la separación por el circuito separador 602
de componente de señal mostrado en la fig. 7.
En base a la información de posición y a la
información de número de componente espectral, encaminadas desde el
circuito separador 701, el circuito de síntesis 704 añade la señal
de componente tonal descodificado en una posición preestablecida de
la señal de componente ruidoso descodificado, para sintetizar los
componentes ruidoso y tonales sobre el eje de frecuencia. La señal
descodificada sintetizada es transformada mediante un circuito 705
de transformación inversa, que ejecuta una transformación inversa
que es la operación inversa de la transformación ejecutada por el
circuito de transformación 601 mostrado en la fig. 7, de modo que
la señal es restablecida a partir de la señal sobre el eje de
frecuencia, a señal de forma de onda acústica sobre el eje de
tiempo. Una señal de forma de onda de salida procedente del
circuito 705 de transformación inversa es dada salida en un
terminal 707. Las operaciones de la transformación inversa y de
síntesis pueden ser invertidas, en cuyo caso un circuito de
restauración 711 mostrado en la fig. 8 tiene una constitución como
la mostrada en la fig. 17. El circuito 712 de transformación
inversa transforma inversamente la señal de componente ruidoso
descodificada sobre el eje de frecuencia a partir del circuito de
descodificación 703, en la señal de componente ruidoso sobre el eje
de tiempo. El circuito 713 de transformación inversa coloca la
señal de componente tonal descodificada procedente del circuito 702
de descodificación de componente tonal en una posición sobre el eje
de frecuencia como es especificada por la información de número
espectral y la información de posición del componente tonal
transmitida desde el circuito de separación 701 de la cadena de
código, y transforma a la inversa la señal resultante para generar
la señal de componente tonal sobre el eje de tiempo. Un circuito de
síntesis 714 sintetiza la señal de componente ruidoso sobre el eje
de tiempo procedente del circuito 712 de transformación inversa y la
señal de componente tonal sobre el eje de tiempo, a partir del
circuito 713 de transformación inversa para restablecer la señal de
forma de onda acústica original.
Seguidamente se explicarán los antecedentes de
cómo el método de codificación de información y el método de
descodificación de información son aplicados en la constitución del
aparato codificador mostrado en la fig. 7, y del aparato
descodificador mostrado en la fig. 8.
La manera de separar los componentes tonales de
los componentes de frecuencia se muestra en la fig. 9, en la que
cuatro componentes tonales TC_{A}, TC_{B}, TC_{C}, y TC_{D}
han sido extraídos. Dichos componentes tonales son distribuidos en
número menor al de los componentes espectrales, como se muestra en
el ejemplo de la fig. 9. Por tanto, si estos componentes son
cuantificados con operaciones de cuantificación más finas, el
número de bitios de cuantificación sobre la totalidad no es
aumentado excesivamente. Aunque los componentes tonales pueden ser
normalizados y subsiguientemente cuantificados para elevar la
eficiencia de la cuantificación, los procedimientos de
normalización y de cuantificación pueden también ser omitidos para
simplificar el aparato, debido al número menor de señales
espectrales que constituyen los componentes tonales. Además, con el
ejemplo mostrado en la fig. 9, el número de las señales espectrales
que constituyen los componentes tonales es variable entre 3, 5, y
7, de modo que el componente tonal TC_{A} está hecho de tres
señales espectrales, el componente tonal TC_{B} está hecho de
siete señales espectrales, y los componentes tonales TC_{C} y
TC_{D} están hechos respectivamente de tres señales espectrales,
centradas en torno a la señal espectral de valor máximo, que es la
señal espectral que tiene un valor localmente máximo. En tal caso,
la codificación puede ser ejecutada sobre el supuesto de que los
respectivos componente tonales están hechos de hasta tres, cinco, o
siete señales espectrales. Ha de hacerse notar que en el ejemplo
ilustrado no hay componente tonal hecho de cinco señales
espectrales.
La fig. 10 muestra un ejemplo en el que los
componentes tonales son eliminados de las señales espectrales
originales mostradas en la fig. 9, con objeto de mostrar sólo los
componentes ruidosos. Dado que los componentes tonales han sido
eliminados de las señales espectrales originales en las respectivas
unidades de codificación (bandas) b_{1} a b_{5}, en la fig. 10,
los coeficientes de normalización en cada unidad codificadora
b_{1} a b_{3} son de valores menores, de modo que el ruido de
cuantificación puede ser reducido, aún con el uso de un número
menor de bitios de cuantificación.
La fig. 11 muestra el flujo de tratamiento para
separar los componentes tonales mediante el circuito separador 602
de componente de señal.
En la fig. 11, I indica el número de serie de las
señales espectrales, N es el número total de señales espectrales, y
P, R indican coeficientes preestablecidos. Como para los
componentes tonales, si el valor absoluto de una señal espectral es
localmente mayor que el valor de las restantes señales espectrales,
y es mayor en más de un valor preestablecido que el valor máximo de
los valores absolutos de las señales espectrales en el bloque de
tiempo para las señales espectrales, y también si la suma de la
energía de las señales espectrales y la energía de las señales
espectrales vecinas tales como las señales espectrales vecinas
arrastradas directamente, está relacionada en más de la relación
preestablecida con respecto a la energía total dentro de una banda
preestablecida que contiene las señales espectrales, la señal
espectral y, por ejemplo, las dos señales directamente vecinas, se
estima son componentes tonales. La banda preestablecida como la
base de la comparación de la relación de la distribución de la
energía puede ser seleccionada para ser más estrecha y más ancha
hacia los márgenes de frecuencia alta y baja, manteniendo por
ejemplo las anchuras de banda críticas, con objeto de tener en
cuenta las características psicoacústicas del sistema de audición
humano.
En la fig. 11, un valor absoluto máximo de la
señal espectral es sustituido en la operación S1 por una variable
A_{0}. En la operación S2, el número de serie I de la señal
espectral se establece en 1. En la operación S3, el valor absoluto
de una señal espectral (citado de aquí en adelante como valor
absoluto espectral) en el bloque de tiempo, es sustituido por una
variable A.
En la operación S4, se juzga si el valor absoluto
anterior de la señal espectral es o no localmente mayor que los
valores de otras señales espectrales , es decir, si es la señal
espectral que tiene el valor absoluto localmente máximo. Si el
resultado es NO, es decir, que el valor espectral absoluto anterior
no es el componente espectral que tiene el valor absoluto máximo
localmente, el programa pasa a la operación S10. Si es de otro
modo, el programa pasa a la operación S5.
En la operación S5, la magnitud de la relación
entre la variable A de la señal espectral que tiene el valor
localmente máximo en el bloque de tiempo que contiene la señal
espectral que tiene el valor absoluto localmente máximo, y la
variable A_{0} del valor absoluto máximo de la señal espectral,
es comparada con la del coeficiente P que representa una magnitud
preestablecida (A/A_{0} > P). Si A/A_{0} > P, el programa
pasa a la operación S6, y si es de otro modo, es decir, si
A/A_{0} \leq P, el programa se desplaza a la operación S10.
En la operación S6, el valor de la energía de los
componentes espectrales vecinos al componente espectral que tiene
el valor absoluto localmente máximo, tal como la suma de las
energías de ambos componentes espectrales vecinos, es sustituido por
la variable X. En la operación siguiente S7, el valor de la energía
total dentro de una banda preestablecida que contiene el componente
espectral que tiene el valor absoluto localmente máximo y los
componentes espectrales vecinos, es sustituido por una variable
Y.
En la operación siguiente S8, la relación entre
la variable X para el valor de la energía y la variable Y del valor
de la energía dentro de la banda preestablecida, es comparada con
el coeficiente R que indica una relación preestablecida (X / Y >
R). Si el resultado es SI, es decir, si X / Y > R, el programa se
desplaza a la operación S9. Si el resultado es NO, es decir, si X /
Y \leq R, el programa pasa a la operación S10.
En la operación S9, si la relación entre la
energía de la señal espectral que tiene el valor absoluto
localmente máximo y las señales espectrales vecinas, y la energía
en la banda preestablecida que contiene estas señales espectrales no
es inferior a un valor preestablecido, la señal espectral que tiene
el valor absoluto localmente máximo y las señales espectrales
vecinas, se considera son componentes tonales, y ese efecto es
registrado.
En la operación siguiente S10, se juzga si el
número I de las señales espectrales registradas en la operación S9
es igual al número total N de señales espectrales (I = N). Si el
resultado es SI, es decir, que I = N. el programa concluye. Si el
resultado es NO, es decir, que I no es igual a N, el programa pasa
a la operación S11, donde I es incrementado (I = I + 1), es decir,
que el número de las señales espectrales es incrementado en uno por
cada operación, para retornar a la operación S3 para la repetición
de las anteriores operaciones del procedimiento.
La fig. 12 muestra el flujo del procedimiento
para determinar el número de señales espectrales constituyentes del
componente tonal, registrado como componente tonal en el ejemplo de
la fig. 9.
En la fig. 12, el número máximo de señales
espectrales constituyentes del componente tonal se establece en 7.
Si la relación entre la energía de las tres o cinco señales
espectrales centradas en torno a la señal espectral que tiene el
valor absoluto máximo, y la energía de las siete señales
espectrales centradas en torno a la señal espectral que tiene el
valor absoluto localmente máximo, excede al valor preestablecido, el
número de las señales espectrales constituyentes del componente
tonal se establece en tres o cinco, respectivamente. Aunque los
componentes tonales registrados son clasificados previamente en el
ejemplo presente, dichas clasificaciones pueden ser efectuadas al
mismo tiempo que los componentes tonales son extraídos con el
número de la señal espectral que tiene el valor absoluto localmente
máximo hallado en la operación S9, como número de los componentes
tonales registrados.
En la fig. 12, el número de los componentes
tonales registrados se establece en la operación S21 en una
variable M. En la operación S22, el número I del componente tonal
se establece en 1. En la operación S23, el valor de la energía de
las siete señales espectrales vecinas del componente espectral
localmente máximo es sustituido por la variable Y. En la operación
S24, el valor de la energía de las tres señales espectrales vecinas
del componente espectral localmente máximo es sustituido por la
variable X.
En la operación S25, se juzga si la relación
entre el valor de la energía de las anteriores siete señales
espectrales vecinas y el valor de la energía de las tres señales
espectrales (X/Y) es superior a la relación preestablecida P (X/Y
> P). Si el resultado es SI, es decir, que la relación es
superior a P, el programa pasa a la operación S26. Si el resultado
es NO, es decir, que la relación no es superior a P, el programa
pasa a la operación S27.
En la operación S26, el número de señales
espectrales del componente tonal se establece en tres, lo que es
registrado como tres componentes tonales espectrales. El programa
pasa entonces a la operación S31.
En la operación S27, el valor de la energía de
las cinco señales espectrales vecinas, centradas en torno a la
señal espectral localmente máxima, es sustituido por la variable X.
En la siguiente operación S28, se juzga si la relación entre el
valor de la energía de las siete señales espectrales vecinas y el
valor de la energía de las cinco señales espectrales (X / Y), es o
no superior a la relación preestablecida P (X/Y > P). Si el
resultado es SI, es decir, que la relación es superior a P, el
programa se desplaza a la operación S29. Si el resultado es NO, es
decir, que la relación no es superior a P, el programa pasa a la
operación S30.
En la operación S29, el número de señales
espectrales del componente local se establece en cinco, lo que es
registrado como cinco componentes tonales espectrales. El programa
pasa entonces a la operación S31.
En la operación S30, el número de señales
espectrales del componente tonal se establece en siete, lo que es
registrado como siete componentes tonales espectrales. El programa
pasa entonces a la operación S31.
En la operación S31 se determina si el número de
componentes tonales N establecido en la operación S21 es igual o no
al número I de los componentes tonales (I = M). Si el resultado es
SI, es decir, que I = M. el programa concluye. Si el resultado es
NO. es decir, que I no es igual a M, el programa pasa a la operación
S32.
En la operación S32, I es incrementado en uno por
cada operación (I = I + 1) para volver a la operación S23 y repetir
las anteriores operaciones del procedimiento.
La fig. 13 muestra una formación de datos de
información cuando éstos, separados en componentes tonales y
ruidosos como antes se ha descrito, son codificados de acuerdo con
el método de codificación descrito en la solicitud de patente de
EE.UU. núm. de serie 08/306.659, propuesta por el presente
cesionario (fecha de registro, 15 de Septiembre de 1994), para
grabación o transmisión. Ya que puede considerarse que el medio de
grabación es un camino de transmisión, el término "transmisión"
aquí usado significa que comprende el registro de la información
sobre el medio de grabación.
En la fig. 13, los componentes tonales son
transmitidos por grupos, y cada uno de ellos consiste en el mismo
número de componentes espectrales. Es decir, que en el ejemplo
presente, dado que la información indica todos los componentes
tonales que tienen el número de señales espectrales constituyentes
igual a tres, el número de los componentes tonales (como el número
de los datos de información para los tres componentes tonales
espectrales STC_{3} = 3) y los contenidos de los componentes
tonales TC_{A}, TC_{C}, y TC_{D}, es decir, los datos de
información de componente tonal tc_{A}, tc_{C}, y tc_{D}, son
transmitidos como cadena LTC_{1} de información de componente
tonal parcial. La información indica que todos los componentes que
tienen el número de los componentes espectrales constituyentes
igual a cinco, y que igualmente dicha información indica que todos
los componentes tonales que tienen el número de componentes
espectrales constituyentes igual a siete, son transmitidos
subsiguientemente de manera similar a las secuencias ordenadas
LTC_{2} y LTC_{3} de información de componente tonal parcial,
junto con los contenidos de los componentes tonales TC_{B}, es
decir, los datos de información tc_{B} de componente tonal. Si
los componentes tonales son transmitidos por grupos, y cada uno de
ellos tiene el mismo número de señales espectrales constituyentes,
se hace innecesario transmitir la información concerniente al
número de señales espectrales que constituyen las señales
espectrales constituyentes, de modo que una codificación eficiente
se hace posible en el caso de que haya un gran número de
componentes tonales.
La información sobre los componentes tonales tc
incluye la información CP de posición central que indica el centro
de la posición espectral de los componentes tonales, tal como CP =
31 para el componente tonal TC_{C}, la información de las
operaciones de cuantificación que indica el número de bitios de
cuantificación QP (por ejemplo, QP = 6), la información de los
coeficientes de normalización NP, y la información sobre los
respectivos componentes de señal que indica los valores normalizados
y cuantificados de las restantes señales espectrales que forman los
componentes tonales, tal como la información SC_{1}, SC_{2},
... SC_{3}.
La información sobre los componentes ruidosos es
registrada o transmitida en la secuencia de nc_{1}, nc_{2},
nc_{3}, nc_{4}, y nc_{5}, asociada a las bandas b_{1} a
b_{5} de la fig. 10, respectivamente. La información del
componente ruidoso nc incluye la información sobre las operaciones
de cuantificación QP (QP = 3 en el caso de la información nc_{1}),
la información sobre los coeficientes NP de normalización, y la
información sobre los respectivos componentes de señal cuantificada
y normalizada, tal como la información SC_{1}, SC_{2}, ...
SC_{3}.
No obstante, en la cadena de código del ejemplo
presente, es necesario transmitir el número de señales espectrales
con independencia del hecho de que no hay un componente tonal
constituido por cinco señales espectrales. En el ejemplo ilustrado,
sólo se permiten tres números diferentes de las señales espectrales
que constituyen los componentes tonales. Sin embargo, en la
descripción del diseño para la codificación, en el que los datos de
información necesarios para ser codificados por el mismo método de
codificación, en función de las relaciones de compresión variables y
el nivel de calidad del sonido deseado, es necesario permitir que
un gran número de señales espectrales formen los componentes
tonales en la descripción del diseño, al tiempo que no resulta
eficiente transmitir el número de los datos de información sobre los
componentes tonales para la cadena parcial de los datos del
componente tonal que no está en uso.
La fig. 14 muestra un ejemplo de constitución de
cadena en el caso en que la señal espectral mostrada en la fig. 9
es codificada de acuerdo con el método de transmisión de la
presente invención, en el que el aspecto antes citado es tenido en
cuenta.
En la fig. 14, el número de secuencias ordenadas
de la información de los componentes tonales n_{LTC} (en el
ejemplo de las figs. 9 y 14, n_{LTC} = 2) es transmitido primero,
seguido por el número de secuencias ordenadas parciales de la
información sobre los componentes tonales LTC_{11} y LTC_{12},
como aquí se especifica. En el ejemplo de la fig. 14, el número
N_{11} indica el número de datos de información tc para los
componentes tonales en la cadena parcial LTC_{11} (en el ejemplo
presente, N_{11} = 3), el número de señales espectrales que
forman los componentes espectrales n_{sp} que indica el número de
las señales espectrales que forman los componentes tonales (en el
ejemplo presente, n_{sp} = 3), y la información del momento sobre
los componentes tonales tc_{A}, tc_{C}, y tc_{D}. son
transmitidos como la cadena parcial LCT_{11}. Dado que el número
de cualquiera de las señales espectrales que forman los componentes
tonales no es igual a 5 en el ejemplo presente, dicha cadena de
información parcial no es codificada. Como en la cadena parcial
LCT_{12}, son transmitidos el número N_{12} que indica el
número de los datos de información tc para los componentes tonales
en la cadena parcial LTC_{12} (en el ejemplo presente, N_{12} =
3), el número de señales espectrales que forman el componente tonal
n_{sp} (en el ejemplo presente, n_{sp} = 7), y la información
del momento sobre los componentes tonales tc_{B}. Ya que no es
necesario transmitir la información sobre la cadena de información
parcial vacía del componente local, puede conseguirse la eficiencia
de la codificación, en especial si clases diferentes de la cadena
de información parcial han de ser permitidas por las razones
expuestas anteriormente.
En el ejemplo de la fig. 4, la cadena de
información parcial sobre los componentes tonales es producida por
agrupamiento basado en el número de señales espectrales que
constituyen el componente tonal. No obstante, el método de la
presente invención puede ser aplicado a un caso tal en el que las
secuencias ordenadas de información parcial para los componentes
tonales estén constituidas por agrupamiento de la información sobre
los componentes tonales, en base a otros atributos distintos al
número de señales espectrales que constituyen el componente
tonal.
Específicamente. el agrupamiento puede estar
basado en la información sobre las operaciones de cuantificación.
Con referencia a las figs. 9, 15, 17, y 18, se explica un ejemplo
ilustrativo de agrupamiento basado en la información de las
operaciones de cuantificación.
Se supone que el circuito separador 602 de
componente de señal separa los componentes tonales de los
componentes de frecuencia, como se muestra en la fig. 9. En el
ejemplo presente, cuatro componentes tonales TC_{A}, TC_{B},
TC_{C}, y TC_{D} han sido extraídos, como se ha explicado
anteriormente. Si se permite cuantificar los componentes
espectrales en las operaciones de cuantificación correspondientes a
la información sobre la operación de cuantificación QP = 6, o en
las operaciones de cuantificación correspondientes a la información
sobre la operación de cuantificación QP = 4, el circuito de decisión
de la operación de cuantificación en el circuito 603 de
codificación de componente tonal determina la operación de
cuantificación de los respectivos componente tonales de la manera
siguiente.
La fig. 18 muestra un flujo del tratamiento
ilustrativo para agrupar los componentes tonales en función de las
operaciones de cuantificación por medio del circuito 603 de
codificación de componente tonal. En esta figura, el agrupamiento
se hace sobre los componentes tonales previamente extraídos y
registrados mediante el tratamiento de la fig. 11. En el ejemplo
presente, si la relación entre el valor de la energía de cinco
señales espectrales centradas en torno a la señal espectral central
del componente tonal, y el valor de la energía en una banda
preestablecida es superior al valor P, los componentes tonales son
agrupados como componentes tonales cuantificados con la información
sobre las operaciones de cuantificación QP = 6. Si es de otro modo,
los componentes tonales son agrupados como componentes tonales
cuantificados con la información sobre las operaciones de
cuantificación QP = 4.
Con referencia a la fig. 18, el número registrado
de componentes tonales es sustituido en la operación S21 por una
variable M. En la operación S22, el número I de los componentes
tonales se establece en 1. En la operación siguiente S23, el valor
de la energía de la banda preestablecida es sustituida por una
variable Y. En la operación S24, el valor de la energía de las
cinco señales espectrales vecinas es sustituido por la variable
X.
En la operación S25, se juzga si la relación
entre la variable X para el valor de la energía de las cinco
señales espectrales vecinas y la variable Y de la energía de la
banda preestablecida, es o no mayor que el valor P (X/Y > P). Si
el resultado es SI, es decir, si X/Y es mayor que P, el programa se
desplaza a la operación S26. Si el resultado es NO, es decir, si
X/F es inferior a P, el programa pasa a la operación S27.
En la operación S26, los componentes tonales son
agrupados o registrados como componentes tonales con la información
de la operación de cuantificación QP = 6. En la operación S27, los
componentes tonales son agrupados o registrados como componentes
tonales con la información de la operación de cuantificación QP = 4.
El programa pasa entonces a la operación S28.
En la operación S28 se juzga si el número I de
los componentes tonales es o no igual a la variable M para el
número de los componentes tonales registrados. Si el resultado es
SI, el tratamiento llega al cierre. Si el resultado es NO, el
programa pasa a la operación S29, donde el número de componentes
tonales I es incrementado (I = I + 1) para volver a la operación
S23 y repetir las operaciones anteriores del procedimiento.
La operación de cuantificación por cada uno de
los componentes tonales es determinada de esta manera por el
circuito de codificación 603 de componente tonal. Por ejemplo,
TC_{A}, TC_{C}, y TC_{D} son cuantificados con la operación de
cuantificación correspondiente a la información de la operación de
cuantificación QP = 6, para proporcionar tc_{A}, tc_{C}, y
tc_{D}. Además de la información sobre el número de señales
espectrales, la información de los componentes tonales,
cuantificada de la manera antes descrita, la información sobre la
operación de cuantificación, y la información sobre el
agrupamiento, son suministradas al circuito 605 generador de cadena
de código, que genera entonces y da salida a una cadena de código
que se muestra en la fig. 15, en base a los datos anteriores.
La fig. 15 muestra un ejemplo en el que la cadena
de información parcial es constituida en base a la información sobre
la operación de cuantificación. En el ejemplo presente, se supone
que el número de las señales espectrales que forman los componentes
tonales es el mismo para todos los componentes tonales. Por supuesto
que el número de señales espectrales que constituyen los
componentes tonales puede ser codificado como parte de la
información sobre los respectivos componentes tonales.
En el ejemplo presente de la fig. 15, el número
de cadenas de información parcial de los componentes tonales
n_{LTC} (en el ejemplo de la fig. 15, n_{LTC} = 2) es
transmitido primero, seguido por un número de cadenas de información
parcial LTC_{21} y LTC_{22} especificado aquí. En el ejemplo de
la fig. 15, el número N_{21} indica el número de componentes
tonales tc en la cadena de información parcial LTC_{21}, que es
el número de componentes tonales cuantificado en la operación de
cuantificación correspondiente a la información sobre la operación
de cuantificación QP = 6 (N_{21} = 3 aquí), la información sobre
las operaciones de cuantificación QP (QP = 6 aquí), y la
información sobre los componentes tonales realmente cuantificados
tc_{A}, tc_{C}, y tc_{D}, son transmitidas en este orden como
cadena de información parcial para los componentes tonales
LTC_{21}. Por otra parte, el número N_{22} indica el número de
componentes tonales tc en la cadena LTC_{22} de información
parcial, es decir, el número de los componentes tonales
cuantificados en la operación de cuantificación correspondiente a la
información sobre la operación de cuantificación QP = 4 (N_{22} =
1 aquí), la información sobre las operaciones de cuantificación QP
(QP = 4 aquí), y la información sobre los componentes tonales
realmente cuantificados tc_{B}, son transmitidas en este orden
como cadena de información parcial para los componentes tonales
LTC_{22}.
Esto elimina la necesidad de acuerdo de la
información sobre las operaciones de cuantificación con los
respectivos componentes tonales. Por ejemplo, la información sobre
los componentes tonales tc_{c} de la fig. 15 puede estar formada
sólo por la información CP de posición del centro, la información
NP de coeficiente de normalización, y la información sobre los
respectivos componentes de señal SC. Por tanto, en el ejemplo de la
fig. 15, la eficiencia de la codificación puede ser mejorada
especialmente si hay un gran número de componentes tonales.
Por supuesto que la secuencia de transmisión de
los respectivos datos de información puede ser cambiada, con
respecto a la antes descrita. Por ejemplo, la información sobre la
operación de cuantificación QP = 6, el número correspondiente de
datos de información sobre los componentes tonales N_{21} = 3, la
información sobre la operación de cuantificación QP = 4, y el
número correspondiente de datos de información sobre los
componentes tonales N_{22} = 1, puede ser transmitida primero
como un bloque, y la información sobre los componentes tonales que
indica los contenidos de los componentes locales tc_{n} puede ser
transmitida subsiguientemente.
La fig. 19 muestra en una tabla de flujo de
acciones, el flujo del tratamiento en la descodificación de la
cadena de información de los componentes tonales, correspondiente a
la cadena de código mostrada en la fig. 15. En la tabla de la fig.
19, los números de los componentes tonales contenidos en los
respectivos grupos, y de los componentes tonales codificados de
acuerdo con la información, son descodificados secuencialmente.
Con referencia a la fig. 19, el número de los
datos de información correspondientes a los componentes tonales,
con la información sobre la operación de cuantificación QP = 6, es
sustituido en la operación S31 por una variable M1. En la operación
siguiente S32, los componentes tonales contenidos en el grupo son
descodificados para construir M1 datos de información sobre los
componentes tonales.
En la operación S33, el número de datos de
información sobre los componentes tonales, con la información sobre
la operación de cuantificación QP = 4, es sustituido por una
variable M2. En la siguiente operación S34, los componentes tonales
contenidos en este grupo son descodificados para construir M2 datos
de información sobre los componentes tonales.
La fig. 16 muestra otro ejemplo de una cadena de
código producida por codificación de acuerdo con el método de la
presente invención. En este ejemplo, la información sobre los
componentes tonales es agrupada en base a la información sobre el
número de las señales espectrales de los componentes tonales, y la
información sobre las operaciones de cuantificación. En este caso,
la eficiencia de la codificación se aumenta, ya que ni la
información sobre el número de las señales espectrales que forman
los componentes tonales, ni la información sobre la operación de
cuantificación, es la información sobre los componentes tonales, y
sólo es suficiente codificar los componentes tonales a partir de
una cadena parcial de información sobre componentes tonales a otra.
En el método mostrado en la fig. 13, la cadena de información
parcial sobre los componentes tonales necesita ser codificada para
todas las combinaciones de los números de los componentes
espectrales y la información de la operación de cuantificación. En
el método de la presente invención, dado que es suficiente
codificar las cadenas de información parcial sobre los componentes
tonales que no son cadenas vacías, la eficiencia de la codificación
puede ser mejorada significativamente.
Aunque el número de las cadenas de información
parcial sobre los componentes tonales es codificado en el ejemplo
anterior, es posible también utilizar la información señalizadora
que indica si la cadena de información parcial sobre los
respectivos componentes tonales, ha de ser o no codificada. Dicha
disposición puede estar comprendida dentro del alcance de la
presente invención, No obstante, resulta más eficiente codificar el
número de cadenas de información parcial codificada, como se muestra
en las realizaciones antes descritas.
En la anterior descripción, la información de
posición central CP es transmitida como posición de información para
los componentes tonales. No obstante, es posible transmitir la
posición de la señal espectral más inferior por cada componente
tonal, tal como 30 para el componente tonal TC_{C}, en lugar de la
información sobre posición central.
Aunque para aumentar la eficiencia de la
codificación es deseable separar y codificar componentes espectrales
que tengan energías espectrales concentradas en proximidad a
frecuencias especificadas como componentes tonales, la separación
de señal no necesariamente ha de estar basada en la energía
espectral, y aquellos componentes espectrales de un margen
especificado codificados con la información de posición sobre el
eje de frecuencia pueden estar comprendidos dentro de los
componentes tonales, de acuerdo con la presente invención.
Además, aunque el medio de grabación es el disco
609 de la explicación anterior, puede ser también un disco óptico,
un disco magneto-óptico, o un disco de transición de fase. El medio
de grabación puede ser también un medio de grabación en forma de
cinta, empleada en un audio cassette o un cassette de vídeo, un
medio de grabación en forma de disco, tal como un disco duro o un
disco flexible, o un medio de grabación semiconductor, tal como una
tarjeta de memoria IC.
La descripción anterior se ha hecho
principalmente referida a señales acústicas. No obstante, la
presente invención puede ser aplicada también para codificar
señales en forma de onda en general. No obstante, la presente
invención puede ser aplicada de modo más efectivo a las señales
acústicas, debido a que la información sobre los componentes
tonales tiene un importante significado en relación con el sistema
de audición humano.
Aunque los respectivos componentes tonales son
normalizados, y subsiguientemente cuantificados para la codificación
de los componentes tonales, la presente invención puede ser
aplicada también a los componentes tonales cuantificados sin
normalización. No obstante, la eficiencia de la codificación puede
ser mejorada primero mediante la normalización, y subsiguientemente
la cuantificación de los componentes tonales, como en las
realizaciones antes descritas.
El método de codificación para los componentes
ruidosos de la presente invención no se limita a la recuantificación
seguida de la codificación, sino que puede ser aplicada también a
la normalización seguida por la cuantificación. La presente
invención proporciona un método ilustrativo para realizar
eficientemente el método descrito en nuestra solicitud, pendiente
junto con ésta PCT/JP94/00880, y en la solicitud de patente de
EE.UU. núm. de serie 08/306659, y puede ser aplicada en conjunción
con los diversos métodos propuestos en estas solicitudes
pendientes.
Con el método y aparato de codificación de
información de la presente invención, puede conseguirse una
codificación altamente eficiente por clasificación de la primera
señal como componentes tonales en cadenas de información parcial de
acuerdo con la información común, sin codificar los vacíos de las
cadenas de información parcial y por unión de la codificación de
información que indica las cadenas de información parcial
codificadas, es decir, por separación de los componentes tonales en
grupos, sin codificar los grupos que no contienen componentes
tonales, y codificando el número de grupos codificados.
Con el método de transmisión de información y el
medio de grabación de información de acuerdo con la presente
invención, puede ser conseguida una transmisión eficiente por
transmisión de la información codificada con el método y aparato de
codificación de la información de esta invención.
Con el método y aparato de descodificación de
esta invención, la información de las cadenas de información
parcial codificada, excepto las de información parcial con huecos
no codificadas, es descodificada, y en base a los resultados de la
descodificación, ésta se hace en las cadenas de información parcial
que consiste en la primera señal de los componentes tonales,
clasificada de acuerdo con la información común.
Con el método de la presente invención, las
señales tonales pueden ser codificadas eficientemente, de modo que
pueda ser conseguida como un todo una codificación de alta
eficiencia. El efecto favorable de la presente invención puede ser
manifestado más significativamente cuando el cumplimiento de la
codificación con las diversas relaciones de compresión y niveles de
calidad del sonido, se logran de acuerdo con las mismas condiciones
estándar.
Claims (33)
1. Un método para codificar una señal de entrada,
que comprende las operaciones de:
- transformar (601) de la señal de entrada en
componentes de frecuencia;
- separar (602) los componentes de frecuencia en
una primera señal compuesta de componentes tonales (TC_{A}...
TC_{D}) que tiene una distribución de energía inclinada, y una
segunda señal compuesta de otros componentes;
- codificar (603) dicha primera señal por medio
de una primera codificación;
- codificar (604) dicha segunda señal por medio
de una segunda codificación; y
- generar (605) una primera cadena de código para
transmisión o grabación, en base a las señales codificadas
producidas por dicha primera codificación; en el que
- dicha primera cadena de código incluye cadenas
parciales (LTC) de datos de componente tonal, en las que los datos
de componente tonal (tc_{A}... tc_{D}) que tienen los mismos
valores que al menos uno de los parámetros (n_{sp}, QP) para
separación de señal (602) y primera codificación (603) están
agrupados.
2. Un método según la reivindicación 1, en el que
los datos de componente tonal (tc_{A}... tc_{D}) en dichas
cadenas parciales (LTC) están agrupados de acuerdo con el parámetro
(n_{sp}) que indica el número de las señales espectrales que
constituyen los componentes tonales (TC_{A}... TC_{D})
separadas por la separación de señal (602).
3. El método según las reivindicaciones 1 ó 2, en
el que la primera operación de codificación (603) incluye una
operación de cuantificación (303) de dicha primera señal, y los
datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas
parciales (LTC), están agrupados de acuerdo con el parámetro (QP)
que indica información de cuantificación (303).
4. El método según la reivindicación 3, en el que
el parámetro (QP) indica la operación de cuantificación.
5. El método según una cualquiera de las
reivindicaciones 1 a 4, en el que la primera cadena de código
contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) que
indica la constitución de las cadenas parciales (LTC).
6. El método según la reivindicación 5, en el que
la información (nLTC) que indica la constitución de las cadenas
parciales indica el número de dichas cadenas parciales (LTC).
7. El método según una cualquiera de las
reivindicaciones 1 a 6, que comprende además la operación de:
- generar (605) una segunda cadena de código en
base a dicha segunda señal; y
- transmitir (605) dichas cadenas de código
primera y segunda.
8. El método según una cualquiera de las
reivindicaciones 1 a 7, en el que los otros componentes son
espectros ruidosos.
9. El método de la reivindicación 8, en el que
dichos componentes de frecuencia están agrupados en bandas (b1...
b5) y dicha segunda cadena de código está compuesta por componentes
ruidosas (nc_{1}... nc_{5}) asociados a dichas bandas (b1...
b5).
10. Un método para descodificar una cadena de
código compuesta por señales codificadas, que comprende las
operaciones de:
- descodificar (701) una señal codificada
correspondiente a una primera señal constituida por componentes
tonales (TC_{A}... TC_{D}) que tiene una distribución de
energía inclinada para generar primeras señales descodificadas por
medio de una primera descodificación;
- descodificar (701) una señal codificada que
corresponde a una segunda señal constituida por otros componentes,
para generar segundas señales descodificadas por medio de una
segunda descodificación; y
- sintetizar (704) dichas señales descodificadas
primera y segunda para restablecer una señal original; en el
que:
- una primera cadena de código incluye unas
cadenas parciales (LTC) de datos de componente tonal, cuyos datos
de componente tonal (tc_{A}... tc_{D}) que tienen los mismos
valores que al menos uno de los parámetros (n_{sp}, QP) para la
separación de señal (602) y la primera codificación (603), están
agrupados; y
- dicha primera descodificación (701) o dicha
restauración emplean el parámetro (n_{sp}, QP) para descodificar
o restaurar las señales codificadas plurales.
11. El método de la reivindicación 10, en el que
los datos de componente tonal (tc_{A}... tc_{D}) en dichas
cadenas parciales (LTC) están agrupados de acuerdo con el parámetro
(n_{sp}) que indica el número de señales espectrales que
constituyen los componentes tonales TC_{A}... TC_{D}) separados
por la separación (602) de señal.
12. El método de la reivindicación 10, en el que
la primera descodificación (702) incluye una cuantificación inversa
de dicha primera señal, y los datos de componente tonal
(tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están
agrupados de acuerdo con el parámetro (n_{sp}) que indica la
información de la cuantificación.
13. El método de la reivindicación 12, en el
que el parámetro (QP) indica la operación de cuantificación.
14. El método según una cualquiera de las
reivindicaciones 10 a 13, en el que la primera cadena de código
contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) que
indica la constitución de las cadenas parciales (LTC).
15. El método según una cualquiera de las
reivindicaciones 10 a 14, en el que la información (nLTC) que
indica la constitución de las cadenas parciales indica el número de
dichas cadenas parciales (LTC).
16. El método según una cualquiera de las
reivindicaciones 10 a 15, en el que dichos otros componentes son
espectros ruidosos.
17. El método según la reivindicación 16, en el
que dichos componentes de frecuencia están agrupados en bandas
(b1... b5), y una segunda cadena de código está compuesta de
componentes ruidosos (nc_{1}...nc_{5}) asociados a dichas
bandas (b1...b5).
18. Un aparato para codificar una señal de
entrada, que comprende:
- medios (601) para transformar la señal de
entrada en componentes de frecuencia;
- medios (602) para separar los componentes de
frecuencia en una primera señal compuesta de componentes tonales
(TC_{A}...TC_{D}) que tienen una distribución de energía
inclinada, y una segunda señal compuesta de otros componentes;
- medios (603) para codificar dicha primera señal
mediante la primera codificación;
- medios (604) para codificar dicha segunda señal
mediante la segunda codificación; y
- medios (605) para generar una primera cadena de
código para transmisión o grabación en base a señales codificadas
producidas por dichas codificaciones primera y segunda, y en los
que:
- dicha primera cadena de codificación incluye
cadenas parciales (LTC) de datos de componente tonal, cuyos datos de
componente tonal (tc_{A}... tc_{D}) que tienen los mismos
valores que al menos uno de los parámetros (n_{sp}, QP) para la
separación de señal (602) y la primera codificación (603), están
agrupados.
19. El aparato de la reivindicación 18, en el que
los datos de componente tonal (tc_{A}... tc_{D}) en dichas
cadenas parciales (LTC) están agrupados de acuerdo con el parámetro
(n_{sp}) que indica el número de las señales espectrales que
forman los componentes tonales (TC_{A}...TC_{D}) separados por
la separación (602) de señal.
20. El aparato de la reivindicación 18, en el que
la primera codificación (603) incluye una cuantificación (303) de
dicha primera señal, y los datos de componente tonal (tc_{A}...
tc_{D}) en dichas cadenas parciales (LTC) están agrupados de
acuerdo con el parámetro (QP) que indica la información de la
cuantificación (303).
21. El aparato de la reivindicación 20, en el que
el parámetro (QP) indica la operación de cuantificación.
22. El aparato según una cualquiera de las
reivindicaciones 18 a 21, en el que la cadena de código contiene
información (STC_{3}, STC_{5}, STC_{7}; nLTC) que indica la
constitución de las cadenas parciales (LTC).
23. El aparato según la reivindicación 22, en el
que la información (nLTC) que indica la constitución de las cadenas
parciales, indica el número de dichas cadenas parciales (LTC).
24. El aparato según una cualquiera de las
reivindicaciones 18 a 23, en el que dichos otros componentes son
espectros ruidosos.
25. El aparato según la reivindicación 24, en el
que dichos componentes de frecuencia están agrupados en bandas
(b1...b5), y una segunda cadena de código está compuesta de
componentes ruidosos (nc_{1}...nc_{5}) asociados a dichas
bandas (b1...b5).
26. Un aparato para descodificar una cadena de
código compuesta por señales codificadas, que comprende:
- primeros medios descodificadores (701) para
descodificar la señal codificada correspondiente a una primera
señal formada por componentes tonales que tienen una distribución
de energía inclinada para generar primeras señales descodificadas
por medio de la primera descodificación;
- segundos medios descodificadores (701) para
descodificar la señal codificada correspondiente a una segunda
señal formada por otros componentes, para generar segundas señales
descodificadas por medio de la segunda descodificación; y
- medios (704) para sintetizar dichas señales
descodificadas primeras y segundas, para restablecer una señal
original, y en el que:
- una primera cadena de código incluye cadenas
parciales (LTC) de datos de componente tonal, cuyos datos de
componente tonal (tc_{A}... tc_{D}) que tienen los mismos
valores de al menos uno de los parámetros (n_{sp}, QP) para
separación (602) de señal y primera codificación (603), están
agrupados;
- y dichos primeros medios descodificadores (701)
o dichos medios de restauración emplean el parámetro (n_{sp}, QP)
para la descodificación o restauración de las señales codificadas
plurales.
27. El aparato según la reivindicación 26, en el
que los datos de componente tonal (tc_{A}... tc_{D}) en dichas
cadenas parciales (LTC) están agrupados de acuerdo con el parámetro
(n_{sp}) que indica el número de las señales espectrales que
forman los componentes tonales (TC_{A}... TC_{D}) separados por
la separación (602) de señal.
28. El aparato según la reivindicación 26, en el
que la primera descodificación (702) incluye la cuantificación
inversa de dicha primera señal, y los datos de componente tonal
(tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están
agrupados de acuerdo con el parámetro (n_{sp}) que indica la
información de la cuantificación.
29. El aparato según la reivindicación 28, en el
que el parámetro (QP) indica la operación de cuantificación.
30. El aparato según una cualquiera de las
reivindicaciones 26 a 29, en el que la cadena de código que
contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) indica
la constitución de las cadenas parciales (LTC).
31. El aparato según la reivindicación 30, en el
que la información (nLTC) que indica la constitución de las cadenas
parciales, indica el número de dichas cadenas parciales (LTC).
32. El aparato según una cualquiera de las
reivindicaciones 26 a 31, en el que dichos otros componentes son
espectros ruidosos.
33. El aparato según la reivindicación 32, en el
que dichos componentes de frecuencia están agrupados en bandas
(b1... b5), y una segunda cadena de código está compuesta de
componentes ruidosos (nc_{1}... nc_{5}) asociados a dichas
bandas (b1...b5).
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6485394 | 1994-04-01 | ||
JP6485494 | 1994-04-01 | ||
JP6485494 | 1994-04-01 | ||
JP6485394 | 1994-04-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2224121T3 true ES2224121T3 (es) | 2005-03-01 |
Family
ID=26405956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES95913405T Expired - Lifetime ES2224121T3 (es) | 1994-04-01 | 1995-03-31 | Metodo y dispositivo para codificar y descodificar informacion. |
Country Status (14)
Country | Link |
---|---|
US (1) | US5680130A (es) |
EP (1) | EP0713295B1 (es) |
JP (1) | JP3203657B2 (es) |
KR (1) | KR100352352B1 (es) |
CN (1) | CN1103141C (es) |
AT (1) | ATE276607T1 (es) |
BR (1) | BR9505863A (es) |
CA (1) | CA2163371C (es) |
DE (1) | DE69533500T2 (es) |
ES (1) | ES2224121T3 (es) |
MY (1) | MY130167A (es) |
PL (1) | PL311812A1 (es) |
TW (1) | TW301829B (es) |
WO (1) | WO1995027335A1 (es) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3250376B2 (ja) * | 1994-06-13 | 2002-01-28 | ソニー株式会社 | 情報符号化方法及び装置並びに情報復号化方法及び装置 |
TW295747B (es) * | 1994-06-13 | 1997-01-11 | Sony Co Ltd | |
JP3277699B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置並びに信号復号化方法及び装置 |
US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
JPH09101799A (ja) * | 1995-10-04 | 1997-04-15 | Sony Corp | 信号符号化方法及び装置 |
JPH09148937A (ja) * | 1995-11-21 | 1997-06-06 | Sony Corp | 符号化処理方法、復号化処理方法、符号化処理装置および復号化処理装置 |
US6324301B1 (en) * | 1996-01-24 | 2001-11-27 | Lucent Technologies Inc. | Adaptive postfilter for low bitrate visual telephony noise removal |
JPH1084284A (ja) * | 1996-09-06 | 1998-03-31 | Sony Corp | 信号再生方法および装置 |
TW429700B (en) * | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
TW384434B (en) | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
US7016308B1 (en) * | 1999-03-19 | 2006-03-21 | Broadband Royalty Corporation | Digital return path for hybrid fiber/coax network |
US6658382B1 (en) | 1999-03-23 | 2003-12-02 | Nippon Telegraph And Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
US7031335B1 (en) | 1999-11-03 | 2006-04-18 | Adc Telecommunications, Inc. | Digital node for hybrid fiber/coax network |
US6967966B1 (en) | 1999-11-03 | 2005-11-22 | Adc Telecommunications, Inc. | Digital return path for hybrid fiber/coax network |
US6519773B1 (en) | 2000-02-08 | 2003-02-11 | Sherjil Ahmed | Method and apparatus for a digitized CATV network for bundled services |
JP3997522B2 (ja) * | 2000-12-14 | 2007-10-24 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びに記録媒体 |
JP4622164B2 (ja) * | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
JP4296752B2 (ja) * | 2002-05-07 | 2009-07-15 | ソニー株式会社 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US6750791B1 (en) * | 2003-02-07 | 2004-06-15 | Nokia Corporation | Method and device for text data compression |
US7022980B2 (en) * | 2004-02-02 | 2006-04-04 | Agilent Technologies, Inc. | Spectral axis transform |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
WO2006059288A1 (en) * | 2004-12-03 | 2006-06-08 | Koninklijke Philips Electronics N.V. | Parametric audio coding comprising balanced quantization scheme |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US8073395B2 (en) * | 2006-03-07 | 2011-12-06 | Samsung Electronics Co., Ltd. | Channel sensing based on self-signal suppression |
KR101291672B1 (ko) | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
CN105336344B (zh) | 2014-07-10 | 2019-08-20 | 华为技术有限公司 | 杂音检测方法和装置 |
CN113112993B (zh) * | 2020-01-10 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 一种音频信息处理方法、装置、电子设备以及存储介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4485337A (en) * | 1983-05-09 | 1984-11-27 | Control Data Corporation | Servo data driven motor speed control |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
JPS62259263A (ja) * | 1986-05-06 | 1987-11-11 | Pioneer Electronic Corp | スピンドルサ−ボ引込み方法及びその装置 |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
IL89672A (en) * | 1988-04-29 | 1994-04-12 | Motorola Inc | Spectral efficient method of transmitting information signal |
JPH06101197B2 (ja) * | 1988-10-12 | 1994-12-12 | パイオニア株式会社 | Clvディスク駆動用スピンドルサーボループのループゲイン制御方法 |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
JP2542097B2 (ja) * | 1990-01-16 | 1996-10-09 | パイオニア株式会社 | クロック生成用pll回路を含む読取線速度可変型ディスク記録情報再生装置 |
JPH0472909A (ja) * | 1990-07-13 | 1992-03-06 | Sony Corp | オーディオ信号の量子化誤差低減装置 |
DK0531538T3 (da) * | 1991-03-29 | 1998-10-19 | Sony Corp | Fremgangsmåde til indkodning af digitale signaler |
CA2075156A1 (en) * | 1991-08-02 | 1993-02-03 | Kenzo Akagiri | Digital encoder with dynamic quantization bit allocation |
JPH0539442A (ja) * | 1991-08-02 | 1993-02-19 | Genji Naemura | 導電性発熱流動体 |
US5355430A (en) * | 1991-08-12 | 1994-10-11 | Mechatronics Holding Ag | Method for encoding and decoding a human speech signal by using a set of parameters |
DE4135070C1 (es) * | 1991-10-24 | 1993-05-19 | Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De | |
JP3134455B2 (ja) * | 1992-01-29 | 2001-02-13 | ソニー株式会社 | 高能率符号化装置及び方法 |
KR100458969B1 (ko) * | 1993-05-31 | 2005-04-06 | 소니 가부시끼 가이샤 | 신호부호화또는복호화장치,및신호부호화또는복호화방법 |
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
US5537510A (en) * | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
-
1995
- 1995-03-31 CA CA002163371A patent/CA2163371C/en not_active Expired - Lifetime
- 1995-03-31 US US08/553,449 patent/US5680130A/en not_active Expired - Lifetime
- 1995-03-31 DE DE69533500T patent/DE69533500T2/de not_active Expired - Lifetime
- 1995-03-31 BR BR9505863A patent/BR9505863A/pt not_active IP Right Cessation
- 1995-03-31 CN CN95190255A patent/CN1103141C/zh not_active Expired - Lifetime
- 1995-03-31 PL PL95311812A patent/PL311812A1/xx unknown
- 1995-03-31 MY MYPI95000818A patent/MY130167A/en unknown
- 1995-03-31 AT AT95913405T patent/ATE276607T1/de active
- 1995-03-31 EP EP95913405A patent/EP0713295B1/en not_active Expired - Lifetime
- 1995-03-31 KR KR1019950705475A patent/KR100352352B1/ko active IP Right Grant
- 1995-03-31 JP JP52556795A patent/JP3203657B2/ja not_active Expired - Lifetime
- 1995-03-31 ES ES95913405T patent/ES2224121T3/es not_active Expired - Lifetime
- 1995-03-31 WO PCT/JP1995/000635 patent/WO1995027335A1/ja active IP Right Grant
- 1995-04-14 TW TW084103667A patent/TW301829B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1126004A (zh) | 1996-07-03 |
TW301829B (es) | 1997-04-01 |
US5680130A (en) | 1997-10-21 |
DE69533500T2 (de) | 2005-09-08 |
KR960702963A (ko) | 1996-05-23 |
CN1103141C (zh) | 2003-03-12 |
BR9505863A (pt) | 1996-02-21 |
JP3203657B2 (ja) | 2001-08-27 |
WO1995027335A1 (fr) | 1995-10-12 |
CA2163371C (en) | 2005-09-20 |
EP0713295A1 (en) | 1996-05-22 |
KR100352352B1 (ko) | 2003-01-06 |
MY130167A (en) | 2007-06-29 |
EP0713295A4 (en) | 2002-04-17 |
CA2163371A1 (en) | 1995-10-12 |
DE69533500D1 (de) | 2004-10-21 |
ATE276607T1 (de) | 2004-10-15 |
PL311812A1 (en) | 1996-03-18 |
EP0713295B1 (en) | 2004-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2224121T3 (es) | Metodo y dispositivo para codificar y descodificar informacion. | |
KR100420891B1 (ko) | 디지탈신호엔코딩/디코딩방법및장치와기록매체 | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
KR100310214B1 (ko) | 신호인코딩또는디코딩장치와레코딩매체 | |
CA2140779C (en) | Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal | |
KR100368854B1 (ko) | 디지털신호의부호화장치,그의복호화장치및기록매체 | |
CA2075156A1 (en) | Digital encoder with dynamic quantization bit allocation | |
US5781586A (en) | Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium | |
EP0692880B1 (en) | Signal encoder, signal decoder, recording medium and signal encoding method | |
US5832426A (en) | High efficiency audio encoding method and apparatus | |
US6647063B1 (en) | Information encoding method and apparatus, information decoding method and apparatus and recording medium | |
EP0581435A2 (en) | Audio data coding methods and apparatus | |
US5950156A (en) | High efficient signal coding method and apparatus therefor | |
JPH07168593A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体 | |
JP3465697B2 (ja) | 信号記録媒体 | |
JP3465698B2 (ja) | 信号復号化方法及び装置 | |
KR100351772B1 (ko) | 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법 | |
JP3134384B2 (ja) | 符号化装置及び方法 | |
JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 |