ES2224121T3

ES2224121T3 - Metodo y dispositivo para codificar y descodificar informacion.

Info

Publication number: ES2224121T3
Application number: ES95913405T
Authority: ES
Inventors: Kyoya Sony Corporation TSUTSUI; Osamu Sony Corporation SHIMOYOSHI; Mito Sony Corporation SONOHARA
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1994-04-01
Filing date: 1995-03-31
Publication date: 2005-03-01
Anticipated expiration: 2015-03-31
Also published as: CN1126004A; TW301829B; US5680130A; DE69533500T2; KR960702963A; CN1103141C; BR9505863A; JP3203657B2; WO1995027335A1; CA2163371C; EP0713295A1; KR100352352B1; MY130167A; EP0713295A4; CA2163371A1; DE69533500D1; ATE276607T1; PL311812A1; EP0713295B1

Abstract

LAS SEÑALES DE ENTRADA SE CONVIERTEN EN COMPONENTES DE FRECUENCIA, LOS COMPONENTES DE FRECUENCIA SE SEPARAN EN PRIMERAS SEÑALES COMPUESTAS DE COMPONENTES TONALES Y SEGUNDAS SEÑALES COMPUESTAS DE OTROS COMPONENTES. LAS PRIMERAS Y LAS SEGUNDAS SEÑALES SON RESPECTIVAMENTE CODIFICADAS Y SE GENERA LA CADENA DE CODIGO A TRASMITIR O A GRABAR. POR EJEMPLO, SOLAMENTE LAS PRIMERAS SEÑALES ESTAN CODIFICADAS, Y UNA SUBCADENA DE INFORMACION GENERADA, POR EJEMPLO, CADA INFORMACION DE CUANTIFICACION DE EXACTITUD QUE TENGA UN VALOR COMUN Y UN PARAMETRO RELACIONADO CON LA CODIFICACION DE LA PRIMERA SEÑAL SE INCLUYE EN LA CADENA DE CODIGO, UTILIZANDO AL MENOS CUALQUIERA, POR EJEMPLO, EL NUMERO DE COMPONENTES DEL ESPECTRO QUE CONSTITUYEN LOS COMPONENTES TONALES QUE ES EL PARAMETRO RELACIONADO CON LA SEPARACION O, POR EJEMPLO, LA INFORMACION DE CUANTIFICACION DE EXACTITUD QUE ES EL PARAMETRO RELACIONADO CON LA CODIFICACION DE LAS PRIMERAS SEÑALES COMO PARAMETRO DE REFERENCIA. DE ESTA FORMA, LAS SEÑALES INTRODUCIDAS PUEDEN SER CODIFICADAS DE MANERA MAS EFICIENTE QUE LA MANERA CONVENCIONAL.

Description

Método y dispositivo para codificar y descodificar información.

Campo de aplicación técnica

Esta invención se refiere a un método y un aparato de codificación para codificar información, tal como datos digitales de entrada, mediante codificación altamente eficiente, y a un método y aparato descodificadores de información, para descodificar la información codificada.

Antecedentes técnicos

Existe una cierta variedad de técnicas de codificación altamente eficientes de señales de audio o voz. Ejemplos de estas técnicas incluyen la codificación de transformación, en la que un cuadro de señales digitales que representa la señal de audio sobre el eje de tiempo es convertida mediante transformación ortogonal en un bloque de coeficientes espectrales que representa la señal de audio sobre el eje de frecuencia, y una codificación de sub-banda (SBC) en la que la banda de frecuencia de la señal de audio es dividida por un banco de filtros en una pluralidad de sub-bandas sin formar la señal en cuadros a lo largo del eje de tiempo antes de la codificación. Se conoce también una combinación de codificación de sub-banda y codificación de transformación, en la que las señales que representan la señal de audio sobre el eje de tiempo son divididas en bandas por división en bandas, y luego son transformadas en señales sobre el eje de frecuencia mediante transformación espectral, y los componentes de frecuencia obtenidos por la transformación espectral son codificados en cada banda.

Entre los filtros para dividir un espectro de frecuencia en una pluralidad de campos de frecuencia de igual anchura se incluye el filtro de espejo de cuadratura (QMF), como se expone por R.R.Crochiere en "Digital Coding of Speech in Sub-bands" (Codificación digital de habla en sub-bandas), 55 Bell Syst. Techn. J., núm. 8 (1978), Con el filtro QMF, el espectro de frecuencia de la señal es dividido en dos bandas de igual anchura. Con dicho filtro QMF, no se produce la aparición de señales espurias cuando las bandas resultantes de la división son subsiguientemente combinadas juntas.

En la publicación "Polyphase Quadrature Filters, A New Subband Technique" (Filtros de cuadratura polifásica, una nueva técnica de sub-banda). Joseph H. Rothweiler, ICASSP 83, Boston, muestra una técnica de división del espectro de frecuencia de la señal en bandas de frecuencia de igual anchura. Con el presente QMF polifásico, el espectro de frecuencia de las señales puede ser dividido en un momento en bandas de frecuencia plurales de igual anchura.

Se conoce también una técnica de transformación ortogonal que incluye dividir la señal de audio de entrada digital en cuadros de duración de tiempo predeterminada, y tratar los cuadros resultantes con el uso de una transformación de Fourier diferente (DFT), transformación de coseno diferente (DCT), y DCT modificada para convertir la señal del eje de tiempo al eje de frecuencia. Exposiciones sobre MDCT pueden ser halladas en la publicación de J.P.Princen y A.B.Bradley "Subband Transform Coding Using Filter Bank Based on Time Domain Aliasing Cancellation" (Codificación de Transformación de sub-banda con el uso de banco de filtros, basada en la cancelación de señales espurias en el dominio del tiempo), ICASSP, 1987.

Mediante la cuantificación de las señales divididas sobre la base de banda por la conversión de filtro o espectro, se hace posible controlar la banda sujeta a ruido de cuantificación, y psicoacústicamente puede ser conseguida una codificación más eficiente mediante la utilización de los efectos denominados de enmascaramiento. Si los componentes de la señal están normalizados de banda a banda con el valor máximo de los valores absolutos de dichos componentes de señal, se hace posible efectuar una codificación más eficiente.

En una técnica de cuantificación de los coeficientes espectrales que resultan de una transformación ortogonal, es conocido el uso de sub-bandas, que aprovecha las ventajas de las características psicoacústicas del sistema de audición humano. Es decir, que los coeficientes espectrales que representan una señal de audio sobre el eje de frecuencia pueden estar divididos en una pluralidad de bandas de frecuencia críticas, por ejemplo, 25 bandas críticas. La anchura de las bandas críticas aumenta al aumentar la frecuencia. En dicho sistema de cuantificación, son asignados bitios de modo adaptable entre las diversas bandas críticas. Por ejemplo, cuando se aplica una asignación de bitios adaptables a los datos del coeficiente espectral resultante del MDCT, los datos del coeficiente espectral generados por el MDCT dentro de cada una de las bandas críticas son cuantificados con el uso de asignación adaptable de cierto número de bitios.

Se conocen en la actualidad las siguientes dos técnicas de asignación de bitios. Por ejemplo, en la publicación del Instituto de Ingenieros Eléctricos y Electrónicos "Transactios of Acustics, Speech and Signal Processing" (Informes sobre tratamiento de señales de voz y acústicas) vol. ASSP-25, núm. 4, Agosto de 1977, la asignación de bitios es llevada a cabo sobre la base de la amplitud de la señal en cada banda crítica. Esta técnica produce un espectro de ruido de cuantificación plana y reduce al mínimo la energía ruidosa, pero el nivel de ruido percibido por el oyente no es óptimo, debido a que esta técnica no aprovecha de manera efectiva el efecto de enmascaramiento psicoacústico.

En la técnica de asignación de bitios descrita en el documento de M.A.Krassner "The critical Band Encoder, Digital Encoding of the Perceptual Requirements of the Auditory System" (Codificador de banda crítica, Codificación digital de los requerimientos perceptuales del sistema de audición), ICASSP 1980, el mecanismo de enmascaramiento psicoacústico es utilizado para determinar la asignación de un bitio fijo que produce la necesaria relación entre señal y ruido para cada banda crítica. No obstante, si la relación entre señal y ruido de dicho sistema es medida con el uso de una onda senoidal, se obtienen resultados no óptimos debido a la asignación fija de bitios entre las bandas críticas.

Para evitar estos inconvenientes, se ha propuesto un aparato codificador de alta eficiencia en el que el número total de bitios disponibles para la asignación de ellos, es dividido entre un patrón de asignación de bitio fijo preestablecido por cada bloque pequeño, y una asignación de bitios que depende de la magnitud de la señal basada en el bloque, y la relación de la división se establece en dependencia de una señal correspondiente a la señal de entrada, de modo que cuanto más liso es el espectro de la señal más alta es la relación de la división para el patrón de asignación de bitio fijo.

Con este aparato, si la energía es concentrada en un componente espectral particular, como en el caso de una entrada de onda senoidal, un número mayor de bitios son asignados al bloque que contiene el componente espectral, para mejora significativa de las características de la relación señal-ruido sobre la totalidad. Dado que el sistema de audición humano es altamente sensible a una señal que tenga componentes espectrales agudos, dicha técnica puede ser empleada para mejorar la relación de señal-ruido, con la mejora no sólo de los valores medidos sino también de la calidad del sonido percibido por el oído.

Además de las técnicas anteriores, se ha propuesto una cierta variedad de otras, y el modelo que simula el sistema de audición humano ha sido refinado, de modo que si el dispositivo de codificación es mejorado en su capacidad, la codificación puede ser hecha con una eficiencia más alta, a la luz de dicho sistema de audición humano.

La fig. 1 muestra una constitución básica de un dispositivo codificador convencional para codificar señales acústicas como señales de forma de onda sobre el eje de tiempo.

Con referencia a la fig. 1, la forma de onda de señal acústica suministrada en un terminal 100 es convertida mediante un circuito de conversión 101 en componentes de frecuencia de señales acústicas que son luego codificadas por un circuito codificador 102 de componente de señal. Los códigos son dispuestos por un circuito generador 103 de cadena de código como una cadena de código a la que se da salida en un terminal 104.

La fig. 2 es una constitución ilustrativa del circuito de conversión 101 mostrado en la fig. 1.

Con referencia a la fig. 2, la señal acústica suministrada en un terminal 200, que corresponde al terminal 100 mostrado en la fig. 1, es dividida en cuatro bandas por un circuito 201 de división de espectro de frecuencia, que puede ser el filtro de cuadratura de polifase antes mencionado. Las señales acústicas de las respectivas bandas, obtenidas por el filtro 201 de división de espectro de frecuencia, son convertidas en componentes espectrales mediante los circuito 211 a 214 de conversión ortogonal directa para efectuar la transformación ortogonal, tal como los circuitos MDCT. Es decir, que las señales acústicas introducidas en los circuitos 211 a 214 de conversión directa de espectro, tienen cada una de ellas una anchura de banda igual a un cuarto de la anchura de banda de la señal suministrada en el terminal 200, de modo que las señales acústicas suministradas a través del terminal 200 son submuestreadas a una velocidad de 1 a 4. Las salidas de los circuitos de conversión directa 211 a 214 de espectro son enviadas a través de los terminales 221 a 224 al circuito 102 de codificación de componente de señal mostrado en la fig. 1. Por supuesto que el circuito de conversión 101 mostrado en la fig. 1 puede ser modificado de la manera deseada. Por ejemplo, la señal acústica de entrada puede ser convertida directamente por el MDCT en componentes espectrales, mientras que dicho MDCT puede ser reemplazado por DFT o DCT.

La fig. 3 muestra una constitución ilustrativa del circuito codificador 102 de componente de señal mostrado en la fig. 1.

Con referencia a la fig. 3, una salida del circuito codificador 102 de componente de señal suministrada a un terminal 300 es normalizada por un circuito de normalización 301 sobre la base de banda, antes de ser transmitido a un circuito de cuantificación 303. La señal de entrada al terminal 300 es enviada también a un circuito de decisión 302 de operación de cuantificación. El circuito de cuantificación 303 cuantifica los componentes espectrales normalizados procedentes del circuito de normalización 301, en base a las operaciones de cuantificación calculadas por el circuito de decisión 303 de la operación de cuantificación a partir de los componentes espectrales suministrados a través del terminal 300. Los componentes espectrales cuantificados procedentes del circuito 303 de cuantificación son enviados a través del terminal 304 al circuito generador 103 de cadena de código de la fig. 1. Una señal que sale por el terminal 304 contiene la información de coeficiente de normalización en el circuito de normalización 301, y la información de la operación de cuantificación en el circuito de decisión 302, además de los componentes espectrales cuantificados procedentes del circuito 303 de cuantificación.

La fig. 4 muestra una constitución básica de un dispositivo descodificador de señal para descodificar la señal acústica procedente de la cadena de código generada por el dispositivo codificador mostrado en la fig. 1, y dar salida a la señal acústica descodificada.

Con referencia a la fig. 4, los códigos de los respectivos componentes de señal son extraídos por un circuito 401 de resolución de cadena de señal procedente de la cadena de código generada por la constitución mostrada en la fig. 1 y suministrada a través del terminal 400. A partir de estos códigos, los componentes de señal son restaurados por el circuito descodificador 402 de componente de señal. Los componentes de la señal descodificada son tratados por un circuito 403 de transformación inversa, con una transformación inversa que es una operación inversa a la ejecutada por el circuito de transformación 101 de la fig. 1. Esto produce una señal de forma de onda acústica a la que se da salida en el terminal 404.

La fig. 5 muestra una constitución ilustrativa de un circuito 403 de transformación inversa mostrado en la fig. 4.

La fig. 5 muestra una constitución ilustrativa de un circuito equivalente del circuito de transformación mostrado en la fig. 2. Las señales suministradas desde el circuito descodificador 402 de componente de señal a través de los terminales 501 a 504 son tratados por los circuitos 511 a 514 de conversión de espectro inverso que ejecutan la transformación de espectro inversa, que es el reverso de la transformación de espectro directa mostrada en la fig. 2. Las señales de las bandas respectivas producidas por los circuitos 511 a 514 de transformación ortogonal inversa son combinadas por un filtro 515 de combinación de banda, que ejecuta una operación que es el reverso de la división de espectro de frecuencia ejecutada por el filtro 201 de división de espectro de frecuencia mostrado en la fig. 2. Una salida del filtro 515 sintetizador de banda se produce por el terminal 521, que corresponde al terminal 404 mostrado en la fig. 4.

La fig. 6 ilustra un ejemplo de un método de codificación convencional. En el ejemplo mostrado en la fig. 6, las señales del componente espectral son las producidas por el circuito de transformación mostrado en la fig. 2. En la fig. 6, los niveles de los valores absolutos de las señales espectrales por medio de MDCT son mostradas después de la conversión a los correspondientes valores de dB.

En la fig. 6, la señal de entrada es transformada en 64 señales espectrales, desde un bloque de tiempo preestablecido a otro. Estas 64 señales espectrales son agrupadas en cinco bandas preestablecidas, citadas aquí como unidades de codificación b_{1} a b_{5} en la fig. 8, de modo que sean normalizadas y cuantificadas sobre la base del grupo de codificación. Las anchuras de banda de las respectivas unidades de codificación b_{1} a b_{5} son más estrechas hacia el margen inferior, y más anchas hacia el margen alto, con objeto de permitir el control de la generación del ruido de cuantificación conforme a las características del sistema de audición humano.

No obstante, y como puede verse en la fig. 6, si la normalización es efectuada por cada una de las bandas preestablecidas, la señal de normalización en la unidad de codificación b3 que contiene los componentes tonales es ejecutada sobre la base de un mayor coeficiente de normalización, como se determine por dichos componentes tonales. Con el uso de este valor de coeficiente de normalización, son normalizados todos los componentes espectrales contenidos en la unidad de codificación b_{3}. El ruido contenido en la señal acústica tonal es obstructivo para el oído. Además, si los componentes tonales no son cuantificados con alta precisión, se produce una considerable distorsión en la conexión cuando los componentes tonales son sintetizados con las señales de forma de onda del bloque de tiempo vecino. Por esta razón, el componente tonal necesita ser cuantificado con un número suficiente de bitios. No obstante, si la operación de cuantificación es determinada en base a las bandas de frecuencia preestablecidas, es necesario asignar un número mayor de bitios a un gran número de componentes espectrales en la unidad de codificación que contiene los componentes tonales, lo que desciende la eficiencia de la codificación.

Con el método convencional antes descrito, son fijadas las bandas de frecuencia para la cuantificación de los componentes de frecuencia con la misma operación de cuantificación. Por esta razón, si los componentes espectrales son concentrados cerca de varias frecuencias específicas, y si estos componentes espectrales han de ser cuantificados con operaciones de cuantificación suficientemente finas, es necesario asignar un gran número de bitios a un número grande de componentes espectrales que pertenecen a la misma banda que éstos.

En general, el ruido contenido en la señal acústica tonal en la que está concentrada la energía espectral a frecuencias especificadas es más ofensiva para el oído que el ruido contenido en la señal acústica en la que la energía es distribuida uniformemente sobre un campo de frecuencia ancho. Dicho ruido es extremadamente molesto para el oído. Por otra parte, si los componentes espectrales que tienen energías mayores, es decir, componentes tonales, no son cuantificados en operaciones de cuantificación extremadamente finas, la distorsión de bloque a bloque se hace mayor cuando los componentes espectrales son restaurados en las señales de forma de onda sobre el eje de tiempo, y las señales de forma de onda resultantes son sintetizadas con bloques temporalmente vecinos. Dicho en otros términos, se produce una distorsión de conexión mayor cuando las señales de forma de onda resultantes son sintetizadas con señales de forma de onda de los bloques temporales vecinos, lo que presenta de nuevo una dificultad para el sistema de audición humano. Por tanto, ha existido la dificultad con el método convencional de elevar la eficiencia de la codificación para la señal acústica tonal sin deteriorar la calidad de la señal.

Para evitar dicho inconveniente, los presentes cesionarios propusieron en el Registro Internacional núm. PCT/JP94 / 00880 (Publicación internacional núm. WO94/28633, de fecha 8 de Diciembre de 1994) un método para realizar codificación de alta eficiencia por separación de la señal de entrada en componentes tonales en los que la energía de la señal es concentrada en una frecuencia especificada, y componentes no tonales en los que la energía de la señal es distribuida uniformemente sobre un campo de frecuencia amplio. Con el método propuesto anteriormente, la codificación puede ser lograda más eficientemente que con el método antes citado de cuantificación de componentes de frecuencia en base a bandas fijas, por cuantificación de los componentes tonales con operaciones de cuantificación finas dentro de un margen de frecuencia extremadamente estrecho sobre el eje de frecuencia, y por registro de los datos resultantes sobre el medio de grabación junto con la posición del eje de frecuencia. Como ejemplo ilustrativo de la codificación de alta eficiencia, fue propuesto un método para normalizar y cuantificar un número preestablecido de señales espectrales, centrado en torno a un componente espectral de energía máxima de cada uno de los componentes tonales, y codificar las señales espectrales resultantes.

No obstante, el método propuesto en el documento PCT/JP/00880 consiste, de acuerdo con la información concerniente a las operaciones de cuantificación para cuantificar los componentes tonales en cada componente tonal, o cuantificar todos los componentes tonales con las mismas operaciones de cuantificación. Si se emplea el primer método, es necesario utilizar un número de bitios grande para codificar la información sobre las mismas operaciones de cuantificación, lo que no es deseable para la realización de codificación de alta eficiencia. Por otra parte, si se utiliza el último método, las operaciones de cuantificación no pueden ser establecidas en valores óptimos para los respectivos componentes tonales.

El documento WO 89 10661 A enseña que el contenido de energía de los datos de voz no aparece de modo aleatorio a través de la banda de frecuencia audible, y cuando la señal de entrada es transferida a los componentes de frecuencia, y éstos son agrupados en una pluralidad de bandas, la información espectral importante queda sólo dentro de las pocas bandas de filtro seleccionadas frecuentemente. En particular, este documento describe un método para transmitir una señal de información sobre un canal de comunicaciones en el que las muestras tratadas digitalmente producidas por un codificador de sub-banda son moduladas sobre el canal de comunicaciones, para crear símbolos de canal que tengan una magnitud de modulación proporcional a una característica de la respectiva muestra tratada digitalmente.

El documento EP-A-0 525 809 describe un aparato codificador en el que coeficientes espectrales de una señal de entrada digital son agrupados en bandas críticas, y el número tonal de bitios disponible para cuantificar los coeficientes espectrales es asignado entre las bandas críticas, con lo que bitios fijos son asignados entre las bandas críticas de acuerdo con uno seleccionado de una pluralidad de patrones de asignación de bitios predeterminados, y bitios variables son asignados entre las bandas críticas de acuerdo con la energía en dichas bandas críticas.

Un objeto de la presente invención es proporcionar un método y aparato de codificación de información, un método y aparato de descodificación de información, con lo que las señales acústicas tonales, sobre todo, puedan ser codificadas eficientemente, y las operaciones de cuantificación puedan ser establecidas de modo óptimo para los respectivos componentes tonales.

Este objeto se logra con un método de codificación, un aparato codificador, un método de descodificación y un aparato descodificador, de acuerdo con las reivindicaciones independientes adjuntas. Características ventajosas de la presente invención se definen en las correspondientes subreivindicaciones.

Con la presente invención puede ser conseguida una codificación de alta eficiencia mediante la clasificación de una primera señal como componentes tonales dentro de secuencias ordenadas de información parcial de acuerdo con una información común, sin codificar los huecos de las secuencias ordenadas de información parcial, y codificando de modo unido la información que indica las secuencias ordenadas de información parcial codificada, es decir, por separación de los componentes tonales en grupos, sin codificar los grupos que no contengan los componentes tonales, y codificando el número de grupos codificados.

Además, una transmisión eficiente puede ser conseguida por transmisión de la información codificada con el método de codificación de dicha información y el aparato de la presente invención.

Con el método y aparato de descodificación de acuerdo con esta invención, la información que indica las cadenas de información parcial codificada, excepto los huecos no codificados de cadenas de información parcial, es descodificada, y en base a los resultados descodificados se efectúa la descodificación de las cadenas de información parcial, que consisten en la primera señal de componentes tonales clasificados de acuerdo con la información común.

Breve descripción de los dibujos

La fig. 1 es diagrama de bloques que muestra la disposición básica de un aparato codificador convencional.

La fig. 2 es un diagrama de bloques que muestra una disposición ilustrativa de un circuito de transformación de un aparato codificador convencional.

La fig. 3 es un diagrama de bloques que muestra una disposición ilustrativa de un circuito codificador de componente de señal convencional.

La fig. 4 es un diagrama de bloques de un circuito, que muestra una disposición típica de un circuito descodificador convencional.

La fig. 5 es un diagrama de bloques de un circuito que muestra una disposición ilustrativa de un circuito de transformación inversa de un circuito descodificador convencional.

La fig. 6 ilustra un método de codificación de acuerdo con una técnica convencional, como comparación con la presente invención.

La fig. 7 es un diagrama de bloques que muestra una disposición de un aparato codificador de información que materializa la presente invención.

La fig. 8 es un diagrama de bloques que muestra una disposición de un aparato descodificador de información que materializa la presente invención.

La fig. 9 ilustra señales espectrales que contienen componentes tonales.

La fig. 10 ilustra señales espectrales que excluyen los componentes tonales.

La fig. 11 es una tabla de flujo de acciones para ilustrar el flujo de tratamiento para la separación de los componentes tonales.

La fig. 12 es una tabla de flujo de acciones para ilustrar el flujo del tratamiento para determinar el número de señales espectrales que forman los componentes tonales registrados.

La fig. 13 ilustra un ejemplo de cadena de código.

La fig. 14 ilustra una cadena de código producida con el método de codificación de la presente invención.

La fig. 15 ilustra otro ejemplo de cadena de código.

La fig. 16 ilustra otro ejemplo más de cadena de código.

La fig. 17 es un diagrama de bloques de un circuito que muestra otro ejemplo de una unidad de restauración de acuerdo con la presente invención.

La fig. 18 es una tabla de flujo de acciones que muestra el flujo del tratamiento durante el agrupamiento de los componentes tonales.

La fig. 19 es una tabla de flujo de acciones que ilustra el flujo del tratamiento del método de descodificación de información de acuerdo con la presente invención.

Mejor modalidad de puesta en práctica de la invención

Con referencia ahora a los dibujos, se explicarán en detalle realizaciones ilustrativas preferidas de la presente invención.

La fig. 7 muestra una disposición de un aparato codificador de información que materializa la presente invención.

Con referencia a dicha fig. 7, una señal de forma de onda acústica es suministrada a un terminal 600. Dicha señal de forma de onda acústica es transferida por medio de un circuito de transformación 601 dentro de los componentes de frecuencia de señal, y que luego es encaminada a un circuito separador 602 de componente de señal. En dicho circuito separador 602 de componente de señal, los componentes de frecuencia de señal producidos por el circuito de transformación 601 son separados en componentes tonales que tienen una distribución espectral progresiva y los restantes componentes de frecuencia de señal, es decir, los componentes ruidosos que tienen una distribución espectral plana. De los componentes de frecuencia resultantes, los componentes tonales que presentan la distribución espectral progresiva son codificados por medio de un circuito 603 codificador de componente tonal, mientras que los componentes de frecuencia de señal restantes, es decir, los componentes ruidosos, son codificados por medio de un circuito codificador 604 de componente ruidoso. La salida del circuito codificador 603 de componente tonal y del circuito codificador 604 de componente ruidoso son formadas mediante un circuito 605 generador de cadena de código, en una cadena a la que se da salida hacia un codificador ECC 606.

El codificador ECC 606 añade códigos de corrección de error a la cadena de código a la que da salida el circuito 605 generador de cadena de código. Una salida del codificador ECC 606 es modulada por un circuito EFM 607, antes de ser transmitida a una cabeza grabadora 608. La cabeza grabadora 608 registra la cadena de código de salida del circuito EFM 607 sobre un disco 609. El circuito separador 602 de componente de señal da salida al número de datos de información del componente tonal, a la información de posición, y la información sobre el número de componentes espectrales, hacia el circuito 605 generador de cadena de código.

Para el circuito de transformación 601 puede ser empleada una disposición similar a la mostrada en la fig. 22.

Por supuesto, puede ser utilizada otra constitución distinta a la mostrada en la fig. 2 para el circuito de transformación 601. Por ejemplo, la señal de salida puede ser transformada directamente por el MDCT en señales espectrales, o la transformación en señales espectrales por DFT o DCT puede ser empleada en lugar del MDCT. El circuito codificador 603 de componente tonal y el circuito codificador 604 de componente ruidoso pueden ser puestos en práctica básicamente con disposición igual a la mostrada en la fig. 3.

La fig. 8 muestra una constitución de un circuito descodificador para descodificar la cadena obtenida con el circuito codificador mostrado en la fig. 7.

Con referencia a la fig. 8, la cadena de código reproducida desde el disco 609 por la cabeza reproductora 708 es encaminada hacia un circuito 709 EFM, que desmodula la cadena de código de entrada. Dicha cadena de código desmodulada es encaminada hacia un descodificador ECC 710, para corrección de error. En base al número de datos de información sobre los componentes tonales contenidos en la cadena de código corregida de error, un circuito 701 de resolución de cadena de código reconoce la parte de la cadena de código que es el código de componente tonal, y separa la cadena de código de entrada en los códigos de componente tonales y en los códigos de componentes ruidosos. Por otra parte, el circuito 701 separador de cadena de código separa la información de posición de componente tonal y la información del número de componente espectral, de la cadena de código de entrada, y da salida a la información separada hacia un lado de aguas abajo del circuito de síntesis 704. El código de componente tonal y el código de componente ruidoso son encaminados respectivamente hacia un circuito 702 de descodificación de componente tonal y un circuito 703 de descodificación de componente ruidoso, donde son cuantificados inversamente y desnormalizados para la descodificación. Las señales descodificadas procedentes de los circuitos 702 y 703 son encaminas hacia un circuito de síntesis 704, que ejecuta una síntesis que es la operación inversa de la separación por el circuito separador 602 de componente de señal mostrado en la fig. 7.

En base a la información de posición y a la información de número de componente espectral, encaminadas desde el circuito separador 701, el circuito de síntesis 704 añade la señal de componente tonal descodificado en una posición preestablecida de la señal de componente ruidoso descodificado, para sintetizar los componentes ruidoso y tonales sobre el eje de frecuencia. La señal descodificada sintetizada es transformada mediante un circuito 705 de transformación inversa, que ejecuta una transformación inversa que es la operación inversa de la transformación ejecutada por el circuito de transformación 601 mostrado en la fig. 7, de modo que la señal es restablecida a partir de la señal sobre el eje de frecuencia, a señal de forma de onda acústica sobre el eje de tiempo. Una señal de forma de onda de salida procedente del circuito 705 de transformación inversa es dada salida en un terminal 707. Las operaciones de la transformación inversa y de síntesis pueden ser invertidas, en cuyo caso un circuito de restauración 711 mostrado en la fig. 8 tiene una constitución como la mostrada en la fig. 17. El circuito 712 de transformación inversa transforma inversamente la señal de componente ruidoso descodificada sobre el eje de frecuencia a partir del circuito de descodificación 703, en la señal de componente ruidoso sobre el eje de tiempo. El circuito 713 de transformación inversa coloca la señal de componente tonal descodificada procedente del circuito 702 de descodificación de componente tonal en una posición sobre el eje de frecuencia como es especificada por la información de número espectral y la información de posición del componente tonal transmitida desde el circuito de separación 701 de la cadena de código, y transforma a la inversa la señal resultante para generar la señal de componente tonal sobre el eje de tiempo. Un circuito de síntesis 714 sintetiza la señal de componente ruidoso sobre el eje de tiempo procedente del circuito 712 de transformación inversa y la señal de componente tonal sobre el eje de tiempo, a partir del circuito 713 de transformación inversa para restablecer la señal de forma de onda acústica original.

Seguidamente se explicarán los antecedentes de cómo el método de codificación de información y el método de descodificación de información son aplicados en la constitución del aparato codificador mostrado en la fig. 7, y del aparato descodificador mostrado en la fig. 8.

La manera de separar los componentes tonales de los componentes de frecuencia se muestra en la fig. 9, en la que cuatro componentes tonales TC_{A}, TC_{B}, TC_{C}, y TC_{D} han sido extraídos. Dichos componentes tonales son distribuidos en número menor al de los componentes espectrales, como se muestra en el ejemplo de la fig. 9. Por tanto, si estos componentes son cuantificados con operaciones de cuantificación más finas, el número de bitios de cuantificación sobre la totalidad no es aumentado excesivamente. Aunque los componentes tonales pueden ser normalizados y subsiguientemente cuantificados para elevar la eficiencia de la cuantificación, los procedimientos de normalización y de cuantificación pueden también ser omitidos para simplificar el aparato, debido al número menor de señales espectrales que constituyen los componentes tonales. Además, con el ejemplo mostrado en la fig. 9, el número de las señales espectrales que constituyen los componentes tonales es variable entre 3, 5, y 7, de modo que el componente tonal TC_{A} está hecho de tres señales espectrales, el componente tonal TC_{B} está hecho de siete señales espectrales, y los componentes tonales TC_{C} y TC_{D} están hechos respectivamente de tres señales espectrales, centradas en torno a la señal espectral de valor máximo, que es la señal espectral que tiene un valor localmente máximo. En tal caso, la codificación puede ser ejecutada sobre el supuesto de que los respectivos componente tonales están hechos de hasta tres, cinco, o siete señales espectrales. Ha de hacerse notar que en el ejemplo ilustrado no hay componente tonal hecho de cinco señales espectrales.

La fig. 10 muestra un ejemplo en el que los componentes tonales son eliminados de las señales espectrales originales mostradas en la fig. 9, con objeto de mostrar sólo los componentes ruidosos. Dado que los componentes tonales han sido eliminados de las señales espectrales originales en las respectivas unidades de codificación (bandas) b_{1} a b_{5}, en la fig. 10, los coeficientes de normalización en cada unidad codificadora b_{1} a b_{3} son de valores menores, de modo que el ruido de cuantificación puede ser reducido, aún con el uso de un número menor de bitios de cuantificación.

La fig. 11 muestra el flujo de tratamiento para separar los componentes tonales mediante el circuito separador 602 de componente de señal.

En la fig. 11, I indica el número de serie de las señales espectrales, N es el número total de señales espectrales, y P, R indican coeficientes preestablecidos. Como para los componentes tonales, si el valor absoluto de una señal espectral es localmente mayor que el valor de las restantes señales espectrales, y es mayor en más de un valor preestablecido que el valor máximo de los valores absolutos de las señales espectrales en el bloque de tiempo para las señales espectrales, y también si la suma de la energía de las señales espectrales y la energía de las señales espectrales vecinas tales como las señales espectrales vecinas arrastradas directamente, está relacionada en más de la relación preestablecida con respecto a la energía total dentro de una banda preestablecida que contiene las señales espectrales, la señal espectral y, por ejemplo, las dos señales directamente vecinas, se estima son componentes tonales. La banda preestablecida como la base de la comparación de la relación de la distribución de la energía puede ser seleccionada para ser más estrecha y más ancha hacia los márgenes de frecuencia alta y baja, manteniendo por ejemplo las anchuras de banda críticas, con objeto de tener en cuenta las características psicoacústicas del sistema de audición humano.

En la fig. 11, un valor absoluto máximo de la señal espectral es sustituido en la operación S1 por una variable A_{0}. En la operación S2, el número de serie I de la señal espectral se establece en 1. En la operación S3, el valor absoluto de una señal espectral (citado de aquí en adelante como valor absoluto espectral) en el bloque de tiempo, es sustituido por una variable A.

En la operación S4, se juzga si el valor absoluto anterior de la señal espectral es o no localmente mayor que los valores de otras señales espectrales , es decir, si es la señal espectral que tiene el valor absoluto localmente máximo. Si el resultado es NO, es decir, que el valor espectral absoluto anterior no es el componente espectral que tiene el valor absoluto máximo localmente, el programa pasa a la operación S10. Si es de otro modo, el programa pasa a la operación S5.

En la operación S5, la magnitud de la relación entre la variable A de la señal espectral que tiene el valor localmente máximo en el bloque de tiempo que contiene la señal espectral que tiene el valor absoluto localmente máximo, y la variable A_{0} del valor absoluto máximo de la señal espectral, es comparada con la del coeficiente P que representa una magnitud preestablecida (A/A_{0} > P). Si A/A_{0} > P, el programa pasa a la operación S6, y si es de otro modo, es decir, si A/A_{0} \leq P, el programa se desplaza a la operación S10.

En la operación S6, el valor de la energía de los componentes espectrales vecinos al componente espectral que tiene el valor absoluto localmente máximo, tal como la suma de las energías de ambos componentes espectrales vecinos, es sustituido por la variable X. En la operación siguiente S7, el valor de la energía total dentro de una banda preestablecida que contiene el componente espectral que tiene el valor absoluto localmente máximo y los componentes espectrales vecinos, es sustituido por una variable Y.

En la operación siguiente S8, la relación entre la variable X para el valor de la energía y la variable Y del valor de la energía dentro de la banda preestablecida, es comparada con el coeficiente R que indica una relación preestablecida (X / Y > R). Si el resultado es SI, es decir, si X / Y > R, el programa se desplaza a la operación S9. Si el resultado es NO, es decir, si X / Y \leq R, el programa pasa a la operación S10.

En la operación S9, si la relación entre la energía de la señal espectral que tiene el valor absoluto localmente máximo y las señales espectrales vecinas, y la energía en la banda preestablecida que contiene estas señales espectrales no es inferior a un valor preestablecido, la señal espectral que tiene el valor absoluto localmente máximo y las señales espectrales vecinas, se considera son componentes tonales, y ese efecto es registrado.

En la operación siguiente S10, se juzga si el número I de las señales espectrales registradas en la operación S9 es igual al número total N de señales espectrales (I = N). Si el resultado es SI, es decir, que I = N. el programa concluye. Si el resultado es NO, es decir, que I no es igual a N, el programa pasa a la operación S11, donde I es incrementado (I = I + 1), es decir, que el número de las señales espectrales es incrementado en uno por cada operación, para retornar a la operación S3 para la repetición de las anteriores operaciones del procedimiento.

La fig. 12 muestra el flujo del procedimiento para determinar el número de señales espectrales constituyentes del componente tonal, registrado como componente tonal en el ejemplo de la fig. 9.

En la fig. 12, el número máximo de señales espectrales constituyentes del componente tonal se establece en 7. Si la relación entre la energía de las tres o cinco señales espectrales centradas en torno a la señal espectral que tiene el valor absoluto máximo, y la energía de las siete señales espectrales centradas en torno a la señal espectral que tiene el valor absoluto localmente máximo, excede al valor preestablecido, el número de las señales espectrales constituyentes del componente tonal se establece en tres o cinco, respectivamente. Aunque los componentes tonales registrados son clasificados previamente en el ejemplo presente, dichas clasificaciones pueden ser efectuadas al mismo tiempo que los componentes tonales son extraídos con el número de la señal espectral que tiene el valor absoluto localmente máximo hallado en la operación S9, como número de los componentes tonales registrados.

En la fig. 12, el número de los componentes tonales registrados se establece en la operación S21 en una variable M. En la operación S22, el número I del componente tonal se establece en 1. En la operación S23, el valor de la energía de las siete señales espectrales vecinas del componente espectral localmente máximo es sustituido por la variable Y. En la operación S24, el valor de la energía de las tres señales espectrales vecinas del componente espectral localmente máximo es sustituido por la variable X.

En la operación S25, se juzga si la relación entre el valor de la energía de las anteriores siete señales espectrales vecinas y el valor de la energía de las tres señales espectrales (X/Y) es superior a la relación preestablecida P (X/Y > P). Si el resultado es SI, es decir, que la relación es superior a P, el programa pasa a la operación S26. Si el resultado es NO, es decir, que la relación no es superior a P, el programa pasa a la operación S27.

En la operación S26, el número de señales espectrales del componente tonal se establece en tres, lo que es registrado como tres componentes tonales espectrales. El programa pasa entonces a la operación S31.

En la operación S27, el valor de la energía de las cinco señales espectrales vecinas, centradas en torno a la señal espectral localmente máxima, es sustituido por la variable X. En la siguiente operación S28, se juzga si la relación entre el valor de la energía de las siete señales espectrales vecinas y el valor de la energía de las cinco señales espectrales (X / Y), es o no superior a la relación preestablecida P (X/Y > P). Si el resultado es SI, es decir, que la relación es superior a P, el programa se desplaza a la operación S29. Si el resultado es NO, es decir, que la relación no es superior a P, el programa pasa a la operación S30.

En la operación S29, el número de señales espectrales del componente local se establece en cinco, lo que es registrado como cinco componentes tonales espectrales. El programa pasa entonces a la operación S31.

En la operación S30, el número de señales espectrales del componente tonal se establece en siete, lo que es registrado como siete componentes tonales espectrales. El programa pasa entonces a la operación S31.

En la operación S31 se determina si el número de componentes tonales N establecido en la operación S21 es igual o no al número I de los componentes tonales (I = M). Si el resultado es SI, es decir, que I = M. el programa concluye. Si el resultado es NO. es decir, que I no es igual a M, el programa pasa a la operación S32.

En la operación S32, I es incrementado en uno por cada operación (I = I + 1) para volver a la operación S23 y repetir las anteriores operaciones del procedimiento.

La fig. 13 muestra una formación de datos de información cuando éstos, separados en componentes tonales y ruidosos como antes se ha descrito, son codificados de acuerdo con el método de codificación descrito en la solicitud de patente de EE.UU. núm. de serie 08/306.659, propuesta por el presente cesionario (fecha de registro, 15 de Septiembre de 1994), para grabación o transmisión. Ya que puede considerarse que el medio de grabación es un camino de transmisión, el término "transmisión" aquí usado significa que comprende el registro de la información sobre el medio de grabación.

En la fig. 13, los componentes tonales son transmitidos por grupos, y cada uno de ellos consiste en el mismo número de componentes espectrales. Es decir, que en el ejemplo presente, dado que la información indica todos los componentes tonales que tienen el número de señales espectrales constituyentes igual a tres, el número de los componentes tonales (como el número de los datos de información para los tres componentes tonales espectrales STC_{3} = 3) y los contenidos de los componentes tonales TC_{A}, TC_{C}, y TC_{D}, es decir, los datos de información de componente tonal tc_{A}, tc_{C}, y tc_{D}, son transmitidos como cadena LTC_{1} de información de componente tonal parcial. La información indica que todos los componentes que tienen el número de los componentes espectrales constituyentes igual a cinco, y que igualmente dicha información indica que todos los componentes tonales que tienen el número de componentes espectrales constituyentes igual a siete, son transmitidos subsiguientemente de manera similar a las secuencias ordenadas LTC_{2} y LTC_{3} de información de componente tonal parcial, junto con los contenidos de los componentes tonales TC_{B}, es decir, los datos de información tc_{B} de componente tonal. Si los componentes tonales son transmitidos por grupos, y cada uno de ellos tiene el mismo número de señales espectrales constituyentes, se hace innecesario transmitir la información concerniente al número de señales espectrales que constituyen las señales espectrales constituyentes, de modo que una codificación eficiente se hace posible en el caso de que haya un gran número de componentes tonales.

La información sobre los componentes tonales tc incluye la información CP de posición central que indica el centro de la posición espectral de los componentes tonales, tal como CP = 31 para el componente tonal TC_{C}, la información de las operaciones de cuantificación que indica el número de bitios de cuantificación QP (por ejemplo, QP = 6), la información de los coeficientes de normalización NP, y la información sobre los respectivos componentes de señal que indica los valores normalizados y cuantificados de las restantes señales espectrales que forman los componentes tonales, tal como la información SC_{1}, SC_{2}, ... SC_{3}.

La información sobre los componentes ruidosos es registrada o transmitida en la secuencia de nc_{1}, nc_{2}, nc_{3}, nc_{4}, y nc_{5}, asociada a las bandas b_{1} a b_{5} de la fig. 10, respectivamente. La información del componente ruidoso nc incluye la información sobre las operaciones de cuantificación QP (QP = 3 en el caso de la información nc_{1}), la información sobre los coeficientes NP de normalización, y la información sobre los respectivos componentes de señal cuantificada y normalizada, tal como la información SC_{1}, SC_{2}, ... SC_{3}.

No obstante, en la cadena de código del ejemplo presente, es necesario transmitir el número de señales espectrales con independencia del hecho de que no hay un componente tonal constituido por cinco señales espectrales. En el ejemplo ilustrado, sólo se permiten tres números diferentes de las señales espectrales que constituyen los componentes tonales. Sin embargo, en la descripción del diseño para la codificación, en el que los datos de información necesarios para ser codificados por el mismo método de codificación, en función de las relaciones de compresión variables y el nivel de calidad del sonido deseado, es necesario permitir que un gran número de señales espectrales formen los componentes tonales en la descripción del diseño, al tiempo que no resulta eficiente transmitir el número de los datos de información sobre los componentes tonales para la cadena parcial de los datos del componente tonal que no está en uso.

La fig. 14 muestra un ejemplo de constitución de cadena en el caso en que la señal espectral mostrada en la fig. 9 es codificada de acuerdo con el método de transmisión de la presente invención, en el que el aspecto antes citado es tenido en cuenta.

En la fig. 14, el número de secuencias ordenadas de la información de los componentes tonales n_{LTC} (en el ejemplo de las figs. 9 y 14, n_{LTC} = 2) es transmitido primero, seguido por el número de secuencias ordenadas parciales de la información sobre los componentes tonales LTC_{11} y LTC_{12}, como aquí se especifica. En el ejemplo de la fig. 14, el número N_{11} indica el número de datos de información tc para los componentes tonales en la cadena parcial LTC_{11} (en el ejemplo presente, N_{11} = 3), el número de señales espectrales que forman los componentes espectrales n_{sp} que indica el número de las señales espectrales que forman los componentes tonales (en el ejemplo presente, n_{sp} = 3), y la información del momento sobre los componentes tonales tc_{A}, tc_{C}, y tc_{D}. son transmitidos como la cadena parcial LCT_{11}. Dado que el número de cualquiera de las señales espectrales que forman los componentes tonales no es igual a 5 en el ejemplo presente, dicha cadena de información parcial no es codificada. Como en la cadena parcial LCT_{12}, son transmitidos el número N_{12} que indica el número de los datos de información tc para los componentes tonales en la cadena parcial LTC_{12} (en el ejemplo presente, N_{12} = 3), el número de señales espectrales que forman el componente tonal n_{sp} (en el ejemplo presente, n_{sp} = 7), y la información del momento sobre los componentes tonales tc_{B}. Ya que no es necesario transmitir la información sobre la cadena de información parcial vacía del componente local, puede conseguirse la eficiencia de la codificación, en especial si clases diferentes de la cadena de información parcial han de ser permitidas por las razones expuestas anteriormente.

En el ejemplo de la fig. 4, la cadena de información parcial sobre los componentes tonales es producida por agrupamiento basado en el número de señales espectrales que constituyen el componente tonal. No obstante, el método de la presente invención puede ser aplicado a un caso tal en el que las secuencias ordenadas de información parcial para los componentes tonales estén constituidas por agrupamiento de la información sobre los componentes tonales, en base a otros atributos distintos al número de señales espectrales que constituyen el componente tonal.

Específicamente. el agrupamiento puede estar basado en la información sobre las operaciones de cuantificación. Con referencia a las figs. 9, 15, 17, y 18, se explica un ejemplo ilustrativo de agrupamiento basado en la información de las operaciones de cuantificación.

Se supone que el circuito separador 602 de componente de señal separa los componentes tonales de los componentes de frecuencia, como se muestra en la fig. 9. En el ejemplo presente, cuatro componentes tonales TC_{A}, TC_{B}, TC_{C}, y TC_{D} han sido extraídos, como se ha explicado anteriormente. Si se permite cuantificar los componentes espectrales en las operaciones de cuantificación correspondientes a la información sobre la operación de cuantificación QP = 6, o en las operaciones de cuantificación correspondientes a la información sobre la operación de cuantificación QP = 4, el circuito de decisión de la operación de cuantificación en el circuito 603 de codificación de componente tonal determina la operación de cuantificación de los respectivos componente tonales de la manera siguiente.

La fig. 18 muestra un flujo del tratamiento ilustrativo para agrupar los componentes tonales en función de las operaciones de cuantificación por medio del circuito 603 de codificación de componente tonal. En esta figura, el agrupamiento se hace sobre los componentes tonales previamente extraídos y registrados mediante el tratamiento de la fig. 11. En el ejemplo presente, si la relación entre el valor de la energía de cinco señales espectrales centradas en torno a la señal espectral central del componente tonal, y el valor de la energía en una banda preestablecida es superior al valor P, los componentes tonales son agrupados como componentes tonales cuantificados con la información sobre las operaciones de cuantificación QP = 6. Si es de otro modo, los componentes tonales son agrupados como componentes tonales cuantificados con la información sobre las operaciones de cuantificación QP = 4.

Con referencia a la fig. 18, el número registrado de componentes tonales es sustituido en la operación S21 por una variable M. En la operación S22, el número I de los componentes tonales se establece en 1. En la operación siguiente S23, el valor de la energía de la banda preestablecida es sustituida por una variable Y. En la operación S24, el valor de la energía de las cinco señales espectrales vecinas es sustituido por la variable X.

En la operación S25, se juzga si la relación entre la variable X para el valor de la energía de las cinco señales espectrales vecinas y la variable Y de la energía de la banda preestablecida, es o no mayor que el valor P (X/Y > P). Si el resultado es SI, es decir, si X/Y es mayor que P, el programa se desplaza a la operación S26. Si el resultado es NO, es decir, si X/F es inferior a P, el programa pasa a la operación S27.

En la operación S26, los componentes tonales son agrupados o registrados como componentes tonales con la información de la operación de cuantificación QP = 6. En la operación S27, los componentes tonales son agrupados o registrados como componentes tonales con la información de la operación de cuantificación QP = 4. El programa pasa entonces a la operación S28.

En la operación S28 se juzga si el número I de los componentes tonales es o no igual a la variable M para el número de los componentes tonales registrados. Si el resultado es SI, el tratamiento llega al cierre. Si el resultado es NO, el programa pasa a la operación S29, donde el número de componentes tonales I es incrementado (I = I + 1) para volver a la operación S23 y repetir las operaciones anteriores del procedimiento.

La operación de cuantificación por cada uno de los componentes tonales es determinada de esta manera por el circuito de codificación 603 de componente tonal. Por ejemplo, TC_{A}, TC_{C}, y TC_{D} son cuantificados con la operación de cuantificación correspondiente a la información de la operación de cuantificación QP = 6, para proporcionar tc_{A}, tc_{C}, y tc_{D}. Además de la información sobre el número de señales espectrales, la información de los componentes tonales, cuantificada de la manera antes descrita, la información sobre la operación de cuantificación, y la información sobre el agrupamiento, son suministradas al circuito 605 generador de cadena de código, que genera entonces y da salida a una cadena de código que se muestra en la fig. 15, en base a los datos anteriores.

La fig. 15 muestra un ejemplo en el que la cadena de información parcial es constituida en base a la información sobre la operación de cuantificación. En el ejemplo presente, se supone que el número de las señales espectrales que forman los componentes tonales es el mismo para todos los componentes tonales. Por supuesto que el número de señales espectrales que constituyen los componentes tonales puede ser codificado como parte de la información sobre los respectivos componentes tonales.

En el ejemplo presente de la fig. 15, el número de cadenas de información parcial de los componentes tonales n_{LTC} (en el ejemplo de la fig. 15, n_{LTC} = 2) es transmitido primero, seguido por un número de cadenas de información parcial LTC_{21} y LTC_{22} especificado aquí. En el ejemplo de la fig. 15, el número N_{21} indica el número de componentes tonales tc en la cadena de información parcial LTC_{21}, que es el número de componentes tonales cuantificado en la operación de cuantificación correspondiente a la información sobre la operación de cuantificación QP = 6 (N_{21} = 3 aquí), la información sobre las operaciones de cuantificación QP (QP = 6 aquí), y la información sobre los componentes tonales realmente cuantificados tc_{A}, tc_{C}, y tc_{D}, son transmitidas en este orden como cadena de información parcial para los componentes tonales LTC_{21}. Por otra parte, el número N_{22} indica el número de componentes tonales tc en la cadena LTC_{22} de información parcial, es decir, el número de los componentes tonales cuantificados en la operación de cuantificación correspondiente a la información sobre la operación de cuantificación QP = 4 (N_{22} = 1 aquí), la información sobre las operaciones de cuantificación QP (QP = 4 aquí), y la información sobre los componentes tonales realmente cuantificados tc_{B}, son transmitidas en este orden como cadena de información parcial para los componentes tonales LTC_{22}.

Esto elimina la necesidad de acuerdo de la información sobre las operaciones de cuantificación con los respectivos componentes tonales. Por ejemplo, la información sobre los componentes tonales tc_{c} de la fig. 15 puede estar formada sólo por la información CP de posición del centro, la información NP de coeficiente de normalización, y la información sobre los respectivos componentes de señal SC. Por tanto, en el ejemplo de la fig. 15, la eficiencia de la codificación puede ser mejorada especialmente si hay un gran número de componentes tonales.

Por supuesto que la secuencia de transmisión de los respectivos datos de información puede ser cambiada, con respecto a la antes descrita. Por ejemplo, la información sobre la operación de cuantificación QP = 6, el número correspondiente de datos de información sobre los componentes tonales N_{21} = 3, la información sobre la operación de cuantificación QP = 4, y el número correspondiente de datos de información sobre los componentes tonales N_{22} = 1, puede ser transmitida primero como un bloque, y la información sobre los componentes tonales que indica los contenidos de los componentes locales tc_{n} puede ser transmitida subsiguientemente.

La fig. 19 muestra en una tabla de flujo de acciones, el flujo del tratamiento en la descodificación de la cadena de información de los componentes tonales, correspondiente a la cadena de código mostrada en la fig. 15. En la tabla de la fig. 19, los números de los componentes tonales contenidos en los respectivos grupos, y de los componentes tonales codificados de acuerdo con la información, son descodificados secuencialmente.

Con referencia a la fig. 19, el número de los datos de información correspondientes a los componentes tonales, con la información sobre la operación de cuantificación QP = 6, es sustituido en la operación S31 por una variable M1. En la operación siguiente S32, los componentes tonales contenidos en el grupo son descodificados para construir M1 datos de información sobre los componentes tonales.

En la operación S33, el número de datos de información sobre los componentes tonales, con la información sobre la operación de cuantificación QP = 4, es sustituido por una variable M2. En la siguiente operación S34, los componentes tonales contenidos en este grupo son descodificados para construir M2 datos de información sobre los componentes tonales.

La fig. 16 muestra otro ejemplo de una cadena de código producida por codificación de acuerdo con el método de la presente invención. En este ejemplo, la información sobre los componentes tonales es agrupada en base a la información sobre el número de las señales espectrales de los componentes tonales, y la información sobre las operaciones de cuantificación. En este caso, la eficiencia de la codificación se aumenta, ya que ni la información sobre el número de las señales espectrales que forman los componentes tonales, ni la información sobre la operación de cuantificación, es la información sobre los componentes tonales, y sólo es suficiente codificar los componentes tonales a partir de una cadena parcial de información sobre componentes tonales a otra. En el método mostrado en la fig. 13, la cadena de información parcial sobre los componentes tonales necesita ser codificada para todas las combinaciones de los números de los componentes espectrales y la información de la operación de cuantificación. En el método de la presente invención, dado que es suficiente codificar las cadenas de información parcial sobre los componentes tonales que no son cadenas vacías, la eficiencia de la codificación puede ser mejorada significativamente.

Aunque el número de las cadenas de información parcial sobre los componentes tonales es codificado en el ejemplo anterior, es posible también utilizar la información señalizadora que indica si la cadena de información parcial sobre los respectivos componentes tonales, ha de ser o no codificada. Dicha disposición puede estar comprendida dentro del alcance de la presente invención, No obstante, resulta más eficiente codificar el número de cadenas de información parcial codificada, como se muestra en las realizaciones antes descritas.

En la anterior descripción, la información de posición central CP es transmitida como posición de información para los componentes tonales. No obstante, es posible transmitir la posición de la señal espectral más inferior por cada componente tonal, tal como 30 para el componente tonal TC_{C}, en lugar de la información sobre posición central.

Aunque para aumentar la eficiencia de la codificación es deseable separar y codificar componentes espectrales que tengan energías espectrales concentradas en proximidad a frecuencias especificadas como componentes tonales, la separación de señal no necesariamente ha de estar basada en la energía espectral, y aquellos componentes espectrales de un margen especificado codificados con la información de posición sobre el eje de frecuencia pueden estar comprendidos dentro de los componentes tonales, de acuerdo con la presente invención.

Además, aunque el medio de grabación es el disco 609 de la explicación anterior, puede ser también un disco óptico, un disco magneto-óptico, o un disco de transición de fase. El medio de grabación puede ser también un medio de grabación en forma de cinta, empleada en un audio cassette o un cassette de vídeo, un medio de grabación en forma de disco, tal como un disco duro o un disco flexible, o un medio de grabación semiconductor, tal como una tarjeta de memoria IC.

La descripción anterior se ha hecho principalmente referida a señales acústicas. No obstante, la presente invención puede ser aplicada también para codificar señales en forma de onda en general. No obstante, la presente invención puede ser aplicada de modo más efectivo a las señales acústicas, debido a que la información sobre los componentes tonales tiene un importante significado en relación con el sistema de audición humano.

Aunque los respectivos componentes tonales son normalizados, y subsiguientemente cuantificados para la codificación de los componentes tonales, la presente invención puede ser aplicada también a los componentes tonales cuantificados sin normalización. No obstante, la eficiencia de la codificación puede ser mejorada primero mediante la normalización, y subsiguientemente la cuantificación de los componentes tonales, como en las realizaciones antes descritas.

El método de codificación para los componentes ruidosos de la presente invención no se limita a la recuantificación seguida de la codificación, sino que puede ser aplicada también a la normalización seguida por la cuantificación. La presente invención proporciona un método ilustrativo para realizar eficientemente el método descrito en nuestra solicitud, pendiente junto con ésta PCT/JP94/00880, y en la solicitud de patente de EE.UU. núm. de serie 08/306659, y puede ser aplicada en conjunción con los diversos métodos propuestos en estas solicitudes pendientes.

Con el método y aparato de codificación de información de la presente invención, puede conseguirse una codificación altamente eficiente por clasificación de la primera señal como componentes tonales en cadenas de información parcial de acuerdo con la información común, sin codificar los vacíos de las cadenas de información parcial y por unión de la codificación de información que indica las cadenas de información parcial codificadas, es decir, por separación de los componentes tonales en grupos, sin codificar los grupos que no contienen componentes tonales, y codificando el número de grupos codificados.

Con el método de transmisión de información y el medio de grabación de información de acuerdo con la presente invención, puede ser conseguida una transmisión eficiente por transmisión de la información codificada con el método y aparato de codificación de la información de esta invención.

Con el método y aparato de descodificación de esta invención, la información de las cadenas de información parcial codificada, excepto las de información parcial con huecos no codificadas, es descodificada, y en base a los resultados de la descodificación, ésta se hace en las cadenas de información parcial que consiste en la primera señal de los componentes tonales, clasificada de acuerdo con la información común.

Con el método de la presente invención, las señales tonales pueden ser codificadas eficientemente, de modo que pueda ser conseguida como un todo una codificación de alta eficiencia. El efecto favorable de la presente invención puede ser manifestado más significativamente cuando el cumplimiento de la codificación con las diversas relaciones de compresión y niveles de calidad del sonido, se logran de acuerdo con las mismas condiciones estándar.

Claims

1. Un método para codificar una señal de entrada, que comprende las operaciones de:

- transformar (601) de la señal de entrada en componentes de frecuencia;

- separar (602) los componentes de frecuencia en una primera señal compuesta de componentes tonales (TC_{A}... TC_{D}) que tiene una distribución de energía inclinada, y una segunda señal compuesta de otros componentes;

- codificar (603) dicha primera señal por medio de una primera codificación;

- codificar (604) dicha segunda señal por medio de una segunda codificación; y

- generar (605) una primera cadena de código para transmisión o grabación, en base a las señales codificadas producidas por dicha primera codificación; en el que

- dicha primera cadena de código incluye cadenas parciales (LTC) de datos de componente tonal, en las que los datos de componente tonal (tc_{A}... tc_{D}) que tienen los mismos valores que al menos uno de los parámetros (n_{sp}, QP) para separación de señal (602) y primera codificación (603) están agrupados.

2. Un método según la reivindicación 1, en el que los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica el número de las señales espectrales que constituyen los componentes tonales (TC_{A}... TC_{D}) separadas por la separación de señal (602).

3. El método según las reivindicaciones 1 ó 2, en el que la primera operación de codificación (603) incluye una operación de cuantificación (303) de dicha primera señal, y los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC), están agrupados de acuerdo con el parámetro (QP) que indica información de cuantificación (303).

4. El método según la reivindicación 3, en el que el parámetro (QP) indica la operación de cuantificación.

5. El método según una cualquiera de las reivindicaciones 1 a 4, en el que la primera cadena de código contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) que indica la constitución de las cadenas parciales (LTC).

6. El método según la reivindicación 5, en el que la información (nLTC) que indica la constitución de las cadenas parciales indica el número de dichas cadenas parciales (LTC).

7. El método según una cualquiera de las reivindicaciones 1 a 6, que comprende además la operación de:

- generar (605) una segunda cadena de código en base a dicha segunda señal; y

- transmitir (605) dichas cadenas de código primera y segunda.

8. El método según una cualquiera de las reivindicaciones 1 a 7, en el que los otros componentes son espectros ruidosos.

9. El método de la reivindicación 8, en el que dichos componentes de frecuencia están agrupados en bandas (b1... b5) y dicha segunda cadena de código está compuesta por componentes ruidosas (nc_{1}... nc_{5}) asociados a dichas bandas (b1... b5).

10. Un método para descodificar una cadena de código compuesta por señales codificadas, que comprende las operaciones de:

- descodificar (701) una señal codificada correspondiente a una primera señal constituida por componentes tonales (TC_{A}... TC_{D}) que tiene una distribución de energía inclinada para generar primeras señales descodificadas por medio de una primera descodificación;

- descodificar (701) una señal codificada que corresponde a una segunda señal constituida por otros componentes, para generar segundas señales descodificadas por medio de una segunda descodificación; y

- sintetizar (704) dichas señales descodificadas primera y segunda para restablecer una señal original; en el que:

- una primera cadena de código incluye unas cadenas parciales (LTC) de datos de componente tonal, cuyos datos de componente tonal (tc_{A}... tc_{D}) que tienen los mismos valores que al menos uno de los parámetros (n_{sp}, QP) para la separación de señal (602) y la primera codificación (603), están agrupados; y

- dicha primera descodificación (701) o dicha restauración emplean el parámetro (n_{sp}, QP) para descodificar o restaurar las señales codificadas plurales.

11. El método de la reivindicación 10, en el que los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica el número de señales espectrales que constituyen los componentes tonales TC_{A}... TC_{D}) separados por la separación (602) de señal.

12. El método de la reivindicación 10, en el que la primera descodificación (702) incluye una cuantificación inversa de dicha primera señal, y los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica la información de la cuantificación.

13. El método de la reivindicación 12, en el que el parámetro (QP) indica la operación de cuantificación.

14. El método según una cualquiera de las reivindicaciones 10 a 13, en el que la primera cadena de código contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) que indica la constitución de las cadenas parciales (LTC).

15. El método según una cualquiera de las reivindicaciones 10 a 14, en el que la información (nLTC) que indica la constitución de las cadenas parciales indica el número de dichas cadenas parciales (LTC).

16. El método según una cualquiera de las reivindicaciones 10 a 15, en el que dichos otros componentes son espectros ruidosos.

17. El método según la reivindicación 16, en el que dichos componentes de frecuencia están agrupados en bandas (b1... b5), y una segunda cadena de código está compuesta de componentes ruidosos (nc_{1}...nc_{5}) asociados a dichas bandas (b1...b5).

18. Un aparato para codificar una señal de entrada, que comprende:

- medios (601) para transformar la señal de entrada en componentes de frecuencia;

- medios (602) para separar los componentes de frecuencia en una primera señal compuesta de componentes tonales (TC_{A}...TC_{D}) que tienen una distribución de energía inclinada, y una segunda señal compuesta de otros componentes;

- medios (603) para codificar dicha primera señal mediante la primera codificación;

- medios (604) para codificar dicha segunda señal mediante la segunda codificación; y

- medios (605) para generar una primera cadena de código para transmisión o grabación en base a señales codificadas producidas por dichas codificaciones primera y segunda, y en los que:

- dicha primera cadena de codificación incluye cadenas parciales (LTC) de datos de componente tonal, cuyos datos de componente tonal (tc_{A}... tc_{D}) que tienen los mismos valores que al menos uno de los parámetros (n_{sp}, QP) para la separación de señal (602) y la primera codificación (603), están agrupados.

19. El aparato de la reivindicación 18, en el que los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica el número de las señales espectrales que forman los componentes tonales (TC_{A}...TC_{D}) separados por la separación (602) de señal.

20. El aparato de la reivindicación 18, en el que la primera codificación (603) incluye una cuantificación (303) de dicha primera señal, y los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (QP) que indica la información de la cuantificación (303).

21. El aparato de la reivindicación 20, en el que el parámetro (QP) indica la operación de cuantificación.

22. El aparato según una cualquiera de las reivindicaciones 18 a 21, en el que la cadena de código contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) que indica la constitución de las cadenas parciales (LTC).

23. El aparato según la reivindicación 22, en el que la información (nLTC) que indica la constitución de las cadenas parciales, indica el número de dichas cadenas parciales (LTC).

24. El aparato según una cualquiera de las reivindicaciones 18 a 23, en el que dichos otros componentes son espectros ruidosos.

25. El aparato según la reivindicación 24, en el que dichos componentes de frecuencia están agrupados en bandas (b1...b5), y una segunda cadena de código está compuesta de componentes ruidosos (nc_{1}...nc_{5}) asociados a dichas bandas (b1...b5).

26. Un aparato para descodificar una cadena de código compuesta por señales codificadas, que comprende:

- primeros medios descodificadores (701) para descodificar la señal codificada correspondiente a una primera señal formada por componentes tonales que tienen una distribución de energía inclinada para generar primeras señales descodificadas por medio de la primera descodificación;

- segundos medios descodificadores (701) para descodificar la señal codificada correspondiente a una segunda señal formada por otros componentes, para generar segundas señales descodificadas por medio de la segunda descodificación; y

- medios (704) para sintetizar dichas señales descodificadas primeras y segundas, para restablecer una señal original, y en el que:

- una primera cadena de código incluye cadenas parciales (LTC) de datos de componente tonal, cuyos datos de componente tonal (tc_{A}... tc_{D}) que tienen los mismos valores de al menos uno de los parámetros (n_{sp}, QP) para separación (602) de señal y primera codificación (603), están agrupados;

- y dichos primeros medios descodificadores (701) o dichos medios de restauración emplean el parámetro (n_{sp}, QP) para la descodificación o restauración de las señales codificadas plurales.

27. El aparato según la reivindicación 26, en el que los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica el número de las señales espectrales que forman los componentes tonales (TC_{A}... TC_{D}) separados por la separación (602) de señal.

28. El aparato según la reivindicación 26, en el que la primera descodificación (702) incluye la cuantificación inversa de dicha primera señal, y los datos de componente tonal (tc_{A}... tc_{D}) en dichas cadenas parciales (LTC) están agrupados de acuerdo con el parámetro (n_{sp}) que indica la información de la cuantificación.

29. El aparato según la reivindicación 28, en el que el parámetro (QP) indica la operación de cuantificación.

30. El aparato según una cualquiera de las reivindicaciones 26 a 29, en el que la cadena de código que contiene información (STC_{3}, STC_{5}, STC_{7}; nLTC) indica la constitución de las cadenas parciales (LTC).

31. El aparato según la reivindicación 30, en el que la información (nLTC) que indica la constitución de las cadenas parciales, indica el número de dichas cadenas parciales (LTC).

32. El aparato según una cualquiera de las reivindicaciones 26 a 31, en el que dichos otros componentes son espectros ruidosos.

33. El aparato según la reivindicación 32, en el que dichos componentes de frecuencia están agrupados en bandas (b1... b5), y una segunda cadena de código está compuesta de componentes ruidosos (nc_{1}... nc_{5}) asociados a dichas bandas (b1...b5).