ES2737889T3 - Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa - Google Patents

Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa Download PDF

Info

Publication number
ES2737889T3
ES2737889T3 ES15774034T ES15774034T ES2737889T3 ES 2737889 T3 ES2737889 T3 ES 2737889T3 ES 15774034 T ES15774034 T ES 15774034T ES 15774034 T ES15774034 T ES 15774034T ES 2737889 T3 ES2737889 T3 ES 2737889T3
Authority
ES
Spain
Prior art keywords
signal
band
tonal
low
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15774034T
Other languages
English (en)
Inventor
Srikanth Nagisetty
Zong Xian Liu
Hiroyuki Ehara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority claimed from PCT/JP2015/001601 external-priority patent/WO2015151451A1/ja
Application granted granted Critical
Publication of ES2737889T3 publication Critical patent/ES2737889T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un dispositivo de codificación, caracterizado porque comprende: un primer codificador (102, 104), que en funcionamiento, codifica una señal de banda baja entre una señal de entrada de voz o audio para generar una primera señal codificada y decodifica la primera señal codificada para generar una señal decodificada de banda baja (S1); un segundo codificador (106), que en funcionamiento, codifica, basándose en la señal decodificada de banda baja (S1), una señal de banda alta que tiene una banda más alta que la de la señal de banda baja para generar una señal codificada de banda alta; un calculador de energía (206) que, en funcionamiento, calcula una energía de la señal de entrada de voz o de audio y envía la energía calculada como energía de banda cuantificada; y un primer multiplexor (103), que en funcionamiento, multiplexa la energía de banda cuantificada, la primera señal codificada y la señal codificada de banda alta para generar y enviar una señal codificada, caracterizado porque el segundo codificador (106) incluye una unidad de separación (202; 302) que separa, de la señal decodificada de banda baja (S1), una señal no tonal de banda baja, que es un componente no tonal de la señal decodificada de banda baja (S1) y una señal tonal de banda baja, que es un componente tonal de la señal decodificada de banda baja (S1), siendo el componente tonal un componente que ha sido cuantificado por un cuantificador de pulsos, siendo el componente no tonal un componente que se ha convertido en cero al no haber sido cuantificado por un cuantificador de pulsos, una unidad de adición de ruido (201) que añade una señal de ruido a la señal decodificada de banda baja o a la señal no tonal de banda baja enviada desde la unidad de separación (302), una primera unidad de extensión de anchura de banda (208) que envía, como información de retardo, información de posición con respecto a una banda específica en la que la correlación entre la señal de banda alta (S2) y la señal tonal de banda baja se vuelve máxima; una unidad de cálculo (205) que calcula una relación de energía entre un componente de ruido de banda alta, que es un componente de ruido de la señal de entrada de banda alta (S2) que corresponde a la banda específica, y la señal no tonal de banda alta obtenida por la segunda unidad de extensión de anchura de banda (203), y envía la relación calculada como un factor de cambio de escala, y un segundo multiplexor (207) que multiplexa la información de retardo y el factor de cambio de escala como la señal codificada de banda alta y envía la señal codificada de banda alta.

Description

DESCRIPCIÓN
Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa
Campo técnico
[0001] La presente descripción se refiere a un dispositivo que codifica una señal de voz y una señal de audio (referidas en lo sucesivo como una señal de voz y similares) y a un dispositivo que decodifica la señal de voz y similares.
Antecedentes de la técnica
[0002] Una tecnología de codificación de voz que comprime la señal de voz y similares a una velocidad binaria baja es una tecnología importante que hace realidad el uso eficiente de ondas radioeléctricas y similares en comunicaciones móviles. Además, las expectativas de una voz a través de teléfono de calidad más alta han sido elevadas en los últimos años, y se ha deseado un servicio telefónico con sensación realista mejorada. Con el fin de hacer realidad lo anterior, es suficiente con que la señal de voz y similares que tienen una banda de frecuencia ancha sean codificadas a una velocidad binaria alta. Sin embargo, este planteamiento contradice el uso eficiente de ondas radioeléctricas o bandas de frecuencias.
[0003] Como un procedimiento que codifica una señal que tiene una banda de frecuencia ancha con alta calidad a una velocidad binaria baja, existe una técnica que reduce la velocidad binaria total dividiendo un espectro de una señal de entrada en dos espectros de una parte de banda baja y una parte de banda alta, y replicando un espectro de banda baja y transponiendo un espectro de banda alta con el espectro de banda baja replicado, es decir, sustituyendo el espectro de banda baja por el espectro de banda alta (PTL 1). En esta técnica, la codificación se realiza asignando un número reducido de bits mediante la realización del siguiente proceso como un proceso básico: codificación de un espectro de banda baja con alta calidad asignando un gran número de bits y replicación del espectro de banda baja codificado como un espectro de banda alta.
[0004] Si la técnica descrita en PTL 1 se usa sin ninguna modificación, una señal que tiene una característica pico fuerte observada en el espectro de banda baja se replica tal como está en la banda alta. De esta manera, se genera un ruido que suena como una campana repiqueteando, lo que reduce la calidad subjetiva. Por consiguiente, existe una técnica que usa un espectro de banda baja con un intervalo dinámico ajustado apropiadamente, como un espectro de banda alta (PTL 2).
[0005] PTL 3 describe codificación y decodificación jerárquica para señales de audio. El procesamiento se realiza en varias bandas de frecuencia, en las que una primera banda de frecuencia básica se ensancha en una capa de extensión de banda en una segunda banda de frecuencia (banda ancha).
[0006] PTL 4 describe un codificador, en el que una porción de banda de baja frecuencia en la que se ha establecido un pico para un estado suficientemente bajo se copia en una porción de banda de alta frecuencia (banda de extensión) con el fin de evitar la generación del espectro con un pico excesivamente grande en la porción de la banda de alta frecuencia y para generar un espectro de banda de extensión de alta calidad.
[0007] PTL 5 describe un aparato para mejorar sistemas de codificación fuente usando reconstrucción de alta frecuencia. Los niveles de suelo de ruido recibidos se comparan con un límite superior suministrado en el decodificador y objeto de correspondencia con varios canales de bancos de filtro.
[0008] El artículo "Enhanced Accuracy of the Tonality Measure and Control Parameter Extraction Modules in MPEG- 4 HE-AAC" de S.-U. Ryu y K. Rose, 119a Convención de la Audio Engineering Society, Nueva York, 2005, describe una estimación de una relación de energía para los componentes tonal y de ruido de la señal fuente, que incide directamente en la decisión de los parámetros de control para controlar los parámetros que se proporcionarán desde el codificador al decodificador.
Lista de referencias
Bibliografía de patente
[0009]
PTL 1: Publicación de Solicitud de Patente Japonesa No Examinada (Traducción de Solicitud del PCT) n° 2001-521648 PTL 2: Publicación Internacional n° 2005/111568
PTL 3: Publicación de solicitud de patente de EE.UU. 2009/0326931 A1
PTL 4: Publicación de solicitud de patente internacional WO 2013/035257 A1
PTL5: Publicación de solicitud de patente de EE.UU. 2013/0339023 A1
Resumen de la invención
[0010] En la técnica descrita en PTL 2, el intervalo dinámico se define teniendo en cuenta todos los componentes que constituyen el espectro de banda baja. Sin embargo, el espectro de una señal de voz y similares incluye un componente que tiene una característica pico fuerte, es decir, un componente que tiene una amplitud grande (componente tonal), y un componente que tiene una característica pico débil, es decir, un componente que tiene una amplitud pequeña (componente no tonal). La técnica descrita en PTL 2 hace una evaluación teniendo en cuenta todos los componentes que incluyen los dos componentes anteriores y por lo tanto no siempre produce el mejor resultado.
[0011] La presente descripción proporciona un dispositivo que permite la codificación de una señal de voz y similares con calidad más alta separando y usando un componente tonal y un componente no tonal individualmente para la codificación mientras se reduce la velocidad binaria total, y un dispositivo que permite la decodificación de la señal de voz y similares.
El objeto se consigue con las características de las reivindicaciones independientes.
[0012] Debe observarse que las realizaciones generales o específicas se pueden implementar como un sistema, un procedimiento, un circuito integrado, un programa informático, un medio de almacenamiento o cualquier combinación selectiva de los mismos.
[0013] Es posible codificar y decodificar una señal de voz y similares con calidad más alta por medio del uso de un codificador y un decodificador en una realización de la presente descripción.
Breve descripción de los dibujos
[0014]
La Fig. 1 ilustra una configuración general de un codificador según la presente descripción.
La Fig.2 ilustra una configuración de una segunda unidad de codificación de capa en un codificador según una primera realización de la presente descripción.
La Fig. 3 ilustra una configuración de una segunda unidad de codificación de capa en un codificador según una segunda realización de la presente descripción.
La Fig.4 ilustra una configuración general de otro codificador según la realización de la presente descripción.
La Fig.5 ilustra una configuración general de un decodificador según la presente descripción.
La Fig.6 ilustra una configuración de una segunda unidad de decodificación de capa en un decodificador según una tercera realización de la presente descripción.
La Fig. 7 ilustra una configuración de una segunda unidad de decodificación de capa en un decodificador según una cuarta realización de la presente descripción.
La Fig.8 ilustra una configuración general de otro decodificador según la realización de la presente descripción. La Fig.9 ilustra una configuración general de otro codificador según la realización de la presente descripción.
La Fig. 10 ilustra una configuración general de otro decodificador según la realización de la presente descripción. Descripción de las realizaciones
[0015] En las realizaciones de la presente descripción, las configuraciones y operaciones se describirán a continuación con referencia a los dibujos. Debe observarse que una señal de entrada que es introducida a un codificador según la presente descripción y una señal de salida que es enviada desde un decodificador según la presente descripción incluyen, además del caso de únicamente señales de voz en un sentido estricto, el caso de señales de audio que tienen anchuras de banda más amplias y el caso en que estas señales coexisten.
(Primera realización)
[0016] La Fig. 1 es un diagrama de bloques que ilustra una configuración de un codificador para una señal de voz y similares según una primera realización. Se describirá un caso ilustrativo en el que una señal codificada tiene una configuración en capas que incluye una pluralidad de capas; es decir, se describirá un caso de realización de una codificación jerárquica (codificación con cambio de escala). Un ejemplo que comprende la codificación diferente de la codificación con cambio de escala se describirá posteriormente con referencia a la Fig. 4. Un codificador 100 ilustrado en la Fig. 1 incluye una unidad de submuestreo 101, una primera unidad de codificación de capa 102, una unidad de multiplexión 103, una primera unidad de decodificación de capa 104, una unidad de retardo 105 y una segunda unidad de codificación de capa 106. Además, a la unidad de multiplexión 103 se le conecta una antena, que no se ilustra.
[0017] La unidad de submuestreo 101 genera una señal que tiene una velocidad de muestreo baja a partir de una señal de entrada y envía la señal generada a la primera unidad de codificación de capa 102 como una señal de banda baja que tiene una frecuencia inferior o igual que una frecuencia predeterminada.
[0018] La primera unidad de codificación de capa 102, que es una realización de un componente de una primera unidad de codificación, codifica la señal de banda baja. Los ejemplos de codificación incluyen la codificación CELP (predicción lineal con excitación por código) y la codificación de transformada. La señal de banda baja codificada se envía a la primera unidad de decodificación de capa 104 y la unidad de multiplexión 103 como una señal codificada de banda baja, que es una primera señal codificada.
[0019] La primera unidad de decodificación de capa 104, que también es una realización de un componente de la primera unidad de codificación, decodifica la señal codificada de banda baja, generando de ese modo una señal decodificada de banda baja. A continuación, la primera unidad de decodificación de capa 104 envía la señal decodificada de banda baja S1 a la segunda unidad de codificación de capa 106.
[0020] Por otra parte, la unidad de retardo 105 retrasa la señal de entrada durante un período predeterminado. Este período de retardo se usa para corregir un retardo de tiempo generado en la unidad de submuestreo 101, la primera unidad de codificación de capa 102 y la primera unidad de decodificación de capa 104. La unidad de retardo 105 envía una señal de entrada retardada s2 a la segunda unidad de codificación de capa 106.
[0021] Con base en la señal decodificada de banda baja S1 generada por la primera unidad de decodificación de capa 104, la segunda unidad de codificación de capa 106, que es una realización de una segunda unidad de codificación, codifica una señal de banda alta que tiene una frecuencia superior o igual que la frecuencia predeterminada de la señal de entrada S2, generando de ese modo una señal codificada de banda alta. La señal decodificada de banda baja S1 y la señal de entrada S2 se introducen en la segunda unidad de codificación de capa después de haber sido sometidas a la transformación de frecuencia, tal como MDCT (transformada modificada de coseno discreto). A continuación, la segunda unidad de codificación de capa 106 envía la señal codificada de banda alta a la unidad de multiplexión 103. Los detalles de la segunda unidad de codificación de capa 106 se describirán posteriormente.
[0022] La unidad de multiplexión 103 multiplexa la señal codificada de banda baja y la señal codificada de banda alta, generando de ese modo una señal codificada, y transmite la señal codificada a un decodificador a través de la antena, que no se ilustra.
[0023] La Fig. 2 es un diagrama de bloques que ilustra una configuración de la segunda unidad de codificación de capa 106 en esta realización. La segunda unidad de codificación de capa 106 incluye una unidad de adición de ruido 201, una unidad de separación 202, una unidad de extensión de anchura de banda 203, una unidad de cálculo de energía de componente de ruido 204 (primera unidad de cálculo), una unidad de cálculo de ganancia 205 (segunda unidad de cálculo), una unidad de cálculo de energía 206, una unidad de multiplexión 207 y una unidad de extensión de anchura de banda 208.
[0024] La unidad de adición de ruido 201 añade una señal de ruido a la señal decodificada de banda baja S1, que ha sido introducida desde la primera unidad de decodificación de capa 104. Debe observarse que el término “señal de ruido” se refiere a una señal que tiene características aleatorias y es, por ejemplo, una señal que tiene una amplitud de intensidad de señal que fluctúa irregularmente con respecto al eje de tiempo o al eje de frecuencia. La señal de ruido se puede generar según se necesite basándose en números aleatorios. Alternativamente, una señal de ruido (por ejemplo, ruido blanco, ruido de Gauss o ruido rosa) que se genera de antemano se puede almacenar en un dispositivo de almacenamiento, tal como una memoria, y puede ser invocada y enviada. Además, la señal de ruido no está limitada a una señal individual, y una de una pluralidad de señales de ruido se puede seleccionar y enviar según condiciones predeterminadas.
[0025] Para codificar una señal de entrada, si el número de bits que se pueden asignar es pequeño, solo algunos de los componentes de frecuencia se pueden cuantificar, lo cual da como resultado la degradación en la calidad subjetiva. Sin embargo, al añadir un ruido por medio del uso de la unidad de adición de ruido 201, las señales de ruido compensan componentes que serían cero al no ser cuantificados, y de esta manera, se puede esperar un efecto de alivio de la degradación.
[0026] Debe observarse que la unidad de adición de ruido 201 tiene una configuración arbitraria. A continuación, la unidad de adición de ruido 201 envía, a la unidad de separación 202, una señal decodificada de banda baja a la que se ha añadido la señal de ruido.
[0027] A partir de la señal decodificada de banda baja, a la que se ha añadido la señal de ruido, la unidad de separación 202 separa una señal no tonal de banda baja, que es un componente no tonal, y una señal tonal de banda baja, que es un componente tonal. En la presente memoria, el término “componente tonal” se refiere a un componente que tiene una amplitud mayor que un umbral predeterminado o un componente que ha sido cuantificado por un cuantificador de pulsos. Además, el término “componente no tonal” se refiere a un componente que tiene una amplitud menor o igual que el umbral predeterminado o un componente que se ha vuelto cero al no haber sido cuantificado por un cuantificador de pulsos.
[0028] En el caso de la distinción del componente tonal y el componente no tonal entre sí por medio del uso del umbral predeterminado, la separación se realiza dependiendo de si la amplitud de un componente de la señal decodificada de banda baja es mayor o no que el umbral predeterminado. En el caso de la distinción del componente tonal y el componente no tonal entre sí dependiendo de si un componente ha sido cuantificado o no por un cuantificador de pulsos, ya que este caso corresponde al caso en que el valor umbral es cero, la señal tonal de banda baja se puede generar restando la señal decodificada de banda baja S1 de la señal decodificada de banda baja a la que el ruido ha sido añadido por la unidad de adición de ruido 201.
[0029] A continuación, la unidad de separación 202 envía la señal no tonal de banda baja a la unidad de extensión de anchura de banda 203 y envía la señal tonal de banda baja a la unidad de extensión de anchura de banda 208.
[0030] La unidad de extensión de anchura de banda 208 busca una banda específica de la señal tonal de banda baja en la que la correlación entre la señal de banda alta de la señal de entrada S2 y una señal tonal de banda baja generada para la extensión de anchura de banda se vuelve máxima. La búsqueda se puede realizar seleccionando un candidato en el que la correlación se vuelve máxima de entre posiciones candidatas específicas que han sido preparadas de antemano. Como la señal tonal de banda baja generada para la extensión de anchura de banda, la señal tonal de banda baja que ha sido separada (cuantificada) por la unidad de separación 202 se puede usar sin ningún procesamiento, o se puede usar una señal tonal aplanada o normalizada.
[0031] A continuación, la unidad de extensión de anchura de banda 208 envía, a la unidad de multiplexión 207 y la unidad de extensión de anchura de banda 203, información que especifica la posición de la banda específica buscada, en otras palabras, información de retardo que especifica la posición (frecuencia) de un espectro de banda baja usado para generar las anchuras de banda extendidas. Debe observarse que la información de retardo no tiene que incluir toda la información que corresponde a todas las anchuras de banda extendidas, y solo se puede transmitir alguna información que corresponda a algunas de las anchuras de banda extendidas. Por ejemplo, la información de retardo se puede codificar para algunas sub-bandas que son generadas por la extensión de anchura de banda; y la codificación puede no ser realizada para el resto de las sub-bandas, y las sub-bandas se pueden generar distorsionando un espectro generado por medio del uso de la información de retardo en el lado del decodificador.
[0032] La unidad de extensión de anchura de banda 208 selecciona un componente que tiene una amplitud grande de la señal de banda alta de la señal de entrada S2 y calcula la correlación usando únicamente el componente seccionado, reduciendo de ese modo la cantidad de cálculo para el cálculo de correlación, y envía, a la unidad de cálculo de energía de componente de ruido 204 (primera unidad de cálculo), la información de posición de frecuencia del componente seleccionado como información de posición de frecuencia de componente tonal de banda alta.
[0033] Basándose en la posición de la banda específica que es especificada por la información de retardo, la unidad de extensión de anchura de banda 203 extrae la señal no tonal de banda baja, establece la señal no tonal de banda baja como una señal no tonal de banda alta y envía la señal no tonal de banda alta a la unidad de cálculo de ganancia 205.
[0034] Por medio del uso de la información de posición de frecuencia de componente tonal de banda alta, la unidad de cálculo de energía de componente de ruido 204 calcula la energía de un componente de ruido de banda alta, que es un componente de ruido de la señal de banda alta de la señal de entrada S2, y envía la energía a la unidad de cálculo de ganancia 205. Específicamente, restando la energía del componente en la posición de frecuencia de componente tonal de banda alta en la parte de banda alta de la energía de los componentes en la parte de banda alta completa de la señal de entrada S2 se obtiene la energía de componentes diferentes del componente tonal de banda alta, y esta energía se envía a la unidad de cálculo de ganancia 205 como energía de componente de ruido de banda alta.
[0035] La unidad de cálculo de ganancia 205 calcula la energía de la señal no tonal de banda alta enviada desde la unidad de extensión de anchura de banda 203, calcula la relación entre esta energía y la energía del componente de ruido de banda alta enviado desde la unidad de cálculo de energía de componente de ruido 204 y envía esta relación a la unidad de multiplexión 207 como un factor de cambio de escala.
[0036] La unidad de cálculo de energía 206 calcula la energía de la señal de entrada S2 para cada sub-banda. Por ejemplo, la energía puede ser calculada a partir de la suma de cuadrados de espectros en sub-bandas obtenidos dividiendo la señal de entrada S2 en sub-bandas. Por ejemplo, la energía se puede definir por medio de la siguiente expresión.
Figure imgf000006_0001
[0037] En la expresión, X es un coeficiente de MDCT, b es un número de sub-bandas y Épsilon es una constante para la cuantificación escalar.
[0038] A continuación, la unidad de cálculo de energía 206 envía un índice que representa el grado de la energía de banda cuantificada, obtenida a la unidad de multiplexión 207 como energía de banda cuantificada.
[0039] La unidad de multiplexión 207 codifica y multiplexa la información de retardo, el factor de cambio de escala y la energía de banda cuantificada. A continuación, una señal obtenida mediante la multiplexión se envía como una señal codificada de banda alta. Debe observarse que la unidad de multiplexión 207 y la unidad de multiplexión 103 se pueden proporcionar por separado o de forma integral.
[0040] De la manera anterior, en esta realización, la unidad de cálculo de ganancia 205 (segunda unidad de cálculo) calcula la relación entre la energía del componente no tonal (ruido) de banda alta de la señal de banda alta a partir de la señal de entrada y la energía de la señal no tonal (ruido) de banda alta a partir de una señal decodificada de banda alta generada a partir de la señal decodificada de banda baja. Por consiguiente, esta realización produce un efecto de habilitación de una reproducción más exacta de la energía de un componente no tonal (ruido) de una señal decodificada.
[0041] Es decir, es posible reproducir de manera más exacta la energía del componente no tonal, que es más pequeña que aquella del componente tonal y tiende a incluir errores, y la energía del componente no tonal de la señal decodificada se estabiliza. Además, también es posible reproducir de manera más exacta la energía del componente tonal calculada por medio del uso de la energía de banda y la energía del componente no tonal. Adicionalmente, es posible realizar la codificación por medio del uso de un número pequeño de bits para generar la señal codificada de banda alta.
(Segunda realización)
[0042] A continuación se describirá una configuración de un codificador según una segunda realización de la presente descripción con referencia a la Fig. 3. Debe observarse que la configuración general de un codificador 100 según esta realización tiene la configuración ilustrada en la Fig. 1, como en la primera realización.
[0043] La Fig. 3 es un diagrama de bloques que ilustra una configuración de una segunda unidad de codificación de capa 106 en esta realización, que difiere de la segunda unidad de codificación de capa 106 en la primera realización en que la relación de posición de la unidad de adición de ruido y la unidad de separación se invierte y que se incluyen una unidad de separación 302 y una unidad de adición de ruido 301.
[0044] A partir de una señal decodificada de banda baja, la unidad de separación 302 separa una señal no tonal de banda baja, que es un componente no tonal, y una señal tonal de banda baja, que es un componente tonal. El procedimiento de separación usado es el mismo que el de la descripción de la primera realización, y la separación se realiza según el grado de amplitud basándose en un umbral predeterminado. El umbral se puede fijar a cero.
[0045] La unidad de adición de ruido 301 añade una señal de ruido a la señal no tonal de banda baja enviada desde la unidad de separación 302. Con el fin de no añadir una señal de ruido a un componente que ya tiene una amplitud, puede hacerse referencia a la señal decodificada de banda baja S1.
[0046] Debe observarse que los ejemplos del empleo de la codificación con cambio de escala han sido descritos en la primera realización y la segunda realización. Sin embargo, la primera realización y la segunda realización se pueden aplicar a casos en que se emplea una codificación diferente de la codificación con cambio de escala. Las Fig. 4 y 9 son ejemplos de otros codificadores, codificadores 110 y 610, respectivamente. En primer lugar, se describirá el codificador 110 ilustrado en la Fig. 4.
[0047] El codificador 110 ilustrado en la Fig. 4 incluye una unidad de transformación de tiempo a frecuencia 111, una primera unidad de codificación 112, una unidad de multiplexión 113, una unidad de normalización de energía de banda 114 y una segunda unidad de codificación 115.
[0048] La unidad de transformación de tiempo a frecuencia 111 realiza la transformación de frecuencia en una señal de entrada por medio de MDCT o similares.
[0049] Para cada banda predeterminada, la unidad de normalización de energía de banda 114 calcula, cuantifica y codifica la energía de banda de un espectro de entrada, que es la señal de entrada sometida a la transformación de frecuencia, y envía la señal codificada de energía de banda resultante a la unidad de multiplexión 113. Además, la unidad de normalización de energía 114 calcula la información de asignación de bits B1 y B2 con respecto a los bits que son asignados a la primera unidad de codificación y la segunda unidad de codificación, respectivamente, por medio del uso de la energía de banda cuantificada, y envía la información de asignación de bits B1 y B2 a la primera unidad de codificación 112 y la segunda unidad de codificación 115, respectivamente. Además, la unidad de normalización de energía de banda 114 normaliza además el espectro de entrada en cada banda por medio del uso de la energía de banda cuantificada, y envía un espectro de entrada normalizado S2 a la primera unidad de codificación 112 y la segunda unidad de codificación 115.
[0050] La primera unidad de codificación 112 realiza la primera codificación en el espectro de entrada normalizado S2 que incluye una señal de banda baja que tiene una frecuencia menor o igual que una frecuencia predeterminada basándose en la información de asignación de bits B1 que ha sido introducida. A continuación, la primera unidad de codificación 112 envía, a la unidad de multiplexión 113, una primera señal codificada que se genera como resultado de la codificación. Además, la primera unidad de codificación 112 envía, a la segunda unidad de codificación 115, una señal decodificada de banda baja S1 que se obtiene en el proceso de la codificación.
[0051] La segunda unidad de codificación 115 realiza una segunda codificación en una parte del espectro de entrada normalizado S2, en la que la primera unidad de codificación 112 no se ha conseguido codificar. La segunda unidad de codificación 115 puede tener la configuración de la segunda unidad de codificación de capa 106 descrita con referencia a las Fig. 2 y 3.
[0052] A continuación se describirá el codificador 610 ilustrado en la Fig. 9. El codificador 610 ilustrado en la Fig. 9 incluye una unidad de trasformación de tiempo a frecuencia 611, una primera unidad de codificación 612, una unidad de multiplexión 613 y una segunda unidad de codificación 614.
[0053] La unidad de transformación de tiempo a frecuencia 611 realiza la transformación de frecuencia en una señal de entrada por medio de MDCT o similares.
[0054] Para cada banda predeterminada, la primera unidad de codificación 612 calcula, cuantifica y codifica la energía de banda de un espectro de entrada, que es la señal de entrada sometida a la transformación de frecuencia, y envía la señal codificada de energía de banda resultante a la unidad de multiplexión 613. Además, la primera unidad de codificación 612 calcula la información de asignación de bits que es asignada a una primera señal codificada y una segunda señal codificada por medio del uso de la energía de banda cuantificada y realiza, basándose en una información de asignación de bits, la primera codificación sobre un espectro de entrada normalizado S2 que incluye una señal de banda baja que tiene una frecuencia menor o igual que una frecuencia predeterminada. A continuación, la primera unidad de codificación 612 envía una primera señal codificada a la unidad de multiplexión 613 y envía, a la segunda unidad de codificación 614, una señal decodificada de banda baja, que es un componente de banda baja de una señal decodificada de la primera señal codificada. La primera codificación en este punto se puede realizar sobre la señal de entrada que ha sido normalizada por la energía de banda cuantificada. En este caso, la señal decodificada de la primera señal codificada corresponde a una señal obtenida por medio de la normalización inversa mediante la energía de banda cuantificada. Además, la primera unidad de codificación 612 envía una información de asignación de bits que es asignada a la segunda señal codificada y energía de banda cuantificada de banda alta a la segunda unidad de codificación 614.
[0055] La segunda unidad de codificación 614 realiza una segunda codificación sobre una parte del espectro de entrada normalizado S2, en la que la primera unidad de codificación 612 no se ha conseguido codificar. La segunda unidad de codificación 614 puede tener la configuración de la segunda unidad de codificación de capa 106 descrita con referencia a las Fig. 2 y 3. Debe observarse que, aunque no se ilustra claramente en las Fig. 2 o 3, la información de asignación de bits se introduce en la unidad de extensión de anchura de banda 208 que codifica la información de retardo y la unidad de cálculo de ganancia que codifica el factor de cambio de escala. Además, la unidad de cálculo de energía 206 calcula y cuantifica la energía de banda por medio del uso de la señal de entrada en las Fig. 2 y 3, pero no es necesario en la Fig. 9 debido a que la primera unidad de codificación 612 realiza este proceso.
(Tercera realización)
[0056] La Fig. 5 es un diagrama de bloques que ilustra una configuración de un decodificador de señal de voz según una tercera realización. Como un ejemplo, en la siguiente descripción, una señal codificada es una señal que tiene una configuración estratificada que incluye una pluralidad de capas y que es transmitida desde un codificador, y el decodificador decodifica esta señal codificada. Debe observarse que se describirá un ejemplo en el que una señal codificada no tiene una configuración estratificada con referencia a la Fig. 8.
[0057] Un decodificador 400 ilustrado en la Fig. 5 incluye una unidad de separación 401, una primera unidad de decodificación de capa 402 y una segunda unidad de decodificación de capa 403. Una antena, que no se ilustra, se conecta a la unidad de separación 401.
[0058] De una señal codificada introducida a través de la antena, que no se ilustra, la unidad de separación 401 separa una señal codificada de banda baja, que es una primera señal codificada, y una señal codificada de banda alta. La unidad de separación 401 envía la señal codificada de banda baja a la primera unidad de decodificación de capa 402 y envía la señal codificada de banda alta a la segunda unidad de decodificación de capa 403.
[0059] La primera unidad de decodificación de capa 402, que es una realización de una primera unidad de decodificación, decodifica la señal codificada de banda baja, generando de este modo una señal decodificada de banda baja S1. Los ejemplos de la decodificación por la primera unidad de decodificación de capa 402 incluyen la decodificación CELP. La primera unidad de decodificación de capa 402 envía la señal decodificada de banda baja a la segunda unidad de decodificación de capa 403.
[0060] La segunda unidad de decodificación de capa 403, que es una realización de una segunda unidad de decodificación, decodifica la señal codificada de banda alta, generando de ese modo una señal decodificada de banda ancha por medio del uso de la señal decodificada de banda baja, y envía la señal decodificada de banda ancha. Los detalles de la segunda unidad de decodificación de capa 403 se describirán posteriormente.
[0061] A continuación, la señal decodificada de banda baja y/o la señal decodificada de banda ancha se reproducen a través de un amplificador y un altavoz, que no se ilustran.
[0062] La Fig. 6 es un diagrama de bloques que ilustra una configuración de la segunda unidad de decodificación de capa 403 en esta realización. La segunda unidad de decodificación de capa 403 incluye una unidad de decodificación y separación 501, una unidad de adición de ruido 502, una unidad de separación 503, una unidad de extensión de anchura de banda 504, una unidad de cambio de escala 505, una unidad de acoplamiento 506, una unidad de adición 507, una unidad de extensión de anchura de banda 508, una unidad de acoplamiento 509, una unidad de estimación de energía de señal tonal 510 y una unidad de cambio de escala 511.
[0063] La unidad de decodificación y separación 501 decodifica la señal codificada de banda alta y separa la energía de banda cuantificada A, un factor de cambio de escala B e información de retardo C. Debe observarse que la unidad de separación 401 y la unidad de decodificación y separación 501 se pueden proporcionar por separado o integralmente.
[0064] La unidad de adición de ruido 502 añade una señal de ruido a la señal decodificada de banda baja S1 introducida desde la primera unidad de decodificación de capa 402. La señal de ruido usada es la misma que la señal de ruido que es añadida por la unidad de adición de ruido 201 en el codificador 100. A continuación, la unidad de adición de ruido 502 envía, a la unidad de separación 503, la señal decodificada de banda baja a la que se ha añadido la señal de ruido.
[0065] Desde la señal decodificada de banda baja, a la que se ha añadido la señal de ruido, la unidad de separación 503 separa un componente no tonal y un componente tonal, y envía el componente no tonal y el componente tonal como una señal no tonal de banda baja y una señal tonal de banda baja, respectivamente. El procedimiento para separar la señal no tonal de banda baja y la señal tonal de banda baja es el mismo que el descrito para la unidad de separación 202 en el codificador 100.
[0066] Por medio del uso de la información de retardo C, la unidad de extensión de anchura de banda 504 copia la señal no tonal de banda baja que tiene una banda específica a una banda alta, generando de ese modo una señal no tonal de banda alta.
[0067] La unidad de cambio de escala 505 multiplica la señal no tonal de banda alta generada por la unidad de extensión de anchura de banda 504 por el factor de cambio de escala B, ajustando de ese modo la amplitud de la señal no tonal de banda alta.
[0068] A continuación, la unidad de acoplamiento 506 acopla la señal no tonal de banda baja y la señal no tonal de banda alta cuya amplitud ha sido ajustada por la unidad de cambio de escala 505, generando de ese modo una señal no tonal de banda ancha.
[0069] Por otra parte, la señal tonal de banda baja separada por la unidad de separación 503 se envía a la unidad de extensión de anchura de banda 508. A continuación, de la misma manera que la unidad de extensión de anchura de banda 504, por medio del uso de la información de retardo C, la unidad de extensión de anchura de banda 508 copia la señal tonal de banda baja que tiene una banda específica a una banda alta, generando de este modo una señal tonal de banda alta.
[0070] La unidad de estimación de energía de señal tonal 510 calcula la energía de la señal no tonal de banda alta que ha sido introducida desde la unidad de cambio de escala 505 y que tiene la amplitud ajustada, y resta la energía de la señal no tonal de banda alta del valor de la energía de banda cuantificada A, obteniendo de ese modo la energía de la señal tonal de banda alta. A continuación, la unidad de estimación de energía de señal tonal 510 envía la relación entre la energía de la señal no tonal de banda alta y la energía de la señal tonal de banda alta a la unidad de cambio de escala 511.
[0071] La unidad de cambio de escala 511 multiplica la señal tonal de banda alta por la relación entre la energía de la señal no tonal de banda alta y la energía de la señal tonal de banda alta, ajustando de ese modo la amplitud de la señal tonal de banda alta.
[0072] A continuación, la unidad de acoplamiento 509 acopla la señal tonal de banda baja y la señal tonal banda alta que tiene la amplitud ajustada, generando de ese modo una señal tonal de banda ancha.
[0073] Finalmente, la unidad de adición 507 añade la señal no tonal de banda ancha y la señal tonal de banda ancha, generando de ese modo una señal decodificada de banda ancha, y envía la señal decodificada de banda ancha.
[0074] De la manera anterior, esta realización tiene una configuración en la que el componente no tonal se genera por medio del uso del espectro cuantificado de banda baja y un número pequeño de bits y se ajusta para tener energía apropiada por medio del uso del factor de cambio de escala, y en el que la energía de la señal tonal de banda alta se ajusta por medio del uso de la energía del componente no tonal ajustado. Por consiguiente, es posible codificar, transmitir y decodificar una señal de música y similares con una pequeña cantidad de información y reproducir apropiadamente la energía de un componente no tonal de banda alta. También es posible reproducir la energía de un componente tonal apropiado determinando la energía del componente tonal por medio del uso de la información de energía de banda cuantificada y la información de energía de componente no tonal.
(Cuarta realización)
[0075] A continuación, se describirá una configuración de un decodificador según una cuarta realización de la presente descripción con referencia a la Fig. 7. Debe observarse que la configuración general de un decodificador 400 según esta realización incluye la configuración ilustrada en la Fig. 4 como en la primera realización.
[0076] La Fig. 7 es un diagrama de bloques que ilustra una configuración de una segunda unidad de decodificación de capa 403 en esta realización, que difiere de la segunda unidad de decodificación de capa 403 en la tercera realización en que se incluyen la relación de posición de la unidad de adición de ruido y la unidad de separación se invierte y una unidad de separación 603 y una unidad de adición de ruido 602, como en la relación entre la primera realización y la segunda realización. Debe observarse que la unidad de decodificación y separación 501 se omite de la ilustración en la Fig. 7.
[0077] A partir de una señal decodificada de banda baja, la unidad de separación 603 separa una señal no tonal de banda baja, que es un componente no tonal, y una señal tonal de banda baja, que es un componente tonal.
[0078] La unidad de adición de ruido 602 añade una señal de ruido a la señal no tonal de banda baja enviada desde la unidad de separación 603.
[0079] Debe observarse que se ha descrito un ejemplo del empleo de codificación con cambio de escala en la tercera realización y en la cuarta realización. Sin embargo, la tercera realización y la cuarta realización se pueden aplicar a casos en que se emplea una codificación diferente de la codificación con cambio de escala. Las Fig. 8 y 10 ilustran ejemplos de otros decodificadores, decodificadores 410 y 620, respectivamente. En primer lugar, se describirá el decodificador 410 ilustrado en la Fig. 8.
[0080] El decodificador 410 ilustrado en la Fig. 8 incluye una unidad de separación 411, una primera unidad de decodificación 412, una segunda unidad de decodificación 413, una unidad de transformación de frecuencia a tiempo 414, una unidad de normalización inversa de energía de banda 415 y una unidad de sintetización 116.
[0081] A partir de una señal codificada introducida a través de una antena, que no se ilustra, la unidad de separación 411 separa una primera señal codificada, una señal codificada de banda alta y una señal codificada de energía de banda. La unidad de separación 411 envía la primera señal codificada, la señal codificada de banda alta y la señal codificada de energía de banda a la primera unidad de decodificación 412, la segunda unidad de decodificación 413 y la unidad de normalización inversa de energía de banda 415, respectivamente.
[0082] La unidad de normalización inversa de energía de banda 415 decodifica la señal codificada de energía de banda, generando de ese modo energía de banda cuantificada. Basándose en la energía de banda cuantificada, la unidad de normalización inversa de energía de banda 415 calcula la información de asignación de bits B1 y B2 y envía la información de asignación de bits B1 y B2 a la primera unidad de decodificación y la segunda unidad de decodificación, respectivamente. Además, la unidad de normalización inversa de energía de banda 415 realiza la normalización inversa en la que la energía de banda cuantificada generada se multiplica por una señal decodificada de banda ancha normalizada que es introducida desde la unidad de sintetización 416, generando de ese modo una señal decodificada de banda ancha final, y envía la señal decodificada de banda ancha a la unidad de transformación de frecuencia a tiempo 414.
[0083] La primera unidad de decodificación 412 decodifica la primera señal codificada según la información de asignación de bits B1, generando de este modo una señal decodificada de banda baja S1 y una señal decodificada de banda alta. La primera unidad de decodificación 412 envía la señal decodificada de banda baja y la señal decodificada de banda alta a la segunda unidad de decodificación 413 y la unidad de sintetización 416, respectivamente.
[0084] La segunda unidad de decodificación 413 decodifica la señal codificada de banda alta según la información de asignación de bits B2, generando de este modo una señal decodificada de banda ancha por medio del uso de la señal decodificada de banda baja y envía la señal decodificada de banda ancha. La segunda unidad de decodificación 413 puede tener la misma configuración que la segunda unidad de decodificación de capa 403 descrita con referencia a las Fig. 6 y 7.
[0085] La unidad de sintetización 416 añade la señal decodificada de banda alta que es decodificada por la primera unidad de decodificación a la señal decodificada de banda ancha introducida desde la segunda unidad de decodificación, generando de este modo la señal decodificada de banda ancha normalizada, y envía la señal decodificada de banda ancha a la unidad de normalización inversa de energía de banda 415.
[0086] A continuación, la señal decodificada de banda ancha enviada desde la unidad de normalización inversa de energía de banda 415 es transformada en una señal de dominio temporal por la unidad de transformación de frecuencia a tiempo 414 y reproducida a través de un amplificador y un altavoz, que no se ilustran.
[0087] A continuación se describirá el decodificador 620 ilustrado en la Fig. 10. La Fig. 10 es un ejemplo de otro decodificador, el decodificador 620. El decodificador 620 ilustrado en la Fig. 10 incluye una primera unidad de decodificación 621, una segunda unidad de decodificación 622, una unidad de sintetización 623 y una unidad de transformación de frecuencia a tiempo 624.
[0088] Una señal codificada (que incluye una primera señal codificada, una señal codificada de banda alta y una señal codificada de energía de banda) introducida a través de una antena, que no se ilustra, se introduce a la primera unidad de decodificación 621. En primer lugar, la primera unidad de decodificación 621 separa y decodifica la energía de banda y envía una parte de banda alta de la energía de banda decodificada a la segunda unidad de decodificación 622 como energía de banda de banda alta (A). A continuación, basándose en la energía de banda decodificada, la primera unidad de decodificación 621 calcula la información de asignación de bits y separa y decodifica la primera señal codificada. Este proceso de decodificación puede incluir un proceso de normalización inversa que usa la energía de banda decodificada. La primera unidad de decodificación 621 envía, a la segunda unidad de decodificación 621, una parte de banda baja de una primera señal decodificada que se obtiene por medio de la decodificación como una señal decodificada de banda baja. A continuación, la primera unidad de decodificación 621 separa y decodifica la señal codificada de banda alta basándose en la información de asignación de bits. Una señal decodificada de banda alta obtenida por medio de la decodificación incluye un factor de cambio de escala (B) e información de retardo (C), y el factor de cambio de escala y la información de retardo son enviados a la segunda unidad de decodificación 622. La primera unidad de decodificación 621 también envía una parte de banda alta de la primera señal decodificada a la unidad de sintetización 623 como una señal decodificada de banda alta. La señal decodificada de banda alta puede ser cero en algunos casos.
[0089] La segunda unidad de decodificación 622 genera una señal decodificada de banda ancha por medio del uso de la señal decodificada de banda baja, la energía de banda cuantificada decodificada, el factor de cambio de escala y la información de retardo introducidas desde la primera unidad de decodificación 621, y envía la señal decodificada de banda ancha. La segunda unidad de decodificación 622 puede tener la misma configuración que la segunda unidad de decodificación de capa 403 descrita con referencia a las Fig. 6 y 7.
[0090] La unidad de sintetización 623 añade la señal decodificada de banda alta que es decodificada por la primera unidad de decodificación 621 a la señal decodificada de banda ancha introducida desde la segunda unidad de decodificación 622, generando de ese modo una señal decodificada de banda ancha. La señal resultante es transformada en una señal de dominio temporal por la unidad de trasformación de frecuencia a tiempo 624 y se reproduce a través de un amplificador y un altavoz, que no se ilustran.
(Conclusión)
[0091] De la primera realización a la cuarta realización anteriores se han descrito los codificadores y decodificadores según la presente descripción. Los codificadores y los decodificadores según la presente descripción son ideas que incluyen una forma de nivel de producto semiacabado o una forma de nivel de componente, normalmente una tarjeta de sistema o un elemento semiconductor, y que incluyen una forma de nivel de producto acabado, tal como un dispositivo terminal o un dispositivo de estación de base. En el caso en que cada uno de los codificadores y decodificadores según la presente descripción está en una forma de nivel de producto semiacabado o una forma de nivel de componente, la forma de nivel de producto acabado se realiza por medio de la combinación con una antena, un convertidor de DA/AD (digital-analógico/analógico-digital), un amplificador, un altavoz, un micrófono o similares.
[0092] Debe observarse que los diagramas de bloques mostrados en las Fig. 1 a 10 ilustran configuraciones y operaciones (procedimientos) de hardware de diseño especializado y también incluyen casos en los que las configuraciones y operaciones de hardware se realizan instalando programas que ejecutan las operaciones (procedimientos) según la presente descripción en el hardware de uso general y que ejecutan los programas por medio de un procesador. Los ejemplos de una calculadora electrónica que sirve como este hardware de uso general incluyen ordenadores personales, varios terminales de información móviles que incluyen teléfonos inteligentes y teléfonos móviles.
[0093] Además, el hardware de diseño especializado no está limitado a un nivel de producto acabado (electrónica de consumo), tal como un teléfono móvil o un teléfono de línea terrestre, e incluye un nivel de producto semiacabado o un nivel de componente, tal como una tarjeta de sistema o un elemento semiconductor.
[0094] Un ejemplo en que se usa la presente descripción en una estación de base puede ser el caso en que la transcodificación para cambiar un esquema de codificación de voz se realiza en la estación de base. Debe observarse que la estación de base es una idea que incluye varios nodos que existen en una línea de comunicación.
Aplicabilidad Industrial
[0095] Los codificadores y decodificadores según la presente descripción son aplicables a dispositivos relacionados con la grabación, transmisión y reproducción de señales de voz y señales de audio.
Lista de signos de referencia
[0096]
100, 110, 610 codificador
101 unidad de submuestreo
102 primera unidad de codificación de capa
103, 113, 613 unidad de multiplexión
104 primera unidad de decodificación de capa
105 unidad de retardo
106 segunda unidad de codificación de capa
201, 301 unidad de adición de ruido
202, 302 unidad de separación
203 unidad de extensión de anchura de banda
204 unidad de cálculo de energía de componente de ruido (primera unidad de cálculo)
205 unidad de cálculo de ganancia (segunda unidad de cálculo)
206 unidad de cálculo de energía
207 unidad de multiplexión
208 unidad de extensión de anchura de banda
400, 410, 620 decodificador
401, 411 unidad de separación
402 primera unidad de decodificación de capa
403 segunda unidad de decodificación de capa
501 unidad de decodificación y separación
502, 602 unidad de adición de ruido
503, 603 unidad de separación
504 unidad de extensión de anchura de banda
505 unidad de cambio de escala
506 unidad de acoplamiento
507 unidad de adición
508 unidad de extensión de anchura de banda
509 unidad de acoplamiento
510 unidad de estimación de energía de señal tonal
511 unidad de cambio de escala
, 612 primera unidad de codificación , 614 segunda unidad de codificación , 621 primera unidad de decodificación , 622 segunda unidad de decodificación

Claims (6)

REIVINDICACIONES
1. Un dispositivo de codificación, caracterizado porque comprende:
un primer codificador (102, 104), que en funcionamiento, codifica una señal de banda baja entre una señal de entrada de voz o audio para generar una primera señal codificada y decodifica la primera señal codificada para generar una señal decodificada de banda baja (S1);
un segundo codificador (106), que en funcionamiento, codifica, basándose en la señal decodificada de banda baja (S1), una señal de banda alta que tiene una banda más alta que la de la señal de banda baja para generar una señal codificada de banda alta; un calculador de energía (206) que, en funcionamiento, calcula una energía de la señal de entrada de voz o de audio y envía la energía calculada como energía de banda cuantificada; y
un primer multiplexor (103), que en funcionamiento, multiplexa la energía de banda cuantificada, la primera señal codificada y la señal codificada de banda alta para generar y enviar una señal codificada,
caracterizado porque
el segundo codificador (106) incluye
una unidad de separación (202; 302) que separa, de la señal decodificada de banda baja (S1), una señal no tonal de banda baja, que es un componente no tonal de la señal decodificada de banda baja (S1) y una señal tonal de banda baja, que es un componente tonal de la señal decodificada de banda baja (S1), siendo el componente tonal un componente que ha sido cuantificado por un cuantificador de pulsos, siendo el componente no tonal un componente que se ha convertido en cero al no haber sido cuantificado por un cuantificador de pulsos,
una unidad de adición de ruido (201) que añade una señal de ruido a la señal decodificada de banda baja o a la señal no tonal de banda baja enviada desde la unidad de separación (302),
una primera unidad de extensión de anchura de banda (208) que envía, como información de retardo, información de posición con respecto a una banda específica en la que la correlación entre la señal de banda alta (S2) y la señal tonal de banda baja se vuelve máxima;
una unidad de cálculo (205) que calcula una relación de energía entre un componente de ruido de banda alta, que es un componente de ruido de la señal de entrada de banda alta (S2) que corresponde a la banda específica, y la señal no tonal de banda alta obtenida por la segunda unidad de extensión de anchura de banda (203), y envía la relación calculada como un factor de cambio de escala, y
un segundo multiplexor (207) que multiplexa la información de retardo y el factor de cambio de escala como la señal codificada de banda alta y envía la señal codificada de banda alta.
2. Un dispositivo de decodificación que recibe una primera señal codificada, una señal codificada de banda alta, una señal codificada de energía de banda, obteniéndose la primera señal codificada por codificación, en un dispositivo de codificación (100; 110), de una señal de banda baja de una señal de entrada de voz o de audio, obteniéndose la señal codificada de banda alta por codificación, en el dispositivo de codificación (100; 110), de una señal de banda alta que tiene una banda superior a la de la señal de banda baja, comprendiendo el dispositivo de decodificación:
un primer decodificador (412), que en funcionamiento, decodifica la primera señal codificada para generar una señal decodificada de banda baja (S1);
un segundo decodificador (403; 413), que en funcionamiento, decodifica la señal codificada de banda alta para generar una señal decodificada de banda ancha usando la señal decodificada de banda baja (S1); y
un tercer decodificador (415), que en funcionamiento, decodifica la señal codificada de energía de banda para generar una energía de banda cuantificada (A), en el que el segundo decodificador (403, 413) incluye
una unidad de separación (503) que separa, a partir de la señal decodificada de banda baja (S1), una señal no tonal de banda baja, que es un componente no tonal de la señal decodificada de banda baja (S1), y una señal tonal de banda baja, que es un componente tonal de la señal decodificada de banda baja (S1), siendo el componente tonal un componente que ha sido cuantificado por un cuantificador de pulsos, y siendo el componente no tonal un componente que se ha convertido en cero al no haber sido cuantificado por un cuantificador de pulsos,
una unidad de adición de ruido que añade una señal de ruido a la señal decodificada de banda baja o a la señal no tonal de banda baja enviada desde la unidad de separación (503);
una primera unidad de extensión de anchura de banda (504) que copia la señal no tonal de banda baja en una banda alta usando información de retardo (C) obtenida por decodificación de la señal codificada de banda alta para generar una señal no tonal de banda alta, una primera unidad de cambio de escala (505) que ajusta una amplitud de la señal no tonal de banda alta usando un factor de cambio de escala (B) obtenido por decodificación de la señal codificada de banda alta,
una unidad de estimación de energía de señal tonal (510) que estima una energía de una señal tonal de banda alta a partir de una energía de la señal no tonal de banda alta y la energía de banda cuantificada (A),
una primera unidad de acoplamiento (506) que acopla la señal no tonal de banda baja y la señal no tonal de banda alta para generar una señal no tonal de banda ancha,
una segunda unidad de extensión de anchura de banda (508) que copia la señal tonal de banda baja en la banda alta usando la información de retardo (C) para generar la señal tonal de banda alta,
una segunda unidad de cambio de escala (511) que ajusta una amplitud de la señal tonal de banda alta basándose en la energía de la señal tonal de banda alta,
una segunda unidad de acoplamiento (509) que acopla la señal tonal de banda baja y la señal tonal de banda alta que tiene la amplitud ajustada para generar una señal tonal de banda ancha, y
una unidad de adición (507) que añade la señal no tonal de banda ancha y la señal tonal de banda ancha para generar una señal decodificada de banda ancha,
en el que la información de retardo (C) es información de posición relativa a una banda específica en la que la correlación entre la señal de banda alta y la señal tonal de banda baja se convierte en máxima, y
en el que el factor de cambio de escala (B) es una relación de energía entre un componente de ruido de banda alta, que es un componente de ruido de la señal de banda alta correspondiente a la banda específica, y la señal no tonal de banda alta generada a partir de la señal de banda baja correspondiente a la información de retardo, basándose en la información de posición relativa a la banda específica.
3. Un procedimiento de codificación que comprende:
codificación de una señal de banda baja de una señal de entrada de voz o de audio para generar una primera señal codificada; decodificación de la primera señal codificada para generar una señal decodificada de banda baja (S1); codificación, basándose en la señal decodificada de banda baja (S1), de una señal de banda alta que tiene una banda mayor que la de la señal de banda baja para generar una señal codificada de banda alta;
cálculo de una energía de la señal de entrada de voz o de audio y envío de la energía calculada como una energía de banda cuantificada; y
multiplexión de la energía de banda cuantificada, la primera señal codificada y la señal codificada de banda alta para generar y enviar una señal codificada,
caracterizado porque
dicha etapa de codificación de una señal de banda alta incluye las etapas de
separación, a partir de la señal decodificada de banda baja (S1), de una señal no tonal de banda baja, que es un componente no tonal de la señal decodificada de banda baja (S1), y una señal tonal de banda baja, que es un componente tonal de la señal decodificada de banda baja (S1), siendo el componente tonal un componente que ha sido cuantificado por un cuantificador de pulsos, siendo el componente no tonal un componente que se ha convertido en cero al no haber sido cuantificado por un cuantificador de pulsos;
adición de una señal de ruido a la señal decodificada de banda baja o a la señal no tonal de banda baja enviada a partir de la etapa de separación,
envío, como información de retardo, de información de posición relativa a una banda específica en el que la correlación entre la señal de entrada de banda alta (S2) y la señal tonal de banda baja se convierte en máxima;
envío de la señal no tonal de banda baja correspondiente a la información de retardo como una señal no tonal de banda alta,
basándose en la información de posición relativa a la banda específica;
cálculo de una relación de energía entre un componente de ruido de banda alta, que es un componente de ruido de la señal de entrada de banda alta (S2), correspondiente a la banda específica, y la señal no tonal de banda alta y envío de la relación calculada como un factor de cambio de escala; y
multiplexión de la información de retardo y el factor de cambio de escala como la señal codificada de banda alta y envío de la señal codificada de banda alta.
4. Un procedimiento de decodificación para una primera señal codificada, una señal codificada de banda alta y una señal codificada de energía de banda, obteniéndose la primera señal codificada por codificación, en un dispositivo de codificación, de una señal de banda baja de una señal de entrada de voz o de audio, obteniéndose la señal codificada de banda alta por codificación, en el dispositivo de codificación, de una señal de banda alta que tiene una banda mayor que la de la señal de banda baja, comprendiendo el procedimiento:
decodificación de la primera señal codificada para generar una señal decodificada de banda baja (S1); decodificación de la señal codificada de banda alta para generar una señal decodificada de banda ancha usando la señal decodificada de banda baja (S1);
decodificación de la señal codificada de energía de banda para generar una energía de banda cuantificada (A); separación, a partir de la señal decodificada de banda baja (S1), de una señal no tonal de banda baja, que es un componente no tonal de la señal decodificada de banda baja (S1), y una señal tonal de banda baja, que es un componente tonal de la señal decodificada de banda baja (S1), siendo el componente tonal un componente que ha sido cuantificado por un cuantificador de pulsos, y siendo el componente no tonal un componente que se ha convertido en cero al no haber sido cuantificado por un cuantificador de pulsos;
una unidad de adición de ruido que añade una señal de ruido a la señal decodificada de banda baja o a la señal no tonal de banda baja enviada a partir de la etapa de separación;
copia de la señal no tonal de banda baja en una banda alta usando información de retardo (C) obtenida por decodificación de la señal codificada de banda alta para generar una señal no tonal de banda alta;
ajuste de una amplitud de la señal no tonal de banda alta usando un factor de cambio de escala (B) obtenido por decodificación de la señal codificada de banda alta;
estimación de una energía de una señal tonal de banda alta a partir de una energía de la señal no tonal de banda alta y de la energía de banda cuantificada (A);
acoplamiento de la señal no tonal de banda baja y la señal no tonal de banda alta para generar una señal no tonal de banda ancha;
copia de la señal tonal de banda baja en la banda alta usando la información de retardo (C) para generar la señal tonal de banda alta;
ajuste de una amplitud de la señal tonal de banda alta basándose en la energía de la señal tonal de banda alta; acoplamiento de la señal tonal de banda baja y la señal tonal de banda alta que tiene la amplitud ajustada para generar una señal tonal de banda ancha; y
adición de la señal no tonal de banda ancha y la señal tonal de banda ancha para generar una señal decodificada de banda ancha, en la que la información de retardo (C) es información de posición relativa a una banda específica en la que la correlación entre la señal de banda alta y la señal tonal de banda baja se convierte en máxima, y
en el que el factor de cambio de escala (B) es una relación de energía entre un componente de ruido de banda alta, que es un componente de ruido de la señal de banda alta correspondiente a la banda específica, y la señal no tonal de banda alta generada a partir de la señal tonal de banda baja correspondiente a la información de retardo, basándose en la información de posición relativa a la banda específica.
5. Un medio de grabación legible por ordenador no transitorio que almacena un programa que hace que un procesador ejecute todas las etapas de un procedimiento según la reivindicación 3.
6. Un medio de grabación legible por ordenador no transitorio que almacena un programa que hace que un procesador ejecute todas las etapas de un procedimiento según la reivindicación 4.
ES15774034T 2014-03-31 2015-03-23 Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa Active ES2737889T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461972722P 2014-03-31 2014-03-31
JP2014153832 2014-07-29
PCT/JP2015/001601 WO2015151451A1 (ja) 2014-03-31 2015-03-23 符号化装置、復号装置、符号化方法、復号方法、およびプログラム

Publications (1)

Publication Number Publication Date
ES2737889T3 true ES2737889T3 (es) 2020-01-16

Family

ID=67901558

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15774034T Active ES2737889T3 (es) 2014-03-31 2015-03-23 Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa

Country Status (3)

Country Link
ES (1) ES2737889T3 (es)
PT (1) PT3128513T (es)
TR (1) TR201910102T4 (es)

Also Published As

Publication number Publication date
TR201910102T4 (tr) 2019-07-22
PT3128513T (pt) 2019-08-21

Similar Documents

Publication Publication Date Title
ES2374496T3 (es) Aparato para mezclar una pluralidad de flujos de datos de entrada.
JP6474874B2 (ja) ハーモニックオーディオ信号の帯域幅拡張
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
US20200219518A1 (en) Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
US20220130402A1 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
KR102653849B1 (ko) 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
US20090055169A1 (en) Voice encoding device, and voice encoding method
ES2698119B2 (es) Aparato de codificación para el procesamiento de una señal de entrada y aparato de decodificación para el procesamiento de una señal codificada
ES2969736T3 (es) Dispositivo de decodificación y método de decodificación
WO2017206794A1 (zh) 一种声道间相位差参数的提取方法及装置
US20120195435A1 (en) Method, Apparatus and Computer Program for Processing Multi-Channel Signals
ES2737889T3 (es) Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa
Sato et al. Range-constrained phase reconstruction for recovering time-domain signal from quantized amplitude and phase spectrogram
Chaudhari et al. A New Algorithm for Voice Signal Compression (VSC) & Analysis Suitable for Limited Storage Devices Using Matlab