ES2634196T3 - Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia - Google Patents

Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia Download PDF

Info

Publication number
ES2634196T3
ES2634196T3 ES14752293.2T ES14752293T ES2634196T3 ES 2634196 T3 ES2634196 T3 ES 2634196T3 ES 14752293 T ES14752293 T ES 14752293T ES 2634196 T3 ES2634196 T3 ES 2634196T3
Authority
ES
Spain
Prior art keywords
scale factor
band
frequency
bands
factor bands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14752293.2T
Other languages
English (en)
Inventor
Per Ekstrand
Kristofer Kjoerling
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2634196T3 publication Critical patent/ES2634196T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Abstract

Un sistema configurado para determinar una tabla maestra de bandas de factor de escala de una señal de banda alta (105) de una señal de audio, que ha de generarse a partir de una señal de banda baja (101) de la señal de audio, utilizando un esquema de reconstrucción de alta frecuencia; en donde la tabla maestra de bandas de factor de escala es indicativa de una resolución de frecuencia de una envolvente espectral de la señal de banda alta (105); en donde el sistema está configurado para - recibir un conjunto de parámetros transmitidos desde un codificador de audio junto con un flujo binario de audio indicativo de la señal de banda baja de la señal de audio, incluyendo dicho conjunto de parámetros un parámetro de selección y uno o más parámetros de índice; - memorizar una pluralidad de tablas de banda de factor de escala predeterminadas (200, 210) en una memoria del sistema con independencia del codificador de audio; en donde al menos una de las bandas de factor de escala (130) de las tablas de bandas de factor de escala predeterminadas (200, 210) comprende una pluralidad de bandas de frecuencia (220); y - determinar la tabla maestra de bandas de factor de escala seleccionando una particular de entre las tablas de bandas de factor de escala predeterminadas (200, 210) sobre la base del parámetro de selección del conjunto de parámetros recibido y seleccionando algunas o la totalidad de las bandas de factor de escala (130) de la tabla de bandas de factor de escala predeterminadas (200, 210) seleccionadas utilizando los uno o más parámetros de índice del conjunto de parámetros recibido, representando los uno o más parámetros de índice a índices en la tabla de bandas de factor de escala predeterminada (200, 210) seleccionada.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Diseno de tabla de banda de frecuencia para algoritmos de reconstruccion de alta frecuencia REFERENCIA CRUZADA CON SOLICITUDES DE PATENTE RELACIONADAS
Esta solicitud de patente reivindica la prioridad para la Solicitud de patente provisional de los Estados Unidos n° 61/871,575, presentada con fecha 29 de agosto de 2013.
CAMPO TECNICO
El presente documento se refiere a codificacion y decodificacion de audio. En particular, el presente documento se refiere a sistemas de codificacion de audio que hacen uso de la reconstruccion de alta frecuencia (HFR).
ANTECEDENTES DE LA INVENCION
Las tecnologfas de reconstruccion HFR, tales como la tecnologfa de Replicacion de Banda Espectral (SBR), permiten mejorar notablemente la eficiencia de codificacion de codecs (referido como codificadores/decodificadores nucleo) de audio perceptual tradicionales. En combinacion con la Codificacion de Audio Avanzada de MPEG-4 (AAC), HFR forma un codec de audio muy eficiente, que esta en uso, a modo de ejemplo, dentro del sistema de Radio Via Satelite XM y la denominada Digital Radio Mondiale y tambien normalizada dentro de 3GPP, DVD Forum y otros. Una puesta en practica de AAC con SBR se denomina Dolby Pulse. AAC con SBR es parte de la norma MPEG-4 en donde se refiere como el Perfil de AAC de Alta Eficiencia (HE-AAC). En general, la tecnologfa HFR puede combinarse con cualquier codec (nucleo) de audio perceptual en una forma compatible hacia delante y atras, que ofrece la posibilidad de actualizar los sistemas de difusion ya establecidos tal como la MPEG Capa 2 utilizada en el sistema Eureka DAB. Los metodos HFR pueden combinarse tambien con codecs de voz para permitir la voz de banda alta a tasas binarias ultrabajas.
La idea basica subyacente en HFR es la observacion de que normalmente esta presente una estrecha correlacion entre las caractensticas de la gama de alta frecuencia de una senal y las caractensticas de la gama de baja frecuencia de la misma senal. De este modo, una buena aproximacion para la representacion de la gama de alta frecuencia de entrada original de una senal puede conseguirse mediante una transposicion de senales desde la gama de baja frecuencia a la gama de alta frecuencia.
La denominada Reconstruccion de Alta Frecuencia puede realizarse en el dominio temporal o en el dominio de la frecuencia, utilizando un banco de filtros o una transformacion de dominio temporal a dominio de la frecuencia. El proceso suele implicar la etapa de crear una senal de alta frecuencia, y posteriormente, modelar la senal de alta frecuencia para la aproximacion de la envolvente espectral del espectro de alta frecuencia original. La etapa de crear una senal de alta frecuencia puede, a modo de ejemplo, basarse en una modulacion de banda lateral unica (SSB) en donde una sinusoide con frecuencia w es mapeada en correspondencia con una sinusoide con frecuencia w + Aw en donde Aw es un desplazamiento de frecuencia fijo. Dicho de otro modo, la senal de alta frecuencia (tambien referida como la senal de banda alta) puede generarse a partir de la senal de baja frecuencia (tambien referida como la senal de banda baja) mediante una operacion de "copia ascendente" de sub-bandas de baja frecuencia (tambien referidas como sub-bandas de banda baja) a sub-bandas de alta frecuencia (tambien referidas como sub-bandas de banda alta). Un metodo adicional para crear una senal de alta frecuencia puede implicar una transposicion armonica de sub-bandas de baja frecuencia. Una transposicion armonica de orden T se suele disenar para el mapeado de correspondencia de una sinusoide de frecuencia w de la senal de baja frecuencia a una sinusoide con frecuencia Tw, con T > 1, de la senal de alta frecuencia.
Segun se indico con anterioridad, posteriormente a la creacion de una senal de alta frecuencia, la forma de la envolvente espectral de la senal de alta frecuencia se ajusta en conformidad con la forma espectral de la componente de alta frecuencia de la senal de audio original. Para esta finalidad, factores de escala para una pluralidad de bandas de factor de escala pueden transmitirse desde el codificador de audio al decodificador de audio. El presente documento soluciona el problema tecnico de permitir al decodificador de audio determinar las bandas de factor de escala (para las cuales se proporcionan factores de escala a partir del codificador de audio) en una manera eficiente desde el punto de vista del calculo y de la tasa binaria.
DOCUMENTO DE REFERENCIA EN EL INFORME DE BUSQUEDA INTERNACIONAL
El informe de busqueda internacional emitido en relacion con el presente documento se refiere al documento de KRISTOFER KJORLING, "ISO_IEC 14496-3_2001_FPDAM 1, Extension del ancho de banda, con los cambios editoriales simples, indicados en los comentarios de NB, incorporados", 64. MPEG MEETING; - 14-032003; PATTAYA; (MOTION PICTURE EXPERT GROUP O ISO/IEC JTC1/SC29/WG11), (20030304), n° M9539, ISSN 0000-0265, XP030038455. El documento de referencia espedfica la primera modificacion a la norma ISO/IEC 14496-3:2001. El documento objeto de referencia espedfica la sintaxis normativa de la herramienta SBR y el proceso de decodificacion, y proporciona una descripcion informativa del codificador. Ademas, el documento objeto
5
10
15
20
25
30
35
40
45
50
55
60
65
de referencia espedfica dos nuevos perfiles, uno basado en el denominado Tipo de Objeto de Audio AAC LC y otro basado en AAC en combinacion con SBR.
SUMARIO DE LA INVENCION
El presente documento da a conocer un sistema y un metodo configurados para determinar una tabla maestra de bandas de factor de escala para una senal de banda alta de una senal de audio, junto con una unidad de reconstruccion de alta frecuencia correspondiente y un decodificador de audio correspondiente, segun se estipula en las reivindicaciones independientes.
Utilizando una o mas tablas de las banda de factores de escala predeterminadas y un conjunto de parametros para seleccionar una o mas de las bandas de factor de escala de entre las una o mas tablas de banda de factor de escala predeterminadas, de conformidad con las formas de realizacion de la presente invencion, pudiendose determinar la tabla maestra de bandas de factor de escala (que se utiliza en el contexto del esquema de HFR) de una manera eficiente desde el punto de vista informatico. En consecuencia, se puede reducir el coste de un decodificador de audio. Ademas, la sobrecarga de senalizacion para transmitir el conjunto de parametros desde un codificador de audio a un decodificador de audio correspondiente puede mantenerse a nivel bajo, proporcionando asf un esquema eficiente de tasa binaria para senalizar la tabla maestra de bandas de factor de escala desde el codificador de audio al decodificador de audio. Lo que antecede permite que el conjunto de parametros sea incluido en una manera periodica (p.ej., para cada trama de audio) en el flujo binario de audio que se transmite desde el codificador de audio al decodificador de audio, permitiendo asf aplicaciones de difusion y/o escision.
Conviene senalar que los metodos y sistemas, que incluyen sus formas de realizacion preferidas segun se describe en la presente solicitud de patente, pueden utilizarse de forma autonoma o en combinacion con los demas metodos y sistemas dados a conocer en este documento. Ademas, todos los aspectos de los metodos y sistemas descritos en la presente solicitud de patente pueden combinarse de forma arbitraria. En particular, las caractensticas de las reivindicaciones pueden combinarse entre sf en una forma tambien arbitraria.
BREVE DESCRIPCION DE LOS DIBUJOS
La invencion se explica a continuacion en una manera a modo de ejemplo haciendo referencia a los dibujos adjuntos, en donde:
La Figura 1 ilustra, a modo de ejemplo, senales de banda baja y de banda alta;
La Figura 2 ilustra, a modo de ejemplo, tablas de banda de factor de escala;
Las Figuras 3a y 3b ilustran comparaciones de tablas de banda de factor de escala maestras a modo de ejemplo; y
La Figura 4 ilustra un metodo, a modo de ejemplo, para generar una senal de banda alta utilizando una tabla de bandas de factor de escala predeterminada.
DESCRIPCION DETALLADA
Los decodificadores de audio que hacen uso de las tecnicas de HFR (Reconstruccion de Alta Frecuencia) suelen comprender una unidad de HFR para generar una senal de audio de alta frecuencia (referida como una senal de banda alta) a partir de una senal de audio de baja frecuencia (referida como una senal de banda baja) y una unidad de ajuste de envolvente espectral posterior para ajustar la envolvente espectral de la senal de audio de alta frecuencia.
En la Figura 1, se visualiza un espectro dibujado de forma estilista 100, 110 de la salida de una unidad de HFR, anterior la entrada en el ajustador de envolvente. En el panel superior, un metodo de copia ascendente (con dos intervalos) se utiliza para generar la senal banda alta 105 a partir de la senal de banda baja 101, p.ej., el metodo de copia ascendente utilizado en MPEG-4 SBR (Replicacion de Banda Espectral) que se describe en el documento "ISO/IEC 14496-3 - Tecnologfa de la Informacion - Codificacion de objetos audiovisuales - Parte 3: Audio". El metodo de copia ascendente convierte partes de las frecuencias mas bajas 101 a frecuencias mas altas 105. En el panel mas bajo, un metodo de transposicion armonica (con dos ordenes de transposicion no solapantes) se utiliza para generar la senal de banda alta 115 a partir de la senal de banda baja 111, p.ej., el metodo de transposicion armonica de MPEG-D USAC que se describe en el documento "MPEG-D USAC: ISO/IEC 23003-3 - Codificacion unificada de voz y audio”. En la posterior etapa de ajuste de envolvente, una envolvente espectral objetivo se aplica a los componentes de frecuencia alta 105, 115.
Ademas del espectro 100, 110, la Figura 1 ilustra bandas de frecuencia ejemplos 130 de los datos de envolvente espectral que representan la envolvente espectral objetivo. Estas bandas de frecuencia 130 se refieren como bandas de factor de escala o intervalos objetivos. En condiciones normales, un valor de energfa objetivo, esto es, una energfa de factor de escala (o factor de escala), se especificada para cada intervalo objetivo, esto es, para cada
5
10
15
20
25
30
35
40
45
50
55
60
65
banda de factor de escala. Dicho de otro modo, las bandas de factor de escala definen la resolucion de frecuencia efectiva de la envolvente espectral objetivo, puesto que suele existir solamente un valor de energfa objetivo unico por intervalo objetivo. Utilizando los factores de escala o energfas objetivos que se especifican para las bandas de factor de escala, un posterior ajustador de envolvente se encargara de ajustar la senal de banda alta, de modo que la energfa de la senal de banda alta dentro de las bandas de factor de escala sea igual a la energfa de los datos de envolvente espectral recibidos, esto es, la energfa objetivo, para las respectivas bandas de factor de escala.
El presente documento se refiere, en particular, a un esquema eficiente para determinar las tablas de bandas de frecuencia (que son indicativas de las bandas de factor de escala 130 a utilizarse dentro del proceso HFR o SBR) en un decodificador de audio. Ademas, el presente documento se refiere, en particular, a la reduccion de la sobrecarga de senalizacion para la comunicacion de las tablas de banda de frecuencia (referidas como tablas de banda de factor de escala) desde un codificador de audio al decodificador de audio correspondiente. Ademas, el presente documento esta destinado a simplificar la sintoma de ajuste del codificador de audio.
Un posible metodo para determinar las tablas de bandas de frecuencia (en particular, la tabla maestra de bandas de factor de escala) en un decodificador de audio esta basado en algoritmos predefinidos que hacen uso de parametros que han de transmitirse al decodificador de audio. Durante el tiempo de ejecucion, los algoritmos predeterminados se ejecutan para calcular las tablas de bandas de frecuencia sobre la base de los parametros transmitidos. Los algoritmos predeterminados proporcionan una asf denominada “tabla maestra” (tambien referida como la tabla maestra de bandas de factor de escala). La “tabla maestra” calculada puede utilizarse, a continuacion, para obtener un conjunto de tablas necesarias para decodificar correctamente y aplicar los datos parametricos correspondientes al algoritmo de Reconstruccion de Alta Frecuencia (p.ej., la tabla de bandas de frecuencia de alta resolucion, la tabla de bandas de frecuencia de baja resolucion, la tabla de bandas de ruido y/o una tabla de bandas de limitacion).
El esquema anteriormente citado para determinar las tablas de bandas de frecuencia tiene numerosos inconvenientes, puesto que requieren la transmision de parametros que se utilizan por el decodificador de audio para calcular las “tablas maestras”. Ademas, la ejecucion de los algoritmos predeterminados para calcular las “tablas maestras” requiere recursos de calculo informatico en el decodificador de audio y por lo tanto, aumenta el coste del decodificador de audio.
En el presente documento, se propone hacer uso de una o mas tablas de banda de factor de escala estaticas predeterminadas. En particular, se propone definir dos tablas de banda de factor de escala estaticas, una primera tabla para tasas binarias bajas y una segunda tabla para tasas binarias bajas. Las otras tablas, incluyendo la tabla maestra, que pueden necesitarse por el decodificador de audio para reconstruir la senal de banda alta 105 pueden obtenerse luego a partir de las tablas estaticamente predefinidas. La obtencion de las demas tablas (en particular, la tabla de banda de factores de escala maestra) puede realizarse de una manera eficiente mediante la indizacion de las tablas de banda de factor de escala predefinidas con parametros transmitidos desde el codificador de audio al decodificador de audio dentro del flujo de datos (tambien referido como flujo binario).
La primera y la segunda tablas de banda de factor de escala estaticas pueden definirse en la notacion Matlab como
• una primera tabla: sfbTableLow = [(10:20)';(22:2:32)';(35:3:38)';(42:4:46)']; y
• una segunda tabla: sfbTableHigh = [(18:24)';(26:2:44)';(47:3:62)'];
que proporcionan las divisiones 210 y 200, respectivamente, de las bandas de factor de escala segun se ilustra en la Figura 2 (lmeas continuas). En la notacion Matlab anteriormente citada, los numeros indican bandas de frecuencia individuales 220 (p.ej., bandas de banco de filtros especulares en cuadratura, QMF, o bandas QMF, CQMF de valores complejos). La primera tabla (esto es, la tabla de bandas de factor de escala de tasa binaria baja) se inicia en la banda de frecuencia 10 (referencia numerica 201) y asciende hasta la banda de frecuencia 46 (referencia numerica 202). La segunda tabla (esto es, la tabla de bandas de factor de escala de tasa binaria alta) se inicia en la banda de frecuencia 18 (referencia numerica 211) y asciende hasta la banda de frecuencia 62 (referencia numerica 212). En consecuencia, la primera tabla (para tasas binarias relativamente bajas, p.ej., inferiores a un umbral de tasas binarias predeterminados) comprende:
• bandas de factor de escala 130 desde la banda de frecuencia 10 a 20, que comprenden una banda de frecuencia unica 220 cada una,
• bandas de factor de escala 130 desde la banda de frecuencia 20 a 32, que comprende dos bandas de frecuencia 220 cada una,
• bandas de factor de escala desde la banda de frecuencia 32 a 38, que comprende tres bandas de frecuencia 220 cada una, y
• bandas de factor de escala 130 desde la banda de frecuencia 38 a 46, que comprende cuatro bandas de
5
10
15
20
25
30
35
40
45
50
frecuencia 220 cada una.
En una manera similar, la segunda tabla (para tasas binarias relativamente altas, p.ej., superiores al umbral de tasas binarias predeterminado) comprende:
• bandas de factor de escala 130 desde la banda de frecuencia 18 a 24, que comprende una banda de frecuencia unica 220 cada una,
• bandas de factor de escala 130 desde la banda de frecuencia 24 a 44, que comprende dos bandas de frecuencia 220 cada una, y
• bandas de factor de escala 130 desde la banda de frecuencia 44 a 62, que comprende tres bandas de frecuencia 220 cada una.
Segun puede deducirse de la Figura 2, la tabla de bandas de factor de escala de tasa binaria baja 200 comienza en la banda CQMF 10 y llega a la banda 46, teniendo hasta 20 bandas de factor de escala 130. La tabla de bandas de factor de escala de tasa binaria alta 210 soporta hasta 22 bandas de factor de escala 130 que vanan desde la banda 18 a la banda 62.
Con el fin de obtener la tabla maestra que ha de utilizarse para la decodificacion de una trama actual a partir de las tablas de banda de factor de escala estaticas 200, 210, pueden utilizarse tres parametros. Estos parametros pueden transmitirse desde el codificador de audio al decodificador de audio, con el fin de permitir al decodificador de audio obtener la tabla maestra para la trama actual (esto es, con el fin de obtener la tabla maestra actual). Estos parametros son:
1. Parametro de frecuencia inicial (startFreq): El parametro de frecuencia inicial puede tener una longitud de 3 bits y puede asumir valores comprendidos entre 0 y 7. El parametro de frecuencia inicial puede ser un mdice en las tablas de banda de factor de escala predeterminadas 200, 210 comenzando desde las bandas de la mas baja frecuencia 201, 211 de las tablas de banda de factor de escala respectivas 200, 210 (esto es, banda de frecuencia 10 o 18) desplazandose en sentido ascendente en etapas de dos bandas de factor de escala 130. El valor del parametro startFreq=1 apuntara, en consecuencia, a la banda de frecuencia 20 para la tabla de bandas de factor de escala de tasa binaria alta 210.
2. Parametro de frecuencia de parada (stopFreq): El parametro de frecuencia de parada puede tener una longitud de 2 bits y puede asumir valores comprendidos entre 0 y 4. El parametro de frecuencia de parada puede ser un mdice en las tablas de banda de factor de escala 200, 210 comenzando desde la banda de frecuencia mas alta (46 o 62) en sentido descendente en etapas de dos bandas de factor de escala 130. El valor de parametro stopFreq=2 apuntara, en consecuencia, a la banda 50 en la tabla de bandas de factor de escala de tasa binaria alta 210.
3. Parametro de escala maestra (masterScale): El parametro de escala maestra puede tener una longitud de 1 bit y puede asumir un valor comprendido entre 0 y 1. El parametro de escala maestra puede indicar cual de las tablas de banda de factor de escala predeterminadas 200, 210 se esta utilizando actualmente. A modo de ejemplo, el valor de parametro masterScale=0 puede indicar la tabla de bandas de factor de escala de tasa binaria baja 200 y el valor de parametro masterScale=1 puede indicar la tabla de bandas de factor de escala de tasa binaria alta 210.
Las siguientes tablas 1 y 2 indican las posibles frecuencias de inicio y parada para la tabla de bandas de factor de escala de tasa binaria baja 200 y para la tabla de bandas de factor de escala de tasa binaria alta 210, respectivamente, utilizando una frecuencia de muestreo de 48000 Hz.
Tabla 1, que muestra las frecuencias inicial y de parada para la tabla de bandas de factor de escala de tasa binaria baja
startFreq
Banda CQMF Frecuencia [Hz] stopFreq Banda CQMF Frecuencia [Hz]
0
10 3750 0 46 17250
1
12 4500 1 38 14250
2
14 5250 2 32 12000
3
16 6000 3 28 10500
4
18 6750
5
20 7500
5
10
15
20
25
30
35
40
45
startFreq
Banda CQMF Frecuencia [Hz] stopFreq Banda CQMF Frecuencia [Hz]
6
24 9000
7
28 10500
Tabla 2, que muestra las frecuencias inicial y de parada para la tabla de bandas de factor de escala de tasa binaria alta
startFreq
Banda CQMF Frecuencia [Hz] stopFreq Banda CQMF Frecuencia [Hz]
0
18 6750 0 62 23250
1
20 7500 1 56 21000
2
22 8250 2 50 18750
3
24 9000 3 44 16500
4
28 10500
5
32 12000
6
36 13500
7
40 15000
Utilizando el parametro de escala maestra, el codificador puede indicar al decodificador, cual de las tablas de banda de factor de escala predeterminadas 200, 210 ha de utilizarse para obtener la tabla maestra de bandas de factor de escala. Utilizando el parametro de frecuencia inicial y el parametro de frecuencia de parada, segun se describe en las tablas 1 y 2, puede determinarse la tabla de bandas de factor de escala maestra real. A modo de ejemplo, para masterScale=0, startFreq=1 y stopFreq=2, la tabla maestra de bandas de factor de escala comprende las bandas de factor de escala desde la tabla de bandas de factor de escala de tasa binaria baja 200 que vana desde la banda de frecuencia 12 hasta la banda de frecuencia 32.
La tabla maestra de bandas de factor de escala puede corresponder a una tabla de bandas de frecuencia de alta resolucion que se utiliza para realizar HFR para segmentos continuos de una senal de audio. Una tabla de bandas de frecuencia de baja resolucion puede obtenerse a partir de la tabla maestra de bandas de factor de escala mediante un diezmado de la tabla de bandas de frecuencia de alta resolucion, p.ej., mediante un factor de 2. La tabla de bandas de frecuencia de baja resolucion puede utilizarse para segmentos transitorios de la senal de audio (con el fin de permitir una resolucion temporal incrementada, a expensas de una resolucion de frecuencia reducida). Puede derivarse de las tablas 1 y 2, que el numero de bandas de factor de escala 130 para las tablas de banda de frecuencia de alta resolucion 210, 210 puede ser un numero par. En consecuencia, una tabla de bandas de frecuencia de baja resolucion puede ser un diezmado perfecto de la tabla de alta resolucion mediante un factor 2. Ademas, segun se deduce de las tablas 1 y 2, las tablas de banda de frecuencia siempre comienzan y terminan en una banda CQMF 220 de numeracion par.
Un cuarto parametro que afecta a las tablas de bandas de frecuencia actualmente utilizadas puede ser el parametro de banda cruzada (xOverBand). El parametro de banda cruzada puede tener una longitud de 2 o 3 bits y puede asumir valores comprendidos entre 0 y 3 (7). El parametro xOverBand puede ser un mdice en las tablas de banda de frecuencias de alta resolucion (o en la tabla maestra de bandas de factor de escala) que comienza en el primer archivo binario, desplazandose en sentido ascendente con una etapa de una banda de factor de escala 130. En consecuencia, la utilizacion del parametro xOverBand truncara efectivamente el inicio de la tabla de bandas de frecuencia de alta resolucion y/o la tabla maestra de bandas de factor de escala. El parametro xOverBand puede utilizarse para ampliar la gama de frecuencia de la senal de banda baja 101 y/o reducir la gama de frecuencia de la senal de banda alta 105. Puesto que el parametro xOverBand cambia el ancho de banda de HFR truncando las tablas existentes y en particular, sin cambiar el esquema de intervalos del transpondedor, el parametro xOverBand puede utilizarse para modificar el ancho de banda en tiempo de ejecucion sin artefactos informaticos audibles, o para permitir diferentes anchos de banda HFR para un establecimiento multicanal, mientras que todos los canales utilicen todavfa el mismo esquema de soluciones informaticas. Para algunas selecciones del parametro xOverBand, la primera banda de factor de escala de la tabla de bandas de frecuencia de alta y baja resolucion sera identico (como puede observarse, a modo de ejemplo, en la Figura 3b).
Las Figuras 3a y 3b ilustran una comparacion de las tablas maestras de bandas de factor de escala que han sido obtenidas sobre la base de las tablas de banda de factor de escala predeterminadas 200, 210 y las tablas maestras de bandas de factor de escala que han sido obtenidas utilizando un metodo algontmico. La Figura 3a ilustra una situacion de una tasa binaria relativamente baja de 22 kbps (mono/estereo parametrico). La mitad superior 300 del
5
10
15
20
25
30
35
40
diagrama ilustra la tabla de bandas de factor de escala maestra que ha sido obtenida utilizando la tabla de bandas de factor de escala de tasa binaria baja estatica 200 y la mitad inferior 310 del diagrama ilustra la tabla maestra de bandas de factor de escala que ha sido obtenida utilizando un metodo algontmico. Las lmeas 301, 311 representan los bordes perifericos de las bandas de factor de escala de las respectivas tablas maestras de bandas de factor de escala. Los sfmbolos de diamante inferiores 302, 312 representan los bordes de las bandas de factor de escala de alta resolucion y los sfmbolos de diamante superiores 303, 313 representan los bordes de las bandas de factor de escala de baja resolucion. Puede derivarse que las tablas de banda de factor de escala maestras que se obtienen utilizando las tablas de banda de factor de escala predeterminadas estaticas 200, 210 son practicamente las mismas que las tablas maestras de bandas de factor de escala que se obtienen utilizando el metodo algontmico.
La Figura 3b ilustra un caso estereo de tasa binaria relativamente alta con una tasa binaria de 76 kb/s. En este caso, la tabla de bandas de factor de escala de tasa binaria alta 210 se ha utilizado para determinar la tabla maestra de bandas de factor de escala. De nuevo, el diagrama superior 320 ilustra la tabla de bandas de factor de escala maestra que ha sido obtenida utilizando la tabla de bandas de factor de escala estatica 210, mientras que el diagrama inferior 330 ilustra la tabla maestra de bandas de factor de escala que ha sido obtenida utilizando el metodo algontmico. Las lmeas 321, 331 representan los bordes de las bandas de factor de escala de las respectivas tablas de bandas de factor de escala maestras. Los sfmbolos de diamante inferiores 322, 332 representan los bordes de las bandas de factor de escala de alta resolucion y los sfmbolos de diamante superiores 323, 333 representan los bordes de las bandas de factor de escala de baja resolucion. De nuevo, puede deducirse que las tablas maestras de bandas de factor de escala que se obtienen utilizando las tablas de banda de factor de escala predeterminadas estaticas 200, 210 son practicamente las mismas que las tablas maestras de bandas de factor de escala que se obtienen utilizando el metodo algontmico.
En el ejemplo ilustrado en la Figura 3, el parametro xOverBand ha sido establecido a un valor distinto de cero. En particular, el parametro xOverBand ha sido establecido a 2 para el metodo algontmico, mientras que el parametro xOverBand ha sido establecido a 1 para el metodo que ha sido descrito en el presente documento. Como un resultado de utilizar el parametro xOverBand, un numero de bandas de frecuencias 324, 334 que es igual para el parametro xOverBand se excluye de las tablas de alta resolucion y de las tablas de baja resolucion.
La tabla de bandas de factor de escala maestra actual (tambien referida como la tabla maestra actual) puede obtenerse por el decodificador de audio utilizando el pseudo-codigo indicado en la tabla 3.
Tabla 3
imagen1
En el pseudo-codigo de la tabla 3, el parametro masterReset se establece a 1 si cualquiera de los siguientes parametros ha cambiado desde la trama anterior: el parametro masterScale, el parametro startFreq y/o el parametro stopFreq. En consecuencia, la recepcion de un parametro masterScale, startFreq y/o stopFreq cambiado inicia la determinacion de una nueva tabla maestra en el decodificador de audio. Una tabla maestra actual se utiliza en tanto
5
10
15
20
25
30
35
40
45
que se determine una nueva tabla maestra (actualizada) (a reserva de un parametro de escala maestra, frecuencia inicial y/o frecuencia de parada cambiado).
En el pseudo-codigo de la tabla 3, masterBandTable es la tabla de bandas de factor de escala maestra obtenida y nMfb es el numero de bandas de factor de escala en la tabla maestra de bandas de factor de escala obtenida. A partir de la tabla maestra de bandas de factor de escala obtenida se pueden obtener todas las demas tablas que se utilizan en el proceso de HFR, esto es, las tablas de bandas de frecuencia resolucion alta y baja, la tabla de bandas de ruido y la tabla de bandas de limitacion, de conformidad con los metodos SBR de tipo legado que se especifican, a modo de ejemplo, en el documento "ISO/IEC 14496-3 Tecnologfa de la Informacion - Codificacion de objetos audiovisuales - Parte 3: Audio".
La Figura 4 ilustra un diagrama de flujo de un metodo a modo de ejemplo 400 para determinar una tabla maestra de bandas de factor de escala para una senal de banda alta 105, 115 de una senal de audio. Dicho de otro modo, el metodo 400 esta destinado a determinar una tabla de bandas de factor de escala maestra (tambien referida como la tabla maestra) que se utiliza en el contexto de un esquema HFR para generar la senal de banda alta 105, 115 a partir de una senal de banda baja 101, 111 de la senal de audio. La tabla maestra de bandas de factor de escala es indicativa de una resolucion de frecuencia de una envolvente espectral de la senal de banda alta 105, 115. El metodo 400 comprende la etapa de recibir 401 un conjunto de parametros, p.ej., el parametro de frecuencia inicial, el parametro de frecuencia de parada y/o el parametro de escala maestra. Ademas, el metodo 400 comprende la etapa de proporcionar 402 una tabla de bandas de factor de escala predeterminada 200, 210. Ademas, el metodo 400 comprende la etapa de determinar 403 la tabla maestra de bandas de factor de escala seleccionando algunas o la totalidad de las bandas de factor de escala 130 de la tabla de bandas de factor de escala predeterminada 200, 210, utilizando el conjunto de parametros.
En el presente documento, se describe un esquema eficiente de obtencion de las bandas de factor de escala utilizadas para HFR. El esquema emplea una o mas tablas de banda de factor de escala predeterminadas a partir de las cuales se obtienen las tablas maestras de bandas de factor de escala para HFR (p.ej., para SBR). Para esta finalidad, un conjunto de parametros se inserta en el flujo binario que se transmite desde el codificador de audio al decodificador de audio, con lo que se permite que el decodificador de audio determine la tabla maestra de bandas de factor de escala. La determinacion de la tabla maestra de bandas de factor de escala solamente en consiste en operaciones de busqueda en tablas, con lo que se proporciona un esquema eficiente, desde el punto de vista del calculo informatico, para determinar la tabla maestra de bandas de factor de escala. Ademas, el conjunto de parametros que se inserta en el flujo binario puede codificarse en una manera eficiente de tasa binaria.
Los metodos y sistemas descritos en el presente documento pueden ponerse en practica como software, firmware y/o hardware. Algunos componentes pueden, a modo de ejemplo, ponerse en practica como ejecucion de programas informaticos en un basado o microprocesador de senales digitales. Otros componentes pueden, a modo de ejemplo, ponerse en practica como hardware y/o como circuitos integrados espedficos de la aplicacion. Las senales encontradas en los metodos y sistemas descritos pueden memorizarse en soportes tales como soporte de memorizacion optica o memoria de acceso aleatorio. Pueden transferirse mediante redes, tales como redes de radio, redes via satelite, redes inalambricas o redes cableadas, p.ej., Internet. Los dispositivos tfpicos que hacen uso de los metodos y sistemas descritos en el presente documento son dispositivos electronicos portatiles u otros equipos de uso general que se utilizan para memorizar y/o presentar senales de audio.

Claims (17)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un sistema configurado para determinar una tabla maestra de bandas de factor de escala de una senal de banda alta (105) de una senal de audio, que ha de generarse a partir de una senal de banda baja (101) de la senal de audio, utilizando un esquema de reconstruccion de alta frecuencia; en donde la tabla maestra de bandas de factor de escala es indicativa de una resolucion de frecuencia de una envolvente espectral de la senal de banda alta (105); en donde el sistema esta configurado para
    - recibir un conjunto de parametros transmitidos desde un codificador de audio junto con un flujo binario de audio indicativo de la senal de banda baja de la senal de audio, incluyendo dicho conjunto de parametros un parametro de seleccion y uno o mas parametros de mdice;
    - memorizar una pluralidad de tablas de banda de factor de escala predeterminadas (200, 210) en una memoria del sistema con independencia del codificador de audio; en donde al menos una de las bandas de factor de escala (130) de las tablas de bandas de factor de escala predeterminadas (200, 210) comprende una pluralidad de bandas de frecuencia (220); y
    - determinar la tabla maestra de bandas de factor de escala seleccionando una particular de entre las tablas de bandas de factor de escala predeterminadas (200, 210) sobre la base del parametro de seleccion del conjunto de parametros recibido y seleccionando algunas o la totalidad de las bandas de factor de escala (130) de la tabla de bandas de factor de escala predeterminadas (200, 210) seleccionadas utilizando los uno o mas parametros de mdice del conjunto de parametros recibido, representando los uno o mas parametros de mdice a indices en la tabla de bandas de factor de escala predeterminada (200, 210) seleccionada.
  2. 2. El sistema segun la reivindicacion 1, en donde la tabla maestra de bandas de factor de escala se determina truncando la tabla de bandas de factor de escala predeterminada seleccionada (200; 210) utilizando el conjunto de parametros.
  3. 3. El sistema segun cualquier reivindicacion anterior, en donde la tabla maestra de bandas de factor de escala comprende solamente bandas de factor de escala (130) obtenidas a partir de la tabla de banda de factor de escala predeterminada seleccionada (200; 210).
  4. 4. El sistema segun cualquier reivindicacion anterior, en donde
    - los uno o mas parametros de mdice del conjunto de parametros comprende un parametro de frecuencia inicial indicativo de la banda de factor de escala (130) de la tabla maestra de bandas de factor de escala que tiene la mas baja frecuencia de las bandas de factor de escala (130) de la tabla maestra de bandas de factor de escala; y
    - el sistema esta configurado para suprimir cero, una o mas bandas de factor de escala (130) en un lfmite inferior de frecuencia de la tabla de bandas de factor de escala predeterminada seleccionada (200, 210) para determinar la tabla maestra de bandas de factor de escala.
  5. 5. El sistema segun la reivindicacion 4, en donde el parametro de frecuencia inicial comprende un valor de 3 bits que toma valores comprendidos entre 0 y 7.
  6. 6. El sistema segun cualquiera de las reivindicaciones 4 a 5, en donde
    - el sistema esta configurado para suprimir un numero par de bandas de factor de escala (130) en el lfmite inferior de frecuencia de la tabla de bandas de factor de escala predeterminada seleccionada (200, 210); y
    - el numero par es el doble del parametro de frecuencia inicial.
  7. 7. El sistema segun cualquier reivindicacion anterior, en donde
    - los uno o mas parametros de mdice del conjunto de parametros comprende un parametro de frecuencia de parada indicativo de la banda de factor de escala (130) de la tabla maestra de bandas de factor de escala que tiene la mas alta frecuencia de las bandas de factor de escala (130) de la tabla maestra de bandas de factor de escala; y
    - el sistema esta configurado para suprimir cero, una o mas de las bandas de factor de escala (130) en un lfmite superior de la frecuencia de la tabla de bandas de factor de escala predeterminada seleccionada (200, 210) para determinar la tabla maestra de bandas de factor de escala, y
    de modo opcional, en donde el parametro de frecuencia de parada comprende un valor de 2 bits que asume valores comprendidos entre 0 y 3.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
  8. 8. El sistema segun la reivindicacion 7, en donde
    - el sistema esta configurado para suprimir un numero par de bandas de factor de escala (130) en el Ifmite superior de frecuencia de la tabla de bandas de factor de escala predeterminada seleccionada (200, 210); y
    - el numero par es el doble del parametro de frecuencia de parada.
  9. 9. El sistema segun cualquier reivindicacion anterior, en donde
    - el parametro de seleccion es un parametro de escala maestro indicativo de una de entre la pluralidad de tablas de bandas de factor de escala predeterminadas (200, 210), que ha de utilizarse para determinar la tabla maestra de bandas de factor de escala.
  10. 10. El sistema segun la reivindicacion 9, en donde
    - la pluralidad de tablas de bandas de factor de escala predeterminadas (200, 210) comprende una tabla de bandas de factor de escala de tasa binaria baja (200) y una tabla de bandas de factor de escala de tasa binaria alta (210); y
    - la tabla de bandas de factor de escala de tasa binaria baja (200) comprende una o mas bandas de factor de escala (130) a frecuencias mas bajas que cualquiera de las bandas de factor de escala (130) de la tabla de bandas de factor de escala de tasa binaria alta (210); y/o
    - la tabla de bandas de factor de escala de tasa binaria alta (210) comprende una o mas bandas de factor de escala (130) a frecuencias mas altas que cualquiera de las bandas de factor de escala de la tabla de bandas de factor de escala de tasa binaria baja (200), y
    de modo opcional, en donde el parametro de escala maestra comprende un valor de 1 bit que asume valores entre 0 y 1, para distinguir entre la tabla de bandas de factor de escala de tasa binaria baja (200) y la tabla de bandas de factor de escala de tasa binaria alta (210).
  11. 11. El sistema segun la reivindicacion 10, en donde
    - la tabla de bandas de factor de escala de tasa binaria baja (200) comprende una o mas de las bandas de factor de escala (130) que vanan desde una primera banda de frecuencia baja (201) a una primera banda de frecuencia alta (202); y
    - la tabla de bandas de factor de escala de tasa binaria alta (210) comprende una o mas bandas de factor de escala (130) que vanan desde una segunda banda de baja frecuencia (211) a una segunda banda de frecuencia alta (212); y
    - la primera banda de frecuencia baja (201) esta a una frecuencia inferior que la segunda banda de frecuencia baja (211); y/o
    - la segunda banda de alta frecuencia (212) esta a una frecuencia superior que la primera banda de frecuencia alta (202).
  12. 12. El sistema segun cualquiera de las reivindicaciones 10 a 11, en donde un numero de bandas de factor de escala (130) comprendido dentro de la tabla de bandas de factor de escala de tasa binaria alta (210) es superior a un numero de bandas de factor de escala comprendido dentro de la tabla de bandas de factor de escala de tasa binaria baja (200).
  13. 13. El sistema segun cualquiera de las reivindicaciones 10 a 12, en donde las bandas de frecuencia (220) corresponden a bandas de frecuencia generadas por un banco de filtros de 64 canales; y en donde las bandas de frecuencia vanan desde el mdice de banda 0 al mdice de banda 63, y
    de modo opcional, en donde la tabla de banda de factores de escala de tasa binaria baja (200) comprende algunas o la totalidad de las bandas siguientes
    bandas de factor de escala (130) desde la banda de comprendiendo cada una, una sola banda de frecuencia;
    frecuencia 10 hasta la banda de frecuencia 20
    bandas de factor de escala (130) desde la banda de comprendiendo cada una, dos bandas de frecuencia;
    frecuencia 20 hasta la banda de frecuencia 32
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    bandas de factor de escala (130) desde la banda de comprendiendo cada una, tres bandas de frecuencia; y/o
    frecuencia 32 hasta la banda de frecuencia 38
    bandas de factor de escala (130) desde la banda de comprendiendo cada, una cuatro bandas de frecuencia.
    frecuencia 38 hasta la banda de frecuencia 46
  14. 14. Una unidad de reconstruccion de alta frecuencia configurada para generar una senal de banda alta (105) de una senal de audio a partir de una senal de banda baja (101) de la senal de audio; en donde la unidad de reconstruccion de alta frecuencia
    - comprende el sistema segun cualquiera de las reivindicaciones 1 a 13, para determinar una tabla de bandas de factor de escala para la senal de banda alta (105); en donde la tabla de bandas de factor de escala comprende una pluralidad de bandas de factor de escala (130) que cubre una gama de frecuencias de banda alta;
    - esta configurada para transponer una o mas senales de sub-banda de banda baja obtenidas a partir de la senal de banda baja (101) para la gama de frecuencias de banda alta, con el fin de proporcionar senales de sub- banda transpuestas;
    - esta configurada para recibir una pluralidad de factores de escala para la pluralidad de bandas de factor de escala (130), respectivamente; y
    - esta configurada para poner a escala las senales de sub-banda transpuestas, de conformidad con la pluralidad de bandas de factor de escala (130), utilizando la pluralidad de factores de escala, para obtener senales de sub- banda escaladas; en donde las senales de sub-banda escaladas son indicativas de la senal de banda alta (105).
  15. 15. La unidad de reconstruccion de alta frecuencia segun la reivindicacion 14, que comprende, ademas
    - un banco de filtros de analisis configurado para determinar las una o mas senales de sub-banda de banda baja a partir de la senal de banda baja (101); y
    - un banco de filtros de smtesis configurado para determinar la senal de banda alta (105) a partir de las senales de sub-banda escaladas.
  16. 16. Un decodificador de audio configurado para determinar una senal de audio reconstruida a partir de un flujo binario; en donde el decodificador de audio comprende:
    - un decodificador nucleo configurado para determinar una senal de banda baja (101) de la senal de audio reconstruida decodificando una parte del flujo binario; y
    - una unidad de reconstruccion de frecuencia alta segun cualquiera de las reivindicaciones 14 a 15, configurada para determinar una senal de banda alta (105) de la senal de audio reconstruida utilizando un conjunto de parametros incluidos dentro de otra parte del flujo binario.
  17. 17. Un metodo (400) para determinar una tabla maestra de bandas de factor de escala para una senal de banda alta (105) de una senal de audio, que ha de generarse a partir de una senal de banda baja (101) de la senal de audio, utilizando un esquema de reconstruccion de frecuencia alta; en donde la tabla maestra de bandas de factor de escala es indicativa de una resolucion de frecuencia de una envolvente espectral de la senal de banda alta (105); en donde el metodo (400) comprende
    - recibir (401) un conjunto de parametros transmitido a partir de un codificador de audio junto con un flujo binario de audio indicativo de la senal de banda baja de la senal de audio, incluyendo el conjunto de parametros un parametro de seleccion y uno o mas parametros de mdice;
    - memorizar (402) una pluralidad de tablas de banda de factor de escala predeterminadas (200, 210) en una memoria con independencia del codificador de audio; en donde al menos una de las bandas de factor de escala (130) de las tablas de banda de factor de escala predeterminadas (200, 210) comprende una pluralidad de bandas de frecuencia (220); y
    - determinar (403) la tabla maestra de bandas de factor de escala seleccionando una tabla particular de entre las tablas de banda de factor de escala predeterminadas (200, 210) sobre la base del parametro de seleccion del conjunto de parametros recibido y seleccionando algunas o la totalidad de las bandas de factor de escala (130) de la tabla de bandas de factor de escala predeterminada seleccionada (200, 210) utilizando los uno o mas parametros de mdice del conjunto de parametros, representando los uno o mas parametros de mdice a indices en la tabla de bandas de factor de escala predeterminada seleccionada (200, 210).
ES14752293.2T 2013-08-29 2014-08-11 Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia Active ES2634196T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361871575P 2013-08-29 2013-08-29
US201361871575P 2013-08-29
PCT/EP2014/067168 WO2015028297A1 (en) 2013-08-29 2014-08-11 Frequency band table design for high frequency reconstruction algorithms

Publications (1)

Publication Number Publication Date
ES2634196T3 true ES2634196T3 (es) 2017-09-27

Family

ID=51355520

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14752293.2T Active ES2634196T3 (es) 2013-08-29 2014-08-11 Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia

Country Status (24)

Country Link
US (1) US9842594B2 (es)
EP (1) EP3008727B1 (es)
JP (1) JP6392873B2 (es)
KR (1) KR101786863B1 (es)
CN (1) CN105556602B (es)
AR (1) AR097454A1 (es)
AU (1) AU2014314477B2 (es)
BR (1) BR112016004157B1 (es)
CA (1) CA2920816C (es)
CL (1) CL2016000475A1 (es)
DK (1) DK3008727T3 (es)
ES (1) ES2634196T3 (es)
HK (1) HK1219557A1 (es)
HU (1) HUE033077T2 (es)
IL (1) IL243961B (es)
ME (1) ME02812B (es)
MX (1) MX355259B (es)
MY (1) MY183529A (es)
PL (1) PL3008727T3 (es)
RU (1) RU2650031C2 (es)
SG (1) SG11201600830UA (es)
TW (1) TWI557726B (es)
UA (1) UA116572C2 (es)
WO (1) WO2015028297A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493666B2 (en) * 1998-09-29 2002-12-10 William M. Wiese, Jr. System and method for processing data from and for multiple channels
SE9903552D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6912424B2 (en) * 1999-12-01 2005-06-28 Meagan, Medical, Inc. Apparatus and method for coupling therapeutic and/or monitoring equipment to a patient
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
JP4390803B2 (ja) * 2003-05-01 2009-12-24 ノキア コーポレイション 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2005043511A1 (en) * 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
NZ562190A (en) * 2005-04-01 2010-06-25 Qualcomm Inc Systems, methods, and apparatus for highband burst suppression
PT1875463T (pt) * 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP5065687B2 (ja) * 2007-01-09 2012-11-07 株式会社東芝 オーディオデータ処理装置及び端末装置
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
CN101836253B (zh) * 2008-07-11 2012-06-13 弗劳恩霍夫应用研究促进协会 一种使用频谱倾斜控制成帧技术来计算带宽扩展数据的装置及方法
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
JP5555707B2 (ja) * 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
MX2012006823A (es) * 2009-12-16 2012-07-23 Dolby Int Ab Mezcla descendente de parametros de corriente de bits sbr.
JP5588025B2 (ja) * 2010-03-09 2014-09-10 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. パッチ境界整合を用いてオーディオ信号を処理するための装置および方法
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR102159194B1 (ko) * 2010-07-19 2020-09-23 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals

Also Published As

Publication number Publication date
EP3008727A1 (en) 2016-04-20
JP6392873B2 (ja) 2018-09-19
IL243961A0 (en) 2016-04-21
PL3008727T3 (pl) 2017-10-31
MX2016002421A (es) 2016-06-10
BR112016004157B1 (pt) 2022-05-17
AU2014314477A1 (en) 2016-02-25
KR101786863B1 (ko) 2017-10-18
MY183529A (en) 2021-02-24
DK3008727T3 (en) 2017-08-28
AR097454A1 (es) 2016-03-16
BR112016004157A2 (es) 2017-08-01
US9842594B2 (en) 2017-12-12
EP3008727B1 (en) 2017-06-14
ME02812B (me) 2018-01-20
HUE033077T2 (en) 2017-11-28
HK1219557A1 (zh) 2017-04-07
KR20160036670A (ko) 2016-04-04
RU2016111311A (ru) 2017-10-04
CA2920816C (en) 2018-04-17
IL243961B (en) 2020-04-30
TWI557726B (zh) 2016-11-11
MX355259B (es) 2018-04-11
TW201521014A (zh) 2015-06-01
CN105556602B (zh) 2019-10-01
CL2016000475A1 (es) 2016-09-23
UA116572C2 (uk) 2018-04-10
US20160210970A1 (en) 2016-07-21
CA2920816A1 (en) 2015-03-05
CN105556602A (zh) 2016-05-04
RU2650031C2 (ru) 2018-04-06
JP2016535870A (ja) 2016-11-17
AU2014314477B2 (en) 2016-11-24
SG11201600830UA (en) 2016-03-30
WO2015028297A1 (en) 2015-03-05

Similar Documents

Publication Publication Date Title
ES2899286T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
ES2604983T3 (es) Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio
TWI545560B (zh) 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法
ES2880883T3 (es) Codificador, decodificador y métodos para la adaptación dinámica compatible inversamente de resolución de tiempo/frecuencia en la codificación de objetos de audio espacial
CA2608030C (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
ES2238798T3 (es) Metodo para codificar y descodificar datos de tipo audio.
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible
EP1852851A1 (en) An enhanced audio encoding/decoding device and method
ES2540215T3 (es) Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
BRPI0520729B1 (pt) Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
JP4538324B2 (ja) 音声信号符号化
CN107633847B (zh) 语音音响编码装置和语音音响编码方法
JP2022548038A (ja) 空間オーディオパラメータ符号化および関連する復号化の決定
KR102196390B1 (ko) 채널 간 위상차 파라미터 추출 방법 및 장치
ES2545623T3 (es) Compartición adaptativa de la velocidad de ganancia-forma
ES2634196T3 (es) Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia
CN104751850B (zh) 一种用于音频信号的矢量量化编解码方法及装置
UA126393C2 (uk) Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
ES2707337T3 (es) Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
CN105336334B (zh) 多声道声音信号编码方法、解码方法及装置