ES2340111T3 - Procesamiento de audio para equipo audiovisual. - Google Patents

Procesamiento de audio para equipo audiovisual. Download PDF

Info

Publication number
ES2340111T3
ES2340111T3 ES98106710T ES98106710T ES2340111T3 ES 2340111 T3 ES2340111 T3 ES 2340111T3 ES 98106710 T ES98106710 T ES 98106710T ES 98106710 T ES98106710 T ES 98106710T ES 2340111 T3 ES2340111 T3 ES 2340111T3
Authority
ES
Spain
Prior art keywords
audio
data
continuous
video
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES98106710T
Other languages
English (en)
Inventor
Takashi Katayama
Tsukuru Ishito
Masahiro Sueyoshi
Masaharu Matsumoto
Kazutaka Abe
Shuji Miyasaka
Tsuyoshi Nakamura
Takeshi Fujita
Eiji Otomura
Akihisa Kawamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP9239968A external-priority patent/JPH1188994A/ja
Priority claimed from JP02302398A external-priority patent/JP3986147B2/ja
Application filed by Panasonic Corp filed Critical Panasonic Corp
Application granted granted Critical
Publication of ES2340111T3 publication Critical patent/ES2340111T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals

Abstract

SE SUMINISTRA UN APARATO DE DECODIFICACION DE AUDIO PARA RECIBIR UNA CORRIENTE DE BITS EN BASE BLOQUE A BLOQUE, DECODIFICANDO UN BLOQUE DE LA CORRIENTE DE BITS PARA FORMAR DATOS DE AUDIO DECODIFICADOS PARA UNA PLURALIDAD DE CANALES, Y ALMACENANDO LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES EN EL DISPOSITIVO DE MEMORIA, MEZCLANDO DE DICHA FORMA EN SU SALIDA LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES. EL APARATO DE DECODIFICACION DE AUDIO INCLUYE UNA SECCION DE OPERACION PARA MEZCLAR A LA SALIDA LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES CORRESPONDIENTES AL PRIMER BLOQUE DE LA CORRIENTE DE BITS EN LA SECCION DE MEMORIA MIENTRAS QUE SE DECODIFICA UN SEGUNDO BLOQUE DE LA CORRIENTE DE BITS.

Description

Procesamiento de audio para equipo audiovisual.
1. Campo de la invención
La presente invención se refiere a un aparato de decodificación de audio usado en equipos AV (audiovisuales) para decodificar en datos PCM un flujo continuo de bits codificados. La presente invención se refiere también a un dispositivo de procesamiento de señales, un dispositivo de localización de imágenes sonoras, un método de control de imágenes sonoras, un dispositivo de procesamiento de señales de audio, y un método de reproducción de alta velocidad de señales de audio usados también en equipos AV.
\vskip1.000000\baselineskip
2. Descripción de la técnica relacionada
Se describirá un aparato convencional 550 de decodificación de audio haciendo referencia a las Figuras 6, 7 y 8. La Figura 6 es un diagrama de bloques que ilustra una estructura del aparato convencional 550 de decodificación de audio. El aparato 550 de decodificación de audio incluye un dispositivo semiconductor integrado 508. El dispositivo semiconductor integrado 508 incluye un analizador 501 de sintaxis de flujos continuos de bits de entrada, un decodificador 502 de secciones exponenciales, un asignador 503 de bits de datos de mantisa, un decodificador 504 de secciones de mantisa, un IMDCT 505, un operador 506 de mezcla descendente, y un dispositivo 507 de memoria interna. El dispositivo semiconductor integrado 508 intercambia datos con un dispositivo 500 de memoria
externa.
En primer lugar un flujo continuo de bits se almacena en el dispositivo 500 de memoria externa y a continuación se introduce en el analizador 501 de sintaxis de flujos continuos de bits de entrada. El analizador 501 de sintaxis de flujos continuos de bits de entrada analiza la sintaxis del flujo continuo de bits y extrae datos requeridos para su decodificación. Dichos datos se envían al decodificador 502 de secciones exponenciales. El decodificador 502 de secciones exponenciales forma datos exponenciales para un dominio de frecuencia a partir de los datos requeridos para la decodificación, y da salida a los datos exponenciales hacia el asignador 503 de bits de datos de mantisa y el IMDCT 505. El asignador 503 de bits de datos de mantisa calcula una magnitud de asignación de bits de datos de mantisa a partir de los datos exponenciales para el dominio de frecuencia y los datos almacenados en el dispositivo 500 de memoria externa, y da salida a la magnitud de asignación de bits de datos de mantisa hacia el decodificador 504 de secciones de mantisa. El decodificador 504 de secciones de mantisa forma datos de mantisa para el dominio de la frecuencia a partir de la magnitud de asignación de bits de datos de mantisa y da salida a los datos de mantisa hacia el IMDCT (dispositivo de transformada de coseno discreta, modificada e inversa) 505. El IMDCT 505 forma datos de audio decodificados en un dominio del tiempo a partir de los datos exponenciales y los datos de mantisa para el dominio de la frecuencia, y almacena los datos de audio decodificados en el dispositivo 500 de memoria externa. El operador 506 de mezcla descendente forma datos PCM a partir de los datos de audio decodificados almacenados en el dispositivo 500 de memoria externa, realiza un entrelazado y a continuación almacena los datos resultantes en el dispositivo 500 de memoria externa. A continuación, a los datos PCM se les da salida desde el dispositivo 500 de memoria externa.
La Figura 7 es un mapa de memoria del aparato 550 de decodificación de audio mostrado en la Figura 6. El mapa de memoria mostrado en la Figura 7 incluye un área 600 para almacenar datos PCM de un bloque, un área 601 para almacenar datos de audio decodificados de un bloque para el canal 0, un área 602 para almacenar datos de audio decodificados de un bloque para el canal 1, un área 603 para almacenar datos de audio decodificados de un bloque para el canal 2, un área 604 para almacenar datos de audio decodificados de un bloque para el canal 3, un área 605 para almacenar datos de audio decodificados de un bloque para el canal 4, y un área 606 para almacenar datos de audio decodificados de un bloque para el canal 5.
La Figura 8 es un diagrama de flujo que ilustra un método para decodificar datos de audio codificados de un bloque para cada canal.
En la etapa S11, se inicializan un registro (no mostrado), el dispositivo 507 de memoria interna (Figura 6), y un dispositivo 500 de memoria externa. En la etapa S12, el flujo continuo de bits almacenado en el dispositivo 500 de memoria externa se introduce en el dispositivo semiconductor integrado 508 (recepción de datos codificados).
A continuación, en la etapa S13, se analiza la sintaxis del flujo continuo de bits, y se extraen datos requeridos para la decodificación (análisis de flujos continuos de bits). En la etapa S14, se forman datos exponenciales para un dominio de frecuencia usando los datos extraídos. En la etapa S15, se calcula una magnitud de asignación de bits de datos de mantisa usando los datos exponenciales para el dominio de frecuencia. En la etapa S16, se forman datos de mantisa para el dominio de frecuencia usando la magnitud de asignación de bits de datos de mantisa. En la etapa S17, se forman datos de audio decodificados usando los datos de mantisa para el dominio de frecuencia y los datos exponenciales para el dominio de frecuencia. En la etapa S18, los datos de audio decodificados resultantes se almacenan en el dispositivo 500 de memoria externa.
\newpage
Las etapas descritas anteriormente se realizan para el número de canal incluido en un bloque hasta que, en la etapa S19, se confirma que las etapas se repiten las veces requeridas. Como consecuencia, se forma el número de segmentos de datos de audio decodificados correspondiente al número de canales incluidos en un bloque, y el mismo se almacena en el dispositivo 500 de memoria externa.
En la etapa S20, datos de audio decodificados de un bloque para cada canal en el dispositivo 500 de memoria externa se introducen en el dispositivo semiconductor integrado 508. En la etapa S21, los datos de audio decodificados de un bloque para cada canal se convierten en datos PCM de un bloque (cálculo de mezcla descendente). En la etapa S22, a los datos PCM de un bloque se les da salida hacia el dispositivo 500 de memoria externa.
En el decodificador convencional 600 de audio, se calculan datos PCM de un bloque en un cálculo de mezcla descendente. Por consiguiente, la cantidad de datos transferidos para introducir los datos de audio decodificados en el dispositivo 500 de memoria externa antes del cálculo de mezcla descendente y para escribir los datos PCM en el dispositivo 500 de memoria externa después del cálculo de mezcla descendente es suficientemente grande como para ocupar una parte significativa del bus de memoria. Dicha ocupación tiene un efecto negativo sobre otros procesamientos realizados por el dispositivo 500 de memoria externa.
Se describirá un dispositivo convencional de procesamiento de señales. Una parte de los datos codificados de una pluralidad de canales puede ser compartida en común por los canales. Por ejemplo, datos codificados de la banda de alta frecuencia que estén incluidos en por lo menos uno de la pluralidad de canales y compartidos por la pluralidad de canales se decodifican para formar datos decodificados de la banda de alta frecuencia. Datos codificados de la banda de baja frecuencia para cada canal se decodifican para formar datos decodificados de la banda de baja frecuencia. Los datos decodificados de la banda de baja frecuencia se acoplan a los datos decodificados de la banda de alta frecuencia para formar datos decodificados para cada canal.
Dicha decodificación se describirá haciendo referencia a las Figuras 19, 20 y 21.
La Figura 20 es un diagrama de bloques de un procesador convencional 1350 de señales para realizar la decodificación de señales antes descrita. Tal como se muestra en la Figura 20, el flujo continuo de bits se almacena temporalmente en un dispositivo 1301 de memoria interna, y es analizado por un analizador 1300 de sintaxis de flujos continuos de bits. De este modo, se extraen datos requeridos. Se forman datos exponenciales para un dominio de frecuencia por medio de un decodificador 1302 de secciones exponenciales basándose en los datos extraídos. Por medio de un asignador 1303 de bits de datos de mantisa, basándose en los datos exponenciales para el dominio de frecuencia, se determina una magnitud de asignación de bits de datos de mantisa. Por medio de un decodificador 1304 de secciones de mantisa, basándose en la magnitud de asignación de bits de datos de mantisa, se forman datos de mantisa. Por medio de un dispositivo 1305 de formación de datos de dominio de frecuencia, basándose en los datos formados por el decodificador 1302 de secciones exponenciales y el decodificador 1304 de secciones de mantisa, se forman datos del dominio de la frecuencia.
El dispositivo 1305 de formación de datos del dominio de la frecuencia decodifica datos codificados, para un canal arbitrario, según la siguiente regla. Los datos codificados de alta frecuencia que están incluidos en por lo menos uno de una pluralidad de canales y compartidos por la pluralidad de canales se decodifican para obtener datos decodificados de la banda de alta frecuencia, y los datos decodificados de la banda de alta frecuencia se multiplican por la relación de la potencia de la señal de un canal preestablecido obtenido por un codificador con respecto a la potencia de la señal de un canal arbitrario. El resultado se acopla a los datos decodificados de baja frecuencia para un canal arbitrario. De este modo, se obtienen datos decodificados para el canal arbitrario.
Los datos decodificados del dominio de la frecuencia obtenidos se convierten en datos decodificados del dominio del tiempo por medio de un conversor 1306 de dominio de frecuencia-dominio de tiempo, y el resultado se convierte en datos PCM, a los cuales se les da salida.
La Figura 21 muestra esquemáticamente la decodificación de datos codificados, para un canal arbitrario.
En la etapa 141, se decodifican datos en un canal preestablecido 1400 para formar un área 1402 de datos decodificados del dominio de baja frecuencia y un área 1403 de datos decodificados de la banda de alta frecuencia, que es compartida por una pluralidad de canales. En la etapa 142, el área 1403 de datos decodificados de la banda de alta frecuencia se multiplica por una relación \alpha de una potencia de la señal para el canal preestablecido 1400 obtenido por el codificador con respecto a los datos decodificados 1404 de la banda de alta frecuencia para un canal arbitrario 1401, formando de este modo datos decodificados 1404 de alta frecuencia para el canal arbitrario 1401. En la etapa 143, datos decodificados 1405 de la banda de baja frecuencia para el canal arbitrario 1401 se acoplan a los datos decodificados 1404 de la banda de alta frecuencia para formar datos decodificados para el canal
1401.
Al usar datos codificados de la banda de alta frecuencia que son compartidos por una pluralidad de canales, no es necesario transferir los datos codificados de la banda de alta frecuencia para cada uno de los canales. De este modo, se mejora la eficacia de la transferencia.
\newpage
Para realizar dicha decodificación, se señala un flujo continuo de bits almacenado en el dispositivo 1301 de memoria interna (Figura 20) mediante una pluralidad de punteros mientras se extraen datos requeridos a partir del flujo de bits. Dicha realización se describirá haciendo referencia a la Figura 19.
Se decodifica el canal preestablecido 1400. A continuación, una sección 1201 de mantisa y una sección exponencial 1202 de datos codificados de la banda de baja frecuencia para el canal arbitrario 1401 incluidos en un flujo continuo 1200 de bits son señaladas por punteros respectivos 1203 y 1204 y, por lo tanto, son leídas para decodificar los datos codificados de baja frecuencia. Una sección 1201 de mantisa y una sección exponencial 1202 de datos codificados de la banda de alta frecuencia para el canal preestablecido 1400 son señaladas por punteros respectivos 1203 y 1204 y, por lo tanto, son leídas para decodificar los datos codificados de alta frecuencia.
Por consiguiente, es necesario controlar el movimiento de los punteros 1203 y 1204 para rebobinar según se indica mediante las flechas 1205 y 1206. Además, es necesario almacenar el flujo continuo de bits en el dispositivo de memoria hasta que se decodifiquen datos de todos los canales que comparten los datos codificados de la banda de alta frecuencia. La decodificación de datos de todos los canales que comparten los datos codificados de la banda de alta frecuencia requiere una capacidad de memoria suficientemente grande para almacenar el flujo continuo de
bits.
Por otra parte, se demanda que la decodificación de los datos codificados de la banda de alta frecuencia, que impone una carga mayor que la decodificación de datos habituales codificados de la banda de baja frecuencia, reduzca la
carga.
En los campos de las películas y la radiodifusión, se realizan una grabación y una reproducción multicanal (por ejemplo, 5.1 canales) usando una tecnología de compresión de audio digital. No obstante, la reproducción de una señal de audio multicanal en el hogar está limitada, ya que la mayoría de los televisores generales de uso doméstico tienen dos o menos canales de salida. Se ha demandado observar que la reproducción multicanal se obtenga incluso mediante equipos AV que tengan una función de reproducción de dos o menos audios, usando tecnologías de control de campos sonoros o de control de imágenes sonoras.
Recientemente, como tecnología de compresión de audio se ha usado frecuentemente una tecnología de conversión del dominio de la frecuencia tal como, por ejemplo, MDCT. En el presente caso, se describirá una tecnología convencional de control de imágenes sonoras así como una tecnología de compresión de audio que usa una conversión del dominio de la frecuencia - dominio del tiempo.
La Figura 23 es un diagrama de bloques que muestra una estructura básica de un dispositivo convencional de localización de imágenes sonoras (reproductor de imágenes sonoras) 2500. En primer lugar, se describirá un método de localización de una imagen sonora a la derecha y delante de un oyente 2010 usando altavoces 2008-1 y 2008-2. Los altavoces 2008-1 y 2008-2 están situados delante con respecto al oyente 2010. Tal como se muestra en la Figura 23, el dispositivo 2500 de localización de imágenes sonoras incluye una fuente 2004 de señales, un divisor 2006 de señales, procesadores 2001-1 y 2001-2 de señales, conversores D/A 2007-1 y 2007-2, y altavoces 2008-1 y 2008-2 de
control.
La fuente 2004 de señales recibe una señal de audio PCM S(t). El divisor 2006 de señales distribuye la señal de audio S(t) hacia los canales izquierdo (L) y derecho (R). El procesador 2001-1 de señales es un filtro digital que tiene una característica de transmisión hL(n), y el procesador 2001-2 de señales es un filtro digital que tiene una característica de transmisión hR(n). Una salida digital del procesador 2001-1 de señales es convertida en una señal analógica por el conversor D/A 2007-1 y enviada hacia el altavoz 2008-1 de control dispuesto a la izquierda de la hoja de la Figura 23. Una salida digital del procesador 2001-2 de señales es convertida en una señal analógica por el conversor D/A 2007-2 y enviada hacia el altavoz 2008-2 de control dispuesto a la derecha de la hoja de la Figura 23.
La Figura 24 es un diagrama de bloques del procesador 2001-1 de señales. El procesador 2001-2 de señales tiene la misma estructura. El procesador 2001-1 de señales es un filtro FIR que incluye n segmentos de circuitos 2011-1 a 2011-n de retardo, n+1 segmentos de multiplicadores 2012-1 a 2012-(n+1), y un sumador 2013. Los multiplicadores 2012-1 a 2012-(n+1) están conectados a entradas y salidas de los circuitos 2011-1 a 2011-n de retardo, y las salidas de los multiplicadores 2012-1 a 2012-(n+1) se suman entre sí por medio del sumador 2013 y son llevadas a la
salida.
Haciendo referencia a las Figuras 23 y 24, el dispositivo convencional 2500 de localización de imágenes sonoras funciona de la siguiente manera. En la Figura 23, a la función de transferencia entre el altavoz 2008-1 y el oído del oyente 2010 se le hace referencia como "respuesta impulsional", y el valor de la respuesta impulsional entre el altavoz 2008-1 y el oído izquierdo del oyente 2010 es h1(t). A continuación, se describirá el funcionamiento en el dominio del tiempo usando la respuesta impulsional. La respuesta impulsional h1(t) es, de forma más precisa, una respuesta en la posición del tímpano izquierdo del oyente 2010 provocada cuando se introduce una señal de audio en el altavoz 2008-1. Por simplicidad, la medición se realiza siempre en la entrada de la glándula ceruminosa. Se obtiene el mismo efecto cuando se considera con respecto al dominio de la frecuencia.
El valor de la respuesta impulsional entre el altavoz 2008-1 y el oído derecho del oyente 2010 es h2(t). El valor de la respuesta impulsional entre el altavoz 2008-2 y el oído izquierdo del oyente 2010 es h3(t). El valor de la respuesta impulsional entre el altavoz 2008-2 y el oído derecho del oyente 2010 es h4(t). Un altavoz 2009 se considera como una fuente de sonido virtual posicionada a la derecha y delante del oyente 2010. El valor de la respuesta impulsional entre el altavoz virtual 2009 y el oído izquierdo del oyente 2010 es h5(t). El valor de la respuesta impulsional entre el altavoz virtual 2009 y el oído derecho del oyente 2010 es h6(t).
En una estructura de este tipo, cuando se da salida a una señal de audio S(t) de la fuente 2004 de señales desde el altavoz virtual 2009, el sonido que llega al oído izquierdo del oyente 2010 se expresa mediante la expresión (1), y el sonido que llega al oído derecho del oyente 2010 se expresa mediante la expresión (2).
L(t) = S(t)*h5(t)
... (1)
R(t) = S(t)*h6(t)
... (2)
En las expresiones (1) y (2), el símbolo "*" representa una operación de convolución. En realidad, la función de transferencia del altavoz y otras similares se multiplican, pero en este caso estos elementos se ignoran. Alternativamente, la función de transferencia del altavoz y otras similares se pueden considerar incluidas en h5(t) y
h6(t).
Las respuestas impulsionales y las señales S(t) se considera que son señales digitales discretas y se expresan respectivamente como:
\quad
L(t)\rightarrow L(n)
\quad
R(t)\rightarrow R(n)
\quad
h5(t)\rightarrow h5(n)
\quad
h6(t)\rightarrow h6(n)
\quad
S(t)\rightarrow S(n)
En las representaciones anteriores, la letra "n" indica un entero. Cuando T es un tiempo de muestreo, "n" en paréntesis se expresa de forma más precisa como nT. En este caso, se omite "T".
Las expresiones (1) y (2) se expresan respectivamente como la expresión (3) y (4), y el símbolo "*" que representa la operación de convolución se sustituye por "x", que representa la multiplicación.
L(n) = S(n)xh5(n)
... (3)
R(n) = S(n)xh6(n)
... (4)
La señal S(t), que se obtiene a la salida de los altavoces 2008-1 y 2008-2 y llega al oído izquierdo del oyente 2010, se expresa con la expresión (5).
\quad
L'(t) = S(t)*hL(t)*h1(t)
+\ S(t)*hR(t)*h3(t)
... (5)
La señal S(t), que se obtiene a la salida de los altavoces 2008-1 y 2008-2 y llega al oído derecho del oyente 2010, se expresa mediante la expresión (6).
\quad
R'(t) = S(t)*hL(t)*h2(t)
+\ S(t)*hR(t)*h4(t)
... (6)
Las expresiones (5) y (6) se expresan como las expresiones (8) y (9) usando la respuesta impulsional.
\quad
L'(n) = S(n)xhL(n)xh1(n)
+\ S(n)xhR(n)xh3(n)
... (8)
\vskip1.000000\baselineskip
\quad
R'(n) = S(n)xhL(n)xh2(n)
+\ S(n)xhR(n)xh4(n)
... (9)
En este caso, hL(n) representa la característica de transmisión del procesador 2001-1 de señales, y hR(n) representa la característica de transmisión del procesador 2001-2 de señales.
\newpage
\global\parskip0.980000\baselineskip
La siguiente descripción se realiza con la premisa de que cuando la función de transferencia entre el oído y el altavoz es la misma, al sonido se le da salida en la misma dirección. En general, esta premisa es correcta. Cuando se considera la expresión (10), se genera la expresión (11).
L(n) = L'(n)
... (10)
h5(n) = hL(n)xh1(n)+hR(n)xh3(n)
... (11)
De modo similar, cuando se considera la expresión (12), se genera la expresión (13).
R(n) = R'(n)
... (12)
h6(n) = hL(n)xh2(n)+hR(n)xh4(n)
... (13)
Para que el oyente 2010 pueda oír el sonido preestablecido desde la derecha y delante del oyente 2010 en donde se considera que existe el altavoz virtual 2009, los valores de hL(n) y hR(n) se determinan de manera que cumplan las expresiones (11) y (13). Por ejemplo, cuando las expresiones (11) y (13) se expresan mediante la representación del dominio de la frecuencia, la operación de convolución se sustituye por la multiplicación, y los otros elementos se sustituyen por funciones de transferencia obtenidas mediante la aplicación de la FFT de los valores de respuestas impulsionales. Como la función de transferencia no es la del filtro FIR, la función de transferencia del filtro FIR se obtiene mediante estas dos expresiones.
En el caso en el que a una señal S(n) y a la hL(n) convolucionada se les dé salida desde el altavoz 2008-1 y a una señal S(n) y a la hR(n) convolucionada se les dé salida desde el altavoz 2008-2 usando hL(n) y hR(n) determinadas de esta manera, el oyente 2010 percibe el sonido como saliendo desde la derecha y delante en la zona en la que se supone que existe el altavoz virtual 2009. La Figura 24 muestra una estructura de un filtro FIR. El filtro FIR mostrado en la Figura 24 localiza una imagen sonora en una posición arbitraria por medio del procesamiento de señales antes descrito.
No obstante, la estructura descrita anteriormente requiere proporcionar un filtro FIR para cada uno de los canales y la realización de una operación de convolución numerosas veces, con el fin de proporcionar una función de transferencia real con respecto a la cabeza. Cuando aumentan el número de filtros y/o el número de canales, la carga impuesta sobre la frecuencia de funcionamiento y el hardware resulta excesivamente elevada para un uso práctico. El número de tomas de los filtros FIR se puede reducir para un uso práctico, aunque es necesario un cierto número de tomas para mantener la precisión de la función de transferencia con respecto a la cabeza. Cuando el número de tomas es excesivamente pequeño, la imagen sonora es borrosa o la calidad del sonido se deteriora.
Sistema para reproducir un soporte que incluye datos de vídeo y datos de audio en un formato comprimido, tal como un DVD (disco de vídeo digital). En un sistema de este tipo, los datos de entrada de vídeo y de audio se dividen en una pluralidad de paquetes y a continuación se multiplexan. El vídeo y el audio se reproducen separando los datos de vídeo (a los que se hace referencia también como "señal de vídeo") y los datos de audio (a los que se hace referencia también como "señal de audio") a partir de dichos datos de entrada y decodificando dichos datos separados. Se describirá un sistema convencional usando un DVD como ejemplo.
Los datos de vídeo se comprimen mediante MPEG2 e incluyen tres tipos de datos de imágenes, es decir, imagen I, imagen P e imagen B. En la normativa NTSC, cada imagen se graba en la unidad de 1/60 segundos en el caso de una estructura de campo y en la unidad de 1/30 segundo en el caso de una estructura de cuadro.
Las normativas de audio ilustrativas usadas en el DVD incluyen AC-3 y MPEG-2BC. En dichas normativas, una trama incluye 1.536 muestras de audio, con la frecuencia de muestreo de 48 kHz. Los datos se graban en un DVD en el estado de compresión a la unidad de 32 ms.
Para reproducir datos de audio y vídeo que se graban con diferentes unidades de tiempo, se requiere una sincronización de los datos. En el caso de un DVD, los datos de vídeo y audio se sincronizan para darles salida bajo el control de una indicación de tiempo de programa (PTS) fijada a cada paquete. En otras palabras, el tiempo para reproducir los datos de vídeo y el tiempo para reproducir los datos de vídeo se ajustan de forma independiente.
Se describirá la reproducción de alta velocidad realizada en dicho sistema. En general, se usan los siguientes métodos para reproducir datos de vídeo a una velocidad elevada.
(1-1)
Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
(1-2)
Reproducir solamente las imágenes I y P (velocidad de reproducción: aproximadamente entre 1,5 y 3 veces la normal)
(1-3)
Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: aproximadamente entre 1 y 1,5 veces la normal).
\newpage
\global\parskip1.000000\baselineskip
Como el número de cada tipo de imágenes varía según el método de codificación, la velocidad de bits y similares, la velocidad de reproducción para la reproducción de alta velocidad no es constante y es posible que resulte tan diversa como desde aproximadamente 1,5 a aproximadamente 7 veces mediante cualquiera de los métodos (1-1), (1-2) ó (1-3).
Para reproducir datos de audio a una velocidad elevada se usan los siguientes métodos.
(2-1)
Rebajar datos de salida y alisar puntos no continuos.
(2-2)
Eliminar partes mudas.
Según el método (2-1), la velocidad de reproducción es fija. Por lo tanto, cuando la velocidad de reproducción de los datos de vídeo es mayor que la velocidad de reproducción de los datos de audio, el sonido continúa pero el vídeo no se puede reproducir a una velocidad mayor que la de los datos de audio. Cuando la velocidad de reproducción de los datos de vídeo es menor que la velocidad de reproducción de los datos de audio, el sonido no avanza.
El método (2-2) es difícil de usar en la práctica debido a los problemas de que resulta difícil elevar la velocidad de reproducción de los datos de audio hasta la velocidad de reproducción más alta de los datos de vídeo (velocidad máxima), y de que el procesamiento para detectar una parte muda requiere una carga elevada.
En general, la reproducción de alta velocidad de un soporte de grabación es usada principalmente por el consumidor para buscar una escena. En la mayoría de los DVDs que están disponibles convencionalmente, únicamente se reproducen los datos de vídeo para la reproducción de alta velocidad sin dar salida a datos de audio.
La solicitud de patente europea EP 0 681 398 A2 da a conocer un procesador de señales de audio que comprende: una sección de control para indicar una velocidad de reproducción; un procesador de señales de entrada para procesar una señal de entrada obtenida como resultado de multiplexar una señal de audio y una señal de vídeo y dar salida a una señal de audio y una señal de vídeo; una memoria intermedia de flujos continuos de audio para almacenar temporalmente la señal de audio obtenida a la salida del procesador de señales de entrada; una memoria intermedia de flujos continuos de vídeo para almacenar temporalmente la señal de vídeo obtenida a la salida del procesador de señales de entrada; un procesador de audio para extraer la señal de audio de la memoria intermedia de flujos continuos de audio y procesar la señal de audio con el fin de formar una señal de audio de salida; un procesador de vídeo para extraer la señal de vídeo de la memoria intermedia de flujos continuos de vídeo y procesar la señal de vídeo, y realizar la reproducción de alta velocidad de la señal de vídeo en respuesta a una instrucción de la sección de control para formar una señal de vídeo de salida; y un controlador de memoria intermedia para supervisar un estado de la memoria intermedia de flujos continuos de audio y la memoria intermedia de flujos continuos de vídeo y controlar la entrada y la salida de datos de manera que el procesador de audio realice la reproducción de alta velocidad de la señal de audio cuando una capacidad libre de la memoria intermedia de flujos continuos de audio o una cantidad de datos restantes en la memoria intermedia de flujos continuos de vídeo llegue a ser menor que un nivel preestablecido.
Sumario de la invención
La presente invención proporciona un procesador de señales de audio y un método de realización de una reproducción de alta velocidad de una señal de audio en un procesador de señales de audio según se describe en las reivindicaciones adjuntas independientes y subordinadas.
De este modo, la invención descrita en la presente memoria posibilita las ventajas de (1) proporcionar un aparato de decodificación de audio para realizar un uso eficaz de un bus de memoria; (2) proporcionar un dispositivo de procesamiento de señales para aliviar el procesamiento de decodificación de datos codificados que es compartido por todos los canales sin requerir un dispositivo de memoria para almacenar datos codificados para todos los canales hasta que se haya completado el procesamiento de decodificación; (3) proporcionar un dispositivo de localización de imágenes sonoras para proporcionar, mediante una cantidad menor de operaciones, un nivel similar de sensación de localización al obtenido cuando se usa un número mayor de tomas de filtros digitales, y un método para controlar la imagen sonora usando dicho dispositivo de localización de imágenes sonoras; y (4) un dispositivo de procesamiento de señales de audio para simplificar el procesamiento de las señales y reproducir datos de audio según la velocidad de reproducción de los datos de vídeo con una menor desconexión del sonido, y un método para realizar una reproducción de alta velocidad de datos de audio usando dicho dispositivo de procesamiento de señales de audio.
Estas y otras ventajas de la presente invención se pondrán de manifiesto para los expertos en la materia a partir de la descripción detallada siguiente haciendo referencia a las figuras adjuntas.
Breve descripción de los dibujos
La Figura 37 es un diagrama de bloques que ilustra una estructura de un dispositivo de procesamiento de señales de audio en un décimo ejemplo según la presente invención;
la Figura 38 es un diagrama de bloques que ilustra una estructura de un dispositivo de procesamiento de señales de audio en un undécimo ejemplo según la presente invención;
la Figura 39 es un diagrama de bloques que ilustra una estructura de un dispositivo de procesamiento de señales de audio en un duodécimo ejemplo según la presente invención;
la Figura 40 representa un método para eliminar una parte de un flujo continuo de audio en un dispositivo de procesamiento de señales de audio según la presente invención;
la Figura 41 representa otro método para eliminar una parte de un flujo continuo de audio en un dispositivo de procesamiento de señales de audio según la presente invención;
la Figura 42 representa todavía otro método para eliminar una parte de un flujo continuo de audio en un dispositivo de procesamiento de señales de audio según la presente invención;
la Figura 43 representa aún otro método para eliminar una parte de un flujo continuo de audio en un dispositivo de procesamiento de señales de audio según la presente invención;
la Figura 44 representa una cantidad de datos restantes en una memoria intermedia de flujos continuos de audio y una memoria intermedia de flujos continuos de vídeo en el dispositivo de procesamiento de señales de audio en los ejemplos décimo y duodécimo; y
la Figura 45 representa una cantidad de datos restantes en una memoria intermedia de flujos continuos de audio y una memoria intermedia de flujos continuos de vídeo en el dispositivo de procesamiento de señales de audio en los ejemplos undécimo y duodécimo.
\vskip1.000000\baselineskip
Descripción de las formas de realización preferidas
A continuación en la presente memoria se describirá la presente invención por medio de ejemplos ilustrativos haciendo referencia a los dibujos adjuntos.
\vskip1.000000\baselineskip
Ejemplo 10
Se describirá, haciendo referencia a la Figura 37, un dispositivo 3700 de procesamiento de señales de audio en un décimo ejemplo según la presente invención. La Figura 37 es un diagrama de bloques que ilustra el dispositivo 3700 de procesamiento de señales de audio en el décimo ejemplo. El dispositivo 3700 de procesamiento de señales de audio incluye un procesador 3002 de flujos continuos de entrada, una memoria intermedia 3003 de flujos continuos de audio, una memoria intermedia 3004 de flujos continuos de vídeo, un controlador 3005A de memorias intermedias, un controlador 3006, un procesador 3007 de audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se introducirá en el procesador 3002 de flujos continuos de entrada es datos de salida de un DVD o datos equivalentes. En otras palabras, el procesador 3002 de flujos continuos de entrada recibe una señal de vídeo o una señal de audio que está comprimida y multiplexada. En este ejemplo, el flujo continuo 3001 de entrada es una salida de flujo continuo de datos de un DVD, los datos de vídeo están en conformidad con el MPEG2 y los datos de audio están en conformidad con el AC-3 por razones de simplicidad. También se pueden usar otros tipos de flujo continuo de datos de una manera similar.
Cuando el flujo continuo 3001 de entrada se introduce en el procesador 3002 de flujos continuos de entrada, el procesador 3002 de flujos continuos de entrada extrae datos de vídeo y datos de audio a reproducir a partir del flujo continuo 3001 de entrada y almacena los datos de vídeo en la memoria intermedia 3004 de flujos continuos de vídeo y los datos de audio en la memoria intermedia 3003 de flujos continuos de audio. Llegado este momento, el controlador 3005A de memorias intermedias supervisa la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio.
En un estado de reproducción normal, cuando los datos de vídeo se introducen en el procesador 3008 de vídeo, el procesador 3008 de vídeo decodifica los datos de vídeo en una señal 3010 de vídeo de salida. Cuando los datos de audio se introducen en el procesador 3007 de audio, el procesador 3007 de audio decodifica y convierte los datos de audio en una señal 3009 de audio de salida.
En un estado de reproducción de alta velocidad, el procesador 3008 de vídeo sigue una instrucción del controlador 3006 para realizar una reproducción de alta velocidad a una velocidad preestablecida. Para realizar la reproducción de alta velocidad, el procesador 3007 de audio iguala la altura tonal del sonido con la del estado de reproducción normal y descarta una parte de los datos de audio. En el caso en el que los datos de vídeo se produzcan en conformidad con el MPEG2, la reproducción de alta velocidad a la velocidad preestablecida se realiza según una de las siguientes
reglas.
(1-1)
Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
(1-2)
Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
(1-3)
Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al (1-1), (1-2) y (1-3).
Durante la reproducción de alta velocidad, el controlador 3005A de memorias intermedias supervisa la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio. Se realiza una reproducción normal hasta que la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio se hace menor que un valor preestablecido W. Cuando la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio se hace menor que el valor preestablecido W, el controlador 3005A de memorias intermedias informa al procesador 3007 de audio sobre la capacidad libre restante. El valor preestablecido W se puede fijar a varios valores según el sistema. En este ejemplo, el valor preestablecido W se fija a 0. El control se realiza de una manera similar cuando el valor preestablecido W se fija a un valor diferente.
Cuando la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0, el procesador 3007 de audio realiza una reproducción de alta velocidad de los datos de audio eliminando una parte de los datos de audio de salida. Dicho comportamiento se describirá haciendo referencia a la Figura 44. La Figura 44 muestra los estados de la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo durante la reproducción. Una parte sombreada representa un área de datos, y una parte en blanco representa un área utilizable.
En el caso en el que los datos de vídeo se reproduzcan a una velocidad elevada y la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio no llegue a 0, la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo se encuentran en el estado 2 en la Figura 44. Como todavía quedan datos de vídeo en la memoria intermedia 3004 de flujos continuos de vídeo, solamente los datos de vídeo se reproducen a una alta velocidad mediante el procesador 3008 de vídeo. Como se introduce un flujo continuo de audio según la velocidad de reproducción de los datos de vídeo, la cantidad de los datos de audio a decodificar para reproducción normal es menor que la cantidad de datos de entrada. De este modo, la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0 (estado 1).
Cuando la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0, el controlador 3005A de memorias intermedias transporta dicha información hacia el procesador 3007 de audio. En respuesta, el procesador 3007 de audio descarta una cantidad preestablecida de los datos de audio mediante evacuación, y retoma la decodificación de los datos de audio a una velocidad normal a partir de la parte que viene inmediatamente después de la parte descartada de los datos de audio.
A continuación se describirán en la presente memoria la cantidad de datos preestablecida para descartar y métodos de descarte (es decir, eliminación).
(i) Borrado de la memoria intermedia de flujos continuos de audio (evacuación)
Los datos de la memoria intermedia 3003 de flujos continuos de audio se evacuan intermitentemente de forma parcial o total borrando la memoria intermedia 3003 de flujos continuos de audio para rebajar parcialmente el flujo continuo antes de la decodificación. De este modo, se reduce la cantidad de datos de audio a reproducir para la reproducción de alta velocidad. Una cantidad preestablecida de datos de audio a descartar es una cantidad arbitraria que es menor que el tamaño de la memoria intermedia 3003 de flujos continuos de audio en el sistema usado.
En la Figura 40 se muestran los datos de audio reproducidos de esta manera. La Figura 40 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B en la reproducción de alta velocidad obtenida cuando se borra la memoria intermedia 3003 de flujos continuos de audio. En el ejemplo mostrado en la Figura 40, se eliminan los datos desde una parte central de la trama 4 a una parte central de la trama 7 borrando la memoria intermedia 3003 de flujos continuos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual al flujo continuo de audio de salida 1A después de que se haya eliminado la sección A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, se puede producir un error no deseable del flujo continuo. Como el contenido de la memoria intermedia 3003 de flujos continuos de audio se elimina totalmente, no se puede dar salida a datos de audio hasta que se introduzcan los datos correspondientes a la siguiente trama.
(ii) Restricción del flujo continuo de audio de entrada
La transferencia del flujo continuo 3001 de entrada desde el procesador 3002 de entrada a la memoria intermedia 3003 de flujos continuos de audio se interrumpe durante un periodo de tiempo preestablecido. En otras palabras, una parte del flujo continuo 3001 de entrada se elimina mediante una no transferencia. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la transferencia, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 41 se muestran los datos de audio reproducidos de esta manera. La Figura 41 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la restricción de la transferencia del flujo continuo 3001 de entrada para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 41, los datos desde una parte central de la trama 4 a una parte central de la trama 7 se eliminan restringiendo la entrada del flujo continuo 3001 de entrada. Como consecuencia, el flujo continuo 1B de audio de salida a decodificar durante la reproducción de alta velocidad es igual al flujo continuo 1A de audio de salida después de que se haya eliminado la sección A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, puede producirse un error no deseable en el flujo continuo. Además, no se puede dar salida a datos de audio hasta que se introduzcan los datos para la siguiente trama.
(iii) Omisión del flujo continuo de audio de entrada
El procesador 3007 de audio omite de una a varias tramas de datos de audio basándose en un procesamiento trama a trama. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), cada vez que se omiten los datos es necesario descartar la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio reproducidos de esta manera. La Figura 42 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la omisión parcial de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 42, los datos desde la trama 4 a la trama 7 se eliminan omitiendo los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual al resultado de eliminar la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
(iv) Interrupción de la salida de los datos de audio
El procesador 3007 de audio interrumpe la salida de una a varias tramas de datos de audio. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Un valor mínimo de una cantidad preestablecida de datos de audio a descartar mediante la interrupción de la salida se determina por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la salida, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 43 se muestran los datos de audio reproducidos de esta manera. La Figura 43 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la interrupción de la salida de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 43, los datos desde la trama 4 a la trama 7 se eliminan interrumpiendo la salida de los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual al resultado obtenido mediante al eliminar la sección A del flujo continuo de audio de salida 1A después de la sección A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la reproducción de alta velocidad de datos de audio se realiza según la velocidad de reproducción de los datos de vídeo sin cambiar la velocidad de reproducción de los datos de vídeo mediante el descarte de una parte del flujo continuo de vídeo y audio por medio de uno de los métodos (i) a (iv) cada vez que la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0. Los métodos (i) a (iv) antes mencionados reducen la discontinuidad del sonido. Por consiguiente, un dispositivo de procesamiento de señales de audio en el décimo ejemplo reproduce datos de audio a una velocidad elevada según la velocidad de reproducción de los datos de vídeo, con menos discontinuidad del sonido y de una manera más sencilla.
\vskip1.000000\baselineskip
Ejemplo 11
Se describirá, haciendo referencia a las figuras, un dispositivo 3800 de procesamiento de señales de audio en un undécimo ejemplo según la presente invención. La Figura 38 es un diagrama de bloques que ilustra el dispositivo 3800 de procesamiento de señales de audio en el undécimo ejemplo. El dispositivo 3800 de procesamiento de señales de audio incluye un procesador 3002 de flujos continuos de entrada, una memoria intermedia 3003 de flujos continuos de audio, una memoria intermedia 3004 de flujos continuos de vídeo, un controlador 3005B de memorias intermedias, un controlador 3006, un procesador 3007 de audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se introducirá en el procesador 3002 de flujos continuos de entrada es datos de salida de un DVD o datos equivalentes. En otras palabras, el procesador 3002 de flujos continuos de entrada recibe una señal de vídeo o una señal de audio que está comprimida y multiplexada. También en este ejemplo, el flujo continuo 3001 de entrada es una salida de flujo continuo de datos de un DVD, los datos de vídeo están en conformidad con el MPEG2 y los datos de audio están en conformidad con el AC-3 por razones de simplicidad. También se pueden usar otros tipos de flujo continuo de datos de una manera similar.
Cuando el flujo continuo 3001 de entrada se introduce en el procesador 3002 de flujos continuos de entrada, el procesador 3002 de flujos continuos de entrada extrae datos de vídeo y datos de audio a reproducir a partir del flujo continuo 3001 de entrada y almacena los datos de vídeo en la memoria intermedia 3004 de flujos continuos de vídeo y los datos de audio en la memoria intermedia 3003 de flujos continuos de audio. Llegado este momento, el controlador 3005B de memorias intermedias supervisa la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo.
En un estado de reproducción normal, cuando los datos de vídeo se introducen en el procesador 3008 de vídeo, el procesador 3008 de vídeo decodifica los datos de vídeo en una señal 3010 de vídeo de salida. Cuando los datos de audio se introducen en el procesador 3007 de audio, el procesador 3007 de audio decodifica y convierte los datos de audio en una señal 3009 de audio de salida.
En un estado de reproducción de alta velocidad, el procesador 3008 de vídeo sigue una instrucción del controlador 3006 para realizar una reproducción de alta velocidad a una velocidad preestablecida. El procesador 3007 de audio realiza una reproducción normal. En el caso en el que los datos de vídeo se produzcan en conformidad con el MPEG2, la reproducción de alta velocidad a la velocidad preestablecida se realiza según una de las siguientes reglas.
(1-1)
Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
(1-2)
Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
(1-3)
Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al (1-1), (1-2) y (1-3).
Durante la reproducción de alta velocidad, el controlador 3005B de memorias intermedias supervisa la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo. Se realiza una reproducción normal hasta que la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo se hace menor que un valor preestablecido V. Cuando la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo se hace menor que el valor preestablecido V, el controlador 3005B de memorias intermedias informa al procesador 3007 de audio sobre la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo. El valor preestablecido V se puede fijar a varios valores según el sistema. En este ejemplo, el valor preestablecido V se fija a 0. El control se realiza de una manera similar cuando el valor preestablecido V se fija a un valor diferente.
Cuando la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo llega a 0, el procesador 3007 de audio realiza una reproducción de alta velocidad de los datos de audio eliminando una parte de los datos de audio de salida. Dicho comportamiento se describirá haciendo referencia a la Figura 45. La Figura 45 muestra los estados de la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo durante la reproducción. Una parte sombreada representa un área de datos, y una parte en blanco representa un área utilizable.
En el caso en el que los datos de vídeo se reproduzcan a una velocidad elevada y la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo no llegue a 0, la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo se encuentran en el estado 2 en la Figura 45. La capacidad libre de la memoria intermedia 3003 de flujos continuos de audio no es 0 y la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo no es 0. Solamente los datos de vídeo se reproducen a una velocidad alta por medio del procesador 3008 de vídeo. Como un flujo continuo de audio se introduce según la velocidad de reproducción de los datos de vídeo, la cantidad de los datos de audio a decodificar para reproducción normal es menor que la cantidad de datos de entrada. Como los datos de audio en la memoria intermedia 3003 de flujos continuos de audio no se procesan, no se puede extraer el siguiente flujo continuo de vídeo del flujo continuo 3001 de entrada. De este modo, la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo llega a 0 (estado 1).
Cuando la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo llega a 0, el controlador 3005B de memorias intermedias transporta dicha información hacia el procesador 3007 de audio. En respuesta, el procesador 3007 de audio descarta una cantidad preestablecida de los datos de audio, y retoma la decodificación de los datos de audio a una velocidad normal a partir de la parte inmediatamente después de la parte descartada de los datos de audio.
A continuación se describirán en la presente memoria la cantidad de datos preestablecida a descartar y métodos de descarte.
(i) Borrado de la memoria intermedia de flujos continuos de audio (evacuación)
Los datos de la memoria intermedia 3003 de flujos continuos de audio se evacuan de forma parcial o total para rebajar parcialmente el flujo continuo antes de la decodificación. De este modo, se reduce la cantidad de datos de audio a reproducir para la reproducción de alta velocidad. Una cantidad preestablecida de datos de audio a descartar es una cantidad arbitraria que es menor que el tamaño de la memoria intermedia 3003 de flujos continuos de audio en el sistema usado.
En la Figura 40 se muestran los datos de audio reproducidos de esta manera. La Figura 40 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B en la reproducción de alta velocidad obtenida cuando se borra la memoria intermedia 3003 de flujos continuos de audio. En el ejemplo mostrado en la Figura 40, se eliminan los datos desde una parte central de la trama 4 a una parte central de la trama 7 borrando la memoria intermedia 3003 de flujos continuos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido al eliminar la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8 mediante el borrado de la memoria intermedia 3003 de flujos continuos de audio. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, se puede producir un error no deseable del flujo continuo. Como el contenido de la memoria intermedia 3003 de flujos continuos de audio se elimina totalmente, no se puede dar salida a datos de audio hasta que se introduzcan los datos correspondientes a la siguiente trama.
(ii) Restricción del flujo continuo de audio de entrada
La transferencia del flujo continuo 3001 de entrada desde el procesador 3002 de flujos continuos de entrada a la memoria intermedia 3003 de flujos continuos de audio se interrumpe durante un periodo de tiempo preestablecido. En otras palabras, una parte del flujo continuo 3001 de entrada se elimina mediante una no transferencia. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida A de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la transferencia, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 41 se muestran los datos de audio reproducidos de esta manera. La Figura 41 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la restricción de la entrada del flujo continuo 3001 de entrada para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 41, los datos desde una parte central de la trama 4 a una parte central de la trama 7 se eliminan restringiendo la entrada del flujo continuo 3001 de entrada. Como consecuencia, el flujo continuo 1B de audio de salida a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido al eliminar la sección A del flujo continuo 1A de audio de salida. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, puede producirse un error no deseable en el flujo continuo. Además, no se puede dar salida a datos de audio hasta que se introduzcan los datos para la siguiente trama.
(iii) Omisión del flujo continuo de audio de entrada
El procesador 3007 de audio omite de una a varias tramas de datos de audio basándose en un procesamiento trama a trama. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), cada vez que se omiten los datos es necesario descartar la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio reproducidos de esta manera. La Figura 42 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la omisión parcial de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 42, los datos desde la trama 4 a la trama 7 se eliminan omitiendo los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual al flujo continuo de audio de salida 1A después de eliminar la sección A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
(iv) Interrupción de la salida de los datos de audio
El procesador 3007 de audio interrumpe la salida de una a varias tramas de datos de audio. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Un valor mínimo de una cantidad preestablecida de datos de audio a descartar mediante la interrupción de la salida se determina por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la salida, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 43 se muestran los datos de audio reproducidos de esta manera. La Figura 43 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la interrupción de la salida de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 43, los datos desde la trama 4 a la trama 7 se eliminan interrumpiendo la salida de los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual al resultado obtenido al eliminar la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la reproducción de alta velocidad de datos de audio se realiza según la velocidad de reproducción de los datos de vídeo sin cambiar la velocidad de reproducción de los datos de vídeo mediante el descarte de una parte del flujo continuo de vídeo y audio por medio de uno de los métodos (i) a (iv) cada vez que la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo llega a 0. Los métodos (i) a (iv) antes mencionados reducen la discontinuidad del sonido. Por consiguiente, un dispositivo de procesamiento de señales de audio en el undécimo ejemplo reproduce datos de audio a una velocidad elevada según la velocidad de reproducción de los datos de vídeo, con menos discontinuidad del sonido y de una manera más sencilla.
\vskip1.000000\baselineskip
Ejemplo 12
Se describirá, haciendo referencia a las figuras, un dispositivo 3900 de procesamiento de señales de audio en un duodécimo ejemplo según la presente invención. La Figura 39 es un diagrama de bloques que ilustra el dispositivo 3900 de procesamiento de señales de audio en el duodécimo ejemplo. El dispositivo 3900 de procesamiento de señales de audio incluye un procesador 3002 de flujos continuos de entrada, una memoria intermedia 3003 de flujos continuos de audio, una memoria intermedia 3004 de flujos continuos de vídeo, un controlador 3005C de memorias intermedias, un controlador 3006, un procesador 3007 de audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se introducirá en el procesador 3002 de flujos continuos de entrada es datos de salida de un DVD o datos equivalentes. En otras palabras, el procesador 3002 de flujos continuos de entrada recibe una señal de vídeo o una señal de audio que está comprimida y multiplexada. También en este ejemplo, el flujo continuo 3001 de entrada es una salida de flujo continuo de datos de un DVD, los datos de vídeo están en conformidad con el MPEG2 y los datos de audio están en conformidad con el AC-3 por razones de simplicidad. También se pueden usar otros tipos de flujo continuo de datos de una manera similar.
Cuando el flujo continuo 3001 de entrada se introduce en el procesador 3002 de flujos continuos de entrada, el procesador 3002 de flujos continuos de entrada extrae datos de vídeo y datos de audio a reproducir a partir del flujo continuo 3001 de entrada y almacena los datos de vídeo en la memoria intermedia 3004 de flujos continuos de vídeo y los datos de audio en la memoria intermedia 3003 de flujos continuos de audio. Llegado este momento, el controlador 3005C de memorias intermedias supervisa la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo y la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio.
En un estado de reproducción normal, cuando los datos de vídeo se introducen en el procesador 3008 de vídeo, el procesador 3008 de vídeo decodifica los datos de vídeo en una señal 3010 de vídeo de salida. Cuando los datos de audio se introducen en el procesador 3007 de audio, el procesador 3007 de audio decodifica y convierte los datos de audio en una señal 3009 de audio de salida.
En un estado de reproducción de alta velocidad, el procesador 3008 de vídeo sigue una instrucción del controlador 3006 para realizar una reproducción de alta velocidad a una velocidad preestablecida. El procesador 3007 de audio realiza una reproducción normal. En el caso en el que los datos de vídeo se produzcan en conformidad con el MPEG2, la reproducción de alta velocidad a la velocidad preestablecida se realiza según una de las siguientes reglas.
(1-1)
Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
(1-2)
Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
(1-3)
Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al (1-1), (1-2) y (1-3).
Durante la reproducción de alta velocidad, el controlador 3005C de memorias intermedias supervisa la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo y la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio. Se realiza una reproducción normal hasta que la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo se hace menor que un valor preestablecido V ó hasta que la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio se hace menor que un valor preestablecido W. Cuando la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo se hace menor que el valor preestablecido V ó cuando la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio se hace menor que un valor preestablecido W, el controlador 3005C de memorias intermedias informa al procesador 3007 de audio sobre la capacidad libre restante de la memoria intermedia 3003 de flujos continuos de audio o la memoria intermedia 3004 de flujos continuos de vídeo. Los valores preestablecidos W y V se pueden fijar a varios valores según el sistema. En este ejemplo, los valores preestablecidos W y V se fijan a 0. El control se realiza de una manera similar cuando los valores preestablecidos W y V se fijan a un valor diferente.
Cuando la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo o la memoria intermedia 3003 de flujos continuos de audio llega a 0, el procesador 3007 de audio realiza una reproducción de alta velocidad de los datos de audio eliminando una parte de los datos de audio de salida. Dicho comportamiento se describirá haciendo referencia a las Figuras 44 y 45. Las Figuras 44 y 45 muestran los estados de la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo durante la reproducción. Una parte sombreada representa un área de datos, y una parte en blanco representa un área utilizable.
En el caso en el que los datos de vídeo se reproduzcan a una velocidad elevada y la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo no llegue a 0, la memoria intermedia 3003 de flujos continuos de audio y la memoria intermedia 3004 de flujos continuos de vídeo se encuentran en el estado 2 en las Figuras 44 y 45. La capacidad libre de la memoria intermedia 3003 de flujos continuos de audio no es 0, y la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo no es 0. Solamente los datos de vídeo se reproducen a una velocidad alta por medio del procesador 3008 de vídeo. Como un flujo continuo de audio se introduce según la velocidad de reproducción de los datos de vídeo, la cantidad de los datos de audio a decodificar para la reproducción normal es menor que la cantidad de datos de entrada. Por consiguiente, la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0 tal como se muestra en el estado 1 de la Figura 44 ó la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo llega a 0 tal como se muestra en el estado 1 de la Figura 45.
Cuando la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio o la cantidad de datos restante en la memoria intermedia 3004 de flujos continuos de vídeo llega a 0, el controlador 3005C de memorias intermedias transporta dicha información hacia el procesador 3007 de audio. En respuesta, el procesador 3007 de audio descarta una cantidad preestablecida de los datos de audio, y retoma la decodificación de los datos de audio a una velocidad normal a partir de la parte inmediatamente después de la parte descartada de los datos de audio.
A continuación se describirán en la presente memoria la cantidad de datos preestablecida a descartar y métodos de descarte.
(i) Borrado de la memoria intermedia 3003 de flujos continuos de audio
Los datos de la memoria intermedia 3003 de flujos continuos de audio se evacuan de forma parcial o total para rebajar parcialmente el flujo continuo antes de la decodificación. De este modo, se reduce la cantidad de datos de audio a reproducir para la reproducción de alta velocidad. Una cantidad preestablecida A de datos de audio a descartar es una cantidad arbitraria que es menor que el tamaño de la memoria intermedia 3003 de flujos continuos de audio en el sistema usado.
En la Figura 40 se muestran los datos de audio reproducidos de esta manera. La Figura 40 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B en la reproducción de alta velocidad como consecuencia del borrado de la memoria intermedia 3003 de flujos continuos de audio. En el ejemplo mostrado en la Figura 40, se eliminan los datos desde una parte central de la trama 4 a una parte central de la trama 7 borrando la memoria intermedia 3003 de flujos continuos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido mediante la eliminación de la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8 mediante el borrado de la memoria intermedia 3003 de flujos continuos de audio. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, se puede producir un error no deseable del flujo continuo. Como el contenido de la memoria intermedia 3003 de flujos continuos de audio se elimina totalmente, no se puede dar salida a datos de audio hasta que se introduzcan los datos correspondientes a la siguiente trama.
(ii) Restricción del flujo continuo de audio de entrada
La transferencia del flujo continuo 3001 de entrada desde el procesador 3002 de flujos continuos de entrada a la memoria intermedia 3003 de flujos continuos de audio se interrumpe durante un periodo de tiempo preestablecido. En otras palabras, una parte del flujo continuo 3001 de entrada se elimina mediante una no transferencia. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida A de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la transferencia, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 41 se muestran los datos de audio reproducidos de esta manera. La Figura 41 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la restricción de la entrada del flujo continuo 3001 de entrada para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 41, los datos desde una parte central de la trama 4 a una parte central de la trama 7 se eliminan restringiendo la entrada del flujo continuo 3001 de entrada. Como consecuencia, el flujo continuo 1B de audio de salida a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido al eliminar del flujo continuo 1A de audio de salida la sección A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. No obstante, como los datos de audio no se pueden procesar trama a trama, puede producirse un error no deseable en el flujo continuo. Además, no se puede dar salida a datos de audio hasta que se introduzcan los datos para la siguiente trama.
(iii) Omisión del flujo continuo de audio de entrada
El procesador 3007 de audio omite de una a varias tramas de datos de audio basándose en un procesamiento trama a trama. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Se determina una cantidad preestablecida de datos de audio a descartar por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), cada vez que se omiten los datos es necesario descartar la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio reproducidos de esta manera. La Figura 42 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la omisión parcial de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 42, los datos desde la trama 4 a la trama 7 se eliminan omitiendo los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido al eliminar la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
(iv) Interrupción de la salida de los datos de audio
El procesador 3007 de audio interrumpe la salida de una a varias tramas de datos de audio. De este modo, la cantidad de datos de audio a reproducir se reduce para la reproducción de alta velocidad. Un valor mínimo de una cantidad preestablecida de datos de audio a descartar mediante la interrupción de la salida se determina por medio de la velocidad de reproducción de los datos de vídeo que es soportada por el sistema. Cuando la velocidad de reproducción de vídeo es n (reproducción normal), es necesario descartar, cada vez que se interrumpe la salida, la cantidad de datos de audio que es igual a o mayor que (n-1) tramas de audio.
En la Figura 43 se muestran los datos de audio reproducidos de esta manera. La Figura 43 muestra un flujo continuo de audio de salida 1A en la reproducción normal y un flujo continuo de audio de salida 1B obtenido mediante la interrupción de la salida de los datos de audio para la reproducción de alta velocidad. En el ejemplo mostrado en la Figura 43, los datos desde la trama 4 a la trama 7 se eliminan interrumpiendo la salida de los datos de audio. Como consecuencia, el flujo continuo de audio de salida 1B a decodificar durante la reproducción de alta velocidad es igual a un resultado obtenido al eliminar la sección A del flujo continuo de audio de salida 1A. En este caso, el número de tramas a decodificar se reduce de 12 (reproducción normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de llevar a cabo. Además, como los datos de audio se procesan trama a trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la reproducción de alta velocidad de datos de audio se realiza según la velocidad de reproducción de los datos de vídeo sin cambiar la velocidad de reproducción de los datos de vídeo mediante el descarte de una parte del flujo continuo de vídeo y audio por medio de uno de los métodos (i) a (iv) cada vez que la capacidad libre de la memoria intermedia 3003 de flujos continuos de audio llega a 0 ó la cantidad de datos restante de la memoria intermedia 3004 de flujos continuos de vídeo llega a 0. Los métodos entre (i) a (iv) antes mencionados reducen la discontinuidad del sonido. Por consiguiente, un dispositivo de procesamiento de señales de audio en el duodécimo ejemplo reproduce datos de audio a una velocidad alta según la velocidad de reproducción de los datos de vídeo con menos discontinuidad del sonido y de una manera más sencilla.
Los datos de audio y los datos de vídeo incluidos en un flujo continuo de datos en conformidad con las normas MPEG se decodifican en general por medio de LSIs que se forman por separado en un chip. Incluso cuando los LSIs se forman en un mismo chip, estos LSIs se forman frecuentemente en bloques independientes que tienen núcleos diferentes. En tal caso, el controlador de memorias intermedias no puede supervisar siempre tanto la memoria intermedia 3003 de flujos continuos de audio como la memoria intermedia 3004 de flujos continuos de vídeo. Por consiguiente, el controlador de memorias intermedias supervisa una de entre la memoria intermedia 3003 de flujos continuos de audio (correspondiente al ejemplo décimo) y la memoria intermedia 3004 de flujos continuos de vídeo (correspondiente al ejemplo undécimo). En el caso en el que los datos de audio y los datos de vídeo se decodifican por medio del mismo chip de LSI, el controlador 3005C de memorias intermedias puede supervisar tanto la memoria intermedia 3003 de flujos continuos de audio como la memoria intermedia 3004 de flujos continuos de vídeo a través de un bus de
datos.
En los ejemplos décimo, undécimo y duodécimo, en el caso en el que los datos de audio se eliminen basándose en un procesamiento trama a trama, por ejemplo, en el caso en el que se introducen los datos de audio para las tramas 0 a i, la trama i+1, ... la trama k-1, la trama k y la trama k+1 y a continuación se eliminan los datos de audio para las tramas i+1, ... la trama k-1, los datos de audio para las tramas i y k se tratan mediante un fundido cruzado.
Tal como puede apreciarse a partir del ejemplo décimo, undécimo y duodécimo, un dispositivo de procesamiento de señales de audio según la presente invención supervisa la capacidad libre de una memoria intermedia de flujos continuos de audio y descarta una cantidad preestablecida del flujo continuo de audio cuando la cantidad utilizable se hace menor que una cantidad preestablecida. De este modo, el dispositivo de procesamiento de señales de audio reproduce datos de audio a una alta velocidad según la velocidad de reproducción de los datos de vídeo con menos discontinuidad del sonido y de una manera sencilla.
Alternativamente, un dispositivo de procesamiento de señales de audio según la presente invención puede supervisar la cantidad de datos restante en una memoria intermedia de flujos continuos de vídeo y descarta una cantidad preestablecida del flujo continuo de audio cuando la cantidad de datos restante se hace menor que una cantidad preestablecida. De este modo, el dispositivo de procesamiento de señales de audio reproduce datos de audio a una velocidad según la velocidad de reproducción de los datos de vídeo con menos discontinuidad del sonido y de una manera sencilla.
Todavía alternativamente, un dispositivo de procesamiento de señales de audio según la presente invención puede supervisar tanto la capacidad libre de la memoria intermedia de flujos continuos de audio como la cantidad de datos restante en la memoria intermedia de flujos continuos de vídeo. En tal caso, el dispositivo de procesamiento de señales de audio descarta una cantidad preestablecida del flujo continuo de audio cuando la capacidad libre de la memoria intermedia de flujos continuos de audio o la cantidad de datos restante en la memoria intermedia de flujos continuos de vídeo se hace menor que una cantidad preestablecida. De este modo, el dispositivo de procesamiento de señales de audio reproduce datos de audio a una alta velocidad según la velocidad de reproducción de los datos de vídeo con menos discontinuidad del sonido y de una manera más sencilla.
La cantidad preestablecida del flujo continuo de audio se descarta mediante evacuación intermitente del contenido de la memoria intermedia de flujos continuos de audio para rebajar los datos de audio.
Alternativamente, la cantidad preestablecida del flujo continuo de audio se descarta interrumpiendo, durante un periodo de tiempo preestablecido, la transferencia, hacia la memoria intermedia de flujos continuos de audio, de una señal de audio que se introduce desde el procesador de flujos continuos de entrada.
Todavía alternativamente, la cantidad preestablecida del flujo continuo de audio se descarta omitiendo una cantidad preestablecida de datos introducidos desde la memoria intermedia de flujos continuos de audio por medio del procesador de audio.
Todavía alternativamente, la cantidad preestablecida del flujo continuo de audio se descarta interrumpiendo, durante un periodo de tiempo preestablecido, la salida de una señal de audio por el procesador de audio.
Mediante cualquiera de los métodos antes descritos se reducen los datos de audio a reproducir para la reproducción de alta velocidad. De esta manera, la reproducción de alta velocidad de datos de audio se realiza según la velocidad de reproducción de los datos de vídeo con menos discontinuidad del sonido.
Otras diversas modificaciones resultarán evidentes para los expertos en la materia y podrán ser realizadas fácilmente por los mismos sin apartarse del alcance de la presente invención.

Claims (6)

1. Procesador (3800) de señales de audio, que comprende:
una sección (3006) de control para indicar una velocidad de reproducción;
un procesador (3002) de señales de entrada para procesar una señal (3001) de entrada obtenida como resultado de multiplexar una señal de audio y una señal de vídeo y dar salida a una señal de audio y una señal de vídeo;
una memoria intermedia (3003) de flujos continuos de audio para almacenar temporalmente la señal de audio obtenida a la salida del procesador (3002) de señales de entrada;
una memoria intermedia (3004) de flujos continuos de vídeo para almacenar temporalmente la señal de vídeo obtenida a la salida del procesador (3002) de señales de entrada;
un procesador (3007) de audio para extraer la señal de audio de la memoria intermedia (3003) de flujos continuos de audio y procesar la señal de audio para formar una señal (3009) de audio de salida; y
un procesador (3008) de vídeo para extraer la señal de vídeo de la memoria intermedia (3004) de flujos continuos de vídeo y procesar la señal de vídeo, y realizar una reproducción de alta velocidad de la señal de vídeo en respuesta a una instrucción de la sección (3006) de control para formar una señal (3010) de vídeo de salida,
caracterizado porque comprende además:
un controlador (3005B) de memorias intermedias para supervisar un estado de la memoria intermedia (3004) de flujos continuos de vídeo y, durante la reproducción de alta velocidad, cuando una cantidad de datos restante en la memoria intermedia (3004) de flujos continuos de vídeo se hace menor que un primer nivel preestablecido (V), informar al procesador de audio sobre la cantidad de datos restante en la memoria intermedia de flujos continuos de vídeo de manera que el procesador (3007) de audio realiza una reproducción de alta velocidad de la señal de audio descartando una cantidad preestablecida de la señal de audio y retomando el procesamiento de la señal de audio para formar una señal de audio de salida en una reproducción de velocidad normal.
2. Procesamiento de señales de audio según la reivindicación 1, en el que el controlador (3005C) de memorias intermedias está destinado además a supervisar un estado de la memoria intermedia (3003) de flujos continuos de audio y, cuando una capacidad libre restante de la memoria intermedia de flujos continuos de audio se hace menor que un segundo valor preestablecido (W), informar al procesador de audio sobre la capacidad libre restante de la memoria intermedia de flujos continuos de audio de manera que el procesador de audio realiza la reproducción de alta velocidad de la señal de audio descartando la cantidad preestablecida de la señal de audio y retomando el procesamiento de la señal de audio para formar la señal de audio de salida en la reproducción de velocidad normal.
3. Método de realización de una reproducción de alta velocidad de una señal de audio en el procesador de señales de audio según la reivindicación 1 ó 2, caracterizado porque comprende una etapa que consiste en rebajar la señal de audio evacuando intermitentemente un contenido de la memoria intermedia de flujos continuos de audio para reducir una cantidad de datos de audio que se debe reproducir mientras se realiza la reproducción de alta velocidad de la señal de vídeo.
4. Método de realización de una reproducción de alta velocidad de una señal de audio en el procesador de señales de audio según la reivindicación 1 ó 2, caracterizado porque comprende una etapa que consiste en interrumpir, durante un periodo de tiempo preestablecido, la transferencia de la señal de audio desde el procesador de señales de entrada hacia la memoria intermedia de flujos continuos de audio para reducir una cantidad de datos de audio que se debe reproducir mientras se realiza la reproducción de alta velocidad de la señal de vídeo.
5. Método de realización de una reproducción de alta velocidad de una señal de audio en el procesador de señales de audio según la reivindicación 1 ó 2, caracterizado porque comprende una etapa que consiste en omitir una cantidad preestablecida de datos introducidos desde la memoria intermedia de flujos continuos de audio hacia el procesador de audio para reducir una cantidad de datos de audio que se debe reproducir mientras se realiza la reproducción de alta velocidad de la señal de vídeo.
6. Método de realización de una reproducción de alta velocidad de una señal de audio en el procesador de señales de audio según la reivindicación 1 ó 2, caracterizado porque comprende una etapa que consiste en interrumpir, durante un periodo de tiempo preestablecido, una salida de la señal de audio desde el procesador de audio para reducir una cantidad de datos de audio que se debe reproducir mientras se realiza la reproducción de alta velocidad de la señal de vídeo.
ES98106710T 1997-04-11 1998-04-14 Procesamiento de audio para equipo audiovisual. Expired - Lifetime ES2340111T3 (es)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP9-93520 1997-04-11
JP9352097 1997-04-11
JP9352197 1997-04-11
JP9-93521 1997-04-11
JP9-239968 1997-09-04
JP9239968A JPH1188994A (ja) 1997-09-04 1997-09-04 音像定位装置及び音像制御方法
JP10-23023 1998-02-04
JP02302398A JP3986147B2 (ja) 1998-02-04 1998-02-04 音響信号処理装置及びオーディオ高速再生方法

Publications (1)

Publication Number Publication Date
ES2340111T3 true ES2340111T3 (es) 2010-05-28

Family

ID=27457879

Family Applications (1)

Application Number Title Priority Date Filing Date
ES98106710T Expired - Lifetime ES2340111T3 (es) 1997-04-11 1998-04-14 Procesamiento de audio para equipo audiovisual.

Country Status (7)

Country Link
US (2) US6356639B1 (es)
EP (1) EP0871293B1 (es)
KR (2) KR100296838B1 (es)
CN (2) CN100334810C (es)
DE (1) DE69841538D1 (es)
ES (1) ES2340111T3 (es)
TW (1) TW405328B (es)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW405328B (en) * 1997-04-11 2000-09-11 Matsushita Electric Ind Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US6650659B1 (en) * 1998-02-27 2003-11-18 Sony Corporation Data transmitting method
DE60204039T2 (de) * 2001-11-02 2006-03-02 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur kodierung und dekodierung von audiosignalen
US6928104B2 (en) * 2002-07-18 2005-08-09 Interdigital Technology Corporation Scaling using gain factors for use in data detection for wireless code division multiple access communication systems
JP4045422B2 (ja) * 2002-07-23 2008-02-13 株式会社日立メディコ 画像処理装置
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
JP2004194100A (ja) * 2002-12-12 2004-07-08 Renesas Technology Corp オーディオ復号再生装置
US20050096918A1 (en) * 2003-10-31 2005-05-05 Arun Rao Reduction of memory requirements by overlaying buffers
JP4207832B2 (ja) * 2004-04-16 2009-01-14 船井電機株式会社 デジタルデータ再生装置
KR100636141B1 (ko) * 2004-04-30 2006-10-18 삼성전자주식회사 프로그래밍 기능을 가진 어플리케이션을 기록한 저장매체, 재생 장치 및 그 재생 방법
US7471337B2 (en) * 2004-06-09 2008-12-30 Lsi Corporation Method of audio-video synchronization
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP5227794B2 (ja) 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
TWI459373B (zh) * 2005-06-30 2014-11-01 Lg Electronics Inc 音頻訊號之解碼方法
TWI314722B (en) * 2005-06-30 2009-09-11 Lg Electronics Inc Apparatus for encoding and decoding audio signal and method thereof
US8185403B2 (en) 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2007033507A (ja) * 2005-07-22 2007-02-08 Matsushita Electric Ind Co Ltd 音響再生装置
CN100420155C (zh) * 2005-08-03 2008-09-17 上海杰得微电子有限公司 宽带音频压缩编码器的频带组划分方法
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007027051A1 (en) 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
KR20080049735A (ko) 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040363A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
KR100677622B1 (ko) * 2005-12-02 2007-02-02 삼성전자주식회사 오디오 파일의 이퀄라이저 설정 방법 및 이를 이용한오디오 파일 재생 방법
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
KR20070077652A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
JP5394753B2 (ja) 2006-02-23 2014-01-22 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
CA2665682C (en) 2006-10-31 2016-10-25 Qualcomm Incorporated Method and apparatus for increasing ack resources for a wireless communication system
JP4284370B2 (ja) * 2007-03-09 2009-06-24 株式会社東芝 ビデオサーバ及びビデオ編集システム
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
KR101331537B1 (ko) * 2007-10-10 2013-11-20 삼성전자주식회사 디지털 미디어 방송 시스템에서 오디오 출력을 위한 장치및 방법
KR101303441B1 (ko) * 2007-10-17 2013-09-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 다운믹스를 이용한 오디오 코딩
US9703784B2 (en) * 2007-12-24 2017-07-11 Sandisk Il Ltd. Mobile device and method for concurrently processing content according to multiple playlists
JP5396588B2 (ja) * 2008-06-16 2014-01-22 株式会社 Trigence Semiconductor デジタルスピーカー駆動装置,デジタルスピーカー装置,アクチュエータ,平面ディスプレイ装置及び携帯電子機器
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8508357B2 (en) 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CN102625982B (zh) 2009-05-01 2015-03-18 尼尔森(美国)有限公司 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
KR101196410B1 (ko) * 2009-07-07 2012-11-01 삼성전자주식회사 Tv 설치타입에 기초한 자동 환경 설정방법 및 이를 적용한 tv
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
US8073995B2 (en) * 2009-10-19 2011-12-06 Research In Motion Limited Efficient low-latency buffer
KR101629306B1 (ko) * 2009-12-07 2016-06-10 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 하이브리드 변환을 사용한 다채널 오디오 엔코딩된 비트 스트림들의 디코딩
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
CN102949997B (zh) * 2012-09-18 2015-01-07 华东理工大学 一种用于吸收强化低碳烃水蒸气重整制氢的催化剂-吸收剂复合体及其制备方法
EP2782094A1 (en) * 2013-03-22 2014-09-24 Thomson Licensing Method and apparatus for enhancing directivity of a 1st order Ambisonics signal
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
CN104754450B (zh) * 2013-12-31 2018-01-19 广州励丰文化科技股份有限公司 基于变轨声像的音效控制方法
CN104754449B (zh) * 2013-12-31 2018-02-16 广州励丰文化科技股份有限公司 基于变域声像的音效控制方法
CN104754443B (zh) * 2013-12-31 2018-01-12 广州励丰文化科技股份有限公司 基于变域声像的链接音效控制方法
CN104754448B (zh) * 2013-12-31 2018-02-16 广州励丰文化科技股份有限公司 变轨声像轨迹控制方法
CN104754445B (zh) * 2013-12-31 2018-01-19 广州励丰文化科技股份有限公司 全景多通道声像轨迹控制方法
CN104754457B (zh) * 2013-12-31 2018-01-12 广州励丰文化科技股份有限公司 声像轨迹控制方法
CN104754444B (zh) * 2013-12-31 2018-03-30 广州励丰文化科技股份有限公司 变域声像轨迹控制方法
CN104754451B (zh) * 2013-12-31 2018-01-19 广州励丰文化科技股份有限公司 定点声像轨迹控制方法
CN104754458B (zh) * 2013-12-31 2018-01-19 广州励丰文化科技股份有限公司 链接音效控制方法
CN104754447B (zh) * 2013-12-31 2018-01-16 广州励丰文化科技股份有限公司 基于变轨声像的链接音效控制方法
CN104754442B (zh) * 2013-12-31 2018-01-09 广州励丰文化科技股份有限公司 全景多通道声像控制方法
CN104240738B (zh) 2014-08-28 2018-05-11 杰发科技(合肥)有限公司 一种音效设置方法及电子装置
EP3392884A1 (en) * 2017-04-21 2018-10-24 audEERING GmbH A method for automatic affective state inference and an automated affective state inference system
JP7095692B2 (ja) * 2017-05-23 2022-07-05 ソニーグループ株式会社 情報処理装置及びその制御方法、並びに記録媒体
JP2020135110A (ja) * 2019-02-14 2020-08-31 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
CN110853657B (zh) * 2019-11-18 2022-05-13 北京小米智能科技有限公司 空间划分方法、装置及存储介质
CN117676450A (zh) * 2024-02-02 2024-03-08 苏州清听声学科技有限公司 一种车载虚拟声像的音频播放方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291526A (ja) 1988-05-19 1989-11-24 Fujitsu Ltd ビタビ復号器
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
US5029200A (en) 1989-05-02 1991-07-02 At&T Bell Laboratories Voice message system using synthetic speech
JP3275247B2 (ja) 1991-05-22 2002-04-15 日本電信電話株式会社 音声符号化・復号化方法
JP3053464B2 (ja) 1991-07-03 2000-06-19 富士通株式会社 音声符号化装置
JPH05199122A (ja) 1992-01-20 1993-08-06 Canon Inc 復号回路
US5384890A (en) 1992-09-30 1995-01-24 Apple Computer, Inc. Method and apparatus for providing multiple clients simultaneous access to a sound data stream
DE69433258T2 (de) * 1993-07-30 2004-07-01 Victor Company of Japan, Ltd., Yokohama Raumklangsignalverarbeitungsvorrichtung
US5583652A (en) * 1994-04-28 1996-12-10 International Business Machines Corporation Synchronized, variable-speed playback of digitally recorded audio and video
JP3622235B2 (ja) * 1994-08-26 2005-02-23 三菱電機株式会社 多重化データの復号装置
KR0174085B1 (ko) 1995-08-09 1999-04-01 조백제 다채널 오디오 복호화기의 복합 디코딩장치
TW432806B (en) 1996-12-09 2001-05-01 Matsushita Electric Ind Co Ltd Audio decoding device
TW405328B (en) * 1997-04-11 2000-09-11 Matsushita Electric Ind Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment

Also Published As

Publication number Publication date
US20020035407A1 (en) 2002-03-21
KR100296838B1 (ko) 2001-10-25
US6356639B1 (en) 2002-03-12
CN1208288A (zh) 1999-02-17
US6823310B2 (en) 2004-11-23
KR100333999B1 (ko) 2002-04-25
CN100334810C (zh) 2007-08-29
TW405328B (en) 2000-09-11
KR19980081535A (ko) 1998-11-25
EP0871293B1 (en) 2010-03-10
CN1529419A (zh) 2004-09-15
DE69841538D1 (de) 2010-04-22
EP0871293A3 (en) 2002-05-29
EP0871293A2 (en) 1998-10-14

Similar Documents

Publication Publication Date Title
ES2340111T3 (es) Procesamiento de audio para equipo audiovisual.
JP5156110B2 (ja) リアルタイム・マルチチャネル対話型デジタル・オーディオを提供するための方法
JP3563109B2 (ja) マルチチャンネルデコーダーマトリクスを得るための方法
US20080159095A1 (en) Pseudo multi-channel stereo play-back apparatus
KR970050172A (ko) 디지탈 신호 처리기, 처리 방법 , 디지탈 신호 기록/재생 장치 및 디지탈 신호 재생 방법
US9990935B2 (en) System aspects of an audio codec
WO2020182020A1 (zh) 一种音频信号播放方法及显示设备
US20050117056A1 (en) Audio coding
JP2001309308A (ja) トランスポートストリームのデータパケットを蓄積媒体に記録し又は蓄積媒体から再生する方法及び装置
JP2009188863A (ja) タイムスタンプ付加装置およびタイムスタンプ付加方法、並びにプログラム
EP0892582B1 (en) Method and apparatus for error masking in multi-channel audio signals
KR100490403B1 (ko) 오디오 스트림의 버퍼링 제어 방법 및 그 장치
JPH10336798A (ja) 音場補正回路
JP2006106068A (ja) 音声復号装置
US20060164927A1 (en) Recording medium, data recording device and method, data reproducing device and method, program, and recording medium
JP3491533B2 (ja) ディジタルオーディオデータの再生方法及び装置
Kawano et al. Development of the virtual sound algorithm
JP2010093614A (ja) 映像信号再生装置
JP4266427B2 (ja) 記録再生装置、記録再生方法及びコンピュータ読み取り可能な記憶媒体
JP2003195893A (ja) 音声再生装置及び音声再生方法
KR100576047B1 (ko) 녹화된 음성다중 프로그램의 오디오신호 출력방법
JP2010130140A (ja) 音声再生装置、及び音声再生方法
JP2002063779A (ja) オーディオチャネルid付加方法、これを用いたオーディオチャネル選択方法及びこれに適した光記録再生装置
JP2004336128A (ja) 映像・音声信号編集方法
KR20000044779A (ko) Ac-3 디코더에서의 에러 처리 방법