ES2340111T3 - Procesamiento de audio para equipo audiovisual. - Google Patents
Procesamiento de audio para equipo audiovisual. Download PDFInfo
- Publication number
- ES2340111T3 ES2340111T3 ES98106710T ES98106710T ES2340111T3 ES 2340111 T3 ES2340111 T3 ES 2340111T3 ES 98106710 T ES98106710 T ES 98106710T ES 98106710 T ES98106710 T ES 98106710T ES 2340111 T3 ES2340111 T3 ES 2340111T3
- Authority
- ES
- Spain
- Prior art keywords
- audio
- data
- continuous
- video
- buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4398—Processing of audio elementary streams involving reformatting operations of audio signals
Abstract
SE SUMINISTRA UN APARATO DE DECODIFICACION DE AUDIO PARA RECIBIR UNA CORRIENTE DE BITS EN BASE BLOQUE A BLOQUE, DECODIFICANDO UN BLOQUE DE LA CORRIENTE DE BITS PARA FORMAR DATOS DE AUDIO DECODIFICADOS PARA UNA PLURALIDAD DE CANALES, Y ALMACENANDO LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES EN EL DISPOSITIVO DE MEMORIA, MEZCLANDO DE DICHA FORMA EN SU SALIDA LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES. EL APARATO DE DECODIFICACION DE AUDIO INCLUYE UNA SECCION DE OPERACION PARA MEZCLAR A LA SALIDA LOS DATOS DE AUDIO DECODIFICADOS PARA CADA UNO DE LA PLURALIDAD DE CANALES CORRESPONDIENTES AL PRIMER BLOQUE DE LA CORRIENTE DE BITS EN LA SECCION DE MEMORIA MIENTRAS QUE SE DECODIFICA UN SEGUNDO BLOQUE DE LA CORRIENTE DE BITS.
Description
Procesamiento de audio para equipo
audiovisual.
La presente invención se refiere a un aparato de
decodificación de audio usado en equipos AV (audiovisuales) para
decodificar en datos PCM un flujo continuo de bits codificados. La
presente invención se refiere también a un dispositivo de
procesamiento de señales, un dispositivo de localización de imágenes
sonoras, un método de control de imágenes sonoras, un dispositivo
de procesamiento de señales de audio, y un método de reproducción
de alta velocidad de señales de audio usados también en equipos
AV.
\vskip1.000000\baselineskip
Se describirá un aparato convencional 550 de
decodificación de audio haciendo referencia a las Figuras 6, 7 y 8.
La Figura 6 es un diagrama de bloques que ilustra una estructura del
aparato convencional 550 de decodificación de audio. El aparato 550
de decodificación de audio incluye un dispositivo semiconductor
integrado 508. El dispositivo semiconductor integrado 508 incluye
un analizador 501 de sintaxis de flujos continuos de bits de
entrada, un decodificador 502 de secciones exponenciales, un
asignador 503 de bits de datos de mantisa, un decodificador 504 de
secciones de mantisa, un IMDCT 505, un operador 506 de mezcla
descendente, y un dispositivo 507 de memoria interna. El
dispositivo semiconductor integrado 508 intercambia datos con un
dispositivo 500 de memoria
externa.
externa.
En primer lugar un flujo continuo de bits se
almacena en el dispositivo 500 de memoria externa y a continuación
se introduce en el analizador 501 de sintaxis de flujos continuos de
bits de entrada. El analizador 501 de sintaxis de flujos continuos
de bits de entrada analiza la sintaxis del flujo continuo de bits y
extrae datos requeridos para su decodificación. Dichos datos se
envían al decodificador 502 de secciones exponenciales. El
decodificador 502 de secciones exponenciales forma datos
exponenciales para un dominio de frecuencia a partir de los datos
requeridos para la decodificación, y da salida a los datos
exponenciales hacia el asignador 503 de bits de datos de mantisa y
el IMDCT 505. El asignador 503 de bits de datos de mantisa calcula
una magnitud de asignación de bits de datos de mantisa a partir de
los datos exponenciales para el dominio de frecuencia y los datos
almacenados en el dispositivo 500 de memoria externa, y da salida a
la magnitud de asignación de bits de datos de mantisa hacia el
decodificador 504 de secciones de mantisa. El decodificador 504 de
secciones de mantisa forma datos de mantisa para el dominio de la
frecuencia a partir de la magnitud de asignación de bits de datos
de mantisa y da salida a los datos de mantisa hacia el IMDCT
(dispositivo de transformada de coseno discreta, modificada e
inversa) 505. El IMDCT 505 forma datos de audio decodificados en un
dominio del tiempo a partir de los datos exponenciales y los datos
de mantisa para el dominio de la frecuencia, y almacena los datos
de audio decodificados en el dispositivo 500 de memoria externa. El
operador 506 de mezcla descendente forma datos PCM a partir de los
datos de audio decodificados almacenados en el dispositivo 500 de
memoria externa, realiza un entrelazado y a continuación almacena
los datos resultantes en el dispositivo 500 de memoria externa. A
continuación, a los datos PCM se les da salida desde el dispositivo
500 de memoria externa.
La Figura 7 es un mapa de memoria del aparato
550 de decodificación de audio mostrado en la Figura 6. El mapa de
memoria mostrado en la Figura 7 incluye un área 600 para almacenar
datos PCM de un bloque, un área 601 para almacenar datos de audio
decodificados de un bloque para el canal 0, un área 602 para
almacenar datos de audio decodificados de un bloque para el canal
1, un área 603 para almacenar datos de audio decodificados de un
bloque para el canal 2, un área 604 para almacenar datos de audio
decodificados de un bloque para el canal 3, un área 605 para
almacenar datos de audio decodificados de un bloque para el canal 4,
y un área 606 para almacenar datos de audio decodificados de un
bloque para el canal 5.
La Figura 8 es un diagrama de flujo que ilustra
un método para decodificar datos de audio codificados de un bloque
para cada canal.
En la etapa S11, se inicializan un registro (no
mostrado), el dispositivo 507 de memoria interna (Figura 6), y un
dispositivo 500 de memoria externa. En la etapa S12, el flujo
continuo de bits almacenado en el dispositivo 500 de memoria
externa se introduce en el dispositivo semiconductor integrado 508
(recepción de datos codificados).
A continuación, en la etapa S13, se analiza la
sintaxis del flujo continuo de bits, y se extraen datos requeridos
para la decodificación (análisis de flujos continuos de bits). En la
etapa S14, se forman datos exponenciales para un dominio de
frecuencia usando los datos extraídos. En la etapa S15, se calcula
una magnitud de asignación de bits de datos de mantisa usando los
datos exponenciales para el dominio de frecuencia. En la etapa S16,
se forman datos de mantisa para el dominio de frecuencia usando la
magnitud de asignación de bits de datos de mantisa. En la etapa
S17, se forman datos de audio decodificados usando los datos de
mantisa para el dominio de frecuencia y los datos exponenciales
para el dominio de frecuencia. En la etapa S18, los datos de audio
decodificados resultantes se almacenan en el dispositivo 500 de
memoria externa.
\newpage
Las etapas descritas anteriormente se realizan
para el número de canal incluido en un bloque hasta que, en la
etapa S19, se confirma que las etapas se repiten las veces
requeridas. Como consecuencia, se forma el número de segmentos de
datos de audio decodificados correspondiente al número de canales
incluidos en un bloque, y el mismo se almacena en el dispositivo
500 de memoria externa.
En la etapa S20, datos de audio decodificados de
un bloque para cada canal en el dispositivo 500 de memoria externa
se introducen en el dispositivo semiconductor integrado 508. En la
etapa S21, los datos de audio decodificados de un bloque para cada
canal se convierten en datos PCM de un bloque (cálculo de mezcla
descendente). En la etapa S22, a los datos PCM de un bloque se les
da salida hacia el dispositivo 500 de memoria externa.
En el decodificador convencional 600 de audio,
se calculan datos PCM de un bloque en un cálculo de mezcla
descendente. Por consiguiente, la cantidad de datos transferidos
para introducir los datos de audio decodificados en el dispositivo
500 de memoria externa antes del cálculo de mezcla descendente y
para escribir los datos PCM en el dispositivo 500 de memoria
externa después del cálculo de mezcla descendente es suficientemente
grande como para ocupar una parte significativa del bus de memoria.
Dicha ocupación tiene un efecto negativo sobre otros procesamientos
realizados por el dispositivo 500 de memoria externa.
Se describirá un dispositivo convencional de
procesamiento de señales. Una parte de los datos codificados de una
pluralidad de canales puede ser compartida en común por los canales.
Por ejemplo, datos codificados de la banda de alta frecuencia que
estén incluidos en por lo menos uno de la pluralidad de canales y
compartidos por la pluralidad de canales se decodifican para formar
datos decodificados de la banda de alta frecuencia. Datos
codificados de la banda de baja frecuencia para cada canal se
decodifican para formar datos decodificados de la banda de baja
frecuencia. Los datos decodificados de la banda de baja frecuencia
se acoplan a los datos decodificados de la banda de alta frecuencia
para formar datos decodificados para cada canal.
Dicha decodificación se describirá haciendo
referencia a las Figuras 19, 20 y 21.
La Figura 20 es un diagrama de bloques de un
procesador convencional 1350 de señales para realizar la
decodificación de señales antes descrita. Tal como se muestra en la
Figura 20, el flujo continuo de bits se almacena temporalmente en
un dispositivo 1301 de memoria interna, y es analizado por un
analizador 1300 de sintaxis de flujos continuos de bits. De este
modo, se extraen datos requeridos. Se forman datos exponenciales
para un dominio de frecuencia por medio de un decodificador 1302 de
secciones exponenciales basándose en los datos extraídos. Por medio
de un asignador 1303 de bits de datos de mantisa, basándose en los
datos exponenciales para el dominio de frecuencia, se determina una
magnitud de asignación de bits de datos de mantisa. Por medio de un
decodificador 1304 de secciones de mantisa, basándose en la
magnitud de asignación de bits de datos de mantisa, se forman datos
de mantisa. Por medio de un dispositivo 1305 de formación de datos
de dominio de frecuencia, basándose en los datos formados por el
decodificador 1302 de secciones exponenciales y el decodificador
1304 de secciones de mantisa, se forman datos del dominio de la
frecuencia.
El dispositivo 1305 de formación de datos del
dominio de la frecuencia decodifica datos codificados, para un
canal arbitrario, según la siguiente regla. Los datos codificados de
alta frecuencia que están incluidos en por lo menos uno de una
pluralidad de canales y compartidos por la pluralidad de canales se
decodifican para obtener datos decodificados de la banda de alta
frecuencia, y los datos decodificados de la banda de alta
frecuencia se multiplican por la relación de la potencia de la señal
de un canal preestablecido obtenido por un codificador con respecto
a la potencia de la señal de un canal arbitrario. El resultado se
acopla a los datos decodificados de baja frecuencia para un canal
arbitrario. De este modo, se obtienen datos decodificados para el
canal arbitrario.
Los datos decodificados del dominio de la
frecuencia obtenidos se convierten en datos decodificados del
dominio del tiempo por medio de un conversor 1306 de dominio de
frecuencia-dominio de tiempo, y el resultado se
convierte en datos PCM, a los cuales se les da salida.
La Figura 21 muestra esquemáticamente la
decodificación de datos codificados, para un canal arbitrario.
En la etapa 141, se decodifican datos en un
canal preestablecido 1400 para formar un área 1402 de datos
decodificados del dominio de baja frecuencia y un área 1403 de
datos decodificados de la banda de alta frecuencia, que es
compartida por una pluralidad de canales. En la etapa 142, el área
1403 de datos decodificados de la banda de alta frecuencia se
multiplica por una relación \alpha de una potencia de la señal
para el canal preestablecido 1400 obtenido por el codificador con
respecto a los datos decodificados 1404 de la banda de alta
frecuencia para un canal arbitrario 1401, formando de este modo
datos decodificados 1404 de alta frecuencia para el canal
arbitrario 1401. En la etapa 143, datos decodificados 1405 de la
banda de baja frecuencia para el canal arbitrario 1401 se acoplan a
los datos decodificados 1404 de la banda de alta frecuencia para
formar datos decodificados para el canal
1401.
1401.
Al usar datos codificados de la banda de alta
frecuencia que son compartidos por una pluralidad de canales, no es
necesario transferir los datos codificados de la banda de alta
frecuencia para cada uno de los canales. De este modo, se mejora la
eficacia de la transferencia.
\newpage
Para realizar dicha decodificación, se señala un
flujo continuo de bits almacenado en el dispositivo 1301 de memoria
interna (Figura 20) mediante una pluralidad de punteros mientras se
extraen datos requeridos a partir del flujo de bits. Dicha
realización se describirá haciendo referencia a la Figura 19.
Se decodifica el canal preestablecido 1400. A
continuación, una sección 1201 de mantisa y una sección exponencial
1202 de datos codificados de la banda de baja frecuencia para el
canal arbitrario 1401 incluidos en un flujo continuo 1200 de bits
son señaladas por punteros respectivos 1203 y 1204 y, por lo tanto,
son leídas para decodificar los datos codificados de baja
frecuencia. Una sección 1201 de mantisa y una sección exponencial
1202 de datos codificados de la banda de alta frecuencia para el
canal preestablecido 1400 son señaladas por punteros respectivos
1203 y 1204 y, por lo tanto, son leídas para decodificar los datos
codificados de alta frecuencia.
Por consiguiente, es necesario controlar el
movimiento de los punteros 1203 y 1204 para rebobinar según se
indica mediante las flechas 1205 y 1206. Además, es necesario
almacenar el flujo continuo de bits en el dispositivo de memoria
hasta que se decodifiquen datos de todos los canales que comparten
los datos codificados de la banda de alta frecuencia. La
decodificación de datos de todos los canales que comparten los datos
codificados de la banda de alta frecuencia requiere una capacidad
de memoria suficientemente grande para almacenar el flujo continuo
de
bits.
bits.
Por otra parte, se demanda que la decodificación
de los datos codificados de la banda de alta frecuencia, que impone
una carga mayor que la decodificación de datos habituales
codificados de la banda de baja frecuencia, reduzca la
carga.
carga.
En los campos de las películas y la
radiodifusión, se realizan una grabación y una reproducción
multicanal (por ejemplo, 5.1 canales) usando una tecnología de
compresión de audio digital. No obstante, la reproducción de una
señal de audio multicanal en el hogar está limitada, ya que la
mayoría de los televisores generales de uso doméstico tienen dos o
menos canales de salida. Se ha demandado observar que la
reproducción multicanal se obtenga incluso mediante equipos AV que
tengan una función de reproducción de dos o menos audios, usando
tecnologías de control de campos sonoros o de control de imágenes
sonoras.
Recientemente, como tecnología de compresión de
audio se ha usado frecuentemente una tecnología de conversión del
dominio de la frecuencia tal como, por ejemplo, MDCT. En el presente
caso, se describirá una tecnología convencional de control de
imágenes sonoras así como una tecnología de compresión de audio que
usa una conversión del dominio de la frecuencia - dominio del
tiempo.
La Figura 23 es un diagrama de bloques que
muestra una estructura básica de un dispositivo convencional de
localización de imágenes sonoras (reproductor de imágenes sonoras)
2500. En primer lugar, se describirá un método de localización de
una imagen sonora a la derecha y delante de un oyente 2010 usando
altavoces 2008-1 y 2008-2. Los
altavoces 2008-1 y 2008-2 están
situados delante con respecto al oyente 2010. Tal como se muestra
en la Figura 23, el dispositivo 2500 de localización de imágenes
sonoras incluye una fuente 2004 de señales, un divisor 2006 de
señales, procesadores 2001-1 y
2001-2 de señales, conversores D/A
2007-1 y 2007-2, y altavoces
2008-1 y 2008-2 de
control.
control.
La fuente 2004 de señales recibe una señal de
audio PCM S(t). El divisor 2006 de señales distribuye la
señal de audio S(t) hacia los canales izquierdo (L) y
derecho (R). El procesador 2001-1 de señales es un
filtro digital que tiene una característica de transmisión
hL(n), y el procesador 2001-2 de señales es
un filtro digital que tiene una característica de transmisión
hR(n). Una salida digital del procesador
2001-1 de señales es convertida en una señal
analógica por el conversor D/A 2007-1 y enviada
hacia el altavoz 2008-1 de control dispuesto a la
izquierda de la hoja de la Figura 23. Una salida digital del
procesador 2001-2 de señales es convertida en una
señal analógica por el conversor D/A 2007-2 y
enviada hacia el altavoz 2008-2 de control
dispuesto a la derecha de la hoja de la Figura 23.
La Figura 24 es un diagrama de bloques del
procesador 2001-1 de señales. El procesador
2001-2 de señales tiene la misma estructura. El
procesador 2001-1 de señales es un filtro FIR que
incluye n segmentos de circuitos 2011-1 a
2011-n de retardo, n+1 segmentos de multiplicadores
2012-1 a 2012-(n+1), y un sumador 2013. Los
multiplicadores 2012-1 a 2012-(n+1) están
conectados a entradas y salidas de los circuitos
2011-1 a 2011-n de retardo, y las
salidas de los multiplicadores 2012-1 a 2012-(n+1)
se suman entre sí por medio del sumador 2013 y son llevadas a
la
salida.
salida.
Haciendo referencia a las Figuras 23 y 24, el
dispositivo convencional 2500 de localización de imágenes sonoras
funciona de la siguiente manera. En la Figura 23, a la función de
transferencia entre el altavoz 2008-1 y el oído del
oyente 2010 se le hace referencia como "respuesta impulsional",
y el valor de la respuesta impulsional entre el altavoz
2008-1 y el oído izquierdo del oyente 2010 es
h1(t). A continuación, se describirá el funcionamiento en el
dominio del tiempo usando la respuesta impulsional. La respuesta
impulsional h1(t) es, de forma más precisa, una respuesta en
la posición del tímpano izquierdo del oyente 2010 provocada cuando
se introduce una señal de audio en el altavoz
2008-1. Por simplicidad, la medición se realiza
siempre en la entrada de la glándula ceruminosa. Se obtiene el
mismo efecto cuando se considera con respecto al dominio de la
frecuencia.
El valor de la respuesta impulsional entre el
altavoz 2008-1 y el oído derecho del oyente 2010 es
h2(t). El valor de la respuesta impulsional entre el altavoz
2008-2 y el oído izquierdo del oyente 2010 es
h3(t). El valor de la respuesta impulsional entre el altavoz
2008-2 y el oído derecho del oyente 2010 es
h4(t). Un altavoz 2009 se considera como una fuente de
sonido virtual posicionada a la derecha y delante del oyente 2010.
El valor de la respuesta impulsional entre el altavoz virtual 2009
y el oído izquierdo del oyente 2010 es h5(t). El valor de la
respuesta impulsional entre el altavoz virtual 2009 y el oído
derecho del oyente 2010 es h6(t).
En una estructura de este tipo, cuando se da
salida a una señal de audio S(t) de la fuente 2004 de señales
desde el altavoz virtual 2009, el sonido que llega al oído
izquierdo del oyente 2010 se expresa mediante la expresión (1), y
el sonido que llega al oído derecho del oyente 2010 se expresa
mediante la expresión (2).
- L(t) = S(t)*h5(t)
- ... (1)
- R(t) = S(t)*h6(t)
- ... (2)
En las expresiones (1) y (2), el símbolo
"*" representa una operación de convolución. En realidad, la
función de transferencia del altavoz y otras similares se
multiplican, pero en este caso estos elementos se ignoran.
Alternativamente, la función de transferencia del altavoz y otras
similares se pueden considerar incluidas en h5(t) y
h6(t).
h6(t).
Las respuestas impulsionales y las señales
S(t) se considera que son señales digitales discretas y se
expresan respectivamente como:
- \quad
- L(t)\rightarrow L(n)
- \quad
- R(t)\rightarrow R(n)
- \quad
- h5(t)\rightarrow h5(n)
- \quad
- h6(t)\rightarrow h6(n)
- \quad
- S(t)\rightarrow S(n)
En las representaciones anteriores, la letra
"n" indica un entero. Cuando T es un tiempo de muestreo,
"n" en paréntesis se expresa de forma más precisa como nT. En
este caso, se omite "T".
Las expresiones (1) y (2) se expresan
respectivamente como la expresión (3) y (4), y el símbolo "*"
que representa la operación de convolución se sustituye por
"x", que representa la multiplicación.
- L(n) = S(n)xh5(n)
- ... (3)
- R(n) = S(n)xh6(n)
- ... (4)
La señal S(t), que se obtiene a la salida
de los altavoces 2008-1 y 2008-2 y
llega al oído izquierdo del oyente 2010, se expresa con la
expresión (5).
- \quad
- L'(t) = S(t)*hL(t)*h1(t)
- +\ S(t)*hR(t)*h3(t)
- ... (5)
La señal S(t), que se obtiene a la salida
de los altavoces 2008-1 y 2008-2 y
llega al oído derecho del oyente 2010, se expresa mediante la
expresión (6).
- \quad
- R'(t) = S(t)*hL(t)*h2(t)
- +\ S(t)*hR(t)*h4(t)
- ... (6)
Las expresiones (5) y (6) se expresan como las
expresiones (8) y (9) usando la respuesta impulsional.
- \quad
- L'(n) = S(n)xhL(n)xh1(n)
- +\ S(n)xhR(n)xh3(n)
- ... (8)
\vskip1.000000\baselineskip
- \quad
- R'(n) = S(n)xhL(n)xh2(n)
- +\ S(n)xhR(n)xh4(n)
- ... (9)
En este caso, hL(n) representa la
característica de transmisión del procesador 2001-1
de señales, y hR(n) representa la característica de
transmisión del procesador 2001-2 de señales.
\newpage
\global\parskip0.980000\baselineskip
La siguiente descripción se realiza con la
premisa de que cuando la función de transferencia entre el oído y
el altavoz es la misma, al sonido se le da salida en la misma
dirección. En general, esta premisa es correcta. Cuando se
considera la expresión (10), se genera la expresión (11).
- L(n) = L'(n)
- ... (10)
- h5(n) = hL(n)xh1(n)+hR(n)xh3(n)
- ... (11)
De modo similar, cuando se considera la
expresión (12), se genera la expresión (13).
- R(n) = R'(n)
- ... (12)
- h6(n) = hL(n)xh2(n)+hR(n)xh4(n)
- ... (13)
Para que el oyente 2010 pueda oír el sonido
preestablecido desde la derecha y delante del oyente 2010 en donde
se considera que existe el altavoz virtual 2009, los valores de
hL(n) y hR(n) se determinan de manera que cumplan las
expresiones (11) y (13). Por ejemplo, cuando las expresiones (11) y
(13) se expresan mediante la representación del dominio de la
frecuencia, la operación de convolución se sustituye por la
multiplicación, y los otros elementos se sustituyen por funciones
de transferencia obtenidas mediante la aplicación de la FFT de los
valores de respuestas impulsionales. Como la función de
transferencia no es la del filtro FIR, la función de transferencia
del filtro FIR se obtiene mediante estas dos expresiones.
En el caso en el que a una señal S(n) y a
la hL(n) convolucionada se les dé salida desde el altavoz
2008-1 y a una señal S(n) y a la
hR(n) convolucionada se les dé salida desde el altavoz
2008-2 usando hL(n) y hR(n)
determinadas de esta manera, el oyente 2010 percibe el sonido como
saliendo desde la derecha y delante en la zona en la que se supone
que existe el altavoz virtual 2009. La Figura 24 muestra una
estructura de un filtro FIR. El filtro FIR mostrado en la Figura 24
localiza una imagen sonora en una posición arbitraria por medio del
procesamiento de señales antes descrito.
No obstante, la estructura descrita
anteriormente requiere proporcionar un filtro FIR para cada uno de
los canales y la realización de una operación de convolución
numerosas veces, con el fin de proporcionar una función de
transferencia real con respecto a la cabeza. Cuando aumentan el
número de filtros y/o el número de canales, la carga impuesta sobre
la frecuencia de funcionamiento y el hardware resulta excesivamente
elevada para un uso práctico. El número de tomas de los filtros FIR
se puede reducir para un uso práctico, aunque es necesario un
cierto número de tomas para mantener la precisión de la función de
transferencia con respecto a la cabeza. Cuando el número de tomas
es excesivamente pequeño, la imagen sonora es borrosa o la calidad
del sonido se deteriora.
Sistema para reproducir un soporte que incluye
datos de vídeo y datos de audio en un formato comprimido, tal como
un DVD (disco de vídeo digital). En un sistema de este tipo, los
datos de entrada de vídeo y de audio se dividen en una pluralidad
de paquetes y a continuación se multiplexan. El vídeo y el audio se
reproducen separando los datos de vídeo (a los que se hace
referencia también como "señal de vídeo") y los datos de audio
(a los que se hace referencia también como "señal de audio") a
partir de dichos datos de entrada y decodificando dichos datos
separados. Se describirá un sistema convencional usando un DVD como
ejemplo.
Los datos de vídeo se comprimen mediante MPEG2 e
incluyen tres tipos de datos de imágenes, es decir, imagen I,
imagen P e imagen B. En la normativa NTSC, cada imagen se graba en
la unidad de 1/60 segundos en el caso de una estructura de campo y
en la unidad de 1/30 segundo en el caso de una estructura de
cuadro.
Las normativas de audio ilustrativas usadas en
el DVD incluyen AC-3 y MPEG-2BC. En
dichas normativas, una trama incluye 1.536 muestras de audio, con
la frecuencia de muestreo de 48 kHz. Los datos se graban en un DVD
en el estado de compresión a la unidad de 32 ms.
Para reproducir datos de audio y vídeo que se
graban con diferentes unidades de tiempo, se requiere una
sincronización de los datos. En el caso de un DVD, los datos de
vídeo y audio se sincronizan para darles salida bajo el control de
una indicación de tiempo de programa (PTS) fijada a cada paquete. En
otras palabras, el tiempo para reproducir los datos de vídeo y el
tiempo para reproducir los datos de vídeo se ajustan de forma
independiente.
Se describirá la reproducción de alta velocidad
realizada en dicho sistema. En general, se usan los siguientes
métodos para reproducir datos de vídeo a una velocidad elevada.
- (1-1)
- Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
- (1-2)
- Reproducir solamente las imágenes I y P (velocidad de reproducción: aproximadamente entre 1,5 y 3 veces la normal)
- (1-3)
- Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: aproximadamente entre 1 y 1,5 veces la normal).
\newpage
\global\parskip1.000000\baselineskip
Como el número de cada tipo de imágenes varía
según el método de codificación, la velocidad de bits y similares,
la velocidad de reproducción para la reproducción de alta velocidad
no es constante y es posible que resulte tan diversa como desde
aproximadamente 1,5 a aproximadamente 7 veces mediante cualquiera de
los métodos (1-1), (1-2) ó
(1-3).
Para reproducir datos de audio a una velocidad
elevada se usan los siguientes métodos.
- (2-1)
- Rebajar datos de salida y alisar puntos no continuos.
- (2-2)
- Eliminar partes mudas.
Según el método (2-1), la
velocidad de reproducción es fija. Por lo tanto, cuando la velocidad
de reproducción de los datos de vídeo es mayor que la velocidad de
reproducción de los datos de audio, el sonido continúa pero el
vídeo no se puede reproducir a una velocidad mayor que la de los
datos de audio. Cuando la velocidad de reproducción de los datos de
vídeo es menor que la velocidad de reproducción de los datos de
audio, el sonido no avanza.
El método (2-2) es difícil de
usar en la práctica debido a los problemas de que resulta difícil
elevar la velocidad de reproducción de los datos de audio hasta la
velocidad de reproducción más alta de los datos de vídeo (velocidad
máxima), y de que el procesamiento para detectar una parte muda
requiere una carga elevada.
En general, la reproducción de alta velocidad de
un soporte de grabación es usada principalmente por el consumidor
para buscar una escena. En la mayoría de los DVDs que están
disponibles convencionalmente, únicamente se reproducen los datos
de vídeo para la reproducción de alta velocidad sin dar salida a
datos de audio.
La solicitud de patente europea EP 0 681 398 A2
da a conocer un procesador de señales de audio que comprende: una
sección de control para indicar una velocidad de reproducción; un
procesador de señales de entrada para procesar una señal de entrada
obtenida como resultado de multiplexar una señal de audio y una
señal de vídeo y dar salida a una señal de audio y una señal de
vídeo; una memoria intermedia de flujos continuos de audio para
almacenar temporalmente la señal de audio obtenida a la salida del
procesador de señales de entrada; una memoria intermedia de flujos
continuos de vídeo para almacenar temporalmente la señal de vídeo
obtenida a la salida del procesador de señales de entrada; un
procesador de audio para extraer la señal de audio de la memoria
intermedia de flujos continuos de audio y procesar la señal de audio
con el fin de formar una señal de audio de salida; un procesador de
vídeo para extraer la señal de vídeo de la memoria intermedia de
flujos continuos de vídeo y procesar la señal de vídeo, y realizar
la reproducción de alta velocidad de la señal de vídeo en respuesta
a una instrucción de la sección de control para formar una señal de
vídeo de salida; y un controlador de memoria intermedia para
supervisar un estado de la memoria intermedia de flujos continuos
de audio y la memoria intermedia de flujos continuos de vídeo y
controlar la entrada y la salida de datos de manera que el
procesador de audio realice la reproducción de alta velocidad de la
señal de audio cuando una capacidad libre de la memoria intermedia
de flujos continuos de audio o una cantidad de datos restantes en
la memoria intermedia de flujos continuos de vídeo llegue a ser
menor que un nivel preestablecido.
La presente invención proporciona un procesador
de señales de audio y un método de realización de una reproducción
de alta velocidad de una señal de audio en un procesador de señales
de audio según se describe en las reivindicaciones adjuntas
independientes y subordinadas.
De este modo, la invención descrita en la
presente memoria posibilita las ventajas de (1) proporcionar un
aparato de decodificación de audio para realizar un uso eficaz de un
bus de memoria; (2) proporcionar un dispositivo de procesamiento de
señales para aliviar el procesamiento de decodificación de datos
codificados que es compartido por todos los canales sin requerir un
dispositivo de memoria para almacenar datos codificados para todos
los canales hasta que se haya completado el procesamiento de
decodificación; (3) proporcionar un dispositivo de localización de
imágenes sonoras para proporcionar, mediante una cantidad menor de
operaciones, un nivel similar de sensación de localización al
obtenido cuando se usa un número mayor de tomas de filtros
digitales, y un método para controlar la imagen sonora usando dicho
dispositivo de localización de imágenes sonoras; y (4) un
dispositivo de procesamiento de señales de audio para simplificar el
procesamiento de las señales y reproducir datos de audio según la
velocidad de reproducción de los datos de vídeo con una menor
desconexión del sonido, y un método para realizar una reproducción
de alta velocidad de datos de audio usando dicho dispositivo de
procesamiento de señales de audio.
Estas y otras ventajas de la presente invención
se pondrán de manifiesto para los expertos en la materia a partir
de la descripción detallada siguiente haciendo referencia a las
figuras adjuntas.
La Figura 37 es un diagrama de bloques que
ilustra una estructura de un dispositivo de procesamiento de señales
de audio en un décimo ejemplo según la presente invención;
la Figura 38 es un diagrama de bloques que
ilustra una estructura de un dispositivo de procesamiento de señales
de audio en un undécimo ejemplo según la presente invención;
la Figura 39 es un diagrama de bloques que
ilustra una estructura de un dispositivo de procesamiento de señales
de audio en un duodécimo ejemplo según la presente invención;
la Figura 40 representa un método para eliminar
una parte de un flujo continuo de audio en un dispositivo de
procesamiento de señales de audio según la presente invención;
la Figura 41 representa otro método para
eliminar una parte de un flujo continuo de audio en un dispositivo
de procesamiento de señales de audio según la presente
invención;
la Figura 42 representa todavía otro método para
eliminar una parte de un flujo continuo de audio en un dispositivo
de procesamiento de señales de audio según la presente
invención;
la Figura 43 representa aún otro método para
eliminar una parte de un flujo continuo de audio en un dispositivo
de procesamiento de señales de audio según la presente
invención;
la Figura 44 representa una cantidad de datos
restantes en una memoria intermedia de flujos continuos de audio y
una memoria intermedia de flujos continuos de vídeo en el
dispositivo de procesamiento de señales de audio en los ejemplos
décimo y duodécimo; y
la Figura 45 representa una cantidad de datos
restantes en una memoria intermedia de flujos continuos de audio y
una memoria intermedia de flujos continuos de vídeo en el
dispositivo de procesamiento de señales de audio en los ejemplos
undécimo y duodécimo.
\vskip1.000000\baselineskip
A continuación en la presente memoria se
describirá la presente invención por medio de ejemplos ilustrativos
haciendo referencia a los dibujos adjuntos.
\vskip1.000000\baselineskip
Ejemplo
10
Se describirá, haciendo referencia a la Figura
37, un dispositivo 3700 de procesamiento de señales de audio en un
décimo ejemplo según la presente invención. La Figura 37 es un
diagrama de bloques que ilustra el dispositivo 3700 de
procesamiento de señales de audio en el décimo ejemplo. El
dispositivo 3700 de procesamiento de señales de audio incluye un
procesador 3002 de flujos continuos de entrada, una memoria
intermedia 3003 de flujos continuos de audio, una memoria
intermedia 3004 de flujos continuos de vídeo, un controlador 3005A
de memorias intermedias, un controlador 3006, un procesador 3007 de
audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se
introducirá en el procesador 3002 de flujos continuos de entrada es
datos de salida de un DVD o datos equivalentes. En otras palabras,
el procesador 3002 de flujos continuos de entrada recibe una señal
de vídeo o una señal de audio que está comprimida y multiplexada. En
este ejemplo, el flujo continuo 3001 de entrada es una salida de
flujo continuo de datos de un DVD, los datos de vídeo están en
conformidad con el MPEG2 y los datos de audio están en conformidad
con el AC-3 por razones de simplicidad. También se
pueden usar otros tipos de flujo continuo de datos de una manera
similar.
Cuando el flujo continuo 3001 de entrada se
introduce en el procesador 3002 de flujos continuos de entrada, el
procesador 3002 de flujos continuos de entrada extrae datos de vídeo
y datos de audio a reproducir a partir del flujo continuo 3001 de
entrada y almacena los datos de vídeo en la memoria intermedia 3004
de flujos continuos de vídeo y los datos de audio en la memoria
intermedia 3003 de flujos continuos de audio. Llegado este momento,
el controlador 3005A de memorias intermedias supervisa la capacidad
libre de la memoria intermedia 3003 de flujos continuos de
audio.
En un estado de reproducción normal, cuando los
datos de vídeo se introducen en el procesador 3008 de vídeo, el
procesador 3008 de vídeo decodifica los datos de vídeo en una señal
3010 de vídeo de salida. Cuando los datos de audio se introducen en
el procesador 3007 de audio, el procesador 3007 de audio decodifica
y convierte los datos de audio en una señal 3009 de audio de
salida.
En un estado de reproducción de alta velocidad,
el procesador 3008 de vídeo sigue una instrucción del controlador
3006 para realizar una reproducción de alta velocidad a una
velocidad preestablecida. Para realizar la reproducción de alta
velocidad, el procesador 3007 de audio iguala la altura tonal del
sonido con la del estado de reproducción normal y descarta una
parte de los datos de audio. En el caso en el que los datos de vídeo
se produzcan en conformidad con el MPEG2, la reproducción de alta
velocidad a la velocidad preestablecida se realiza según una de las
siguientes
reglas.
reglas.
- (1-1)
- Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
- (1-2)
- Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
- (1-3)
- Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al
(1-1), (1-2) y
(1-3).
Durante la reproducción de alta velocidad, el
controlador 3005A de memorias intermedias supervisa la capacidad
libre de la memoria intermedia 3003 de flujos continuos de audio. Se
realiza una reproducción normal hasta que la capacidad libre de la
memoria intermedia 3003 de flujos continuos de audio se hace menor
que un valor preestablecido W. Cuando la capacidad libre de la
memoria intermedia 3003 de flujos continuos de audio se hace menor
que el valor preestablecido W, el controlador 3005A de memorias
intermedias informa al procesador 3007 de audio sobre la capacidad
libre restante. El valor preestablecido W se puede fijar a varios
valores según el sistema. En este ejemplo, el valor preestablecido
W se fija a 0. El control se realiza de una manera similar cuando
el valor preestablecido W se fija a un valor diferente.
Cuando la capacidad libre de la memoria
intermedia 3003 de flujos continuos de audio llega a 0, el
procesador 3007 de audio realiza una reproducción de alta velocidad
de los datos de audio eliminando una parte de los datos de audio de
salida. Dicho comportamiento se describirá haciendo referencia a la
Figura 44. La Figura 44 muestra los estados de la memoria
intermedia 3003 de flujos continuos de audio y la memoria intermedia
3004 de flujos continuos de vídeo durante la reproducción. Una
parte sombreada representa un área de datos, y una parte en blanco
representa un área utilizable.
En el caso en el que los datos de vídeo se
reproduzcan a una velocidad elevada y la capacidad libre de la
memoria intermedia 3003 de flujos continuos de audio no llegue a 0,
la memoria intermedia 3003 de flujos continuos de audio y la
memoria intermedia 3004 de flujos continuos de vídeo se encuentran
en el estado 2 en la Figura 44. Como todavía quedan datos de vídeo
en la memoria intermedia 3004 de flujos continuos de vídeo,
solamente los datos de vídeo se reproducen a una alta velocidad
mediante el procesador 3008 de vídeo. Como se introduce un flujo
continuo de audio según la velocidad de reproducción de los datos de
vídeo, la cantidad de los datos de audio a decodificar para
reproducción normal es menor que la cantidad de datos de entrada. De
este modo, la capacidad libre de la memoria intermedia 3003 de
flujos continuos de audio llega a 0 (estado 1).
Cuando la capacidad libre de la memoria
intermedia 3003 de flujos continuos de audio llega a 0, el
controlador 3005A de memorias intermedias transporta dicha
información hacia el procesador 3007 de audio. En respuesta, el
procesador 3007 de audio descarta una cantidad preestablecida de los
datos de audio mediante evacuación, y retoma la decodificación de
los datos de audio a una velocidad normal a partir de la parte que
viene inmediatamente después de la parte descartada de los datos de
audio.
A continuación se describirán en la presente
memoria la cantidad de datos preestablecida para descartar y
métodos de descarte (es decir, eliminación).
Los datos de la memoria intermedia 3003 de
flujos continuos de audio se evacuan intermitentemente de forma
parcial o total borrando la memoria intermedia 3003 de flujos
continuos de audio para rebajar parcialmente el flujo continuo
antes de la decodificación. De este modo, se reduce la cantidad de
datos de audio a reproducir para la reproducción de alta velocidad.
Una cantidad preestablecida de datos de audio a descartar es una
cantidad arbitraria que es menor que el tamaño de la memoria
intermedia 3003 de flujos continuos de audio en el sistema
usado.
En la Figura 40 se muestran los datos de audio
reproducidos de esta manera. La Figura 40 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B en la reproducción de alta velocidad obtenida
cuando se borra la memoria intermedia 3003 de flujos continuos de
audio. En el ejemplo mostrado en la Figura 40, se eliminan los
datos desde una parte central de la trama 4 a una parte central de
la trama 7 borrando la memoria intermedia 3003 de flujos continuos
de audio. Como consecuencia, el flujo continuo de audio de salida
1B a decodificar durante la reproducción de alta velocidad es igual
al flujo continuo de audio de salida 1A después de que se haya
eliminado la sección A. En este caso, el número de tramas a
decodificar se reduce de 12 (reproducción normal) a 8. De este modo,
la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, se puede producir un error no deseable del
flujo continuo. Como el contenido de la memoria intermedia 3003 de
flujos continuos de audio se elimina totalmente, no se puede dar
salida a datos de audio hasta que se introduzcan los datos
correspondientes a la siguiente trama.
La transferencia del flujo continuo 3001 de
entrada desde el procesador 3002 de entrada a la memoria intermedia
3003 de flujos continuos de audio se interrumpe durante un periodo
de tiempo preestablecido. En otras palabras, una parte del flujo
continuo 3001 de entrada se elimina mediante una no transferencia.
De este modo, la cantidad de datos de audio a reproducir se reduce
para la reproducción de alta velocidad. Se determina una cantidad
preestablecida de datos de audio a descartar por medio de la
velocidad de reproducción de los datos de vídeo que es soportada
por el sistema. Cuando la velocidad de reproducción de vídeo es n
(reproducción normal), es necesario descartar, cada vez que se
interrumpe la transferencia, la cantidad de datos de audio que es
igual a o mayor que (n-1) tramas de audio.
En la Figura 41 se muestran los datos de audio
reproducidos de esta manera. La Figura 41 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la restricción de la
transferencia del flujo continuo 3001 de entrada para la
reproducción de alta velocidad. En el ejemplo mostrado en la Figura
41, los datos desde una parte central de la trama 4 a una parte
central de la trama 7 se eliminan restringiendo la entrada del flujo
continuo 3001 de entrada. Como consecuencia, el flujo continuo 1B
de audio de salida a decodificar durante la reproducción de alta
velocidad es igual al flujo continuo 1A de audio de salida después
de que se haya eliminado la sección A. En este caso, el número de
tramas a decodificar se reduce de 12 (reproducción normal) a 8. De
este modo, la velocidad de reproducción es 12/8=1,5 veces la
normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, puede producirse un error no deseable en el
flujo continuo. Además, no se puede dar salida a datos de audio
hasta que se introduzcan los datos para la siguiente trama.
El procesador 3007 de audio omite de una a
varias tramas de datos de audio basándose en un procesamiento trama
a trama. De este modo, la cantidad de datos de audio a reproducir se
reduce para la reproducción de alta velocidad. Se determina una
cantidad preestablecida de datos de audio a descartar por medio de
la velocidad de reproducción de los datos de vídeo que es soportada
por el sistema. Cuando la velocidad de reproducción de vídeo es n
(reproducción normal), cada vez que se omiten los datos es
necesario descartar la cantidad de datos de audio que es igual a o
mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio
reproducidos de esta manera. La Figura 42 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la omisión parcial de los
datos de audio para la reproducción de alta velocidad. En el ejemplo
mostrado en la Figura 42, los datos desde la trama 4 a la trama 7
se eliminan omitiendo los datos de audio. Como consecuencia, el
flujo continuo de audio de salida 1B a decodificar durante la
reproducción de alta velocidad es igual al resultado de eliminar la
sección A del flujo continuo de audio de salida 1A. En este caso, el
número de tramas a decodificar se reduce de 12 (reproducción
normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5
veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
El procesador 3007 de audio interrumpe la salida
de una a varias tramas de datos de audio. De este modo, la cantidad
de datos de audio a reproducir se reduce para la reproducción de
alta velocidad. Un valor mínimo de una cantidad preestablecida de
datos de audio a descartar mediante la interrupción de la salida se
determina por medio de la velocidad de reproducción de los datos de
vídeo que es soportada por el sistema. Cuando la velocidad de
reproducción de vídeo es n (reproducción normal), es necesario
descartar, cada vez que se interrumpe la salida, la cantidad de
datos de audio que es igual a o mayor que (n-1)
tramas de audio.
En la Figura 43 se muestran los datos de audio
reproducidos de esta manera. La Figura 43 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la interrupción de la
salida de los datos de audio para la reproducción de alta velocidad.
En el ejemplo mostrado en la Figura 43, los datos desde la trama 4
a la trama 7 se eliminan interrumpiendo la salida de los datos de
audio. Como consecuencia, el flujo continuo de audio de salida 1B a
decodificar durante la reproducción de alta velocidad es igual al
resultado obtenido mediante al eliminar la sección A del flujo
continuo de audio de salida 1A después de la sección A. En este
caso, el número de tramas a decodificar se reduce de 12
(reproducción normal) a 8. De este modo, la velocidad de
reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la
reproducción de alta velocidad de datos de audio se realiza según
la velocidad de reproducción de los datos de vídeo sin cambiar la
velocidad de reproducción de los datos de vídeo mediante el
descarte de una parte del flujo continuo de vídeo y audio por medio
de uno de los métodos (i) a (iv) cada vez que la capacidad libre de
la memoria intermedia 3003 de flujos continuos de audio llega a 0.
Los métodos (i) a (iv) antes mencionados reducen la discontinuidad
del sonido. Por consiguiente, un dispositivo de procesamiento de
señales de audio en el décimo ejemplo reproduce datos de audio a una
velocidad elevada según la velocidad de reproducción de los datos
de vídeo, con menos discontinuidad del sonido y de una manera más
sencilla.
\vskip1.000000\baselineskip
Ejemplo
11
Se describirá, haciendo referencia a las
figuras, un dispositivo 3800 de procesamiento de señales de audio
en un undécimo ejemplo según la presente invención. La Figura 38 es
un diagrama de bloques que ilustra el dispositivo 3800 de
procesamiento de señales de audio en el undécimo ejemplo. El
dispositivo 3800 de procesamiento de señales de audio incluye un
procesador 3002 de flujos continuos de entrada, una memoria
intermedia 3003 de flujos continuos de audio, una memoria
intermedia 3004 de flujos continuos de vídeo, un controlador 3005B
de memorias intermedias, un controlador 3006, un procesador 3007 de
audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se
introducirá en el procesador 3002 de flujos continuos de entrada es
datos de salida de un DVD o datos equivalentes. En otras palabras,
el procesador 3002 de flujos continuos de entrada recibe una señal
de vídeo o una señal de audio que está comprimida y multiplexada.
También en este ejemplo, el flujo continuo 3001 de entrada es una
salida de flujo continuo de datos de un DVD, los datos de vídeo
están en conformidad con el MPEG2 y los datos de audio están en
conformidad con el AC-3 por razones de simplicidad.
También se pueden usar otros tipos de flujo continuo de datos de una
manera similar.
Cuando el flujo continuo 3001 de entrada se
introduce en el procesador 3002 de flujos continuos de entrada, el
procesador 3002 de flujos continuos de entrada extrae datos de vídeo
y datos de audio a reproducir a partir del flujo continuo 3001 de
entrada y almacena los datos de vídeo en la memoria intermedia 3004
de flujos continuos de vídeo y los datos de audio en la memoria
intermedia 3003 de flujos continuos de audio. Llegado este momento,
el controlador 3005B de memorias intermedias supervisa la cantidad
de datos restante de la memoria intermedia 3004 de flujos continuos
de vídeo.
En un estado de reproducción normal, cuando los
datos de vídeo se introducen en el procesador 3008 de vídeo, el
procesador 3008 de vídeo decodifica los datos de vídeo en una señal
3010 de vídeo de salida. Cuando los datos de audio se introducen en
el procesador 3007 de audio, el procesador 3007 de audio decodifica
y convierte los datos de audio en una señal 3009 de audio de
salida.
En un estado de reproducción de alta velocidad,
el procesador 3008 de vídeo sigue una instrucción del controlador
3006 para realizar una reproducción de alta velocidad a una
velocidad preestablecida. El procesador 3007 de audio realiza una
reproducción normal. En el caso en el que los datos de vídeo se
produzcan en conformidad con el MPEG2, la reproducción de alta
velocidad a la velocidad preestablecida se realiza según una de las
siguientes reglas.
- (1-1)
- Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
- (1-2)
- Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
- (1-3)
- Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al
(1-1), (1-2) y
(1-3).
Durante la reproducción de alta velocidad, el
controlador 3005B de memorias intermedias supervisa la cantidad de
datos restante de la memoria intermedia 3004 de flujos continuos de
vídeo. Se realiza una reproducción normal hasta que la cantidad de
datos restante de la memoria intermedia 3004 de flujos continuos de
vídeo se hace menor que un valor preestablecido V. Cuando la
cantidad de datos restante de la memoria intermedia 3004 de flujos
continuos de vídeo se hace menor que el valor preestablecido V, el
controlador 3005B de memorias intermedias informa al procesador
3007 de audio sobre la cantidad de datos restante en la memoria
intermedia 3004 de flujos continuos de vídeo. El valor
preestablecido V se puede fijar a varios valores según el sistema.
En este ejemplo, el valor preestablecido V se fija a 0. El control
se realiza de una manera similar cuando el valor preestablecido V
se fija a un valor diferente.
Cuando la cantidad de datos restante de la
memoria intermedia 3004 de flujos continuos de vídeo llega a 0, el
procesador 3007 de audio realiza una reproducción de alta velocidad
de los datos de audio eliminando una parte de los datos de audio de
salida. Dicho comportamiento se describirá haciendo referencia a la
Figura 45. La Figura 45 muestra los estados de la memoria
intermedia 3003 de flujos continuos de audio y la memoria
intermedia 3004 de flujos continuos de vídeo durante la
reproducción. Una parte sombreada representa un área de datos, y
una parte en blanco representa un área utilizable.
En el caso en el que los datos de vídeo se
reproduzcan a una velocidad elevada y la cantidad de datos restante
de la memoria intermedia 3004 de flujos continuos de vídeo no llegue
a 0, la memoria intermedia 3003 de flujos continuos de audio y la
memoria intermedia 3004 de flujos continuos de vídeo se encuentran
en el estado 2 en la Figura 45. La capacidad libre de la memoria
intermedia 3003 de flujos continuos de audio no es 0 y la cantidad
de datos restante en la memoria intermedia 3004 de flujos continuos
de vídeo no es 0. Solamente los datos de vídeo se reproducen a una
velocidad alta por medio del procesador 3008 de vídeo. Como un flujo
continuo de audio se introduce según la velocidad de reproducción
de los datos de vídeo, la cantidad de los datos de audio a
decodificar para reproducción normal es menor que la cantidad de
datos de entrada. Como los datos de audio en la memoria intermedia
3003 de flujos continuos de audio no se procesan, no se puede
extraer el siguiente flujo continuo de vídeo del flujo continuo
3001 de entrada. De este modo, la cantidad de datos restante en la
memoria intermedia 3004 de flujos continuos de vídeo llega a 0
(estado 1).
Cuando la cantidad de datos restante de la
memoria intermedia 3004 de flujos continuos de vídeo llega a 0, el
controlador 3005B de memorias intermedias transporta dicha
información hacia el procesador 3007 de audio. En respuesta, el
procesador 3007 de audio descarta una cantidad preestablecida de los
datos de audio, y retoma la decodificación de los datos de audio a
una velocidad normal a partir de la parte inmediatamente después de
la parte descartada de los datos de audio.
A continuación se describirán en la presente
memoria la cantidad de datos preestablecida a descartar y métodos
de descarte.
Los datos de la memoria intermedia 3003 de
flujos continuos de audio se evacuan de forma parcial o total para
rebajar parcialmente el flujo continuo antes de la decodificación.
De este modo, se reduce la cantidad de datos de audio a reproducir
para la reproducción de alta velocidad. Una cantidad preestablecida
de datos de audio a descartar es una cantidad arbitraria que es
menor que el tamaño de la memoria intermedia 3003 de flujos
continuos de audio en el sistema usado.
En la Figura 40 se muestran los datos de audio
reproducidos de esta manera. La Figura 40 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B en la reproducción de alta velocidad obtenida
cuando se borra la memoria intermedia 3003 de flujos continuos de
audio. En el ejemplo mostrado en la Figura 40, se eliminan los
datos desde una parte central de la trama 4 a una parte central de
la trama 7 borrando la memoria intermedia 3003 de flujos continuos
de audio. Como consecuencia, el flujo continuo de audio de salida
1B a decodificar durante la reproducción de alta velocidad es igual
a un resultado obtenido al eliminar la sección A del flujo continuo
de audio de salida 1A. En este caso, el número de tramas a
decodificar se reduce de 12 (reproducción normal) a 8 mediante el
borrado de la memoria intermedia 3003 de flujos continuos de audio.
De este modo, la velocidad de reproducción es 12/8=1,5 veces la
normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, se puede producir un error no deseable del
flujo continuo. Como el contenido de la memoria intermedia 3003 de
flujos continuos de audio se elimina totalmente, no se puede dar
salida a datos de audio hasta que se introduzcan los datos
correspondientes a la siguiente trama.
La transferencia del flujo continuo 3001 de
entrada desde el procesador 3002 de flujos continuos de entrada a
la memoria intermedia 3003 de flujos continuos de audio se
interrumpe durante un periodo de tiempo preestablecido. En otras
palabras, una parte del flujo continuo 3001 de entrada se elimina
mediante una no transferencia. De este modo, la cantidad de datos
de audio a reproducir se reduce para la reproducción de alta
velocidad. Se determina una cantidad preestablecida A de datos de
audio a descartar por medio de la velocidad de reproducción de los
datos de vídeo que es soportada por el sistema. Cuando la velocidad
de reproducción de vídeo es n (reproducción normal), es necesario
descartar, cada vez que se interrumpe la transferencia, la cantidad
de datos de audio que es igual a o mayor que (n-1)
tramas de audio.
En la Figura 41 se muestran los datos de audio
reproducidos de esta manera. La Figura 41 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la restricción de la
entrada del flujo continuo 3001 de entrada para la reproducción de
alta velocidad. En el ejemplo mostrado en la Figura 41, los datos
desde una parte central de la trama 4 a una parte central de la
trama 7 se eliminan restringiendo la entrada del flujo continuo 3001
de entrada. Como consecuencia, el flujo continuo 1B de audio de
salida a decodificar durante la reproducción de alta velocidad es
igual a un resultado obtenido al eliminar la sección A del flujo
continuo 1A de audio de salida. En este caso, el número de tramas a
decodificar se reduce de 12 (reproducción normal) a 8. De este modo,
la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, puede producirse un error no deseable en el
flujo continuo. Además, no se puede dar salida a datos de audio
hasta que se introduzcan los datos para la siguiente trama.
El procesador 3007 de audio omite de una a
varias tramas de datos de audio basándose en un procesamiento trama
a trama. De este modo, la cantidad de datos de audio a reproducir se
reduce para la reproducción de alta velocidad. Se determina una
cantidad preestablecida de datos de audio a descartar por medio de
la velocidad de reproducción de los datos de vídeo que es soportada
por el sistema. Cuando la velocidad de reproducción de vídeo es n
(reproducción normal), cada vez que se omiten los datos es
necesario descartar la cantidad de datos de audio que es igual a o
mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio
reproducidos de esta manera. La Figura 42 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la omisión parcial de los
datos de audio para la reproducción de alta velocidad. En el ejemplo
mostrado en la Figura 42, los datos desde la trama 4 a la trama 7
se eliminan omitiendo los datos de audio. Como consecuencia, el
flujo continuo de audio de salida 1B a decodificar durante la
reproducción de alta velocidad es igual al flujo continuo de audio
de salida 1A después de eliminar la sección A. En este caso, el
número de tramas a decodificar se reduce de 12 (reproducción
normal) a 8. De este modo, la velocidad de reproducción es 12/8=1,5
veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
El procesador 3007 de audio interrumpe la salida
de una a varias tramas de datos de audio. De este modo, la cantidad
de datos de audio a reproducir se reduce para la reproducción de
alta velocidad. Un valor mínimo de una cantidad preestablecida de
datos de audio a descartar mediante la interrupción de la salida se
determina por medio de la velocidad de reproducción de los datos de
vídeo que es soportada por el sistema. Cuando la velocidad de
reproducción de vídeo es n (reproducción normal), es necesario
descartar, cada vez que se interrumpe la salida, la cantidad de
datos de audio que es igual a o mayor que (n-1)
tramas de audio.
En la Figura 43 se muestran los datos de audio
reproducidos de esta manera. La Figura 43 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la interrupción de la
salida de los datos de audio para la reproducción de alta velocidad.
En el ejemplo mostrado en la Figura 43, los datos desde la trama 4
a la trama 7 se eliminan interrumpiendo la salida de los datos de
audio. Como consecuencia, el flujo continuo de audio de salida 1B a
decodificar durante la reproducción de alta velocidad es igual al
resultado obtenido al eliminar la sección A del flujo continuo de
audio de salida 1A. En este caso, el número de tramas a decodificar
se reduce de 12 (reproducción normal) a 8. De este modo, la
velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la
reproducción de alta velocidad de datos de audio se realiza según
la velocidad de reproducción de los datos de vídeo sin cambiar la
velocidad de reproducción de los datos de vídeo mediante el
descarte de una parte del flujo continuo de vídeo y audio por medio
de uno de los métodos (i) a (iv) cada vez que la cantidad de datos
restante de la memoria intermedia 3004 de flujos continuos de vídeo
llega a 0. Los métodos (i) a (iv) antes mencionados reducen la
discontinuidad del sonido. Por consiguiente, un dispositivo de
procesamiento de señales de audio en el undécimo ejemplo reproduce
datos de audio a una velocidad elevada según la velocidad de
reproducción de los datos de vídeo, con menos discontinuidad del
sonido y de una manera más sencilla.
\vskip1.000000\baselineskip
Ejemplo
12
Se describirá, haciendo referencia a las
figuras, un dispositivo 3900 de procesamiento de señales de audio
en un duodécimo ejemplo según la presente invención. La Figura 39 es
un diagrama de bloques que ilustra el dispositivo 3900 de
procesamiento de señales de audio en el duodécimo ejemplo. El
dispositivo 3900 de procesamiento de señales de audio incluye un
procesador 3002 de flujos continuos de entrada, una memoria
intermedia 3003 de flujos continuos de audio, una memoria
intermedia 3004 de flujos continuos de vídeo, un controlador 3005C
de memorias intermedias, un controlador 3006, un procesador 3007 de
audio, y un procesador 3008 de vídeo.
Un flujo continuo 3001 de entrada que se
introducirá en el procesador 3002 de flujos continuos de entrada es
datos de salida de un DVD o datos equivalentes. En otras palabras,
el procesador 3002 de flujos continuos de entrada recibe una señal
de vídeo o una señal de audio que está comprimida y multiplexada.
También en este ejemplo, el flujo continuo 3001 de entrada es una
salida de flujo continuo de datos de un DVD, los datos de vídeo
están en conformidad con el MPEG2 y los datos de audio están en
conformidad con el AC-3 por razones de simplicidad.
También se pueden usar otros tipos de flujo continuo de datos de una
manera similar.
Cuando el flujo continuo 3001 de entrada se
introduce en el procesador 3002 de flujos continuos de entrada, el
procesador 3002 de flujos continuos de entrada extrae datos de vídeo
y datos de audio a reproducir a partir del flujo continuo 3001 de
entrada y almacena los datos de vídeo en la memoria intermedia 3004
de flujos continuos de vídeo y los datos de audio en la memoria
intermedia 3003 de flujos continuos de audio. Llegado este momento,
el controlador 3005C de memorias intermedias supervisa la cantidad
de datos restante de la memoria intermedia 3004 de flujos continuos
de vídeo y la capacidad libre de la memoria intermedia 3003 de
flujos continuos de audio.
En un estado de reproducción normal, cuando los
datos de vídeo se introducen en el procesador 3008 de vídeo, el
procesador 3008 de vídeo decodifica los datos de vídeo en una señal
3010 de vídeo de salida. Cuando los datos de audio se introducen en
el procesador 3007 de audio, el procesador 3007 de audio decodifica
y convierte los datos de audio en una señal 3009 de audio de
salida.
En un estado de reproducción de alta velocidad,
el procesador 3008 de vídeo sigue una instrucción del controlador
3006 para realizar una reproducción de alta velocidad a una
velocidad preestablecida. El procesador 3007 de audio realiza una
reproducción normal. En el caso en el que los datos de vídeo se
produzcan en conformidad con el MPEG2, la reproducción de alta
velocidad a la velocidad preestablecida se realiza según una de las
siguientes reglas.
- (1-1)
- Reproducir solamente la imagen I (velocidad de reproducción: aproximadamente entre 6 y 7 veces la normal)
- (1-2)
- Reproducir imágenes I y P (velocidad de reproducción: entre 1,5 y 3 veces la normal)
- (1-3)
- Reproducir imágenes I y P y una parte de la imagen B (velocidad de reproducción: entre 1 y 1,5 veces la normal).
Se pueden usar otros métodos diferentes al
(1-1), (1-2) y
(1-3).
Durante la reproducción de alta velocidad, el
controlador 3005C de memorias intermedias supervisa la cantidad de
datos restante de la memoria intermedia 3004 de flujos continuos de
vídeo y la capacidad libre de la memoria intermedia 3003 de flujos
continuos de audio. Se realiza una reproducción normal hasta que la
cantidad de datos restante de la memoria intermedia 3004 de flujos
continuos de vídeo se hace menor que un valor preestablecido V ó
hasta que la capacidad libre de la memoria intermedia 3003 de flujos
continuos de audio se hace menor que un valor preestablecido W.
Cuando la cantidad de datos restante de la memoria intermedia 3004
de flujos continuos de vídeo se hace menor que el valor
preestablecido V ó cuando la capacidad libre de la memoria
intermedia 3003 de flujos continuos de audio se hace menor que un
valor preestablecido W, el controlador 3005C de memorias
intermedias informa al procesador 3007 de audio sobre la capacidad
libre restante de la memoria intermedia 3003 de flujos continuos de
audio o la memoria intermedia 3004 de flujos continuos de vídeo. Los
valores preestablecidos W y V se pueden fijar a varios valores
según el sistema. En este ejemplo, los valores preestablecidos W y
V se fijan a 0. El control se realiza de una manera similar cuando
los valores preestablecidos W y V se fijan a un valor
diferente.
Cuando la cantidad de datos restante de la
memoria intermedia 3004 de flujos continuos de vídeo o la memoria
intermedia 3003 de flujos continuos de audio llega a 0, el
procesador 3007 de audio realiza una reproducción de alta velocidad
de los datos de audio eliminando una parte de los datos de audio de
salida. Dicho comportamiento se describirá haciendo referencia a
las Figuras 44 y 45. Las Figuras 44 y 45 muestran los estados de la
memoria intermedia 3003 de flujos continuos de audio y la memoria
intermedia 3004 de flujos continuos de vídeo durante la
reproducción. Una parte sombreada representa un área de datos, y una
parte en blanco representa un área utilizable.
En el caso en el que los datos de vídeo se
reproduzcan a una velocidad elevada y la cantidad de datos restante
de la memoria intermedia 3004 de flujos continuos de vídeo no llegue
a 0, la memoria intermedia 3003 de flujos continuos de audio y la
memoria intermedia 3004 de flujos continuos de vídeo se encuentran
en el estado 2 en las Figuras 44 y 45. La capacidad libre de la
memoria intermedia 3003 de flujos continuos de audio no es 0, y la
cantidad de datos restante en la memoria intermedia 3004 de flujos
continuos de vídeo no es 0. Solamente los datos de vídeo se
reproducen a una velocidad alta por medio del procesador 3008 de
vídeo. Como un flujo continuo de audio se introduce según la
velocidad de reproducción de los datos de vídeo, la cantidad de los
datos de audio a decodificar para la reproducción normal es menor
que la cantidad de datos de entrada. Por consiguiente, la capacidad
libre de la memoria intermedia 3003 de flujos continuos de audio
llega a 0 tal como se muestra en el estado 1 de la Figura 44 ó la
cantidad de datos restante en la memoria intermedia 3004 de flujos
continuos de vídeo llega a 0 tal como se muestra en el estado 1 de
la Figura 45.
Cuando la capacidad libre de la memoria
intermedia 3003 de flujos continuos de audio o la cantidad de datos
restante en la memoria intermedia 3004 de flujos continuos de vídeo
llega a 0, el controlador 3005C de memorias intermedias transporta
dicha información hacia el procesador 3007 de audio. En respuesta,
el procesador 3007 de audio descarta una cantidad preestablecida de
los datos de audio, y retoma la decodificación de los datos de
audio a una velocidad normal a partir de la parte inmediatamente
después de la parte descartada de los datos de audio.
A continuación se describirán en la presente
memoria la cantidad de datos preestablecida a descartar y métodos
de descarte.
Los datos de la memoria intermedia 3003 de
flujos continuos de audio se evacuan de forma parcial o total para
rebajar parcialmente el flujo continuo antes de la decodificación.
De este modo, se reduce la cantidad de datos de audio a reproducir
para la reproducción de alta velocidad. Una cantidad preestablecida
A de datos de audio a descartar es una cantidad arbitraria que es
menor que el tamaño de la memoria intermedia 3003 de flujos
continuos de audio en el sistema usado.
En la Figura 40 se muestran los datos de audio
reproducidos de esta manera. La Figura 40 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B en la reproducción de alta velocidad como
consecuencia del borrado de la memoria intermedia 3003 de flujos
continuos de audio. En el ejemplo mostrado en la Figura 40, se
eliminan los datos desde una parte central de la trama 4 a una
parte central de la trama 7 borrando la memoria intermedia 3003 de
flujos continuos de audio. Como consecuencia, el flujo continuo de
audio de salida 1B a decodificar durante la reproducción de alta
velocidad es igual a un resultado obtenido mediante la eliminación
de la sección A del flujo continuo de audio de salida 1A. En este
caso, el número de tramas a decodificar se reduce de 12
(reproducción normal) a 8 mediante el borrado de la memoria
intermedia 3003 de flujos continuos de audio. De este modo, la
velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, se puede producir un error no deseable del
flujo continuo. Como el contenido de la memoria intermedia 3003 de
flujos continuos de audio se elimina totalmente, no se puede dar
salida a datos de audio hasta que se introduzcan los datos
correspondientes a la siguiente trama.
La transferencia del flujo continuo 3001 de
entrada desde el procesador 3002 de flujos continuos de entrada a
la memoria intermedia 3003 de flujos continuos de audio se
interrumpe durante un periodo de tiempo preestablecido. En otras
palabras, una parte del flujo continuo 3001 de entrada se elimina
mediante una no transferencia. De este modo, la cantidad de datos
de audio a reproducir se reduce para la reproducción de alta
velocidad. Se determina una cantidad preestablecida A de datos de
audio a descartar por medio de la velocidad de reproducción de los
datos de vídeo que es soportada por el sistema. Cuando la velocidad
de reproducción de vídeo es n (reproducción normal), es necesario
descartar, cada vez que se interrumpe la transferencia, la cantidad
de datos de audio que es igual a o mayor que (n-1)
tramas de audio.
En la Figura 41 se muestran los datos de audio
reproducidos de esta manera. La Figura 41 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la restricción de la
entrada del flujo continuo 3001 de entrada para la reproducción de
alta velocidad. En el ejemplo mostrado en la Figura 41, los datos
desde una parte central de la trama 4 a una parte central de la
trama 7 se eliminan restringiendo la entrada del flujo continuo 3001
de entrada. Como consecuencia, el flujo continuo 1B de audio de
salida a decodificar durante la reproducción de alta velocidad es
igual a un resultado obtenido al eliminar del flujo continuo 1A de
audio de salida la sección A. En este caso, el número de tramas a
decodificar se reduce de 12 (reproducción normal) a 8. De este modo,
la velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. No obstante, como los datos de audio no se pueden
procesar trama a trama, puede producirse un error no deseable en el
flujo continuo. Además, no se puede dar salida a datos de audio
hasta que se introduzcan los datos para la siguiente trama.
El procesador 3007 de audio omite de una a
varias tramas de datos de audio basándose en un procesamiento trama
a trama. De este modo, la cantidad de datos de audio a reproducir se
reduce para la reproducción de alta velocidad. Se determina una
cantidad preestablecida de datos de audio a descartar por medio de
la velocidad de reproducción de los datos de vídeo que es soportada
por el sistema. Cuando la velocidad de reproducción de vídeo es n
(reproducción normal), cada vez que se omiten los datos es
necesario descartar la cantidad de datos de audio que es igual a o
mayor que (n-1) tramas de audio.
En la Figura 42 se muestran los datos de audio
reproducidos de esta manera. La Figura 42 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la omisión parcial de los
datos de audio para la reproducción de alta velocidad. En el ejemplo
mostrado en la Figura 42, los datos desde la trama 4 a la trama 7
se eliminan omitiendo los datos de audio. Como consecuencia, el
flujo continuo de audio de salida 1B a decodificar durante la
reproducción de alta velocidad es igual a un resultado obtenido al
eliminar la sección A del flujo continuo de audio de salida 1A. En
este caso, el número de tramas a decodificar se reduce de 12
(reproducción normal) a 8. De este modo, la velocidad de
reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
El procesador 3007 de audio interrumpe la salida
de una a varias tramas de datos de audio. De este modo, la cantidad
de datos de audio a reproducir se reduce para la reproducción de
alta velocidad. Un valor mínimo de una cantidad preestablecida de
datos de audio a descartar mediante la interrupción de la salida se
determina por medio de la velocidad de reproducción de los datos de
vídeo que es soportada por el sistema. Cuando la velocidad de
reproducción de vídeo es n (reproducción normal), es necesario
descartar, cada vez que se interrumpe la salida, la cantidad de
datos de audio que es igual a o mayor que (n-1)
tramas de audio.
En la Figura 43 se muestran los datos de audio
reproducidos de esta manera. La Figura 43 muestra un flujo continuo
de audio de salida 1A en la reproducción normal y un flujo continuo
de audio de salida 1B obtenido mediante la interrupción de la
salida de los datos de audio para la reproducción de alta velocidad.
En el ejemplo mostrado en la Figura 43, los datos desde la trama 4
a la trama 7 se eliminan interrumpiendo la salida de los datos de
audio. Como consecuencia, el flujo continuo de audio de salida 1B a
decodificar durante la reproducción de alta velocidad es igual a un
resultado obtenido al eliminar la sección A del flujo continuo de
audio de salida 1A. En este caso, el número de tramas a decodificar
se reduce de 12 (reproducción normal) a 8. De este modo, la
velocidad de reproducción es 12/8=1,5 veces la normal.
Este método es sencillo y relativamente fácil de
llevar a cabo. Además, como los datos de audio se procesan trama a
trama, no se produce un error en el flujo continuo.
Tal como se ha descrito anteriormente, la
reproducción de alta velocidad de datos de audio se realiza según
la velocidad de reproducción de los datos de vídeo sin cambiar la
velocidad de reproducción de los datos de vídeo mediante el
descarte de una parte del flujo continuo de vídeo y audio por medio
de uno de los métodos (i) a (iv) cada vez que la capacidad libre de
la memoria intermedia 3003 de flujos continuos de audio llega a 0 ó
la cantidad de datos restante de la memoria intermedia 3004 de
flujos continuos de vídeo llega a 0. Los métodos entre (i) a (iv)
antes mencionados reducen la discontinuidad del sonido. Por
consiguiente, un dispositivo de procesamiento de señales de audio
en el duodécimo ejemplo reproduce datos de audio a una velocidad
alta según la velocidad de reproducción de los datos de vídeo con
menos discontinuidad del sonido y de una manera más sencilla.
Los datos de audio y los datos de vídeo
incluidos en un flujo continuo de datos en conformidad con las
normas MPEG se decodifican en general por medio de LSIs que se
forman por separado en un chip. Incluso cuando los LSIs se forman
en un mismo chip, estos LSIs se forman frecuentemente en bloques
independientes que tienen núcleos diferentes. En tal caso, el
controlador de memorias intermedias no puede supervisar siempre
tanto la memoria intermedia 3003 de flujos continuos de audio como
la memoria intermedia 3004 de flujos continuos de vídeo. Por
consiguiente, el controlador de memorias intermedias supervisa una
de entre la memoria intermedia 3003 de flujos continuos de audio
(correspondiente al ejemplo décimo) y la memoria intermedia 3004 de
flujos continuos de vídeo (correspondiente al ejemplo undécimo). En
el caso en el que los datos de audio y los datos de vídeo se
decodifican por medio del mismo chip de LSI, el controlador 3005C de
memorias intermedias puede supervisar tanto la memoria intermedia
3003 de flujos continuos de audio como la memoria intermedia 3004 de
flujos continuos de vídeo a través de un bus de
datos.
datos.
En los ejemplos décimo, undécimo y duodécimo, en
el caso en el que los datos de audio se eliminen basándose en un
procesamiento trama a trama, por ejemplo, en el caso en el que se
introducen los datos de audio para las tramas 0 a i, la trama i+1,
... la trama k-1, la trama k y la trama k+1 y a
continuación se eliminan los datos de audio para las tramas i+1,
... la trama k-1, los datos de audio para las tramas
i y k se tratan mediante un fundido cruzado.
Tal como puede apreciarse a partir del ejemplo
décimo, undécimo y duodécimo, un dispositivo de procesamiento de
señales de audio según la presente invención supervisa la capacidad
libre de una memoria intermedia de flujos continuos de audio y
descarta una cantidad preestablecida del flujo continuo de audio
cuando la cantidad utilizable se hace menor que una cantidad
preestablecida. De este modo, el dispositivo de procesamiento de
señales de audio reproduce datos de audio a una alta velocidad según
la velocidad de reproducción de los datos de vídeo con menos
discontinuidad del sonido y de una manera sencilla.
Alternativamente, un dispositivo de
procesamiento de señales de audio según la presente invención puede
supervisar la cantidad de datos restante en una memoria intermedia
de flujos continuos de vídeo y descarta una cantidad preestablecida
del flujo continuo de audio cuando la cantidad de datos restante se
hace menor que una cantidad preestablecida. De este modo, el
dispositivo de procesamiento de señales de audio reproduce datos de
audio a una velocidad según la velocidad de reproducción de los
datos de vídeo con menos discontinuidad del sonido y de una manera
sencilla.
Todavía alternativamente, un dispositivo de
procesamiento de señales de audio según la presente invención puede
supervisar tanto la capacidad libre de la memoria intermedia de
flujos continuos de audio como la cantidad de datos restante en la
memoria intermedia de flujos continuos de vídeo. En tal caso, el
dispositivo de procesamiento de señales de audio descarta una
cantidad preestablecida del flujo continuo de audio cuando la
capacidad libre de la memoria intermedia de flujos continuos de
audio o la cantidad de datos restante en la memoria intermedia de
flujos continuos de vídeo se hace menor que una cantidad
preestablecida. De este modo, el dispositivo de procesamiento de
señales de audio reproduce datos de audio a una alta velocidad según
la velocidad de reproducción de los datos de vídeo con menos
discontinuidad del sonido y de una manera más sencilla.
La cantidad preestablecida del flujo continuo de
audio se descarta mediante evacuación intermitente del contenido de
la memoria intermedia de flujos continuos de audio para rebajar los
datos de audio.
Alternativamente, la cantidad preestablecida del
flujo continuo de audio se descarta interrumpiendo, durante un
periodo de tiempo preestablecido, la transferencia, hacia la memoria
intermedia de flujos continuos de audio, de una señal de audio que
se introduce desde el procesador de flujos continuos de entrada.
Todavía alternativamente, la cantidad
preestablecida del flujo continuo de audio se descarta omitiendo una
cantidad preestablecida de datos introducidos desde la memoria
intermedia de flujos continuos de audio por medio del procesador de
audio.
Todavía alternativamente, la cantidad
preestablecida del flujo continuo de audio se descarta
interrumpiendo, durante un periodo de tiempo preestablecido, la
salida de una señal de audio por el procesador de audio.
Mediante cualquiera de los métodos antes
descritos se reducen los datos de audio a reproducir para la
reproducción de alta velocidad. De esta manera, la reproducción de
alta velocidad de datos de audio se realiza según la velocidad de
reproducción de los datos de vídeo con menos discontinuidad del
sonido.
Otras diversas modificaciones resultarán
evidentes para los expertos en la materia y podrán ser realizadas
fácilmente por los mismos sin apartarse del alcance de la presente
invención.
Claims (6)
1. Procesador (3800) de señales de audio, que
comprende:
una sección (3006) de control para indicar una
velocidad de reproducción;
un procesador (3002) de señales de entrada para
procesar una señal (3001) de entrada obtenida como resultado de
multiplexar una señal de audio y una señal de vídeo y dar salida a
una señal de audio y una señal de vídeo;
una memoria intermedia (3003) de flujos
continuos de audio para almacenar temporalmente la señal de audio
obtenida a la salida del procesador (3002) de señales de
entrada;
una memoria intermedia (3004) de flujos
continuos de vídeo para almacenar temporalmente la señal de vídeo
obtenida a la salida del procesador (3002) de señales de
entrada;
un procesador (3007) de audio para extraer la
señal de audio de la memoria intermedia (3003) de flujos continuos
de audio y procesar la señal de audio para formar una señal (3009)
de audio de salida; y
un procesador (3008) de vídeo para extraer la
señal de vídeo de la memoria intermedia (3004) de flujos continuos
de vídeo y procesar la señal de vídeo, y realizar una reproducción
de alta velocidad de la señal de vídeo en respuesta a una
instrucción de la sección (3006) de control para formar una señal
(3010) de vídeo de salida,
caracterizado porque comprende
además:
un controlador (3005B) de memorias intermedias
para supervisar un estado de la memoria intermedia (3004) de flujos
continuos de vídeo y, durante la reproducción de alta velocidad,
cuando una cantidad de datos restante en la memoria intermedia
(3004) de flujos continuos de vídeo se hace menor que un primer
nivel preestablecido (V), informar al procesador de audio sobre la
cantidad de datos restante en la memoria intermedia de flujos
continuos de vídeo de manera que el procesador (3007) de audio
realiza una reproducción de alta velocidad de la señal de audio
descartando una cantidad preestablecida de la señal de audio y
retomando el procesamiento de la señal de audio para formar una
señal de audio de salida en una reproducción de velocidad
normal.
2. Procesamiento de señales de audio según la
reivindicación 1, en el que el controlador (3005C) de memorias
intermedias está destinado además a supervisar un estado de la
memoria intermedia (3003) de flujos continuos de audio y, cuando
una capacidad libre restante de la memoria intermedia de flujos
continuos de audio se hace menor que un segundo valor
preestablecido (W), informar al procesador de audio sobre la
capacidad libre restante de la memoria intermedia de flujos
continuos de audio de manera que el procesador de audio realiza la
reproducción de alta velocidad de la señal de audio descartando la
cantidad preestablecida de la señal de audio y retomando el
procesamiento de la señal de audio para formar la señal de audio de
salida en la reproducción de velocidad normal.
3. Método de realización de una reproducción de
alta velocidad de una señal de audio en el procesador de señales de
audio según la reivindicación 1 ó 2, caracterizado porque
comprende una etapa que consiste en rebajar la señal de audio
evacuando intermitentemente un contenido de la memoria intermedia de
flujos continuos de audio para reducir una cantidad de datos de
audio que se debe reproducir mientras se realiza la reproducción de
alta velocidad de la señal de vídeo.
4. Método de realización de una reproducción de
alta velocidad de una señal de audio en el procesador de señales de
audio según la reivindicación 1 ó 2, caracterizado porque
comprende una etapa que consiste en interrumpir, durante un periodo
de tiempo preestablecido, la transferencia de la señal de audio
desde el procesador de señales de entrada hacia la memoria
intermedia de flujos continuos de audio para reducir una cantidad de
datos de audio que se debe reproducir mientras se realiza la
reproducción de alta velocidad de la señal de vídeo.
5. Método de realización de una reproducción de
alta velocidad de una señal de audio en el procesador de señales de
audio según la reivindicación 1 ó 2, caracterizado porque
comprende una etapa que consiste en omitir una cantidad
preestablecida de datos introducidos desde la memoria intermedia de
flujos continuos de audio hacia el procesador de audio para reducir
una cantidad de datos de audio que se debe reproducir mientras se
realiza la reproducción de alta velocidad de la señal de vídeo.
6. Método de realización de una reproducción de
alta velocidad de una señal de audio en el procesador de señales de
audio según la reivindicación 1 ó 2, caracterizado porque
comprende una etapa que consiste en interrumpir, durante un periodo
de tiempo preestablecido, una salida de la señal de audio desde el
procesador de audio para reducir una cantidad de datos de audio que
se debe reproducir mientras se realiza la reproducción de alta
velocidad de la señal de vídeo.
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9-93520 | 1997-04-11 | ||
JP9352097 | 1997-04-11 | ||
JP9352197 | 1997-04-11 | ||
JP9-93521 | 1997-04-11 | ||
JP9-239968 | 1997-09-04 | ||
JP9239968A JPH1188994A (ja) | 1997-09-04 | 1997-09-04 | 音像定位装置及び音像制御方法 |
JP10-23023 | 1998-02-04 | ||
JP02302398A JP3986147B2 (ja) | 1998-02-04 | 1998-02-04 | 音響信号処理装置及びオーディオ高速再生方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2340111T3 true ES2340111T3 (es) | 2010-05-28 |
Family
ID=27457879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES98106710T Expired - Lifetime ES2340111T3 (es) | 1997-04-11 | 1998-04-14 | Procesamiento de audio para equipo audiovisual. |
Country Status (7)
Country | Link |
---|---|
US (2) | US6356639B1 (es) |
EP (1) | EP0871293B1 (es) |
KR (2) | KR100296838B1 (es) |
CN (2) | CN100334810C (es) |
DE (1) | DE69841538D1 (es) |
ES (1) | ES2340111T3 (es) |
TW (1) | TW405328B (es) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW405328B (en) * | 1997-04-11 | 2000-09-11 | Matsushita Electric Ind Co Ltd | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US6650659B1 (en) * | 1998-02-27 | 2003-11-18 | Sony Corporation | Data transmitting method |
DE60204039T2 (de) * | 2001-11-02 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur kodierung und dekodierung von audiosignalen |
US6928104B2 (en) * | 2002-07-18 | 2005-08-09 | Interdigital Technology Corporation | Scaling using gain factors for use in data detection for wireless code division multiple access communication systems |
JP4045422B2 (ja) * | 2002-07-23 | 2008-02-13 | 株式会社日立メディコ | 画像処理装置 |
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
JP2004194100A (ja) * | 2002-12-12 | 2004-07-08 | Renesas Technology Corp | オーディオ復号再生装置 |
US20050096918A1 (en) * | 2003-10-31 | 2005-05-05 | Arun Rao | Reduction of memory requirements by overlaying buffers |
JP4207832B2 (ja) * | 2004-04-16 | 2009-01-14 | 船井電機株式会社 | デジタルデータ再生装置 |
KR100636141B1 (ko) * | 2004-04-30 | 2006-10-18 | 삼성전자주식회사 | 프로그래밍 기능을 가진 어플리케이션을 기록한 저장매체, 재생 장치 및 그 재생 방법 |
US7471337B2 (en) * | 2004-06-09 | 2008-12-30 | Lsi Corporation | Method of audio-video synchronization |
WO2006126859A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method of encoding and decoding an audio signal |
JP5227794B2 (ja) | 2005-06-30 | 2013-07-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
TWI459373B (zh) * | 2005-06-30 | 2014-11-01 | Lg Electronics Inc | 音頻訊號之解碼方法 |
TWI314722B (en) * | 2005-06-30 | 2009-09-11 | Lg Electronics Inc | Apparatus for encoding and decoding audio signal and method thereof |
US8185403B2 (en) | 2005-06-30 | 2012-05-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2007033507A (ja) * | 2005-07-22 | 2007-02-08 | Matsushita Electric Ind Co Ltd | 音響再生装置 |
CN100420155C (zh) * | 2005-08-03 | 2008-09-17 | 上海杰得微电子有限公司 | 宽带音频压缩编码器的频带组划分方法 |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
WO2007027051A1 (en) | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
KR20080049735A (ko) | 2005-08-30 | 2008-06-04 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
WO2007040363A1 (en) | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
KR100857115B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7742913B2 (en) | 2005-10-24 | 2010-06-22 | Lg Electronics Inc. | Removing time delays in signal paths |
KR100677622B1 (ko) * | 2005-12-02 | 2007-02-02 | 삼성전자주식회사 | 오디오 파일의 이퀄라이저 설정 방법 및 이를 이용한오디오 파일 재생 방법 |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
JP5394753B2 (ja) | 2006-02-23 | 2014-01-22 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US8392176B2 (en) | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
CA2665682C (en) | 2006-10-31 | 2016-10-25 | Qualcomm Incorporated | Method and apparatus for increasing ack resources for a wireless communication system |
JP4284370B2 (ja) * | 2007-03-09 | 2009-06-24 | 株式会社東芝 | ビデオサーバ及びビデオ編集システム |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
KR101331537B1 (ko) * | 2007-10-10 | 2013-11-20 | 삼성전자주식회사 | 디지털 미디어 방송 시스템에서 오디오 출력을 위한 장치및 방법 |
KR101303441B1 (ko) * | 2007-10-17 | 2013-09-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다운믹스를 이용한 오디오 코딩 |
US9703784B2 (en) * | 2007-12-24 | 2017-07-11 | Sandisk Il Ltd. | Mobile device and method for concurrently processing content according to multiple playlists |
JP5396588B2 (ja) * | 2008-06-16 | 2014-01-22 | 株式会社 Trigence Semiconductor | デジタルスピーカー駆動装置,デジタルスピーカー装置,アクチュエータ,平面ディスプレイ装置及び携帯電子機器 |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US8508357B2 (en) | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
CN102625982B (zh) | 2009-05-01 | 2015-03-18 | 尼尔森(美国)有限公司 | 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品 |
KR101196410B1 (ko) * | 2009-07-07 | 2012-11-01 | 삼성전자주식회사 | Tv 설치타입에 기초한 자동 환경 설정방법 및 이를 적용한 tv |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
US8073995B2 (en) * | 2009-10-19 | 2011-12-06 | Research In Motion Limited | Efficient low-latency buffer |
KR101629306B1 (ko) * | 2009-12-07 | 2016-06-10 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 하이브리드 변환을 사용한 다채널 오디오 엔코딩된 비트 스트림들의 디코딩 |
TWI557723B (zh) * | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
US20120095729A1 (en) * | 2010-10-14 | 2012-04-19 | Electronics And Telecommunications Research Institute | Known information compression apparatus and method for separating sound source |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US9183842B2 (en) * | 2011-11-08 | 2015-11-10 | Vixs Systems Inc. | Transcoder with dynamic audio channel changing |
CN102949997B (zh) * | 2012-09-18 | 2015-01-07 | 华东理工大学 | 一种用于吸收强化低碳烃水蒸气重整制氢的催化剂-吸收剂复合体及其制备方法 |
EP2782094A1 (en) * | 2013-03-22 | 2014-09-24 | Thomson Licensing | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
US8804971B1 (en) | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
CN104754450B (zh) * | 2013-12-31 | 2018-01-19 | 广州励丰文化科技股份有限公司 | 基于变轨声像的音效控制方法 |
CN104754449B (zh) * | 2013-12-31 | 2018-02-16 | 广州励丰文化科技股份有限公司 | 基于变域声像的音效控制方法 |
CN104754443B (zh) * | 2013-12-31 | 2018-01-12 | 广州励丰文化科技股份有限公司 | 基于变域声像的链接音效控制方法 |
CN104754448B (zh) * | 2013-12-31 | 2018-02-16 | 广州励丰文化科技股份有限公司 | 变轨声像轨迹控制方法 |
CN104754445B (zh) * | 2013-12-31 | 2018-01-19 | 广州励丰文化科技股份有限公司 | 全景多通道声像轨迹控制方法 |
CN104754457B (zh) * | 2013-12-31 | 2018-01-12 | 广州励丰文化科技股份有限公司 | 声像轨迹控制方法 |
CN104754444B (zh) * | 2013-12-31 | 2018-03-30 | 广州励丰文化科技股份有限公司 | 变域声像轨迹控制方法 |
CN104754451B (zh) * | 2013-12-31 | 2018-01-19 | 广州励丰文化科技股份有限公司 | 定点声像轨迹控制方法 |
CN104754458B (zh) * | 2013-12-31 | 2018-01-19 | 广州励丰文化科技股份有限公司 | 链接音效控制方法 |
CN104754447B (zh) * | 2013-12-31 | 2018-01-16 | 广州励丰文化科技股份有限公司 | 基于变轨声像的链接音效控制方法 |
CN104754442B (zh) * | 2013-12-31 | 2018-01-09 | 广州励丰文化科技股份有限公司 | 全景多通道声像控制方法 |
CN104240738B (zh) | 2014-08-28 | 2018-05-11 | 杰发科技(合肥)有限公司 | 一种音效设置方法及电子装置 |
EP3392884A1 (en) * | 2017-04-21 | 2018-10-24 | audEERING GmbH | A method for automatic affective state inference and an automated affective state inference system |
JP7095692B2 (ja) * | 2017-05-23 | 2022-07-05 | ソニーグループ株式会社 | 情報処理装置及びその制御方法、並びに記録媒体 |
JP2020135110A (ja) * | 2019-02-14 | 2020-08-31 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN110853657B (zh) * | 2019-11-18 | 2022-05-13 | 北京小米智能科技有限公司 | 空间划分方法、装置及存储介质 |
CN117676450A (zh) * | 2024-02-02 | 2024-03-08 | 苏州清听声学科技有限公司 | 一种车载虚拟声像的音频播放方法及系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01291526A (ja) | 1988-05-19 | 1989-11-24 | Fujitsu Ltd | ビタビ復号器 |
US5208860A (en) * | 1988-09-02 | 1993-05-04 | Qsound Ltd. | Sound imaging method and apparatus |
US5029200A (en) | 1989-05-02 | 1991-07-02 | At&T Bell Laboratories | Voice message system using synthetic speech |
JP3275247B2 (ja) | 1991-05-22 | 2002-04-15 | 日本電信電話株式会社 | 音声符号化・復号化方法 |
JP3053464B2 (ja) | 1991-07-03 | 2000-06-19 | 富士通株式会社 | 音声符号化装置 |
JPH05199122A (ja) | 1992-01-20 | 1993-08-06 | Canon Inc | 復号回路 |
US5384890A (en) | 1992-09-30 | 1995-01-24 | Apple Computer, Inc. | Method and apparatus for providing multiple clients simultaneous access to a sound data stream |
DE69433258T2 (de) * | 1993-07-30 | 2004-07-01 | Victor Company of Japan, Ltd., Yokohama | Raumklangsignalverarbeitungsvorrichtung |
US5583652A (en) * | 1994-04-28 | 1996-12-10 | International Business Machines Corporation | Synchronized, variable-speed playback of digitally recorded audio and video |
JP3622235B2 (ja) * | 1994-08-26 | 2005-02-23 | 三菱電機株式会社 | 多重化データの復号装置 |
KR0174085B1 (ko) | 1995-08-09 | 1999-04-01 | 조백제 | 다채널 오디오 복호화기의 복합 디코딩장치 |
TW432806B (en) | 1996-12-09 | 2001-05-01 | Matsushita Electric Ind Co Ltd | Audio decoding device |
TW405328B (en) * | 1997-04-11 | 2000-09-11 | Matsushita Electric Ind Co Ltd | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
-
1998
- 1998-04-10 TW TW087105480A patent/TW405328B/zh not_active IP Right Cessation
- 1998-04-10 US US09/058,713 patent/US6356639B1/en not_active Expired - Lifetime
- 1998-04-11 KR KR1019980013966A patent/KR100296838B1/ko not_active IP Right Cessation
- 1998-04-13 CN CNB200410007394XA patent/CN100334810C/zh not_active Expired - Fee Related
- 1998-04-13 CN CN98103260A patent/CN1208288A/zh active Pending
- 1998-04-14 DE DE69841538T patent/DE69841538D1/de not_active Expired - Lifetime
- 1998-04-14 EP EP98106710A patent/EP0871293B1/en not_active Expired - Lifetime
- 1998-04-14 ES ES98106710T patent/ES2340111T3/es not_active Expired - Lifetime
-
2000
- 2000-07-28 KR KR1020000043783A patent/KR100333999B1/ko not_active IP Right Cessation
-
2001
- 2001-11-27 US US09/994,962 patent/US6823310B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20020035407A1 (en) | 2002-03-21 |
KR100296838B1 (ko) | 2001-10-25 |
US6356639B1 (en) | 2002-03-12 |
CN1208288A (zh) | 1999-02-17 |
US6823310B2 (en) | 2004-11-23 |
KR100333999B1 (ko) | 2002-04-25 |
CN100334810C (zh) | 2007-08-29 |
TW405328B (en) | 2000-09-11 |
KR19980081535A (ko) | 1998-11-25 |
EP0871293B1 (en) | 2010-03-10 |
CN1529419A (zh) | 2004-09-15 |
DE69841538D1 (de) | 2010-04-22 |
EP0871293A3 (en) | 2002-05-29 |
EP0871293A2 (en) | 1998-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2340111T3 (es) | Procesamiento de audio para equipo audiovisual. | |
JP5156110B2 (ja) | リアルタイム・マルチチャネル対話型デジタル・オーディオを提供するための方法 | |
JP3563109B2 (ja) | マルチチャンネルデコーダーマトリクスを得るための方法 | |
US20080159095A1 (en) | Pseudo multi-channel stereo play-back apparatus | |
KR970050172A (ko) | 디지탈 신호 처리기, 처리 방법 , 디지탈 신호 기록/재생 장치 및 디지탈 신호 재생 방법 | |
US9990935B2 (en) | System aspects of an audio codec | |
WO2020182020A1 (zh) | 一种音频信号播放方法及显示设备 | |
US20050117056A1 (en) | Audio coding | |
JP2001309308A (ja) | トランスポートストリームのデータパケットを蓄積媒体に記録し又は蓄積媒体から再生する方法及び装置 | |
JP2009188863A (ja) | タイムスタンプ付加装置およびタイムスタンプ付加方法、並びにプログラム | |
EP0892582B1 (en) | Method and apparatus for error masking in multi-channel audio signals | |
KR100490403B1 (ko) | 오디오 스트림의 버퍼링 제어 방법 및 그 장치 | |
JPH10336798A (ja) | 音場補正回路 | |
JP2006106068A (ja) | 音声復号装置 | |
US20060164927A1 (en) | Recording medium, data recording device and method, data reproducing device and method, program, and recording medium | |
JP3491533B2 (ja) | ディジタルオーディオデータの再生方法及び装置 | |
Kawano et al. | Development of the virtual sound algorithm | |
JP2010093614A (ja) | 映像信号再生装置 | |
JP4266427B2 (ja) | 記録再生装置、記録再生方法及びコンピュータ読み取り可能な記憶媒体 | |
JP2003195893A (ja) | 音声再生装置及び音声再生方法 | |
KR100576047B1 (ko) | 녹화된 음성다중 프로그램의 오디오신호 출력방법 | |
JP2010130140A (ja) | 音声再生装置、及び音声再生方法 | |
JP2002063779A (ja) | オーディオチャネルid付加方法、これを用いたオーディオチャネル選択方法及びこれに適した光記録再生装置 | |
JP2004336128A (ja) | 映像・音声信号編集方法 | |
KR20000044779A (ko) | Ac-3 디코더에서의 에러 처리 방법 |