MX2008012250A - Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. - Google Patents

Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.

Info

Publication number
MX2008012250A
MX2008012250A MX2008012250A MX2008012250A MX2008012250A MX 2008012250 A MX2008012250 A MX 2008012250A MX 2008012250 A MX2008012250 A MX 2008012250A MX 2008012250 A MX2008012250 A MX 2008012250A MX 2008012250 A MX2008012250 A MX 2008012250A
Authority
MX
Mexico
Prior art keywords
information
signal
audio decoding
audio
channel
Prior art date
Application number
MX2008012250A
Other languages
English (en)
Inventor
Hee Suk Pang
Dong Soo Kim
Jae Hyun Lim
Sung Yong Yoon
Hyun Kook Lee
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of MX2008012250A publication Critical patent/MX2008012250A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Se proporcionan un método y aparato de codificación de audio y un método y aparato de descodificación en los que las señales de audio se pueden codificar o descodificar de manera que imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto. El método de descodificación de audio incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada, generar información de entrega basada en el dato de control de entrada; y generar información espacial basada en al información de entrega y la información lateral basada en objeto.

Description

MÉTODOS Y APARATOS PARA CODIFICAR Y DESCODIFICAR SEÑALES DE AUDIO BASADAS EN OBJETO CAMPO TÉCNICO El método de descodificación de señal de audio incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar una señal de mezcla descendente modificada basada en la señal de mezcla descendente e información extraida que se extrae de la información lateral basada en objeto; generar información lateral basada en canal basada en la información lateral basada en objeto y dato de control para entregar la señal de mezcla descendente; y generar una señal de audio de multicanal basada en la señal de mezcla descendente modificada y la información lateral basada en canal RAMO ANTERIOR En general, en técnicas de codificación y descodificación de audio de multicanal, un número de señales de canal de una señal de multicanal se mezclan descendentemente en menos señales de canal, información lateral respecto a las señales de canal originales se transmite, y una señal de multicanal que tiene tantos canales como la señal de multicanal original se restaura. Las técnicas de codificación y descodificación basadas en objeto básicamente son similares a las técnicas de codificación y descodificación de audio de multicanal en términos de mezclar descendentemente varias fuentes de sonido en menos señales de fuente de sonido y transmitir información lateral respecto a las fuentes de sonido originales. Sin embargo, en técnicas de codificación y descodificación de audio basadas en objeto, las señales de objeto, que son elementos básicos (v.gr., el sonido de un instrumento musical o una voz humana) de una señal de canal, se tratan igual que las señales de canal en técnicas de codificación y descodificación de audio de multicanal y de esta manera se pueden codificar. En otras palabras, en técnicas de codificación y descodificación de audio basadas en objeto, cada señal de objeto se considera la entidad que se va a codificar. A este respecto, las técnicas de codificación y descodificación dee audio basadas en objeto son diferentes de las técnicas de codificación y descodificación de audio de multicanal en las que una operación de codificación de audio de multicanal se realiza simplemente basada en información de intercanal, independientemente del número de elementos de una señal de canal que se va a codificar. EXPOSICIÓN DE LA INVENCIÓN PROBELMA TÉCNICO La presente invención proporciona un método y aparato de codificación de audio y un método y aparato dee descodificación de audio en los que las señales de audio se pueden codificar o descodificar de manera que las imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto. SOLUCIÓN TÉCNICA De conformidad con un aspecto de la presente invención, se proporciona un método de descodificación de audio que incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada; generar información de entrega basada en el dato de control de entrada; y generar información espacial basada en la información de entrega y la información lateral basada en objeto. De conformidad con otro aspecto de la presente invención, se proporciona un aparato de descodificación de audio que incluye un desmultiplexor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada; un servidor que genera información de entrega basada en el dato de control de entrada, y un transcodificador que generar información espacial basado en la información de entrega y la información lateral basada en objeto. De conformidad con un aspecto de la presente invención, se proporciona un medio de registro legible por computadora que tiene registrado en el mismo un programa de computadora para ejecutar un método de descodificación de audio, el método de descodificación de audio incluyendo extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada, generar información de entrega basada en dato de control de entrada; y generar información espacial basada en la información de entrega y la información lateral basada en objeto. EFECTOS VENTAJOSOS Se proporcionan un método y aparato de codificación de audio y un método y aparato de descodificación de audio en el que las señales de audio se pueden codificar o descodificar de manera que imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto BREVE DESCRIPCIÓN DE LOS DIBUJOS La presente invención quedará más completamente entendida de la descripción detallada proporcionada abajo y los dibujos que se , acompañan, que se proporcionar por ilustración solamente, y de esta manera no son limitativos de la presente invención, y en donde: La Figura 1 es un diagrama de bloque de un sistema de codificación/descodificación de audio basado en objeto típico; La Figura 2 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una primera modalidad de la presente invención; La Figura 3 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una segunda modalidad de la presente invención; La Figura 4 es una gráfica para explicar la influencia de una diferencia de amplitud y una diferencia de tiempo, que son independientes una de la otra, en 1 localización de imágenes de sonido; La Figura 5 es una gráfica de función respecto a la correspondencia entre diferencias de amplitud y diferencias de tiempo que se requieren para localizar imágenes de sonido en una posición predeterminada; La Figura 6 ilustra un formato de dato de control que incluye información armónica; La Figura 7 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una tercera modalidad de la presente invención; La Figura 8 es un diagrama de bloque de un módulo de ganancias de mezcla descendente artística (ADG) que se puede usar en el aparato de descodificación de audio ilustrado en la Figura 7; La Figura 9 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una cuarta modalidad de la presente invención; La Figura 10 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una quina modalidad de la presente invención; La Figura 11 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una sexta modalidad de la presente invención; La Figura 12 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una séptima modalidad de la presente invención; La Figura 13 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una octava modalidad de la presente invención; La Figura 14 es un diagrama para explicar la aplicación de información tridimensional (2D) a un cuadro por el aparato de descodificación de audio ilustrado en la Figura 13; La Figura 15 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una novena modalidad de la presente invención; La Figura 16 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una décima modalidad de la presente invención; Las Figuras 17 a 19 son diagramas para explicar un método de descodificación de audio de conformidad con una modalidad de la presente invención; y La Figura 20 es un diagrama de bloque de un aparato de codificación de audio de conformidad con una modalidad de la presente invención. MEJOR MODO PARA LLEVAR A CABO LA INVENCIÓN La presente invención se describirá a continuación con detalle con referencia a los dibujos que se acompañan en los que se muestran modalidades de ejemplo de la invención. ün método y aparato de codificación de audio y un método y aparato de descodificación de audio de conformidad con la presente invención se pueden aplicar a operaciones de procesamiento de audio basadas en objeto, pero la presente invención no está restringida a esto. En otras palabras, el método y aparato de codificación de audio y el método y aparato de descodificación de audio se pueden aplicar a varias operaciones de procesamiento de señal distintas a operaciones de procesamiento de audio basadas en objeto. La Figura 1 es un diagrama de bloque de un sistema de codificación/descodificación de audio basado en objeto tipico. En general, las señales de audio entradas a un aparato de codificación de audio basado en objeto no corresponden a canales de una señal de multicanal, pero son señales de objeto independientes. A este respecto, un aparato de codificación de audio basado en objeto se diferencia de un aparato de codificación de audio de multicanal al que las señales de canal de una señal de multicanal tienen entrada. Por ejemplo, las señales de canal tales como una señal de canal izquierdo frontal y de una señal de canal derecho frontal de una señal de 5.1-canal puede tener entrada a una señal de audio de multicanal, mientras que las señales de audio de objeto tales como una voz humana o el sonido de un instrumento musical (v.gr., el sonido de un violin o un piano) que son entidades menores que las señales de canal pueden tener entrada a un aparato de codificación de audio basado en objeto. Haciendo referencia a la Figura 1, el sistema de codificación/descodificación de audio basado en objeto incluye un aparato de codificación de audio basado en objeto y un aparato de descodificación de audio basado en objeto. El aparato de codificación de audio basado en objeto incluye un codificador 100 de objeto, y el aparato de descodificación de audio basado en objeto incluye un descodificador 111 de objeto y un servidor 113. El codificador 100 de objeto recibe N señales de audio de objeto, y genera una señal de mezcla descendente basada en objeto con uno o más canales e información lateral que incluye un número de piezas de información extraídas de las N señales de audio de objeto tales como diferencia de energía, diferencia de fase, y valor de correlación. La información lateral y la señal de mezcla descendente basada en objeto se incorporan en una sola corriente de bits, y la corriente de bits se transmite al aparato de descodificación basado en objeto. La información lateral puede incluir una bandera que indica si realizar codificación de audio basada en canal o codificación de audio basada en objeto, y de esta manera, puede determinar si realizar codificación de audio basada en canal o codificación de audio basada en objeto basado en la bandera de la información lateral. La información lateral también puede incluir información de envolvente, información de agrupación, información de periodo de silencio, e información de retraso respecto a señales de objeto. La información lateral también puede incluir información de diferencias de nivel de objeto, información de correlación cruzada de inter-objeto, información de ganancia de mezcla descendente, información de diferencia de nivel de mezcla descendente, e información de energía de objeto absoluta. El descodificador 111 de objeto recibe la señal de mezcla descendente basada en objeto y la información lateral del aparato de codificación de audio basado en objeto, y restaura las señales de objeto que tienen propiedades similares a aquellas de las N señales de audio de objeto basadas en la señal de mezcla descendente basada en objeto y la información lateral. Las señales de objeto generadas por el descodificador 111 de objeto todavía no se han asignado a ninguna posición en un espacio de multicanal. De esta manera, el servidor 113 asigna cada una de las señales de objeto generadas por el decodificador 111 de objeto en una posición predeterminada en un espacio de multicanal y determina los niveles de las señales de objeto de manera que las señales de objeto se puedan reproducir desde posiciones correspondientes respectivas designadas por el servidor 113 con niveles correspondientes respectivos determinados por el servidor 113. La información de control respecto a cada una de las señales de objeto generadas por el descodificador 111 de objeto puede variar durante el tiempo, y de esta manera, las posiciones espaciales y los niveles de las señales de objeto generadas por el descodificador 111 de objeto pueden variar de acuerdo con la información de control. La Figura 2 es un diagrama de bloque de un aparato 120 de descodificación de audio de conformidad con una primera modalidad de la presente invención. Haciendo referencia a la Figura2, el aparato 120 de descodificación de audio incluye un descodificador 121 de objeto, un servidor 123, y un convertidor 125 de parámetro. El aparato 120 de descodificación de audio también puede incluir un desmultiplexor (no mostrado9 que extrae una señal de mezcla descendente e información lateral de una corriente de bits entrada al mismo, y esto se aplicará a todos los aparatos de descodificación de audio de conformidad con las otras modalidades de la presente invención. El descodificador 121 de objeto genera un número de señales de objeto basado en una señal de mezcla descendente e información lateral modificada provista por el convertidor 125 de parámetro. El servidor 123 asigna cada una de las señales de objeto generadas por el descodificador 121 de objeto a una posición predeterminada en un espacio de multicanal y determina los niveles de las se3ñales de objeto generadas por el descodificador 121 de objeto de conformidad con la información de control. El convertidor 125 de parámetro genera la información lateral modificada combinando la información lateral y la información de control. Luego, el convertidor 125 de parámetro transmite la información lateral modificada al descodificador 121 de objeto. El descodificador 121 de objeto puede ser capaz de realizar descodificación de adaptación analizando la información de control en la información lateral modificada. Por ejemplo, si la información de control indica que una primera señal de objeto y una segunda señal de objeto están asignadas a la misma posición en un espacio de multicanal y tienen el mismo nivel, un aparato de descodificación de audio tipico puede descodificar la primera y segunda señales de objeto separadamente, y luego disponerlas en un espacio de multicanal a través de una operación de mezcla/entrega. Por otra parte, el descodificador 121 de objeto del aparato 120 de descodificación de audio aprende de la información de control en la información lateral modificada que la primera y segunda señales de objeto están asignadas a la misma posición en un espacio de multicanal y tienen el mismo nivel como si fueran una sola fuente de sonido. Consecuentemente, el descodificador 121 de objeto descodifica la primera y segunda señales de objeto tratándolas como una sola fuente de sonido sin descodificarlas separadamente. Como resultado, disminuye la complejidad de descodificación. Además, debido a una disminución en el número de fuentes de sonido que necesitan procesarse, también disminuye la complejidad de mezclado/entrega. El aparato 120 de descodificación de audio puede usarse efectivamente en la situación cuando el número de señales de objeto es mayor que el número de canales de salida porque una pluralidad de señales de objeto son altamente probables de ser asignadas a la misma posición espacial. Alternativamente, el aparato 120 de descodificación de audio se puede usar en la situación cuando la primera señal de objeto y la segunda señal de objeto son asignadas a la misma posición en un espacio de multicanal pero tienen diferentes niveles. En este caso, el aparato 120 de descodificación de audio descodifica la primera y segunda señales de objeto tratando la primera y segunda señales de objeto como una sola, en lugar de descodificar la primera y segunda señales de objeto separadamente y transmitir la primera y segunda señales de objeto descodificadas al servidor 123. Más específicamente, el descodificador 121 de objeto puede obtener información respecto a la diferencia entre los niveles de la primera y segunda señales de objeto de la información de control en la información lateral modificada, y descodificar la primera y segunda señales de objeto basado en la información obtenida. Como resultado, aún cuando la primera y segunda señales de objeto tengan diferentes niveles, la primera y segunda señales de objeto se pueden descodificar como si fueran una sola fuente de sonido. Todavía alternativamente, el descodificador 121 de objeto puede ajustar los niveles de las señales de objeto generadas por el descodificador 121 de objeto de conformidad con la información de control. Luego, el descodificador 121 de objeto puede descodificar las señales de objeto cuyos niveles están ajustados. Consecuentemente, el servidor 123 no necesita ajustar los niveles de las señales de objeto descodificadas proporcionadas por el descodificador 121 de objeto sino simplemente dispone las señales de objeto descodificadas proporcionadas por el descodificador 121 de objeto en un espacio de multicanal. Brevemente, puesto que el descodificador 121 de objeto ajusta los niveles de las señales de objeto generadas por el descodificador 121 de objeto de acuerdo con la información de control, el servidor 123 puede disponer fácilmente las señales de objeto generadas por el descodificador 121 de objeto en un espacio de multicanal sin la necesidad de ajustar adicionalmente los niveles de las señales de objeto generadas por el descodificador 121 de objeto. Por lo tanto, es posible reducir la complejidad de la mezcla/entrega. De conformidad con la modalidad de la Figura 2, el descodificador de objeto del aparato 120 de descodificación de audi9o puede realizar de manera adaptable una operación de descodificación a través del análisis de la información de control, reduciendo de esta manera la complejidad de descodificación y la complejidad de mezcla/entrega. Una combinación de los métodos arriba descritos realizados por el aparato 120 de descodificación de audio se puede usar. La Figura 3 es un diagrama de bloque de un aparato 130 de descodificación de audio de conformidad con una segunda modalidad de la presente invención. Haciendo refer4encia a la Figura 3, el aparato 130 de descodificación de audio incluye un descodificador 131 de objeto y un servidor 133. El aparato 130 de descodificación de audio se caracteriza por proporcionar información lateral no solamente al descodificador 131 de objeto sino también al servidor 133.
El aparato 130 de descodificación de audio puede realizar efectivamente una operación de descodificación aún cuando haya una señal de objeto correspondiente a un período de silencio. Por ejemplo, la segunda a cuarta señales de objeto pueden corresponder a un período de reproducción de música durante el que se toca un instrumento musical, y una primera señal de objeto puede corresponder a un período de silencio durante el que se toca un acompañamiento. En este caso, la información que indica cual de una pluralidad de señales de objeto corresponde a un período de silencio se puede incluir en la información lateral, y la información lateral se puede proporcionar al servidor 133 así como al descodificador 131 de objeto. El descodificador 131 de objeto puede reducir al mínimo la complejidad de descodificar por no descodificar una señal de objeto correspondiente a un período de silencio. El descodificador 131 de objeto ajusta una señal de objeto correspondiente a un valor de 0 y transmite el nivel de la señal de objeto al servidor 133. En general, las señales de objeto que tienen un valor de 0 se tratan igual que las señales de objeto que tienen un valor, distinto a 0 y de esta manera se someten a una operación de mezcla/entrega. Por otra parte, el aparato 130 de descodificación de audio transmite información lateral que incluye información que indica cual de una pluralidad de señales de objeto corresponde a un periodo de silencio al servidor 133 y de esta manera puede prevenir que una señal de objeto correspondiente a un periodo de silencio sea sometida a una operación de mezcla/entrega realizada por el servidor 133. Por lo tanto, el aparato 130 de descodificación de audio puede prevenir un aumento innecesario en la complejidad de mezcla/entrega . El servidor 133 puede usar información de parámetro de mezcla que se incluye en la información de control para localizar una imagen de sonido de cada señal de objeto en una escena estéreo. La información de parámetro de mezcla puede incluir información de amplitud solamente, o ambas, información de amplitud e información de tiempo. La información de parámetro de mezcla afecta no solamente la localización de imágenes de sonido estéreo sino también la percepción psicoacústica de una calidad de sonido espacial por un usuario. Por ejemplo, al comparar dos imágenes de sonido que se generan usando un método de encuadramiento de tiempo y un método de encuadramiento de amplitud, respectivamente, y se reproducen en la misma ubicación usando un parlante estéreo de 2 canales, se reconoce que el método de encuadramiento de amplitud puede contribuir a una localización precisa de imágenes de sonido, y que el método de encuadramiento de tiempo puede proporcionar sonidos naturales con una sensación profunda de espacio. De esta manera, si el servidor 133 solamente usa el método de encuadramiento de amplitud para disponer señales de objeto es un espacio de multicanal, el servidor 133 puede ser capaz de localizar precisamente cada imagen de sonido, pero puede no ser capaz de proporcionar una sensación tan profunda de sonido como cuando se usa el método de encuadramiento de tiempo. Los usuarios en ocasiones pueden preferir una localización precisa de imágenes de sonido o una sensación profunda de sonido o viceversa de acuerdo con el tipo de fuentes de sonido. Las Figuras 4(a) y 4(b) explican la influencia de intensidad (diferencia de amplitud) y una diferencia de tiempo en la localización de imágenes de sonido como se realiza en la reproducción de señales con un parlante estéreo de 2-canales. Haciendo referencia a las Figuras 4(a) y 4(b), una imagen de sonido se puede localizar en un ángulo predeterminado de acuerdo con una diferencia de amplitud y una diferencia de tiempo que son independientes una dee la otra. Por ejemplo, una diferencia de amplitud de alrededor de 8 dB o una diferencia de tiempo de alrededor de 0.5 ms, que es equivalente a la diferencia de amplitud de 8 dB, se puede usar4 para localizar una imagen de sonido a un ángulo de 20. Por lo tanto, aún cuando solamente una diferencia de amplitud se proporcione como información de parámetro de mezclado, es posible obtener diversos sonidos con diferentes propiedades convirtiendo la diferencia de amplitud en una diferencia de tiempo que es equivalente a la diferencia de amplitud durante la localización de las imágenes de sonido. La Figura 5 ilustra funciones respecto a la correspondencia entre diferencias de amplitud y diferencias de tiempo que se requieren para Idealizar imágenes de sonido a ángulos de 10, 20 y 30. La función ilustrada en la Figura 5 se puede obtener basado en las Figuras 4(a) y 4(b). Haciendo referencia a la Figura 5, diversas combinaciones de diferencia de amplitud-diferencia de tiempo se pueden proporcionar para localizar una imagen de sonido en una posición predeterminada. Por ejemplo, supóngase que una diferencia de 8 dB se proporciona como información de parámetro de mezclado a fin de localizar una imagen de sonido a un ángulo de 20. De conformidad con la función ilustrada en la Figura 5, una imagen de sonido también se puede localizar en el ánhgulo de 20 usando la combinación de una diferencia de amplitud de 3 dB y una diferencia de tiempo de 03. ms. En este caso, no solamente la información de diferencia de amplitud sino también la información de diferencia destiempo se puede proporcionar como información de parámetro de mezcla, mejorando de esta manera la sensación de espacio. Por lo tanto, a fin de generar sonidos con propiedades deseadas por un usuario durante una operación de mezcla/entrega, la información de parámetro de mezcla se puede convertir apropiadamente de modo que cualquiera de encuadramiento de amplitud y encuadramiento de tiempo sea apropiado para que el usuario pueda realizar. Es decir, si la información de parámetro de mezcla solamente incluye información de diferencia de amplitud y el usuario desea sonidos con una sensación profunda de espacio, la información de diferencia de amplitud se puede convertir en información de diferencia de tiempo equivalente a la información de diferencia de amplitud con referencia a dato psicoacústico. Alternativamente, si el usuario desea ambos sonidos con una sensación profunda de espacio y una localización precisa de imágenes de sonido, la información de diferencia de amplitud se puede convertir en una combinación de información de diferencia de amplitud e información de diferencia de tiempo equivalente a la información de amplitud original.
Alternativamente, si la información de parámetro de mezcla solo incluye información de diferencia de tiempo y un usuario prefiere una localización precisa de imágenes de sonido, la información de diferencia de tiempo se puede convertir en información de diferencia de amplitud equivalente a la información de diferencia de tiempo, o se puede convertir en la combinación de información de diferencia de amplitud e información de diferencia de tiempo que puede satisfacer la preferencia del usuario mejorando tantota precisión de localización de imágenes de sonido como la sensación de espacio. Todavía alternativamente, si la información de parámetro de mezcla incluye ambas información de diferencia de amplitud e información de diferencia de tiempo y un usuario prefiere una localización precisa de imágenes de sonido, la combinación de la información de diferencia de amplitud y la información de diferencia de tiempo se puede convertir en información de diferencia de amplitud equivalente a la combinación de la información de diferencia de amplitud original y la información de diferencia de tiempo. Por otra parte, si la información de parámetro de mezcla incluye ambas, información de diferencia de amplitud e información dee diferencia de tiempo y un usuario prefiere la mejora de la sensación de espacio, la combinación de la información de diferencia de amplitud y la información de diferencia de tiempo se puede convertir en información de diferencia de tiempo equivalente a la combinación de la información de diferencia de amplitud y la información de diferencia de tiempo original. Haciendo referencia a la Figura 6, la información de control puede incluir información de mezcla/entrega e información armónica respecto a una o más señales de objeto. La información armónica puede incluir cuando menos una de información de paso, información de frecuencia fundamental, e información de banda de frecuencia dominante respecto a una o más señales de objeto, y descripciones de la energía y espectro de cada subbandas de cada una de las señales de objeto. La información armónica se puede usar para procesar una señal de objeto durante una operación de entrega debido a que la resolución de un servidor que realiza su operación en unidades de subbandas es insuficiente Si la información armónica incluye información de paso respecto a una o más señales de objeto, la ganancia de cada una de las señales de objeto se puede ajustar atenuando o reforzando un dominio de frecuencia predeterminado usando un filtro de peine o un filtro de peine inverso. Por ejemplo, si una de una pluralidad de señales de objeto es una señal vocal, las señales de objeto se pueden usar en un karaoke atenuando solamente la señal vocal. Alternativamente, sila información armónica incluye información de dominio de frecuencia dominante respecto a una o más señales de objeto, un proceso de atenuación o refuerzo de un dominio de frecuencia dominante se puede realizar. Todavía alternativamente, si la información armónica incluye información de espectro respecto a una o más señales de objeto, la ganancia de cada una de las señales de objeto se puede controlar realizando atenuación o refuerzo sin estar restringida por ningunos límites de subbsnda. La Figura 7 es un diagrama de bloque de un aparato 140 de descodificación de audio de conformidad con otra modalidad de la presente invención. Haciendo referencia a la Figura 7, el aparato 140 de descodificación de audio usa un descodificador 141 de multicanal, en lugar de un descodificador de objeto y un servidor, y descodifica un número de señales de objeto después de que las señales de objeto están apropiadamente dispuestas en un espacio de multicanal . Más específicamente, el aparato 140 de descodificación de audio incluye el descodificador 141 de multicanal y un convertidor 145 de parámetro. El descodificador 141 de multicanal genera una señal de multicanal cuyas señales de objeto ya se han dispuesto en un espacio de multicanal basadas en una señal de mezcla descendente e información de parámetro espacial, que es información lateral basada en canal proporcionada por el convertidor 145 de parámetro. El convertidor 145 de parámetro analiza la información lateral e información de control transmitidas por un aparato de codificación de audio (no mostrado) , y genera la información de parámetro espacial basado en el resultado del análisis. Más específicamente, el convertidor 145 de parámetro genera la información de parámetro espacial combinando la información lateral y la información de control que incluye información de establecimiento de reproducción e información de mezcla. Es decir, la conversión 145 de parámetro realiza la conversión de la combinación de la información lateral y la información de control a dato espacial correspondiente a una caja de Uno-A-dos (OTT) o una caja de dos-A-Tres (TTT) . El aparato 140 dee descodificación de audio puede realizar una operación de descodificación de multicanal hacia la que una operación de descodificación basada en objeto y una operación de mezcla/entrega se incorporan y de esta manera puede saltar la descodificación de cada señal de objeto. Por lo tanto, es posible reducir la complejidad de descodificación y/o mezcla/entrega. Por ejemplo, cuando hay? 10 señales de objeto y una señal de multicanal obtenida basada en las 10 señales de objeto se va a reproducir por un sistema de reproducción de parlante de 5.1 canal, un aparato de descodificación de audio basado en objeto típico genera señales descodificadas respectivamente correspondientes a las 10 señales de objeto basado en una señal de mezcla descendente e información lateral y luego genera una señal de 5.1 canal disponiendo apropiadamente las 10 señales de objeto en un espacio de multicanal de manera que las señales de objeto puedan hacerse apropiadas para un ambiente de parlante de 5.1 canal. Sin embargo, es ineficiente generar 10 señales de objeto durante la generación de una señal de 5.1 canal, y este problema se hace más severo a medida que aumen5ta la diferencia entre el número de señales de objeto y el número de canales de una señal de multicanal que se va a generar. Por otra parte, de conformidad con la modalidad de la Figura 7, el aparato 140 de descodificación de audio genera información de parámetro espacial apropiada para una señal de 5.1-canal basada en información lateral e información de control, y proporciona la información de parámetro espacial y una señal de mezcla descendente al descodificador 141 de multicanal. Luego, el descodificador 141 de multicanal genera una señal de 5.1 canal basado en la información de parámetro espacial y la señal de mezcla descendente. En otras palabras, cuando el número de canales a que se va a dar salida es 5.1 canales, el aparato 140 de descodificación de audio puede generar fácilmente una señal de 5.1-canal basado en una señal de mezcla descendente sin la necesidad de generar 10 señales de objeto y de esta manera es más eficiente que un aparato de descodificación de audio convencional en términos de complejidad. El aparato 140 de descodificación de audio se considera eficiente cuando la cantidad de computación requerida calcula información de parámetro espacial correspondiente a cada una de una caja OTT y una caja TTT a través del análisis de información lateral e información de control transmitidas por un aparato de codificación de audio es menos que la cantidad de computación requerida para realizar una operación de mezcla/entrega después de la descodificación de cada señal de objeto. El aparato 140 de decodificación de audio puede obtenerse simplemente añadiendo un módulo para generar información de parámetro espacial a través del análisis de información lateral e información de control a un aparato de descodificación de audio de multicanal típico, y de esta manera puede mantener la compatibilidad con un aparato de descodificación de audio de multicanal típico. Asimismo, el aparato 140 de descodificación de audio puede mejorar la calidad de sonido usando herramientas existentes de un aparato de descodificación de audio de multicanal típico tal como un configurador de envolvente, una herramienta de procesamiento temporal de subbandas (STP) , y un descorrelacionador. Dado todo esto, se concluye que todas las ventajas de un método de descodificación de audio de multicanal típico se pueden aplicar fácilmente a un método de descodificación de audio de objeto. La información de parámetro espacial transmitida al descodificador 141 de multicanal por el convertidor 145 de parámetro puede haberse comprimido de manera de ser apropiada para ser trasmitida. Alternativamente, la información de parámetro espacial puede tener el mismo formato que aquel del dato transmitido por un aparato de codificación de multicanal típico. Es decir, la información de parámetro espacial puede haberse sometido a una operación de descodificación de Huffman o una operación de descodifricación piloto y de esta manera se puede transmitir a cada módulo como dato de marca espacial no comprimido. El formador es apropiado para transmitir la información de parámetro espacial a un aparato de descodificación de audio de multicanal en un lugar remoto, y el último es conveniente debido a que no hay necesidad de un aparato de descodificación de audio de multicanal para convertir dato de marca espacial comprimido en dato de marca espacial no comprimido que se puede usar fácilmente en una operación de descodificación. La configuración de información de parámetro espacial basada en el análisis de información lateral e información de control puede ocasionar un retraso entre una señal de mezcla descendente y la información de parámetro espacial. A fin de dirigir esto, una memoria intermedia adicional se puede proporcionar ya sea para una señal de mezcla descendente o para información de parámetro espacial de manera que la señal de mezcla descendente y la información de parámetro espacial se puedan sincronizar entre si. Estos métodos, sin embargo, son inconvenientes debido al requerimiento de proporci8onar una memoria intermedia adicional. Alternativamente, la información lateral puede ser transmitida antes de una señal de mezcla descendente en consideración a la posibilidad de la ocurrencia de un retraso entre una señal de mezcla descendente e información de parámetro espacial. En este caso, la información de parámetro espacial obtenida combinando la información lateral e información de control no necesita ajustarse sino que se usa fácilmente . Si una pluralidad de señales de objeto de una señal de mezcla descendente tienen diferentes niveles, un módulo de ganancias de mezcla descendente artística (ADG) que puede compensar directamente por la señal de mezcla descendente puede determinar los niveles relativos de las señales de objeto, y cada una de las señales de objeto se puede asignar a una posición predeterminada en un espacio de multicanal usando dato de marca espacial tal como información de diferencia de nivel de canal, información de correlación de intercanal (ICC), e información de coeficiente de predicción de canal (CPC) . Por ejemplo, si la información de control indica que una señal de objeto predeterminada se va a asignar a una posición predeterminada en un espacio de multicanal y tiene un nivel superior que otras señales de objeto, un descodificador de multicanal típico puede calcular la diferencia entre las energías de canales de una señal de mezcla descendente, y dividir la señal de mezcla descendente en un número de canales de salida basado en los resultados del cálculo. Sin embargo, un descodificador de multicanal típico no puede aumentar ni reducir el volumen de un cierto sonido en una señal de mezcla descendente. En otras palabras, un descodificador de multicanal típico simplemente distribuye una señal de mezcla descendente en un número de canales de salida y de esta manera no puede aumentar ni reducir el volumen de un sonido en la señal de mezcla descendente. Es relativamente fácil asignar cada uno de una número de señales de objeto de una señal de mezcla descendente generada por un codificador de objeto a una posición predeterminada en un espacio de multicanal de conformidad con la información de control. Sin embargo, se requieren técnicas especiales para aumentar o reducir la amplitud de una señal de objeto predeterminada. En otras palabras, si una señal de mezcla descendente generada por un codificador de objeto se usa como está, es difícil reducir la amplitud de cada señal de objeto de la señal de mezcla descendente. Por lo tanto, de conformidad con una modalidad de la presente invención, las amplitudes relativas de las señales de objeto se pueden variar de conformidad con información de control usando un módulo 147 de ADG ilustrado en la Figura 8. Más específicamente, la amplitud de cualquiera de una pluralidad de señales de objeto de una señal de mezcla descendente transmitida por un codificador de objeto puede aumentarse o reducirse usando el módulo 147 de ADG. Una señal de mezcla descendente obtenida por compensación realizada por el módulo 147 de ADG se puede someter a descodificación de multicanal. Si las amplitudes relativas de señales de objeto de una señal de mezcla descendente están apropiadamente ajustadas usando el modulo 147 de ADG, es posible realizar descodificación de objeto usando un descodificador de canal típico. Si una señal de mezcla descendente generada por un codificador de objeto es una señal mono o estéreo o una señal de multicanal con tres o más canales, la señal de mezcla descendente se puede procesar mediante el módulo 147 de ADGT. Si una señal de mezcla descendente generada por un codificador de objeto tiene dos o más canales y una señal de objeto predeterminada que necesita ser ajustada por el módulo 147 de ADG solamente existe en uno de los canales de la señal de mezcla descendente, el módulo 147 de ADG se puede aplicar solamente a todos los canales de una señal de mezcla descendente. Una señal de mezcla descendente procesada por el módulo 147 de ADG en la forma arriba descrita puede procesarse fácilmente usando un descodificación de multicanal típico sin la necesidad de modificar la estructura del decodificador de multicanal. Aún cuando una señal de salida final no sea una señal de multicanal que se puede reproducir por un parlante de multicanal, pero es una señal biaural, el módulo 147 de ADG se puede usar para ajustar las amplitudes relativas de las señales de objeto de la señal de salida final. Alternativamente al uso del módulo 147 de ADG, la información de ganancia que especifica un valor de ganancia para aplicarse a cada señal de objeto se puede incluir en información de control durante la generación de un número de se3ñales de objeto. Para esto, la estructura de un descodificador de multicanal típico sé puede modificar. Aún cuando se requiere una modificación de la estructura de un descodificador de multicanal existente, este método es conveniente en términos de reducir la complejidad de descodificación aplicando un valor de ganancia a cada señal de objeto durante una operación de descodificación sin la necesidad de calcular ADG y compensar para cada señal de objeto. La Figura 9 es un diagrama de bloque de un aparato 150 de descodificación de audio de conformidad con una cuarta modalidad de la presente invención. Haciendo referencia a la Figura 9, el aparato 150 de descodificación de audio se caracteriza por generar una señal biaural. Más específicamente, el aparato 150 de descodificación de audio incluye un descodificador 151 biaural de multicanal, un primer convertidor 157 de parámetro y un segundo convertidor de parámetro. El segundo convertidor 159 de parámetro analiza información lateral e información de control que se proporcionan por un aparato de codificación de audio, y configura información de parámetro espacial basado en el resultado del análisis. El primer convertidor 157 de parámetro configura información de parámetro biaural, que se puede usar por el descodificador 151 biaural de multicanal, añadiendo información tridimensional (3D) tal como parámetros de función de transferencia relacionada con cabeza (HRTF) a la información de parámetro espacial. El descodificador 151 biaural de multicanal genera una señal tridimensional (3D) virtual aplicando la información de parámetro 3D virtual a una señal de mezcla descendente. El primer convertidor 157 de parámetro y el segundo convertidor 159 de parámetro se pueden reemplazar por un solo módulo, es decir, un módulo 155 de conversión de parámetro que recibe la información lateral, la información de control, y los parámetros de HRTF y configura la información de parámetro biaural basado en la información lateral, la información de control, y los parámetros de HRTF. Convencionalmente, a fin de generar una señal biaural para la reproducción de una señal de mezcla descendente que incluye 10 señales de objeto con un casco telefónico, una señal de objeto debe generar 10 señales descodificadas respectivamente correspondientes a las 10 señales de objeto basado en la señal de mezcla descendente y la información lateral. A continuación , un servidor asigna cada una de las 10 señales de objeto a una posición predeterminada en un espacio de multicanal con referencia a información de control de manera de ser apropiada a un ambiente de parlante de 5-canal. A continuación, el servidor genera una señal de 5-canal que se puede reproducir usando un parlante de 5-canal. A continuación, el servidor aplica parámetros de HRTF a la señal de 5-canal, generando de esta manera una señal de 2-canal. Brevemente, el método de descodificación de audio convencional arriba mencionado incluye reproducir 10 señales de objeto, convertir las 10 señales de objeto en una señal de 5-canal, y generar una señal de 2-canal basado en la señal de 5-canal, y de esta manera es ineficiente. Por otra parte, el aparato 150 de descodificación de audio puede generar fácilmente una señal biaural que se puede reproducir usando un casco telefónico basado en señales de audio de objeto. Además, el aparato 150 de descodificación de audio configura información de parámetro espacial a través del análisis de información lateral e información de control, y de esta manera puede generar una señal biaural usando un descodificador biaural de multicanal típico. Además, el aparato 150 de descodificación de audio todavía puede usar un descodificador biaural de multicanal típico aún cuando esté equipado con un convertidor de parámetro incorporado que recibe información lateral, información de control, y parámetros de HRTF y configura la información e parámetro biaural basado en la información lateral, la información de control,, y los parámetros de HRTF. La Figura 10 es un diagrama de bloque de un aparato 160 de descodificación de audio de conformidad con una quinta modalidad de la presente invención. Haciendo referencia a la Figura 10, el aparato 160 de descodificación de audio incluye un procesador 161 de mezcla descendente, un descodificador 163 de multicanal, y un convertidor 165 de parámetro. El procesador 161 de mezcla descendente y el convertidor 163 de parámetro se pu3eden reemplazar por un solo módulo 167. El convertidor 165 de parámetro genera información de parámetro espacial, que se puede usar por el descodificador 163 de multicanal, e información de parámetro, que se puede usar por el procesador 161 de mezcla descendente. El procesador 161 de mezcla descendente realiza una operación de procesamiento previo en una señal de mezcla descendente, y transmite una señal de mezcla descendente que resulta de la operación de procesamiento previo al descodificador 163 de multicanal. El descodificador 163 de multicanal realiza una operación de descodificación en la señal de mezcla descendente transmitida por el procesador 161 de mezcla descendente, dando salida de esta manera a una señal estéreo, una señal estéreo biaural o una señal de multicanal. Ejemplos de la operación de procesamiento previo realizada por el procesador 161 de mezcla descendente incluyen la modificación o conversión de una señal de mezcla descendente en un dominio de tiempo o un dominio de frecuencia usando filtración. Si una señal de mezcla descendente entrada al aparato 160 de descodificación de audio es una señal estéreo, la señal de mezcla descendente puede haberse sometido a un procesamiento previo de mezcla descendente realizado por el procesador 161 de mezcla descendente antes de tener entrada al descodificador 163 de multicanal debido a que el descodificador 163 de multicanal no puede mapear un componente de la señal de mezcla descendente correspondiente a un canal izquierdo, que es uno de los canales múltiples, a un canal derecho, que es otro de los múltiples canales. Por lo tanto, a fin de desplazar la posición de una señal de objeto clasificada en el canal izquierdo a la dirección del canal derecho, la señal de mezcla descendente entrada al aparato 160 de descodificación de audio se puede procesar previamente por el procesador 161 de mezcla descendente, y la señal de mezcla descendente previamente procesada puede tener entrada al descodificador 163 de multicanal. El procesamiento previo de una señal de mezcla descendente estéreo se puede realizar basado en información de procesamiento previo obtenida de la información lateral y de la información de control. La Figura 11 es un diagrama de bloque de un aparato 170 de descodificación de audio de conformidad con una sexta modalidad de la presente invención. Haciendo referencia a la Figura 11, el aparato 170 de descodificación de audio incluye un descodificador 171 de multicanal, un procesador 173 de canal y un convertidor 175 de parámetro. El convertidor 175 de parámetro genera información de parámetro espacial, que se puede usar mediante el descodificador 173 de multicanal, e información de parámetro, que se puede usar por el procesador 173 de canal. El procesador 173 de canal realiza una operación de procesamiento posterior en una señal salida por el descodificador 173 de multicanal. Ejemplos de la salida de señal por el descodificador 173 de multicanal incluyen u7na señal estéreo, una señal estéreo biaural y una señal de multicanal . Ejemplos de la operación de procesamiento posterior realizada por el procesador 173 posterior incluyen la modificación y conversión de cada canal o todos los canales de una señal de salida. Por ejemplo, si la información lateral incluye información de frecuencia fundamental respecto a una señal dee objeto pre3determinada, el procesador 173 de canal puede remover los componentes armónicos de una señal de objeto predeterminada con referencia a la información de frecuencia fundamental. Un método de descodificación de audio de multicanal puede no ser suficientemente eficiente para usarse en un sistema de karaoke. Sin embargo, si la información de frecuencia fundamental respecto a señales de objeto vocal se remueven durante una operación de procesamiento posterior, es posible realizar un sistema de karaoke de alto funcionamiento usando la modalidad de la Figura 11. La modalidad de la Figura 11 también se puede aplicar a señales de objeto, distintas a señales de objeto vocal. Por ejemplo, es posible remover el sonido de un instrumento musical predeterminado usando la modalidad de la Figura 11. También, es posible amplificar componentes armónicos predeterminados usando información de frecuencia fundamental respecto a señales de objeto utilizando la modalidad de la Figura 11. El procesador 173 de canal puede realizar procesamiento de efecto adicional en una señal de mezcla descendente. Alternativamente, el procesador 173 de canal puede añadir una señal obtenida por el procesamiento de efecto adicional a una señal salida por el descodificador 171 de multicanal. El procesador 173 de canal puede cambiar el espectro de un objeto o modificar una señal de mezcla descendente siempre que sea necesario. Si no es apropiado realizar directamente una operación de procesamiento de efecto tal como reverberación en una señal de mezcla descendente y transmitir una señal obtenida por la operación de procesamiento de efecto al descodificador 171 de multicanal, el procesador 173 de mezcla descendente puede añadir la señal obtenida por la operación de procesamiento de efecto a la salida del descodificador 171 de multicanal, en lugar de realizar procesamiento de efecto en la señal de mezcla descendente. El aparato 170 de descodificación de audio se puede diseñar para incluir no solamente el procesador 173 de canal sino también el procesador de mezcla descendente. En este caso, el procesador de mezcla descendente puede disponerse en frente del descodificador 173 de multicanal, y el procesador 173 de canal se puede disponer detrás del descodificador 173 de3 multicanal. La Figura 12 es un diagrama de bloque de un aparato 210 de descodificación de audio de conformidad con una séptima modalidad de la presente invención. Haciendo referencia a la Figura 12, el aparato 210 de descodificación de audio usa un descodificador 213 de multicanal, en lugar de un descodificador de objet5o. Más específicamente, el aparato 210 de descodificación de audio incluye el descodificador 213 de multicanal, un transcodificador 215, un servidor 217, k y una base 217 de datos de información 3D. El servidor 217 determina las posiciones 3D de una pluralidad de señales de objeto basado en información 3D correspondiente a dato de índice incluido en la información de control. El transcodificador 215 genera información lateral basada en canal sintetizando información de posición respecto a un número de señales de audio de objeto a las que3 se aplica información 3D por el servidor 217. El descodificador 213 de multicanal da salida a una señal 3D aplicando la información lateral basada en canal a una señal de mezcla descendente. Una función de transferencia relacionada con cabeza (HRTF) se puede usar como la información 3D. Una HRTF es una función de transferencia que describe la transmisión de ondas de sonido entre una fuente de sonido en una posición arbitrarias y el tambor de oído, y regresa un valor que varía de acuerdo con la dirección y altitud de la fuente de sonido. Si una señal sin directividad se filtra usando la HRTF, la señal se puede oír como se fuera reproducida desde una cierta dirección. Cuando se recibe una corriente de bits de entrada, el aparato 210 de descodificación de audio extrae una señal de mezcla descendente basada en objeto e información dee parámetro basada en objeto de una corriente de bits de entrada usando un desmultiplexor (no mostrado) . Luegto, el servidor 217 extrae dato de Indice de información de control, que se usa para determinar las posiciones de una pluralidad de señales de audio de objeto, y retira información 3D correspondiente al dato de índice extraído de la base 219 de datos de información 3D. Más específicamente, la información de parámetro de mezcla, que se incluy3e en información de control que se usa por el aparato 210 de descodificación de audi8o, pude incluir no solamente información de nivel sino también dato de índice necesario para buscar información 3D. La información de parámetro de mezcla también puede incluir información de tiempo respecto a la diferencia de tiempo entre canales, información de posición y uno o más parámetros obtenidos combinando apropiadamente la información de nivel y la información de tiempo. La posición de una señal de audio de objeto se puede determinar inicialmente de conformidad con información de parámetro de mezcla de falla, y se puede cambiar posteriormente aplicando información 3D correspondiente a una posición deseada por un usuario a la señal de audio de objeto. Alternativamente, si el usuario desea aplicar un efecto 3D solamente a varias señales de audio de objeto, la información de nivel y la información de tiempo respecto a otras señales de audio de objeto a las que el usuario no desea aplicar un efecto 3D se pueden usar como información de parámetro de mezcla. El transcodificador 217 genera información lateral basada en canal respecto a M canales sintetizando la información de parámetro basada en objeto respecto a N señales de objeto transmitidas por un aparato de codificación de audio e información de posición de un número de señales de objeto a las que la información 3D tal como una HRTF se aplica por el servidor 217. El descodificador 213 de multicanal genera una señal de audio basada en una señal de mezcla descendente y la información lateral basada en canal provista por el transcodificador 217, y genera una señal de multicanal 3D realizando una operación de entrega de 3D usando información 3D incluida en la información lateral basada en canal. La Figura 13 es un diagrama de bloque de un aparato 220 de descodificación de audio de conformidad con una oct5ava modalidad de la presente invención. Haciendo referencia a la Figura 13, el aparato 220 de descodificación de audio es diferente del aparato 210 de descodificación de audio ilustrado en la Figura 12 en que un transcodificador 225 transmite información lateral basada en canal e información 3D separadamente a un descodificador 223 de multicanal. En otras palabras, el transcodificador 225 del aparato 220 de descodificación de audio obtiene información lateral basada en canal respecto a M canales de información de parámetro basada en objeto respecto a N señales de objeto y transmite la información lateral basada en canal e información 3D, que se aplica a cada una de las N señales de objeto, al descodificador 223 de multicanal, mientras que el transcodificador 217 del aparato 210 de descodificación de audio transmite información lateral basada en canal incluyendo información 3D a un descodificador 213 de multicanal . Haciendo referencia a la Figura 14, la información lateral basada en canal y la información 3D pueden incluir una pluralidad de Índices de cuadro. De esta manera, el descodificador 223 de multicanal puede sincronizar la información lateral basada en canal y la información 3D con referencia a los índices de cuadro de cada una de la información lateral basada en canal y la información 3D, y de esta manera puede aplicar información 3D a un cuadro de una corriente de bits correspondiente a la información 3d. Por ejemplo, la información 3D que tiene índice se puede aplicar al principio del cuadro 2 lúe tiene el índice 2.
Puesto que la información basada en canal y la información 3D ambas incluyen índices de cuadro, es posible determinar efectivamente una posición temporal de la información lateral basada en canal a la que la información 3D se va a aplicar, aún cuando la información 3D sea actualizada con el tiempo. En otras palabras, el transcodificador 225 incluye información 3D y un número de índices de cuadro en información lateral basada en canal, y de esta manera, el descodificador 223 de multicanal puede sincronizar fácilmente la información lateral basada en canal y la información 3D. El procesador 231 de mezcla descendente, el transcodificador 235, el servidor 237 y6 la base de datos de información 3D se pueden reemplazar por un solo módulo 239. La Figura 15 es un diagrama de bloque de un aparato 230 de descodificación de audi8o de conformidad con una novena modalidad de la presente invención. Haciendo referencia a la Figura 15, el aparato 230 de descodificación de audio se diferencia del aparato 220 de descodificación de audio ilustrado en la Figura 14 por incluir además un procesador 231 de mezcla descendente. Más específicamente, el aparato 230 de descodificación de audio incluye un transcodificador 235, un servidor 237, una base 239 de datos de información 3D, un descodificador 233 de multicanal, y el procesador 231 de mezcla descendente. El transcodificador 235, el servidor 237, la base 239 de datos de información 3D, y el descodificador 233 de multicanal son los mismos que sus contrapartes respectivas ilustradas en la figura 14. El procesador 231 de mezcla descendente realiza una operación de procesamiento previo en una señal de mezcla descendente es5téreo para ajuste de posición. La base 239 de datos de información 3D se puede incorporar con el servidor 237. ü/n modulo para aplicar un efecto predeterminado una señal de mezcla descendente también se puede proporcionar en el aparato 230 de descodificación de audio. La Figura 16 ilustra un diagrama de bloque de un aparato 240 de descodificación de audio de conformidad con una décima modalidad de la presente invención. Haciendo referencia a la Figura 16, el aparato 240 de descodificación de audio se diferencia del aparato 230 de descodificación de audio ilustrado en la Figura 15 por incluir un combinador 241 de unidad de control de multipunto. Es decir, el apar4ato 240 de descodificación de audio, como el aparato 230 de descodificación de audio, incluye un procesador 243 de mezcla descendente, un descodificador 244 de multicanal, un tanscodificador 245, un servidor 247, y una base 249 de datos de información 3D. El combinador 241 de unidad de control de multipunto combina una pluralidad de corrientes de bits obtenidas codificando en base de objeto, obteniendo de esta manera una sola corriente de bits. Por ejemplo, cuando una primera corriente de bits para una primera señal de audio y una segunda corriente de bits para una segunda señal de audio tienen entrada, el combinador 241 de unidad de control de multipunto extrae una primera señal de mezcla descendente de la primera corriente de bits, extrae una segunda señal de mezcla descendente de la segunda corriente de bits y genera una tercera señal de mezcla descendente combinando la primera y segunda señales de mezcla descendente. Además, el combinador 241 de unidad de control de multipunto extrae primera información lateral basada en objeto de la primera corriente de bits, extrae segunda información lateral basada en objeto de la segunda corriente de bits, y genera tercera información lateral basada en objeto combinando la primera información lateral basada en objeto y la segunda información lateral basada en objeto. A continuación, el combinador 241 de unidad de control de multipunto genera una corriente de bits combinando la tercera señal de mezcla descendente y la tercera información lateral basada en objeto y da salida a la corriente de bits generada. Por lo tanto, de conformidad con la décima modalidad de la presente invención, es posible procesar eficientemente señales pares transmitidas or dos o más socios de comunicación comparada con el caso de codificar o descodificar cada señal de objeto. A fin de que el combinador 241 de unidad de control de multipunto incorpore una pluralidad de señales de mezcla descendente, que son respectivamente extraídas de una pluralidad de corrientes de bits y están asociadas con diferentes codificaciones de compresión, en una sola señal de mezcla descendente, las señales de mezcla descendente pueden necesitar ser convertidas en señales de modulación de código de impulso (PCM) o señales en un dominio de frecuencia predeterminada de conformidad con los tipos de códigos de compresión de las señales de mezcla descendente, las señales de PCM o las señales obtenidas por la conversión pueden necesitar combinarse juntas, y una señal obtenida por la combinación puede necesitar ser convertida usando un código de compresión predeterminado. En este caso, puede ocurrir un retraso de conformidad con si las señales de mezcla descendente se incorporan en una señal PCM o en una señal en el dominio de frecuencia predeterminado. El retraso, sin embargo, puede no ser capaz de calcular apropiadamente por un descodificador . Por lo tanto, el retraso puede necesitar ser incluido en una corriente de bits y transmitido junto con la corriente de bits. El retraso puede indicar el número de muestras de retraso en una señal de PCM o el número de muestras de retraso en el dominio de frecuencia' predeterminado. Durante una operación de codificación de audio basada en objeto, un número considerable de señales de entrada en ocasiones puede necesitar ser procesado comparado con el número de señales de entrada generalmente procesado durante una operación de codificación de multicanal típica (v.gr., una operación de codificación de 5.1-canal o 7.1-canal) . Por lo tanto, un método de codificación de audio basado en objeto requiere biestratos muy superiores que un método de codificación de audio de multicanal basado en canal típico. Sin embargo, puesto que un método de codificación de audio basado en objeto involucra el procesamiento de señales de objeto que son menores que las señales de canal, es posible generar señales de salida dinámicas usando un método de codificación de audio basado en objeto. Un método de codificación de audio de conformidad con una modalidad de la presente invención a continuación se describirá con detalle con referencia a las Figuras 17 a 20. En un método de codificación de audio basado en objeto, las señales de objeto se pueden definir para representar sonidos individuales tales como la voz de un humano o el sonido de un instrumento musical. Alternativamente, los sonidos que tienen características similares tales como los sonidos de instrumentos musicales de cuerda (v.gr., un violin, una viola, y un chelo), sonidos pertenecientes a la misma banda de frecuencia, o sonidos clasificados en la misma categoría de conformidad con las direcciones y ángulos de sus fuentes de sonido, se pueden agrupar juntos, y definirse por las mismas señales de objeto. Todavía alternativamente, las señales de objeto se pueden definir usando la combinación de los métodos arriba descritos . Un número de señales de objeto se puede transmitir como una señal de mezcla descendente e información lateral. Durante la creación de información que se va a transmitir, la energía o potencia de una señal de mezcla descendente o cada una de una pluralidad de señales de objeto de la señal de mezcla descendente se calcula originalmente para el propósito de detectar el envolvente de la señal de mezcla descendente.
Los resultados del cálculo se pueden usar para transmitir las señales de objeto o la señal de mezcla descendente o para calcular la relación de los niveles de las señales de objeto. Un algoritmo de codificación predictiva lineal (LPC) se puede usar para reducir los biestratos. Más específicamente, un número de coeficientes LPC que representan el envolvente de una señal se generan a través del análisis dee la señal y los coeficientes de LPC se transmiten, en lugar de transmitir información de envolvente respecto a la señal. Este método es eficiente en términos de biestratos. Sin embargo, puesto que los coeficientes de LPC muy probablemente van a ser discrepantes del envolvente real de la señal, este método requiere un proceso de adición tal como corrección de error. Brevemente, un método que involucra transmitir información de envolvente de una señal puede garantizar una alta calidad de sonido, pero resulta en un aumento considerable en la cantidad de información que necesita transmitirse. Por otra parte, un método que involucra el uso de coeficientes de LPC puede reducir la cantidad de información que necesita ser transmitida, pero requiere un proceso adicional tal como corrección de error y resulta en una disminución en la calidad de sonido. De conformidad con una modalidad de la presente invención, una combinación de estos métodos se puede usar. En otras palabras, el envolvente de una señal se puede representar por la energía o potencia de la señal o un valor de índice u otro valor tal como un coeficiente de LPC correspondiente a la energía o potencia de la señal. La información de envolvente respecto a una señal se puede obtener en unidades de secciones temporales o secciones de frecuencia, Más específicamente, haciendo referencia a la Figura 17, la información de envolvente respecto a una señal se puede obtener en unidades de cuadros. Alternativamente, si una señal se representa por una estructura de banda de frecuencia usando un banco de filtro tal como un banco de filtro de espejo de cuadratura (QMF) , la información de envolvente respecto a una señal se puede obtener en unidades de subbandas de frecuencia, divisiones de subbandas de frecuencia o grupos de divisiones de subbandas de frecuencia. Todavía alternativamente, una combinación del método basado en cuadro, el método basado en subbandas de frecuencia, y el método basado en división de subbandas de frecuencia se puede usar dentro del alcance de la presente invención . Todavía alternativamente, dado que los componentes de baja frecuencia de una señal generalmente tienen más información que los componentes de alta frecuencia de la señal, la información de envolvente respecto a componentes de baja frecuencia de una señal se pueden transmitir como está, mientras qu7e la información de envolvente respecto a componentes de alta frecuencia de la señal se pueden representar por coeficientes de LPC u otros valores y los coeficientes de LPC o los otros valores se pueden transmitir en lugar de la información de envolvente respecto a componentes de alta frecuencia de la señal. Sin embargo, los componentes de baja frecuencia de una señal puede no tener necesariamente más información que los componentes de alta frecuencia de la señal. Por lo tanto, el método arriba descrito debe aplicarse flexiblemente de acuerdo a las circunstancias . De conformidad con una modalidad de la presente invención, la información de envolvente o dato de índice correspondiente a una porción (a continuación referida como la porción dominante) de una señal que aparece dominante en un eje de tiempo/frecuencia se puede transmitir, y ninguna de la información de envolvente y dato de índice correspondiente a una porción no dominante de la señal se puede transmitir. Alternativamente, los valores (v.gr., coeficientes de LPC) que representan la energía y potencia de 1 porción dominante de la señal se pueden transmitir, ninguno de estos valores correspondientes a la porción no dominante de la señal se pueden transmitir. Todavía alternativamente, la información de envolvente o dato de índice correspondiente a la porción dominante de la señal se puede transmitir, y los valores que representan la energía o potencia de la porción no dominante de la señal se pueden transmitir. Todavía alternativamente, la información solo respecto a la porción dominante de la señal se puede transmitir de modo que la porción no dominante de la señal se puede calcular basado en la información respecto a la porción dominante de la señal. Todavía alternativamente, una combinación de los métodos arriba descritos se puede usar. Por ejemplo, haciendo referencia a la Figura 18, si una señal se divide en un período dominante y un período no dominante, la información respecto a la señal se puede transmitir de cuatro maneras diferentes, como se indica por (a) a (d). A fin de transmitir un número de señales de objeto como la combinación de una señal de mezcla descendente e información lateral, la señal de mezcla descendente necesita ser dividida en una pluralidad de elementos como parte de una operación de descodificacióri, por ejemplo, en consideración a la relación de los niveles de las señales de objeto. A fin de garantizar independencia entre los elementos de la señal de mezcla descendente, necesita realizarse adicionalmente un a operación de descorrelación. Las señales de objeto que son las unidades de codificación en un método de codificación basado en objeto tienen más independencia que las señales de canal que son las unidades de codificación en un método de codificación de multicanal. En otras palabras, una señal de canal incluye un número de señales de objeto, y de esta manera necesita ser descorrelacionada. Por otra parte, las señales de objeto son independientes una de la otra, y de esta manera, la separación de canal se puede realizar fácilmente simplemente usando las características de las señales de objeto sin un requerimiento de una operación de descorrelación. Más específicamente, haciendo referencia a la Figura 19, las señales de objeto A, B y C toman turnos para aparecer dominantes en un eje de frecuencia. En este caso, no hay necesidad de dividir una señal de mezcla descendente en un númnero de señales de conformidad con la relación de los niveles de las señales de objeto A, B, y C y realizar descorrelación. En su lugar, la información respecto a los períodos dominantes de las señales de objeto A, B, y C se pueden transmitir, o un valor de ganancia se puede aplicar a cada componente de frecuencia de cada una de las señales de objeto A, B, y C, saltando de esta manera la descorrelación. Por lo tanto, es posible reducir la cantidad de computación y reducir el bistrato por la cantidad qu3e de otra manera se habría requerido por la información lateral necesaria para descorrelación. En breve, a fin de saltar la descorrelación, que se realiza de manera de garantizar independencia entre un número de señales obtenidas dividiendo una señal de mezcla descendente de acuerdo con la relación de las relaciones de señales de objeto de la señal de mezcla descendente, información respecto a un dominio de frecuencia que incluye cada señal de objeto se puede transmitir como información lateral. Alternativamente, diferentes valores de ganancia se pueden aplicar a un periodo dominante durante el que cada señal de objeto aparece dominante y un periodo no dominante durante el cual cada señal de objeto aparece menos dominante, y de esta manera, la información respecto al periodo dominante se puede proporcionar principalmente como información lateral. Todavía alternativamente, la información respecto al período dominante se puede transmitir como información lateral, y ninguna información respecto al periodo no dominante se puede transmitir. Todavía alternativamente, se puede usar una combinación de los métodos arriba descritos que son alternativas a un método de descorrelación. Los métodos arriba descritos que son alternativas a un método de descorrelación se pueden aplicar a todas las señales de objeto o solamente a algunas señales de objeto con períodos dominantes fácilmente distinguibles. Asimismo, los métodos arriba descritos que son alternativas a un método de descorrelación se pueden aplicar variablemente en unidades de cuadros . La codificación de señales de audio de objeto usando una señal residual se describirá a continuación con detalle . En general, en un método de codificación de audio basado en objeto, un número de señales de objeto se codifican, y los resultados de la codificación son transmitidos como la combinación de una señal de mezcla descendente e información lateral. Luego, un número de señales de objeto se restauran de la señal de mezcla descendente a través de descodificación de acuerdo con la información lateral, y las señales de objeto restauradas se mezclan apropiadamente, por ejemplo, a la solicitud de un usuario de acuerdo con información de control, generando de esta manera una señal de canal final. Un método de codificación de audio basado en objeto generalmente se dirige a variar libremente una señal de canal de salida de acuerdo con la información de control con ayuda de un mezclador. Sin embargo, un método de codificación de audio basado en objeto también se puede usar para generar una salida de canal de una manera previamente definida independientemente de la información de control. Para esto, la información lateral puede incluir no solamente información necesaria para obtener un número de señales de objeto de una señal de mezcla descendente, sino también información de parámetro de mezcla necesaria para generar una señal de canal. De esta manera, es posible generar una señal de salida de canal final sin ayuda de un mezclador. En este caso, un algoritmo tal como codificación residual se puede usar para mejorar la calidad de sonido. Un método de codificación residual típico incluye codificar una señal y codificar el error entre la señal codificada y la señal original, es decir, una señal residual. Durante una operación de descodificación, la señal codificada se descodifica mientras que se compensa por el error entre la señal codificada y la señal original, restaurando de esta manera una señal que es tan similar a la señal original como es posible. Puesto que el error entre la señal codificada y la señal original es generalmente no considerable, es posible reducir la cantidad de información adicionalmente necesaria para realizar codificación residual. Si una salida de canal final de un descodificador es fija, no solamente información de parámetro de mezcla necesaria para generar una señal de canal final sino también información de codificación residual se puede proporcionar como información lateral. En este caso, es posible mejorar la calidad de sonido. La Figura 20 es un diagrama de bloque de un aparato 310 de codificación de audio de conformidad con una modalidad de la presente invención. Haciendo referencia a la Figura 20, el aparato 310 de codificación de audio se caracteriza por usar una señal residual. Más específicamente, el aparato 310 de codificación de audio incluye un codificador 311, un descodificador 313, un primer mezclador 315, un segundo mezclador 319, un sumador5 317 y un generador 421 de corriente de bits. El primer mezclador 315 realiza una operación de mezcla en una señal original, y el segundo mezclador 319 realiza una operación de mezcla en una señal obtenida realizando una operación de codificación y luego una operación de descodificación en la señal original. El sumador 317 calcula una señal residual entre una señal salida por el primer mezclador 315 y una señal salida por el segundo mezclador 319. El generador 321 de biestrato añade la señal residual a información lateral y transmite el resultado de la adición. De esta manera, es posible mejorar la calidad de sonido. El cálculo de una señal residual se puede aplicar a todas las porciones de una señal o solamente para porciones de baja frecuencia de una señal. Alternativamente, el cálculo de una señal residual se puede aplicar variablemente solo a dominios de frecuencia que incluyen señales dominantes en una base de cuadro por cuadro. Todavía alternativamente, se puede usar una combinación de los métodos arriba descritos. Puesto que la cantidad de información lateral que incluye información de señal residual es mucho mayor que la cantidad de información lateral que no incluye información de señal residual, el cálculo de una señal residual se puede aplicar solamente a algunas porciones de una señal que afectan directamente la calidad de sonido, impidiendo de esta manera un aumento excesivo en biestrato. La presente invención se puede realizar como código legible por computadora escrito en un medio de registro legible por computadora. « El medio de registro legible por computadora puede ser cualquie3r tipo de dispositivo de registro en el que el dato se almacena de una manera legible por computadora. Ejemplos del medio de registro legible por computadora incluyen una ROM, una RAM, una CD-ROM, una cinta magnética, un disco suave, un almacenamiento de dato óptico, y una onda portadora (v.gr., transmisión de dato a través del Internet) . El medio de registro legible por computadora puede distribuirse a través de una pluralidad de sistemas de comput6adora conectados a una red de manera que el código legible por computadora se escriba al mismo y se ejecute de la misma de una manera descentralizada. Los programas funcionales, código, y segmentos de código necesarios para realizar la presente invención se pueden construir fácilmente por uno de experiencia ordinaria en el ramo. APLICABILIDAD INDUSTRIAL Como se describe arriba, de conformidad con la presente invención, las imágenes de sonido se localizan para cada señal de audio de objeto beneficiándose de las ventajas de métodos de codificación y descodificación de audio basados en objeto. De esta manera, es posible ofrecer sonidos más realistas a través de la reproducción de señales de audio de objeto. Además, la presente invención se puede aplicar a juegos interactivos, y de esta manera puede proporcionar al usuario con una experiencia de realidad virtual más realista. Mientras que la presente invención se ha mostrado y descrito particularmente con referencia a modalidades de ejemplo de la misma, se entenderá por aquellos de experiencia ordinaria en el ramo que varios cambios en forma y detalles se pueden hacer en la misma sin abandonar el espíritu y alcance de la presente invención como se define por las siguientes reivindicaciones.

Claims (1)

  1. REIVINDICACIONES 1. - Un método de descodificación de audio que comprende : extraer una señal de mezcla descendente e información lateral basada en objeto de una señalo de audio de entrada, generar información de entrega basada en información de control de entrada; y generar información lateral basada en canal basada en la información de entrega y la información lateral basada en objeto. 2. - El método de descodificación de audio de conformidad con la reivindicación 1, que comprende además generar una señal de audio de multicanal basada en la señal de mezcla desce4ndente y la información lateral basada en canal . 3. - El método de descodificación de audio de conformidad con la reivindicación 1, en donde la información de control comprende cuando menos una de información tridimensional (3D), información de mezcla e información armónica para procesar una señal de objeto predeterminada. 4. - El método de descodificación de audio de conformidad con la reivindicación 1, en donde la generación de la información de entrega, comprende convertir información de tiempo incluida en la información de mezcla en información de amplitud equivalente en respuesta a una orden de usuario. 5. - El método de descodificación de audio de conformidad con la reivindicación 3, en donde la generación de la información de entrega comprende además convertir información de amplitud incluida en la información de mezcla en información de tiempo equivalente en respuesta a una orden de usuario. 6. - El método de descodificación de audio de conformidad con la reivindicación 3, en donde la información armónica comprende cuando menos una de información de paso, información de frecuencia fundamental e información de frecuencia dominante de la señal de objeto predeterminada. 7. - El método de descodificación de audio de conformidad con la reivindicación 6, que comprende además ajustar ganancia de la señal de objeto predeterminada basada en la información armónica. 8. - El método de descodificación de audio de conformidad con la reivindicación 6, que comprende además compensar un retraso entre la información espacial y la señal de mezcla descendente. 10.- Un aparato de descodificación de audio que comprende : un desmultiplexaor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada, un servidor que genera información de entrega basada en información de control de entrada; y un transcodificador que genera información lateral basada en canal basada en la información de entrega y la información lateral basada en objeto. 11. - El aparato de descodificación de audio de conformidad con la reivindicación 10, que comprende además un descodificador de multicanal que genera una señal de audio de multicanal basada en la señal de mezcla descendente y la información lateral basada en canal. 12. - El aparato de descodificación de audio de conformidad con la reivindicación 10, en donde el dato de control comprende cuando menos una de información 3D, información de mezcla e información armónica para procesar una señal de objeto predeterminada. 13. - El aparato de descodificación de audio de conformidad con la reivindicación 12, en donde el servidor convierte información de tiempo incluida en la información de mezcla en información de amplitud equivalente en respuesta a una orden de usuario durante la generación de la información de entrega. 14. - El aparato de descodificación de audio de conformidad con la reivindicación 12, en donde el servidor convierte información de amplitud incluida en la información de mezcla en información de tiempo equivalente en respuesta a una orden de usuario durante la generación de la información de entrega. 15. - El aparato de descodificación de audio de conformidad con la reivindicación 12, en donde la información armónica comprende cuando menos una de información de paso, información de frecuencia fundamental e información de frecuencia dominante de la señal de objeto predeterminada. 16. - El aparato de descodificación de audio de conformidad con la reivindicación 15, en donde el servidor ajusta la ganancia de la banda de señal de frecuencia prede4terminada basada en la información armónica. 17. - El aparato de descodificación de audio de conformidad con la reivindicación 15, en donde el servidor compensa una señal de objeto en una banda de frecuencia predeterminada basado en la información armónica. 18. - El aparato de descodificación de audio de conformidad con la reivindicación 10, que comprende además una memoria intermedia que compensa un retraso entre la información espacial y la señal de mezcla descendente. 19.- Un medio de registro legible por computadora que tiene registrado en el mismo un programa de computadora para ejecutar un método de descodificación de audio, el método de descodificación de audio comprendiendo: extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio de entrada, generar información de entrega basada en dato de control de entrada; y generar información lateral basada en canal basada en la información de entrega y la información lateral basada en objeto. 20.- El medio de registro legible por computadora de conformidad con la reivindicación 19, en donde el método de descodificación de audio comprende además generar una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal.
MX2008012250A 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. MX2008012250A (es)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US84829306P 2006-09-29 2006-09-29
US82980006P 2006-10-17 2006-10-17
US86330306P 2006-10-27 2006-10-27
US86082306P 2006-11-24 2006-11-24
US88071407P 2007-01-17 2007-01-17
US88094207P 2007-01-18 2007-01-18
US94837307P 2007-07-06 2007-07-06
PCT/KR2007/004801 WO2008039042A1 (en) 2006-09-29 2007-10-01 Methods and apparatuses for encoding and decoding object-based audio signals

Publications (1)

Publication Number Publication Date
MX2008012250A true MX2008012250A (es) 2008-10-07

Family

ID=39230400

Family Applications (4)

Application Number Title Priority Date Filing Date
MX2008012251A MX2008012251A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012250A MX2008012250A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012246A MX2008012246A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012315A MX2008012315A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basados en objeto.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2008012251A MX2008012251A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.

Family Applications After (2)

Application Number Title Priority Date Filing Date
MX2008012246A MX2008012246A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012315A MX2008012315A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basados en objeto.

Country Status (10)

Country Link
US (7) US7979282B2 (es)
EP (4) EP2071564A4 (es)
JP (4) JP4787362B2 (es)
KR (4) KR101069266B1 (es)
AU (4) AU2007300814B2 (es)
BR (4) BRPI0711104A2 (es)
CA (4) CA2646045C (es)
MX (4) MX2008012251A (es)
RU (1) RU2551797C2 (es)
WO (4) WO2008039041A1 (es)

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
CN101529504B (zh) 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
CA2874451C (en) 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP5023662B2 (ja) * 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
JP4838361B2 (ja) * 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
EP2095365A4 (en) * 2006-11-24 2009-11-18 Lg Electronics Inc METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
WO2008084427A2 (en) * 2007-01-10 2008-07-17 Koninklijke Philips Electronics N.V. Audio decoder
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
CN102007532B (zh) 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
KR101062351B1 (ko) 2008-04-16 2011-09-05 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
EP2111062B1 (en) 2008-04-16 2014-11-12 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101061129B1 (ko) 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
US8639368B2 (en) 2008-07-15 2014-01-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2010008200A2 (en) * 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
KR101137361B1 (ko) * 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
CN102292769B (zh) * 2009-02-13 2012-12-19 华为技术有限公司 一种立体声编码方法和装置
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101123698B1 (ko) 2009-07-30 2012-03-15 삼성전자주식회사 프로세스 카트리지 및 이를 구비한 화상형성장치
JP5635097B2 (ja) 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
KR101405976B1 (ko) * 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US10326978B2 (en) * 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103119846B (zh) * 2010-09-22 2016-03-30 杜比实验室特许公司 利用对白水平归一化对音频流进行混合
CN103026406B (zh) * 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR101783962B1 (ko) * 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
TWI543642B (zh) * 2011-07-01 2016-07-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
KR101547809B1 (ko) * 2011-07-01 2015-08-27 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 시스템을 위한 동기화 및 전환 방법과 시스템
KR102394141B1 (ko) 2011-07-01 2022-05-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
CA2843226A1 (en) 2012-07-02 2014-01-09 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
CN104541524B (zh) * 2012-07-31 2017-03-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
EP2880653B1 (en) * 2012-08-03 2017-11-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
WO2014023477A1 (en) * 2012-08-10 2014-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for adapting audio information in spatial audio object coding
US20140114456A1 (en) * 2012-10-22 2014-04-24 Arbitron Inc. Methods and Systems for Clock Correction and/or Synchronization for Audio Media Measurement Systems
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
US9613660B2 (en) 2013-04-05 2017-04-04 Dts, Inc. Layered audio reconstruction system
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
KR102058619B1 (ko) * 2013-04-27 2019-12-23 인텔렉추얼디스커버리 주식회사 예외 채널 신호의 렌더링 방법
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
EP3712889A1 (en) * 2013-05-24 2020-09-23 Dolby International AB Efficient coding of audio scenes comprising audio objects
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
EP3055998A1 (en) * 2013-10-11 2016-08-17 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
JP6299202B2 (ja) * 2013-12-16 2018-03-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
JP6306958B2 (ja) * 2014-07-04 2018-04-04 日本放送協会 音響信号変換装置、音響信号変換方法、音響信号変換プログラム
US10341799B2 (en) * 2014-10-30 2019-07-02 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
US10057707B2 (en) 2015-02-03 2018-08-21 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
EP3780589A1 (en) 2015-02-03 2021-02-17 Dolby Laboratories Licensing Corporation Post-conference playback system having higher perceived quality than originally heard in the conference
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US10325610B2 (en) 2016-03-30 2019-06-18 Microsoft Technology Licensing, Llc Adaptive audio rendering
EP3465678B1 (en) 2016-06-01 2020-04-01 Dolby International AB A method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB201808897D0 (en) * 2018-05-31 2018-07-18 Nokia Technologies Oy Spatial audio parameters
US11445296B2 (en) 2018-10-16 2022-09-13 Sony Corporation Signal processing apparatus and method, and program to reduce calculation amount based on mute information
JP7326824B2 (ja) 2019-04-05 2023-08-16 ヤマハ株式会社 信号処理装置、及び信号処理方法

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3882280A (en) * 1973-12-19 1975-05-06 Magnavox Co Method and apparatus for combining digitized information
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
RU2121718C1 (ru) 1998-02-19 1998-11-10 Яков Шоел-Берович Ровнер Портативная музыкальная система для караоке и картридж для нее
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3173482B2 (ja) 1998-11-16 2001-06-04 日本ビクター株式会社 記録媒体、及びそれに記録された音声データの音声復号化装置
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US7020618B1 (en) * 1999-10-25 2006-03-28 Ward Richard E Method and system for customer service process management
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US6849794B1 (en) * 2001-05-14 2005-02-01 Ronnie C. Lau Multiple channel system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP2003186500A (ja) 2001-12-17 2003-07-04 Sony Corp 情報伝達システム、情報符号化装置および情報復号装置
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US8340302B2 (en) * 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
JP2005533271A (ja) 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2004064363A (ja) 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
JP2006503319A (ja) 2002-10-14 2006-01-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号フィルタリング
US7395210B2 (en) 2002-11-21 2008-07-01 Microsoft Corporation Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform
CN1717955B (zh) * 2002-12-02 2013-10-23 汤姆森许可贸易公司 用于描述音频信号的合成的方法
EP1621047B1 (en) 2003-04-17 2007-04-11 Koninklijke Philips Electronics N.V. Audio signal generation
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1768107B1 (en) 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
JP4466242B2 (ja) 2004-07-13 2010-05-26 株式会社サタケ ペレット選別機
KR100658222B1 (ko) 2004-08-09 2006-12-15 한국전자통신연구원 3차원 디지털 멀티미디어 방송 시스템
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP5106115B2 (ja) 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005008342A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8359341B2 (en) 2005-12-10 2013-01-22 International Business Machines Corporation Importing content into a content management system using an e-mail application
CN101356573B (zh) * 2006-01-09 2012-01-25 诺基亚公司 对双耳音频信号的解码的控制
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
KR101358700B1 (ko) * 2006-02-21 2014-02-07 코닌클리케 필립스 엔.브이. 오디오 인코딩 및 디코딩
DE102007003374A1 (de) 2006-02-22 2007-09-20 Pepperl + Fuchs Gmbh Induktiver Näherungsschalter sowie Verfahren zum Betreiben eines solchen
CN101406073B (zh) 2006-03-28 2013-01-09 弗劳恩霍夫应用研究促进协会 用于多声道音频重构中的信号成形的增强的方法
CA2656867C (en) * 2006-07-07 2013-01-08 Johannes Hilpert Apparatus and method for combining multiple parametrically coded audio sources
US8271290B2 (en) * 2006-09-18 2012-09-18 Koninklijke Philips Electronics N.V. Encoding and decoding of audio objects
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
TW200930042A (en) * 2007-12-26 2009-07-01 Altek Corp Method for capturing image

Also Published As

Publication number Publication date
US8762157B2 (en) 2014-06-24
US8625808B2 (en) 2014-01-07
BRPI0711185A2 (pt) 2011-08-23
AU2007300813A1 (en) 2008-04-03
US20110196685A1 (en) 2011-08-11
JP2010505142A (ja) 2010-02-18
US7979282B2 (en) 2011-07-12
US9792918B2 (en) 2017-10-17
US7987096B2 (en) 2011-07-26
JP5238707B2 (ja) 2013-07-17
CA2645908C (en) 2013-11-26
CA2646045A1 (en) 2008-04-03
JP4787362B2 (ja) 2011-10-05
MX2008012246A (es) 2008-10-07
JP5238706B2 (ja) 2013-07-17
US20090157411A1 (en) 2009-06-18
CA2645910C (en) 2015-04-07
CA2645908A1 (en) 2008-04-03
BRPI0710923A2 (pt) 2011-05-31
EP2070080A1 (en) 2009-06-17
US8504376B2 (en) 2013-08-06
EP2070080A4 (en) 2009-10-14
AU2007300813B2 (en) 2010-10-14
AU2007300810B2 (en) 2010-06-17
EP2071563A1 (en) 2009-06-17
KR20090013178A (ko) 2009-02-04
JP2010505141A (ja) 2010-02-18
AU2007300812B2 (en) 2010-06-10
AU2007300812A1 (en) 2008-04-03
AU2007300810A1 (en) 2008-04-03
US20160314793A1 (en) 2016-10-27
WO2008039039A1 (en) 2008-04-03
KR101069266B1 (ko) 2011-10-04
JP2010505140A (ja) 2010-02-18
KR101065704B1 (ko) 2011-09-19
CA2645909C (en) 2012-12-11
EP2071564A1 (en) 2009-06-17
EP2071563A4 (en) 2009-09-02
BRPI0711104A2 (pt) 2011-08-23
BRPI0711102A2 (pt) 2011-08-23
RU2010141970A (ru) 2012-04-20
US9384742B2 (en) 2016-07-05
US20080140426A1 (en) 2008-06-12
MX2008012315A (es) 2008-10-10
US20090164222A1 (en) 2009-06-25
CA2645910A1 (en) 2008-04-03
KR20090026121A (ko) 2009-03-11
EP2070081A4 (en) 2009-09-30
RU2551797C2 (ru) 2015-05-27
US20140303985A1 (en) 2014-10-09
CA2645909A1 (en) 2008-04-03
MX2008012251A (es) 2008-10-07
AU2007300814A1 (en) 2008-04-03
JP5232789B2 (ja) 2013-07-10
JP2010505328A (ja) 2010-02-18
WO2008039041A1 (en) 2008-04-03
WO2008039043A1 (en) 2008-04-03
EP2070081A1 (en) 2009-06-17
US20090164221A1 (en) 2009-06-25
CA2646045C (en) 2012-12-11
KR100987457B1 (ko) 2010-10-13
AU2007300814B2 (en) 2010-05-13
EP2071564A4 (en) 2009-09-02
WO2008039042A1 (en) 2008-04-03
KR20090013177A (ko) 2009-02-04
KR20090009842A (ko) 2009-01-23

Similar Documents

Publication Publication Date Title
US9792918B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Legal Events

Date Code Title Description
FG Grant or registration