MX2008012251A - Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. - Google Patents

Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.

Info

Publication number
MX2008012251A
MX2008012251A MX2008012251A MX2008012251A MX2008012251A MX 2008012251 A MX2008012251 A MX 2008012251A MX 2008012251 A MX2008012251 A MX 2008012251A MX 2008012251 A MX2008012251 A MX 2008012251A MX 2008012251 A MX2008012251 A MX 2008012251A
Authority
MX
Mexico
Prior art keywords
signal
information
channel
audio
downmix
Prior art date
Application number
MX2008012251A
Other languages
English (en)
Inventor
Hee Suk Pang
Dong Soo Kim
Jae Hyun Lim
Sung Yong Yoon
Hyun Kook Lee
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of MX2008012251A publication Critical patent/MX2008012251A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Se proporcionar un método y aparato de codificación de audio y un método y aparato de descodificación de audio en el que las señales de audio se pueden codificar o descodificar de manera que las imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto. El método de descodificación de audio incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal basada en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; procesar la señal de mezcla descendente usando una señal de canal descorrelacionada, y generar una señal de audio de multicanal usando la señal de mezcla descendente procesada y la información lateral basada en canal.

Description

MÉTODOS Y APARATOS PARA CODIFICAR Y DESCODIFICAR SEÑALES DE AUDIO BASADAS EN OBJETO Campo Técnico La presente invención se relaciona con un método y aparato de dosificación de audio y un método y aparato de descodificación de audio en donde las imágenes de sonido se pueden localizar en cualquier posición deseada para cada señal de audio de objeto. Ramo Anterior En general, en técnicas de codificación y descodificación de audio de multicanal, un número de señales de canal de una señal de multicanal se mezclan descendentemente en menos señales de canal, la información lateral respecto a las señales de canal originales y se transmiten, y una señal de multicanal que tiene tantos canales como la señal de multicanal original se restaura. Las técnicas de codificación y descodificación de audio basada en objeto son básicamente similares a técnicas de codificación y descodificación de audio de multicanal en términos de mezclado descendente de varias fuentes de sonido en menos señales de fuente de sonido y transmitir información lateral respecto a las fuentes de sonido originales. Sin embargo, en técnicas de codificación y descodificación de audio basadas en objeto, las señales de objeto, que son elementos básicos (v.gr., el sonido de un instrumento musical o una voz humana) de una señal de canal, se tratan igual que las señales de canal en técnicas de codificación y descodificación de audio de multicanal, y de esta manera se pueden codificar. En otras palabras, en técnicas de codificación y descodificación de audio basado en objeto, cada señal de objeto se considera la entidad que se va a codificar. A este respecto, las técnicas de codificación y descodificación de audio basadas en objeto son diferentes a las técnicas de codificación y descodificación de audio de multicanal en las que una operación de codificación de audio de multicanal se realiza sencillamente basado en información de intercanal independientemente del número de elementos dee una señal de canal que se va a codificar. Exposición de la Invención Problema Técnico La presente invención proporciona un método y aparato de codificación de audio y un método y aparato de descodificación de audio en el que las señales de audio se pueden codificar o descodificar de manera que las imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto. Solución Técnica De conformidad con un aspecto de la presente invención, se proporciona un método de descodificación de audio que incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal basada en una información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; procesar la señal de mezcla descendente usando una señal de canal descorrelacionada; y generar una señal de audio de multicanal usando la señal de mezcla descendente procesada y la información lateral basada en canal. De conformidad con otro aspecto de la presente invención, se proporciona un aparato de descodificación de audio que incluye un desmultiplexor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; un convertidor de parámetro que genera información lateral basada en canal basada en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; un procesador de mezcla descendente que modificar la señal de mezcla descendente mediante la señal de mezcla descendente descorrelacionada si la señal de mezcla descendente es una señal de mezcla descendente estéreo; y un descodificador de multicanal que genera una señal de audio de multicanal usando una señal de mezcla descendente modificada obtenida por el procesador de mezcla descendente y la información lateral basada en canal . De conformidad con otro aspecto de la presente invención, se proporciona un método de descodificación de audio que incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal y uno o más parámetros de procesamiento basados en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; generar una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y modificar la señal de audio de multicanal usando los parámetros de procesamiento. De conformidad con otro aspecto de la presente invención, se proporciona un aparato de descodificación de audio que incluye un desmultiplexor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; un convertidor de parámetro que genera información lateral basada en canal y uno o más parámetros de procesamiento basados en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; un descodificador de multicanal que genera una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y un procesador de canal que modifica la señal de audio de multicanal usando los parámetros de procesamiento. De conformidad con otro aspecto de la presente invención, se proporciona un medio de registro legible por computadora que tiene registrado en el mismo un método de descodificación de audio que incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal basada en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; procesar la señal de mezcla descendente usando una señal de canal descorrelacionado; y generar una señal de audio de multicanal usando la señal de mezcla descendente procesada obtenida por el cambio y la información lateral basada en canal. De conformidad con otro aspecto de la presente invención, se proporciona un medio de registro legible por computadora que tiene registrado en el mismo un método de descodificación de audio que incluye extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal y uno o más parámetros de procesamiento basados en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; generar una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y modificar la señal de audio de multicanal usando los parámetros de procesamiento. Efectos Ventajoso Se proporcionan un método y aparato para codificar audio y un método y aparato para descodificar audio en los que las señales de audio se pueden codificar o descodificar de manera que las imágenes de sonido se puedan localizar en cualquier posición deseada para cada señal de audio de objeto. Breve Descripción de los Dibujos La presente invención quedará más completamente entendida de la descripción detallada proporcionada abajo y los dibujos que se acompañan, que se proporciona por ilustración solamente, y de esta manera no son limitativos de la presente invención, y en donde: La Figura 1 es un diagrama de bloque de un sistema de codificación/descodificación de audio basado en objeto típico; La Figura 2 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una primera modalidad de la presente invención; La Figura 3 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una segunda modalidad de la presente invención; La Figura 4 es una gráfica para explicar la influencia de una diferencia de amplitud y una diferencia de tiempo, que son independientes una de la otra, en la localización de imágenes de sonido, La Figura 5 es una gráfica de función respecto a la correspondencia entre diferencias de amplitud y diferencias de tiempo que se requieren para localizar imágenes de sonido en una posición predeterminada, La Figura 6 ilustra el formado de dato de control que incluye información armónica; La Figura 7 es u7n diagrama de bloque de un aparato de descodificación de audio de conformidad con una tercera modalidad de la presente invención, La Figura 8 es un diagrama de bloque de un módulo de ganancias de mezcla descendente artística (ADG) que se puede usar en el aparato de descodificación de audio ilustrado en la Figura 7; La Figura 9 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una cuarta modalidad de la presente invención, La Figura 10 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una quinta modalidad de la presente invención; La Figura 11 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una sexta modalidad de la presente invención; La Figura 12 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una séptima modalidad de la presente invención; La Figura 13 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una octava modalidad de la presente invención; La Figura 14 es un diagrama para explicar la aplicación de información tridimensional (3D) a un cuadro mediante el aparato de descodificación de audio ilustrado en la Figura 13; La Figura 15 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una novena modalidad de la presente invención; La Figura 16 es un diagrama de bloque de un aparato de descodificación de audio de conformidad con una décima modalidad de la presente invención; Las Figuras 17 a 19 son diagramas para explicar un método de descodificación de audio de conformidad con una modalidad de la presente invención; y La Figura 20 es un diagrama de bloque de un aparato de codificación de audio de conformidad con una modalidad de la presente invención. Mejor Modo para Llevar a Cabo la Invención La presente invención se describirá a continuación con detalle con referencia a los dibujos que se acompañan en los que modalidades de ejemplo de la invención se muestran. Un método y aparato de codificación de audio y un método y aparato de descodificación de audio de conformidad con la presente invención se pueden aplicar a operaciones de procesamiento de audio basadas en objeto, pero la presente invención no está restringida a esto. En otras palabras, el método y aparato de codificación de audio y el método y aparato de descodificación de audio se pueden aplicar a diversas operaciones de procesamiento de señal distintas a operaciones de procesamiento de audio basado en objeto. La Figura 1 es un diagrama de bloque de un sistema típico de codificación/descodificación de audio basado en objeto. En general, la entrada de señales de audio a un aparato de codificación de audio basado en objeto no correspondiente a canales de una señal de multicanal sino que son señales de objeto independientes. A este respecto, un aparato de codificación de audio basado en objeto se diferencia de un aparato de codificación de audio de multicanal al que las señales de canal de una señal de multicanal reciben entrada. Por ejemplo, las señales de canl tales como una señal de canal izquierdo frontal y una señal de canal derecho frontal de una señal de 5.1-canal puede recibir entrada a una señal de audio de multicanal, mientras que las señales de audio de objeto tales como una voz humana o el sonido de un instrumento musical (v.gr., el sonido de un violín o un piano) que son entidades menores que las señales de canal pueden recibir entrada a un aparato de codificación de audio basado en objeto. Haciendo referencia a la Figura 1, el sistema de codificación/descodificación de audio basado en objeto incluye un aparato de codificación de audio basado en objeto y un aparato de descodificación de audio basado en objeto. El aparato de codificación de audio basado en objeto incluye un codificador 100 de objeto, y el aparato de descodificación de audio basado en objeto incluye un descodificador 111 de objeto y un servidor 113. El codificador 100 de objeto recibe N señales de audio de objeto, y genera una señal de mezcla descendente basada en objeto con uno o más canales e información lateral incluyendo un número de piezas de información extraídas de las N señales de audio de objeto tal como diferencia de energía, diferencia de fase, y valor de correlación. La información lateral y la señal de mezcla descendente basada en objeto se incorpora en una sola corriente de bits, y la corriente de bits se transmite al aparato de descodificación basado en objeto. La información lateral puede incluir una bandera indicando si realizar codificación de audio basada en canal o codificación de audio asada en objeto, y de esta manera, puede determinar si realizar codificación de audio basada en canal o codificación de audio basada en objeto basado en la bandera de la información lateral. La información lateral también puede incluir información de envolvente, información de agrupación, información de período de silencio, e información de retraso respecto a las señales de objeto. La información lateral también puede incluir información de diferencias de nivel de objeto, información de correlación cruzada entre objeto, información de ganancia de mezcla descendente, información de diferencia de nivel de canal de mezcla descendente, e información de energía de objeto absoluta . El descodificador 111 de objeto recibe la señal de mezcla descendente basada en objeto y la información lateral del aparato de codificación basado en objeto, y restaura las señales de objeto que tienen propiedades similares a aquellas de las N señales de audio de objeto basado en la señal de mezcla descendente basada en objeto y la información lateral. Las señales de objeto generadas por el descodificador 111 de objeto todavía no se han asignado a ninguna posición en un espacio de multicanal. De esta manera, el servidor 113 asigna cada una de las señales de objeto generadas por el descodificador 111 de objeto a una posición predeterminada en un espacio de multicanal y determina los niveles de las señales de objeto de manera que las señales de objeto se puedan reproducir de posiciones correspondientes respectivas designadas por el servidor 113 con los niveles correspondientes respectivos determinados por el servidor 113. La información de control respecto a cada una de las señales de objeto generadas por el descodificador 111 de objeto pueden variar con el tiempo y, de esta manera, las posiciones espaciales y los niveles de las señales de objeto generadas por el descodificador 111 de objeto pueden variar de conformidad con la información de control. La Figura 2 es un diagrama de bloque de un aparato 120 de descodificación de audio de conformidad con una primera modalidad de la presente invención. Haciendo referencia a la Figura 2, el aparato 120 de descodificación de audio incluye un descodificador 121 de objeto, un servidor 123, y un convertidor 125 de parámetro. El aparato 120 de descodificación de audio también puede incluir un desmultiplexor (no mostrado) que extrae una señal de mezcla descendente e información lateral de una corriente de bits admitida al mismo, y de esta manera aplicará a todos los aparatos de descodificación de audio de conformidad con otras modalidades de la invención. El descodificador 121 de objeto genera un número de señales de objeto basado en una señal de mezcla descendente e información lateral odificada proporcionada por el convertidor 125 de parámetro. El servidor 123 asigna cada una de las señales de objeto generadas por el descodificador 121 de objeto a una posición predeterminada en un espacio de multicanal y determina los niveles de las señales de objeto generadas por el descodificador 121 de objeto de conformidad con información de control. El convertidor 125 de parámetro genera la información lateral modificada combinando la información lateral y la información de control. Luegto, el convertidor 125 de parámetro transmite la información lateral modificada al descodificador 121 de objeto. El descodificador 121 de objeto puede ser capaz de realizar descodificación de adaptación analizando la información de control en la información lateral modificada. Por ejemplo, si la información de control indica que una primera señal de objeto y una segunda señal de objeto están asignadas a la misma posición en un espacio de multicanal y tienen el mismo nivel, un aparato típico de descodificación de audio puede descodificar la primera y segunda señales de objeto separadamente, y luego disponerlas en un espacio de multicanal a través de una operación de mezclado/entrega. Por otra parte, el descodificador 121 de objeto del aparato 120 de descodificación de audio aprende de la información de control en la información lateral modificada que la primera y segunda señales de objeto están asignadas a la misma posición es un espacio de multicanal y tienen el mismo nivel como si fueran una sola fuente de sonido. Consecuentemente, el descodificador 121 de objeto descodifica la primera y segunda señales tratándolas como una sola fuente de sonido sin descodificarlas separadamente. Comió resultado, la complejidad de descodificación disminuye. Además, debido a una disminución en el número de fuentes de sonido que necesitan procesarse, la complejidad de mezclado/entrega también disminuye. El aparato 120 de descodificación de audio se puede usar efectivamente en la situación cuando el número de señales de objeto es mayor que el número de canales de salida debido a que una pluralidad de señales de objeto son altamente probables de ser asignadas a la misma posición espacial. Alternativamente, el aparato 120 de descodificación de audio se puede usar en la situación cuando la primera señal de objeto y la segunda señal de objeto son asignadas a la misma posición en un espacio de multicanal pero tienen diferentes niveles. En este caso, el aparato 120 de descodificación de audio descodifica la primera y segunda señales de objeto tratanto la primera y segunda señales de objeto como una sola, en lugar de descodificar la primera y segunda señales de objeto separadamente y transmitiendo la primera y segunda señales de objeto descodificadas al servidor 123. Más específicamente, el descodificador 121 de objeto puede obtener información respecto a la diferencia entre los niveles de la primera y segunda señales de objeto de la información de control en la información lateral modificada, y descodificar la primera y segunda señales de objeto basado en la información obtenida. Como resultado, aún cuando la primera y segunda señales de objeto tengan diferentes niveles, la primera y segunda señales de objeto se pueden descodificar como si fueran una sola fuente de sonido. Todavía alte3rnativamente, el descodificador 121 de objeto puede ajusfar los niveles de las señales de objeto generadas por el descodificador 121 de objeto de conformidad con la información de control. Luego, el descodificador 121 de objeto puede descodificar las señales de objeto cuyos niveles son ajustados. Consecuentemente, el servidor 123 no necesita ajusfar los niveles de las señales de objeto descodificadas provistas por el descodificador 121 de objeto sino simplemente dispone las señales de objeto descodificadas provistas por el descodificador 121 de objeto en un espacio de multicanal. Brevemente, puesto que el descodificador 121 de objeto ajusta los niveles de las señales de objeto generadas por el descodificador 121 de objeto en un espacio de multicanal sin la necesidad de ajustar adicionalmente los niveles de las señales de objeto generadas por el descodificador 121 de objeto, Por lo tanto, es posible reducir la complejidad de la mezcla/entrega. De conformidad con la modalidad de la Figura 2, el descodificador de objeto del aparato 120 de descodificación de audio puede realizar de manera adaptable una operación de descodificación a través del análisis de la información de control, reduciendo de esta manera la complejidad de descodificación y la complejidad de mezclado/entrega. Dna combinación de los métodos arriba descritos realizados por el aparato 120 de descodificación de audio se puede usar. La Figura 3 es un diagrama de bloque de un aparato 130 de descodificación de audio de conformidad con una segunda modalidad de la presente invención. Haciendo referencia a la Figura 3, el aparato 130 de descodificación de audio incluye un descodificador 131 de objeto y un servidor 133. El aparato 130 de descodificación de audio se caracteriza por proporcionar información lateral no solamente al descodificador 131 de objeto sino también al servidor 133. El aparato 130 de descodificación de audio puede realizar efectivamente una operación de descodificación aún cuando haya una señal de objeto correspondiente a un periodo de silencio. Por ejemplo, las segunda a cuerta señales de objeto pueden corresponder a un periodo de reproducción de música durante el que se toca un instrumento musical, y una primera señal de objeto puede corresponder a un periodo de silencio durante el que se reproduce un acompañamiento. En este caso, la información que indica cual de una pluralidad de señales de objeto corresponde a un periodo de silencio se puede incluir en información lateral, y la información lateral se puede proporcionar al servidor 133 asi como al descodificador 131 de objeto. El descodificador 131 de objeto puede reducir al mínimo la complejidad de descodificación al no descodificar una señal de objeto correspondiente a un período de silencio. El descodificador 131 de objeto ajusta una señal de objeto correspondiente a un valor de 0 y transmite el nivel de la señal de objeto al servidor 133. En general, las señales de objeto que tienen un valor de 0 se tratan igual que las señales de objeto que tienen un valor, distinto a 0, y de esta manera se someten a una operación de mezclado/entrega. Por otra parte, el aparato 130 de descodificación de audio transmite información lateral que incluye información que indica cual de una pluralidad de señales de objeto corresponde a un periodo de silencio al servidor 133 y de esta manera puede evitar que una señal de objeto correspondiente al periodo de silencio sea sometida a una operación de mezclado/entrega realizada por el servidor 133. Por lo tanto, el aparato 130 de descodificación de audio puede impedir un aumento innecesario en la complejidad de mezclado/entrega . El servidor 133 puede usar información de parámetro de mezclado que se incluye en la información de control para localizar una imagen de sonido de cada señal de objeto en una escena estéreo. La información de parámetro de mezclado puede incluir información de amplitud solamente o ambas, información de amplitud e información de tiempo. La información de parámetro de mezclado afecta no solamente la localización de imágenes de sonido estéreo, sino también la percepción psicoacústica de una calidad de sonido espacial por un usuario. Por ejemplo, al comparar dos imágenes de sonido que se generan usando un método de encuadramiento de tiempo y un método de encuadramiento de amplitud, y reproducidas en la misma ubicación usando un parlante estéreo de 2-canales, se reconoce que el método de encuadramiento de amplitud puede contr5ibuir a una localización precisa de imágenes de sonido, y que el método de encuadramiento de tiempo puede proporcionar sonidos naturales con un sentimiento de espacio profundo. De esta manera, si el servidor 133 solamente utiliza el método de encuadramiento de amplitud para disponer señales de objeto en un espacio de multicanal, el servidor 133 puede ser capaz de localizar de manera precisa cada imagen de sonido, pero puede no ser capaz de proporcionar un sentimiento tan profundo de sonido como cuando se usa el método de encuadramiento de tiempo. Los usuarios en ocasiones pueden preferir una localización precisa de imágenes de sonido a un sentimiento de sonido profundo o viceversa, de acuerdo con el tipo de fuentes de sonido. Las Figuras 4(a) y 4(b) explican la influencia de intensidad (diferencia de amplitud) y una diferencia de tiempo en la localización de imágenes de sonido como se realiza en la reproducción de señales con un parlante estéreo de 2 canales. Haciendo referencia a las Figuras 4(a) y 4(b), una imagen de sonido ' puede estar localizada en un ángulo predeterminado de acuerdo con una diferencia de amplitud y una diferencia de tiempo que son independientes una de la otra. Por ejemplo, una diferencia de amplitud de alrededor de 8 dB o una diferencia de tiempo de alrededor de 0.5 ms, que es equivalente a la diferencia de amplitud de 8 dB, se puede usar a fin de localizar una imagen de sonido a un ángulo de 20. Por lo tanto, aun cuando solamente una diferencia de amplitud se proporcione como información de parámetro de mezclado, es posible obtener diversos sonidos con diferentes propiedades convirtiendo la diferencia de amplitud en una diferencia de tiempo que es equivalente a la diferencia de amplitud durante la localización de imágenes de sonido. La Figura 5 ilustra funciones respecto a la correspondencia entre diferencias de amplitud y diferencias de tiempo que se requieren para localizar imágenes de sonido a ángulos de 10, 20 y 30. La función ilustrada en la Figura 5 se puede obtener basado en las Figuras 4(a) y 4(b). Haciendo referencia a la Figura 5, diversas combinaciones de diferencia de amplitud-diferencia de tiempo se pueden proporcionar para localizar una imagen de sonido en una posición predeterminada. Por ejemplo, supóngase que una diferencia de amplitud de 8 dB se proporciona como información de parámetro de mezclado a fin de localizar una imagen de sonido a un ángulo de 20. De conformidad con la función ilustrada en la Figura 5, una imagen de sonido también se puede localizar en el ángulo de 20 usando la combinación de una diferencia de amplitud de 3 dB y una diferencia de tiempo de 0.3 ms. En este caso, no solamente la información de diferencia de amplitud sino también la información de diferencia de tiempo se pueden proporcionar como información de parámetro de mezclado, mejorando de esta manera la sensación de espacio. Por lo tanto, a fin de generar sonidos con propiedades deseadas por un usuario durante una operación de mezclado/entrega, la información de parámetro de mezclado se puede convertir apropiadamente de manera que cualquiera de encuadramiento de amplitud y encuadramiento de tiempo sea apropiado para que el usuari8o realice. Es decir, si la información de parámetro de mezclado solamente incluye información de diferencia de amplitud y el usuario desea sonidos con una sensación profunda de espacio, la información de diferencia de amplitud se puede convertir en información de diferencia de tiempo equivalente a la información de diferencia de amplitud con referencia a datos psicoacústicos . Alternativamente, si el usuario desea ambos sonidos con una sensación profunda de espacio y una localización precisa de imágenes de sonido, la información de diferencia de amplitud se puede convertir hacia la combinación de información de diferencia de amplitud y la información de diferencia de tiempo equivalente a la información de amplitud original. Alternativamente, si la información de parámetro de mezclado solamente incluye información de diferencia de tiempo y un usuario prefiere una localización precisa de imágenes de sonido, la información de diferencia de tiempo se puede convertir en información de diferencia de amplitud equivalente a la información de diferencia de tiempo, o se puede convertir en la combinación de información de diferencia de amplitud e información de diferencia de tiempo que pueda satisfacer la preferencia del usuario mejorando tanto la precisión de localización de imágenes de sonido y la sensación de espacio. Todavía alternativamente, si la información de parámetro de mezclado incluye tanto información de diferencia de amplitud e información de diferencia de tiempo y un usuario prefiere una localización precisa de imágenes de sonido, la combinación de la información de diferencia de amplitud original y la información de diferencia de tiempo. Por otra parte, si la información de parámetro de mezclado incluye tanto información de diferencia de amplitud e información de diferencia de tiempo y un usuario prefiere la mejora de la sensación de espacio, la combinación de la información de diferencia de amplitud y la información de diferencia de tiempo se puede convertir en información de diferencia de tiempo equivalente a la combinación de la información de diferencia de ampli9tud y la información de diferencia de tiempo original. Haciendo referencia a la figura 6, la información de control puede incluir información de mezclado/entrega e información armónica respecto a una o más señales de objeto. La información armónica puede incluir cuando menos una información de paso, información de frecuencia fundamental, e información de banda de frecuencia dominante respecto a una o más señales de objeto, y descripciones de la energía y espectro de cada sub-banda de cada una de las señales originales. La información armónica se puede usar para procesar una señal de objeto durante una operación de entrega debido a que la resolución de un servidor que realiza su operación en unidades de sub-bandas es insuficiente. Si la información armónica incluye información de paso respecto a una o más señales de objeto, la ganancia de cada una de las señales de objeto se puede ajustar atenuando o reforzando un dominio de frecuencia predeterminada usando un filtro de peine o un filtro de peina inverso. Por ejemplo, si una de una pluralidad de señales de objeto es una señal vocal, las señales de objeto se pueden usar como un karaoke atenuando solamente la señal vocal. Alternativamente, si la información armónica incluye información de dominio de frecuencia dominante respecto a una o más señales de objeto, se puede realizar un proceso de atenuar o reforzar el dominio de frecuencia dominante. Todavía alternativamente, si la información armónica incluye información de espectro respecto a una o más señales de objeto, la ganancia de cada una de las señales de objeto se puede controlar realizando atenuación o refuerzo sin ser restringidos por ningunos límites de subbandas . La Figura 7 es un diagrama de bloque de un aparato 140 de descodificación de audio de conformidad con otra modalidad de la presente invención. Haciendo referencia a la Figura 7, el aparato 140 de descodificación de audio utiliza un descodificador 141 de multicanal, en lugar de un descodificador de objeto y un servidor, y descodifica un número de señales de objeto después de que las señales de objeto están apropiadamente dispuestas en un espacio de multicanal . Más específicamente, el aparato 140 de descodificación de audio incluye el descodificador 141 de multicanal y un convertidor 145 de parámetro. El descodificador 141 de multicanal genera una señal de multicanal cuyas señales de objeto ya se han dispuesto en un espacio de multicanal basadas en una señal de mezcla descendente e información de parámetro espacial, que es información lateral basada en canal provista por el convertidor 145 de parámetro. El convertidor 145 de parámetro analiza información lateral e información de control transmitida por un aparato de codificación de audio (no mostrado) , y genera la información de parámetro espacial basado en el resultado del análisis. Más específicamente, el convertidor 145 de parámetro genera la información de parámetro espacial combinando la información lateral y la información de control que incluye información de establecimiento de reproducción e información de mezclado. Es decir, la conversión 145 de parámetro realiza la conversión de la combinación de la información lateral y la información de control a datos espaciales correspondientes a una caja de Uno-A-Dos (OTT)o una caja de Dos-A-Tres (TTT) . El aparato 140 de descodificación de audio puede realizar una operación de descodificación de multicanal hacia la que una operación de descodificación basada en objeto y una operación de mezclado/entrega se incorporan y de esta manera puede saltar la descodificación de cada señal de objeto. Por lo tanto, es posible reducir la complejidad de descodificación y/o mezclado/entrega.
Por ejemplo, cuando hay 10 señales de objeto y una señal de multicanal obtenida basada en las 10 señales de objeto se va a reproducir por un sistema de reproducción de parlante de 5.1 canal, un aparato típico de descodificación de audio basado en objeto genera señales descodificadas respectivamente correspondientes a las 10 señales de objeto basados en una señal de mezcla descendente e información lateral y luego genera una señal de 5.1 canal disponiendo apropiadamente las 10 señales de objeto en un espacio de multicanal de manera que las señales de objeto puedan hacerse apropiadas para un ambiente de parlante de .1 canal. Sin embargo, es ineficiente para generar 10 señales de objeto durante la generación de una señal de canal 5.1, y este problema se hace más severo a medida que aumenta la diferencia entre el número dee señales de objeto y el número canales de una señal de multicanal que se va a generar. Por otra parte, de conformidad con la modalidad de la figura 7, el aparato 140 de descodificación de audio genera información de parámetro espacial apropiada para una señal de 5.1-canal basada en información lateral e información de control, y proporciona la información de parámetro espacial y una señal de mezcla descendente al descodificador 141 de multicanal. Luego, el descodificador 141 de multicanal genera una señal de canal 5.1 basada en la información de parámetro espacial y la señal de mezcla descendente. En otras palabras, cuando el número de canales que va a tener salida es 5.1 canales, el aparato 140 de descodificación de audio puede generar fácilmente una señal de 5.1-canal basada en una señal de mezcla descendente sin la necesidad de generar 10 señales de objeto y de esta manera es más eficiente que un aparato de descodificación de audio convencional en términos de complejidad. El aparato 140 de descodificación de audio se considera eficiente cuando la cantidad de computación requerida calcula información de parámetro espacial correspondiente a cada una de una caja OTT y una caja TTT a través del análisis de información lateral e información de control transmitida por un aparato de codificación de audio es menos que la cantidad de computación requerida para realizar una operación de mezclado/entrega después de la descodificación de cada señal de objeto. El aparato 140 de descodificación de audio se puede obtener sencillamente añadiendo un módulo para generar información de parámetro espacial a través del análisis de información lateral e información de control a un aparato de descodificación de audio de multicanal típico, y de esta manera puede mantener la compatibilidad con un aparato típico de descodificación de audio de multicanal. Asimismo, el aparato 140 de descodificación de audio puede mejorar la calidad de sonido usando herramientas existentes de un aparato típico de descodificación de audio de multicanal tal como un configurador de envolvente, una herramienta de procesamiento temporal de subbandas (STP) , y un descorrelacionador . Dado todo esto, se concluye que todas las ventajas de un método típico de descodificación de audio de multicanal se puede aplicar fácilmente a un método de descodificación de audio de objeto. La información de parámetro espacial transmitida al descodificador 141 de multicanal mediante el convertidor 145 de parámetro puede haber sido comprimida de manera de ser apropiada para ser transmitida. Alternativamente, la información de parámetro espacial puede tener el mismo formato como aquella del dato transmitido por un aparato típico de codificación de multicanal. Es decir, la información de parámetro espacial puede haberse sometido a una operación de descodificación Huffman o una operación de descodificación piloto y de esta manera se puede transmitir a cada módulo como dato de marca espacial no comprimido. El formador es apropiado para transmitir la información de parámetro espacial a un aparato descodificador de audio de multicanal en un lugar remoto, y el último es conveniente debido a que no hay necesidad de un aparato de descodificación de audio de multicanal para convertir dato de marca espacial comprimido en dato de marca espacial no comprimido que se puede usar fácilmente en una operación de descodificación . La configuración de la información de parámetro espacial basada en el análisis de información lateral e información de control puede ocasionar un retraso entre una señal de mezcla descendente y la información de parámetro espacial. A fin de dirigir esto, una memoria intermedia adicional se puede proporcionar ya sea para una señal de mezcla descendente o para información de parámetro espacial de manera que la señal de mezcla descendente y la información de parámetro espacial se pueden sincronizar entre si. Estos métodos, sin embargo, son inconvenientes debido al requerimiento de proporcionar una memoria intermedia adicional. Alternativamente, la información lateral se puede transmitir antes de una señal de mezcla descendente en consideración a la posibilidad de ocurrencia de un retraso entre una señal de mezcla descendente e información de parámetro espacial. En este caso, la información de parámetro espacial obtenida combinando la información lateral e información de control no necesita ajustarse sino que se puede usar fácilmente. Si una pluralidad de señales de objeto de una señal de mezcla descendente tienen niveles diferentes, un módulo de ganancias de . mezcla descendente artística (ADG) que puede compensar directamente la señal de mezcla descendente puede determinar los niveles relativos de las señales de objeto, y cada una de las señales de objeto se puede asignar a una posición predeterminada en un espacio de multicanal usando dato de marca espacial tal como una información de diferencia de nivel de canal, información de correlación de intercanal (ICC), e información de coeficiente de predicción de canal (CPC) . Por ejemplo, si la información de control indica que una señal de objeto predeterminada se va a asignar a una posición predeterminada en un espacio de multicanal y tiene un niel superior que otras señales de objeto, un descodificador de multicanal típico puede calcular la diferencia entre las energías de canales de una señal de mezcla descendente, y dividir la señal remezcla descendente en un número de canales de salida basado en los resultados del cálculo. Sin embargo, un descodificador de multicanal típico no puede aumentar o reducir el volumen de un cierto sonido en una señal de mezcla descendente. En otras palabras, un descodificador de multicanal típico simplemente distribuye una señal de mezcla descendente a un número de canales de salida y de esta manera no puede aumentar o reducir el volumen de un sonido en la señal de mezcla descendente. Es relativamente fácil asignar cada uno de un número de señales de objeto de una señal de mezcla descendente generada por un codificador de objeto a una posición predeterminada en un espacio de multicanal de conformidad con información de control. Sin embargo, se requieren técnicas especiales para aumentar o reducir la amplitud de una señal de objeto predeterminada. En otras palabras de una señal de mezcla descendente generada por un codificador de objeto se usa como está, es difícil reducir la amplitud de cada señal de objeto de la señal de mezcla descendente . Por lo tanto, de conformidad con una modalidad de la presente invención, las amplitudes relativas de señales de objeto se pueden variar de conformidad con información de control usando un módulo 147 de ADG ilustrado en la Figura 8. Más específicamente, la amplitud de cualquiera de una pluralidad de señales de objeto de una señal de mezcla descendente transmitida por un codificador de objeto se puede aumentar o reducir usando el módulo 147 de ADG. Una señal de mezcla descendente obtenida mediante compensación realizada por el módulo 147 de ADG se puede someter de descodificación de multicanal. Si las amplitudes relativas de señales de objeto de una señal de mezcla descendente se ajustan apropiadamente usando el módulo 147 de ADG, es posible realizar descodificación de objeto usando un descodificador típico de multicanal. Si una señal de mezcla descendente generada por un codificador de objeto es una señal mono o estéreo o u8na señal de multicanal con tres o más canales, la señal de mezcla descendente se puede procesar mediante el módulo 147 de ADG. Si una señal de mezcla descendente generada por un codificador de objeto tiene dos o más canales y una señal de objeto predeterminada que necesita ajustarse por el módulo 147 de ADG solamente existe en uno de los canales de la señal de mezcla descendente, el módulo 147 de ADG se puede aplicar solamente al canal que incluye la señal de objeto predeterminada, en lugar de ser aplicada a todos los canales de la señal de mezcla descendente. Una señal de mezcla descendente procesada por el módulo 147 de ADG en la forma arriba descrita se puede procesar fácilmente usando un descodificador de multicanal típico sin la necesidad de modificar la estructura del descodificador de multicanal. Aún cuando una señal de salida final no sea una señal de multicanal que puede reproducirse mediante un parlante de multicanal pero es u8na señal biaural, el módulo 147 de ADG se puede usar para ajusfar las amplitudes relativas de señales de objeto de la señal de salida final. Alternativamente al uso del módulo 147 de ADG, información de ganancia que especifica un valor de ganancia que se va a aplicar a cada señal de objeto se puede incluir en información de control durante la generación de un número de señales de objeto. Para esto, la estructura de un descodificador de multicanal típico se puede modificar. Aún cuando requiera una modificación a la estructura de un descodificador de multicanal existente, este método es conveniente en términos de reducir la complejidad de descodificación aplicando un valor de ganancia a cada señal de objeto durante una operación de descodificación sin la necesidad de calcular ADG y compensar para cada señal de objeto. La Figura 9 es un diagrama de bloque de un aparato 150 de descodificación de audio de conformidad con una cuarta modalidad de la presente invención. Haciendo referencia a la Figura 9, el aparato 150 de descodificación de audio se caracteriza por generar una señal biaural. Más específicamente, el aparato 150 de descodificación de audio incluye un descodificador 151 biaural de multicanal, un primer convertidor 157 de parámetro, y un segundo convertidor 159 de parámetro. El segundo convertidor 159 de parámetro analiza información lateral e información de control que se proporciona mediante un aparato de codificación de raudio, y configura información de parámetro espacial basado en el resultado del análisis. El primer convertidor 157 de parámetro configura información de parámetro biaural, que se puede usar por el descodificador 151 biaural de multicanal, añadiendo información tridimensional (3D) tal como parámetro de función de transferencia relacionada con cabeza 8HRTF) a la información de parámetro espacial. El descodificador 151 biaural de multicanal genera una señal tridimensional (3D) virtual aplicando la información de parámetro 3D virtual a una señal de mezcla descendente. El primer convertidor 157 de parámetro y el segundo convertidor 159 de parámetro se pueden reemplazar por un solo módulo, es decir, un módulo 155 de conversión de parámetro que recibe la información lateral, la información de control, y los parámetros de HRTF y configura la información de parámetro biaural basado en la información lateral, la información de control, y los parámetros de HRTF. Convencionalmente, a fin de generar una señal biaural para la reproducción de una señal de mezcla descendente que incluye 10 señales de objeto con un casco telefónico, una señal de objeto debe generar 10 señales de objeto basadas en la señal de mezcla descendente e información lateral. A continuación, el servidor asigna cada una de las 10 señales de objeto a una posición predeterminada en un espacio de multicanal con referencia a información de control de manera de ser apropiado a un ambiente de parlante de 5-canal. A continuación el servidor genera una señal de 5-canal que se puede reproducir usando un parlante de 5-canal. A continuación, el servidor aplica parámetros de HRTF a la señal de 5-canal, generando de esta manera una señal de 2-canal. Brevemente, el método de descodificación de audio convencional arriba mencionado incluye reproducir 10 señales de objeto, convirtiendo las 10 señales de objeto en una señal de 5-canal, y6 generando una señal de 2-canal basada en la señal de 5-canal, y de esta manera es ineficiente. Por otra parte, el aparato 150 de descodificación de audio puede generar fácilmente una señal baural, el aparato 150 de descodificación de audio configura información de parámetro espacial a través del análisis de información lateral e información de control, y de esta manera puede generar una señal biaural usando un descodificador biaural de multicanal típico. Además, el aparato 150 de descodificación de audio todavía puede usar un descodificador biaural de multicanal típico aún cuando esté equipado con un convertidor de parámetro incorporado que recibe información lateral, información de control, y parámetros de HRTF y configura la información de parámetro biaural basado en la información lateral, la información de control, y los parámetros de HRTF. La Figura 10 es un diagrama de bloque de un aparato 160 de descodificación de audio de conformidad con una quinta modalidad de la presente invención. Haciendo referencia a la Figura 10, el aparato 160 de descodificación de audio incluye un procesador 161 de mezcla descendente, un descodificador 163 de multicanal, y un convertidor 165 de parámetro. El procesador 161 de mezcla descendente y el convertidor 163 de parámetro se pueden reemplazar por un solo módulo 167. El convertidor 165 de parámetro genera información de parámetro espacial, que se puede usar por el descodificador 163 de multicanal, e información de parámetro, que se puede usar por el procesador 161 de mezcla descendente. El procesador 161 de mezcla descendente realiza una operación de procesamiento previo en una señal de mezcla descendente, y transmite una señal de mezcla descendente que resulta de la operación de procesamiento previo al descodificador 163 de multicanal. El descodificador 163 de multicanal realiza una operación de descodificación en la señal de mezcla descendente transmitida por el procesador 161 de mezcla descendente, dando salida de esta manera a una señal estéreo, una señal estéreo biaural o una señal de multicanal. Los ejemplos de la operación de procesamiento previo realizada por el procesador 161 de mezcla descendente incluyen la modificación o conversión de una señal de mezcla descendente en un dominio de tiempo o un dominio de frecuencia usando filtración. Si una señal de mezcla descendente entrada al aparato 160 de descodificación de audio es una señal estéreo, la señal de mezcla descendente puede haberse sometido a procesamiento de mezcla descendente realizado por el procesador 161 de mezcla descendente antes de recibir entrada al descodificador 163 de multicanal debido a que el descodificador 163 de multicanal no puede mapear un componente dee la señal descendente correspondiente al canal izquierdo, que es uno de los múltiples canales, a un canal derecho, que es otro de los múltiples canales. Por lo tanto, a fin de desplazar la posición de una señal de objeto clasificada en el canal izquierdo a la dirección del canal derecho, la señal de mezcla descendente entrada al aparato 160 de descodificación de audio se puede procesar previamente por el procesador 161 de mezcla descendente, y la señal de mezcla descendente previamente procesada puede recibir entrada al descodificador 163 de multicanal . El procesamiento previo de la señal de mezcla descendente estéreo se puede realizar basado en la información de procesamiento previo obtenida de la información lateral y de la información de control. La Figura 11 es un diagrama de bloque de un aparato 170 de descodificación de audio de conformidad con una sexta modalidad de la presente invención. Haciendo referencia a la Figura 11, el aparato 170 de descodificación de audio incluye un descodificador 171 de multicanal, un procesador 173 de canal, y un convertidor 175 de parámetro. El convertidor 175 de parámetro genera información de parámetro espacial, que se puede usar por el descodificador 173 de multicanal, e información de parámetro, que3 se puede usar por el procesador 173 de canal. El procesador 173 de canal realiza una operación de procesamiento posterior en una señal salida por el descodificador 173 de multicanal. Los ejemplos de la salida de señal por el descodificador 173 de multicanal incluyen una señal estéreo, una señal estéreo biaural y una señal de multicanal. Ejemplos de la operación de procesamiento posterior realizada por el procesador 173 posterior incluyen la modificación y conversión de cada canal o todos los canales de una señal de salida. Por ejemplo, si la información lateral incluye información de frecuencia fundamental respecto a una señal de objeto predeterminada, el procesador 173 de canal puede remover los componentes armónicos de la señal de objeto predeterminada con referencia a la información de frecuencia fundamental. Un método de descodificación de audio de multicanal no puede ser suficientemente eficiente para usarse en un sistema de karaoke. Sin embargo, si la información de frecuencia fundamental respecto a señales de objeto vocales se incluye en información lateral y componentes armónicos de las señales de objeto vocal y se remueven durante una operación de procesamiento posterior, es posible realizar un sistema de karaoke de alto funcionamiento usando la modalidad de la Figura 11. La modalidad de la Figura 11 también se puede aplicar a señales de objeto, distintas a las señales de objeto vocal. Por ejemplo, es posible remover el sonido de un instrumento musical predeterminado usando la modalidad de la Figura 11. Asimismo, es posible amplificar componentes armónicos predeterminados usando información de frecuencia fundamental respecto a señales de objeto usando la modalidad de la Figura 11. El procesador 173 de canal puede realizar procesamiento de efecto adicional en una señal de mezcla descendente. Alternativamente, el procesador 173 de canal puede añadir una señal obtenida por el procesamiento de efecto adicional a una salida de señal por el descodificador 171 de multicanal. El procesador 173 de canal puede cambiar el espectro de un objeto o modificar una señal de mezcla descendente siempre que sea necesario. Si no es apropiado realizar directamente una operación de procesamiento de efecto tal como reverberación en una señal de mezcla descendente y para transmitir una señal obtenida por la operación de procesamiento de efecto al descodificador 171 de multicanal, el procesador 173 de mezcla descendente puede añadir la señal obtenida por la operación de procesamiento de efecto a la salida del descodificador 171 de multicanal, en lugar de realizar procesamiento de efecto en la señal de mezcla descendente. El aparato 170 de descodificación de audio se puede diseñar para incluir no solamente el procesador 173 de canal sino también un procesador de mezcla descendente. En este caso, el procesador de mezcla descendente se puede disponer en frente del descodificador 173 de multicanal, y el procesador 173 de canal se puede disponer detrás del descodificador 173 de multicanal. La Figura 12 es un diagrama de bloque de un aparato 210 de descodificación de audio de conformidad con una séptima modalidad de la presente invención. Haciendo referencia a la Figura 12, el aparato 210 de descodificación de audio utiliza un descodificador 213 de multicanal, en lugar de un descodificador de objeto. Más específicamente, el aparato 210 de descodificación de audio incluye el descodificador 213 de multicanal, un transcodificador 215, un servidor 217, y una basa 217 de datos de información 3D. El servidor 217 determina las posiciones 3D de una pluralidad de señales de objeto basado en información 3D correspondiente a dato de índice incluido en la información de control. El transcodificador 215 genera información lateral basada en canal mediante información de posición de sintetización respecto a un número de señales de audio de objeto al que la información 3D se aplica por el servidor 217. El descodificador 213 de multicanal da salida a una señal 3D aplicando la información lateral basada en canal a una señal de mezcla descendiente. Una función de transferencia relacionada con cabeza (HRTF) se puede usar como la información 3D. Una HRTF es una función de transferencia que describe la transmisión de ondas de sonido entre una fuente de sonido en una posición arbitraria y el tambor de oído, y regresa un valor que varié de conformidad con la dirección y altitud de la fuente de sonido. Si una señal sin directividad se filtra usando la HRTF, la señal se puede oír como si fuera reproducida desde una cierta dirección. Cuando se recibe una corriente de bits de entrada, el aparato 210 de descodificación de audio extrae una señal de mezcla descendente basada en objeto e información de parámetro basada en objeto de la corriente de bits de entrada usando un desmultiplexor (no mostrado) . Luego, el servidor 217 extrae dato de índice de la información de control, que se usa para determinar las posiciones de una pluralidad de señales de audio de objeto, y retira información 3D correspondiente al dato de índice extraído de la base 219 de datos de información 3D. Más específicamente, mezclar información de parámetro, que se incluye en información de control que se usa por el aparato 210 de descodificación de audio, puede incluir no solamente información de nivel sino también dato de índice necesario para buscar la información 3D. El mezclado de información de parámetro también puede incluir información de tiempo respecto a la diferencia de tiempo entre canales, información de posición y uno o más parámetros obtenidos combinando apropiadamente la información de nivel y la información de tiempo. La posición de una señal de audio de objeto se puede determinar inicialmente de conformidad con información de parámetro de mezclado de falla, y se puede cambiar posteriormente aplicando información 3D correspondiente a una posición deseada por un usuario a la señal de audio de objeto. Alternativamente, si el usuario desea aplicar un efecto 3D solamente a varias señales de audio de objeto, la información de nivel y la información de tiempo respecto a otras señales de audio de objeto a la que el usuario no desea aplicar un efecto 3D se puede usar como información de parámetro de mezclado. El transcodificador4 217 genera información lateral basada en canal respecto a M canales sintetizando la información de parámetro basada en objeto respecto a N señales de objeto transmitidas por un aparato de codificación de audio e información de posición de un número de señales de objeto a las que la información 3D tal como una HRTF se aplica por el servidor 217. El descodificador 213 de multicanal genera una señal de audio basada en una señal de mezcla descendente y la información lateral basada en canal provista por el transcodificador 217, y genera una señal de multicanal 3D realizando una operación de entrega de 3D usando información 3D incluida en la información lateral basada en canal. La Figura 13 es un diagrama de bloque de un aparato 220 de descodificación de audio de conformidad con una octava modalidad de la presente invención. Haciendo referencia a la Figura 13, el aparato 220 de descodificación de audio es diferente al aparato 210 de descodificación de audio ilustrado en la Figura 12 en que un transcodificador 225 transmite información lateral basada en canal e información 3D separadamente a un descodificador 223 de multicanal. En otras palabras, el transcodificador 225 del aparato 220 de descodificdación de audio obtiene información lateral basada en canal respecto a canales de información de parámetro basada en objeto respecto a N señales de objeto y transmite la información lateral basada en canal e información 3D, que se aplica a cada una de las N señales de objeto, al descodificador 223 de multicanal, mientras que el transcodificador 217 del aparato 210 de descodificación de audio transmite información lateral basada en canal que incluye información 3D al descodificador 213 de multicanal. Haciendo referencia a la Figura 14, la información lateral basada en canal y la información 3D pueden incluir una pluralidad de índices de cuadro. De esta manera, el descodificador 223 de multicanal puede sincronizar la información lateral basada en canal y la informaci'n 3D con referencia a los índices de cuadro de cada una de la información lateral basada en canal y la información 3D, y de esta manera puede aplicar información 3D a un cuadro de una corriente de bits correspondiente a la información 3D. Por ejemplo, la información 3d que tiene índice 2 se puede aplicar al principio del cuadro 2 que tiene el índice 2. Puesto que la información lateral basada en canal y la información 3D ambas incluyen índices de cuadro, es posible determinar efectivamente una posición temporal de la información lateral basada en canal a la que se va a aplicar la información 3D, aun cuando la información 3D esté actualizada con el tiempo. En otras palabras, el transcodificador 225 incluye información 3D y un número de índices de cuadro en información lateral basada en canal, y de esta manera, el descodificador 223 de ulticanal puede sincronizar fácilmente la información lateral basada en canal y la información 3D. El procesador 231 de mezcla descendente, el transcodificador 235, el servidor 237 y la base dee datos de información 3D se pueden reemplazar por un solo módulo 239. La Figura 15 es un diagrama de bloque de un aparato 230 de descodificación de audio de conformidad con una novena modalidad de la presente invención. Hacdiendo referencia a la Figura 15, el aparato 230 de descodificación de audio se diferencia del aparato 220 de descodificación de audio ilustrado en la Figura 14 por incluir además un procesador 231 de mezcla descendente. Más específicamente, el aparato 230 de descodificación de audio incluye un transcodificador 235, un servidor 237, una base 239 de datos de información 3D, un descodificador 233 de multicanal, y el procesador 231 de mezcla descendente. El transcodificador 235, el servidor 237, la base 239 de datos de información 3D, y el descodificador 233 de multicanal son los mismos que sus contrapartes respectivas ilustradas en la figura 14. El procesador 231 de mezcla descendente realiza una operación de procesamiento previo en una señal de mezcla descendente estéreo para ajuste de posición. La base 239 de datos de información 3D puede estar incorporada con el servidor 237. un módulo para aplicar un efecto predeterminado a una señal de mezcla descendente también se puede proporcionar en el aparato 230 de descodificación de audio. La Figura 16 ilustra un diagrama de bloque de un aparato 240 de descodificación de audio de conformidad con una décima modalidad de la presente invención. Haciendo referencia a la Figura 16, el aparato 240 de descodificación de audio se diferencia del aparato 230 de descodificación de audio ilustrado en la Figura 15 por incluir un combinador 241 de unidad de control de multipunto. Es decir, el aparato 240 de descodificación de audio, como el aparato 230 de descodificación de audio, incluye un procesador 243 de mezcla descende3nte, un descodificador 244 de multicanal, un transcodificador 245, un servidor 247, y una base 249 de datos de información 3D. El combinador 241 de unidad de control de multipunto combina una pluralidad de corrientes de bits obtenidas mediante la codificación basada en objeto, obteniendo de esta manera una sola corriente de bits. Por ejemplo, cuando una primera corriente de bits para una primera señal de audio y una segunda corriente de bits para una segunda señal de audio reciben entrada, el combinador 241 de unidad de control de multipunto extrae una primera señal de mezcla descendente de la primera corriente de bits, extrae una segunda señal de mezcla descendente de la segunda corriente de bits y genera una tercera señal de mezcla descendente combinando la primera y segunda señales de mezcla descendente. Además, el cfombinador 241 de unidad de control de multipunto extrae primera información lateral basada en objeto de la primera corriente de bits, extrae segunda información lateral basada en objeto de la segunda corriente de bits, y genera tercera información lateral basada en objeto combinando la primera información lateral basada en objeto y la segunda información lateral basada en objeto. A continuación, el combinador 241 de unidad de control de multipunto genera una corriente de bits combinando la tercera señal de mezcla descendente y la tercera información lateral basada en objeto y da salida a la corriente de bits generada. Por lo tanto, de conformidad con la décima modalidad de la presente invención, es posible procesar eficientemente señales pares transmitidas por dos o más socios de comunicación comparada con el caso de codificar o descodificar cada señal de objeto. A fin de que el combinador 241 de unidad de control de multipunto para incorporar una pluralidad de señales de mezcla descendente, que son respectivamente extraídas de una pluralidad de corrientes de bits y están asociadas con diferentes códigos de compresión, hacia una sola señal de mezcla descendente, las señales de mezcla descendente pueden necesitar convertirse en señales de modulación de código de impulso (PCM) o señales en un dominio de frecuencia predeterminado de conformidad con los tipos de las codificaciones de compresión de las señales de mezcla descendente, las señales de PCM o las señales obtenidas mediante la conversión pueden necesitar combinarse juntas, y una señal obtenida por la combinación puede necesitar ser convertida usando un código de compresión predeterminado. En este caso, puede ocurrir un retraso de conformidad con si las señales de mezcla descendente se incorporan en una señal de PCM o en una señal en un dominio de frecuencia predeterminado. El retraso, sin embargo, puede no ser capaz de calcularse apropiadamente por un descodificador . Por lo tanto, el retraso puede necesitar ser incluido en una corriente de bits y transmitido junto con la corriente de bits. El retraso puede indicar el número de muestras de retraso en una señal de PCM o el número de muestras de retraso en un dominio de frecuencia predeterminado. Durante una operación de codificación de audio basada en objeto, un número considerable de señales de entrada en ocasiones puede necesitar ser procesado comparado con el número de señales de entrada generalmente procesados durante una operación de codificación de multicanal típica (v.gr., una operación de codificación de 5.1-canal o 7.1-canal) . Por lo tanto, el método de codificación de audio basado en objeto requiere biestratos mucho superiores que un método de codificación de audio de multicanal basado en canal típico. Sin embargo, puesto un método de codificación de audio basado en objeto involucra el procesamiento de señales de objeto que son menores que las señales de canal, es posible generar señales de salida dinámicas usando un método de codificación de audio basado en objeto. Un método de codificación e audio de conformidad con una modalidad de la presente invención se describirá a continuación con detalle con referencia a las Figuras 17 a 20. En un método de codificación de audio basado en objeto, las señales de objeto se pueden definir para representar sonidos individuales tales como la voz de un humano o el sonido de un instrumento musical. Alternativamente, los sonidos que tienen características similares tales como los sonidos de instrumentos musicales de cuerdas (v.gr., un violón, una viola, o un chelo), los sonidos pertenecientes a la misma banda de frecuencia, o sonidos clasificados en la misma categoría de conformidad con las direcciones y ángulos de sus fuentes de sonido, se pueden agrupar juntas, y definirse por las mismas señales de objeto. Todavía alternativamente, las señales de objeto se pueden definir usando la combinación de los métodos arriba descritos . Un número de señales de objeto se puede transmitir como una señal de mezcla descendente e información lateral. Durante la creación de información que se va a transmitir, la energía o potencia de una señal de mezcla descendente o cada una de una pluralidad de señales de objeto de la señal de mezcla descendente se calcula originalmente con el propósito de detectar el envolvente de la señal de mezcla descendente. Los resultados del cálculo se pueden usar para transmitir las señales de objeto o la señal de mezcla descendente o para calcular la relación de los niveles de las señales de objeto. Un algoritmo de codificación de predicción lineal (LPC) se puede usar para reducir los biestratos. Más específicamente, un número de coeficientes de LPC que representan el envolvente de una señal se generan a través del análisis de la señal, y los coeficientes de LPC se transmiten, en lugar de transmitir información de envolvente respecto a la señal. Este método es eficiente en términos de biestratos. Sin embargo, puesto que los coeficientes de LPC muy probablemente serán discrepantes del envolvente real de la señal, este método requiere un proceso de adición tal como corrección de error. Brevemente, un método que involucra transmitir información de envolvente de una señal puede garantizar una alta calidad de sonido, pero resulta en un aumento considerable en la cantidad de información que necesita ser transmitida, pero requiere un proceso adicional tal como corrección de error y resulta en una disminución en la calidad de sonido. De conformidad con una modalidad de la presente invención, una combinación de estos métodos se puede usar. En otras palabras, el envolvente de una señal se puede representar por la energía o potencia de la señal o un valor de índice u otro valor tal como un coeficiente de LPC correspondiente a la energía o potencia de la señal. La información de envolvente respecto a una señal se puede obtener en unidades de secciones temporale3s o secciones de frecuencia. Más específicamente, haciendo referencia a la Figura 17, información de envolvente respecto a una señal se puede obtener en unidades de cuadros. Alternativamente, si una señal se representa por una estructura de banda de frecuencia usando un banco de filtro tal como un banco de filtro de espejo de cuadratura (QMF) , información de envolvente respecto a una señal se puede obtener en unidades de subbandas de frecuencia, divisiones de subbandas de frecuencia que son entidades menores que las subbandas de frecuencia, grupos de subbandas de frecuencia o grupos de divisiones de subbandas de frecuencia. Todavía alternativamente, una combinación del método basado en cuadro, el método basado en subbandas de frecuencia, y el método basado en división de subbandas de frecuencia se puede usar dentro del alcance de la presente invención. Todavía alternativamente, dado que los componentes de baja frecuencia de una señal generalmente tienen más información que los componentes de alta frecuencia de la señal, la información de envolvente respecto a los componentes de baja frecuencia de una señal se puede transmitir como está, mientras que la información de envolvente respecto a los componentes de alta frecuencia de la señal se pueden representar por coeficientes de LPC u otros valores y los coeficientes de LPC u otros valores se pueden transmitir en lugar de la información de envolvente respecto a los componentes de alta frecuencia de la señal. Sin embargo, los componentes de baja frecuencia de una señal pueden no tener necesariamente más información que los componentes de alta frecuencia de la señal. Por lo tanto, el método arriba descrito debe aplicarse flexiblemente de conformidad con las circunstancias. De conformidad con una modalidad de la presente invención, la información de envolvente o dato de índice correspondiente a una porción (a continuación referida como la porción dominante) de una señal que aparece dominante en un eje de tiempo7frecuencia se puede transmitir, y ninguno de la información de envolvente y dato de índice correspondiente a una porción no dominante de la señal se puede transmitir. Alternativamente, los valores (v.gr., coeficientes de LPC) que representan la energía y potencia de la porción dominante de la señal se puede transmitir, y ningunos de estos valores correspondientes a la porción no dominante de la señal se pueden transmitir. Todavía alternativamente, la información de envolvente o dato de índice correspondiente a la porción dominante de la señal se puede transmitir, y los valores que representan la energía o potencia de la porción no dominante de la señal se pueden transmitir. Todavía alternativamente, la información solamente respecto a la porción dominante de la señal se puede transmitir de manera que la porción no dominante de la señal pueda calcularse basado en la información r4especto a la porción dominante de la señal. Todavía alternativamente, una combinación de los métodos arriba descritos se puede usar. Por ejemplo, haciendo referencia a la Figura 18, si una señal de divide en un período dominante y un período no dominante, la información respecto a la señal se puede transmitir de cuatro maneras diferentes, como se indica por (a) a (d) . AA fin de transmitir un número de señales de objeto como la combinación de una señal de mezcla descendente y la información lateral, la señal de mezcla descendente necesita dividirse en una pluralidad de elementos como parte de una operación de descodificación, por ejemplo, en consideración a la relación de los niveles de las señales de objeto. A fin de garantizar la independencia entre los elementos de la señal de mezcla descendente, necesita realizarse adicionalmente una operación de descorrelación. Las señales de objeto que son las unidades de codificación en un método de codificación basado en objeto tienen más independencia que las señales de canal que son las unidades de codificación en un método de codificación de multicanal. En otras palabras, una señal de canal incluye un número de señales de objeto, y de esta manera necesita ser descorrelacionada. Por otra parte, las señales de objeto son independientes una de la otra, y de esta manera, la separación de canal se puede realizar fácilmente usando simplemente las características de las señales de objeto sin un requerimiento de una operación de descorrelación. Más específicamente, haciendo referencia a la figura 19, las señales A, B y C de objeto toman turnos para aparecer dominantes en un eje de frecuencia. En este caso, no hay necesidad de dividir una señal de mezcla descendente en un número de señales de conformidad con la relación de los niveles de las señales A, B, y C de objeto y para realizar la deescorrelación . En su lugar, la información respecto a los períodos dominantes de las señales A, B, y C de objeto se pueden transmitir, o un valor de ganancia se puede aplicar a cada componente de frecuencia de cada una de las señales A, B, y C de objeto, saltando de esta manera la descorrelación. Por lo tanto, es posible reducir la cantidad de computación y6 reducir el biestrato por la cantidad que de otra manera habría sido requerida por la información lateral necesaria para descorrelación. Brevemente, a fin de saltar la descorrelación, que se realiza de modo de garantizar independencia entre un número de señales obtenidas dividiendo una señal de mezcla descendente de acuerdo con la relación de las relaciones de señales de objeto de la señal remezcla descendente, la información respecto a un dominio de frecuencia que incluye cada señal de objeto se puede transmitir como información lateral. Alternativamente, diferentes valores de ganancia se pueden aplicar a un período dominante durante el que cada señal de objeto aparece dominante y un período n dominante durante el que cada señal de objeto aparece menos dominante, y de esta manera, la información respecto al período dominante se puede proporcionar principalmente como información lateral. Todavía alternativamente, la información respecto al período dominante se puede transmitir como información lateral, y ninguna información respect6o al período no dominante se puede transmitir. Todavía alternativamente, una combinación de los métodos arriba descritos que son alternativas a un método de descorrelación se puede usar. Los métodos arriba descritos que son alternativas a Un método de descorrelación se pueden aplicar a todas las señales de objeto o solamente a algunas señales de objeto son periodos dominantes fácilmente distinguibles. Asimismo, los métodos arriba descritos que son alternativas a un método de descorrelación se puede aplicar variablemente en unidades de cuadros . La codificación de señales de audio de objeto usando una señal residual se describirá con detalle a continuación . En general, en un método de codificación de audio basado en objeto, un número de señales de objeto se codifican, y los resultados de la codificación se transmite como la combinación de una señal de mezcla descendente e información lateral. Luego, un número de señales de objeto se restauran de la señal de mezcla descendente a través de descodificación de conformidad con la información lateral, y las señales de objeto restauradas se mezclan apropiadamente, por ejemplo, a la solicitud de un usuario de conformidad con información de control, generando de esta manera una señal de canal final. Un método de codificación de audio basada en objeto generalmente apunta a variar libremente una señal de canal de salida de conformidad con información de control con la ayuda de un mezclador. Sin embargo, un método de codificación de audio basado en objeto también se puede usar para generar una salida de canal de una manera predefinida independientemente de la información de control- Para esto, la información lateral puede incluir no solamente información necesaria para obtener un número de señales de objeto de una señal de mezcla descendente sino también mezclar información de parámetro necesaria para generar una señal de canal. De esta manera, es posible generar una señal de salida de canal final sin ayuda de un mezclador. En este caso, dicho algoritmo como codificación residual se puede usar para mejorar la calidad de sonido. Un método de codificación residual ti8pico incluye codificar una señal y codificar el error entre la señal codificada y la señal original, es decir, una señal residual. Durante una operación de descodificación, la señal codificada se descodifica mientras que se compensa para el error entre la señal codificada y la señal original, restaurando de esta manera una señal que es tan similar a la señal original como es posible. Puesto que el error entre la señal codificada y la señal original es generalmente inconsiderable, es posible reducir la cantidad de información adicionalmente necesaria para realizar la codificación residual. Si una salida de canal final de un descodificador es fija, no solamente información de parámetro de mezclado necesaria para generar una señal de canal final sino también información de codificación residual se puede proporcionar como información lateral. En este caso, es posible mejorar la calidad de sonido. La Figura 20 es un diagrama de bloque de un aparato 310 de codificación de audio de conformidad con una modalidad de la presente invención. Haciendo referencia a la Figura 20, el aparato 310 de codificación de audio se caracteriza usando una señal residual. Más específicamente, el aparato 310 de codificación de audio incluye un codificador 311, un descodificador 313, un primer mezclador 315, un segundo mezclador 319, un sumador 317 y un generador 321 de corriente de bits. El primer mezclador 315 realiza una operación de mezclado en una señal original, y el segundo mezclador 319 realiza una operación de mezclado en una señal obtenida realizando una operación decodificación y luego una operación de descodificación en la señal original. El sumador 317 calcula una señal residual entre una señal salida por el primer mezclador 315 y una salida de señal por el segundo mezclador 319. El generador 321 de corriente de bits añade la señal residual a información lateral y transmite el resultado de la adición. De esta manera, es posible mejorar la calidad de sonido. El cálculo de una señal residual se puede aplicar a todas las porciones de una señal o solamente para porciones de baja frecuencia de una señal. Alternativamente, el cálculo de una señal residual se puede aplicar variablemente solo a dominios de frecuencia incluyendo señales dominantes sobre una base de cuadro-por-cuadro. Todavía alternativamente, una combinación de los métodos arriba descritos se puede usar. Puesto que la cantidad de información lateral que incluye información de señal residual es mucho mayor que la cantidad de información lateral que no incluye información de señal residual, el cálculo de una señal residual se puede aplicar solamente a algunas porciones de una señal que afectan directamente la calidad de sonido, previniendo de esta manera un aumento excesivo en biestrato. La presente invención se puede realizar como código legible por computadora escrito en un medio de registro legible por computadora. El medio de registro legible por computadora puede ser cualquier tipo de dispositivo de registro en el que el dato se almacena de una manera legible por computadora. Los ejemplos del medio de registro legible por computadora incluyen una ROM, una RAM, una CD-ROM, una cinta magnética, un disco suave, un almacenamiento de dato óptico, y una onda portadora (v.gr., transmisión de datos a través de la Internet) . El medio de registro legible por computadora se puede distribuir a través de una pluralidad de sistemas de computadora conectados a una red de manera que el código legible por computadora se escriba en el mismo y se ejecute del mismo en una manera descentralizada. Los programas funcionales, código, y segmentos de código necesarios para realizar la presente invención se pueden considerar fácilmente por uno de experiencia ordinaria en el ramo. Aplicabilidad Industrial Como se describe arriba, de conformidad con la presente invención, las imágenes de sonido son localizadas para cada señal de audio de objeto beneficiándose de las ventajas de métodos de codificación y descodificación de audio basado en objeto. De esta manera, es posible ofrecer sonidos más realistas a través de la reproducción de señales de audio de objeto. Además, la presente invención se puede aplicar a juegos interactivos, y de esta manera puede proporcionar a un usuario con una experiencia de realidad virtual más realista. Mientras que la presente invención se ha mostrado y descrito particularmente con referencia a modalidades de ejemplo de la misma, se entenderá por aquellos de experiencia ordinaria en el ramo que diversos cambios en forma y detalles se pueden hacer en la misma sin abandonar el espíritu y alcance de la presente invención como se define por las siguientes reivindicaciones.

Claims (21)

  1. REIVINDICACIONES 1. - Un método de descodificación de audio que comprende . extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral a base de canal basada en información lateral basada en objeto e información de control para entregar una señal de mezcla descendente; procesar la señal de mezcla descendente usando una señal de canal descorrelacionada; y generar una señal de audio de multicanal usando la señal de mezcla descendente procesada y la información lateral basada en canal.
  2. 2. - El método de descodificación de audio de conformidad con la reivindicación 1, que comprende además, antes de generar la señal de audio de multicanal, modificar la señal de mezcla descendente usando la información lateral basada en objeto y la información de control.
  3. 3. - El método de descodificación de audio de conformidad con la reivindicación 2, en donde la modificación de la señal de mezcla descendente, comprende realizar cuando menos un ajuste de nivel, procesar imagen de sonido y adición de efecto en la señal de mezcla descendente.
  4. 4. - El método de descodificación de audio de conformidad con la reivindicación 3, en donde la modificación de la señal de mezcla descendente, comprende además modificar la señal de mezcla descendente ya sea en un dominio de tiempo o en un dominio de frecuencia.
  5. 5. - El método de descodificación de audio de conformidad con la reivindicación 3, que comprende además realizar procesamiento de reverberación en la señal de audio de multicanal.
  6. 6.- El método de descodificación de audio de conformidad con la reivindicación 3, que comprende además añadir una señal predeterminada obtenida por procesamiento de efecto a la señal de audio de multicanal.
  7. 7. - El método de descodificación de audio de conformidad con la reivindicación 1, en donde la señal de canal descorrelacionada se basa en la señal de audio de canal de señal de mezcla descendente.
  8. 8. - Un aparato de descodificación de audio que comprende : un desmultiplexor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; un convertidor de parámetro que genera información lateral basada en canal basada en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; un procesador de mezcla descendente que modifica la señal de mezcla descendente mediante señal de mezcla descendente descorrelacionada si la señal de mezcla descendente en una señal de mezcla descendente estéreo; y un descodificador de multicanal que genera una señal de audio de multicanal usando una señal de mezcla descendente modificada obtenida por el procesador de mezcla descendente y la información lateral basada en canal.
  9. 9. - El aparato de descodificación de audio de conformidad con la reivindicación 8, en donde el procesador de mezcla descendente modifica la señal de mezcla descendente usando la información lateral basada en objeto y la información de control .
  10. 10. - El aparato de descodificación de audio de conformidad con la reivindicación 9, en donde el procesador de mezcla descendente modifica la señal de mezcla descendente realizando cuando menos un ajuste de nivel, procesamiento de imagen de sonido y adición de efecto en la señal de mezcla descendente .
  11. 11. - El aparato de descodificación dee audio de conformidad con la reivindicación 9, en donde el procesador de mezcla descendente modifica la señal de mezcla descendente ya sea en un dominio de tiempo o en un dominio de frecuencia.
  12. 12. - El aparato de descodificación de audio de conformidad con la reivindicación 9, que comprende además un procesador de canal que realiza procesamiento de reverberación en la señal de audio de multicanal.
  13. 13. - El aparato de descodificación de audio de conformidad con la reivindicación 9, que comprende además un procesador de canal que añade una señal predeterminada obtenida por procesamiento de efecto a la señal de audio de multicanal .
  14. 14. - Un método de descodificación de audio que comprende : extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal y uno o más parámetros de procesamiento basado en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; generar una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y modificar la señal de audio de multicanal usando los parámetros de procesamiento.
  15. 15. - El método de descodificación de señal de audio de conformidad con la reivindicación 14, en donde la modificación de la señal de mezcla descendente, comprende realizar procesamiento de reverberación en la señal de audio de multicanal usando el parámetro.
  16. 16. - El método de descodificación de señal de audio de conformidad con la reivindicación 14, en donde la modificación de la señal de mezcla descendente, comprende añadir una señal obtenida mediante procesamiento de efecto a la señal de audio de multicanal.
  17. 17. - Un aparato de descodificación de audio que comprende : un desmultiplexor que extrae una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; un convertidor de parámetro que genera información lateral basada en canal y uno o más parámetros de procesamiento basados en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; un descodificador de multicanal que genera una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y un procesador de canal que modifica la señal de audio de multicanal usando los parámetros de procesamiento.
  18. 18. - El aparato de conformidad con la reivindicación 17, en donde el procesador de canal realiza procesamiento de reverberación en la señal de audio de multicanal usando el parámetro.
  19. 19. - El aparato de conformidad con la reivindicación 17, en donde el procesador de canal añade una señal obtenida por procesamiento de efecto a la señal de audio de multicanal.
  20. 20. - Un medio de registro legible por computadora que tiene registrado en el mismo un método de descodificación de audio que comprende : extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal basada en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; procesar la señal de mezcla descendente usando una señal de canal descorrelacionada; y generar una señal de audio de multicanal usando la señal de mezcla descendente procesada obtenida mediante el cambio y la información lateral basada en canal.
  21. 21.- Un medio de registro legible por computadora que tiene registrado en el mismo un método de descodificación de audio que comprende: extraer una señal de mezcla descendente e información lateral basada en objeto de una señal de audio; generar información lateral basada en canal y uno o más parámetros de procesamiento basados en información lateral basada en objeto e información de control para entregar la señal de mezcla descendente; generar una señal de audio de multicanal usando la señal de mezcla descendente y la información lateral basada en canal; y modificar la señal de audio de multicanal usando los parámetros de procesamiento.
MX2008012251A 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. MX2008012251A (es)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US84829306P 2006-09-29 2006-09-29
US82980006P 2006-10-17 2006-10-17
US86330306P 2006-10-27 2006-10-27
US86082306P 2006-11-24 2006-11-24
US88071407P 2007-01-17 2007-01-17
US88094207P 2007-01-18 2007-01-18
US94837307P 2007-07-06 2007-07-06
PCT/KR2007/004803 WO2008039043A1 (en) 2006-09-29 2007-10-01 Methods and apparatuses for encoding and decoding object-based audio signals

Publications (1)

Publication Number Publication Date
MX2008012251A true MX2008012251A (es) 2008-10-07

Family

ID=39230400

Family Applications (4)

Application Number Title Priority Date Filing Date
MX2008012251A MX2008012251A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012250A MX2008012250A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012246A MX2008012246A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012315A MX2008012315A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basados en objeto.

Family Applications After (3)

Application Number Title Priority Date Filing Date
MX2008012250A MX2008012250A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012246A MX2008012246A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
MX2008012315A MX2008012315A (es) 2006-09-29 2007-10-01 Metodos y aparatos para codificar y descodificar señales de audio basados en objeto.

Country Status (10)

Country Link
US (7) US7979282B2 (es)
EP (4) EP2071564A4 (es)
JP (4) JP4787362B2 (es)
KR (4) KR101069266B1 (es)
AU (4) AU2007300814B2 (es)
BR (4) BRPI0711104A2 (es)
CA (4) CA2646045C (es)
MX (4) MX2008012251A (es)
RU (1) RU2551797C2 (es)
WO (4) WO2008039041A1 (es)

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
CN101529504B (zh) 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
CA2874451C (en) 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP5023662B2 (ja) * 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
JP4838361B2 (ja) * 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
EP2095365A4 (en) * 2006-11-24 2009-11-18 Lg Electronics Inc METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
WO2008084427A2 (en) * 2007-01-10 2008-07-17 Koninklijke Philips Electronics N.V. Audio decoder
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
CN102007532B (zh) 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
KR101062351B1 (ko) 2008-04-16 2011-09-05 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
EP2111062B1 (en) 2008-04-16 2014-11-12 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101061129B1 (ko) 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
US8639368B2 (en) 2008-07-15 2014-01-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2010008200A2 (en) * 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
KR101137361B1 (ko) * 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
CN102292769B (zh) * 2009-02-13 2012-12-19 华为技术有限公司 一种立体声编码方法和装置
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101123698B1 (ko) 2009-07-30 2012-03-15 삼성전자주식회사 프로세스 카트리지 및 이를 구비한 화상형성장치
JP5635097B2 (ja) 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
KR101405976B1 (ko) * 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US10326978B2 (en) * 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103119846B (zh) * 2010-09-22 2016-03-30 杜比实验室特许公司 利用对白水平归一化对音频流进行混合
CN103026406B (zh) * 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR101783962B1 (ko) * 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
TWI543642B (zh) * 2011-07-01 2016-07-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
KR101547809B1 (ko) * 2011-07-01 2015-08-27 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 시스템을 위한 동기화 및 전환 방법과 시스템
KR102394141B1 (ko) 2011-07-01 2022-05-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
CA2843226A1 (en) 2012-07-02 2014-01-09 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
CN104541524B (zh) * 2012-07-31 2017-03-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
EP2880653B1 (en) * 2012-08-03 2017-11-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
WO2014023477A1 (en) * 2012-08-10 2014-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for adapting audio information in spatial audio object coding
US20140114456A1 (en) * 2012-10-22 2014-04-24 Arbitron Inc. Methods and Systems for Clock Correction and/or Synchronization for Audio Media Measurement Systems
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
US9613660B2 (en) 2013-04-05 2017-04-04 Dts, Inc. Layered audio reconstruction system
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
KR102058619B1 (ko) * 2013-04-27 2019-12-23 인텔렉추얼디스커버리 주식회사 예외 채널 신호의 렌더링 방법
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
EP3712889A1 (en) * 2013-05-24 2020-09-23 Dolby International AB Efficient coding of audio scenes comprising audio objects
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
EP3055998A1 (en) * 2013-10-11 2016-08-17 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
JP6299202B2 (ja) * 2013-12-16 2018-03-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
JP6306958B2 (ja) * 2014-07-04 2018-04-04 日本放送協会 音響信号変換装置、音響信号変換方法、音響信号変換プログラム
US10341799B2 (en) * 2014-10-30 2019-07-02 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
US10057707B2 (en) 2015-02-03 2018-08-21 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
EP3780589A1 (en) 2015-02-03 2021-02-17 Dolby Laboratories Licensing Corporation Post-conference playback system having higher perceived quality than originally heard in the conference
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US10325610B2 (en) 2016-03-30 2019-06-18 Microsoft Technology Licensing, Llc Adaptive audio rendering
EP3465678B1 (en) 2016-06-01 2020-04-01 Dolby International AB A method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB201808897D0 (en) * 2018-05-31 2018-07-18 Nokia Technologies Oy Spatial audio parameters
US11445296B2 (en) 2018-10-16 2022-09-13 Sony Corporation Signal processing apparatus and method, and program to reduce calculation amount based on mute information
JP7326824B2 (ja) 2019-04-05 2023-08-16 ヤマハ株式会社 信号処理装置、及び信号処理方法

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3882280A (en) * 1973-12-19 1975-05-06 Magnavox Co Method and apparatus for combining digitized information
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
RU2121718C1 (ru) 1998-02-19 1998-11-10 Яков Шоел-Берович Ровнер Портативная музыкальная система для караоке и картридж для нее
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3173482B2 (ja) 1998-11-16 2001-06-04 日本ビクター株式会社 記録媒体、及びそれに記録された音声データの音声復号化装置
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US7020618B1 (en) * 1999-10-25 2006-03-28 Ward Richard E Method and system for customer service process management
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US6849794B1 (en) * 2001-05-14 2005-02-01 Ronnie C. Lau Multiple channel system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP2003186500A (ja) 2001-12-17 2003-07-04 Sony Corp 情報伝達システム、情報符号化装置および情報復号装置
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US8340302B2 (en) * 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
JP2005533271A (ja) 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2004064363A (ja) 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
JP2006503319A (ja) 2002-10-14 2006-01-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号フィルタリング
US7395210B2 (en) 2002-11-21 2008-07-01 Microsoft Corporation Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform
CN1717955B (zh) * 2002-12-02 2013-10-23 汤姆森许可贸易公司 用于描述音频信号的合成的方法
EP1621047B1 (en) 2003-04-17 2007-04-11 Koninklijke Philips Electronics N.V. Audio signal generation
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1768107B1 (en) 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
JP4466242B2 (ja) 2004-07-13 2010-05-26 株式会社サタケ ペレット選別機
KR100658222B1 (ko) 2004-08-09 2006-12-15 한국전자통신연구원 3차원 디지털 멀티미디어 방송 시스템
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP5106115B2 (ja) 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005008342A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8359341B2 (en) 2005-12-10 2013-01-22 International Business Machines Corporation Importing content into a content management system using an e-mail application
CN101356573B (zh) * 2006-01-09 2012-01-25 诺基亚公司 对双耳音频信号的解码的控制
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
KR101358700B1 (ko) * 2006-02-21 2014-02-07 코닌클리케 필립스 엔.브이. 오디오 인코딩 및 디코딩
DE102007003374A1 (de) 2006-02-22 2007-09-20 Pepperl + Fuchs Gmbh Induktiver Näherungsschalter sowie Verfahren zum Betreiben eines solchen
CN101406073B (zh) 2006-03-28 2013-01-09 弗劳恩霍夫应用研究促进协会 用于多声道音频重构中的信号成形的增强的方法
CA2656867C (en) * 2006-07-07 2013-01-08 Johannes Hilpert Apparatus and method for combining multiple parametrically coded audio sources
US8271290B2 (en) * 2006-09-18 2012-09-18 Koninklijke Philips Electronics N.V. Encoding and decoding of audio objects
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
TW200930042A (en) * 2007-12-26 2009-07-01 Altek Corp Method for capturing image

Also Published As

Publication number Publication date
US8762157B2 (en) 2014-06-24
US8625808B2 (en) 2014-01-07
BRPI0711185A2 (pt) 2011-08-23
AU2007300813A1 (en) 2008-04-03
US20110196685A1 (en) 2011-08-11
JP2010505142A (ja) 2010-02-18
US7979282B2 (en) 2011-07-12
US9792918B2 (en) 2017-10-17
US7987096B2 (en) 2011-07-26
JP5238707B2 (ja) 2013-07-17
CA2645908C (en) 2013-11-26
CA2646045A1 (en) 2008-04-03
JP4787362B2 (ja) 2011-10-05
MX2008012246A (es) 2008-10-07
JP5238706B2 (ja) 2013-07-17
US20090157411A1 (en) 2009-06-18
CA2645910C (en) 2015-04-07
CA2645908A1 (en) 2008-04-03
BRPI0710923A2 (pt) 2011-05-31
EP2070080A1 (en) 2009-06-17
US8504376B2 (en) 2013-08-06
EP2070080A4 (en) 2009-10-14
AU2007300813B2 (en) 2010-10-14
AU2007300810B2 (en) 2010-06-17
EP2071563A1 (en) 2009-06-17
KR20090013178A (ko) 2009-02-04
JP2010505141A (ja) 2010-02-18
AU2007300812B2 (en) 2010-06-10
AU2007300812A1 (en) 2008-04-03
AU2007300810A1 (en) 2008-04-03
US20160314793A1 (en) 2016-10-27
WO2008039039A1 (en) 2008-04-03
KR101069266B1 (ko) 2011-10-04
JP2010505140A (ja) 2010-02-18
MX2008012250A (es) 2008-10-07
KR101065704B1 (ko) 2011-09-19
CA2645909C (en) 2012-12-11
EP2071564A1 (en) 2009-06-17
EP2071563A4 (en) 2009-09-02
BRPI0711104A2 (pt) 2011-08-23
BRPI0711102A2 (pt) 2011-08-23
RU2010141970A (ru) 2012-04-20
US9384742B2 (en) 2016-07-05
US20080140426A1 (en) 2008-06-12
MX2008012315A (es) 2008-10-10
US20090164222A1 (en) 2009-06-25
CA2645910A1 (en) 2008-04-03
KR20090026121A (ko) 2009-03-11
EP2070081A4 (en) 2009-09-30
RU2551797C2 (ru) 2015-05-27
US20140303985A1 (en) 2014-10-09
CA2645909A1 (en) 2008-04-03
AU2007300814A1 (en) 2008-04-03
JP5232789B2 (ja) 2013-07-10
JP2010505328A (ja) 2010-02-18
WO2008039041A1 (en) 2008-04-03
WO2008039043A1 (en) 2008-04-03
EP2070081A1 (en) 2009-06-17
US20090164221A1 (en) 2009-06-25
CA2646045C (en) 2012-12-11
KR100987457B1 (ko) 2010-10-13
AU2007300814B2 (en) 2010-05-13
EP2071564A4 (en) 2009-09-02
WO2008039042A1 (en) 2008-04-03
KR20090013177A (ko) 2009-02-04
KR20090009842A (ko) 2009-01-23

Similar Documents

Publication Publication Date Title
US9792918B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Legal Events

Date Code Title Description
FG Grant or registration