ES2836682T3 - Método y dispositivo para extraer parámetro de diferencia de fase entre canales - Google Patents

Método y dispositivo para extraer parámetro de diferencia de fase entre canales Download PDF

Info

Publication number
ES2836682T3
ES2836682T3 ES17805739T ES17805739T ES2836682T3 ES 2836682 T3 ES2836682 T3 ES 2836682T3 ES 17805739 T ES17805739 T ES 17805739T ES 17805739 T ES17805739 T ES 17805739T ES 2836682 T3 ES2836682 T3 ES 2836682T3
Authority
ES
Spain
Prior art keywords
current frame
ipd
extraction
parameter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17805739T
Other languages
English (en)
Inventor
Xingtao Zhang
Haiting Li
Zexin Liu
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2836682T3 publication Critical patent/ES2836682T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Stereophonic System (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Un metodo de extraccion de parametros de diferencia de fase entre canales, que comprende: obtener (S101) un parametro usado para determinar una forma de extraccion de informacion para una trama actual de una senal multicanal; determinar (S102) una forma de extraccion de parametros de diferencia de fase entre canales, IPD, para la trama actual de la senal multicanal en funcion del parametro usado para determinar la forma de extraccion de informacion para la trama actual de la senal multicanal, en donde la forma de extraccion de parametros IPD determinada para la trama actual de la senal multicanal es una de al menos dos formas de extraccion de parametros IPD preestablecidas; y extraer (S103) un parametro IPD de la trama actual de la senal multicanal en funcion de la forma de extraccion de parametros IPD determinada para la trama actual de la senal multicanal; en donde el parametro usado para determinar la forma de extraccion de informacion para la trama actual de la senal multicanal comprende al menos uno de un parametro caracteristico de la senal de la trama actual y un parametro caracteristico de la senal de cada una de las A tramas anteriores a la trama actual, en donde A es un numero entero no menor que 1; el parametro caracteristico de la senal de la trama actual comprende al menos uno de un parametro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de senal de la trama actual y una diferencia de tiempo entre canales, ITD, de la trama actual; el parametro caracteristico de la senal de cada una de las A tramas anteriores a la trama actual comprende al menos uno de un parametro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extraccion de parametros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de senal de cada una de las A tramas anteriores a la trama actual; y la clase de senal comprende trama de voz o trama de musica; caracterizado porque el parametro usado para determinar la forma de extraccion de informacion para la trama actual de la senal multicanal comprende el parametro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho; y si un valor del parametro que es de la trama actual y que representa la coherencia del canal izquierdoderecho es mayor que un primer umbral, la determinacion de una forma de extraccion de parametros IPD para la trama actual de la senal multicanal en funcion del parametro usado para determinar la forma de extraccion de informacion para la trama actual de la senal multicanal comprende: determinar que la forma de extraccion de parametros IPD para la trama actual de la senal multicanal es una primera forma de extraccion.

Description

DESCRIPCIÓN
Método y dispositivo para extraer parámetro de diferencia de fase entre canales
Campo técnico
La presente invención se refiere al campo de las tecnologías de las comunicaciones, y en particular, a un método y aparato de extracción de parámetros de diferencia de fase entre canales.
Antecedentes
Con la mejora de la calidad de vida, las personas tienen cada vez más demandas de audio de alta calidad. En comparación con el audio mono, el audio estéreo transmite una sensación de orientación y distribución de las fuentes de sonido, y puede hacer que la información de audio sea más clara y mejor comprendida y mejorar la sensación de presencia durante la reproducción de audio. Por lo tanto, el audio estéreo es altamente preferido por la gente.
La codificación estéreo paramétrica (Parametric Stereo, PS) es uno de los esquemas de codificación comunes para las tecnologías de procesamiento estéreo. La codificación PS significa que el procesamiento de codificación y decodificación se realiza en una señal estéreo (es decir, una señal multicanal) en función de una característica de percepción espacial, de modo que la codificación y decodificación de la señal multicanal se convierte en codificación y decodificación de señales de audio mono y codificación y decodificación de un parámetro de percepción espacial. Los parámetros de percepción espacial en la codificación PS incluyen una coherencia entre canales (Inter-channel Coherence, IC), una diferencia de nivel entre canales (Inter-channel Level Difference, ILD), una diferencia de tiempo entre canales (Inter-channel Time Difference, ITD), una diferencia de fase entre canales (Inter-channel Phase Difference, IPD) y similares. El ITD y el IPD son parámetros de percepción espacial que representan una orientación horizontal de una fuente de sonido. El ILD, el ITD y el IPD deciden cómo el oído humano percibe la ubicación de una fuente de sonido, lo que puede determinar efectivamente la ubicación de un campo de sonido y son importantes para la restauración de la señal estéreo. Por tanto, la determinación de parámetros tal como el IPD es importante para la restauración de la señal estéreo.
En la técnica anterior 1, para un parámetro IPD de cada trama de una señal estéreo, una señal en el dominio del tiempo se convierte en una señal en el dominio de la frecuencia, la señal en el dominio de la frecuencia se divide en una pluralidad de subbandas, se calcula un parámetro IPD para cada subbanda, y el parámetro IPD de cada subbanda se usa para la codificación de señales estéreo después de cuantificarse y codificarse. En la técnica anterior 1, para una señal en el dominio de la frecuencia en una pluralidad de subbandas, es necesario calcular un parámetro IPD para cada subbanda, ocupando una gran cantidad de recursos y provocando una tasa de codificación baja.
En la técnica anterior 2, para un parámetro IPD de cada trama de una señal estéreo, una señal en el dominio del tiempo se convierte en una señal en el dominio de la frecuencia, luego se calcula un parámetro IPD de una trama en función de la señal en el dominio de la frecuencia, donde el parámetro IPD de una trama se denomina parámetro de diferencia de fase entre canales de grupo (IPD de Grupo) y, finalmente, el parámetro IPD de grupo se usa para la codificación de señales estéreo después de cuantificarse y codificarse. En la técnica anterior 2, solo se extrae un parámetro IPD (el parámetro IPD de grupo) y, por lo tanto, solo puede cuantificarse y codificarse un parámetro IPD. Aunque se ocupa una pequeña cantidad de recursos, la precisión de la información de fase extraída es baja y la calidad de codificación es deficiente.
El documento EP 2296142 A2 divulga un método de codificación de audio en el que un codificador recibe una pluralidad de canales de entrada y genera uno o más canales de salida de audio y uno o más parámetros que describen las relaciones espaciales deseadas entre una pluralidad de canales de audio que pueden derivarse de uno o más canales de salida de audio, que comprenden detectar cambios en las características de la señal con respecto al tiempo en uno o más de la pluralidad de canales de entrada de audio, identificar como límites de eventos auditivos cambios en las características de la señal con respecto al tiempo en dicha una o más de la pluralidad de entradas de canales de audio, en donde un segmento de audio entre límites consecutivos constituye un evento auditivo en el canal o canales, y generar todos o algunos de dichos uno o más parámetros al menos en parte en respuesta a eventos auditivos y/o al grado de cambio en las características de la señal asociadas con dichos límites de eventos auditivos.
Resumen
Esta solicitud proporciona un método y un aparato de extracción de parámetros de diferencia de fase entre canales, para enriquecer las opciones de una forma de extracción de parámetros IPD, mantener mejor la información de fase y mejorar la calidad de codificación de audio.
La presente invención se define en las reivindicaciones independientes. Los ejemplos adicionales denominados modalidades en la descripción son ejemplos ilustrativos y no modalidades reivindicadas en la presente solicitud. De acuerdo con un primer aspecto, se proporciona un método de extracción de parámetros de diferencia de fase entre canales, donde el método puede incluir:
obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal.
De acuerdo con el método proporcionado en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros IPD de diferencia de fase entre canales, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede determinarse en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, y luego el parámetro IPD de la trama actual de la señal multicanal puede extraerse en base a la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al primer aspecto, en una primera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro característico de la señal de la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales ITD de la trama actual;
el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
El parámetro, proporcionado en esta solicitud, que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro característico de la señal de la trama actual, o el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, o el parámetro característico de la señal de la trama actual y el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, o similares. El parámetro característico de la señal de la trama actual y el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual pueden incluir uno o más parámetros, de modo que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro característico de la señal de la trama actual o el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual más estrechamente, y se mejora la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal.
Con referencia a la primera implementación posible del primer aspecto, en una segunda implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
De acuerdo con el método proporcionado en esta solicitud, cuando el valor de coherencia del canal izquierdoderecho de la trama actual cumple una condición, y la varianza de IPD de subbanda de la trama actual también cumple una condición, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona con el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual de la señal multicanal más estrechamente y se mejora la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal.
Con referencia a la primera implementación posible del primer aspecto, en una tercera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual; y
si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
De acuerdo con el método proporcionado en esta solicitud, cuando el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho cumple una condición, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, de modo que se mejore la aplicabilidad de la forma de extracción de parámetros iPd para la trama actual de la señal multicanal.
Con referencia a la segunda implementación posible del primer aspecto, en una cuarta implementación posible, el primer umbral es 0,75.
Con referencia a la primera implementación posible del primer aspecto, en una quinta implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
De acuerdo con el método provisto en esta solicitud, cuando la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual cumple con un requisito, y la clase de señal de cada una de las A tramas anteriores a la trama actual cumple con un requisito, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona más estrechamente con el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, y puede mejorarse la precisión de la selección de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal.
Con referencia a la primera implementación posible del primer aspecto, en una sexta implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
De acuerdo con el método proporcionado en esta solicitud, cuando los parámetros de características de la señal, como el parámetro ITD y la varianza de IPD de subbanda de la trama actual, cumplen las condiciones, y la clase de señal de cada una de las A tramas anteriores a la trama actual cumple con un requisito, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona más estrechamente tanto con el parámetro característico de la señal de la trama actual como con el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual y puede mejorarse la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal.
Con referencia a cualquiera de la segunda implementación posible del primer aspecto a la sexta implementación posible del primer aspecto, en una séptima implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0.
En esta solicitud, se proporcionan dos implementaciones opcionales como la primera forma de extracción, de modo que se enriquecen las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal y se mejora la aplicabilidad del método de extracción de parámetros IPD para la trama actual de la señal multicanal.
Con referencia a la séptima implementación posible del primer aspecto, en una octava implementación posible, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de la señal multicanal, la extracción de un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinado para la trama actual de la señal multicanal incluye:
extraer parámetros IPD de subbanda de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
De acuerdo con el método proporcionado en esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual puede extraerse, y el grupo IPD de la trama actual de la señal multicanal puede determinarse en función de los parámetros IPD de subbanda extraídos, de modo que el grupo IPD de la trama actual de la señal multicanal se correlacione con los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y pueda mejorarse la calidad de codificación de parámetros IPD. Cuando la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden usarse más bits para codificar otros parámetros, mejorando así la calidad de la codificación de audio.
Con referencia a cualquiera de la segunda implementación posible del primer aspecto a la sexta implementación posible del primer aspecto, en una novena implementación posible, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye además: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
Con referencia a la novena implementación posible del primer aspecto, en una décima implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y la determinación de que la forma de extracción de los parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción incluye:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia de canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros iPd de conjuntos de subbandas; y
la extracción de un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal incluye:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
De acuerdo con el método proporcionado en esta solicitud, cuando se determina que el parámetro IPD de la trama actual de la señal multicanal no es la primera forma de extracción, la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede determinarse además en base a los IPD de subbanda de una pluralidad de conjuntos de subbandas obtenidos al clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Cuando la varianza de IPD de subbanda de cada subconjunto obtenido a través de la clasificación cumple una condición, y el valor de coherencia del canal izquierdo-derecho de la trama actual también cumple una condición, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer los parámetros IPD de conjuntos de subbandas y, a continuación, puede calcularse el parámetro IPD de cada conjunto de subbandas, de modo que el parámetro IPD de cada conjunto de subbandas puede determinarse como el parámetro IPD de la trama actual de la señal multicanal. En esta solicitud, pueden enriquecerse las elecciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal. Se usa una pluralidad de parámetros IPD como parámetro IPD de la trama actual de la señal multicanal, de modo que la información de fase puede mantenerse mejor y puede mejorarse la precisión de la codificación de audio. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden usarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Con referencia a la novena implementación posible del primer aspecto, en una undécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de conjuntos de subbandas, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción incluye:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
Con referencia a la novena implementación posible del primer aspecto, en una duodécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción incluye:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de subbanda; y
la extracción de un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal incluye:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
De acuerdo con el método proporcionado en esta solicitud, cuando se determina que el parámetro IPD de la trama actual de la señal multicanal no es la primera forma de extracción, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de subbanda, y luego pueden calcularse los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, de modo que se pueda determinar un parámetro IPD de cada subbanda como el parámetro IPD de la trama actual de la señal multicanal. En esta solicitud, pueden enriquecerse las elecciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal. Los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual se usan como el parámetro IPD de la trama actual de la señal multicanal, para que la información de fase se pueda mantener mejor, y pueda mejorarse la precisión de la codificación de audio.
Con referencia a la novena implementación posible del primer aspecto, en una decimotercera implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción incluye:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del primer aspecto, en una decimocuarta implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual, la obtención de un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal incluye:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo-derecho de la trama actual de la señal multicanal en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho.
De acuerdo con el método proporcionado en esta solicitud, las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal pueden convertirse en señales en el dominio de la frecuencia de canal izquierdo y derecho, y el valor de coherencia del canal izquierdo y derecho de la trama actual puede calcularse en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho, para determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, de modo que la determinación de la forma de extracción de parámetros IPD para que la trama actual de la señal multicanal pueda correlacionarse más estrechamente con las señales en el dominio de la frecuencia de canal izquierdo-derecho de la trama actual, y puede mejorarse la precisión de la determinación de la forma de extracción de parámetros IPD.
Con referencia a la primera implementación posible del primer aspecto, en una decimoquinta implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la varianza de IPD de subbanda de la trama actual, un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal incluye:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular un IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función del IPD de cada subbanda.
De acuerdo con el método proporcionado en esta solicitud, las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal pueden convertirse en las señales en el dominio de la frecuencia de canal izquierdo y derecho, y el IPD de cada subbanda de la trama actual puede calcularse en función de las señales en el dominio de la frecuencia del canal izquierdo y derecho, para calcular la varianza de IPD de subbanda de la trama actual y luego determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, de modo que la determinación de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede correlacionarse con las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual más estrechamente, y puede mejorarse la precisión de la determinación de la forma de extracción de parámetros IPD.
De acuerdo con un segundo aspecto, se proporciona un aparato de extracción de parámetros de diferencia de fase entre canales, donde el aparato de extracción puede incluir:
un módulo de obtención, configurado para obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
un módulo de determinación, configurado para determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de la señal multicanal en función del parámetro que se obtiene por el módulo de obtención y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y un módulo de extracción, configurado para extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de la señal multicanal y que está determinada por el módulo de determinación.
De acuerdo con el aparato de extracción proporcionado en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros IPD de diferencia de fase entre canales, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede determinarse en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, y luego el parámetro IPD de la trama actual de la señal multicanal puede extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al segundo aspecto, en una primera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro característico de la señal de la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales ITD de la trama actual;
el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
Con referencia a la primera implementación posible del segundo aspecto, en una segunda implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
Con referencia a la primera implementación posible del segundo aspecto, en una tercera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho; y si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
Con referencia a la tercera implementación posible del segundo aspecto, en una cuarta implementación posible, el primer umbral es 0,75.
Con referencia a la primera implementación posible del segundo aspecto, en una quinta implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
Con referencia a la primera implementación posible del segundo aspecto, en una sexta implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
Con referencia a cualquiera de la segunda implementación posible del segundo aspecto a la sexta implementación posible del segundo aspecto, en una séptima implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0.
Con referencia a la séptima implementación posible del segundo aspecto, en una octava implementación posible, cuando el módulo de determinación determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, el módulo de extracción se configura específicamente para: extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de la señal multicanal en base a los parámetros IPD de subbanda extraídos.
Con referencia a cualquiera de la segunda implementación posible del segundo aspecto a la quinta implementación posible del segundo aspecto, en una novena implementación posible, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
Con referencia a la novena implementación posible del segundo aspecto, en una décima implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia de canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros iPd de conjuntos de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de obtención.
Con referencia a la novena implementación posible del segundo aspecto, en una undécima implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; y el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de obtención.
Con referencia a la décima implementación posible del segundo aspecto, en una duodécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama de la señal multicanal es extraer parámetros IPD de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la décima implementación posible del segundo aspecto, en una decimotercera implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el módulo de extracción se configura específicamente para:
calcular los parámetros iPd de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del segundo aspecto, en una decimocuarta implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual, el módulo de obtención se configura específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo y derecho de la trama actual en base a las señales en el dominio de la frecuencia de canal izquierdo y derecho.
Con referencia a la primera implementación posible del segundo aspecto, en una decimoquinta implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la varianza de IPD de subbanda de la trama actual, la obtención del módulo está configurada específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular un IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función del IPD de cada subbanda.
En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden usarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede usarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de la señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden usarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
De acuerdo con un tercer aspecto, se proporciona un terminal, que incluye una memoria y un procesador, donde la memoria está conectada al procesador;
la memoria se configura para almacenar un conjunto de código de programa; y
el procesador está configurado para llamar al código de programa almacenado en la memoria, para realizar las siguientes operaciones:
obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal.
De acuerdo con el terminal provisto en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros IPD de diferencia de fase entre canales, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede determinarse en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, y luego el parámetro IPD de la trama actual de la señal multicanal puede extraerse en base a la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al tercer aspecto, en una primera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro característico de la señal de la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de la trama actual, una varianza de IPD de subbanda de la trama actual, y una diferencia de tiempo entre canales ITD de la trama actual; el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
Con referencia a la primera implementación posible del tercer aspecto, en una segunda implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
Con referencia a la primera implementación posible del tercer aspecto, en una tercera implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el modo de extracción del parámetro IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
Con referencia a la primera implementación posible del tercer aspecto, en una cuarta implementación posible, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
Con referencia a cualquiera de la segunda implementación posible del tercer aspecto a la cuarta implementación posible del tercer aspecto, en una quinta implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal.
Con referencia a la quinta implementación posible del tercer aspecto, en una sexta implementación posible, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de la señal multicanal, el procesador se configura específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de la señal multicanal en base a los parámetros IPD de subbanda extraídos.
Con referencia a cualquiera de la segunda implementación posible del tercer aspecto a la cuarta implementación posible del tercer aspecto, en una séptima implementación posible, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
Con referencia a la séptima implementación posible del tercer aspecto, en una octava implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el procesador se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia de canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros iPd de conjuntos de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
Con referencia a la octava implementación posible del tercer aspecto, en una novena implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama de la señal multicanal es extraer parámetros IPD de subbanda; y
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del tercer aspecto, en una décima implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual, el procesador se configura específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo y derecho de la trama actual en base a las señales en el dominio de la frecuencia del canal izquierdo y derecho.
Con referencia a la primera implementación posible del tercer aspecto, en una undécima implementación posible, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la varianza de IPD de subbanda de la trama actual, el procesador se configura específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular un IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función del IPD de cada subbanda.
En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden usarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede usarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de la señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden usarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Breve descripción de los dibujos
Para describir las soluciones técnicas en las modalidades de la presente invención más claramente, a continuación, se describen brevemente los dibujos adjuntos necesarios para describir las modalidades. Aparentemente, los dibujos adjuntos en la siguiente descripción muestran meramente algunas modalidades de la presente invención, y un experto en la técnica aún puede obtener otros dibujos de estos dibujos adjuntos sin esfuerzos creativos.
La Figura 1 es un diagrama de principio esquemático de la codificación PS;
La Figura 2 es un diagrama de principio esquemático de decodificación PS;
La Figura 3 es un diagrama de flujo esquemático de un método de extracción de parámetros IPD de acuerdo con una modalidad de la presente invención;
La Figura 4 es otro diagrama de flujo esquemático de un método de extracción de parámetros IPD de acuerdo con una modalidad de la presente invención;
La Figura 5 es un diagrama esquemático de asignación de una cantidad total de bits usados para la codificación de señales multicanal;
La Figura 6a es un espectrograma de señal original de una señal multicanal;
La Figura 6b es un espectrograma de señal de audio obtenido decodificando un espectrograma de señal original; La Figura 6c es otro espectrograma de señal de audio obtenido decodificando un espectrograma de señal original;
La Figura 7 es un diagrama estructural esquemático de un aparato de extracción de parámetros IPD de acuerdo con una modalidad de la presente invención; y
La Figura 8 es un diagrama estructural esquemático de un terminal de acuerdo con una modalidad de la presente invención.
Descripción de las modalidades
Lo siguiente describe clara y completamente las soluciones técnicas en las modalidades de la presente invención con referencia a los dibujos adjuntos en las modalidades de la presente invención. Aparentemente, las modalidades descritas son simplemente algunas, pero no todas las modalidades de la presente invención. Todas las demás modalidades obtenidas por un experto en la técnica en función de las modalidades de la presente invención sin esfuerzos creativos se incluirán dentro del alcance de protección de la presente invención.
Con referencia a la Figura 1, la Figura 1 es un diagrama de principio esquemático de la codificación PS.
En la codificación PS, un codificador mezcla (mezcla), en una señal de audio mono, códigos de una señal estéreo introducida por una pluralidad de canales (por ejemplo, un canal x1 y un canal x2), extrae un parámetro de percepción espacial de la señal estéreo a través del análisis del parámetro de percepción espacial, luego codifica la señal de audio mono para obtener un flujo de bits de audio mono, y codifica el parámetro de percepción espacial para obtener un flujo de bits del parámetro de percepción espacial. Además, el codificador obtiene un flujo de bits en el que se codifica la señal estéreo multiplexando el flujo de bits de audio mono y el flujo de bits del parámetro de percepción espacial.
Con referencia a la Figura 2, la Figura 2 es un diagrama de principio esquemático de la decodificación PS.
Un decodificador demultiplexa un flujo de bits en el que se codifica una señal estéreo para obtener un flujo de bits de audio mono y un flujo de bits de parámetros de percepción espacial, luego realiza la decodificación de señal de audio mono en el flujo de bits de audio mono y realiza la decodificación de parámetros de percepción espacial en el flujo de bits de parámetros de percepción espacial. Además, el decodificador decodifica una señal de audio mono y luego sintetiza y reconstruye la señal estéreo usando un parámetro de percepción espacial.
Durante la implementación específica, los parámetros de percepción espacial en la codificación PS y la decodificación PS incluyen un IC, un ILD, un ITD, un IPD y similares. El IC describe una coherencia entre canales. Este parámetro decide la percepción de un rango de campo de sonido y puede mejorar la sensación de espacio de una señal de audio y la estabilidad acústica. El ILD se usa para identificar un ángulo horizontal de una fuente estéreo y describe una diferencia de intensidad entre canales. Este parámetro afecta a todos los componentes de frecuencia de un espectro. El ITD y el IPD son parámetros de percepción espacial que representan una orientación horizontal de una fuente de sonido. El ILD, el ITD y el IPD deciden cómo el oído humano percibe la ubicación de una fuente de sonido, lo que puede determinar efectivamente la ubicación de un campo de sonido y son importantes para la restauración de la señal estéreo. Por tanto, la determinación de parámetros tal como el IPD es importante para la restauración de la señal estéreo.
Con referencia a la Figura 3 a la Figura 8, a continuación, se describe en detalle un método y aparato de extracción de parámetros IPD proporcionados en las modalidades de la presente invención.
Con referencia a la Figura 3, la Figura 3 es un diagrama de flujo esquemático de un método de tracción de parámetros IPD de acuerdo con una modalidad de la presente invención. El método proporcionado en esta modalidad de la presente invención incluye las siguientes etapas.
S101. Obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal.
Durante la implementación específica, el método de extracción de parámetros IPD proporcionado en esta modalidad de la presente invención puede ser ejecutado por un codificador para la codificación de señales multicanal. Después de extraer un parámetro IPD de la trama actual de la señal multicanal de acuerdo con el método de extracción de parámetros IPD proporcionado en esta modalidad de la presente invención, el codificador puede cuantificar y codificar el parámetro IPD extraído. Después de obtener el parámetro IPD mediante decodificación, un decodificador puede usar el parámetro IPD obtenido mediante decodificación para realizar el procesamiento de síntesis estéreo. A continuación, se describe en detalle el método de extracción de parámetros iPd proporcionado en esta modalidad de la presente invención.
En algunas implementaciones factibles, al extraer el parámetro IPD de la trama actual de la señal multicanal, el codificador puede obtener primero el parámetro que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal, y luego puede determinar una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual. En otras palabras, el parámetro usado para determinar la forma de extracción de información para la trama actual se usa para determinar una forma de extraer información tal como el parámetro IPD de la trama actual de la señal multicanal. Durante la implementación específica, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual. Para ser específico, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal puede incluir el parámetro característico de la señal de la trama actual, o el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, o el parámetro característico de la señal de la trama actual y el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, o similares. El parámetro puede determinarse específicamente según los escenarios de aplicación reales, y no se limita en el presente documento. A es un número entero no menor que 1. Para ser específicos, las A tramas anteriores a la trama actual pueden ser, por ejemplo, una trama, dos tramas o tres A tramas anteriores a la trama actual. Esto no se limita en el presente documento.
Durante la implementación específica, el parámetro característico de la señal de la trama actual puede incluir uno o más parámetros tales como un valor de coherencia de canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y un ITD de la trama actual. El valor de coherencia de canal izquierdo-derecho de la trama actual, el parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho, y la varianza de IPD de subbanda de la trama actual pueden calcularse en función de las señales del dominio de frecuencia del canal izquierdo y derecho de la señal multicanal. El codificador puede determinar el parámetro ITD de la trama actual en base a una forma de extracción de parámetros ITD para la trama actual de la señal multicanal. La forma de extracción del parámetro ITD para la trama actual puede incluir una forma de extracción proporcionada en un protocolo estándar, o una forma de extracción existente conocida por un experto en la técnica. Esto no se limita en el presente documento.
El parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada uno de las A tramas anteriores a la trama actual y una clase de señal de cada uno de las A tramas anteriores a la trama actual. Para ser específico, el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual puede incluir la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, o la clase de señal de cada una de las A tramas anteriores a la trama actual, o la forma de extracción de parámetros IPD y la clase de señal de cada una de las A tramas anteriores a la trama actual, o similares. El parámetro de la característica de la señal puede determinarse específicamente según los escenarios de aplicación reales, y no se limita en el presente documento. La forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual puede incluir una forma de extracción de parámetros IPD que es para cada una de las A tramas anterior a la trama actual de la señal multicanal y que está determinada por el codificador en función de un parámetro usado para determinar una forma de extracción de información para cada una de las A tramas antes de la trama actual de la señal multicanal, o una forma de extracción de parámetros IPD proporcionada en el protocolo estándar, o una forma de extracción de parámetros IPD existente conocida por un persona experta en la técnica, o similar. Esto no se limita en el presente documento. La clase de señal puede incluir trama de voz o trama de música.
En algunas implementaciones factibles, el codificador puede realizar conversión de tiempo a frecuencia en señales en el dominio del tiempo de canal izquierdo-derecho de la trama actual de la señal multicanal, para obtener las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Específicamente, la conversión de tiempo a frecuencia puede implementarse a través de la transformación rápida de Fourier (Transformación Rápida de Fourier, fFt ) o la transformación de coseno discreto modificado (Transformación de Coseno Discreto Modificado, MDCT), o de otra forma. Esto no se limita en el presente documento. La conversión de tiempo a frecuencia puede realizarse por trama o puede realizarse por subtrama. Por ejemplo, el codificador puede convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal en las señales en el dominio de la frecuencia de canal izquierdo y derecho a través de FFT. Las fórmulas de transformación específicas pueden incluir: y
Figure imgf000014_0001
donde
n es un valor de índice de señal en el dominio del tiempo, k es un valor de índice de señal en el dominio de la frecuencia, Longitud es una longitud de trama, L es una longitud de conversión de tiempo a frecuencia para convertir una señal en el dominio del tiempo en una señal en el dominio de la frecuencia, x¿(n) y XR(n) son señales en el dominio del tiempo del canal izquierdo y derecho, respectivamente, y L(k) y R(k) son respectivamente késimo valor de frecuencia de una señal en el dominio de la frecuencia del canal izquierdo y una señal en el dominio de la frecuencia de canal derecho que se usa para calcular un parámetro IPD.
Un coeficiente de transformación de Fourier X(k) de una secuencia numérica real x(n) (incluyendo XL(n) o XR(n)) es un número complejo. Una parte real de X(k) tiene simetría par y una parte imaginaria de X(k) tiene simetría impar. En otras palabras, X(k) tiene la siguiente simetría conjugada: Tanto X(0) como X(N/2) son números reales, y las siguientes expresiones relacionales son verdaderas:
Xík ) = X* ÜV - k),y 1 < k < L/2 - 1,
Durante el cálculo de la transformación discreta de Fourier, debido a la simetría conjugada, puede que no sea necesario calcular o almacenar X(k), L/2 + 1<k<L-1, o partes imaginarias de X(0) y X(L/2), y solo es necesario calcular X(0) a X(L/2).
Después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en las señales en el dominio de la frecuencia de canal izquierdo-derecho, el codificador puede calcular el valor de coherencia de canal izquierdo-derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho. Específicamente, una expresión para el valor de coherencia del canal izquierdoderecho es la siguiente:
Figure imgf000015_0001
donde
L es la longitud de conversión de tiempo a frecuencia para convertir la señal en el dominio del tiempo en la señal en el dominio de la frecuencia, L(k) y R(k) son respectivamente los késimos valores de frecuencia de la señal del dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho que se usa para calcular el parámetro IPD, y R*(k) es un conjugado de R(k), es decir, R*(k) es un conjugado del késimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
En algunas implementaciones factibles, después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en las señales en el dominio de la frecuencia de canal izquierdo-derecho por trama o por subtrama, el codificador puede calcular, en base a las señales en el dominio de la frecuencia de canal izquierdo y derecho, el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho. Específicamente, las expresiones para el parámetro que representa la coherencia del canal izquierdo-derecho son las siguientes:
F f(b ) = E | =d |¿ 0 c) | 2
Fr O ) = E t-=0|flOO|2 ;
Dr(b) = EjUuMfc) ■ Rr(k) + L¿k) -R{ (fc)
Figure imgf000015_0002
■ Jff(fc)]
y
[g{(h)+ - f A- corr = HD = D
B¿. bJ £i-
Figure imgf000015_0003
donde
L(k) y R(k) son respectivamente los késimos valores de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho, L(k) y R(k) son partes reales respectivamente de los késimos valores de frecuencia de la señal en el dominio de la frecuencia de canal izquierdo y la señal en el dominio de la frecuencia de canal derecho, L(k) y R(k) son partes respectivamente imaginarias de los késimos valores de frecuencia de la señal en el dominio de la frecuencia de canal izquierdo y la señal en el dominio de la frecuencia de canal derecho, L es una cantidad de coeficientes espectrales de subbanda, y N es una cantidad de subbandas.
Alternativamente, una expresión para el parámetro que representa la coherencia del canal izquierdo-derecho es la siguiente:
^ |L(fc) fl( íc )|2
¿ ( | L 0 c ) | |*(fc )|> 2
donde
L es una cantidad de coeficientes espectrales de todas o algunas bandas de frecuencia.
Alternativamente, una expresión para el parámetro que representa la coherencia del canal izquierdo-derecho es la siguiente:
Figure imgf000016_0001
En algunas implementaciones factibles, después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en señales en el dominio de la frecuencia de canal izquierdo y derecho, el codificador puede calcular además la varianza de IPD de subbanda de la trama actual en base a las señales en el dominio de la frecuencia de canal izquierdo y derecho. Específicamente, las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual pueden dividirse primero en al menos dos subbandas (es decir, una pluralidad de subbandas). Se supone que hay subbandas Nsubbanda, donde Nsubbanda es un número entero mayor que 2. Además, puede calcularse un parámetro IPD de cada subbanda en base a una señal en el dominio de la frecuencia de cada subbanda obtenida mediante división, y la varianza de IPD de subbanda de la trama actual puede calcularse en función del parámetro IPD de cada subbanda. Para una bésima subbanda, donde b es un número entero mayor que o igual que 0 y menor que N, y la bésima subbanda incluye una frecuencia Ab-i < k < Ab - 1, un parámetro IPD de la bésima subbanda puede calcularse usando la siguiente expresión:
¿b i
IPD ib) - arg ^ L(fc)/T (ft), 0 < b < N subbcnác
k= A b l
donde
L(k) es el késimo valor de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo, y R*(k) es un conjugado del késimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
El codificador puede calcular el parámetro IPD de cada subbanda en base a la expresión anterior, y luego calcular la varianza de IPD de subbanda de la trama actual en función del parámetro IPD de cada subbanda. La varianza de IPD de subbanda puede calcularse usando la siguiente expresión:
var
Figure imgf000016_0002
donde
IPD{b} = arg
Figure imgf000016_0003
y
^subbmda ^
^ (IPD(b).
N,subbania E?=D
Una vez que el codificador obtiene el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, si el codificador necesita determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del valor de coherencia del canal izquierdo derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, el codificador puede determinar directamente la forma de extracción de parámetros IPD usando el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual.
Después de que el codificador determina el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, si el codificador necesita determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, el codificador puede determinar directamente la forma de extracción de parámetros IPD usando el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual.
5102. Determinar una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal.
Durante la implementación específica, en el método de extracción de parámetros IPD proporcionado en esta modalidad de la presente invención, el codificador puede seleccionar de forma adaptativa la forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama, es decir, seleccionar una de una pluralidad de formas de extracción de parámetros IPD preestablecidas como la forma de extracción de parámetros IPD para la trama actual de la señal multicanal. La pluralidad de formas de extracción de parámetros IPD preestablecidas puede incluir una primera forma de extracción y una segunda forma de extracción. La primera forma de extracción incluye extraer un IPD de grupo, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0. La segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas, extraer parámetros IPD de subbandas, o similares. En combinación con la etapa S103, a continuación, se describen implementaciones para determinar la forma de extracción de parámetros IPD para la trama actual de la extracción de señal multicanal y de parámetros IPD correspondientes a varias formas de extracción de parámetros IPD.
5103. Extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinado para la trama actual de la señal multicanal.
En algunas implementaciones factibles, el codificador puede determinar primero, en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. En caso afirmativo, según la forma de extracción correspondiente, el codificador extrae un IPD de grupo de la trama actual de la señal multicanal, o no extrae ningún parámetro IPD, o establece el parámetro IPD de la trama actual de la señal multicanal en 0. De lo contrario, el codificador puede determinar directamente que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas. En este caso, durante la aplicación real, puede haberse determinado que la segunda forma de extracción es una de las dos formas de extracción y, por lo tanto, cuál de las dos formas de extracción se usa específicamente se determina una vez que se determina el uso de la segunda forma de extracción. Alternativamente, el codificador puede determinar, además, en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer el conjunto de subbandas IPD parámetros o extraer parámetros IPD de subbanda.
En algunas implementaciones factibles, si el parámetro que obtiene el codificador y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, el valor de coherencia de canal izquierdo-derecho de la trama actual puede compararse con un primer umbral predefinido, y la varianza de IPD de subbanda de la trama actual puede compararse con un segundo umbral predefinido. Un rango de valores del primer umbral predefinido es [0,6, 0,95] y un rango de valores del segundo umbral predefinido es [0,05, 0,5]. Durante la implementación específica, un valor del primer umbral puede ser 0,89, 0,8, 0,75 o similar. 0,89 puede ser un valor máximo, 0,8 puede ser un valor intermedio y 0,75 puede ser un valor mínimo. El primer umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en el presente documento. Un valor del segundo umbral puede ser 0,45, 0,25, 0,3 o similar. 0,45 puede ser un valor máximo, 0,3 puede ser un valor intermedio y 0,25 puede ser un valor mínimo. El segundo umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en el presente documento. Si se descubre mediante la comparación que el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral y la varianza de IPD de subbanda de la trama actual es menor que el segundo umbral, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción.
Opcionalmente, en algunas implementaciones factibles, si el parámetro que se obtiene por el codificador y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal es el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho, un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho puede compararse con un primer umbral predefinido. Si el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, por ejemplo, puede establecerse el parámetro IPD de la trama actual de la señal multicanal en 0, o puede extraerse un IPD de grupo, o puede extraerse ningún parámetro IPD de la trama actual de la señal multicanal. Un rango de valores y un valor específico del primer umbral pueden ser los descritos anteriormente. Por ejemplo, el primer umbral puede ser 0,75.
Opcionalmente, en algunas implementaciones factibles, si el parámetro que se obtiene por el codificador y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal es el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, incluyendo la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual, puede determinarse si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual son una forma de extracción de parámetros IPD preestablecida, y si la clase de señal de cada uno de las A tramas anteriores a la trama actual es una clase de señal preestablecida. Si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es la primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
Por ejemplo, cuando A=1, las A tramas anteriores a la trama actual son una trama anterior a la trama actual. Si una forma de extracción de parámetros IPD para la trama anterior a la trama actual es la primera forma de extracción, y una clase de señal de la trama anterior a la trama actual es una trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción.
Cuando A=2, las A tramas anteriores a la trama actual son dos A tramas anteriores a la trama actual. Si una forma de extracción de parámetros IPD para cada una de las dos A tramas anteriores a la trama actual es la primera forma de extracción, y una clase de señal de cada una de las dos A tramas anteriores a la trama actual es la trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción.
En algunas implementaciones factibles, si el parámetro que obtiene el codificador y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual, puede compararse un valor absoluto del parámetro ITD de la trama actual con un tercer umbral predefinido, y puede compararse la varianza de IPD de subbanda de la trama actual con un cuarto umbral predefinido. Puede determinarse además si la clase de señal de cada una de las A tramas anteriores a la trama actual es una clase de señal objetivo. Un valor del tercer umbral predefinido es [0, 4] y un rango de valores del cuarto umbral predefinido es [0,05, 0,4]. Un valor del tercer umbral puede ser 4, 2, 0 o similar. 4 puede ser un valor máximo, 2 puede ser un valor intermedio y 0 puede ser un valor mínimo. El tercer umbral puede determinarse específicamente en función de los escenarios de aplicación reales, y no se limita en el presente documento. Un valor del cuarto umbral puede ser 0,4, 0,35, 0,25 o similar. 0,4 puede ser un valor máximo, 0,35 puede ser un valor intermedio y 0,25 puede ser un valor mínimo. El cuarto umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en el presente documento. La clase de señal de destino es la trama de voz. Si se aprende mediante comparación que el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral y la clase de señal de cada una de las A tramas antes de la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción.
Las A tramas anteriores a la trama actual pueden incluir una trama anterior a la trama actual, dos A tramas anteriores a la trama actual, tres A tramas anteriores a la trama actual, o similares. Esto no se limita en el presente documento. Si las A tramas anteriores a la trama actual son una trama anterior a la trama actual, cuando un valor absoluto de un parámetro ITD de la trama anterior a la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral, y una clase de señal de la trama anterior a la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo. Si las A tramas anteriores a la trama actual son una pluralidad de A tramas anteriores a la trama actual, cuando el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral, y una clase de señal de cada una de la pluralidad de A tramas anteriores a la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, después de determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, el codificador codifica un bit de marca de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal y luego cuantifica el parámetro IPD de la trama actual de la señal multicanal en función de diferentes formas de extracción de diferentes formas.
En algunas implementaciones factibles, después de determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción, el codificador puede extraer el parámetro IPD de la trama actual de la señal multicanal en base a la primera forma de extracción. Específicamente, si la primera forma de extracción es no extraer ningún parámetro IPD de la trama actual de la señal multicanal, no se realiza ninguna operación y finaliza un proceso correspondiente a la extracción del parámetro IPD de la trama actual. Si la primera forma de extracción es establecer el parámetro IPD de la trama actual de la señal multicanal en 0, un valor del parámetro IPD extraído de la trama actual de la señal multicanal se establece en 0. Si la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de la señal multicanal, la IPD de grupo de la trama actual de la señal multicanal puede extraerse en base a la forma de extraer un parámetro IPD de grupo. El IPD de grupo extraído de la trama actual de la señal multicanal se usa como el parámetro IPD de la trama actual de la señal multicanal. Específicamente, el codificador puede extraer parámetros IPD de al menos algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Las al menos algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual pueden incluir específicamente todas o algunas de las subbandas Nsubbanda obtenidas dividiendo las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Esto no se limita en el presente documento. Durante la implementación específica, un usuario puede determinar, en función de un requisito de codificación en la codificación de señales multicanal, por ejemplo, una tasa de codificación o calidad de codificación, rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual que se usan para extraer el IPD de grupo de la trama actual de la señal multicanal de la señal multicanal, incluidas las señales en el dominio de la frecuencia en todos los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, es decir, señales en el dominio de la frecuencia de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual; o rangos en el dominio de la frecuencia específicos de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, es decir, algunas tramas de señales en el dominio de la frecuencia en las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Las algunas tramas de las señales en el dominio de la frecuencia en las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual se incluyen en las señales en el dominio de la frecuencia de algunas subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho.
En algunas implementaciones factibles, si el codificador determina que los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de los canales izquierdo y derecho de la trama actual que se usan para extraer un IPD de grupo de las señales en el dominio de la frecuencia de los canales izquierdo-derecho de la trama actual son los rangos en el dominio de la frecuencia completos de las señales en el dominio de la frecuencia de los canales izquierdo y derecho de la trama actual, pueden extraerse los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de los canales izquierdo-derecho de la trama actual (es decir, las subbandas Nsubbanda de la trama actual), puede calcularse un promedio de todos los parámetros IPD extraídos de las subbandas, y luego puede usarse el promedio obtenido de todos los parámetros IPD extraídos de las subbandas como el IPD de grupo de la trama actual de señal multicanal. El grupo IPD de la trama actual de la señal multicanal se extrae según la siguiente fórmula:
Figure imgf000019_0001
donde
G_IPD es el IPD de grupo de la trama actual de la señal multicanal, e IPD(b) es un parámetro IPD de una bésima subbanda.
Es factible, en algunas implementaciones factibles, si el codificador determina que los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual que se usan para extraer un IPD de grupo de las señales del dominio de la frecuencia de los canales izquierdo y derecho de la trama actual son rangos específicos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de los canales izquierdo y derecho de la trama actual, por ejemplo, [k1, k2], es decir, las señales en el dominio de la frecuencia entre una frecuencia k1ra y una frecuencia k2da, los parámetros IPD de algunas subbandas (es decir, subbandas a las que las señales en el dominio de la frecuencia entre la frecuencia k1ra y la frecuencia K2da pertenecen) de las señales en el dominio de la frecuencia izquierdo y derecho de los canales de la trama actual puede extraerse, puede calcularse un promedio de todos los parámetros IPD extraídos de las subbandas, y luego puede usarse el promedio obtenido de todos los parámetros IPD de las subbandas como el IPD de grupo de la trama actual de la señal multicanal.
Durante la implementación específica, los parámetros IPD de las subbandas a las que las señales en el dominio de la frecuencia entre la frecuencia k1ra y la frecuencia k2da pertenecen, pueden ser predefinidos como parámetros IPD de todas las frecuencias. En este caso, el cálculo de los parámetros IPD de las subbandas puede reemplazarse con el cálculo de los parámetros IPD de todas las frecuencias, y se calcula un parámetro IPD de cada frecuencia como un parámetro IPD de cada subbanda, para calcular el IPD del grupo de la trama actual de la señal multicanal. Los parámetros IPD de todas las frecuencias en el rango en el dominio de la frecuencia preestablecido [k1, k2] se calculan uno por uno de la siguiente forma:
IPDik ) = ¿.tik)R*ík), kL < k < k 2
donde
L(k) es el késimo valor de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo, y R*(k) es el conjugado del késimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
Además, el procesamiento estadístico se realiza en IPD (k) en un rango preestablecido (una pluralidad de tramas, incluida la trama actual y las A tramas previos a la trama actual, de señales en una señal en el dominio de la frecuencia multicanal), para obtener el parámetro IPD de grupo.
Por ejemplo, si el rango en el dominio de la frecuencia específico [k1, k2] es un rango de selección de cada una de las seis tramas de señales en el dominio de la frecuencia de canal izquierdo y derecho, un promedio de los parámetros IPD de (k2-k1 1) frecuencias en puede calcularse cada una de las seis tramas de señales en el dominio de la frecuencia de canal izquierdo y derecho. Una fórmula de cálculo es la siguiente:
Figure imgf000020_0001
Además, puede calcularse y usar un promedio de parámetros IPD de seis tramas consecutivas, incluida la trama actual, como IPD de grupo de la trama actual de la señal multicanal:
i# — X '1 uiffi]
m :po ~ ^ , m ip d ‘
J r = - 5
donde
es un promedio de los parámetros IPD de una trama anterior adyacente a la trama actual,
Figure imgf000020_0002
es un promedio de los parámetros IPD de dos A tramas anteriores a la trama actual, y así sucesivamente.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, puede determinarse directamente que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de conjuntos de subbandas o extrayendo parámetros IPD de subbandas.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede determinar además la forma de extracción de parámetros IPD para la trama actual de la señal multicanal. Específicamente, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en al menos dos conjuntos de subbandas (es decir, una pluralidad de conjuntos de subbandas). Cada conjunto de subbandas incluye una o más subbandas. Además, el codificador puede obtener una varianza de IPD de subbanda de cada conjunto de subbandas. Si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer los parámetros iPd de conjuntos de subbandas. Entonces, el codificador puede calcular un parámetro IPD de cada conjunto de subbandas y usar el parámetro IPD obtenido de cada conjunto de subbandas como el parámetro IPD de la trama actual de la señal multicanal.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede determinar además la forma de extracción de parámetros IPD para la trama actual de la señal multicanal. Específicamente, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en al menos dos conjuntos de subbandas (es decir, una pluralidad de conjuntos de subbandas). Cada conjunto de subbandas incluye una o más subbandas. Además, el codificador puede obtener una varianza de IPD de subbanda de cada conjunto de subbandas. Si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer los parámetros iPd de conjuntos de subbandas. Entonces, el codificador puede calcular un parámetro IPD de cada conjunto de subbandas y usar el parámetro IPD obtenido de cada conjunto de subbandas como el parámetro IPD de la trama actual de la señal multicanal.
Por ejemplo, haciendo referencia a la Figura 4, la Figura 4 es otro diagrama de flujo esquemático de un método de extracción de parámetros IPD de acuerdo con una modalidad de la presente invención. El método incluye las siguientes etapas.
5201. Calcular un valor de coherencia de canal izquierdo-derecho de una trama actual y una varianza de IPD de subbanda de la trama actual.
En algunas implementaciones, la etapa S201 puede determinar un valor de un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual. 5202. Determinar si una forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción; y si un resultado determinante es sí, realizar la etapa S203; o de lo contrario, realizar la etapa S205.
Un codificador puede determinar, en función del valor de coherencia del canal izquierdo y derecho entre las señales en el dominio de la frecuencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. Para un método de determinación específico, consultar la modalidad anterior, y los detalles no se describen en el presente documento nuevamente.
Alternativamente, el codificador puede determinar, en función del valor del parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción. Para un método de determinación específico, consultar la modalidad anterior, y los detalles no se describen en el presente documento nuevamente.
5203. Extraer un IPD de grupo de la trama actual de la señal multicanal.
5204. Cuantificar y codificar el IPD del grupo.
Si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, el codificador puede extraer el IPD de grupo de la trama actual de la señal multicanal. Para una forma de extracción específica, consultar la modalidad anterior, y los detalles no se describen en el presente documento nuevamente. Después de extraer el IPD de grupo de la trama actual de la señal multicanal, el codificador puede realizar operaciones tales como cuantificación y codificación en el IPD de grupo. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en el presente documento.
5205. Calcular una varianza de IPD de subbanda de las subbandas P1 y una varianza de IPD de subbanda de las subbandas P2.
5206. Determinar si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer dos parámetros IPD; y si un resultado determinante es sí, realizar la etapa S207; o de lo contrario, realizar la etapa S209.
Si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no extrae un IPD de grupo, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en dos conjuntos de subbandas que incluyen un conjunto de subbandas 1 (el conjunto de subbandas 1 incluye subbandas P1) y un conjunto de subbandas 2 (el conjunto de subbandas 2 incluye subbandas P2), y luego puede calcularse una varianza de IPD de subbanda (se denomina primera varianza) del conjunto de subbandas 1 (es decir, las subbandas P1) y una varianza de IPD de subbanda (se denomina segunda varianza) del conjunto de subbandas 2 (es decir, las subbandas P2). Una suma de P1 y P2 es igual a Nsubbanda. Cuando el valor de coherencia del canal izquierdo y derecho entre las señales en el dominio de la frecuencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y tanto la primera varianza como la segunda varianza son menores que un segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer dos parámetros IPD, es decir, extraer parámetros IPD de dos conjuntos de subbandas. Alternativamente, cuando el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo y derecho entre las señales del dominio de frecuencia del canal izquierdo-derecho es mayor que un primer umbral, y tanto la primera varianza como la segunda varianza son menores que un segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer dos parámetros IPD, es decir, extraer parámetros IPD de dos conjuntos de subbandas.
La primera varianza se calcula de la siguiente forma:
Figure imgf000022_0001
donde
Figure imgf000022_0002
La segunda varianza se calcula de la siguiente forma:
var;
Figure imgf000022_0003
avr, ) 2
donde
®Fuhbandx~L
1
QLTn
R I IPDÍb).
- - :
5207. Calcular un primer parámetro IPD y un segundo parámetro IPD.
5208. Cuantificar y codificar el primer parámetro IPD y el segundo parámetro IPD.
Además, después de determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer dos parámetros IPD, el codificador puede calcular por separado el primer parámetro IPD correspondiente al conjunto de subbandas 1 y el segundo parámetro IPD correspondiente al conjunto de subbandas 2. Un método para calcular el primer parámetro IPD y un método para calcular el segundo parámetro IPD puede ser el mismo que el método anterior para calcular el IPD de grupo. Para obtener más detalles, consultar la modalidad anterior, y los detalles no se describen en el presente documento nuevamente. Después de calcular el primer parámetro IPD y el segundo parámetro IPD, el codificador puede cuantificar y codificar el primer parámetro IPD y el segundo parámetro IPD. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en el presente documento.
5209. Calcular una varianza de IPD de subbanda de las subbandas P3 y una varianza de IPD de subbanda de las subbandas P4.
5210. Determinar si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer tres parámetros IPD; y si un resultado determinante es sí, realizar la etapa S211; o de lo contrario, realizar la etapa S213.
Además, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no extrae dos parámetros IPD, el conjunto de subbandas 1 puede dividirse para obtener conjuntos de subbandas más finos (por ejemplo, un conjunto de subbandas 3 y un conjunto de subbandas 4, donde el conjunto de subbandas 3 incluye subbandas P3, el conjunto de subbandas 4 incluye subbandas P4, y P3+P4=P1). A continuación, pueden calcularse las varianzas de IPD de subbanda de todos los conjuntos de subbandas (el conjunto de subbandas 2, el conjunto de subbandas 3 y el conjunto de subbandas 4). Las varianzas de IPD de subbanda incluyen una segunda varianza, una tercera varianza y una cuarta varianza. Para conocer las formas de calcular la tercera varianza (es decir, una varianza de IPD de subbanda de las subbandas P3) y la cuarta varianza (es decir, una varianza de IPD de subbanda de las subbandas P4), consultar las formas anteriores para calcular la primera varianza y la segunda varianza, y los detalles no se describen en el presente documento nuevamente. Cuando el valor de coherencia del canal izquierdoderecho de la trama actual es mayor que el primer umbral, y la segunda varianza, la tercera varianza y la cuarta varianza son todas menores que el segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer tres parámetros IPD.
5211. Calcular un segundo parámetro IPD, un tercer parámetro IPD y un cuarto parámetro IPD.
5212. Cuantificar y codificar el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD.
Después de determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer tres parámetros IPD, el codificador puede extraer por separado el segundo parámetro IPD correspondiente al conjunto de subbandas 2, el tercer parámetro IPD correspondiente al conjunto de subbandas 3, y el cuarto parámetro IPD correspondiente al conjunto de subbandas 4, y luego puede cuantificar y codificar el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en el presente documento. Los métodos para calcular el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD pueden ser los mismos que el método anterior para calcular el IPD de grupo. Para obtener más detalles, consultar la modalidad anterior, y los detalles no se describen en el presente documento nuevamente. La tercera varianza se calcula de la siguiente forma:
Figure imgf000023_0001
donde
Figure imgf000023_0002
La cuarta varianza se calcula con el siguiente método:
Figure imgf000023_0003
donde
Figure imgf000023_0004
donde
1<P3, P4<P1yP3+P4=P1.
5213. Calcular los K parámetros IPD.
5214. Cuantificar y codificar los K parámetros IPD.
Cabe señalar que esta modalidad de la presente invención no se limita a la extracción del primer parámetro IPD, el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD. Cuando cualquiera de la tercera varianza, la cuarta varianza y la segunda varianza no cumple una condición, puede reducirse aún más un rango de cálculo para calcular K parámetros IPD y cuantificar y codificar los K parámetros IPD. Finalmente se implementan los M métodos de extracción de IPD. Tanto K como M son números enteros mayores o iguales que 4 y menores o iguales que Nsubbanda.
Opcionalmente, en algunas implementaciones opcionales, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede obtener varianzas de IPD de subbanda de todos los conjuntos de subbandas, y si una o más de las varianzas de IPD de subbanda obtenidas de todos los conjuntos de subbandas son mayores que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una forma de extracción de parámetros IPD de conjunto de subbandas. Luego, el codificador puede calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en base a las señales en el dominio de la frecuencia de canal izquierdo-derecho de la trama actual, y usar los parámetros IPD extraídos de las subbandas como el parámetro IPD de la trama actual de la señal multicanal. En otras palabras, después de determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede calcular los parámetros IPD de todas las subbandas Nsubbanda de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual, y luego determinar los parámetros IPD de las subbandas Nsubbanda como el parámetro IPD de la trama actual de la señal multicanal. Para conocer una forma de calcular los parámetros IPD de todas las subbandas, consultar la implementación anterior, y los detalles no se describen en el presente documento nuevamente.
Opcionalmente, en algunas implementaciones opcionales, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede obtener varianzas de IPD de subbanda de todos los conjuntos de subbandas, y si una o más de las varianzas IPD de subbanda obtenidas de todos los conjuntos de subbandas son mayores que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo es menor o igual que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de conjuntos de subbandas. Luego, el codificador puede calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en base a las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y usar los parámetros IPD extraídos de todas las subbandas como el parámetro IPD de la trama actual de la señal multicanal. En otras palabras, después de determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el codificador puede calcular los parámetros IPD de todas las subbandas Nsubbanda de las señales en el dominio de la frecuencia de canal izquierdo-derecho de la trama actual, y luego determinar los parámetros IPD de las subbandas Nsubbanda como el parámetro IPD de la trama actual de la señal multicanal. Para conocer una forma de calcular los parámetros IPD de todas las subbandas, consultar la implementación anterior, y los detalles no se describen en el presente documento nuevamente.
Con referencia a la Figura 5, la Figura 5 es un diagrama esquemático de asignación de una cantidad total de bits usados para la codificación de señales multicanal. En esta modalidad de la presente invención, en un escenario de aplicación en el que la cantidad total de bits usados para la codificación de señales multicanal no cambia (es decir, N1+M1=N2+M2), cuando se usa la forma de extracción de parámetros IPD de grupo, puede reducirse una cantidad de bits ocupados por la codificación de parámetros IPD y pueden usarse más bits para codificar otros parámetros, reduciendo así la tasa de codificación mientras se mantiene la calidad de codificación; cuando se usa la forma de extraer parámetros IPD de subbanda (incluida la extracción de parámetros IPD de conjuntos de subbandas y la extracción de parámetros IPD de subbanda), la cantidad de bits ocupados por la codificación de parámetros IPD es mayor que cuando se usa la forma de extraer un parámetro IPD de grupo, y puede seleccionarse de forma adaptativa una forma de extracción de parámetros IPD para mejorar la calidad de la codificación mientras se mantiene una tasa de codificación. N1 es una cantidad de bits usados para codificar un parámetro IPD de subbanda, M1 es una cantidad de bits de la trama actual que se usan para codificar parámetros distintos del parámetro IPD de subbanda, N2 es una cantidad de bits usados para codificar un parámetro de grupo IPD, M2 es una cantidad de bits de la trama actual que se usan para la codificación de parámetros distintos del parámetro de grupo IPD, y N1, N2, M1 y M2 son números enteros positivos.
La Figura 6a a la Figura 6c muestran espectrogramas para comparar los efectos del método de extracción de parámetros IPD (conmutación adaptativa entre la forma de extraer un parámetro IPD de grupo y la forma de extraer los parámetros IPD de subbanda, donde una forma de extracción de parámetros IPD se determina adaptativamente en función de un parámetro usado para determinar una forma de extracción de información para una trama actual) proporcionada en esta modalidad de la presente invención y una tecnología existente (extracción de parámetros IPD de subbandas Nsubbanda) bajo la premisa de que la cantidad total de bits para codificación no cambia. La Figura 6a es un espectrograma de señal original de una señal multicanal, donde la señal original es una señal armónica. La Figura 6b es un espectrograma de señal de audio obtenido por decodificación, mediante un decodificador de acuerdo con un algoritmo de decodificación correspondiente, un parámetro IPD que se extrae usando una tecnología existente y que está codificado. Como se muestra en la Figura 6b, un componente armónico de una parte de alta frecuencia (una parte circular) de la señal original no se restaura en una señal de audio obtenida por el decodificador al decodificar la señal original y, por lo tanto, la señal de audio provoca una sensación de ruido relativamente fuerte en audición, causando molestias al oído humano. La Figura 6c es un espectrograma de señal de audio obtenido decodificando, mediante un decodificador en función de un algoritmo de decodificación correspondiente, un parámetro IPD que se extrae en el método proporcionado en esta modalidad de la presente invención y que está codificado. Como se muestra en la Figura 6c, un componente armónico de una parte de alta frecuencia de la señal original se restaura bien en una señal de audio obtenida por el decodificador al decodificar la señal original y, por lo tanto, la señal de audio no produce ninguna sensación de ruido en la audición. Puede aprenderse de un resultado de comparación que, en el método proporcionado en esta modalidad de la presente invención, la calidad auditiva de una señal de salida final puede mejorarse manteniendo una fase de señal estéreo.
En esta modalidad de la presente invención, el codificador puede preestablecer una pluralidad de formas de extracción de parámetros IPD, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, el codificador puede determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y luego el codificador puede extraer el parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada. En esta modalidad de la presente invención, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta modalidad de la presente invención, partiendo de la premisa de que la cantidad total de bits usados para la codificación de señales multicanal no cambia, mediante la selección adaptativa entre las formas de extracción de parámetros IPD, cuando se usa la forma de extracción de parámetros IPD de grupo, una cantidad de los bits ocupados por la codificación de parámetros IPD pueden reducirse y pueden usarse más bits para codificar otros parámetros, reduciendo así la tasa de codificación mientras se mantiene la calidad de la codificación; cuando se usa la forma de extraer los parámetros IPD de subbanda (incluida la extracción de los parámetros IPD de conjuntos de subbandas y la extracción de los parámetros IPD de subbanda uno por uno), la cantidad de bits ocupados por la codificación de parámetros IPD es mayor que cuando se usa la forma de extracción de parámetros IPD de grupo y puede seleccionarse de forma adaptativa una forma de extracción de parámetros IPD para mejorar la calidad de codificación mientras se mantiene una tasa de codificación.
Con referencia a la Figura 7, la Figura 7 es un diagrama estructural esquemático de una modalidad de un aparato de extracción de parámetros IPD de acuerdo con las modalidades de la presente invención. El aparato de extracción proporcionado en esta modalidad de la presente invención incluye:
un módulo de obtención 10, configurado para obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
un módulo de determinación 20, configurado para determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de la señal multicanal en función del parámetro que se obtiene mediante el módulo de obtención y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal, donde
la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
un módulo de extracción 30, configurado para extraer un parámetro iPd de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de la señal multicanal y que está determinada por el módulo de determinación.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro característico de la señal de la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales ITD de la trama actual;
el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo; y si el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, el módulo de determinación se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción. Un valor del primer umbral puede ser el descrito anteriormente, y los detalles no se describen en el presente documento nuevamente.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0. En algunas implementaciones factibles, cuando el módulo de determinación determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, el módulo de extracción se configura específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de la señal multicanal en base a los parámetros IPD de subbanda extraídos.
En algunas implementaciones factibles, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el módulo de determinación se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia de canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de conjuntos de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de determinación.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros iPd de conjuntos de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de determinación.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama de la señal multicanal es extraer parámetros IPD de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
Durante la implementación específica, el aparato de extracción de parámetros IPD puede ser específicamente el codificador descrito en las modalidades de la presente invención. El aparato de extracción puede realizar, usando los módulos incorporados en el aparato de extracción, implementaciones descritas en las etapas de la forma de extracción de parámetros IPD. Los detalles no se describen en el presente documento nuevamente.
En esta modalidad de la presente invención, el codificador puede preestablecer una pluralidad de formas de extracción de parámetros iPd , de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, el codificador puede determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y luego el codificador puede extraer el parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada. En esta modalidad de la presente invención, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta modalidad de la presente invención, con la premisa de que la cantidad total de bits usados para la codificación de señales multicanal no cambia, mediante la selección adaptativa entre las formas de extracción de parámetros IPD, cuando se usa la forma de extracción de parámetros IPD de grupo, una cantidad de los bits ocupados por la codificación de parámetros IPD pueden reducirse y pueden usarse más bits para codificar otros parámetros, reduciendo así la tasa de codificación mientras se mantiene la calidad de la codificación; cuando se extraen los parámetros IPD de subbanda (incluida la forma de extracción de parámetros IPD de conjuntos de subbandas y la extracción de parámetros IPD de subbanda), una cantidad de bits ocupados por la codificación de parámetros IPD es mayor que cuando se usa la forma de extracción de parámetros iPd de grupo y una forma de extracción de parámetro iPd puede seleccionarse adaptativamente para mejorar la calidad de la codificación mientras se mantiene una tasa de codificación.
Con referencia a la Figura 8, la Figura 8 es un diagrama estructural esquemático de un terminal de acuerdo con una modalidad de la presente invención. El terminal proporcionado en esta modalidad de la presente invención incluye una memoria 1000 y un procesador 2000. La memoria 1000 está conectada al procesador 2000.
La memoria 1000 se configura para almacenar un conjunto de código de programa.
El procesador 2000 está configurado para llamar al código de programa almacenado en la memoria 1000, para realizar las siguientes operaciones:
obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro característico de la señal de la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, y un ITD de diferencia de tiempo entre canales de la trama actual;
el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia de canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual; y
si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal.
En algunas implementaciones factibles, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de la señal multicanal, el procesador 2000 se configura específicamente para: extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de la señal multicanal en base a los parámetros IPD de subbanda extraídos.
En algunas implementaciones factibles, si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el procesador 2000 se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el procesador 2000 se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia de canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de conjuntos de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el procesador 2000 se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros iPd de conjuntos de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador 2000 se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama de la señal multicanal es extraer parámetros IPD de subbanda; y
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador 2000 se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer parámetros IPD de subbanda; y
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye el valor de coherencia de canal izquierdo-derecho de la trama actual, el procesador 2000 se configura específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo y derecho de la trama actual en base a las señales en el dominio de la frecuencia del canal izquierdo y derecho.
En algunas implementaciones factibles, cuando el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal incluye la varianza de IPD de subbanda de la trama actual, el procesador 2000 se configura específicamente para:
obtener las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de la señal multicanal y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular un IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función del IPD de cada subbanda.
En esta solicitud, pueden preestablecerse una pluralidad de formas de extracción de parámetros IPD, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de la señal multicanal, la forma de extracción de parámetros IPD para la trama actual de la señal multicanal puede determinarse en función del parámetro obtenido usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y luego el parámetro IPD de la trama actual de la señal multicanal puede extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de la señal multicanal se correlaciona con el parámetro usado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden usarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede usarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de la señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden usarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Un experto en la técnica puede comprender que todos o algunos de los procesos de los métodos en las modalidades pueden implementarse mediante un programa informático que instruya al hardware relevante. El programa puede almacenarse en un medio de almacenamiento legible por ordenador. Cuando se ejecuta el programa, pueden realizarse los procesos de los métodos en las modalidades. El medio de almacenamiento puede incluir: un disco magnético, un disco óptico, una memoria de solo lectura (Read-Only Memory, ROM), una memoria de acceso aleatorio (Random Access Memory, RAM), o similares.
En la memoria descriptiva, las reivindicaciones y los dibujos adjuntos de la presente invención, los términos "primero", "segundo", "tercero", "cuarto" y similares están destinados a distinguir entre diferentes objetos, pero no indican un orden específico. Además, los términos "contener", "incluir" o cualquier otra variante de los mismos están destinados a cubrir una inclusión no exclusiva. Por ejemplo, un proceso, un método, un sistema, un producto o un dispositivo que incluye una serie de etapas o unidades no se limitan a las etapas o unidades enumeradas, sino que opcionalmente incluye además una etapa o unidad no enumerada, u opcionalmente incluye además otra etapa o unidad inherente del proceso, el método, el producto o el dispositivo.
Lo que se divulga anteriormente son meramente ejemplos de modalidades de la presente invención, y ciertamente no se pretende limitar el alcance de protección de la presente invención. Por tanto, las varianzas que caen dentro del alcance de las reivindicaciones de la presente invención estarán dentro del alcance de la presente invención.

Claims (1)

  1. REIVINDICACIONES
    Un método de extracción de parámetros de diferencia de fase entre canales, que comprende:
    obtener (S101) un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
    determinar (S102) una forma de extracción de parámetros de diferencia de fase entre canales, IPD, para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal, en donde la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
    extraer (S103) un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal;
    en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, en donde A es un número entero no menor que 1;
    el parámetro característico de la señal de la trama actual comprende al menos uno de un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales, ITD, de la trama actual;
    el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual comprende al menos uno de un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
    la clase de señal comprende trama de voz o trama de música;
    caracterizado porque el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho; y
    si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdoderecho es mayor que un primer umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
    El método de acuerdo con la reivindicación 1, en donde el primer umbral es de 0,75.
    El método de acuerdo con la reivindicación 1, en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
    si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
    El método de acuerdo con la reivindicación 1, en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende el ITD de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
    si un valor de la ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
    El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en donde la primera forma de extracción comprende extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0.
    6. El método de acuerdo con la reivindicación 5, en donde cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de la señal multicanal, la extracción de un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros iPd determinada para la trama actual de la señal multicanal comprende:
    extraer parámetros IPD de subbanda de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
    7. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en donde si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, la determinación de una forma de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende, además:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, en donde
    la segunda forma de extracción comprende extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
    8. El método de acuerdo con la reivindicación 7, en donde la segunda forma de extracción es extraer parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción comprende:
    calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
    9. El método de acuerdo con la reivindicación 7, en donde la segunda forma de extracción es extraer parámetros IPD de conjuntos de subbandas, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción comprende:
    clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, en donde cada conjunto de subbandas comprende al menos una subbanda, y al menos un conjunto de subbandas comprende al menos dos subbandas; y
    calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
    10. Un aparato de extracción de parámetros de diferencia de fase entre canales, que comprende:
    un módulo de obtención (10), configurado para obtener un parámetro usado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
    un módulo de determinación (20), configurado para determinar una forma de extracción de parámetros de diferencia de fase entre canales, IPD, para la trama actual de la señal multicanal en función del parámetro que se obtiene por el módulo de obtención (10) y que se usa para determinar la forma de extracción de información para la trama actual de la señal multicanal, en donde la forma de extracción de parámetros IPD determinada para la trama actual de la señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
    un módulo de extracción (30), configurado para extraer un parámetro IPD de la trama actual de la señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de la señal multicanal y que está determinada por el módulo de determinación (20);
    en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende al menos uno de un parámetro característico de la señal de la trama actual y un parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual, en donde A es un número entero no menor que 1;
    el parámetro característico de la señal de la trama actual comprende al menos uno de un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales, ITD, de la trama actual;
    el parámetro característico de la señal de cada una de las A tramas anteriores a la trama actual comprende al menos uno de un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, un ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
    la clase de señal comprende trama de voz o trama de música;
    caracterizado porque el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho; y
    si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdoderecho es mayor que un primer umbral, el módulo de determinación (20) se configura específicamente para:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
    11. El aparato de extracción de acuerdo con la reivindicación 10, en donde el primer umbral es 0,75.
    12. El aparato de extracción de acuerdo con la reivindicación 11, en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
    si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de música, el módulo de determinación (20) se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es la primera forma de extracción.
    13. El aparato de extracción de acuerdo con la reivindicación 11, en donde el parámetro usado para determinar la forma de extracción de información para la trama actual de la señal multicanal comprende el ITD de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
    si un valor del ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el módulo de determinación (20) se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una primera forma de extracción.
    14. El aparato de extracción de acuerdo con cualquiera de las reivindicaciones 10 a 13, en donde la primera forma de extracción comprende extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de la señal multicanal, o no extraer ningún parámetro IPD de la trama actual de la señal multicanal, o establecer el parámetro IPD de la trama actual de la señal multicanal en 0.
    15. El aparato de extracción de acuerdo con la reivindicación 14, en donde cuando el módulo de determinación (20) determina que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es extraer un IPD de grupo, el módulo de extracción (30) se configura específicamente para:
    extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar un IPD de grupo de la trama actual de la señal multicanal en base a los parámetros IPD de subbanda extraídos.
    16. El aparato de extracción de acuerdo con cualquiera de las reivindicaciones 10 a 13, en donde si la forma de extracción de parámetros IPD para la trama actual de la señal multicanal no es la primera forma de extracción, el módulo de determinación (20) se configura específicamente para:
    determinar que la forma de extracción de parámetros IPD para la trama actual de la señal multicanal es una segunda forma de extracción, en donde la segunda forma de extracción comprende extraer parámetros IPD de conjuntos de subbandas o extraer parámetros IPD de subbandas.
    17. El aparato de extracción de acuerdo con la reivindicación 16, en donde la segunda forma de extracción es extraer los parámetros IPD de conjuntos de subbandas, y el módulo de determinación (20) se configura específicamente para:
    clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de la señal multicanal en al menos dos conjuntos de subbandas, en donde cada conjunto de subbandas comprende al menos una subbanda, y al menos un conjunto de subbandas comprende al menos dos subbandas; y
    el módulo de extracción (30) se configura específicamente para:
    calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de determinación (20).
    18. El aparato de extracción de acuerdo con la reivindicación 16, en donde la segunda forma de extracción es extraer parámetros IPD de subbanda; y
    el módulo de extracción (30) se configura específicamente para:
    calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual
ES17805739T 2016-05-31 2017-05-25 Método y dispositivo para extraer parámetro de diferencia de fase entre canales Active ES2836682T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610377800.4A CN107452387B (zh) 2016-05-31 2016-05-31 一种声道间相位差参数的提取方法及装置
PCT/CN2016/102128 WO2017206416A1 (zh) 2016-05-31 2016-10-14 一种声道间相位差参数的提取方法及装置
PCT/CN2017/085909 WO2017206794A1 (zh) 2016-05-31 2017-05-25 一种声道间相位差参数的提取方法及装置

Publications (1)

Publication Number Publication Date
ES2836682T3 true ES2836682T3 (es) 2021-06-28

Family

ID=60478483

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17805739T Active ES2836682T3 (es) 2016-05-31 2017-05-25 Método y dispositivo para extraer parámetro de diferencia de fase entre canales

Country Status (7)

Country Link
US (3) US11393480B2 (es)
EP (3) EP4336495A3 (es)
KR (2) KR102196390B1 (es)
CN (3) CN107452387B (es)
BR (1) BR112018074333A2 (es)
ES (1) ES2836682T3 (es)
WO (2) WO2017206416A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2345026A1 (en) * 2008-10-03 2011-07-20 Nokia Corporation Apparatus for binaural audio coding
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
KR101646650B1 (ko) * 2009-10-15 2016-08-08 오렌지 최적의 저-스루풋 파라메트릭 코딩/디코딩
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
KR101033241B1 (ko) * 2010-07-23 2011-05-06 엘아이지넥스원 주식회사 위상 배열 안테나 시스템을 위한 신호 처리 장치 및 방법
EP2612322B1 (en) 2010-10-05 2016-05-11 Huawei Technologies Co., Ltd. Method and device for decoding a multichannel audio signal
EP2633520B1 (en) 2010-11-03 2015-09-02 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
KR101662681B1 (ko) 2012-04-05 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
PL3028474T3 (pl) * 2013-07-30 2019-06-28 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN104053120B (zh) * 2014-06-13 2016-03-02 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals

Also Published As

Publication number Publication date
EP4336495A3 (en) 2024-05-01
KR20190009363A (ko) 2019-01-28
WO2017206416A1 (zh) 2017-12-07
US11393480B2 (en) 2022-07-19
CN108475509B (zh) 2022-10-04
EP3451331B1 (en) 2020-10-21
CN107452387A (zh) 2017-12-08
CN115662449A (zh) 2023-01-31
EP3451331A1 (en) 2019-03-06
EP3822967A1 (en) 2021-05-19
CN107452387B (zh) 2019-11-12
EP4336495A2 (en) 2024-03-13
KR102196390B1 (ko) 2020-12-29
US11915709B2 (en) 2024-02-27
KR20200145859A (ko) 2020-12-30
KR102288841B1 (ko) 2021-08-10
US20220328053A1 (en) 2022-10-13
EP3822967B1 (en) 2023-12-27
CN108475509A (zh) 2018-08-31
BR112018074333A2 (pt) 2019-03-06
WO2017206794A1 (zh) 2017-12-07
US20190096411A1 (en) 2019-03-28
US20240161755A1 (en) 2024-05-16
EP3451331A4 (en) 2019-06-19

Similar Documents

Publication Publication Date Title
ES2836682T3 (es) Método y dispositivo para extraer parámetro de diferencia de fase entre canales
US20240056764A1 (en) Multi-Channel Signal Encoding Method, Multi-Channel Signal Decoding Method, Encoder, and Decoder
JP7439152B2 (ja) チャネル間位相差パラメータ符号化方法および装置
BR122023025938A2 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal, e meio de armazenamento
Wang et al. The perceptual and statistics characteristic of spatial cues and its application