ES2979342T3 - Método y dispositivo de codificación de parámetros de diferencia de fase entre canales - Google Patents
Método y dispositivo de codificación de parámetros de diferencia de fase entre canales Download PDFInfo
- Publication number
- ES2979342T3 ES2979342T3 ES18823145T ES18823145T ES2979342T3 ES 2979342 T3 ES2979342 T3 ES 2979342T3 ES 18823145 T ES18823145 T ES 18823145T ES 18823145 T ES18823145 T ES 18823145T ES 2979342 T3 ES2979342 T3 ES 2979342T3
- Authority
- ES
- Spain
- Prior art keywords
- current frame
- parameter
- ipd
- coding scheme
- ipd parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Manipulation Of Pulses (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
En la presente solicitud se describe un método de codificación de parámetros de diferencia de fase entre canales, comprendiendo el método: adquirir un parámetro de referencia configurado para determinar un modo de codificación de parámetros de diferencia de fase entre canales (IPD) de un cuadro actual de una señal de audio multicanal; determinar, según el parámetro de referencia, el modo de codificación de parámetros IPD del cuadro actual, siendo el modo de codificación de parámetros IPD determinado del cuadro actual uno de al menos dos modos de codificación de parámetros IPD predeterminados; y realizar, según el modo de codificación de parámetros IPD determinado del cuadro actual, el procesamiento de parámetros IPD del cuadro actual. La solución técnica proporcionada en la presente solicitud mejora la calidad de codificación de una señal de audio multicanal. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Método y dispositivo de codificación de parámetros de diferencia de fase entre canales
Campo técnico
La presente invención se refiere al campo de las tecnologías de comunicaciones y, en particular, a un método y un aparato de codificación de parámetros de diferencia de fase entre canales.
Antecedentes
A medida que mejora la calidad de vida, aumenta constantemente la necesidad de audio de alta calidad. En comparación con el audio mono, el audio estéreo presenta una sensación de orientación y una sensación de distribución para cada fuente acústica, y puede mejorar la claridad y la inteligibilidad de la información de audio y mejorar la sensación de presencia de la reproducción de audio. Por lo tanto, la gente prefiere el audio estéreo.
Una tecnología de codificación estéreo paramétrica (Parametric Stereo, PS) es una tecnología de codificación estéreo común. En la tecnología de codificación PS, el procesamiento de codificación y decodificación se realiza en una señal estéreo (en otras palabras, una señal multicanal) basándose en una característica de percepción espacial. Específicamente, la codificación y decodificación de una señal multicanal se convierten en codificación y decodificación de una señal de audio mono y codificación y decodificación de parámetros de percepción espacial. Los parámetros de percepción espacial en la codificación PS incluyen correlación entre canales (Inter-channel Correlation, IC), una diferencia de nivel entre canales (Inter-channel Level Difference, ILD), una diferencia de tiempo entre canales (Inter-channel Time Difference, ITD), una diferencia de fase entre canales (Inter-channel Phase Difference, IPD), y similares. Un parámetro ITD y un parámetro IPD son parámetros de percepción espacial que indican la orientación horizontal de una fuente acústica. Un parámetro ILD, el parámetro ITD y el parámetro IPD determinan la percepción del oído humano de una ubicación de la fuente acústica y pueden determinar efectivamente una ubicación del campo sonoro y son importantes para la restauración de la señal estéreo. Por lo tanto, la determinación de parámetros como el parámetro IPD es importante para la restauración de la señal estéreo.
En la técnica anterior 1, cuando se calcula un parámetro IPD de cada trama en una señal estéreo, específicamente, una señal en el dominio de tiempo se transforma en una señal en el dominio de la frecuencia, la señal en el dominio de la frecuencia se divide en una pluralidad de subbandas, los parámetros IPD de las subbandas se calculan uno por uno y luego los parámetros IPD de todas las subbandas se cuantifican para usarlos para codificar la señal estéreo. Se puede aprender que el cálculo del parámetro IPD en la técnica anterior 1 debe realizarse en las subbandas una por una. En consecuencia, se ocupa una pluralidad de recursos y la eficiencia de codificación es baja.
En la técnica anterior 2, cuando se calcula un parámetro IPD de cada trama en una señal estéreo, específicamente, una señal en el dominio de tiempo se transforma en una señal en el dominio de la frecuencia, un parámetro IPD de una señal estéreo con una trama se calcula en función de la señal en el dominio de la frecuencia. El parámetro IPD de la señal estéreo con la trama es un parámetro de diferencia de fase entre canales de grupo (IPD de grupo), y luego el parámetro IPD de grupo se cuantifica para usarse para codificar la señal estéreo. Se puede aprender que, en la técnica anterior, sólo se calcula un parámetro IPD (es decir, el parámetro IPD de grupo), y luego sólo se puede cuantificar un parámetro IPD. Aunque se ocupan menos recursos, la precisión de la información de fase para la codificación es baja y la calidad de la codificación es deficiente.
El documento EP3451331A1 divulga un método de extracción de parámetros de diferencia de fase entre canales que incluye: obtener un parámetro usado para determinar una manera de extracción de información para una trama actual de una señal multicanal; determinar una manera de extracción de parámetros IPD para la trama actual de la señal multicanal en función del parámetro usado para determinar la manera de extracción de información para la trama actual de la señal multicanal, donde la manera de extracción de parámetros IPD determinada para la trama actual de la señal multicanal es una de al menos dos maneras de extracción de parámetros IPD preestablecidas; y extraer un parámetro IPD de la trama actual de señal multicanal basándose en la manera de extracción de parámetros IPD determinada para la trama actual de señal multicanal.
El documento EP2296142A2 divulga un método de codificación de audio que recibe una pluralidad de canales de entrada y genera uno o más canales de salida de audio y uno o más parámetros que describen las relaciones espaciales deseadas entre una pluralidad de canales de audio que pueden derivarse de uno o más canales de salida de audio, detectando cambios en las características de la señal con respecto al tiempo en uno o más de la pluralidad de canales de entrada de audio, identificando como fronteras de eventos auditivos cambios en las características de la señal con respecto al tiempo en uno o más canales de salida de audio de la pluralidad de canales de entrada de audio, un segmento de audio entre fronteras consecutivas que constituye un evento auditivo en el canal o canales, y genera todo o algunos de uno o más parámetros al menos parcialmente en respuesta a eventos auditivos y/o el grado de cambio en las características de la señal asociadas con las fronteras de evento auditivo.
Compendio
Esta solicitud proporciona un método y un aparato de codificación de parámetros IPD para aumentar la diversidad en la selección de un esquema de codificación de parámetros IPD, mantener mejor la información de fase y mejorar la calidad de codificación de audio.
La presente invención se define por las reivindicaciones independientes. En las reivindicaciones dependientes se presentan características adicionales de la invención.
Breve descripción de los dibujos
Para describir las soluciones técnicas en las realizaciones de la presente invención más claramente, a continuación, se describen brevemente los dibujos adjuntos requeridos para describir las realizaciones. Aparentemente, los dibujos adjuntos en la siguiente descripción muestran meramente algunas realizaciones de la presente invención, y un experto en la técnica puede obtener otros dibujos de estos dibujos adjuntos sin esfuerzos creativos.
La FIG. 1 es un diagrama de principio esquemático de la codificación PS;
la FIG. 2 es un diagrama de principio esquemático de la decodificación PS;
la FIG. 3 es un diagrama esquemático de un escenario de aplicación de una solución de la presente invención según una realización de la presente invención;
la FIG. 4 es un diagrama esquemático de otro escenario de aplicación de una solución de la presente invención según una realización de la presente invención;
la FIG. 5 es un diagrama de flujo esquemático de un método de codificación de parámetro IPD según una realización de la presente invención;
la FIG. 6 es otro diagrama de flujo esquemático de un método de codificación de parámetros IPD según una realización de la presente invención que no está cubierto por las reivindicaciones;
la FIG. 7 es otro diagrama de flujo esquemático de un método de codificación de parámetros IPD según una realización de la presente invención que no está cubierto por las reivindicaciones;
la FIG. 8 es un diagrama estructural esquemático de un aparato de codificación de parámetro IPD según una realización de la presente invención; y
la FIG. 9 es un diagrama estructural esquemático de un aparato de codificación de parámetro IPD según otra realización de la presente invención
Descripción de las realizaciones
A continuación se describen de forma clara soluciones técnicas en las realizaciones de la presente invención con referencia a los dibujos adjuntos en las realizaciones de la presente invención. Aparentemente, las realizaciones descritas son solamente algunas, pero no todas las realizaciones de la presente invención. Todas las demás realizaciones obtenidas por un experto en la técnica basándose en las realizaciones de la presente invención sin esfuerzos creativos estarán dentro del alcance de protección de la presente invención.
La FIG. 1 es un diagrama de principio esquemático de la codificación PS.
En la codificación PS, un codificador mezcla reduciendo (downmix) una entrada de señal estéreo desde una señal de audio multicanal (por ejemplo, un canal x1 y un canal x2) a una mono, extrae parámetros de percepción espacial de la señal estéreo a través del análisis de parámetros de percepción espacial, obtiene un flujo de bits de audio mono a través de codificación de señal de audio mono, y obtiene un flujo de bits de parámetros de percepción espacial a través de codificación de parámetros de percepción espacial. Además, el codificador realiza multiplexación de flujos de bits en el flujo de bits de audio mono y el flujo de bits del parámetro de percepción espacial para obtener un flujo de bits para codificación de señal estéreo.
La FIG. 2 es un diagrama de principio esquemático de la decodificación PS.
Un decodificador realiza demultiplexación de flujo de bits en un flujo de bits para codificación de señal estéreo para obtener un flujo de bits de audio mono y un flujo de bits de parámetro de percepción espacial, realiza decodificación de señal de audio mono en el flujo de bits de audio mono y realiza la decodificación de parámetros de percepción espacial en el flujo de bits del parámetro de percepción espacial. Además, después de decodificar una señal de audio mono, el decodificador sintetiza una señal estéreo reconstruida utilizando los parámetros de percepción espacial.
En una implementación específica, los parámetros de percepción espacial en la codificación PS y decodificación PS anteriores incluyen parámetros tales como IC, un ILD, un ITD y un IPD. El IC describe una correlación o una correlación entre canales. Este parámetro determina la percepción del intervalo de campo sonoro y puede mejorar la sensación de espacio y la estabilidad del sonido de una señal de audio. Un parámetro ILD se utiliza para distinguir entre ángulos de dirección horizontal de fuentes estéreo y describe una diferencia de intensidad entre canales. Este parámetro afecta a los componentes de frecuencia de todo un espectro. Un parámetro ITD y un parámetro IPD son parámetros de percepción espacial que indican la orientación horizontal de una fuente acústica. El parámetro ILD, el parámetro ITD y el parámetro IPD determinan la percepción del oído humano de una ubicación de la fuente de sonido y pueden determinar efectivamente una ubicación del campo sonoro y son importantes para la restauración de la señal estéreo. Por lo tanto, la determinación de parámetros como el parámetro IPD es importante para la restauración de la señal estéreo.
En la FIG. 3. se muestra un escenario de aplicación de una solución de la presente invención. Después de codificar (incluida la codificación de un parámetro IPD) una señal multicanal recopilada, un terminal 301 envía un flujo de código obtenido mediante codificación a una red de acceso por radio (RAN: Radio Access Network) 302, por ejemplo, puede enviar directamente el flujo de código a una estación basada 3021 en la RAN 302. Después de pasar a través de la estación basada 3021, el flujo de código se transmite a una puerta de enlace de red de datos en paquetes (Packet Data Network Gateway, PGW) 3022. Después de pasar a través de la PGW 3022, el flujo de código se transmite a una red central 303 y, específicamente, el flujo de código puede pasar a través de un controlador de borde de sesión (SBC: Session Border Controller) 3031 en la red central 303. El flujo de código que pasa a través de la red central 303 entra a una RAN 304. La RAN 304 incluye una PGW 3042 y una estación base 3041. Después de que el flujo de código pasa a través de la PGW 3042 y llega a la estación base 3041, la estación base 3041 envía el flujo de código a un terminal 305, y el terminal 305 decodifica el flujo de código y reproduce una señal multicanal obtenida mediante decodificación.
Cabe señalar que, en la descripción anterior, la RAN simplemente incluye un ejemplo de dos elementos de red (la estación base y la PGW). Durante la implementación real, la RAN incluye además una pluralidad de otros elementos de red. Para facilitar la descripción, se omite otro elemento de red en las realizaciones de la presente invención. De manera similar, la red central también incluye simplemente un ejemplo del SBC. Para facilitar la descripción, se omite otro elemento de red en las realizaciones de la presente invención. Puede entenderse que los elementos de red en la red anterior son meramente ejemplos, y los nombres de los elementos de red pueden ser diferentes en diferentes redes. Por ejemplo, la PGW se denomina puerta de enlace de datos de paquetes evolucionada (ePDG: Evolved Packet Data Gateway) en una red LTE. De manera similar, la forma de conexión entre los elementos de red anteriores también puede cambiar con la evolución de una red. Por lo tanto, en las realizaciones de la presente invención, un escenario de aplicación de la presente invención no se limita a los ejemplos anteriores.
El terminal 301 y el terminal 305 son terminales que tienen una capacidad de acceso a la red celular, y pueden ser un dispositivo portable, un dispositivo de realidad virtual (VR: Virtual Reality), una realidad aumentada (AR: Augmented Reality), un teléfono móvil, una tableta (Pad), un ordenador portátil (NB: Notebook Computer), un ordenador personal (PC: Personal Computer), o similares.
Otro escenario de aplicación de una solución de la presente invención se muestra en la FIG. 4. Después de codificar (incluida la codificación de un parámetro IPD) una señal multicanal recopilada, un terminal 401 envía el flujo de código obtenido mediante la codificación a un terminal 403 a través de Internet 402. El terminal 403 decodifica el flujo de código y reproduce una señal multicanal obtenida mediante decodificación.
El terminal 401 y el terminal 403 son terminales que tienen capacidad de acceso a Internet y pueden ser dispositivos portables, dispositivos VR, dispositivos AR, teléfonos móviles, Pads, NB, PC o similares.
La FIG. 5 es un diagrama de flujo esquemático de un método de codificación de parámetro IPD según una realización de la presente invención. El método incluye las siguientes etapas:
S501. Obtener un parámetro de referencia utilizado para determinar un esquema de codificación de parámetros IPD de una trama actual de una señal multicanal.
Durante una implementación específica, el método de codificación de parámetros IPD proporcionado en esta realización de la presente invención puede realizarse mediante un codificador que puede codificar la señal multicanal. Después de codificar un parámetro IPD de la trama actual utilizando el método de codificación de parámetros IPD proporcionado en esta realización de la presente invención, el codificador transmite el parámetro IPD codificado. Un decodificador utiliza, para el procesamiento de síntesis estéreo, el parámetro IPD obtenido mediante decodificación. A continuación se describe en detalle el método de codificación de parámetros IPD proporcionado en esta realización de la presente invención. Cabe señalar que el codificador y el decodificador en esta realización de la presente invención se describen simplemente en términos de una función, y las formas reales del codificador y el decodificador pueden ser los terminales anteriores. Puede entenderse que, en un proceso de llamada, el terminal puede tener una función tanto de codificador como de decodificador. Para facilitar la descripción, la trama actual se utiliza directamente cuando se describe posteriormente la trama actual de la señal multicanal. La señal multicanal en esta realización de la presente invención puede ser específicamente una señal de dos canales, una señal de tres canales, una señal de cuatro canales o similares. Una cantidad específica de canales correspondientes a la señal multicanal no está limitada en esta realización de la presente invención.
En algunas implementaciones factibles, al codificar el parámetro IPD de la trama actual, el codificador puede obtener primero el parámetro de referencia utilizado para determinar el esquema de codificación de parámetros IPD de la trama actual y luego determinar el esquema de codificación de parámetros IPD de la trama actual en función del parámetro de referencia. En otras palabras, el parámetro de referencia se utiliza para determinar el esquema de codificación de parámetros IPD de la trama actual. Puede entenderse que el parámetro de referencia puede usarse alternativamente para determinar un esquema de codificación para otro parámetro de la trama actual. En esta realización de la presente invención, el parámetro de referencia no se limita a usarse para determinar el esquema de codificación de parámetros IPD. Durante una implementación específica, el parámetro de referencia puede incluir al menos uno de un parámetro característico de señal de la trama actual y parámetros característicos de señal de tramas A anteriores a la trama actual. Para ser específicos, el parámetro de referencia puede incluir el parámetro característico de señal de la trama actual, los parámetros característicos de señal de las tramas A anteriores a la trama actual, el parámetro característico de señal de la trama actual y los parámetros característicos de señal de las tramas A anteriores a la trama actual, o similar, y puede determinarse específicamente en función de un escenario de aplicación real. Esto no se limita en la presente memoria. En este caso, A es un número entero no menor que 1. Para ser específicos, las tramas A anteriores a la trama actual pueden ser una trama, dos tramas, tres tramas o similares anteriores a la trama actual. Esto no se limita en la presente memoria. La trama anterior a la trama actual y la trama actual son consecutivas en una secuencia de tiempo. Las dos tramas anteriores a la trama actual son consecutivas en una secuencia de tiempo e incluyen la trama anterior a la trama actual. Las tres tramas anteriores a la trama actual son consecutivas en una secuencia de tiempo e incluyen las dos tramas anteriores a la trama actual.
Durante una implementación específica, el parámetro característico de señal de la trama actual puede incluir uno o más parámetros tales como un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, una varianza de los parámetros IPD de subbanda de la trama actual, un tipo de señal de la trama actual y un parámetro ITD de la trama actual. El parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, y la varianza de los parámetros IPD de subbanda de la trama actual se puede obtener mediante cálculo basado en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de las señales multicanal. El parámetro ITD de la trama actual se puede determinar basándose en una manera de extraer un parámetro ITD de la señal multicanal de la trama actual. La manera de extraer el parámetro ITD de la trama actual puede incluir una manera de extracción proporcionada en un protocolo estándar o una manera de extracción conocida por un experto en la técnica. Esto no se limita en esta memoria.
Los parámetros característicos de señal de las tramas A anteriores a la trama actual incluyen uno o más parámetros tales como un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de cada una de las tramas A anteriores a la trama actual, una varianza de los parámetros IPD de subbanda de cada una de las tramas A anteriores a la trama actual, un parámetro ITD de cada una de las tramas A anteriores a la trama actual, un esquema de codificación de parámetros IPD de cada una de las tramas A anteriores a la trama actual y un tipo de señal de cada una de las tramas A anteriores a la trama actual. La selección de un parámetro específico o parámetros específicos se puede determinar basándose en un escenario de aplicación real. Esto no se limita en la presente memoria. El esquema de codificación de parámetros IPD de cada una de las tramas A anteriores a la trama actual puede almacenarse en una memoria caché o en una memoria. El tipo de señal puede incluir un tipo de voz o un tipo de música. Los parámetros característicos de señal de las tramas A anteriores a la trama actual pueden almacenarse en una memoria caché. Puede entenderse que, después de obtener el parámetro característico de señal de la trama actual, el parámetro característico de señal de la trama actual también se almacena en la memoria caché para determinar un esquema de codificación de parámetros IPD de una trama siguiente.
En algunas implementaciones factibles, el codificador puede realizar una transformación tiempo-frecuencia en las señales del dominio de tiempo de canal izquierdo y del canal derecho de la señal multicanal de la trama actual para obtener la señal en dominio de frecuencia de canal izquierdo y señal en dominio de frecuencia de canal derecho de la trama actual. Específicamente, la transformación de tiempo-frecuencia anterior se puede implementar usando una implementación tal como una transformación rápida de Fourier (Fast Fourier T ransformation, FFT) o una transformada de coseno discreta modificada (Modified Discrete Cosine T ransform, MDCT). Esto no se limita en la presente memoria. La transformación de tiempo-frecuencia realizada en las señales de dominio de tiempo de canal izquierdo y del canal derecho de la señal multicanal de la trama actual se puede realizar en forma de trama o en forma de subtrama. Una trama puede incluir normalmente cuatro subtramas, dos subtramas u ocho subtramas. Se puede determinar una cantidad específica de subtramas en función de una situación específica.
Por ejemplo, en una implementación, cuando el codificador transforma las señales del dominio de tiempo de canal izquierdo y del canal derecho de la señal multicanal de la trama actual en la señal en dominio de frecuencia de canal izquierdo y la frecuencia del canal derecho señal en dominio a través de la FFT, se pueden usar específicamente las siguientes fórmulas de transformación:
Longilud-1
R(k) =]TxR(n)xe~j2MrL, 0 < k < M
H=0 "<1>"<0>
y
En esta memoria, n indica un valor de índice de una señal en dominio de tiempo, k indica un valor de índice de una señal en el dominio de la frecuencia,Longitudindica una longitud de trama,Mindica una longitud de transformación de tiempo-frecuencia para transformar una señal en el dominio del tiempo en una señal en el dominio de la frecuencia,XL(n)indica una señal en dominio del tiempo del canal izquierdo de audio,xn(n)indica una señal en el dominio del tiempo del canal derecho de audio,L(k)indica un k'ésim° valor de frecuencia que es de una señal en dominio de frecuencia de canal izquierdo de audio y que se usa para calcular el parámetro IPD, yR(k)indica un k-^ ™ valor de frecuencia que es de una señal en dominio de frecuencia de canal derecho de audio y que se usa para calcular el parámetro IPD,donde,XL(ft)y XR(n)indican secuencias de números reales.
Un coeficiente de transformación de Fourier X(k) de una secuencia de números reales x(n) (incluidosXL(n)yXR(n))es un número complejo y una parte real de la secuencia de números reales x(n) tiene simetría par y una parte imaginaria tiene simetría impar. Para ser específicos, X(k) tiene una simetría conjugada. Tanto X(0) como X(N/2) son números reales y cumplen la siguiente fórmula de relación:
X(k) = X*(N-k), donde 1 <k<L/2-1
Cuando se realiza la transformación discreta de Fourier, utilizando esta simetría conjugada, el codificador no necesita calcular y almacenar X(k), L/2 1 <k<L- 1, y partes imaginarias de X(0) y X(L/2), pero solo necesita calcular X(0) a X(L/2), para reducir la ocupación de un recurso informático y un recurso de almacenamiento del codificador.
Después de transformar las señales del dominio de tiempo de canal izquierdo y del canal derecho de la trama actual en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho en forma de trama o subtrama, el codificador puede calcular, basándose en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual.
En una implementación, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual se puede obtener mediante cálculo utilizando la siguiente fórmula de cálculo:
N
c o r r= ^
b=0[E ,(b)E r( 6 ) 2^ D ;(fe ) D ;(7 > ) ]
E/(b) indica una suma de energía de un canal de audio izquierdo,Er(b)indica una suma de energía de un canal de audio derecho,L(k)indica una parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal izquierdo de audio,R r(k)indica una parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal derecho de audio,L(k)indica una parte imaginaria de un k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal izquierdo de audio,Ri(k)indica una parte imaginaria de un k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal derecho de audio, L indica una cantidad de coeficientes espectrales de subbanda, y N indica un cantidad de subbandas.
En otra implementación, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual se puede obtener mediante cálculo utilizando la siguiente fórmula de cálculo:
En una implementación, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual se puede obtener mediante cálculo utilizando la siguiente fórmula de cálculo:
En esta memoria, R*(k) indica un conjugado de R(k). Para ser específicos, R*(k) indica un conjugado del k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal derecho de audio.
En algunas implementaciones factibles, después de transformar las señales del dominio de tiempo de canal izquierdo y de canal derecho de la trama actual en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho, el codificador puede calcular además la varianza de los parámetros IPD de subbanda de la trama actual basándose en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho. Específicamente, el codificador puede dividir primero la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual en al menos dos subbandas (en otras palabras, una pluralidad de subbandas). Se supone que la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho se dividen en Nsubbandas subbandas, donde Nsubbandas es un número entero mayor que 2. Luego, el codificador puede calcular los parámetros IPD de todas las subbandas basándose en señales en dominio de frecuencia de las Nsubbandas subbandas obtenidas mediante división, y calcular la varianza de los parámetros IPD de subbanda de la trama actual en función de los parámetros IPD de las subbandas Nsubbanda obtenidos mediante cálculo.
En una implementación, el codificador puede calcular específicamente el parámetro IPD de subbanda utilizando la siguiente fórmula de cálculo:
En esta memoria, b indica un valor de índice de una subbanda, y una frecuencia incluida en una subbanda b esAb-i<k<Ab- 1.
En una implementación, el codificador puede calcular la varianza de los parámetros IPD de subbanda utilizando la siguiente fórmula de cálculo:
NsutotnOr l
var = - ------- £(lP D (b ) - avr)f
s^ubtiende b-0i donde
|NsubbanOa-1
avr<= — ---------------->Y IP D (b )
N subbanda h=0
En otra implementación de la presente invención, el parámetro IPD de subbanda se puede obtener mediante cálculo utilizando la siguiente fórmula de cálculo:
IP D (b ) =a ta n 2 (- ^ ^ - )
Dr(b)
En esta memoria, atan2 indica una función arctan.
Puede entenderse que, durante la aplicación real, el parámetro IPD de subbanda puede obtenerse alternativamente mediante cálculo de otra manera. Una manera de cálculo específica del parámetro IPD de subbanda no está limitada en esta realización de la presente invención.
S502. Determinar el esquema de codificación de parámetros IPD de la trama actual en función del parámetro de referencia obtenido.
Durante una implementación específica, el codificador puede seleccionar de forma adaptativa, basándose en el parámetro de referencia obtenido, uno de una pluralidad de esquemas de codificación de parámetros IPD preestablecidos como el esquema de codificación de parámetros IPD de la trama actual.
La pluralidad de esquemas de codificación de parámetros IPD preestablecidos puede incluir un primer esquema de codificación y un segundo esquema de codificación. El primer esquema de codificación incluye un esquema de codificación de parámetros de IPD de grupo, omitiendo la codificación de un parámetro de IPD, estableciendo un valor del parámetro de IPD en 0, o similares. El segundo esquema de codificación incluye un esquema de codificación de parámetros IPD de un conjunto de subbandas, un esquema de codificación de parámetros IPD de subbandas, o similares. El esquema de codificación de parámetros IPD de subbanda puede codificar parámetros IPD de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual.
Puede entenderse que, en algunas implementaciones, puede estar predeterminado que el primer esquema de codificación sea específicamente uno de los siguientes: el esquema de codificación de parámetros IPD de grupo, omitiendo codificar el parámetro IPD y establecer el valor del parámetro IPD en 0. Por lo tanto, el codificador puede determinar directamente que un esquema de codificación es el esquema de codificación de parámetros IPD de grupo, omitiendo codificar el parámetro IPD o estableciendo el valor del parámetro IPD en 0, y no necesita realizar una selección entre tres esquemas de codificación. En consecuencia, se puede predeterminar además que el segundo esquema de codificación sea específicamente uno de entre el esquema de codificación de parámetros IPD del conjunto de subbandas y el esquema de codificación de parámetros IPD de subbandas. Por lo tanto, el codificador puede determinar directamente que un esquema de codificación es el esquema de codificación de parámetros IPD del conjunto de subbanda o el esquema de codificación de parámetros IPD de subbanda, y no necesita realizar la selección entre dos esquemas de codificación.
En algunas otras implementaciones, el codificador puede determinar primero el primer esquema de codificación o el segundo esquema de codificación. Al determinar el primer esquema de codificación, el codificador selecciona uno de los tres esquemas de codificación anteriores. De manera correspondiente, al determinar el segundo esquema de codificación, el codificador selecciona uno de los dos segundos esquemas de codificación anteriores.
En algunas implementaciones, después de que se determina el esquema de codificación de parámetros IPD de la trama actual, se puede codificar el esquema de codificación de parámetros IPD determinado de la trama actual. Un esquema de codificación específico puede ser establecer un parámetro preestablecido como un valor preestablecido e indicar diferentes esquemas de codificación utilizando diferentes valores. Por ejemplo, en una implementación, el esquema de codificación de parámetros IPD de la trama actual puede indicarse utilizando un bit de marcador de esquema de codificación. El bit de marcador puede ocupar un bit. Cuando un valor de este bit es 0, indica que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. Cuando un valor de este bit es 1, indica que el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. Ciertamente, cuando un valor de este bit es 1, alternativamente puede indicar que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación, y cuando un valor de este bit es 0, alternativamente puede indicar que el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. El decodificador puede determinar el esquema de codificación de parámetros IPD basándose en el valor del bit de marcador, para determinar una manera de decodificación correspondiente.
S503. Procesar un parámetro IPD de la trama actual sobre la base del esquema de codificación de parámetros IPD determinado de la trama actual.
En algunas implementaciones factibles, el parámetro de referencia incluye el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual. En este caso, cuando se va a determinar el esquema de codificación de parámetros IPD de la trama actual, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual se puede comparar con un primer umbral predefinido. Si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual que el primer umbral, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. Por el contrario, si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es menor que el primer umbral, el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. Un valor del primer umbral predefinido oscila entre 0,6 y 0,95. Por ejemplo, el valor puede ser específicamente 0,89, 0,8, 0,75 o similar.
En algunas implementaciones factibles, el parámetro de referencia incluye la varianza de los parámetros IPD de subbanda de la trama actual. En este caso, cuando se va a determinar el esquema de codificación de parámetros IPD de la trama actual, la varianza de los parámetros IPD de subbanda de la trama actual se puede comparar con un segundo umbral predefinido. Si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es menor que el segundo umbral, indica que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. Por el contrario, si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual que el segundo umbral, indica que el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. Un valor del segundo umbral predefinido oscila entre 0,05 y 0,5. Por ejemplo, el valor puede ser específicamente 0,45, 0,25, 0,3 o similar.
En algunas implementaciones factibles, el parámetro de referencia incluye el tipo de señal de la trama actual. Por ejemplo, en una implementación, cuando el tipo de señal de la trama actual es un tipo de voz, se puede determinar que el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. Cuando el tipo de señal de la trama actual es un tipo de música, se puede determinar que el esquema de codificación de parámetros IPD de la trama actual es un primer esquema de codificación de parámetros IPD. Puede entenderse que, en algunas otras realizaciones, el tipo de señal de la trama actual no es el único parámetro de referencia para determinar el esquema de codificación de parámetros IPD de la trama actual. El esquema de codificación de parámetros IPD puede determinarse además con referencia a otro parámetro de referencia.
En algunas implementaciones factibles, el parámetro de referencia incluye un parámetro ITD de la trama actual. Si un valor del parámetro ITD de la trama actual es mayor que un umbral preestablecido, se determina que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. De lo contrario, el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación. En una realización, el umbral preestablecido puede ser 1, 2, 3, 4 o 5.
Puede entenderse que el parámetro característico de señal de la trama actual puede incluir sólo uno de los parámetros anteriores. En este caso, el esquema de codificación de parámetros IPD de la trama actual puede determinarse siempre que el parámetro cumpla una condición de parámetro correspondiente. Ciertamente, el parámetro característico de la señal de la trama actual puede incluir alternativamente al menos dos de los parámetros anteriores. En este caso, el esquema de codificación de parámetros IPD de la trama actual puede determinarse sólo cuando al menos dos parámetros cumplen respectivamente las condiciones de parámetros correspondientes.
En algunas implementaciones factibles, el parámetro de referencia incluye el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores a la trama actual y el tipo de señal de cada una de las tramas A anteriores a la trama actual. En este caso, se puede determinar si el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores a la trama actual es un esquema de codificación de parámetros IPD preestablecido y si el tipo de señal de cada una de las tramas A anteriores a la trama actual es un tipo de señal preestablecida. Si el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores a la trama actual es el primer esquema de codificación, y el tipo de señal de cada una de las tramas A de la trama actual es un tipo de música, el esquema de codificación de parámetros IPD de la trama actual puede determinarse como el primer esquema de codificación.
Por ejemplo, cuando A = 1, las tramas A anteriores a la trama actual son una trama anterior a la trama actual. Si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual es el primer esquema de codificación, y el tipo de señal de la trama anterior a la trama actual es un tipo de música, el esquema de codificación de parámetros IPD de la trama actual La trama puede determinarse como el primer esquema de codificación De lo contrario, se determina que el esquema de codificación de parámetros IPD de la trama actual no es el primer esquema de codificación, por ejemplo, el segundo esquema de codificación.
Cuando A = 2, las tramas A anteriores a la trama actual son dos tramas anteriores a la trama actual. Si los esquemas de codificación de parámetros IPD de dos tramas anteriores a la trama actual son ambos primeros esquemas de codificación, y los tipos de señal de las dos tramas anteriores a la trama actual son tipos de música, el esquema de codificación de parámetros IPD de la trama actual La trama puede determinarse como el primer esquema de codificación. De lo contrario, se determina que el esquema de codificación de parámetros IPD de la trama actual no es el primer esquema de codificación, por ejemplo, el segundo esquema de codificación.
En algunas implementaciones factibles, el parámetro de referencia incluye el parámetro ITD de la trama actual, la varianza de los parámetros IPD de subbanda de la trama actual y el tipo de señal de cada una de las tramas A anteriores a la trama actual. En este caso, se puede comparar un valor absoluto del parámetro ITD de la trama actual con un tercer umbral predefinido, la varianza de los parámetros IPD de subbanda de la trama actual se compara con un cuarto umbral predefinido, y se determina si el tipo de señal de cada una de las tramas A anteriores a la trama actual es un tipo de voz. Un valor del tercer umbral predefinido puede variar de 0 a 4. Por ejemplo, el valor del tercer umbral puede ser 4, 2, 0 o similar. Un valor del cuarto umbral predefinido puede oscilar entre 0,05 y 0,4. El valor del cuarto umbral puede ser 0,4, 0,35, 0,25, 0,05 o similar. Si el valor absoluto del parámetro iTd de la trama actual es mayor que el tercer umbral, la varianza de los parámetros IPD de subbanda de la trama actual es menor que el cuarto umbral, y el tipo de señal de cada una de las tramas A anteriores a la trama actual es un tipo de voz, el esquema de codificación de parámetros IPD de la trama actual puede determinarse como el primer esquema de codificación. De lo contrario, se determina que el esquema de codificación de parámetros IPD de la trama actual no es el primer esquema de codificación, por ejemplo, el segundo esquema de codificación.
Si las tramas A anteriores a las tramas actuales son la trama anterior a la trama actual, cuando el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de los parámetros IPD de subbanda de la trama actual es menor que el cuarto umbral, y el tipo de señal de la trama anterior a la trama actual es un tipo de voz, el esquema de codificación de parámetros IPD de la trama actual puede determinarse como el primer esquema de codificación. Si las tramas A anteriores a las tramas actuales son las dos tramas anteriores a la trama actual, cuando el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de los parámetros IPD de subbanda de la trama actual es menor que el cuarto umbral, y un tipo de señal de cada una de las dos tramas anteriores a la trama actual es un tipo de voz, el esquema de codificación de parámetros IPD de la trama actual puede determinarse como el primer esquema de codificación.
En algunas implementaciones factibles, después de determinar que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación, el codificador puede procesar el parámetro IPD de la trama actual basándose en el primer esquema de codificación. Por ejemplo, si el primer esquema de codificación omite la codificación del parámetro IPD, no se realiza ninguna operación, para ser específicos, finaliza un proceso correspondiente a la codificación del parámetro IPD de la trama actual. Si el primer esquema de codificación es el esquema de codificación de parámetros de IPD de grupo, se puede codificar el parámetro de IPD de grupo de la trama actual. El parámetro IPD de grupo de la trama actual se utiliza como parámetro IPD de la trama actual. Si el primer esquema de codificación establece el valor del parámetro IPD en 0, el valor del parámetro IPD de la trama actual puede establecerse en 0 y luego se procesa posteriormente el parámetro IPD con un valor de 0. Por ejemplo, si el valor del parámetro IPD se requiere como entrada durante algún procesamiento, después de que el valor del parámetro IPD de la trama actual se establezca en 0, se puede utilizar 0 como entrada del procesamiento.
En algunas implementaciones, el parámetro de referencia incluye el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, y puede incluir además el esquema de codificación de parámetros IPD de la trama anterior a la trama actual y el tipo de señal de la trama anterior. Si el valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual que el primer umbral, se puede determinar que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. Si el valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es menor que el primer umbral, y el esquema de codificación de parámetros IPD de la trama anterior a la trama actual es el primer esquema de codificación y el tipo de señal de la trama anterior es un tipo de señal de música, también se puede determinar que el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación. De lo contrario, si el valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es menor que el primer umbral, y el esquema de codificación de parámetros IPD de la trama anterior a la trama actual es el segundo esquema de codificación o el tipo de señal de la trama anterior a la trama actual es un tipo de voz, se determina que el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación.
Además, en una implementación opcional, después de que se determina el esquema de codificación de parámetros IPD de la trama actual utilizando la implementación anterior, se puede determinar si se debe ajustar el esquema de codificación de parámetros IPD de la trama actual además basándose en los esquemas de codificación de parámetros IPD de las tramas A anteriores a la trama actual. Por ejemplo, se puede determinar si ajustar el esquema de codificación de parámetros IPD de la trama actual basándose en el esquema de codificación de parámetros IPD de la trama, dos tramas, tres tramas, cuatro tramas o cinco tramas anteriores a la trama actual. En una posible implementación, si el esquema de codificación de parámetros IPD de la trama actual es el mismo que el esquema de codificación de parámetros IPD de las tramas A anteriores, no es necesario ajustar el esquema de codificación de parámetros IPD de la trama actual. Si el esquema de codificación de parámetros IPD de la trama actual es diferente del esquema de codificación de parámetros IPD de las tramas A anteriores, se puede considerar ajustar el esquema de codificación de parámetros IPD de la trama actual. Por ejemplo, los dos tramas, tres tramas, cuatro tramas o cinco tramas anteriores a la trama actual, incluida la trama anterior a la trama actual, utilizan un mismo esquema de codificación de parámetros IPD. Además, cuando el esquema de codificación de parámetros IPD utilizado por las dos tramas, tres tramas, cuatro tramas o cinco tramas anteriores a la trama actual es diferente del esquema de codificación de parámetros IPD de la trama actual, el esquema de codificación de parámetros IPD de la trama actual se puede ajustar. Para ser específicos, el esquema de codificación de parámetros IPD de la trama actual se ajusta para que sea el mismo que el esquema de codificación de parámetros IPD de las tramas A anteriores. Ajustar el esquema de codificación de parámetros IPD de la trama actual puede garantizar que un esquema de codificación de la trama actual se mantenga coherente con el de una trama anterior hasta cierto punto, de modo que un flujo de código codificado pueda garantizar una transición suave entre la trama anterior y la trama actual durante la decodificación y la percepción auditiva es mejor.
Específicamente, en algunas implementaciones, el codificador puede extraer parámetros IPD de al menos algunas subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual cuando el esquema de codificación es el segundo esquema de codificación. Las al menos algunas subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual pueden incluir específicamente todas o algunas de las Nsubbandas subbandas obtenidas a través de la división de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual. Esto no se limita en la presente memoria. Durante una implementación específica, un usuario puede determinar, basándose en los requisitos de codificación tales como una tasa de codificación o la calidad de codificación de la codificación de señal multicanal, que un intervalo de dominio de frecuencia de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho que son de la trama actual y que se utilizan para codificar el parámetro IPD de grupo de la trama actual incluye un intervalo completo en el dominio de frecuencia de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, para ser específicos, señales en dominio de frecuencia de todas las subbandas en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, o incluye un intervalo de dominio de frecuencia específico de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, para ser específicos, señales en dominio de frecuencia de algunas tramas en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual. Las señales en dominio de frecuencia de algunas de las tramas en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual se incluyen en las señales en dominio de frecuencia de algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho.
En algunas implementaciones factibles, es posible que el codificador no extraiga primero los parámetros IPD de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual y luego Determinar el esquema de codificación de parámetros IPD de la trama actual. Si el primer esquema de codificación omite la codificación del parámetro IPD de la trama actual, los parámetros IPD de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual pueden no extraerse directamente. En algunas otras implementaciones, alternativamente, primero se puede extraer un parámetro IPD de cada una de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, y luego se determina el esquema de codificación de parámetros IPD de la trama actual.
En algunas implementaciones factibles, si el codificador determina que el intervalo de dominio de frecuencia de la señal en dominio de frecuencia de canal izquierdo y de la señal en dominio de frecuencia de canal derecho que son de la trama actual y que se utilizan para codificar el grupo de parámetros IPD de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual es un intervalo de dominio de frecuencia completo de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, se puede extraer el parámetro IPD de cada una de todas las subbandas (para ser específicos, las Nsubbandas subbandas de la trama actual) de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, se puede calcular un valor promedio de los parámetros IPD de todas las subbandas extraídas y luego el valor promedio obtenido de los parámetros IPD de todas las subbandas se usa como parámetro IPD de grupo de la trama actual. En una implementación, una fórmula para calcular el parámetro IPD de grupo de la trama actual es la siguiente:
G _ IPD =------- VlPD(b).
^ Subbanda b=0
G_IPD indica el parámetro IPD de grupo de la trama actual, e IPD(b) indica un parámetro IPD de subbanda bésima
Opcionalmente, en algunas implementaciones factibles, si el codificador determina que el intervalo de dominio de frecuencia de la señal en dominio de frecuencia de canal izquierdo y de la señal en dominio de frecuencia de canal derecho que son la trama actual y que se utilizan para codificar el grupo de parámetros IPD de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual es un intervalo de dominio de frecuencia específico de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, por ejemplo [k1, k2], para ser específicos, las señales en dominio de frecuencia entre una (k1)-ésima frecuencia y una (k2)-ésima frecuencia, se puede extraer el parámetro IPD de cada una de algunas las subbandas (para ser específicos, subbandas de las señales en dominio de frecuencia de canal izquierdo entre la (k1)-ésima frecuencia y la (k2)-ésima frecuencia) de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, se puede calcular un valor promedio de los parámetros IPD de todas las subbandas extraídas y luego el valor promedio obtenido de los parámetros IPD de todas las subbandas se usa como parámetro IPD de grupo de la trama actual.
Durante una implementación específica, los parámetros IPD de las subbandas de las señales en el dominio de la frecuencia entre la (k1)-ésima frecuencia y la (k2)-ésima frecuencia pueden predefinirse cada uno como un parámetro IPD de cada frecuencia. Para ser específicos, en este caso, el cálculo de los parámetros IPD de las subbandas puede sustituirse por el cálculo del parámetro IPD de cada frecuencia. El parámetro IPD de grupo de la trama actual se calcula utilizando el parámetro IPD de cada frecuencia como parámetro IPD de cada subbanda. Una forma de calcular el parámetro IPD de cada frecuencia una por una en un intervalo de dominio de frecuencia preestablecido [k1, k2] es la siguiente:
fPD(k) = Z L ( k ) R \ k ) , kt < k < k 2
En esta memoria, Z indica calcular un ángulo de un número complejo. L(k) indica un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal izquierdo de audio, yR'(k)indica un conjugado de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal derecho de audio.
Además, el procesamiento estadístico se puede realizar en IPD(k) en un intervalo preestablecido (una señal multitrama de una señal en dominio de frecuencia multicanal, que incluye una trama actual y tramas A anteriores a la trama actual) para obtener el parámetro IPD de grupo.
Por ejemplo, si el intervalo de dominio de frecuencia específico [k1, k2] es un intervalo de selección de cada una de las seis tramas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho, se puede calcular un valor promedio de parámetros IPD de (k2-k1 1)-ésimas frecuencias de cada trama en la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho con las seis tramas, y la fórmula de cálculo es la siguiente:
M m1Y ^ lP D ik )
&2 — 1^ ^k^ k¡
Además, se puede calcular un valor promedio de los parámetros IPD de seis tramas consecutivas, incluida la trama actual, y se utiliza como parámetro IPD de grupo de la trama actual:
MrV[°'Ii XA\-i
I r ‘ miindica un valor promedio de los parámetros IPD de la trama actual,ieDindica un valor promedio A / [-4
de los parámetros IPD de una trama anterior y adyacente a la trama actual,mindica un promedio valor de los parámetros IPD de una trama anterior y adyacente a la trama anterior y adyacente a la trama actual, y así sucesivamente.
En algunas implementaciones factibles, el segundo esquema de codificación puede ser un esquema de codificación de parámetros IPD de un conjunto de subbandas, o un esquema de codificación de parámetros IPD de subbandas. Por ejemplo, cuando un esquema de codificación de parámetros IPD de la trama actual es una manera de extracción de parámetros IPD de subbanda, se extrae un parámetro IPD de cada una de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual, y luego el parámetro IPD de la subbanda se cuantifica de cualquier forma de cuantificación. Esto no se limita específicamente.
La FIG. 6 describe un procedimiento de un método de codificación de parámetros IPD según otra realización de la presente invención. Esta realización se describe usando un ejemplo en el que un parámetro de referencia incluye: un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de una trama actual, un esquema de codificación de parámetros IPD de una trama anterior a la trama actual, y un tipo de señal de la trama anterior a la trama actual, un valor de un primer umbral es 0,75 y un valor de A es 1. Como se muestra en la FIG. 6, esta realización incluye las siguientes etapas.
S601. Obtener el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual.
Para una manera específica de obtener el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, consúltese la descripción anterior. Los detalles no se describen de nuevo en la presente memoria.
5602. Determinar si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual a 0,75. Si el valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho es inferior a 0,75, ir a la etapa S603; si el valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho es mayor o igual a 0,75, ir a la etapa S607.
5603. Obtener el esquema de codificación de parámetros IPD de la trama anterior a la trama actual.
El esquema de codificación de parámetros IPD de la trama anterior a la trama actual puede almacenarse en una memoria caché. El esquema de codificación de parámetros IPD de la trama anterior puede omitir la codificación de un parámetro IPD, o codificar parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho.
5604. Determinar si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual omite la codificación del parámetro IPD. Si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual se omite la codificación del parámetro IPD, ir a la etapa S605. Si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual no se omite la codificación del parámetro IPD, ir a la etapa S608.
5605. Obtener el tipo de señal de la trama anterior a la trama actual.
El tipo de señal de la trama anterior a la trama actual puede almacenarse en la memoria caché. El tipo de señal de la trama anterior puede ser un tipo de señal de música o un tipo de señal de voz.
5606. Determinar si el tipo de señal de la trama anterior a la trama actual es el tipo de señal de música. Si el tipo de señal de la trama anterior a la trama actual es el tipo de señal de música, ir a la etapa S607; si el tipo de señal de la trama anterior a la trama actual no es el tipo de señal de música, ir a la etapa S608.
5607. Omitir la codificación del parámetro IPD de la trama actual; para ser específicos, determinar que el esquema de codificación de parámetros IPD de la trama actual omite la codificación del parámetro IPD. Finalizar un procedimiento de procesamiento de la trama actual.
5608. Codificar los parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual. Una subbanda está en correspondencia uno a uno con un parámetro IPD de subbanda. En otras palabras, cada subbanda tiene un parámetro IPD de subbanda correspondiente.
Un proceso específico para obtener el parámetro IPD de subbanda se ha descrito anteriormente, y los detalles no se describen nuevamente en esta memoria.
Cuando los parámetros IPD de subbanda de algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho de la trama actual están codificados, los parámetros IPD de subbanda a codificar de una parte específica de las subbandas se pueden establecer en función de un requisito. Por ejemplo, se supone que hay subbandas a en total, y los valores de frecuencia de las subbandas a aumentan gradualmente desde una subband 0a a una subbanda (a-1)-ésima En una realización, sólo se pueden codificar parámetros IPD de subbanda desde la subbanda 0a a una subbanda (a-3)-ésima En otras palabras, los parámetros IPD de subbanda de dos subbandas respectivamente con la frecuencia más alta y la segunda frecuencia más alta no están codificados. En otra realización, sólo se pueden codificar parámetros IPD de subbanda desde una segunda subbanda a una subbanda (a-1)'ésima. En otras palabras, los parámetros IPD de subbanda de dos subbandas respectivamente con la frecuencia más baja y la segunda frecuencia más baja no están codificados. Ciertamente, los parámetros IPD de subbanda de cualquiera de las dos subbandas pueden alternativamente no codificarse. Puede entenderse que, en algunas realizaciones, se puede establecer una cantidad de subbandas correspondientes a parámetros IPD de subbanda codificados en función de un requisito específico. Por ejemplo, se pueden codificar los parámetros IPD de subbanda de (a-1) subbandas en las a subbandas, o se pueden codificar los parámetros IPD de subbanda de (a-2) subbandas en las a subbandas, o los parámetros IPD de subbanda de (a-3) subbandas se pueden codificar en las a subbandas, o se pueden codificar parámetros IPD de subbanda de (a-4) subbandas en las a subbandas.
Puede entenderse que una secuencia de realización para obtener las etapas S601, S603 y S605 en la FIG. 6 no está limitado. Primero se puede realizar cualquiera de las etapas de obtención S601, S603 y S605, o se pueden realizar simultáneamente las etapas de obtención S601, S603 y S605. De manera similar, la secuencia de realización para determinar las etapas S602, S604 y S606 tampoco está limitada. Primero se puede realizar cualquiera de las etapas de determinación S602, S604 y S606, o se pueden realizar simultáneamente las etapas de determinación S602, S604 y S606.
La FIG. 7 describe un procedimiento de un método de codificación de parámetros IPD según otra realización de la presente invención. Esta realización incluye las siguientes etapas:
5701. Obtener un parámetro de referencia utilizado para determinar un esquema de codificación de parámetros IPD de una trama actual de una señal multicanal.
Para un parámetro de referencia específico y una manera específica de obtener el parámetro de referencia, consúltese la descripción en la realización anterior. Los detalles no se describen de nuevo en la presente memoria.
5702. Determinar el esquema de codificación de parámetros IPD de la trama actual en función del parámetro de obtenido.
Para el esquema de codificación de parámetros IPD de la trama actual, consúltese la descripción en la realización anterior. Los detalles no se describen de nuevo en la presente memoria.
5703. Determinar si el esquema de codificación de parámetros IPD de la trama actual es el mismo que un esquema de codificación de parámetros IPD de una trama anterior a la trama actual. Si el esquema de codificación de parámetros IPD de la trama actual es el mismo que el esquema de codificación de parámetros IPD de la trama anterior a la trama actual, ir a la etapa S704. Si el esquema de codificación de parámetros IPD de la trama actual es diferente que el esquema de codificación de parámetros IPD de la trama anterior a la trama actual, ir a la etapa S705.
5704. Establecer un valor preestablecido de un contador en 0 e ir a la etapa S707.
En otras palabras, no es necesario ajustar el esquema de codificación de parámetros IPD de la trama actual.
5705. Determinar si un valor preestablecido del contador es menor que 5. Si el valor preestablecido del contador es menor que 5, ir a la etapa S706. Si el valor preestablecido del contador es mayor o igual a 5, ir a la etapa S707.
5706. Ajustar el esquema de codificación de parámetros IPD de la trama actual, y aumentar el valor preestablecido del contador en 1 e ir a la etapa<s>708.
Cuando el esquema de codificación de parámetros IPD de la trama actual es un primer esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual se ajusta a un segundo esquema de codificación. Por ejemplo, cuando el esquema de codificación de parámetros IPD de la trama actual omite codificar un parámetro IPD, el esquema de codificación de parámetros IPD de la trama actual se ajusta para codificar los parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y de la señal en dominio de frecuencia de canal derecho de la trama actual. Alternativamente, cuando el esquema de codificación de parámetros IPD de la trama actual es un segundo esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual se ajusta a un primer esquema de codificación. Por ejemplo, cuando el esquema de codificación de parámetros IPD de la trama actual es codificar parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y de la señal en dominio de frecuencia de canal derecho de la trama actual, el esquema de codificación de parámetros IPD de la trama actual se ajusta para omitir codificar un parámetro IPD.
5707. Procesar un parámetro IPD de la trama actual usando el esquema de codificación de parámetros IPD determinado de la trama actual. Finalizar un procedimiento.
5708. Procesar un parámetro IPD de la trama actual sobre la base del esquema de codificación de parámetros IPD ajustado de la trama actual.
En otra implementación de la presente invención, cuando se debe determinar si se debe ajustar el esquema de codificación de parámetros IPD de la trama actual, se pueden usar dos contadores. Una manera de procesamiento específica es la siguiente:
Cuando el esquema de codificación de parámetros IPD de la trama actual y el esquema de codificación de parámetros IPD de la trama anterior a la trama actual son ambos primeros esquemas de codificación, el valor de un primer contador se establece en 0. Si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual es el primer esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual es el segundo esquema de codificación y el valor del primer contador es menor que 5, el esquema de codificación de parámetros IPD de la trama actual se ajusta al primer esquema de codificación y el valor del primer contador se incrementa en 1. El primer esquema de codificación puede omitir la codificación del parámetro IPD y el segundo esquema de codificación puede ser codificar los parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho.
Cuando el esquema de codificación de parámetros IPD de la trama actual y el esquema de codificación de parámetros IPD de la trama anterior a la trama actual son ambos segundos esquemas de codificación, el valor de un segundo contador se establece en 0 Si el esquema de codificación de parámetros IPD de la trama anterior a la trama actual es el segundo esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación y el valor del segundo contador es menor que 5, el esquema de codificación de parámetros IPD de la trama actual se ajusta al segundo esquema de codificación y el valor del segundo contador se incrementa en 1. El primer esquema de codificación puede omitir la codificación del parámetro IPD y el segundo esquema de codificación puede estar codificando los parámetros IPD de subbanda de todas o algunas de las subbandas de la señal en dominio de frecuencia de canal izquierdo y la señal en dominio de frecuencia de canal derecho.
Puede entenderse que, si se ajusta el esquema de codificación de parámetros IPD de la trama actual, el esquema de codificación de parámetros IPD ajustado de la trama actual se almacena en caché. En otras palabras, cuando se va a determinar un esquema de codificación de parámetros IPD de una trama después de la trama actual, se hace referencia al esquema de codificación de parámetros IPD ajustado de la trama actual.
La FIG. 8 es un diagrama estructural esquemático de una realización de un aparato de codificación de parámetros IPD 800 según una realización de la presente invención. El aparato de codificación de parámetros IPD 800 incluye:
una unidad de obtención 801, configurada para obtener un parámetro de referencia, donde el parámetro de referencia se usa para determinar un esquema de codificación de parámetros IPD de una trama actual de una señal multicanal, y
para un parámetro de referencia específico y un parámetro de obtención específico del parámetro de referencia, se puede hacer referencia a la descripción en la realización anterior, y los detalles no se describen en esta memoria nuevamente;
una unidad de determinación 802, configurada para determinar un esquema de codificación de parámetros IPD de la trama actual basándose en el parámetro de referencia obtenido por la unidad de obtención 801, donde el esquema de codificación de parámetros IPD determinado de la trama actual es una de al menos dos esquemas de codificación de parámetros IPD preestablecidos, y
para determinar el esquema de codificación de parámetros IPD de la trama actual, se puede hacer referencia específicamente a la descripción en una parte de realización de método, para esquemas de codificación específicos de al menos dos esquemas de codificación de parámetros IPD preestablecidos, también se puede hacer referencia a la descripción en la parte de realización de método y los detalles no se describen nuevamente en esta memoria; y
una unidad de procesamiento 803, configurada para procesar un parámetro IPD de la trama actual basándose en el esquema de codificación de parámetros IPD que es de la trama actual y que es determinado por la unidad de determinación 802.
Para un proceso de procesamiento específico, consúltese la descripción en la parte de realización de método. Los detalles no se describen de nuevo en la presente memoria.
En otra realización de la presente invención, la unidad de determinación 802 puede configurarse además para determinar si es necesario ajustar el esquema de codificación de parámetros IPD determinado de la trama actual. En este caso, como se muestra en la FIG. 8, el aparato de codificación de parámetros IPD 800 puede incluir además una unidad de ajuste 804, configurada para ajustar el esquema de codificación de parámetros IPD determinado de la trama actual cuando la unidad de determinación 802 determina que el esquema de codificación de parámetros IPD determinado de la trama actual necesita ajustarse. En consecuencia, la unidad de procesamiento 803 se configura específicamente para procesar el parámetro IPD de la trama actual basándose en el esquema de codificación de parámetros IPD ajustado de la trama actual. Para saber cómo determinar si es necesario ajustar el esquema de codificación de parámetros IPD determinado de la trama actual y cómo ajustar el esquema de codificación de parámetros IPD de la trama actual, consúltese la descripción en la realización del método. Los detalles no se describen de nuevo en la presente memoria.
Como se muestra en la FIG. 8, en otra realización de la presente invención, el aparato de codificación de parámetros IPD 800 puede incluir además una unidad de codificación 805, configurada para codificar el esquema de codificación de parámetros IPD que es de la trama actual y que es determinado por la unidad de determinación 802. Por ejemplo, se puede establecer un bit de marcador de esquema de codificación, y el bit de marcador ocupa un bit, para indicar si el esquema de codificación de parámetros IPD de la trama actual es un primer esquema de codificación o un segundo esquema de codificación. De esta manera, un decodificador puede determinar el esquema de codificación de parámetros IPD de la trama actual basándose en el bit de marcador de esquema de codificación, para realizar la decodificación utilizando una forma de decodificación correspondiente. Puede entenderse que, en algunas implementaciones, la unidad de codificación 805 y la unidad de procesamiento 803 pueden ser una unidad lógica.
La FIG. 9 describe una estructura de un terminal según una realización de la presente invención. El terminal puede ser un dispositivo portable, un dispositivo VR, un dispositivo AR, un teléfono móvil, una tableta, una ordenador portátil, una PC o similares. Como se muestra en la FIG. 9, el terminal proporcionado en esta realización de la presente invención incluye una interfaz de red 910 (como se muestra en un cuadro de línea de puntos en la FIG. 9). La interfaz de red 910 se configura para enviar y recibir datos. Por ejemplo, cuando el terminal sirve como codificador, los datos enviados incluyen una señal multicanal (transportada en un flujo de código) codificada por el terminal. Cuando se codifica un parámetro IPD, los datos enviados incluyen además el parámetro IPD (el parámetro IPD también se transporta en el flujo de código y puede usarse como parte de la señal multicanal). Cuando el terminal sirve como decodificador, los datos recibidos incluyen un flujo de código que transporta la señal multicanal. Cuando el codificador codifica el parámetro IPD, los datos recibidos pueden incluir además el parámetro IPD. Una forma específica de la interfaz de red 910 puede ser variada y puede ser específicamente diferente en función de una forma específica del terminal y diferentes escenarios de aplicación. La FIG. 9 muestra tres ejemplos. Un primer ejemplo es un módulo de acceso a la red celular que incluye un transceptor de radiofrecuencia (Transceptor RF) 901 y un módem (Módem) 902. El módulo de acceso a la red celular se configura para acceder a una red de comunicaciones móviles proporcionada por un operador móvil, tal como 2G (2.a generación), 3G (3.a generación), 4G (4.a generación), Para ser específicos, una red de evolución a largo plazo (LTE: Long Term Evolution), red futura 5G (5.a generación) o 6G (6.a generación), o similares. Un segundo ejemplo es un módulo de fidelidad inalámbrica (WiFi: Wireless Fidelity) 903, configurado para acceder a una red accediendo a un punto de acceso (AP: Access Point). Un tercer ejemplo es un adaptador de red Ethernet 904, configurado para acceder a la red mediante el uso de un cable de par trenzado o una fibra óptica. Cabe señalar que no es necesario que el terminal incluya las tres interfaces de red anteriores, y puede incluir solo al menos uno de los tres terminales de interfaz de red anteriores, de modo que el terminal pueda acceder a la red. Además, una interfaz de red incluida en el terminal puede no ser uno de los tres tipos anteriores; por ejemplo, puede ser una interfaz Bluetooth o un módem. Por lo tanto, una forma específica de la interfaz de red 910 no está limitada en esta realización de la presente invención, y la implementación de esta realización de la presente invención no se ve afectada siempre que el terminal pueda acceder a la red a través de la interfaz de red 910.
Como se muestra en la FIG. 9, el terminal puede incluir además un micrófono 905, configurado para recoger una señal multicanal. Se puede incorporar un convertidor analógico a digital en el micrófono 905. Por lo tanto, el micrófono puede convertir una señal multicanal recopilada en forma de señal analógica en una señal multicanal en forma de señal digital. Naturalmente, alternativamente no se puede incorporar ningún convertidor analógico-digital en el micrófono 905. En este caso, el terminal necesita además incluir un convertidor analógico a digital, para realizar la conversión analógico a digital en una señal multicanal en una forma de señal analógica recogida por el micrófono 905 y obtener una señal multicanal en una forma de señal digital. Puede haber uno, dos, tres o más micrófonos 905. Una cantidad específica de micrófonos 905 no se limita en esta realización de la presente invención. Puede entenderse que el terminal puede, alternativamente, recoger la señal multicanal utilizando un micrófono externo. En este caso, el terminal necesita incluir una interfaz de adaptación del micrófono externo, para facilitar la inserción del micrófono externo y luego implementar el intercambio de datos entre el terminal y el micrófono externo.
Como se muestra en la FIG. 9, el terminal puede incluir además un altavoz 906, configurado para reproducir una señal multicanal obtenida mediante decodificación por parte del terminal. Si un flujo de bits que incluye la señal multicanal y que es recibido por el terminal incluye un parámetro IPD, este proceso de decodificación puede realizarse basándose en el parámetro IPD. Puede incorporarse un convertidor de digital a analógico en el altavoz 906. En otras palabras, el terminal puede enviar una señal multicanal en forma de señal digital al altavoz 906, y el altavoz 906 realiza una conversión de analógico a digital en la señal multicanal en forma de señal digital, para convertir la señal multicanal en forma de señal digital y reproduce una señal multicanal en forma de señal analógica.
Ciertamente, alternativamente puede no incorporarse ningún convertidor digital-analógico en el altavoz 906. En este caso, el terminal necesita incluir un convertidor analógico a digital para convertir la señal multicanal en forma de señal digital en la señal multicanal en forma de señal analógica, y envía la señal multicanal en forma de señal analógica al altavoz 906 para su reproducción. Puede haber uno, dos, tres o más altavoces 906. Una cantidad de altavoces 906 no se limita en esta realización de la presente invención. Puede entenderse que el terminal puede reproducir alternativamente la señal multicanal utilizando un altavoz externo. En este caso, el terminal necesita incluir una interfaz de adaptación del altavoz externo, para facilitar la inserción del altavoz externo y luego implementar el intercambio de datos con el altavoz externo.
Como se muestra en la FIG. 9, el terminal incluye además un procesador 908 y una memoria 909. La memoria 909 se configura para almacenar código ejecutable por el procesador, y el procesador 908 se configura para ejecutar el código almacenado en la memoria 909, para implementar el método descrito en las realizaciones de método anteriores.
Como se muestra en la FIG. 9, la terminal incluye además un bus 907. El intercambio de datos entre los componentes anteriores, tales como la interfaz de red 910, el micrófono 905, el altavoz 906, el procesador 908 y la memoria 909, se puede realizar utilizando el bus 907. Puede entenderse que la FIG. 9 simplemente describe un ejemplo de la estructura del terminal. Algunas relaciones de conexión en la estructura se simplifican. Durante la aplicación real, es posible que componentes tales como la interfaz de red 910, el micrófono 905 o el altavoz 906 no estén conectados directamente al bus 907. En otras palabras, es posible que el intercambio de datos entre los componentes tales como la interfaz de red 910, el micrófono 905 o el altavoz 906 deba pasar a través de otro componente.
En algunas implementaciones, el procesador 908 y la memoria 909 pueden tener además una interfaz de intercambio de datos. El intercambio de datos entre el procesador 908 y la memoria 909 se puede realizar directamente a través de la interfaz de intercambio de datos, y no es necesario pasar a través del bus 907, para mejorar la eficiencia del intercambio de datos entre el procesador 908 y la memoria 909.
En algunas implementaciones, el procesador 908 y la memoria 909 pueden ser un procesador y una memoria en un procesador de señales digitales (DSP: Digital Signal Processor). En otras palabras, tanto el procesador 908 como la memoria 909 se encapsulan en el DSP. En este caso, el intercambio de datos entre el procesador 908 y la memoria 909 se puede realizar a través de una interfaz de intercambio de datos dentro del DSP. Además, debido a que tanto el procesador 908 como la memoria 909 se encapsulan en el DSP, el procesador 908 y la memoria 909 pueden intercambiar datos con otro componente a través de una interfaz de intercambio de datos entre el DSP y el bus 907.
Una realización de la presente invención proporciona adicionalmente un programa informático. Cuando se ejecuta el programa informático, se puede ejecutar un procedimiento de cualquiera de las realizaciones del método anterior.
Una realización de la presente invención proporciona adicionalmente un soporte de almacenamiento. El soporte de almacenamiento almacena código ejecutable, y cuando se ejecuta el código ejecutable, se puede ejecutar un procedimiento en cualquiera de las realizaciones de métodos anteriores.
Un experto en la técnica puede entender que todos o algunos de los procedimientos del método en las realizaciones pueden implementarse mediante un programa informático que le dé indicaciones a un hardware relevante. El programa puede almacenarse en un soporte de almacenamiento legible por ordenador. Cuando se ejecuta el programa, se incluyen los procedimientos del método en las realizaciones. El soporte de almacenamiento puede incluir: un disco magnético, un disco óptico, una memoria de solo lectura (Read-Only Memory, ROM) una memoria de acceso aleatorio (Random Access Memory, RAM), o similares.
En la memoria descriptiva, las reivindicaciones y los dibujos adjuntos de la presente invención, los términos "primero", "segundo", "tercero", "cuarto", y similares pretenden distinguir entre diferentes objetos, pero no indican un orden específico. Además, los términos "incluir", "tener", y cualquier otra variante de los mismos, están destinados a cubrir una inclusión no exclusiva. Por ejemplo, un procedimiento, un sistema, un producto o un dispositivo que incluye una serie de etapas o unidades no se limita a las etapas o unidades enumeradas, sino que opcionalmente incluye además una etapa o unidad no enumeradas, u opcionalmente incluye además otra etapa o unidad inherente del proceso, método, sistema, producto o dispositivo.
Lo que se describe anteriormente son simplemente realizaciones de ejemplo de la presente invención, y ciertamente no pretende limitar el alcance de protección de la presente invención. Por lo tanto, las variaciones realizadas según las reivindicaciones de la presente invención estarán dentro del alcance de la presente invención.
Claims (10)
- REIVINDICACIONES 1. Un método de codificación de parámetros de diferencia de fase entre canales, que comprende: obtener (S501) un parámetro de referencia utilizado para determinar una diferencia de fase entre canales, IPD, esquema de codificación de parámetros de una trama actual de una señal multicanal; determinar (S502) el esquema de codificación de parámetros IPD de la trama actual sobre la base del parámetro de referencia, en donde el esquema de codificación de parámetros IPD determinado de la trama actual es uno de al menos dos esquemas de codificación de parámetros IPD preestablecidos; y procesar (S503) un parámetro IPD de la trama actual sobre la base del esquema de codificación de parámetros IPD determinado de la trama actual, en donde el parámetro de referencia comprende al menos uno de un parámetro característico de señal de la trama actual y parámetros característicos de señal de tramas A anteriores a la trama actual, en donde A es un número entero no menor que 1; el parámetro característico de señal de la trama actual comprende al menos uno de un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, una varianza de los parámetros IPD de subbanda de la trama actual, un tipo de señal de la trama actual, y el parámetro ITD de diferencia de tiempo intercanal de la trama actual; y los parámetros característicos de señal de las tramas A anteriores a la trama actual comprenden al menos uno de un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de cada una de las tramas A anteriores, una varianza de los parámetros IPD de subbanda de cada una de las tramas A anteriores, un parámetro ITD de cada una de las tramas A anteriores, un esquema de codificación de parámetros IPD de cada una de las tramas A anteriores, y un tipo de señal de cada una de las tramas A anteriores, en donde el tipo de señal comprende un tipo de voz o un tipo de música; caracterizado por que el parámetro de referencia comprende el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual; y Si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual que el primer umbral, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación en los al menos dos esquemas de codificación de parámetros IPD; en donde el parámetro de referencia comprende el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores y el tipo de señal de cada una de las tramas A anteriores; y si el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores es el primer esquema de codificación en los al menos dos esquemas de codificación de parámetros IPD, y el tipo de señal de cada una de las tramas A anteriores es un tipo de música, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación.
- 2. El método según la reivindicación 1, en donde el primer umbral es 0,75.
- 3. El método según cualquiera de las reivindicaciones 1 a 2, en donde el primer esquema de codificación comprende cualquiera de las siguientes maneras: un esquema de codificación de parámetros IPD de grupo; omitir la codificación de un parámetro IPD; o establecer un valor de un parámetro IPD en 0.
- 4. El método según cualquiera de las reivindicaciones 1 a 3, en donde si el esquema de codificación de parámetros IPD de la trama actual no es el primer esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual es un segundo esquema de codificación, en donde el segundo esquema de codificación comprende un esquema de codificación de parámetros IPD de un conjunto de subbandas, o un esquema de codificación de parámetros IPD de subbanda, y el esquema de codificación de parámetros IPD de subbanda codifica parámetros IPD de subbanda de algunas o todas las subbandas de la trama actual.
- 5. El método según cualquiera de las reivindicaciones 1 a 4, en donde el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual se obtiene utilizando la siguiente fórmula de cálculo:en donde E(b)indica una suma de energía de un canal izquierdo de audio,Er(b)indica una suma de energía de un canal de audio derecho,L(k)indica una parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal izquierdo de audio,Rr(k)indica un parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal derecho de audio,L(k)indica una parte imaginaria del k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal izquierdo de audio,R(k)indica un valor imaginario parte del k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal derecho de audio, L indica una cantidad de coeficientes espectrales de subbanda, y N indica una cantidad de subbandas, n indica un valor de índice de una señal en el dominio de tiempo, k indica un valor de índice de una señal en el dominio de la frecuencia,Longitudindica la longitud de la trama,XL(n)indica una señal en el dominio de tiempo de canal izquierdo de audio,XR(n)indica una señal en el dominio de tiempo del canal derecho de audio, L(k) indica un k-ésimo valor de frecuencia que es de la señal en dominio de frecuencia de canal izquierdo de audio y que se usa para calcular el parámetro IPD, yR(k) indica un k-ésimo valor de frecuencia que es de la señal en dominio de frecuencia de canal derecho de audio y que se usa para calcular el Parámetro IPD, dondeXL(n)yXR(n)indican secuencias de números reales.
- 6. Un aparato de codificación de parámetros de diferencia de fase entre canales (800), que comprende: una unidad de obtención (801), configurada para obtener un parámetro de referencia, en donde el parámetro de referencia se usa para determinar un esquema de codificación de parámetros de diferencia de fase de entre canales, IPD, de una trama actual de una señal multicanal; una unidad de determinación (802), configurada para determinar el esquema de codificación de parámetros IPD de la trama actual basándose en el parámetro de referencia, en donde el esquema de codificación de parámetros IPD determinado de la trama actual es una de al menos dos esquemas de codificación de parámetros IPD preestablecidos, y una unidad de procesamiento (803), configurada para procesar un parámetro IPD de la trama actual sobre la base del esquema de codificación de parámetros IPD determinado de la trama actual. en donde el parámetro de referencia comprende al menos uno de un parámetro característico de señal de la trama actual y parámetros característicos de señal de tramas A anteriores a la trama actual, en donde A es un número entero no menor que 1; el parámetro característico de señal de la trama actual comprende al menos uno de un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual, una varianza de los parámetros IPD de subbanda de la trama actual, un tipo de señal de la trama actual, y el parámetro ITD de diferencia de tiempo entre canales de la trama actual; y los parámetros característicos de señal de las tramas A anteriores a la trama actual comprenden al menos uno de un parámetro que indica la correlación entre el canal izquierdo y el canal derecho de cada una de las tramas A anteriores, una varianza de los parámetros IPD de subbanda de cada una de las tramas A anteriores, un parámetro ITD de cada una de las tramas A anteriores, un esquema de codificación de parámetros IPD de cada una de las tramas A anteriores, y un tipo de señal de cada una de las tramas A anteriores, en donde el tipo de señal comprende un tipo de voz o un tipo de música; caracterizado por que el parámetro de referencia comprende el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual; y si un valor del parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual es mayor o igual que el primer umbral, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación en los al menos dos esquemas de codificación de parámetros IPD; en donde el parámetro de referencia comprende el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores y el tipo de señal de cada una de las tramas A anteriores; y si el esquema de codificación de parámetros IPD de cada una de las tramas A anteriores es el primer esquema de codificación en los al menos dos esquemas de codificación de parámetros IPD, y el tipo de señal de cada una de las tramas A anteriores es un tipo de música, el esquema de codificación de parámetros IPD de la trama actual es el primer esquema de codificación.
- 7. El aparato según la reivindicación 6, en donde el primer umbral es 0,75.
- 8. El aparato según cualquiera de las reivindicaciones 6-7, en donde el primer esquema de codificación comprende cualquiera de las siguientes maneras: un esquema de codificación de parámetros IPD de grupo; omitir la codificación de un parámetro IPD; o establecer un valor de un parámetro IPD en 0.
- 9. El aparato según cualquiera de las reivindicaciones 6 a 8, en donde si el esquema de codificación de parámetros IPD de la trama actual no es el primer esquema de codificación, el esquema de codificación de parámetros IPD de la trama actual es un segundo esquema de codificación, en donde el segundo esquema de codificación comprende un esquema de codificación de parámetros IPD de un conjunto de subbandas, o un esquema de codificación de parámetros IPD de subbanda, y el esquema de codificación de parámetros IPD de subbanda codifica parámetros IPD de subbanda de algunas o todas las subbandas de la trama actual.
- 10. El aparato según cualquiera de las reivindicaciones 6 a 9, en donde la unidad de obtención se configura específicamente para obtener, usando la siguiente fórmula de cálculo, el parámetro que indica la correlación entre el canal izquierdo y el canal derecho de la trama actual: dondeen donde E(b)indica una suma de energía de un canal izquierdo de audio,Er(b)indica una suma de energía de un canal de audio derecho,L(k)indica una parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal izquierdo de audio,Rr(k)indica un parte real de un k-ésimo valor de frecuencia de una señal en dominio de frecuencia de canal derecho de audio,L(k)indica una parte imaginaria del k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal izquierdo de audio,R(k)indica un valor imaginario parte del k-ésimo valor de frecuencia de la señal en dominio de frecuencia de canal derecho de audio, L indica una cantidad de coeficientes espectrales de subbanda, y N indica una cantidad de subbandas, n indica un valor de índice de una señal en el dominio de tiempo, k indica un valor de índice de una señal en el dominio de la frecuencia,Longitudindica la longitud de la trama,XL(n)indica una señal en el dominio de tiempo de canal izquierdo de audio,XR(n)indica una señal en el dominio de tiempo del canal derecho de audio, L(k) indica un k-ésimo valor de frecuencia que es de la señal en dominio de frecuencia de canal izquierdo de audio y que se usa para calcular el parámetro IPD, yR(k) indica un k-ésimo valor de frecuencia que es de la señal en dominio de frecuencia de canal derecho de audio y que se usa para calcular el Parámetro IPD, dondeXL(n)yXR(n)indican secuencias de números reales.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710524352.0A CN109215668B (zh) | 2017-06-30 | 2017-06-30 | 一种声道间相位差参数的编码方法及装置 |
| PCT/CN2018/085756 WO2019001142A1 (zh) | 2017-06-30 | 2018-05-05 | 一种声道间相位差参数的编码方法及装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2979342T3 true ES2979342T3 (es) | 2024-09-25 |
Family
ID=64741065
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18823145T Active ES2979342T3 (es) | 2017-06-30 | 2018-05-05 | Método y dispositivo de codificación de parámetros de diferencia de fase entre canales |
Country Status (10)
| Country | Link |
|---|---|
| US (5) | US11031021B2 (es) |
| EP (2) | EP3637415B1 (es) |
| JP (4) | JP7080262B2 (es) |
| KR (5) | KR102554892B1 (es) |
| CN (1) | CN109215668B (es) |
| BR (1) | BR112019028256A2 (es) |
| ES (1) | ES2979342T3 (es) |
| RU (1) | RU2769789C2 (es) |
| SG (1) | SG11201913610VA (es) |
| WO (1) | WO2019001142A1 (es) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109215668B (zh) | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | 一种声道间相位差参数的编码方法及装置 |
| JP7396459B2 (ja) * | 2020-03-09 | 2023-12-12 | 日本電信電話株式会社 | 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体 |
| CN115881140B (zh) * | 2021-09-29 | 2025-09-26 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
| US20250024216A1 (en) * | 2021-12-03 | 2025-01-16 | Beijing Xiaomi Mobile Software Co., Ltd. | Stereo audio signal processing method, encoding device, and storage medium |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
| TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
| EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
| KR101108060B1 (ko) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
| EP2169664A3 (en) * | 2008-09-25 | 2010-04-07 | LG Electronics Inc. | A method and an apparatus for processing a signal |
| US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
| GB2470059A (en) * | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
| US9112591B2 (en) * | 2010-04-16 | 2015-08-18 | Samsung Electronics Co., Ltd. | Apparatus for encoding/decoding multichannel signal and method thereof |
| CN104246873B (zh) * | 2012-02-17 | 2017-02-01 | 华为技术有限公司 | 用于编码多声道音频信号的参数编码器 |
| ES2540215T3 (es) * | 2012-04-05 | 2015-07-09 | Huawei Technologies Co., Ltd. | Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial |
| ES2571742T3 (es) * | 2012-04-05 | 2016-05-26 | Huawei Tech Co Ltd | Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal |
| WO2013149671A1 (en) * | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
| US9536540B2 (en) * | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
| CN104681029B (zh) * | 2013-11-29 | 2018-06-05 | 华为技术有限公司 | 立体声相位参数的编码方法及装置 |
| CN107452387B (zh) * | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | 一种声道间相位差参数的提取方法及装置 |
| US10217467B2 (en) * | 2016-06-20 | 2019-02-26 | Qualcomm Incorporated | Encoding and decoding of interchannel phase differences between audio signals |
| CN109215668B (zh) * | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | 一种声道间相位差参数的编码方法及装置 |
-
2017
- 2017-06-30 CN CN201710524352.0A patent/CN109215668B/zh active Active
-
2018
- 2018-05-05 KR KR1020227025384A patent/KR102554892B1/ko active Active
- 2018-05-05 KR KR1020237023244A patent/KR102697288B1/ko active Active
- 2018-05-05 KR KR1020247027520A patent/KR20240130819A/ko active Pending
- 2018-05-05 EP EP18823145.0A patent/EP3637415B1/en active Active
- 2018-05-05 EP EP24156328.7A patent/EP4390920B1/en active Active
- 2018-05-05 SG SG11201913610VA patent/SG11201913610VA/en unknown
- 2018-05-05 RU RU2020103799A patent/RU2769789C2/ru active
- 2018-05-05 JP JP2019572587A patent/JP7080262B2/ja active Active
- 2018-05-05 ES ES18823145T patent/ES2979342T3/es active Active
- 2018-05-05 KR KR1020217028047A patent/KR102425236B1/ko active Active
- 2018-05-05 BR BR112019028256-4A patent/BR112019028256A2/pt unknown
- 2018-05-05 WO PCT/CN2018/085756 patent/WO2019001142A1/zh not_active Ceased
- 2018-05-05 KR KR1020207001994A patent/KR102299916B1/ko active Active
-
2019
- 2019-12-20 US US16/723,449 patent/US11031021B2/en active Active
-
2021
- 2021-05-13 US US17/319,353 patent/US11568882B2/en active Active
-
2022
- 2022-03-18 JP JP2022044026A patent/JP7439152B2/ja active Active
- 2022-12-21 US US18/069,573 patent/US12067993B2/en active Active
-
2024
- 2024-02-14 JP JP2024020494A patent/JP7741217B2/ja active Active
- 2024-07-03 US US18/763,087 patent/US12387732B2/en active Active
-
2025
- 2025-07-14 US US19/268,726 patent/US20250391416A1/en active Pending
- 2025-09-03 JP JP2025146258A patent/JP2025168499A/ja active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12067993B2 (en) | Inter-channel phase difference parameter encoding method and apparatus | |
| JP7612987B2 (ja) | オーディオの符号化及び復号方法及び装置 | |
| ES3035269T3 (en) | Stereo signal encoding method and device | |
| GB2590651A (en) | Combining of spatial audio parameters | |
| EP4014234A1 (en) | Quantization of spatial audio direction parameters | |
| ES2836682T3 (es) | Método y dispositivo para extraer parámetro de diferencia de fase entre canales | |
| EP4131261A1 (en) | Audio signal encoding method, decoding method, encoding device, and decoding device | |
| US12488803B2 (en) | Method and system for encoding and wirelessly transmitting stereo audio content for audio communication | |
| BR122025011908A2 (pt) | Método de codificação de parâmetro de diferença de fase entre canais, terminal e meio de armazenamento | |
| EP4539045A1 (en) | Audio encoding and decoding method and apparatus, storage medium, and computer program product | |
| US11729570B2 (en) | Spatial audio monauralization via data exchange | |
| EP4294047A1 (en) | Hoa coefficient acquisition method and apparatus |