ES2963219T3 - Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo - Google Patents

Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo Download PDF

Info

Publication number
ES2963219T3
ES2963219T3 ES19825743T ES19825743T ES2963219T3 ES 2963219 T3 ES2963219 T3 ES 2963219T3 ES 19825743 T ES19825743 T ES 19825743T ES 19825743 T ES19825743 T ES 19825743T ES 2963219 T3 ES2963219 T3 ES 2963219T3
Authority
ES
Spain
Prior art keywords
channel signal
lsf parameter
lsf
parameter
primary channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19825743T
Other languages
English (en)
Inventor
Eyal Shlomot
Jonathan Alastair Gibbs
Haiting Li
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2963219T3 publication Critical patent/ES2963219T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Se proporcionan un método y aparato de codificación de señal estéreo y un método y aparato de decodificación. El método de codificación comprende: realizar la dispersión del espectro en un parámetro LSF cuantificado de una señal del canal primario de un cuadro actual en una señal estéreo para obtener el parámetro LSF de la señal del canal primario después de la dispersión del espectro (S510); determinar el residuo de predicción de un parámetro LSF de una señal de canal secundario de acuerdo con un parámetro LSF original de la señal de canal secundario de la trama actual y el parámetro LSF de la señal de canal primario después de la expansión del espectro (S520); y realizar codificación de cuantificación en el residuo de predicción del parámetro LSF de la señal del canal secundario (S530). El método y aparato de codificación y decodificación facilitan una reducción en el número de bits en la codificación. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo
Esta solicitud reivindica prioridad a la solicitud de patente china n.° 201810701919.1, presentada ante la Oficina de Patentes de China el 29 de junio de 2018 y titulada "STEREO SIGNAL ENCODING METHOD AND APPARATUS, AND STEREO SIGNAL DECODING METHOD AND APPARATUS".
Campo técnico
Esta solicitud se refiere al campo del audio, y más específicamente, a un método y aparato de codificación de señales estéreo, y a un método y aparato de decodificación de señales estéreo.
Antecedentes
En un método de codificación/decodificación estéreo en el dominio del tiempo, un lado del codificador primero realiza una estimación de la diferencia de tiempo entre canales en una señal estéreo, realiza una alineación temporal basándose en un resultado de estimación, luego realiza una mezcla descendente en el dominio del tiempo en una señal alineada en el tiempo, y finalmente codifica por separado una señal del canal primario y una señal del canal secundario que se obtienen después de la mezcla descendente, para obtener un flujo de bits codificado.
Codificar la señal del canal primario y la señal del canal secundario puede incluir: determinar un coeficiente de predicción lineal (coeficiente de predicción lineal, LPC) de la señal del canal primario y un LPC de la señal del canal secundario, convertir respectivamente el LPC de la señal del canal primario y el LPC de la señal del canal secundario en un parámetro LSF de la señal del canal primario y un parámetro LSF de la señal del canal secundario, y luego realizar la cuantificación en el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario.
Un proceso de realizar una cuantificación en el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario puede incluir: cuantificar un parámetro LSF original de la señal del canal primario para obtener un parámetro LSF cuantificado de la señal del canal primario; realizar la determinación de reutilización basándose en una distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario, y si la distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario es mayor que o igual a un umbral, determinar que el parámetro LSF de la señal del canal secundario no cumple una condición de reutilización, y es necesario cuantificar un parámetro LSF original de la señal del canal secundario para obtener un parámetro LSF cuantificado de la señal del canal secundario; y escribir el parámetro LSF cuantificado de la señal del canal primario y el parámetro LSF cuantificado de la señal del canal secundario en el flujo de bits. Si la distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario es menor que el umbral, solo el parámetro LSF cuantificado de la señal del canal primario se escribe en el flujo de bits. En este caso, el parámetro LSF cuantificado de la señal del canal primario puede usarse como el parámetro LSF cuantificado de la señal del canal secundario.
En este proceso de codificación, si el parámetro LSF de la señal del canal secundario no cumple la condición de reutilización, tanto el parámetro LSF cuantificado de la señal del canal primario como el parámetro LSF cuantificado de la señal del canal secundario deben escribirse en el flujo de bits. Por lo tanto, se requiere una cantidad relativamente grande de bits para la codificación.
Además, la solicitud de patente de Estados Unidos US 2013/0223633 A1 describe un dispositivo de codificación de señales estéreo que permite una tasa de bits más baja sin disminuir la calidad cuando se aplica una técnica de transmisión intermitente a una señal estéreo. Además, el artículo "Delayed Decision Switched Prediction Multi-Stage LSF Quantization" de E. Shlomot (XP010269475) describe un esquema combinado de predicción conmutada lineal y cuantificación vectorial de múltiples etapas para el conjunto de frecuencias espectrales de líneas.
Además, la solicitud de patente internacional WO 2017/049399 A1 describe un método y un sistema de decodificación de sonido estéreo que decodifica los canales izquierdo y derecho de una señal de sonido estéreo.
Compendio
Esta solicitud proporciona un método y aparato de codificación de señales estéreo, y un método y aparato de decodificación de señales estéreo, para ayudar a reducir una cantidad de bits necesarios para la codificación cuando un parámetro LSF de una señal del canal secundario no cumple una condición de reutilización.
Breve descripción de los dibujos
La FIG. 1 es un diagrama estructural esquemático de un sistema de codificación y decodificación estéreo en el dominio del tiempo según una realización de esta solicitud;
La FIG. 2 es un diagrama esquemático de un terminal móvil según una realización de esta solicitud;
La FIG. 3 es un diagrama esquemático de un elemento de red según una realización de la esta solicitud; La FIG. 4 es un diagrama de flujo esquemático de un método para realizar la cuantificación de un parámetro LSF de una señal del canal primario y un parámetro LSF de una señal del canal secundario;
La FIG. 5 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 6 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 7 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 8 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 9 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 10 es un diagrama de flujo esquemático de un método de decodificación de señales estéreo según una realización de esta solicitud;
La FIG. 11 es un diagrama estructural esquemático de un aparato de codificación de señales estéreo según una realización de esta solicitud;
La FIG. 12 es un diagrama estructural esquemático de un dispositivo de decodificación de señales de audio según una realización de esta solicitud;
La FIG. 13 es un diagrama estructural esquemático de un aparato de codificación de señales de audio según una realización de esta solicitud;
La FIG. 14 es un diagrama estructural esquemático de un aparato de decodificación de señales estéreo según otra realización de esta solicitud; y
La FIG. 15 es un diagrama esquemático de envolventes espectrales de predicción lineal de una señal del canal primario y una señal del canal secundario.
Descripción de las realizaciones
La FIG. 1 es un diagrama estructural esquemático de un sistema de codificación y decodificación estéreo en el dominio del tiempo según una realización de ejemplo esta solicitud. El sistema de codificación y decodificación estéreo incluye un componente 110 de codificación y un componente 120 de decodificación. Debe entenderse que una señal estéreo en esta solicitud puede ser una señal estéreo original, puede ser una señal estéreo que incluye dos señales incluidas en señales en una pluralidad de canales, o puede ser una señal estéreo que incluye dos señales generadas conjuntamente de una pluralidad de señales incluidas en una pluralidad de canales.
El componente 110 de codificación está configurado para codificar la señal estéreo en el dominio del tiempo. Opcionalmente, el componente 110 de codificación se puede implementar en forma de software, hardware o una combinación de software y hardware. Esto no se limita en las realizaciones de esta solicitud.
Que el componente 110 de codificación codifique la señal estéreo en el dominio del tiempo puede incluir las siguientes etapas.
(1) Realizar un preprocesamiento en el dominio del tiempo en la señal estéreo obtenida para obtener una señal del canal izquierdo preprocesada en el dominio del tiempo y una señal del canal derecho preprocesada en el dominio del tiempo.
La señal estéreo puede ser recogida por un componente de recogida y enviada al componente 110 de codificación. Opcionalmente, el componente de recogida y el componente 110 de codificación pueden estar dispuestos en un mismo dispositivo. Alternativamente, el componente de recogida y el componente 110 de codificación pueden estar dispuestos en diferentes dispositivos.
La señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo son señales en dos canales en una señal estéreo preprocesada.
Opcionalmente, el preprocesamiento en el dominio del tiempo puede incluir al menos uno de procesamiento de filtrado de paso alto, procesamiento de preénfasis, conversión de frecuencia de muestreo y conmutación de canal. Esto no se limita en las realizaciones de esta solicitud.
(2) Realizar una estimación de tiempo basándose en la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo, para obtener una diferencia de tiempo entre canales entre la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo.
Por ejemplo, una función de correlación cruzada entre una señal del canal izquierdo y una señal del canal derecho se puede calcular basándose en la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo. Luego, se busca un valor máximo de la función de correlación cruzada, y el valor máximo se usa como la diferencia de tiempo entre canales entre la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo.
En otro ejemplo, se puede calcular una función de correlación cruzada entre una señal del canal izquierdo y una señal del canal derecho basándose en la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo. Luego, se realiza un suavizado de larga duración en una función de correlación cruzada entre una señal del canal izquierdo y una señal del canal derecho en una trama actual basándose en una función de correlación cruzada entre una señal del canal izquierdo y una señal del canal derecho en cada una de las L tramas anteriores (L es un número entero mayor o igual a 1) de la trama actual, para obtener una función de correlación cruzada suavizada. Posteriormente, se busca un valor máximo de la función de correlación cruzada suavizada y se usa un valor de índice correspondiente al valor máximo como una diferencia de tiempo entre canales entre una señal del canal izquierdo preprocesada en el dominio del tiempo y una señal del canal derecho preprocesada en el dominio del tiempo en la trama actual.
En otro ejemplo, el suavizado entre tramas puede realizarse sobre una diferencia de tiempo entre canales estimada en una trama actual basándose en diferencias de tiempo entre canales en M tramas anteriores (M es un número entero mayor o igual a 1) de la trama actual, y una diferencia de tiempo entre canales suavizada se usa como diferencia de tiempo entre canales final entre una señal del canal izquierdo preprocesada en el dominio del tiempo y una señal del canal derecho preprocesada en el dominio del tiempo en la trama actual.
Debe entenderse que el método de estimación de diferencia de tiempo entre canales anterior es simplemente un ejemplo, y las realizaciones de esta solicitud no se limitan al método de estimación de diferencia de tiempo entre canales anterior.
(3) Realizar la alineación temporal en la señal del canal izquierdo preprocesada en el dominio del tiempo y la señal del canal derecho preprocesada en el dominio del tiempo basándose en la diferencia de tiempo entre canales, para obtener una señal del canal izquierdo alineada en el tiempo y una señal del canal derecho alineada en el tiempo.
Por ejemplo, una o dos señales en la señal del canal izquierdo y la señal del canal derecho en la trama actual pueden comprimirse o extraerse basándose en la diferencia de tiempo estimada entre canales en la trama actual y un diferencia de tiempo entre canales en una trama anterior, para que no exista diferencia de tiempo entre canales entre la señal del canal izquierdo alineada en el tiempo y la señal del canal derecho alineada en el tiempo.
(4) Codificar la diferencia de tiempo entre canales para obtener un índice de codificación de la diferencia de tiempo entre canales.
(5) Calcular un parámetro estéreo para la mezcla descendente en el dominio del tiempo y codificar el parámetro estéreo para la mezcla descendente en el dominio del tiempo para obtener un índice de codificación del parámetro estéreo para la mezcla descendente en el dominio del tiempo.
El parámetro estéreo para mezcla descendente en el dominio del tiempo se usa para realizar una mezcla descendente en el dominio del tiempo en la señal del canal izquierdo alineada en el tiempo y la señal del canal derecho alineada en el tiempo.
(6) Realizar una mezcla descendente en el dominio del tiempo en la señal del canal izquierdo alineada en el tiempo y la señal del canal derecho alineada en el tiempo basándose en el parámetro estéreo para la mezcla descendente en el dominio del tiempo, para obtener una señal del canal primario y una señal del canal secundario.
La señal del canal primario se usa para representar información relacionada entre canales, y también puede denominarse señal de mezcla descendente o señal de canal central. La señal del canal secundario se usa para representar información de diferencia entre canales y también puede denominarse señal residuo o señal de canal lateral.
Cuando la señal del canal izquierdo alineada en el tiempo y la señal del canal derecho alineada en el tiempo están alineadas en el dominio del tiempo, la señal del canal secundario es la más débil. En este caso, la señal estéreo tiene el mejor efecto.
(7) Codificar por separado la señal del canal primario y la señal del canal secundario para obtener un primer flujo de bits codificado monofónico correspondiente a la señal del canal primario y un segundo flujo de bits codificado monofónico correspondiente a la señal del canal secundario.
(8) Escribir el índice de codificación de la diferencia de tiempo entre canales, el índice de codificación del parámetro estéreo, el primer flujo de bits codificado monofónico y el segundo flujo de bits codificado monofónico en un flujo de bits codificado estéreo.
Cabe señalar que no todos las etapas anteriores son obligatorias. Por ejemplo, la etapa (1) no es obligatoria. Si no hay ninguna etapa (1), la señal del canal izquierdo y la señal del canal derecho usadas para la estimación del tiempo pueden ser una señal del canal izquierdo y una señal del canal derecho en una señal estéreo original. En la presente memoria, la señal del canal izquierdo y la señal del canal derecho en la señal estéreo original son señales obtenidas después de la recogida y conversión de analógico a digital (A/D).
El componente 120 de decodificación está configurado para decodificar el flujo de bits codificado estéreo generado por el componente 110 de codificación, para obtener la señal estéreo.
Opcionalmente, el componente 110 de codificación puede conectarse al componente 120 de decodificación por cable o de manera inalámbrica, y el componente 120 de decodificación puede obtener, a través de una conexión entre el componente 120 de decodificación y el componente 110 de codificación, el flujo de bits codificado estéreo generado por el componente 110 de codificación. Alternativamente, el componente 110 de codificación puede almacenar el flujo de bits codificado estéreo generado en una memoria, y el componente 120 de decodificación lee el flujo de bits codificado estéreo en la memoria.
Opcionalmente, el componente 120 de decodificación se puede implementar en forma de software, hardware o una combinación de software y hardware. Esto no se limita en las realizaciones de esta solicitud.
Un proceso en el que el componente 120 de decodificación decodifica el flujo de bits codificado estéreo para obtener la señal estéreo puede incluir las siguientes etapas:
(1) Decodificar el primer flujo de bits codificado monofónico y el segundo flujo de bits codificado monofónico en el flujo de bits codificado estéreo para obtener la señal del canal primario y la señal del canal secundario.
(2) Obtener un índice de codificación de un parámetro estéreo para la mezcla ascendente en el dominio del tiempo basándose en el flujo de bits codificado estéreo, y realizar una mezcla ascendente en el dominio del tiempo en la señal del canal primario y la señal del canal secundario para obtener una señal del canal izquierdo de mezcla ascendente en el dominio del tiempo y una señal del canal derecho de mezcla ascendente en el dominio del tiempo.
(3) Obtener el índice de codificación de la diferencia de tiempo entre canales basándose en el flujo de bits codificado estéreo y realizar un ajuste de tiempo en la señal del canal izquierdo de mezcla ascendente en el dominio del tiempo y en la señal del canal derecho de mezcla ascendente en el dominio del tiempo, para obtener la señal estéreo.
Opcionalmente, el componente 110 de codificación y el componente 120 de decodificación pueden estar dispuestos en un mismo dispositivo, o pueden estar dispuestos en diferentes dispositivos. El dispositivo puede ser un terminal móvil que tiene una función de procesamiento de señales de audio, tal como un teléfono móvil, una tableta, un ordenador portátil, un ordenador de escritorio, una caja de sonido Bluetooth, un lápiz grabador o un dispositivo portátil, o puede ser un elemento de red que tenga una capacidad de procesamiento de señales de audio en una red central o una red inalámbrica. Esto no se limita en las realizaciones de esta solicitud.
Por ejemplo, como se muestra en la FIG. 2, las descripciones se proporcionan usando el siguiente ejemplo: el componente 110 de codificación está dispuesto en un terminal 130 móvil. El componente 120 de decodificación está dispuesto en un terminal 140 móvil. El terminal 130 móvil y el terminal 140 móvil son dispositivos electrónicos que son independientes entre sí y que tienen una capacidad de procesamiento de señales de audio. Por ejemplo, el terminal 130 móvil y el terminal 140 móvil pueden ser cada uno de ellos un teléfono móvil, un dispositivo portátil, un dispositivo de realidad virtual (realidad virtual, VR), un dispositivo de realidad aumentada (realidad aumentada, AR), o similares. Además, el terminal 130 móvil está conectado al terminal 140 móvil a través de una red inalámbrica o por cable.
Opcionalmente, el terminal 130 móvil puede incluir un componente 131 de recogida, el componente 110 de codificación y un componente 132 de codificación de canal. El componente 131 de recogida está conectado al componente 110 de codificación, y el componente 110 de codificación está conectado al componente 132 de codificación.
Opcionalmente, el terminal 140 móvil puede incluir un componente 141 de reproducción de audio, el componente 120 de decodificación y un componente 142 de decodificación de canal. El componente 141 de reproducción de audio está conectado al componente 120 de decodificación, y el componente 120 de decodificación está conectado al componente 142 de decodificación de canal.
Después de recoger una señal estéreo usando el componente 131 de recogida, el terminal 130 móvil codifica la señal estéreo usando el componente 110 de codificación, para obtener un flujo de bits codificado estéreo. Luego, el terminal 130 móvil codifica el flujo de bits codificado estéreo usando el componente 132 de codificación de canal para obtener una señal de transmisión.
El terminal 130 móvil envía la señal de transmisión al terminal 140 móvil a través de la red inalámbrica o por cable.
Después de recibir la señal de transmisión, el terminal 140 móvil decodifica la señal de transmisión usando el componente 142 de decodificación de canal para obtener el flujo de bits codificado estéreo, decodifica el flujo de bits codificado estéreo usando el componente 120 de decodificación para obtener la señal estéreo, y reproduce la señal estéreo usando el componente 141 de reproducción de audio.
Por ejemplo, como se muestra en la FIG. 3, en esta realización de esta solicitud se usa para la descripción un ejemplo en el que el componente 110 de codificación y el componente 120 de decodificación están dispuestos en un mismo elemento 150 de red que tiene una capacidad de procesamiento de señales de audio en una red central o una red inalámbrica.
Opcionalmente, el elemento 150 de red incluye un componente 151 de decodificación de canal, el componente 120 de decodificación, el componente 110 de codificación y un componente 152 de codificación de canal. El componente 151 de decodificación de canal está conectado al componente 120 de decodificación, el componente 120 de decodificación está conectado al componente 110 de codificación y el componente 110 de codificación está conectado al componente 152 de codificación de canal.
Después de recibir una señal de transmisión enviada por otro dispositivo, el componente 151 de decodificación de canal decodifica la señal de transmisión para obtener un primer flujo de bits codificado estéreo. El componente 120 de decodificación decodifica el flujo de bits codificado estéreo para obtener una señal estéreo. El componente 110 de codificación codifica la señal estéreo para obtener un segundo flujo de bits codificado estéreo. El componente 152 de codificación de canal codifica el segundo flujo de bits codificado estéreo para obtener la señal de transmisión.
El otro dispositivo puede ser un terminal móvil que tiene una capacidad de procesamiento de señales de audio, o puede ser otro elemento de red que tenga una capacidad de procesamiento de señales de audio. Esto no se limita en las realizaciones de esta solicitud.
Opcionalmente, el componente 110 de codificación y el componente 120 de decodificación en el elemento de red pueden transcodificar un flujo de bits codificado estéreo enviado por el terminal móvil.
Opcionalmente, en las realizaciones de esta solicitud, un dispositivo en el que está instalado el componente 110 de codificación puede denominarse dispositivo de codificación de audio. Durante la implementación real, el dispositivo de codificación de audio también puede tener una función de decodificación de audio. Esto no se limita en las realizaciones de esta solicitud.
Opcionalmente, en las realizaciones de esta solicitud, solo se usa la señal estéreo como ejemplo para la descripción. En esta solicitud, el dispositivo de codificación de audio puede procesar además una señal multicanal, y la señal multicanal incluye al menos dos señales de canal.
El componente 110 de codificación puede codificar la señal del canal primario y la señal del canal secundario usando un método de codificación de predicción lineal excitada por código algebraico (predicción lineal excitada por código algebraico, ACELP).
El método de codificación ACELP generalmente incluye: determinar un coeficiente LPC de la señal del canal primario y un coeficiente LPC de la señal del canal secundario, convertir cada uno del coeficientes LPC de la señal del canal primario y del coeficiente LPC de la señal del canal secundario en un parámetro LSF, y realizar una cuantificación en el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario; buscar excitación de código adaptativo para determinar un período de tono y una ganancia de libro de códigos adaptativo, y realizar por separado una cuantificación en el período de tono y la ganancia de libro de códigos adaptativo; buscar la excitación del código algebraico para determinar un índice de pulso y una ganancia de la excitación del código algebraico, y realizar por separado una cuantificación del índice de pulso y la ganancia de la excitación del código algebraico.
La FIG. 4 muestra un método de ejemplo en el que el componente 110 de codificación realiza una cuantificación en el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario.
S410: Determinar un parámetro LSF original de la señal del canal primario basándose en la señal del canal primario.
S420: Determinar un parámetro LSF original de la señal del canal secundario basándose en la señal del canal secundario.
No hay secuencia de ejecución entre la etapa S410 y la etapa S420.
S430: determinar, basándose en el parámetro LSF original de la señal del canal primario y el parámetro LSF original de la señal del canal secundario, si el parámetro LSF de la señal del canal secundario cumple con una condición de determinación de reutilización. La condición de determinación de reutilización también puede denominarse abreviadamente condición de reutilización.
Si el parámetro LSF de la señal del canal secundario no cumple la condición de determinación de reutilización, se realiza la etapa S440. Si el parámetro LSF de la señal del canal secundario cumple la condición de determinación de reutilización, se realiza la etapa S450.
Reutilizar significa que se puede obtener un parámetro LSF cuantificado de la señal del canal secundario basándose en un parámetro LSF cuantificado de la señal del canal primario. Por ejemplo, el parámetro LSF cuantificado de la señal del canal primario se usa como el parámetro LSF cuantificado de la señal del canal secundario. En otras palabras, el parámetro LSF cuantificado de la señal del canal primario se reutiliza como el parámetro LSF cuantificado de la señal del canal secundario.
Determinar si el parámetro LSF de la señal del canal secundario cumple con la condición de determinación de reutilización puede denominarse realizar la determinación de reutilización en el parámetro LSF de la señal del canal secundario.
Por ejemplo, cuando la condición de determinación de reutilización es que una distancia entre el parámetro LSF original de la señal del canal primario y el parámetro LSF original de la señal del canal secundario es menor o igual a un umbral preestablecido, si la distancia entre el parámetro LSF original de la señal del canal primario y el parámetro LSF original de la señal del canal secundario es mayor que el umbral preestablecido, se determina que el parámetro LSF de la señal del canal secundario no cumple la condición de determinación de reutilización; o si la distancia entre el parámetro LSF original de la señal del canal primario y el parámetro LSF original de la señal del canal secundario es menor o igual al umbral preestablecido, se puede determinar que el parámetro LSF de la señal del canal secundario cumple con la condición de determinación de reutilización.
Debe entenderse que la condición de determinación usada en la determinación de reutilización anterior es simplemente un ejemplo, y esto no está limitada en esta solicitud.
La distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario se puede usar para representar una diferencia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario.
La distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario se puede calcular en una pluralidad maneras.
Por ejemplo, la distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario se puede calcular según la siguiente fórmula:
M W D l ^ w ^ L S F ^ - L S F ^ ) ] .
/=i
En la presente memoria,LSFp(i)es un vector de parámetros LSF de la señal del canal primario,LSFses un vector de parámetros LSF de la señal del canal secundario, i es un índice de vector, i = 1,..., o M , M es un orden de predicción lineal ywies un iésimo coeficiente de ponderación.
también puede denominarse distancia ponderada. La fórmula anterior es simplemente un método de ejemplo para calcular la distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario, y la distancia entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario se puede calcular alternativamente usando otro método. Por ejemplo, se puede eliminar el coeficiente de ponderación en la fórmula anterior, o se puede realizar una resta en el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario.
Realizar la determinación de reutilización en el parámetro LSF original de la señal del canal secundario también puede denominarse realizar determinación de cuantificación en el parámetro LSF de la señal del canal secundario. Si un resultado de la determinación es cuantificar el parámetro LSF de la señal del canal secundario, el parámetro LSF original de la señal del canal secundario puede cuantificarse y escribirse en un flujo de bits, para obtener el parámetro LSF cuantificado de la señal del canal secundario.
El resultado de la determinación en esta etapa se puede escribir en el flujo de bits, para transmitir el resultado de la determinación a un lado del decodificador.
S440: cuantificar el parámetro LSF original de la señal del canal secundario para obtener el parámetro LSF cuantificado de la señal del canal secundario, y cuantificar el parámetro LSF de la señal del canal primario para obtener el parámetro LSF cuantificado de la señal del canal primario.
Debe entenderse que, cuando el parámetro LSF de la señal del canal secundario cumple la condición de determinación de reutilización, usar directamente el parámetro LSF cuantificado de la señal del canal primario como el parámetro LSF cuantificado de la señal del canal secundario es simplemente un ejemplo. Ciertamente, el parámetro LSF cuantificado de la señal del canal primario se puede reutilizar usando otro método para obtener el parámetro LSF cuantificado de la señal del canal secundario. Esto no está limitado en esta realización de esta solicitud.
S450: cuando el parámetro LSF de la señal del canal secundario cumple la condición de determinación de reutilización, usar directamente el parámetro LSF cuantificado de la señal del canal primario como el parámetro LSF cuantificado de la señal del canal secundario.
El parámetro LSF original de la señal del canal primario y el parámetro LSF original de la señal del canal secundario se cuantifican por separado y se escriben en el flujo de bits, para obtener el parámetro LSF cuantificado de la señal del canal primario y el parámetro LSF cuantificado de la señal del canal secundario. En este caso se ocupa una cantidad relativamente grande de bits.
La FIG. 5 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud. Cuando se aprende que un resultado de determinación de reutilización es que no se cumple una condición de determinación de reutilización, el componente 110 de codificación puede realizar el método mostrado en la FIG. 5.
S510: realizar ampliación del espectro en un parámetro LSF cuantificado de una señal del canal primario en una trama actual en una señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario.
S520: determinar un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
Como se muestra en la FIG. 15, existe una similitud entre una envolvente espectral de predicción lineal de la señal del canal primario y una envolvente espectral de predicción lineal de la señal del canal secundario. Una envolvente espectral de predicción lineal está representada por un coeficiente LPC, y el coeficiente LPC se puede convertir en un parámetro LSF. Por lo tanto, existe una similitud entre el parámetro LSF de la señal del canal primario y el parámetro LSF de la señal del canal secundario. Por lo tanto, determinar el residuo de predicción del parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario ayuda a mejorar la precisión del residuo de predicción.
El parámetro LSF original de la señal del canal secundario puede entenderse como un parámetro LSF obtenido basándose en la señal del canal secundario usando un método de la técnica anterior, por ejemplo, el parámetro LSF original obtenido en S420.
Determinar el residuo de predicción del parámetro LSF de la señal del canal secundario basándose en el parámetro LSF original de la señal del canal secundario y un parámetro LSF predicho de la señal del canal secundario puede incluir: usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho de la señal del canal secundario como el residuo de predicción del parámetro LSF de la señal del canal secundario.
S530: realizar la cuantificación en el residuo de predicción del parámetro LSF de la señal del canal secundario. S540: realizar la cuantificación en el parámetro LSF cuantificado de la señal del canal primario.
En el método de codificación en esta realización de esta solicitud, cuando es necesario codificar el parámetro LSF de la señal del canal secundario, la cuantificación se realiza en el residuo de predicción del parámetro LSF de la señal del canal secundario. En comparación con un método en el que el parámetro LSF de la señal del canal secundario se codifica por separado, este método ayuda a reducir la cantidad de bits necesarios para la codificación.
Además, debido a que el parámetro LSF que es de la señal del canal secundario y que se usa para determinar el residuo de predicción se obtiene a través de la predicción basándose en el parámetro LSF obtenido después de que se realiza la ampliación del espectro en el parámetro LSF cuantificado de la señal del canal primario, se puede usar una característica de similitud entre la envolvente espectral de predicción lineal de la señal del canal primario y la envolvente espectral de predicción lineal de la señal del canal secundario. Esto ayuda a mejorar la precisión del residuo de predicción con respecto al parámetro LSF cuantificado de la señal del canal primario, y ayuda a mejorar la precisión de determinar, por un lado del decodificador, un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción y el parámetro LSF cuantificado de la señal del canal primario.
S510, S520 y S530 se pueden implementar en una pluralidad de maneras. A continuación se proporcionan descripciones con referencia de la FIG. 6 a la FIG. 9.
Como se muestra en la FIG. 6, S510 puede incluir S610 y S520 puede incluir S620.
S610: realizar una ampliación del espectro de extracción a promedio (pull-to-average) en el parámetro LSF cuantificado de la señal del canal primario, para obtener el parámetro LSF de espectro ampliado de la señal del canal primario.
El procesamiento de extracción a promedio anterior se puede realizar según la siguiente fórmula:
En la presente memoria,LSFsbes un vector de parámetros LSF de espectro ampliado de la señal del canal primario, es un factor de ampliación (factor de ampliación),LSFpes un vector de parámetros LSF cuantificado de la señal del canal primario,LSFses un vector medio del parámetro LSF de la señal del canal secundario, i es un índice de vector, i = 1, ..., o M, y M es un orden de predicción lineal.
Generalmente, se pueden usar diferentes órdenes de predicción lineal para diferentes anchos de banda de codificación. Por ejemplo, cuando un ancho de banda de codificación es de 16 KHz, se puede realizar una predicción lineal de orden 20, es decir, M = 20. Cuando un ancho de banda de codificación es de 12,8 KHz, se puede realizar una predicción lineal de 16 órdenes, es decir, M = 16. Un vector de parámetros LSF también puede denominarse brevemente parámetro LSF.
El factor de ampliaciónf3puede ser una constante preestablecida. Por ejemplo,f3puede ser un número real constante preestablecido mayor que 0 y menor que 1. Por ejemplo,f3= 0,82 of3= 0,91.
Alternativamente, el factor de ampliaciónf3puede obtenerse de forma adaptativa. Por ejemplo, se pueden preestablecer diferentes factores de ampliaciónf3basándose en parámetros de codificación tales como diferentes modos de codificación, anchos de banda de codificación o tasas de codificación, y luego se selecciona un factor de ampliaciónf3correspondiente basándose en uno o más parámetros de codificación actuales. El modo de codificación descrito en la presente memoria puede incluir un resultado de detección de activación de voz, clasificación de habla sin voz y habla con voz, y similares.
Por ejemplo, los siguientes factores de ampliación correspondientes p pueden establecerse para diferentes tasas de codificación:
14000
18000
22000.
26000
34000
En la presente memoria,btasarepresenta una tasa de codificación.
Luego, se puede determinar un factor de ampliación correspondiente a una tasa de codificación en la trama actual basándose en la tasa de codificación en la trama actual y la correspondencia anterior entre una tasa de codificación y un factor de ampliación.
El vector medio del parámetro LSF de la señal del canal secundario se puede obtener a través de entrenamiento basándose en una gran cantidad de datos, puede ser un vector constante preestablecido o se puede obtener de forma adaptativa.
Por ejemplo, se pueden preestablecer diferentes vectores medios del parámetro LSF de la señal del canal secundario basándose en parámetros de codificación tales como modos de codificación, anchos de banda de codificación o tasas de codificación. Luego, se selecciona un vector medio correspondiente al parámetro LSF de la señal del canal secundario basándose en un parámetro de codificación en la trama actual.
S620: usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario como el residuo de predicción del parámetro LSF de la señal del canal secundario.
Específicamente, el residuo de predicción del parámetro LSF de la señal del canal secundario cumple la siguiente fórmula:
En la presente memoria,E_LSFses un vector residuo de predicción del parámetro LSF de la señal del canal secundario,LSFses un vector de parámetros LSF original de la señal del canal secundario,LSFsbes un vector de parámetros LSF de espectro ampliado de la señal del canal primario, i es un índice de vector, i = 1, ..., o M, y M es un orden de predicción lineal. Un vector de parámetros LSF también puede denominarse brevemente parámetro LSF.
En otras palabras, el parámetro LSF de espectro ampliado de la señal del canal primario se usa directamente como el parámetro lSf predicho de la señal del canal secundario (se puede denominar esta implementación realización de predicción de una sola etapa en el parámetro LSF de la señal del canal secundario), y la diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho de la señal del canal secundario se usa como el residuo de predicción del parámetro LSF de la señal del canal secundario.
Como se muestra en la FIG. 7, S510 puede incluir S710 y S520 puede incluir S720.
S710: realizar una ampliación del espectro de extracción a promedio (pull-to-average) en el parámetro LSF cuantificado de la señal del canal primario, para obtener el parámetro LSF de espectro ampliado de la señal del canal primario.
Para conocer esta etapa, consulte S610. Los detalles no se describen de nuevo en la presente memoria. S720: realizar predicción de múltiples etapas en el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener el parámetro LSF predicho de la señal del canal secundario, y usar la diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho de la señal del canal secundario como el residuo de predicción de la señal del canal secundario.
Una cantidad específica de tiempos de predicción realizados en el parámetro LSF de la señal del canal secundario puede denominarse una cantidad específica de etapas de predicción realizadas en el parámetro LSF de la señal del canal secundario.
La predicción de múltiples etapas puede incluir: predecir el parámetro LSF de espectro ampliado de la señal del canal primario como el parámetro LSF predicho de la señal del canal secundario. Esta predicción puede denominarse intrapredicción.
La intrapredicción se puede realizar en cualquier ubicación de la predicción de múltiples etapas. Por ejemplo, primero se puede realizar la intrapredicción (es decir, predicción de la etapa 1) y después se realiza una predicción (por ejemplo, predicción de la etapa 2 y predicción de la etapa 3) distinta de la intrapredicción. Alternativamente, se puede realizar primero una predicción (es decir, predicción de etapa 1) distinta de la intrapredicción, y después se realiza la intrapredicción (es decir, predicción de etapa 2). Ciertamente, se puede realizar además una predicción (es decir, predicción de etapa 3) distinta de la intrapredicción.
Si se realiza una predicción de dos etapas en el parámetro LSF de la señal del canal secundario, y la predicción de la etapa 1 es la intrapredicción, la predicción de la etapa 2 se puede realizar basándose en un resultado de intrapredicción del parámetro LSF de la señal del canal secundario (es decir, basándose en el parámetro LSF de espectro ampliado de la señal del canal primario), o puede realizarse basándose en el parámetro LSF original de la señal del canal secundario. Por ejemplo, la predicción de la etapa 2 se puede realizar en el parámetro LSF de la señal del canal secundario usando un método de interpredicción basándose en un parámetro LSF cuantificado de una señal del canal secundario en una trama anterior y el parámetro LSF original de la señal del canal secundario en la trama actual.
Si se realiza una predicción de dos etapas en el parámetro LSF de la señal del canal secundario, la predicción de la etapa 1 es la intrapredicción, y la predicción de la etapa 2 se realiza basándose en el parámetro LSF de espectro ampliado de la señal del canal primario, el residuo de predicción del parámetro LSF del canal secundario cumple las siguientes fórmulas:
E _ LSFs (i) = LSFs (i) - P _ LSFs (i)-
En la presente memoria,E_LSFses un vector residuo de predicción del parámetro LSF de la señal del canal secundario,LSFses un vector de parámetros LSF original de la señal del canal secundario,LSFsbes un vector de parámetros LSF de espectro ampliado de la señal del canal primario,P_LSFses un vector predicho del parámetro LSF de la señal del canal secundario, Pre{LSFsB(/)} es un vector predicho que es del parámetro LSF de la señal del canal secundario y que se obtiene después de realizar la predicción de la etapa 2 en el parámetro LSF del canal secundario basándose en el vector del parámetro LSF de espectro ampliado de la señal del canal primario, i es un índice de vector, i = 1, ..., o M, y M es un orden de predicción lineal. Un vector de parámetros LSF también puede denominarse brevemente parámetro LSF.
Si se realiza una predicción de dos etapas en el parámetro LSF de la señal del canal secundario, la predicción de la etapa 1 es la intrapredicción, y la predicción de la etapa 2 se realiza basándose en un vector de parámetros LSF original de la señal del canal secundario, el residuo de predicción del parámetro LSF de la señal del canal secundario cumple las siguientes fórmulas:
E _ LSFs (i) = LSFs (i) - P _ LSFs(/);
En la presente memoria,E_LSFses un vector residuo de predicción del parámetro LSF de la señal del canal secundario,LSFses el vector de parámetros LSF original de la señal del canal secundario,P_LSFses un vector predicho del parámetro LSF de la señal del canal secundario,LSFsbes un vector de parámetros LSFde espectro ampliado de la señal del canal primario,LSF s'es un vector predicho de etapa 2 del parámetroLSF del canal secundario, i es un índice de vector, i = 1, ..., o M, y M es un orden de predicción lineal. Un vector de parámetros LSF también puede denominarse brevemente parámetro LSF.
Como se muestra en la FIG. 8, S510 puede incluir S810, S820 y S830, y S520 puede incluir S840.
S810: convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal.
Para conocer detalles de la conversión del parámetro LSF en el coeficiente de predicción lineal, consulte la técnica anterior. Los detalles no se describen en la presente memoria. Si el coeficiente de predicción lineal obtenido después de convertir el parámetro LSF cuantificado de la señal del canal primario en el coeficiente de predicción lineal se indica como ai, y una función de transferencia usada para la conversión se indica como A(z), se cumple la siguiente fórmula:
M
A ( z ) = y ] a iz~! ,dondea0 =1,
¿=o
En la presente memoria,aies el coeficiente de predicción lineal obtenido después de convertir el parámetro LSF cuantificado de la señal del canal primario en el coeficiente de predicción lineal, y M es un orden de predicción lineal.
S820: modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario.
Una función de transferencia de un predictor lineal modificado cumple la siguiente fórmula:
dondeao= 1.
En la presente memoria,aies el coeficiente de predicción lineal obtenido después de convertir el parámetro LSF cuantificado de la señal del canal primario en el coeficiente de predicción lineal,f3es un factor de ampliación y M es un orden de predicción lineal.
El coeficiente de predicción lineal de espectro ampliado de la señal del canal primario cumple la siguiente fórmula:
a¡ ~ aiP> donde i = 1, o M; y
< = 1 .
En la presente memoria,a¡es el coeficiente de predicción lineal obtenido después de convertir el parámetrorjf
LSF cuantificado de la señal del canal primario en el coeficiente de predicción lineal, > es el coeficiente de predicción lineal de espectro ampliado,f3es el factor de ampliación y M es un orden de predicción lineal. Para conocer una manera de obtener el factor de ampliaciónf3en esta implementación, consulte la manera de obtener el factor de ampliaciónf3en S610. Los detalles no se describen de nuevo en la presente memoria. S830: convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Para conocer un método para convertir el parámetro LSF en el coeficiente de predicción lineal, consulte la técnica anterior. Los detalles no se describen en la presente memoria. El parámetro LSF de espectro ampliado de la señal del canal primario puede denominarseLSFsb.
S840: usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario como el residuo de predicción del parámetro LSF de la señal del canal secundario.
Para conocer esta etapa, consulte S620. Los detalles no se describen de nuevo en la presente memoria. Como se muestra en la FIG. 9, S510 puede incluir S910, S920 y S930, y S520 puede incluir S940.
S910: convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal.
Para conocer esta etapa, consulte S810. Los detalles no se describen de nuevo en la presente memoria.
S920: modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario.
Para conocer esta etapa, consulte S820. Los detalles no se describen de nuevo en la presente memoria. S930: convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Para conocer esta etapa, consulte S830. Los detalles no se describen de nuevo en la presente memoria. S940: realizar predicción de múltiples etapas en el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener el parámetro LSF predicho de la señal del canal secundario, y usar la diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho de la señal del canal secundario como el residuo de predicción de la señal del canal secundario.
Para conocer esta etapa, consulte S720. Los detalles no se describen de nuevo en la presente memoria. En S530 en esta realización de esta solicitud, cuando la cuantificación se realiza en el residuo de predicción del parámetro LSF de la señal del canal secundario, se puede hacer referencia a cualquier método de cuantificación de vector de parámetros LSF en la técnica anterior, por ejemplo, cuantificación de vector dividido, cuantificación de vector de múltiples etapas o cuantificación de vector safenet.
Si un vector obtenido después de cuantificar el residuo de predicción del parámetro LSF de la señal del canal p'Tcp
secundario se indica como c- l j ‘:)rs , el parametro LSF cuantificado de la señal del canal secundario cumple la siguiente fórmula:
LSFs(i) - EXSFs(i) P_LSFs(i).
En la presente memoria,P_LSFses un vector predicho del parámetro LSF de la señal del canal secundario, pT 'cc
5 es el vector obtenido después de cuantificar el residuo de predicción del parámetro LSF de la señal del canal secundario,<I>S es un vector de parametros de LSF cuantificados de la señal del canal secundario, i es un índice de vector, i = 1, ..., o M, y M es un orden de predicción lineal. Un vector de parámetros LSF también puede denominarse brevemente parámetro LSF.
La FIG. 10 es un diagrama de flujo esquemático de un método de codificación de señales estéreo según una realización de esta solicitud. Cuando se aprende que un resultado de determinación de reutilización es que no se cumple una condición de reutilización, el componente 120 de decodificación puede realizar el método mostrado en la FIG. 10.
S1010: obtener un parámetro LSF cuantificado de una señal del canal primario en una trama actual a partir de un flujo de bits.
Para conocer esta etapa, consulte la técnica anterior. Los detalles no se describen en la presente memoria. S1020: realizar una ampliación del espectro en el parámetro LSF cuantizado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario.
Para conocer esta etapa, consulte S510. Los detalles no se describen de nuevo en la presente memoria. S1030: obtener un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual en una señal estéreo a partir del flujo de bits.
Para conocer esta etapa, consulte un método de implementación para obtener cualquier parámetro de una señal estéreo a partir de un flujo de bits en la técnica anterior. Los detalles no se describen en la presente memoria.
S1040: determinar un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
En el método de decodificación en esta realización de esta solicitud, el parámetro LSF cuantificado de la señal del canal secundario se puede determinar basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario. Esto ayuda a reducir la cantidad de bits ocupados por el parámetro LSF de la señal del canal secundario en el flujo de bits.
Además, debido a que el parámetro LSF cuantificado de la señal del canal secundario se determina basándose en el parámetro<l>S<f>obtenido después de que se realiza la ampliación del espectro en el parámetro LSF cuantificado de la señal del canal primario, se puede usar una característica de similitud entre una envolvente espectral de predicción lineal de la señal del canal primario y una envolvente espectral de predicción lineal de la señal del canal secundario. Esto ayuda a mejorar la precisión del parámetro lSf cuantificado de la señal del canal secundario.
En algunas implementaciones posibles, la realización de una ampliación del espectro en el parámetro LSF cuantificado de la señal del canal primario en la trama actual en la señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario incluye:
realizar un procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, donde el procesamiento de extracción a promedio se puede realizar según la siguiente fórmula:
En la presente memoria,LSFsbrepresenta un vector del parámetro LSF de espectro ampliado de la señal del canal primario,LSFp(í)representa un vector del parámetro LSF cuantificado de la señal del canal primario,irepresenta un índice de vector,f3representa un factor de ampliación, 0 <f3< 1,LSFsrepresenta un vector medio de un parámetro LSF original de la señal del canal secundario, 1 <i<M, ies un número entero yMrepresenta un parámetro de predicción lineal.
En una posible implementación, la realización de la ampliación del espectro en el parámetro LSF cuantificado de la señal del canal primario en la trama actual en la señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario incluye:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
En algunas implementaciones posibles, el parámetro LSF cuantificado de la señal del canal secundario es una suma del parámetro LSF de espectro ampliado de la señal del canal primario y el residuo de predicción del parámetro LSF de la señal del canal secundario.
En algunas implementaciones posibles, la determinación de un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal de canal primerio incluye:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho; y
usar una suma del parámetro LSF predicho y el residuo de predicción del parámetro LSF de la señal del canal secundario como el parámetro LSF cuantificado de la señal del canal secundario.
En esta implementación, para una implementación de realización de una predicción de dos etapas en el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener el parámetro LSF predicho, consulte a S720. Los detalles no se describen de nuevo en la presente memoria.
La FIG. 11 es un diagrama de bloques esquemático de un aparato 1100 de codificación de señales estéreo según una realización de esta solicitud. Debe entenderse que el aparato 1100 de codificación es simplemente un ejemplo.
En algunas implementaciones, un módulo 1110 de ampliación del espectro, un módulo 1120 de determinación y un módulo 1130 de cuantificación pueden incluirse todos en el componente 110 de codificación del terminal 130 móvil o el elemento 150 de red.
El módulo 1110 de ampliación del espectro está configurado para realizar una ampliación del espectro en un parámetro LSF de frecuencia espectral de línea cuantificado de una señal del canal primario en una trama actual en la señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario. El módulo 1120 de determinación está configurado para determinar un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
El módulo 1130 de cuantificación está configurado para realizar la cuantificación en el residuo de predicción. El módulo de ampliación del espectro está configurado para: realizar procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, donde el procesamiento de extracción a promedio puede realizarse según la siguiente fórmula:
En la presente memoria,LSFsbrepresenta un vector del parámetro LSF de espectro ampliado de la señal del canal primario,LSFp(í)representa un vector del parámetro LSF cuantificado de la señal del canal primario,irepresenta un índice de vector,f3representa un factor de ampliación, 0 <f3< 1,LSFsrepresenta un vector medio del parámetro LSF original de la señal del canal secundario, 1 <i<M, ies un número entero yMrepresenta un parámetro de predicción lineal.
O el módulo de ampliación del espectro está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Opcionalmente, el residuo de predicción de la señal del canal secundario es una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado.
Opcionalmente, el módulo de determinación está específicamente configurado para:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho de la señal del canal secundario; y
usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho como el residuo de predicción de la señal del canal secundario.
Antes de determinar el residuo de predicción del parámetro LSF de la señal del canal secundario en la trama actual basándose en el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario, el módulo de determinación está configurado además para determinar que el parámetro LSF de la señal del canal secundario no cumple una condición de reutilización.
El aparato 1100 de codificación puede configurarse para realizar el método de codificación descrito en la FIG.
5. Por brevedad, los detalles no se describen de nuevo en la presente memoria.
La FIG. 12 es un diagrama de bloques esquemático de un aparato 1200 de decodificación de señales de audio según una realización de esta solicitud. Debe entenderse que el aparato 1200 de codificación es simplemente un ejemplo.
En algunas implementaciones, un módulo 1220 de obtención, un módulo 1230 de ampliación del espectro y un módulo 1240 de determinación pueden incluirse todos en el componente 120 de decodificación del terminal 140 móvil o el elemento 150 de red.
El módulo 1220 de obtención está configurado para obtener un parámetro LSF cuantificado de una señal del canal primario en la trama actual del flujo de bits.
El módulo 1230 de ampliación del espectro está configurado para realizar una ampliación del espectro en el parámetro LSF cuantificado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario.
El módulo 1220 de obtención está configurado además para obtener un residuo de predicción de un parámetro LSF de frecuencia espectral de línea de una señal del canal secundario en la trama actual en la señal estéreo a partir del flujo de bits.
El módulo 1240 de determinación está configurado para determinar un parámetro LSF cuantizado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
El módulo de ampliación del espectro está configurado para:
realizar procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, donde el procesamiento de extracción a promedio puede realizarse según la siguiente fórmula:
En la presente memoria,LSFsbrepresenta un vector del parámetro LSF de espectro ampliado de la señal del canal primario,LSFp(í)representa un vector del parámetro LSF cuantificado de la señal del canal primario,irepresenta un índice de vector,f3representa un factor de ampliación, 0 <f3< 1,LSFsrepresenta un vector medio de un parámetro LSF original de la señal del canal secundario, 1 <i< M,ies un número entero yMrepresenta un parámetro de predicción lineal.
O el módulo de ampliación del espectro está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Opcionalmente, el parámetro LSF cuantificado de la señal del canal secundario es una suma del parámetro LSF de espectro ampliado y el residuo de predicción.
Opcionalmente, el módulo de determinación está específicamente configurado para:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho; y
usar una suma del parámetro LSF predicho y el residuo de predicción como el parámetro LSF cuantificado de la señal del canal secundario.
Antes de obtener el residuo de predicción del parámetro LSF de frecuencia espectral de línea de la señal del canal secundario en la trama actual en la señal estéreo a partir del flujo de bits, el módulo de obtención se configura además para determinar que el parámetro LSF de la señal del canal secundario no cumple con una condición de reutilización.
El aparato 1200 de decodificación puede configurarse para realizar el método de decodificación descrito en la FIG. 10. Por brevedad, los detalles no se describen de nuevo en la presente memoria.
La FIG. 13 es un diagrama de bloques esquemático de un aparato 1300 de codificación de señales estéreo según una realización de esta solicitud. Debe entenderse que el aparato 1300 de codificación es simplemente un ejemplo.
Una memoria 1310 está configurada para almacenar un programa.
Un procesador 1320 está configurado para ejecutar el programa almacenado en la memoria. Cuando se ejecuta el programa en la memoria, el procesador está configurado para:
realizar una ampliación del espectro en un parámetro LSF de frecuencia espectral de línea cuantificado de una señal del canal primario en una trama actual de la señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
determinar un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario; y
realizar la cuantificación del residuo de predicción.
El procesador 1320 está configurado para:
realizar procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, donde el procesamiento de extracción a promedio puede realizarse según la siguiente fórmula:
En la presente memoria,LSFsbrepresenta un vector del parámetro LSF de espectro ampliado de la señal del canal primario,LSFp(í)representa un vector del parámetro LSF cuantificado de la señal del canal primario,irepresenta un índice de vector,f3representa un factor de ampliación, 0 <f3< 1,LSFsrepresenta un vector medio del parámetro LSF original de la señal del canal secundario, 1 <i< M,ies un número entero yMrepresenta un parámetro de predicción lineal.
O el procesador está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Opcionalmente, el residuo de predicción de la señal del canal secundario es una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado.
Opcionalmente, el procesador está específicamente configurado para:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho de la señal del canal secundario; y
usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho como el residuo de predicción de la señal del canal secundario.
Antes de determinar el residuo de predicción del parámetro LSF de la señal del canal secundario en la trama actual basándose en el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario, el procesador está configurado además para determinar que el parámetro LSF de la señal del canal secundario no cumple una condición de reutilización.
El aparato 1300 de codificación puede configurarse para realizar el método de codificación descrito en la FIG.
5. Por brevedad, los detalles no se describen de nuevo en la presente memoria.
La FIG. 14 es un diagrama de bloques esquemático de un aparato 1400 de decodificación de señales estéreo según una realización de esta solicitud. Debe entenderse que el aparato 1400 de codificación es simplemente un ejemplo.
Una memoria 1410 está configurada para almacenar un programa.
Un procesador 1420 está configurado para ejecutar el programa almacenado en la memoria. Cuando se ejecuta el programa en la memoria, el procesador está configurado para:
obtener un parámetro LSF cuantificado de una señal del canal primario en una trama actual a partir de un flujo de bits;
realizar una ampliación del espectro en el parámetro LSF cuantizado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
obtener un residuo de predicción de un parámetro LSF de frecuencia espectral de línea de una señal del canal secundario en la trama actual en la señal estéreo a partir del flujo de bits; y
determinar un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
El procesador está configurado para:
realizar procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, donde el procesamiento de extracción a promedio puede realizarse según la siguiente fórmula:
En la presente memoria,LSFsbrepresenta un vector del parámetro LSF de espectro ampliado de la señal del canal primario,LSFp(í)representa un vector del parámetro LSF cuantificado de la señal del canal primario,irepresenta un índice de vector,f3representa un factor de ampliación, 0 <f3< 1,LSFsrepresenta un vector medio de un parámetro LSF original de la señal del canal secundario, 1 <i< M,ies un número entero yMrepresenta un parámetro de predicción lineal.
O el procesador está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
Opcionalmente, el parámetro LSF cuantificado de la señal del canal secundario es una suma del parámetro LSF de espectro ampliado de la señal del canal primario y el residuo de predicción.
Opcionalmente, el procesador está específicamente configurado para:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho; y
usar una suma del parámetro LSF predicho y el residuo de predicción como el parámetro LSF cuantificado de la señal del canal secundario.
Antes de obtener el residuo de predicción del parámetro LSF de frecuencia espectral de línea de la señal del canal secundario en la trama actual en la señal estéreo a partir del flujo de bits, el procesador se configura además para determinar que el parámetro LSF de la señal del canal secundario no cumple con una condición de reutilización.
El aparato 1400 de decodificación puede configurarse para realizar el método de decodificación descrito en la FIG. 10. Por brevedad, los detalles no se describen de nuevo en la presente memoria.
Un experto en la técnica puede ser consciente de que, en combinación con los ejemplos descritos en las realizaciones descritas en esta memoria descriptiva, unidades y etapas algorítmicas se pueden implementar mediante hardware electrónico o una combinación de software informático y hardware electrónico. Si las funciones se efectúan mediante hardware o software depende de aplicaciones particulares y condiciones de restricción de diseño de las soluciones técnicas. Un experto en la técnica puede usar diferentes métodos para implementar las funciones descritas para cada aplicación particular, pero no debe considerarse que la implementación va más allá del alcance de esta solicitud.
Un experto en la técnica puede entender claramente que, con el propósito de una descripción breve y conveniente, para un procedimiento de trabajo detallado del sistema, aparato y unidad anteriores, se puede hacer referencia a un proceso correspondiente en las realizaciones del método anterior. Los detalles no se describen de nuevo en la presente memoria.
En las varias realizaciones proporcionadas en esta solicitud, se debería entender que el sistema, aparato y método descritos se pueden implementar de otras maneras. Por ejemplo, las realizaciones de aparato descritas son solo ejemplos. Por ejemplo, la división en unidades es simplemente una división de función lógica. Puede haber otras maneras de división en una implementación real. Por ejemplo, una pluralidad de unidades o componentes pueden combinarse o integrarse en otro sistema, o algunas características pueden ignorarse o no realizarse. Además, los acoplamientos mutuos visualizados o analizados o los acoplamientos directos o las conexiones de comunicación se pueden implementar usando algunas interfaces. Los acoplamientos o conexiones de comunicación indirectos entre los aparatos o unidades se pueden implementar de forma electrónica, mecánica u otras.
Las unidades descritas como partes separadas pueden estar o no físicamente separadas, y las partes visualizadas como unidades pueden ser o no unidades físicas, pueden estar ubicadas en una ubicación, o pueden estar distribuidas en una pluralidad de unidades de red. Algunas o todas las unidades se pueden seleccionar basándose en requisitos reales para lograr los objetivos de las soluciones de las realizaciones.
Además, las unidades de función en las realizaciones de esta solicitud se pueden integrar en una unidad de procesamiento, o cada una de las unidades puede existir sola físicamente, o dos o más unidades se pueden integrar en una unidad.
Debe entenderse que el procesador en las realizaciones de esta solicitud puede ser una unidad de procesamiento central (unidad de procesamiento central, CPU). Alternativamente, el procesador puede ser otro procesador de propósito general, un procesador de señal digital (procesador de señal digital, DSP), un circuito integrado de aplicación específica (circuito integrado de aplicación específica, ASIC), una matriz de puertas programables en campo (matriz de puertas programables en campo, FPGA) u otro dispositivo lógico programable, una puerta discreta o un dispositivo lógico de transistor, o un componente de hardware discreto o similares. El procesador de uso general puede ser un microprocesador, o el procesador puede ser cualquier procesador convencional o similar.
Cuando las funciones se implementan en una forma de una unidad de función de software y se vende o se usa como un producto independiente, las funciones se pueden almacenar en un soporte de almacenamiento legible por ordenador. En función de dicho entendimiento, las soluciones técnicas de esta solicitud esencialmente, o la parte que contribuye a la técnica anterior, o algunas de las soluciones técnicas, se pueden implementar en forma de un producto de software. El producto de software se almacena en un soporte de almacenamiento e incluye varias instrucciones para dar instrucciones a un dispositivo informático (que puede ser un ordenador personal, un servidor o un dispositivo de red) para realizar todas o algunas de las etapas de los métodos descritos en las realizaciones de esta solicitud. El soporte de almacenamiento anterior incluye cualquier medio que pueda almacenar código de programa, tal como una unidad flash USB, un disco duro extraíble, una memoria de solo lectura (memoria de solo lectura, ROM), una memoria de acceso aleatorio (memoria de acceso aleatorio, RAM), un disco magnético o un disco compacto.
Las descripciones anteriores son simplemente implementaciones específicas de esta solicitud, pero no pretenden limitar el alcance de protección de esta solicitud. Cualquier variación o reemplazo fácilmente resuelto por un experto en la técnica dentro del alcance técnico descrito en esta solicitud caerá dentro del alcance de protección de esta solicitud. Por lo tanto, el alcance de protección de esta solicitud estará sujeto al alcance de protección de las reivindicaciones.

Claims (14)

REIVINDICACIONES
1. Un método de codificación de señales estéreo, que comprende:
realizar una ampliación del espectro en un parámetro frecuencia espectral de línea, LSF, cuantificado de una señal del canal primario en una trama actual en una señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
determinar un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario; y
realizar la cuantificación del residuo de predicción,
en donde la realización de la ampliación del espectro en un parámetro LSF cuantificado de una señal del canal primario en una trama actual en una señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario comprende:
realizar un procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, en donde el procesamiento de extracción a promedio se realiza según la siguiente fórmula:
LSFJ0 =p-ISFr(i)+ (1 -p )■ LSFs(i) , en donde
LSF<sb>representa un vector del parámetro LSF de espectro ampliado de la señal del canal primario, LSF<p>(í) representa un vector del parámetro LSF cuantificado de la señal del canal primario, i representa un índice de vector, p representa un factor de ampliación, 0 < p < 1, LSF<s>representa un vector medio del parámetro LSF original de la señal del canal secundario, 1 < i < M, i es un número entero y M representa un parámetro de predicción lineal;
o
en donde la realización de la ampliación del espectro en un parámetro LSF cuantificado de una señal del canal primario en una trama actual en una señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario comprende:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario, en donde los coeficientes de predicción lineal modificadosd< dependen de los coeficientes de predicción lineal ai según la siguiente fórmula:
a¡ ~ aiP’ donde i = 1, o M; y
a'o = 1,
en donde p es el factor de ampliación y M es un orden de predicción lineal; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, en donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
2. El método de codificación según la reivindicación 1, en donde el residuo de predicción del parámetro LSF de la señal de canal secundario es una diferencia entre el parámetro LSF original de la señal de canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
3. El método de codificación según la reivindicación 1, en donde la determinación de un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario comprende:
realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho de la señal del canal secundario; y
usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho como el residuo de predicción del parámetro LSF de la señal del canal secundario.
4. El método de codificación según una cualquiera de las reivindicaciones 1 a 3, en donde antes de la determinación de un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y parámetro LSF de espectro ampliado de la señal del canal primario, el método de codificación comprende además:
determinar que el parámetro LSF de la señal del canal secundario no cumple una condición de reutilización, en donde reutilizar significa que se puede obtener el parámetro LSF cuantificado de la señal del canal secundario basándose en el parámetro LSF cuantificado de la señal del canal primario.
5. Un método de codificación de señales estéreo, que comprende:
obtener un parámetro LSF cuantificado de una señal del canal primario en una trama actual a partir de un flujo de bits;
realizar una ampliación del espectro en el parámetro LSF cuantizado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
obtener un residuo de predicción de un parámetro de frecuencia espectral de línea, LSF, de una señal del canal secundario en la trama actual en una señal estéreo a partir del flujo de bits; y
determinar un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario,
en donde la realización de una ampliación del espectro en el parámetro LSF cuantizado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario comprende: realizar un procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, en donde el procesamiento de extracción a promedio se realiza según la siguiente fórmula:
LSFsb(i ) = p•LSFP(1)+ (1 - /?) •LSFs(i),en donde
LSF<sb>representa un vector del parámetro LSF de espectro ampliado de la señal del canal primario, LSF<p>(<í>) representa un vector del parámetro LSF cuantificado de la señal del canal primario, i representa un índice de vector, p representa un factor de ampliación, 0 < p< 1, LSF<s>representa un vector medio de un parámetro LSF original de la señal del canal secundario, 1 < i < M, i es un número entero y M representa un parámetro de predicción lineal;
o
en donde la realización de la ampliación del espectro en un parámetro LSF cuantificado de la señal del canal primario en una trama actual en la señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario comprende:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario, en donde los coeficientes de predicción lineal modificadosd <dependen de los coeficientes de predicción lineal ai según la siguiente fórmula:
a i ~ a i P> donde i = 1, o M; y
a'o = 1,
en donde p es el factor de ampliación y M es un orden de predicción lineal; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, en donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
6. El método de decodificación según la reivindicación 5, en donde el parámetro LSF cuantificado de la señal del canal secundario es una suma del parámetro LSF de espectro ampliado de la señal del canal primario y el residuo de predicción.
7. El método de descodificación según la reivindicación 5, en donde la determinación de un parámetro LSF cuantizado de la señal de canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario comprende: realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho; y
usar una suma del parámetro LSF predicho y el residuo de predicción como el parámetro LSF cuantificado de la señal del canal secundario.
8. Un aparato de codificación de señales estéreo, que comprende una memoria (1310) y un procesador (1320), en donde
la memoria (1310) está configurada para almacenar un programa; y
el procesador (1320) está configurado para ejecutar el programa almacenado en la memoria (1310), y cuando se ejecuta el programa en la memoria (1310), el procesador (1320) está configurado para:
realizar una ampliación del espectro en un parámetro de frecuencia espectral de línea, LSF, cuantificado de una señal del canal primario en una trama actual en una señal estéreo, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
determinar un residuo de predicción de un parámetro LSF de una señal del canal secundario en la trama actual basándose en un parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario; y
realizar la cuantificación del residuo de predicción,
en donde el procesador (1320) está configurado para:
realizar un procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, en donde el procesamiento de extracción a promedio se realiza según la siguiente fórmula:
LSFJi) =<•>LSFp(i)<(1 ->P<) •>LSFs(i),<en donde>
LSF<sb>representa un vector del parámetro LSF de espectro ampliado de la señal del canal primario, LSF<p>(<í>) representa un vector del parámetro LSF cuantificado de la señal del canal primario, i representa un índice de vector, p representa un factor de ampliación, 0 < p < 1, LSF<s>representa un vector medio del parámetro LSF original de la señal del canal secundario, 1 < i < M, i es un número entero y M representa un parámetro de predicción lineal;
o
en donde el procesador (1320) está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario, en donde los coeficientes de predicción lineal modificadosc i¡ dependen de los coeficientes de predicción lineal ai según la siguiente fórmula:
a¡ ~ aiP’ donde i = 1, o M; y
a<'0>= 1,
en donde p es el factor de ampliación y M es un orden de predicción lineal; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, en donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
9. El método de codificación según la reivindicación 8, en donde el residuo de predicción del parámetro LSF de la señal del canal secundario es una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario.
10. El aparato de codificación según la reivindicación 8, en donde el procesador (1320) está configurado para: realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho de la señal del canal secundario; y
usar una diferencia entre el parámetro LSF original de la señal del canal secundario y el parámetro LSF predicho como el residuo de predicción del parámetro LSF de la señal del canal secundario.
11. El aparato de codificación según una cualquiera de las reivindicaciones 8 a 10, en donde antes de la determinación del residuo de predicción del parámetro LSF de la señal del canal secundario en la trama actual basándose en el parámetro LSF original de la señal del canal secundario y parámetro LSF de espectro ampliado de la señal del canal primario, el procesador (1320) está configurado para:
determinar que el parámetro LSF de la señal del canal secundario no cumple una condición de reutilización, en donde reutilizar significa que se puede obtener el parámetro LSF cuantificado de la señal del canal secundario basándose en el parámetro LSF cuantificado de la señal del canal primario.
12. Un aparato de decodificación de señales estéreo, que comprende una memoria (1410) y un procesador (1420), en donde
una memoria (1410) configurada para almacenar un programa; y
un procesador (1420) está configurado para ejecutar el programa almacenado en la memoria (1410), y cuando se ejecuta el programa en la memoria (1410), el procesador (1420) está configurado para:
obtener un parámetro LSF cuantificado de una señal del canal primario en una trama actual a partir de un flujo de bits;
realizar una ampliación del espectro en el parámetro LSF cuantizado de la señal del canal primario, para obtener un parámetro LSF de espectro ampliado de la señal del canal primario;
obtener un residuo de predicción de un parámetro de frecuencia espectral de línea, LSF, de una señal del canal secundario en la trama actual en una señal estéreo a partir del flujo de bits; y
determinar un parámetro LSF cuantificado de la señal del canal secundario basándose en el residuo de predicción del parámetro LSF de la señal del canal secundario y el parámetro LSF de espectro ampliado de la señal del canal primario,
en donde el procesador (1420) está configurado para:
realizar un procesamiento de extracción a promedio en el parámetro LSF cuantificado de la señal del canal primario para obtener el parámetro LSF de espectro ampliado, en donde el procesamiento de extracción a promedio se realiza según la siguiente fórmula:
LSFsb(i ) = p•LSFP(1)+ (1 - /?) •LSFs(i),en donde
LSF<sb>representa un vector del parámetro LSF de espectro ampliado de la señal del canal primario, LSF<p>(í) representa un vector del parámetro LSF cuantificado de la señal del canal primario, i representa un índice de vector, p representa un factor de ampliación, 0 < p< 1, LSF<s>representa un vector medio de un parámetro LSF original de la señal del canal secundario, 1 < i < M, i es un número entero y M representa un parámetro de predicción lineal;
o
en donde el procesador (1420) está configurado para:
convertir el parámetro LSF cuantificado de la señal del canal primario en un coeficiente de predicción lineal; modificar el coeficiente de predicción lineal para obtener un coeficiente de predicción lineal modificado de la señal del canal primario, en donde los coeficientes de predicción lineal modificadosd ¡dependen de los coeficientes de predicción lineal ai según la siguiente fórmula:
a ' = a tP l’ donde i = 1, o M; y
a<'0>= 1,
en donde p es el factor de ampliación y M es un orden de predicción lineal; y
convertir el coeficiente de predicción lineal modificado de la señal del canal primario en un parámetro LSF, en donde el parámetro LSF obtenido a través de la conversión es el parámetro LSF de espectro ampliado de la señal del canal primario.
13. El método de decodificación según la reivindicación 12, en donde el parámetro LSF cuantificado de la señal del canal secundario es una suma del parámetro LSF de espectro ampliado de la señal del canal primario y el residuo de predicción.
14. El aparato de codificación según la reivindicación 12, en donde el procesador (1420) está configurado para: realizar una predicción en dos etapas sobre el parámetro LSF de la señal del canal secundario basándose en el parámetro LSF de espectro ampliado de la señal del canal primario para obtener un parámetro LSF predicho; y
usar una suma del parámetro LSF predicho y el residuo de predicción como el parámetro LSF cuantificado de la señal del canal secundario.
ES19825743T 2018-06-29 2019-06-27 Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo Active ES2963219T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810701919.1A CN110728986B (zh) 2018-06-29 2018-06-29 立体声信号的编码方法、解码方法、编码装置和解码装置
PCT/CN2019/093404 WO2020001570A1 (zh) 2018-06-29 2019-06-27 立体声信号的编码方法、解码方法、编码装置和解码装置

Publications (1)

Publication Number Publication Date
ES2963219T3 true ES2963219T3 (es) 2024-03-25

Family

ID=68986259

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19825743T Active ES2963219T3 (es) 2018-06-29 2019-06-27 Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo

Country Status (7)

Country Link
US (3) US11462223B2 (es)
EP (2) EP4297029A3 (es)
JP (2) JP7160953B2 (es)
CN (2) CN110728986B (es)
BR (1) BR112020026932A2 (es)
ES (1) ES2963219T3 (es)
WO (1) WO2020001570A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115472170A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 一种三维音频信号的处理方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
CN101695150B (zh) * 2009-10-12 2011-11-30 清华大学 多声道音频编码方法、编码器、解码方法和解码器
CN102044250B (zh) * 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
CN103180899B (zh) * 2010-11-17 2015-07-22 松下电器(美国)知识产权公司 立体声信号的编码装置、解码装置、编码方法及解码方法
ES2955962T3 (es) * 2015-09-25 2023-12-11 Voiceage Corp Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios

Also Published As

Publication number Publication date
US20220406316A1 (en) 2022-12-22
US11790923B2 (en) 2023-10-17
US20210125620A1 (en) 2021-04-29
CN115831130A (zh) 2023-03-21
JP7160953B2 (ja) 2022-10-25
JP2022188262A (ja) 2022-12-20
EP4297029A2 (en) 2023-12-27
EP3806093A1 (en) 2021-04-14
US20240021209A1 (en) 2024-01-18
EP3806093A4 (en) 2021-07-21
EP4297029A3 (en) 2024-02-28
JP7477247B2 (ja) 2024-05-01
EP3806093B1 (en) 2023-10-04
JP2021529340A (ja) 2021-10-28
CN110728986B (zh) 2022-10-18
CN110728986A (zh) 2020-01-24
BR112020026932A2 (pt) 2021-03-30
WO2020001570A1 (zh) 2020-01-02
US11462223B2 (en) 2022-10-04
WO2020001570A8 (zh) 2020-10-22

Similar Documents

Publication Publication Date Title
US20190237087A1 (en) Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel
US9275648B2 (en) Method and apparatus for processing audio signal using spectral data of audio signal
JP6874151B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
US11062715B2 (en) Time-domain stereo encoding and decoding method and related product
US20200176001A1 (en) Method for determining audio coding/decoding mode and related product
KR20070003593A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
US20240153511A1 (en) Time-domain stereo encoding and decoding method and related product
US20160133260A1 (en) Encoding device and method, decoding device and method, and program
WO2017206794A1 (zh) 一种声道间相位差参数的提取方法及装置
ES2963219T3 (es) Método y aparato de codificación de señales estéreo, método y aparato de decodificación de señales estéreo
US11922958B2 (en) Method and apparatus for determining weighting factor during stereo signal encoding
WO2017202680A1 (en) Method and apparatus for voice or sound activity detection for spatial audio
ES2911515T3 (es) Codificación de audio
US11727943B2 (en) Time-domain stereo parameter encoding method and related product
WO2021136344A1 (zh) 音频信号的编解码方法和编解码装置
JP6318904B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
CN112233682A (zh) 一种立体声编码方法、立体声解码方法和装置
EP3800637B1 (en) Encoding and decoding method for stereo audio signal, encoding device, and decoding device
WO2024110562A1 (en) Adaptive encoding of transient audio signals
CN112151045A (zh) 一种立体声编码方法、立体声解码方法和装置