MX2014007968A - Metodo, aparato, y sistema para procesar datos de audio. - Google Patents

Metodo, aparato, y sistema para procesar datos de audio.

Info

Publication number
MX2014007968A
MX2014007968A MX2014007968A MX2014007968A MX2014007968A MX 2014007968 A MX2014007968 A MX 2014007968A MX 2014007968 A MX2014007968 A MX 2014007968A MX 2014007968 A MX2014007968 A MX 2014007968A MX 2014007968 A MX2014007968 A MX 2014007968A
Authority
MX
Mexico
Prior art keywords
sid
high band
band noise
parameter
frame
Prior art date
Application number
MX2014007968A
Other languages
English (en)
Other versions
MX338445B (es
Inventor
Zhe Wang
Original Assignee
Huawei Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Tech Co Ltd filed Critical Huawei Tech Co Ltd
Publication of MX2014007968A publication Critical patent/MX2014007968A/es
Publication of MX338445B publication Critical patent/MX338445B/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)

Abstract

La presente invención divulga un método, un aparato, y un sistema para procesar datos de audio, y pertenece al campo de las tecnologías de comunicaciones. El método incluye: obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido actual en una señal de ruido de banda baja y una señal de ruido de banda alta; y codificar y transmitir la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y codificar y transmitir la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. De acuerdo con la presente invención, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se pueden guardar cargas de cálculo y bits codificados bajo una premisa de no bajar la calidad subjetiva de un codec, y los bits que se guardan pueden ayudar a alcanzar un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad general de codificación.

Description

MÉTODO, APARATO, Y SISTEMA. PARA PROCESAR DATOS DE AUDIO CAMPO DE LA INVENCIÓN La presente invención se refiere al campo de las tecnologías de las comunicaciones, y en particular, a un método, un aparato, y sistema para procesar datos de audio ANTECEDENTES DE LA INVENCION En el campo de las comunicaciones digitales, hay requerimientos de aplicación extensos para la transmisión de voces, imágenes, audios, y videos, tales como llamadas de teléfono, conferencia de audio/video, televisión de difusión, y entretenimiento multimedia. Una voz se digitaliza, y después se transfiere de una terminal a otra terminal a través de una red de comunicación. En este documento, las terminales pueden ser teléfonos móviles, terminales de teléfono digital, o terminales de voz o cualquier otro tipo. Ejemplos de terminales de teléfono digital son los teléfonos VoIP o teléfonos ISDN, computadoras, y teléfonos de comunicación por cable. Para reducir los recursos ocupados en el proceso de almacenar o transmitir señales de audio, un extremo de envío lleva a cabo procesamiento de compresión en señales de audio antes de transmitir las señales de audio a un extremo de recepción, y el extremo de recepción llevada a cabo procesamiento de descompresión para restablecer las señales de audio y reproducir las señales de audio.
En la comunicación de voz, una voz se incluye con solamente un 40% del tiempo, y en otro tiempo, sólo hay silencio o ruido de fondo. Para ahorrar anchos de banda de transmisión y evitar el consumo innecesario de anchos de banda en un periodo de silencio o ruido de fondo, emerge una tecnología de sistema de transmisión discontinua/generación de ruido de confort (DTX/CNG, Discontinuous Transmission System/Comfort Noise Generation) . Simplemente, DTX/CNG significa no codificar tramas de ruido continuamente, sino llevar a cabo solamente codificación una vez en un intervalo de varias tramas en un periodo de ruido/silencio de acuerdo con una política, donde una tasa de bits codificados es generalmente mucho menor que una tasa de bits de codificado de trama vocal. Una trama vocal codificada en tal tasa baja se denomina como una trama de descriptor de inserción de silencio (SID, Silence Insertion Descriptor) . Un decodificador restablece las tramas de ruido de fondo continuas en el extremo de decodificación de acuerdo con las tramas SIDs recibidas discontinuamente. Tal ruido de fondo restablecido continuamente no es una reproducción fiel del ruido de fondo de un extremo de modificación, pero apunta a evitar provocar el deterioro de la calidad en la audición tanto como sea posible, de tal forma que un usuario se sienta confortable cuando escucha el ruido. El ruido de fondo restablecido se denomina como un ruido de confort (CN, Comfort Noise) , y el método para restablecer el CN en el extremo de decodificación se denomina como generación de ruido de confort.
En el arte actual, ITU-T G.718 es un nuevo codee de banda ancha estándar, que incluye un sistema DTX/CNG de banda ancha. El sistema puede enviar un SID de acuerdo con un intervalo fijo, y puede también ajusfar de manera adaptable el intervalo de envió de SID de acuerdo con un nivel de ruido estimado. Una trama de SID de G.718 incluye 16 parámetros de ISP y parámetros de energía de excitación. Este grupo de parámetros de par espectral de inmitancia (ISP, Immittance Spectral Pair) representa una envolvente espectral en el ancho de banda de toda una banda ancha, y se obtiene una energía de excitación por medio de un filtro de análisis representado por este grupo de parámetros de ISP. En el extremo de decodificación, el G.718 estima, de acuerdo con los parámetros de ISP obtenidos al decodificar un SID en un estado de CNG, un coeficiente de LPC requerido para CNG, estima, de acuerdo con los parámetros de energía de excitación obtenidos al decodificar la trama de SID, una energía de excitación requerida para CNG, y utiliza ruido blanco ajustado por ganancia para excitar un filtro de síntesis de CNG para obtener un CN reconstruido.
Sin embargo, para una envolvente espectral de súper banda ancha, el ancho de banda de la súper banda ancha es extremadamente ancho; cuando el arte actual se extiende a un sistema DTX/CNG, se necesitan consumir más cargas de cálculo y bits para calcular y codificar la docena adicional de parámetros de ISP, debido a que una envolvente espectral de súper banda ancha necesita ser codificada para un SID. Debido a que las señales de ruido de banda ancha (lo cual se refiere a un rango de frecuencia por encima de la banda ancha de este documento) no son generalmente perceptualmente sensibles en audición, las cargas de cálculo y bits consumidos para esta parte de señales no son económicos, reduciendo de esta manera la eficiencia decodificación del codee.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Para resolver un problema de codificación y transmisión de súper banda ancha, las modalidades de la presente invención proporcionan un método, aparato, y un sistema para procesar datos de audio. Las soluciones técnicas son como sigue: de acuerdo con un aspecto, se proporciona un método para procesar datos de audio e incluye: obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta; y codificar la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua y transmitir la señal de ruido de banda baja codificada al utilizar el primer mecanismo de transmisión discontinua, y codificar la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua, donde una política para enviar una primera trama de descriptor de inserción de silencio (SID) del primer mecanismo de transmisión discontinua es diferente de una política para enviar una segunda trama de SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua .
De acuerdo con un aspecto, se proporciona un método para procesar datos de audio e incluye: obtener, por medio de un decodificador, un SID, y determinar si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; cuando el SID incluye el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort (CN) de acuerdo con el parámetro de ruido de banda baja obtenido al decodificar el parámetro de ruido de banda alta generado localmente; cuando el SID incluye el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido al decodificar y generar localmente el parámetro de ruido de banda baja; y cuando el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación.
De acuerdo con otro aspecto, se proporciona un aparato para codificar datos de audio e incluye: un módulo de obtención, configurado para obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta; y un módulo de transmisión, configurado para codificar la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua y transmitir la señal de ruido de banda baja codificada al utilizar el primer mecanismo de transmisión discontinua, y codificar la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua, donde una política para enviar una primera trama de SID del primer mecanismo de transmisión discontinua es diferente de una política para enviar una segunda trama de SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua .
De acuerdo con otro aspecto, se proporciona un aparato para decodificar datos de audio e incluye: un módulo de obtención, configurado para obtener un SID, y determinar si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; un primer módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención incluye el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por la decodificación y el parámetro de ruido de banda alta generado localmente; un segundo módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención incluye el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por la decodificación y el parámetro de ruido de banda baja generado localmente; y un tercer módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención incluye el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercer trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación.
De acuerdo con otro aspecto, se proporciona un sistema para procesar datos de audio e incluye el aparato anterior para codificar datos de audio y el aparato anterior para decodificar datos de audio.
Las soluciones técnicas proporcionadas por las modalidades de la presente invención aportan los siguientes efectos benéficos: una trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después la señal de ruido de banda baja se codifica y se transmite al utilizar un primer mecanismo de transmisión discontinua, y la señal de ruido de banda alta se codifica y se transmite al utilizar un segundo mecanismo de transmisión discontinua; un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja y/o un parámetro de * banda alta; y diferentes maneras de decodificación de ruido se utilizan de acuerdo con diferentes resultados de determinación. De esta forma, se utilizan diferentes maneras de procesamiento de codificación y decodificación para la señal de banda alta y la señal de banda baja, la complejidad del cálculo se puede reducir y los bits codificados se pueden guardar bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan pueden ayudar a alcanzar un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
BREVE DESCRIPCION DE LOS DIBUJOS Para describir las soluciones técnicas en las modalidades de la presente invención de manera más clara, lo siguiente introduce brevemente los dibujos de acompañamiento requeridos para describir las modalidades. Aparentemente, los dibujos de acompañamiento en la siguiente descripción muestran solamente algunas modalidades de la presente invención, y una persona experimentada en la materia puede aún derivar otros dibujos a partir de estos dibujos de acompañamiento sin esfuerzos creativos .
La Figura 1 es un diagrama de flujo de un método para procesar datos de audio de acuerdo con la Modalidad 1 de la presente invención.
La Figura 2 es un diagrama de flujo de un método para procesar datos de audio de acuerdo con la Modalidad 2 de la presente invención.
La Figura 3 es un diagrama de flujo de un método para procesar datos de audio de acuerdo con la Modalidad 3 de la presente invención.
La Figura 4 es un diagrama de flujo de un método para procesar datos de audio de acuerdo con la Modalidad 4 de la presente invención.
La Figura 5 es un diagrama esquemático de un aparato para codificar datos de audio de acuerdo con la Modalidad 6 de la presente invención.
La Figura 6 es un diagrama esquemático de otro aparato para codificar datos de audio de acuerdo con la Modalidad 6 de la presente invención.
La Figura 7 es un diagrama esquemático de un aparato para decodificar datos de audio de acuerdo con la Modalidad 7 de la presente invención.
La Figura 8 es un diagrama esquemático de otro aparato para decodificar datos de audio de acuerdo con la Modalidad 7 de la presente invención.
La Figura 9 es un diagrama esquemático de un sistema para procesar datos de audio de acuerdo con la Modalidad 8 de la presente invención.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Para hacer más claros los objetivos, soluciones técnicas, y ventajas de la presente invención, lo siguiente describe adicionalmente las modalidades de la presente invención a detalle con referencia a los dibujos de acompañamiento.
Modalidad 1 Haciendo referencia a la Figura 1, esta modalidad proporciona un método para procesar datos de audio, donde el método incluye lo siguiente: 101. Obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta. 102. Codificar y transmitir la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y codificar y transmitir la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua, donde una política para enviar una primera trama de descriptor de inserción de silencio SID del primer mecanismo de transmisión discontinua es diferente de una política para enviar un segundo SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua.
En esta modalidad, el primer SID incluye un parámetro de banda baja de la trama de ruido, y el segundo SID incluye un parámetro de banda baja o un parámetro de banda alta de la trama de ruido.
Opcionalmente, en esta modalidad, la codificación y transmisión de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua incluye: determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida; de ser asi, y se satisface una condición de envío de la política para enviar el segundo SID, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse .
La determinación de si la señal de ruido de banda alta tiene una estructura espectral preestablecida incluye: obtenér un espectro de la señal de ruido de banda alta, dividir el espectro en al menos dos sub-bandas, y si una energía promedio de cualquier primera sub-banda en las sub-bandas no es menor que una energía promedio de una segunda sub-banda en las sub-bandas, donde una banda de frecuencia en la cual se ubica la segunda sub-banda es mayor que una banda de frecuencia en la cual se ubica la primera sub-banda, confirmar que la señal de ruido de banda alta no tiene estructura espectral preestablecida; de otra forma, confirmar que la señal de ruido de banda alta tiene una estructura espectral preestablecida.
Opcionalmente , en este documento, la codificación y transmisión de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua incluye: generar un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación, donde la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido, y la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento donde un SID que incluye un parámetro de ruido de banda alta es enviado por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; de ser así, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse.
Opcionalmente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido .
Alternativamente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía promedio ponderada de las señales de ruido de banda alta de la trama de ruido y una trama de ruido antes de la trama de ruido con respecto a una energía promedio ponderada de las señales de ruido de banda baja de la trama de ruido y la trama de ruido antes de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía promedio ponderada de señales de banda alta con respecto a una energía promedio ponderada de señales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido.
En esta modalidad, la generación de un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación incluye: calcular por separado un valor logarítmico de la primera relación y un valor logarítmico de la segunda relación; y calcular un valor absoluto de una diferencia entre el valor logarítmico de la primera relación y el valor logarítmico de la segunda relación, para obtener el valor de extensión de desviación.
Opcionalmente, en esta modalidad, la codificación y transmisión de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua incluye: determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido, satisface una condición restablecida; de ser asi, codificar un SID de la señal de ruido de banda alta de la trama de ruido al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta de la trama de ruido no necesita codificarse y transmitirse.
La estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido incluye: un promedio ponderado de espectros de las señales de ruido de banda alta antes de la trama de ruido.
En esta modalidad, la condición de envío en la política para enviar el segundo SID del segundo mecanismo de transmisión discontinua además incluye: el primer mecanismo de transmisión discontinua que satisface una condición para enviar el primer SID.
La modalidad del método que se proporciona por la presente invención aporta los siguientes efectos benéficos: se obtiene una trama de ruido actual de una señal de audio, y la trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después se codifica y transmite la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y se codifica y transmite la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad de cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
Modalidad 2 Haciendo referencia a la Figura 2, esta modalidad proporciona un método para procesar datos de audio, donde el método incluye lo siguiente: 201. Un decodificador obtiene una trama de descriptor reinserción de silencio SID, y determina si el SID incluye un parámetro de banda baja o un parámetro de banda alta. 202. Si el SID incluye el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente . 203. Si el SID incluye el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente. 204. Si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación .
Opcionalmente, en esta modalidad, si el SID incluye el parámetro de banda baja, antes de decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, el método además incluye: si el decodificador está en un primer estado de generación de ruido de confort CNG, introducir, por medio del decodificador, un segundo estado de CNG.
Opcionalmente, en esta modalidad, si el SID incluye el parámetro de banda alta y el parámetro de banda baja, antes de decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación, el método además incluye: si el decodificador está en un segundo estado de CNG, introducir, por medio del decodificador, un primer estado de CNG.
Opcionalmente, en esta modalidad, la determinación de si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta incluye: si el número de bits del SID es menor gue un primer umbral preestablecido, confirmar que el SID incluye el parámetro de banda alta; si el número de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, confirmar que el SID incluye el parámetro de banda baja; y si el número de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, confirmar que el SID incluye el parámetro de banda alta y el parámetro de banda baja; o si el SID incluye un primer identificador , confirmar que el SID incluye el parámetro de banda alta; si el SID incluye un segundo identificador, confirmar que el SID incluye el parámetro de banda baja; y si el SID incluye un tercer identificador, confirmar que el SID incluye el parámetro de banda baja y el parámetro de banda alta.
En esta modalidad, generar localmente un parámetro de ruido de banda alta incluye: obtener por separado una energía promedio ponderada de una señal de ruido de banda alta y un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID; y obtener la señal de ruido de banda alta de acuerdo con la energía promedio ponderada obtenida de la señal de ruido de banda alta y el coeficiente de filtro de síntesis obtenido de la señal de ruido de banda alta en el momento correspondiente al SID.
Opcionalmente , en esta modalidad, obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID incluye: obtener una energía de una señal de banda baja de la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación; calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de banda alta se recibe antes del SID, para obtener una primera relación; obtener, de acuerdo con la energía de la señal de banda baja de la primera trama de CN y la primera relación, una energía de la señal de ruido de banda alta en el momento correspondiente al SID; y llevar a cabo promediación ponderada en la energía de la señal de ruido de banda alta en el momento correspondiente al SID y una energía de una señal de banda alta de una trama de CN almacenada en memoria intermedia (buffer) localmente, para obtener la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de C .
Opcionalmente, en esta modalidad, calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento donde se recibe un SID que incluye un parámetro de banda alta antes del SID, para obtener una primera relación, incluye : calcular una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación; o calcular una relación de una energía promedio ponderada de la señal de ruido de banda alta con respecto a una energía promedio ponderada de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación.
Cuando la energía de la señal de ruido de banda alta en el momento correspondiente al SID es mayor que una energía de una señal de banda alta de una trama de CN previa que se almacena en memoria intermedia localmente, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una primera tasa; de otra forma, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una segunda tasa, donde la primera tasa es mayor que la segunda tasa.
Opcionalmente, en esta modalidad, obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID incluye: seleccionar una señal de banda alta de una trama vocal con una energía de señal de banda alta mínima de tramas vocales dentro de un período preestablecido de tiempo antes del SID; y obtener, de acuerdo con una energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN; o seleccionar señales de banda alta de N tramas vocales con una energía de señal de banda alta menor que un umbral preestablecido de tramas vocales dentro de un período de tiempo preestablecido antes del SID; y obtener, de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN .
Opcionalmente, en esta modalidad, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID incluye: distribuir M coeficientes de frecuencia espectral de inmitancia (ISF, Immittance Spectral Frequency) o coeficientes de ISP o coeficientes de frecuencia espectral de linea (LSF, Line Spectral Frequency) o coeficientes de par espectral de línea (LSP, Line Spectral Pair) en un rango de frecuencia correspondiente a la señal de banda alta; llevar a cabo procesamiento de randomización en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas, donde ambos M y N son números naturales; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
Opcionalmente , en esta modalidad, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID incluye: obtener M coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente; llevar a cabo procesamiento de randomi zación en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los ¦ M coeficientes cambia después de cada .N tramas; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
Opcionalmente, en esta modalidad, antes de obtener una primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, el método además incluye : cuando las tramas de historia adyacentes al SID son tramas vocales codificadas, si una energía promedio de las señales de banda alta o una parte de las señales de banda alta que se decodifican a partir de las tramas vocales codificadas es. menor que una energía promedio de las señales de ruido de banda alta o una parte de las señales de ruido de banda alta que se generan localmente, multiplicar las señales de ruido de banda alta de las L tramas subsecuentes iniciando desde el SID por un factor de suavizado menor que 1, para obtener una nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente; y correspondientemente, obtener la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente incluye: obtener una cuarta trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID, y la nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
La modalidad de método que se proporciona por la presente invención aporta los siguientes efectos benéficos: un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; si el SID incluye el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda baja, genera localmente un parámetro de ruido de banda alta, y obtiene una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente; si el SID incluye el parámetro de banda alta, decodifica el SID para obtener un parámetro de ruido de banda alta, genera localmente un parámetro de ruido de banda baja, y obtiene una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente; y si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad del cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
Modalidad 3 Esta modalidad proporciona un método para procesar datos de audio. En un extremo decodificación, independientemente de un espectro de ruido de CNG de banda baja o un espectro de ruido de CNG de banda alta, generalmente, se pierde una estructura armónica, y por lo tanto, en una señal de banda alta de CNG, que es perceptualmente efectiva en audición es principalmente una energía de la señal de banda alta de CNG, y no una estructura espectral de la señal de banda alta de CNG por lo tanto, en transmisión de DTX de una señal de súper banda ancha, en muchos casos, es innecesario transmitir un espectro de señal de banda alta en un SID; en su lugar, se puede utilizar un método apropiado para construir un espectro de banda alta localmente en un extremo de decodificación. El espectro de banda alta construido localmente no provocará una distorsión perceptual obvia. De esta forma, las cargas de cálculo y los bits para calcular y codificar el espectro de banda alta se guardan en el extremo decodificación. Mientras tanto, para otras señales de ruido, puede existir una estructura armónica en una señal de banda alta de las mismas, y construir un espectro de banda alta localmente sólo en el extremo de decodificación puede provocar un problema de deterioro de calidad perceptual en cambiar entre un segmento de CNG y un segmento vocal. Por lo tanto, para tal ruido, un parámetro espectral necesita ser transmitido en un SID. Se puede observar que un sistema de DTX/CNG que toma en cuenta tanto la eficiencia como la calidad debe ser capaz de seleccionar de manera adaptable para codificar o seleccionar no para codificar un parámetro espectral de banda alta en un SID en el extremo decodificación de acuerdo con una característica de banda alta de ruido de fondo, y reconstruir una trama de CNG en el extremo de decodificación al utilizar diferentes métodos de decodificación de acuerdo con diferentes tipos de SIDs. En esta modalidad, se proporciona un método para procesar datos de audio e incluye lo siguiente: se analiza y se clasifica un espectro de ruido de banda alta; un decodificador construye ciegamente un espectro de señal de banda alta; cuando un SID no incluye un parámetro de energía de banda alta, el decodificador estima una energía de señal de banda alta; y el decodificador cambia entre diferentes módulos de CNG, y así sucesivamente. Haciendo referencia a la Figura 3, específicamente, un método para procesar datos de audio en un extremo codificador de acuerdo con esta modalidad incluye: 301. Un codificador obtiene una trama de ruido de una señal de audio, y descompone la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta.
En esta modalidad, debido a diferentes reglas de codificación del codificador, el codificador obtiene una trama de ruido de una señal de audio, y la trama de ruido puede ser una trama de ruido actual, o puede ser una trama de ruido almacenada en memoria intermedia en el extremo codificador, lo cual no se limita específicamente en esta modalidad. En esta modalidad, las señales de audio de entrada de súper banda ancha muestreadas a 32 kHz se utilizan como un ejemplo. El codificador primero lleva a cabo el procesamiento de tramas en las señales de audio de entrada, por ejemplo, 20 ms (o 640 puntos de muestreo) se utilizan como una trama. Para la trama actual (en esta modalidad, la trama actual se refiere a una trama actual que se va a codificar) , el codificador primero lleva a cabo filtración de pase alto. Generalmente, un pase de banda se refiere a las frecuencias más altas que 50 Hz. La trama actual filtrada por paso alto se descompone en una señal de banda baja s0 y una señal de banda alta si por medio de un filtro de análisis de filtro de espejo de cuadratura (QMF, Quadrature Mirror Filter) . La señal de banda baja s0 se muestrea en 16 kHz, y representa un espectro de 0-8 kHz de la trama actual. La señal de banda alta Si también se muestrea en 16 kHz, y representa un espectro de 8-16kHz de la trama actual. Cuando un detector de actividad de voz (VAD, Voice Activity Detector) indica que una trama actual es una trama de señal de primer plano, esto es, una trama de señal vocal, el codificador lleva a cabo codificación vocal en la trama actual. En esta modalidad, que el codificador codifique la trama vocal codificada pertenece al alcance del arte actual, y los detalles no se describen repetidamente en esta modalidad. El VAD indica que el codificador entra un estado de trabajo de DTX cuando la trama actual es una trama de ruido. En esta modalidad, la trama de ruido se refiere a cualquiera de una trama de ruido de fondo o una trama de silencio.
En esta modalidad, en el estado de trabajo de DTX, un controlador de DTX decide, de acuerdo con una política de envío de SID, si codifica y envía un SID de la señal de banda baja de la trama actual. En esta modalidad, la política para enviar un SID de una señal de banda baja es como sigue: (1) enviar una SID en una primera trama de ruido después de una trama vocal codificada, y ajusfar un señalizador de envío de SID flagsiD en 1; (2) en un periodo de ruido, enviar una trama de SID en una enésima (N) trama después de cada trama de SID, y ajustar flagSiD en 1 en la trama, donde N es un entero mayor que 1 y se introduce externamente al codificador; y (3) en el periodo de ruido, no enviar ningún SID en otras tramas, y ajustar flagSID en 0. En esta modalidad, la política para enviar un SID de una señal de banda baja es similar a la del arte actual, y no se describe a detalle en la presente invención . 302. Determinar si la señal de banda alta de la trama de ruido actual satisface una condición decodificación y transmisión preestablecida; de ser así, llevar a cabo el paso 304; de no ser así, llevar a cabo el paso 303.
En esta modalidad, la determinación de si la señal de banda alta de la trama de ruido actual satisface una condición decodificación y transmisión preestablecida incluye: determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida; de ser así, y se satisface una condición de envío de una política para enviar el segundo SID, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse. La determinación de si la señal de ruido de banda alta tiene una estructura espectral preestablecida incluye: obtener un espectro de la señal de ruido de banda alta, dividir el espectro en al menos dos sub-bandas, y si una energía promedio de cualquier primer sub-banda en la sub- bandas no es menor que una energía promedio de una segunda sub-banda en la sub-bandas, donde una banda de frecuencia en la cual se ubica la segunda sub-banda es mayor que una banda de frecuencia en la cual se ubica la primera sub-banda, confirmar que la señal de ruido de banda alta no tiene estructura espectral preestablecida; de otra forma, confirmar que la señal de ruido de banda alta tiene una estructura espectral preestablecida.
En esta modalidad, en el estado de trabajo de DTX, el codificador lleva a cabo análisis espectral en la señal de banda alta s de la trama de ruido actual para determinar si si tiene una estructura espectral aparente, esto es, una estructura espectral preestablecida. Un método específico en esta modalidad es como sigue: la reducción de resolución a 12.8 kHz se lleva a cabo en Si, y se lleva a cabo FFT de 256 puntos en la señal con reducción de resolución para obtener un espectro C(i), donde i = 0, ... 127. C(i) se divide en four cuatro sub-bandas de un ancho igual, y se calcula una energía E(i) de cada sub-banda. Cada sub-banda es cualquier primer mi) sub-banda mencionada anteriormente. E(i = ?C(i) , donde i = 0, =/(/) 3, l(i) y h(i) respectivamente representan un límite superior y límite inferior de la i* sub-banda, l(i) = {0, 32, 64, 96}, y h(i) = {31, 63, 95, 127}. Si la siguiente condición se satisface se comprueba: E(i)>VE(j) j>i (1) donde, E(j) es la segunda sub-banda mencionada anteriormente. Si la fórmula (1) anterior se satisface, esto es, si la energía de cualquier primera sub-banda en las sub-bandas no es menor que la energía de la segunda sub-banda en las sub-bandas, se considera que la señal de banda alta no tiene una estructura espectral aparente; de otra forma, la señal de banda alta tiene una estructura espectral aparente. Si la señal de banda alta tiene una estructura espectral aparente, una política de DTX es enviar un parámetro de banda alta. En esta modalidad, si un señalizador de envío de parámetro de banda alta flaghb no es 1, flaghb = 1 se establece la siguiente vez cuando flagSiD = 1; de otra forma, flaghb = 0.
En esta modalidad, cuando se satisface la condición de envío de SID, ya sea necesario codificar y transmitir la señal de banda alta de la trama de ruido actual se puede determinar utilizando la estructura espectral de la señal de banda alta de la trama de ruido actual, y la determinación de si la señal de ruido de banda alta tiene una estructura espectral preestablecida y si la señal de ruido de banda baja satisface la condición de envío de SID se utiliza como una primera condición de determinación. Opcionalmente , en esta modalidad, determinar si la señal de banda alta de la trama de ruido actual satisface una condición preestablecida y condición de envío incluye: generar un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación, donde la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido, y la segunda relación es una relación de energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; de ser así, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse. Opcionalmente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando un SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido. Alternativamente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía promedio ponderada de las señales de ruido de banda alta de la trama de ruido y una trama de ruido antes de la trama de ruido con respecto a una energía promedio ponderada de las señales de ruido de banda baja de la trama de ruido y la trama de ruido antes de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía promedio ponderada de señales de banda alta con respecto a una energía promedio ponderada de señales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía última vez antes de la trama de ruido. En esta modalidad, preferiblemente, la generación de un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación incluye: calcular por separado un valor algorítmico de la primera relación y un valor algorítmico de la segunda relación; y calcular un valor absoluto de una diferencia entre el valor logarítmico de la primera relación y el valor logarítmico de la segunda relación, para obtener el valor de extensión de desviación.
Específicamente, en esta modalidad, la determinación de si el valor de extensión de desviación alcanza un umbral preestablecido se puede implementar en la siguiente manera: en el estado de trabajo de DTX, el codificador calcula por separado las energías logarítmicas ei y eo de la señal de banda alta si y la señal de banda baja s0 de la trama actual. ß?=10·1?&0(? ,()2) x = 0,l / = 0,1,...,319 (2) Los promedios en movimiento a largo plazo eia y e0a de ei y eo en el extremo de codificación se actualizan: *«, = " +c -sign[eMI - MIN^ -e£ \ x = 0,\ (3) donde, sign [ . ] Representa una función sign, MIN[.] Representa una función de mínimo, | . | Representa una función de valor absoluto, la forma x(_1) representa un valor de una trama previa x, y a = 0.1 es un factor de olvido que decide si una velocidad de actualización es alta o baja. La trama previa es el SID que se envía por última vez antes de la trama de ruido actual e incluye el parámetro de ruido de banda alta. En esta modalidad, una magnitud de actualización de eia y eoa es limitada. Si una variación de energía entre ex de la trama de ruido actual y exa de la trama previa es mayor que 3dB, exa de la trama actual se actualiza por 3dB. Cuando el codificador introduce el estado de trabajo de DTX para el primer tiempo, exa se inicializa como ex de la trama actual. El codificador comprueba si una desviación entre la relación (es decir, la primera relación) de la energía de la señal de banda alta con respecto a la energía de la señal de banda baja de la trama de ruido actual y la relación (la segunda relación) de la energía de la banda alta con respecto a la energía de la banda baja en el momento en que el SID que incluye el parámetro de banda alta se envia por última vez alcanza una extensión, esto es, se comprueba si se satisface la siguiente condición: |(e0a- -(eou-ej|>4.5 (4) donde e^, y e a respectivamente representan una energía logarítmicas demanda alta y una energía logarítmicas demanda baja en el momento en que la trama de SID que incluye el parámetro de banda alta se envía por última vez. Si se satisface la fórmula (4) anterior, la señal de ruido de banda alta necesita ser codificada y transmitida. Si el parámetro de banda alta que envía el señalizador flaghb - 0, se establece flaghb = 1 · En esta modalidad, la promediación de movimiento a largo plazo es un tipo de cálculo de promedio ponderado, que no se limita específicamente en esta modalidad.
En esta modalidad, la determinación de si el valor de extensión de desviación alcanza un umbral preestablecido se puede utilizar como una segunda condición de determinación. En un proceso de implementación específica, para determinar si la señal de ruido de banda alta necesita ser codificada y transmitida, se necesita determinar cualquiera de la primera condición de determinación o la segunda condición de determinación, lo cual no se limita específicamente en esta modalidad .
En esta modalidad, la segunda condición de determinación es opcional. Un propósito de llevar a cabo este paso es ayudar a un extremo de decodificación en estimar localmente la energía del ruido de banda alta de acuerdo con la energía del ruido de banda baja y la relación de la energía del ruido de banda alta con respecto a la energía del ruido de banda baja en el momento en que el SID que incluye el parámetro de banda alta se envía por última vez. Específicamente, si el valor de extensión de desviación no se calcula en el extremo de codificación, se puede obtener una trama vocal con una energía de señal de banda alta mínima en el extremo de decodificación a partir de tramas vocales dentro de un periodo de tiempo antes de la trama de ruido actual, y la energía del ruido de banda alta actual se estima localmente de acuerdo con una energía de una señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales dentro del periodo de tiempo antes de la trama de ruido actual. Por ejemplo, la energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales dentro del periodo de tiempo antes de la trama de ruido actual se selecciona como la energía del ruido de banda alta actual.
Alternativamente, las señales de banda alta de N tramas vocales con una energía de señal de banda alta menor que un umbral preestablecido se seleccionan de las tramas vocales dentro de un período de tiempo preestablecido antes del SID; y la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID se obtiene de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales. Específicamente, no se establece ninguna limitación en esta modalidad. 303. Transmitir la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua.
En esta modalidad, preferiblemente, la transmisión de la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua incluye: en el estado de trabajo de DTX, el codificador lleva a cabo análisis de predicción lineal de 16° orden en la señal de banda baja s0 de la trama de riesgo actual, y obtiene 16 coeficientes de predicción lineal lpc(i), donde i = 0,1, ... ,15. Dos coeficientes de LPC se transforman coeficientes de ISP para obtener 16 coeficientes de ISP isp(i), donde i = 0,1, ... ,15, y los coeficientes de ISP se almacenan en memoria intermedia. Si un SID se codifica en la trama actual, esto es, flagSID = 1, se busca un coeficiente de ISP medio en los coeficientes de ISP almacenados en memoria intermedia de las N tramas de historia incluyendo la trama actual. Un método es como sigue: primero, calcular una distancia d desde un coeficiente de ISP de cada trama hasta un coeficiente de ISP de otra trama: después, seleccionar un coeficiente de ISP de una trama con el d más pequeño como un coeficiente de ISP ÍSPSID(Í) qu© se va a codificar, donde i = 0, ... ,15; transformar ispSID(i) a un coeficiente de ISF isfSID(i), cuantificar el isfSID(i), obtener y encapsular un grupo de índices cuantificados idxISF en el SID; decodificar localmente el idxISF; obtener un coeficiente de ISF decodificario isf'(i), donde i = 0, ... ,15; transformar isf (i) a un coeficiente de ISP isp' (i), donde i = 0, ... ,15, almacenar en memoria intermedia el isp1 (i); para cada trama de ruido, actualizar un promedio de movimiento largo plazo de los coeficientes de ISP decodificados del extremo de ubicación al utilizar el isp' (i) almacenado en memoria intermedia: ispa(i) = a - ispl~, ) (i) + (\ - a) - isp'(i) / = 0,1,...15 (6) donde, preferiblemente, ce = 0.9, e ispa(i) se inicializa en como isp' (i) de un primer SID; transformar ispa(i) a un coeficiente de LPC lpca(i), obtener un filtro de análisis A(Z); filtrar la señal de banda baja s0 de cada trama de ruido por el A(Z) para obtener una señal residual r(i), donde i = 0,1, ... 319, y calcular una energía residual logarítmicas En esta modalidad, er se almacena en memoria intermedia. Donde el flagSID de la trama de ruido actual es 1, una energía logarítmicas promedio ponderada eSiD se calcula de acuerdo con er almacenada en memoria intermedia de M tramas de historia incluyendo la trama de ruido actual: Donde i(k) es un grupo de coeficientes positivos tridimensionales, y una suma de los mismos es menor que 1. Se cuantifica eSiD, y se obtiene un índice cuantificado idxe.
En esta modalidad, el estado de trabajo de DTX, cuando flagSID = 1, si flaghb = 0, solamente se codifica un parámetro de banda baja y se envía en una trama de SID, y en este caso, la trama de SID se forma del idxiSF e idxe, y se denomina como una trama de SID pequeño por conveniencia.
En esta modalidad, la política para codificar y transmitir una señal de ruido de banda baja es similar a una política para codificar y transmitir una señal de ruido de banda ancha en el arte actual. Solamente se proporciona una breve introducción en esta modalidad. El proceso específico de implementación no se describe a detalle en esta modalidad. En esta modalidad, la señal de ruido de banda alta de la trama de ruido actual no necesita codificarse, y solamente se codifica la señal de ruido de banda baja. Por lo tanto, se reduce una carga de cálculo en el extremo de codificación, y se guardan bits de transmisión. 304. Transmitir la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y transmitir la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua.
En esta modalidad, si flagb = lr además de que un parámetro de banda baja necesita ser codificado, un parámetro de banda alta también necesita ser codificado en un SID. La codificación de un parámetro de banda baja de ruido de banda baja es la misma que el modo de codificación en el paso 303, y los detalles no se describen repetidamente en esta modalidad. En esta modalidad, preferiblemente, el método para codificar un parámetro de banda alta es como sigue: solamente cuando el codificador está en el estado de trabajo de DTX y flagsiD = 1, el codificador lleva a cabo análisis de predicción lineal de 10° orden en la señal de banda alta Si de la trama actual, y obtiene 10 coeficientes de predicción lineal lpc(i), donde i = 0,1, ... ,9. lpc(i) se pondera: lpcw (i) = w2 (i)¦ lpc(í) i = 0,1, ...9 ( 8 ) Y se obtiene el coeficiente de LPC ponderado lpcw(i), donde w2(i) representa un grupo de factores de ponderación 9-dimensionales que son menores o iguales a 1. lpc„(i) se transforma a un coeficiente de LSP para obtener 10 coeficientes de LSP lsp„ (i), donde i = 0,1, ... ,9, y un promedio en movimiento largo plazo de lspw (i) del extremo de codificación se actualiza de acuerdo con lspw (i) . lspa(i) = -lsp\;' í) + (\ -a) -lspw(i) i = 0,1,...9 ( 9 ) donde, preferiblemente, a = 0.9, y lspa (i) se inicializa como lspw (i) de la trama actual cada vez que flaghb cambia de 0 a 1. Cuando el SID necesita incluir parámetros de banda alta, se cuantifica lspd (i), y se obtiene un grupo de índices cuantificados ídxLSP. Se cuantifica un promedio en movimiento largo plazo eXa de las energías logarítmicas de las señales de banda alta en el extremo de cuantificación, y se obtiene un índice cuantificado idxE. En este caso, el SID se forma del idxISF> idxe, idxLSP, e idxE. En esta modalidad, el SID formado del idxISFí idxe, idxLSp, e idxE se denomina como un SID grande.
Opcionalmente, lspa (i) también se puede actualizar continuamente en el estado de trabajo de DTX. Esto es, no importa si el valor de flaghb es 1 o 0, lspa (i) se actualiza. Específicamente, el método para actualizar lspa (i) cuando flagh = 0 es el mismo que el método anterior cuando flaghb = 1, y los detalles no se describen repetidamente en esta modalidad .
En esta modalidad, un principio de la política para codificar una señal de ruido de banda alta es similar al de la política para codificar una señal de ruido de banda baja. Solamente se proporciona una breve introducción en esta modalidad. El proceso de implementación específica no se describe a detalle en esta modalidad.
En esta modalidad, cuando se satisface la condición para codificar y transmitir una señal de ruido de banda alta, la codificación y transmisión de la señal de ruido de banda alta siempre se llevan a cabo simultáneamente con la codificación y transmisión de una señal de ruido de banda baja. Sin embargo, opcionalmente, la codificación y transmisión de la señal de ruido de banda alta pueden también no llevarse a cabo simultáneamente con la codificación y transmisión de la señal de ruido de banda baja. Esto es, cuando se envía el SID, pueden existir tres casos posibles: (1) solamente se codifica y transmite la señal de banda baja de la trama de ruido actual; (2) solamente se codifica y transmite la señal de banda alta de la trama de ruido actual; y (3) se codifican y transmiten simultáneamente la señal de banda baja y la señal de banda alta de la trama de ruido actual, y en este caso, la condición de envío en la política para enviar el segundo SID del segundo mecanismo de transmisión discontinua además incluye: el primer mecanismo de transmisión discontinua que satisface la primera condición de envío de SID. Los tres casos de envío del SID no se limitan específicamente en esta modalidad.
En esta modalidad, los pasos 302 a 304 son específicamente pasos para codificar y transmitir la señal de ruido de banda baja al utilizar el primer mecanismo de transmisión discontinua, y codificar y transmitir la señal de ruido de banda alta al utilizar el segundo mecanismo de transmisión discontinua, donde una política para enviar una primera trama de descriptor de inserción de silencio SID del primer mecanismo de transmisión discontinua es diferente de una política para enviar un segundo SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua.
La modalidad del método que se proporciona por la presente invención aporta los siguientes efectos benéficos: se obtiene una trama de ruido actual de una señal de audio, y la trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después se codifica y transmite la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y se codifica y transmite la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad de cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
Modalidad 4 Esta modalidad proporciona un método para procesar datos de audio. En comparación con el procesamiento de una señal de ruido en un extremo de codificador, un extremo de decodificador puede determinar, de acuerdo con un flujo de bits recibido, si la trama actual es una trama vocal codificada o un SID o una trama sin datos (NO_DATA) . La trama NO DATA es una trama que indica que el extremo de codificación no codifica y envía un SID en un período de ruido. Cuando la trama actual es un SID, el decodi ficador puede además determinar, de acuerdo con el número de bits del SID, si el SID incluye un parámetro de banda baja y/o banda alta. Opcionalmente, el decodificador puede también determinar, de acuerdo con un identificador específico insertado en el SID, si el SID incluye un parámetro de banda baja y/o banda alta. Esto requiere que un bit identificador adicional se debe agregar cuando el SID se codifica. Por ejemplo, cuando se inserta un primer identificador en el SID, éste identifica que el SID incluye solamente un parámetro de banda alta; cuando se inserta un segundo identificador, éste define que el SID incluye solamente un parámetro de banda baja, y cuando se inserta un tercer identificador , éste identifica que el SID incluye un parámetro de banda alta y un parámetro de banda baja. Si la trama actual es una trama vocal codificada, el decodificador de codifica la trama vocal. El proceso de procesamiento especifico es similar al del arte actual, y no se describe a detalle en esta modalidad. Cuando la trama actual es un SID o una trama NO_DATA, el decodificador selecciona, de acuerdo con un estado de trabajo especifico de CNG, un método correspondiente para reconstruir una trama de C . En esta modalidad, la CNG tiene dos estados de trabajo: un estado de CNG de decodificación media correspondiente a una trama de SID pequeña, es decir, un primer estado de CNG, y un estado de CNG de decodificación completa correspondiente a una trama de SID grande, es decir, un segundo estado de CNG. En el estado de CNG de decodificación completa, el decodificador reconstruye una trama de CN de acuerdo con un parámetro de ruido de banda alta y un parámetro de ruido de banda baja obtenidos al decodificar una trama de SID grande. En el estado de CNG de decodificación media, el decodificador reconstruye una trama de CN de acuerdo con un parámetro de ruido de banda baja obtenido al decodificar una trama de SID pequeña y un parámetro de ruido de banda alta estimado localmente. Cuando la trama actual en el extremo de decodificación es una trama de SID grande, si un señalizador flagc G es 0 (que indica el estado de CNG de decodificación media), el señalizador de estado de trabajo de CNG flagNG se establece como 1 (que indica el estado de CNG de decodificación completa) ; de otra forma, el estado original permanece sin cambios. De manera similar, cuando la trama actual en el extremo de decodificación es una trama de SID pequeña, si el señalizador de estado de trabajo de CNG es 1, el señalizador de estado de trabajo de CNG flagc G se establece como 0; de otra forma, el estado original permanece sin cambios. Haciendo referencia a la Figura 4, específicamente esta modalidad proporciona un método para procesar datos de audio en un extremo de decodificador, donde el método incluye lo siguiente: 401. Un decodificador obtiene un SID, y si el SID incluye un parámetro de banda alta y un parámetro de banda baja, de codifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación.
En esta modalidad, después de recibir una trama vocal codificada enviada por un extremo de codificador, el extremo de decodificador primero determina el tipo de trama vocal, de tal forma que diferentes maneras de decodificación se utilizan correspondientemente de acuerdo con diferentes tipos de tramas vocales. Específicamente, si el número de bits del SID es más pequeño que un primer umbral preestablecido, se confirma que el SID incluye el parámetro de banda alta; si el número de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, se confirma que el SID incluye el parámetro de banda baja; y si el número de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, se confirma que el SID incluye el parámetro de banda alta y el parámetro de banda baja. Alternativamente, si el SID incluye un primer identificador, se confirma que el SID incluye el parámetro de banda alta; si el SID incluye un segundo identificador, se confirma que el SID incluye el parámetro de banda baja; o si el SID incluye un tercer identificador, se confirma que el SID incluye el parámetro de banda baja y el parámetro de banda alta.
En esta modalidad, si el SID incluye el parámetro de banda alta y el parámetro de banda baja, el SID se decodifica para obtener el parámetro de ruido de banda alta y el parámetro de ruido de banda baja, y se obtiene la tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación. Específicamente, el decodificador decodifica el SID para obtener una energía logarítmica de excitación de banda baja decodificada eD, un coeficiente de ISF debe banda baja isfd(i), una energía logarítmicas de banda alta ED, y coeficiente de LSP de banda alta lspd(i) . El isfd(i) se transforma a un coeficiente de ISP ispd(i), y eD y ED se transforman a las energías ed y Ed, donde £,,=10°"" y ed = 2 " r y entonces ispd(i), ed, lspd(i), y Ed se almacenan en memoria intermedia { buffered) .
En esta modalidad, cuando el decodificador está en el estado de trabajo de CNG y flagCNG = 1, sin importar si la trama actual es una trama de SID o una trama NO_DATA, los ispd(i), ed, lspd(i), y Ed almacenados en memoria intermedia se utilizan para actualizar un promedio de movimiento a largo plazo de cada uno de los ispd(i), ed, lspd(i), y Ed almacenados en memoria intermedia en el extremo de decodificación: ÍSPCNO) = A¦ »??:?/?( + (!-«)· ispÁ / = 0,1,...15 lsp,N ( ) = ߦ Ispü>(i) + (1 - ß)¦ lspd (i) = 0,1,-9 (10) ECN=p.E + {\-pyEd donde, a = 0.9, y ß = 0.7. ECN se almacena en memoria intermedia en una memoria intermedia de energía de banda alta Eioid- energía pequeña aleatoria se agrega con base en ec , y una energía de excitación final e ' C que se utiliza para reconstruir una señal de ruido de banda baja se obtiene: eN =(1 + 0.00001 \ RND e(N) -e{N , donde RND representa un número aleatorio dentro de un rango de [-32767, 32767]. En esta modalidad, se genera una secuencia de ruido blanco de 320 puntos exco(i), donde i = 0,1, ... 319. e'CN se utiliza para llevar a cabo ajuste de ganancia en exco(i) para obtener exc'o(i), esto es, exco(i) se multiplica por un coeficiente de ganancia Go, de tal forma que la energía de exc'o(i) es igual a e'cN> donde ÍSPCN(Í) se transforma a un coeficiente de LPC para obtener un filtro de síntesis 1/A0(Z), la excitación de ganancia ajustada exc'o(i) se utiliza para excitar el filtro 1/A(Z) para obtener una señal de CN de banda baja s'0 que se reconstruye en el extremo de decodificación y se muestrea a 16 kHz, y se calcula una energía de s'o y se almacena en memoria intermedia en una memoria intermedia de energía de banda baja E0oid- En esta modalidad, el procesamiento de una señal de ruido de banda alta en el extremo de decodificación es similar al procesamiento de una señal de ruido de banda baja. Se genera otra secuencia de ruido blanco de 320 puntos exci(i), donde i = 0,1, ... 319, lspCN(i) se transforma a un coeficiente de LPC para obtener un filtro de síntesis l/Ai(Z), y exci(i) se utiliza para excitar el filtro l/Ai(Z) para obtener una señal de CN de banda alta de ganancia no ajustada s~i(i). s~i(i) se multiplica por los coeficientes de ganancia Gi y G2, donde G2 = 0.8 , y se obtiene una señal de CN de banda alta s'i que se reconstruye en el extremo de decodificación y se muestrea a 16 kHz, donde, En esta modalidad, el propósito de G2 es llevar a cabo la supresión de energía en la señal de ruido reconstruida en alguna medida.
En esta modalidad, en el extremo de decodificador, s'o y s'i se pasan a través de un filtro de síntesis de QMF, y se obtiene finalmente una primera trama de CN que se reconstruye por el decodificador y se muestrea a 32 kHz. 402. Si el SID incluye el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente.
En esta modalidad, cuando el decodificador está en el estado de trabajo de CNG y flagcG = 0, sin importar si la trama actual es una trama de SID o una trama NO_DATA, se obtiene una señal de CN de banda baja s'o que se reconstruye en el extremo de decodificación y se muestrea a 16 kHz de acuerdo con el mismo método que se utiliza cuando flagcNG = lr es decir, el método en el paso 402, el cual no se describe adicionalmente en esta modalidad.
En esta modalidad, se obtiene una señal de banda alta de la primera trama de CN todavía al utilizar el método de excitar un filtro de síntesis al utilizar ruido blanco, excepto que se obtienen una energía de la señal de banda alta de la primera trama de CN y un coeficiente de filtro de síntesis al llevar a cabo la estimación localmente. En esta modalidad, la generación localmente de un parámetro de ruido de banda alta incluye: obtener por separado una energía promedio ponderada de una señal de ruido de banda alta y un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID; y obtener la señal de ruido de banda alta de acuerdo con la energía promedio ponderada obtenida de la señal de ruido de banda alta y el coeficiente de filtro de síntesis obtenido de la señal de ruido de banda alta en el momento correspondiente al SID.
En esta modalidad, preferiblemente, obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID incluye: obtener una energía de una señal de banda baja de la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación; calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando se recibe un SID que incluye un parámetro de banda alta antes del SID, para obtener una primera relación; obtener, de acuerdo con la energía de la señal de banda baja de la primera trama de CN y la primera relación, una energía de la señal de ruido de banda alta en el momento correspondiente al SID; y llevar a cabo promediación ponderada en la energía de la señal de ruido de banda alta en el momento correspondiente al SID y una energía de una señal de banda alta de una trama de CN almacenada en memoria intermedia localmente, para obtener la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN . Opcionalmente, calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando se recibe un SID que incluye un parámetro de banda alta antes del SID, para obtener una primera relación, incluye: calcular una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación; o calcular una relación de una energía promedio ponderada de la señal de ruido de banda alta con respecto a una energía promedio ponderada de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación. La energía instantánea es la energía obtenida por decodificación. Cuando la energía de la señal de ruido de banda alta en el momento correspondiente al SID es mayor que una energía de una señal de banda alta de una trama de CN previa que se almacena en memoria intermedia localmente, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una primera tasa; de otra forma, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una segunda tasa, donde la primera tasa es mayor que la segunda tasa .
Específicamente, en esta modalidad, obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID se puede implementar al utilizar el siguiente método: obtener una energía E0 de la señal de banda baja de la primera trama de CN s'0 de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación ; estimar, de acuerdo con la energía El0id de la señal de banda alta y E0oid de la señal de banda baja de la trama de CN previa en el estado de CNG de decodificación completa E0, una energía E~x de la señal de ruido de banda alta en el momento correspondiente al SID, donde Et~ E0 ; y actualizar un promedio de movimiento largo plazo ECN de energías de señal de CN de banda alta en el extremo de decodificación al utilizar E~i : EN - ?· E({^ +(1 - X)· E[ , donde un coeficiente ? es una variable, cuando E~i > ECN, X = 0.98; de otra forma, ? = 0.9, donde X = 0.98 es una primera tasa, y ? = 0.9 es una segunda tasa.
En esta modalidad, si un valor de extensión de desviación no se calcula en el extremo de codificación, opcionalmente, obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID incluye: seleccionar una señal de banda alta de una trama vocal con una energía de señal de banda alta mínima de tramas vocales dentro de un periodo preestablecido de tiempo antes del SID; y obtener, de acuerdo con una energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID; o seleccionar señales de banda alta de N tramas vocales con una energía de señal de banda alta menor gue un umbral preestablecido de tramas vocales dentro de un período de tiempo preestablecido antes del SID; y obtener, de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN .
En esta modalidad, preferiblemente, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID incluye: distribuir M coeficientes de frecuencia espectral de inmitancia ISF o coeficientes de par espectral de inmitancia ISP o coeficientes de frecuencia espectral de línea LSF o coeficientes de par espectral de línea LSP en un rango de frecuencia correspondiente a la señal de banda alta; llevar a cabo procesamiento de randomización en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas, y N puede ser una variable; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
Específicamente, en esta modalidad, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID se puede implementar al utilizar el siguiente método: Nueve coeficientes de ISF isfext(i) se distribuyen uniformemente en una banda de frecuencia de -16 kHz correspondientes a coeficientes de ISF de banda baja isfd(14), donde i = 0,1, ... 8 : isf^ (i) = i fd (14) + 0.1 - (i + !) ·(! 6000 - isfd (14)) / = 0,1,-8 (11) isfext(i) se transforma a una banda de frecuencia de 0-8 kHz, y isf'ext(i) se obtiene: isfa, (i) = isfal(0-8000 = 0,1,...8 (12) isf'ext(i) cerrando misa al utilizar un grupo de factores de randomización 9-dimensionales R(i), donde i = 0,1, ... 8, y se obtiene un coeficiente de ISF randomizado isfi(i) : isf (i) = R(i)¦ (i (1) - isfnl (0)) + is (i) i = 0,1,...8 (13) donde, R(i) se obtiene de acuerdo con la siguiente fórmula ( 14 ) : R{í) = a - R(- )(i) + (\ -a) - R, {i) / = 0,1,...8 (14) donde, ce = 0.8, y Rt(i) se denomina como un factor de randomización objetivo, y se obtiene de acuerdo con la siguiente fórmula: mod(cnt, 10) = 0 = 0,1,...8 (15) mod(cm, 10)?0 En la fórmula anterior (15), RN de representa un grupo de secuencias de número aleatorio 9-dimensional , y los números aleatorios en cada dimensión son diferentes entre ellos y todos caen dentro de un rango de [-1, 1] . cnt es un contador de tramas. En el estado de trabajo de CNG, cuando flagc G = 0/ para cada trama de SID por trama NO_DATA frame, se suma 1 al contador. mod(cnt, 10) representa cnt mod 10. En otra modalidad, cuando se calcula Rt(i), 10 in mod (cnt, 10) puede también ser una variable, por ejemplo, mod(cnl, N) = 0 i = 0,1,...8 mod(cnt, N)?0 (16) mod(cnt, N{~ ) ) = 0 mod(cm, N ))?0 donde, RND representa un número aleatorio dentro de un rango de [-1, 1], que no se limita específicamente en esta modalidad .
En esta modalidad, se utiliza un coeficiente de ISF de banda baja isfd(15) como isfi(9), y se sintetiza con un coeficiente de ISF aleatorizado isfi(i), donde i = 0,1, ... 8, para formar un coeficiente de ISF de filtro de 10°-orden, el cual después se transforma a un coeficiente de LPC lpci(i), donde i = 0,1, ... 9. lpci(i) se multiplica por un grupo de factores de ponderación 10-dimensionales W(i) = {0.6699, 0.5862, 0.5129, 0.4488, 0.3927, 0.3436, 0.3007, 0.2631, 0.2302, 0.2014}, y se obtiene coeficiente de LSP ponderado lpc~i(i), esto es, se estima un filtro de síntesis 1/?~?(?).
En esta modalidad, se genera una secuencia de ruido blanco exc2 (i) de 320 puntos, donde i = 0,1, ... 319, y exc2(i) se utiliza para excitar el filtro l/A~i(Z) para obtener una señal de CN de banda alta ajustada por ganancia s~i(i) . s~i(i) se multiplica por los coeficientes de ganancia G3 y G4, donde G4 = 0.6, y se obtiene una señal de CN de banda alta s' i que se reconstruye en el extremo de decodificación y se muestrea a 16 kHz, donde: Si la trama actual es un SID, es necesario transformar lpc~ i(i) a un coeficiente de LSP lsp~ i(i), y utilizar lsp~i(i) para actualizar un promedio en movimiento a largo plazo de coeficientes de LSP de señales de banda alta de tramas de CN almacenadas en memoria intermedia en el extremo de decodificación : lsp( ? () = ߦ lsp >() + (!- ?)¦ lsp~ (i) i = 0,1,...9 (17) donde, ß = 0.7.
En esta modalidad, opcionalmente, obtener un coeficiente--de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID incluye: obtener M coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente; llevar a cabo procesamiento de randomización en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID. Específicamente, no se establece ninguna limitación en esta modalidad .
En esta modalidad, después de que se obtienen el parámetro de banda baja y el parámetro de banda alta, s'o y s'i se pasan a través de un filtro de síntesis de QMF, y finalmente se obtiene una primera trama de CN que se reconstruye por el decodificador y se muestrea a 32 kHz.
Además, en esta modalidad, opcionalmente, antes de que se obtenga la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, el parámetro de ruido de banda alta generado localmente se puede optimizar adicionalmente , de tal forma que se puede obtener ruido de confort de un mejor efecto. Un paso de optimización especifica incluye: cuando las tramas de historia adyacentes al SID son tramas vocales codificadas, si una energía promedio de señales de banda alta o una parte de señales de banda alta que son de codificadas de las tramas vocales codificadas es menor que una energía promedio de señales de ruido de banda alta o una parte de las señales de ruido de banda alta que son generadas localmente, multiplicar las señales de ruido de banda alta de las L tramas subsecuentes iniciando desde el SID por un factor de suavizado menor que 1, para obtener una nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente; y correspondientemente, obtener la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente incluye: obtener una cuarta trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID, y la nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
En esta modalidad, cuando una trama antes del SID actual es una trama vocal codificada, y una energía Esp de una señal de banda alta de la trama vocal codificada es menor que una energía Es-i de s'i, es necesario suavizar las energías de las señales de banda alta del SID actual y los varios SIDs subsecuentes (50 tramas en esta modalidad). Un método de suavizado específico es: multiplicar s'i de la trama actual por una ganancia Gs, para obtener s 1 is suavizados. G = ^\ -0.02 -(50- cnt) -(?-^*^ ) ' d o n d e r c n t e s un contador de tramas, se suma 1 al contador por cada trama iniciando desde la primera trama de CN después de la trama vocal modificada, y E~ es una energía de una señal de banda alta suavizada de una trama previa y se inicializa como Esp cuando cnt = 1. El proceso de suavizado se lleva a cabo solamente hasta 50 tramas. En este periodo, si E~¡ es mayor que ES'i, el proceso de suavizado se termina. Opcionalmente, £s7,' y ES'i pueden también representar energías de solamente una parte de las tramas, lo cual no se limita específicamente en esta modalidad. En esta modalidad, s'0 y s'i (o s'is) se pasan a través de un filtro de síntesis de QMF, y finalmente se obtiene una trama de CN que se reconstruye por medio del decodificador y se muestrea a 32 kHz. 403. Si el SID incluye el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente.
En esta modalidad, si el SID incluye el parámetro de banda alta, el SID se decodifica para obtener el parámetro de banda alta, y se genera localmente un parámetro de ruido de banda baja, y se obtiene una segunda trama de CN de acuerdo con el parámetro de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente. El método para decodificar el parámetro de banda alta es el mismo que el método en el paso 401, y los detalles no se describen repetidamente en esta modalidad. El método para generar localmente el parámetro de banda baja es el mismo que el método para generar localmente un parámetro de banda ancha, y los detalles no se describen repetidamente en esta modalidad .
La modalidad de método que se proporciona por la presente invención aporta los siguientes efectos benéficos: un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; si el SID 7 O incluye el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda baja, genera localmente un parámetro de ruido de banda alta, y obtiene una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente; si el SID incluye el parámetro de banda alta, decodifica el SID para obtener un parámetro de ruido de banda alta, genera localmente un parámetro de ruido de banda baja, y obtiene una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente; y si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad del cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha. Además, antes de que se obtenga la segunda trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, el parámetro de ruido de banda alta generado localmente se puede optimizar adicionalmente, de tal forma que se puede obtener ruido de confort de un mejor efecto. De esta manera, se optimizar adicionalmente el desempeño del decodificador .
Modalidad 5 Esta modalidad proporciona un método para procesar datos de audio. Igual que en el método para procesar datos de audio en la Modalidad 2, un extremo de codificador obtiene una trama de ruido de una señal de audio, y descompone la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta. Sin embargo, opcionalmente, determinar si la señal de banda alta de la trama de ruido satisface una condición de codificación y transmisión preestablecida incluye: determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido, satisface una condición restablecida; de ser asi, codificar un SID de la señal de ruido de banda alta de la trama de ruido al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta de la trama de ruido no necesita codificarse y transmitirse. La estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido incluye: un promedio ponderado de espectros de las señales de ruido de banda alta antes de la trama de ruido. En esta modalidad, determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de las trama de ruido, satisface una condición preestablecida, se utiliza como una tercera condición para determinar si se codifica y transmite la señal de ruido de banda alta.
En esta modalidad, opcionalmente, si se codifica y transmite la señal de ruido de banda alta también se puede determinar al utilizar una segunda condición de determinación, que no se limita específicamente en esta modalidad .
En esta modalidad, DTX decide si se codifica y transmite un parámetro de banda alta, esto es, el ajuste de flaghb se puede decidir al utilizar las siguientes condiciones: (1) si se satisface una tercera condición de determinación; de ser asi, ajustar flaghb a 0; de otra forma, ajusfar flaghb a 1; y (2) si se satisface la segunda condición del determinación; de no ser asi, ajustar flaghb a 0; y de ser asi, ajustar flaghb a 1.
En esta modalidad, un método especifico para implementar la tercera condición de determinación puede ser como sigue: el modificador obtiene coeficiente de LSP de 10° orden lsp(i) de la señal de ruido de banda alta sx de la trama de ruido actual, donde i = 0, ...9, y opcionalmente , el coeficiente también puede ser un coeficiente de LSF o ISF o ISP, lo cual no se limita específicamente en esta modalidad. El coeficiente de LSP o LSF o ISF o ISP es solamente una manera de representación diferente en un dominio diferente, pero todos representan un coeficiente de filtro de síntesis, lo cual no se limita específicamente en esta modalidad, lsp(i) se utiliza para actualizar un promedio en movimiento de los mismos : lspa(i) = a lspa (i) + {\ - a) - lsp{i) i = 0,...9 (18) donde, lspa(i) es un promedio en movimiento a largo plazo de lsp(i) . Una distorsión espectral entre lspa(i) actual y lspa(i) en un momento cuando se envía por última vez una trama de SID que incluye un parámetro de banda alta se calcula como: , donde Disp representa distorsión espectral, y lsp~ representa lspa(i) en el momento en que la trama de SID que incluye el parámetro de banda alta se envía por última vez. Si Disp es menor que un cierto umbral, se establece flagh = 0; de otra forma, se establece flaghb = 1.
En esta modalidad, un método de trabajo para codificar el parámetro de banda baja y/o el parámetro de banda alta por el codificador cuando es necesario es básicamente el mismo que el método de trabajo en la Modalidad 3, y los detalles no se describen repetidamente en esta modalidad.
En esta modalidad, cuando un decodificador está en un estado de trabajo de CNG y flagCNG = 0, es necesario generar localmente una señal de ruido de banda alta. El método para obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente a un SID es el mismo que el método en la Modalidad 4, y los detalles no se describen repetidamente en esta modalidad. Sin embargo, en esta modalidad, preferiblemente, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID incluye: obtener M coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente; llevar a cabo procesamiento de randomi zación en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID. Específicamente, obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID se puede implementar en la siguiente manera : Suponer lsp' (i) = lspCN(i) donde i = 0, ... 9, lspCN(i) es un promedio en movimiento a largo plazo de coeficientes de LSP de señales de banda alta de tramas de CN que están almacenadas en memoria intermedia localmente en el extremo de decodificación. El procesamiento de randomización se lleva a cabo en lsp' (i) al utilizar el mismo método que en la Modalidad 4, y se obtiene lspi(i): /^, (0) = í(0)- (l - /^, (0)) + (0) (19) Isp, (i) = R(i)¦ (Isp ( ) - Isp (i - 1)) + Isp (i) = 1,...9 lspi(i) se transforma a un coeficiente de LPC lpci(i), y se obtiene un filtro de síntesis l/A~i(Z) después de la ponderación con w(i) al utilizar el mismo método que en la Modalidad 4. En esta modalidad, se genera una secuencia de ruido blanco de 320 puntos exc2 (i) , donde i = 0,1, ... 319, y exc2(i) se utiliza para excitar el filtro l/A~i(Z) para obtener una señal de CN de banda alta de ganancia no ajustada s~i(i). s~i (i) se multiplica por un coeficiente de ganancia G3, y se obtiene una señal de banda alta s'i de una trama de CN que se reconstruye en el extremo de decodificación y se muestrea en 16 kHz. En esta modalidad, cuando la trama actual es un SID, el lspi(i) obtenido al utilizar este método no se utiliza para actualizar el promedio en movimiento a largo plazo de los coeficientes de LSP de las señales de banda alta de las tramas de CN que se almacenan en memoria intermedia en el extremo de decodificación.
En esta modalidad, cuando el codificador codifica una trama de SID grande, cuando se cuantifica un promedio en movimiento a largo plazo eia de energías logarítmicas de señales de banda alta en el extremo de codificación, la cuantificación se lleva a cabo después de que eia se atenúa (esto es, después de que se sustrae un valor) . Por lo tanto, en este caso, en decodificación, es innecesario multiplicar s~i(i) por G2 o G4 en la Modalidad 4. Otros pasos del extremo de decodificación en esta modalidad son similares a los pasos en la modalidad anterior, y los detalles no se describen repetidamente en esta modalidad.
La modalidad del método que se proporciona por la presente invención aporta los siguientes efectos benéficos: se obtiene una trama de ruido actual de una señal de audio, y la trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después se codifica y transmite la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y se codifica y transmite la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. Un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; si el SID incluye el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda baja, genera localmente un parámetro de ruido de banda alta, y obtiene una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente; si el SID incluye el parámetro de banda alta, decodifica el SID para obtener un parámetro de ruido de banda alta, genera localmente un parámetro de ruido de banda baja, y obtiene una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente; y si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad del cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha .
Modalidad 6 Haciendo referencia a la Figura 5, esta modalidad proporciona un aparato para codificar datos de audio, donde el aparato incluye: un módulo de obtención 501 y un módulo de transmisión 502.
El módulo de obtención 501 está configurado para obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta.
El modelo de transmisión 502 está configurado para codificar y transmitir la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y codificar y transmitir la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua, donde una política para enviar una primera trama de descriptor de inserción de silencio SID del primer mecanismo de transmisión discontinua es diferente de una política para enviar un segundo SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua.
En esta modalidad, el primer SID incluye un parámetro de banda baja de la trama de ruido, y el segundo SID incluye un parámetro de banda baja y/o un parámetro de banda alta de la trama de ruido.
Opcionalmente, haciendo referencia a la Figura 6, el módulo de transmisión 502 incluye: una primera unidad de transmisión 502a, configurada para determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida; de ser asi, y se satisface una condición de envió de la política para enviar el segundo SID, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse .
En esta modalidad, la primera unidad de transmisión 502a incluye: una primera subunidad de determinación, configurada para obtener un espectro de la señal de ruido de banda alta, dividir el espectro en al menos dos sub-bandas, y si una energía promedio de cualquier primer sub-banda en la sub-bandas no es menor que una energía promedio de una segunda sub-banda en la sub-bandas, donde una banda de frecuencia en la cual se ubica la segunda sub-banda es mayor que una banda de frecuencia en la cual se ubica la primera sub-banda, confirmar que la señal de ruido de banda alta no tiene estructura espectral preestablecida; de otra forma, confirmar que la señal de ruido de banda alta tiene una estructura espectral preestablecida.
Haciendo referencia a la Figura 6, opcionalmente , el módulo de transmisión 502 incluye: una segunda unidad de transmisión 502b, configurada para generar un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación, donde la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido, y la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento donde un SID que incluye un parámetro de ruido de banda alta es enviado por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; de ser así, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse.
Opcionalmente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido .
Alternativamente, que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido incluye que: la primera relación es una relación de una energía promedio ponderada de las señales de ruido de banda alta de la trama de ruido y una trama de ruido antes de la trama de ruido con respecto a una energía promedio ponderada de las señales de ruido de banda baja de la trama de ruido y la trama de ruido antes de la trama de ruido; y correspondientemente, que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido incluye que: la segunda relación es una relación de una energía promedio ponderada de señales de banda alta con respecto a una energía promedio ponderada de señales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento en que el SID que incluye el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido.
Opcionalmente, en esta modalidad, la segunda unidad de transmisión 502b incluye: una subunidad de cálculo, configurada para calcular por separado un valor logarítmico de la primera relación y un valor logarítmico de la segunda relación; y calcular un valor absoluto de una diferencia entre el valor logarítmico de la primera relación y el valor logarítmico de la segunda relación, para obtener el valor de extensión de desviación.
Haciendo referencia a la Figura 6, opcionalmente, en esta modalidad, el modelo de transmisión 502 incluye: una tercera unidad de transmisión 502c, configurada para determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido, satisface una condición restablecida; de ser asi, codificar un SID de la señal de ruido de banda alta de la trama de ruido al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta de la trama de ruido no necesita codificarse y transmitirse.
En esta modalidad, opcionalmente, la estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido incluye: un promedio ponderado de espectros de las señales de ruido de banda alta antes de la trama de ruido.
Opcionalmente, en esta modalidad, la condición de envío en la política para enviar el segundo SID del segundo mecanismo de transmisión discontinua además incluye: el primer mecanismo de transmisión discontinua que satisface una condición para enviar el primer SID.
La modalidad del aparato que se proporciona por la presente invención aporta los siguientes efectos benéficos: se obtiene una trama de ruido actual de una señal de audio, y la trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después se codifica y transmite la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y se codifica y transmite la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad de cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
Modalidad 7 Haciendo referencia a la Figura 7, esta modalidad proporciona un aparato para decodificar datos de audio, donde el aparato incluye: un módulo de obtención 601, un primer módulo de decodificación 602, un segundo módulo de decodificación 603, y un tercer módulo de decodificación 604.
El módulo de obtención 601 está configurado para determinar si una trama de descriptor de inserción de silencio SID actual recibida incluye un parámetro de banda baja o un parámetro de banda alta.
El primer módulo de decodificación 602 está configurado para: si el SID obtenido por el módulo de obtención 601 incluye el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de CN de ruido de confort de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente.
El segundo módulo de decodificación 603 está configurado para: si el SID obtenido por el módulo de obtención 601 incluye el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de ruido de confort de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente.
El tercer módulo de decodificación 604 está configurado para: si el SID obtenido por el módulo de obtención 601 incluye el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación.
Opcionalmente, en esta modalidad, el primer módulo de decodificación 602 está además configurado para: antes de decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de CN de ruido de confort de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, si el decodificador está en un primer estado de generación de ruido de confort CNG, entrar a un segundo estado de CNG.
Opcionalmente, en esta modalidad, el tercer módulo de decodificación 604 está además configurado para: antes de decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación, si el decodificador está en un segundo estado de CNG, entrar a un primer estado de CNG.
Opcionalmente, el módulo de obtención 601 incluye: una primera unidad de confirmación, configurada para: si el número de bits del SID es menor que un primer umbral preestablecido, confirmar que el SID incluye el parámetro de banda alta; si el número de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, confirmar que el SID incluye el parámetro de banda baja; y si el número de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, confirmar que el SID incluye el parámetro de banda alta y el parámetro de banda baja; o una segunda unidad de confirmación, configurada para: si el SID incluye un primer identificador, confirmar que el SID incluye el parámetro de banda alta; si el SID incluye un segundo identificador, confirmar que el SID incluye el parámetro de banda baja; y si el SID incluye un tercer identificador, confirmar que el SID incluye el parámetro de banda baja y el parámetro de banda alta.
En esta modalidad, el primer módulo de decodificación 602 incluye: una primera unidad de obtención, configurada para obtener por separado una energía promedio ponderada de una señal de ruido de banda alta y un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID; y una segunda unidad de obtención, configurada para obtener la señal de ruido de banda alta de acuerdo con la energía promedio ponderada obtenida de la señal de ruido de banda alta y el coeficiente de filtro de síntesis obtenido de la señal de ruido de banda alta en el momento correspondiente al SID.
Opcionalmente, la primera unidad de obtención incluye: una primera subunidad de obtención, configurada para obtener una energía de una señal de banda baja de la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación; una subunidad de cálculo, configurada para calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que incluye un parámetro de banda alta se recibe antes del SID, para obtener una primera relación; una segunda subunidad de obtención, configurada para obtener, de acuerdo con la energía de la señal de banda baja de la primera trama de CN y la primera relación, una energía de la señal de ruido de banda alta en el momento correspondiente al SID; y una tercera subunidad de obtención, configurada para llevar a cabo promediación ponderada en la energía de la señal de ruido de banda alta en el momento correspondiente al SID y una energía de una señal de banda alta de una trama de CN almacenada en memoria intermedia (buffer) localmente, para obtener la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN .
La subunidad de cálculo está especialmente configurada para: calcular una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación; o calcular una relación de una energía promedio ponderada de la señal de ruido de banda alta con respecto a una energía promedio ponderada de la señal de ruido de banda baja en el momento en que se recibe el SID que incluye el parámetro de banda alta antes del SID, para obtener la primera relación.
Cuando la energía de la señal de ruido de banda alta en el momento correspondiente al SID es mayor que una energía de una señal de banda alta de una trama de CN previa que se almacena en memoria intermedia localmente, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una primera tasa; de otra forma, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una segunda tasa, donde la primera tasa es mayor que la segunda tasa.
Opcionalmente, la primera unidad de obtención incluye: una primera subunidad de selección, configurada para seleccionar una señal de banda alta de una trama vocal con una energía de señal de banda alta mínima de tramas vocales dentro de un período preestablecido de tiempo antes del SID, y obtener, de acuerdo con una energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN; o unas segunda subunidad de selección, configurada para seleccionar señales de banda alta de N tramas vocales con una energía de señal de banda alta menor que un umbral preestablecido de tramas vocales dentro de un periodo de tiempo preestablecido antes del SID; y obtener, de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN.
Opcionalmente, la primera unidad de obtención incluye: una subunidad de distribución, configurada para distribuir M coeficientes de frecuencia espectral de inmitancia ISF o coeficientes de par espectral de inmitancia ISP o coeficientes de frecuencia espectral de línea LSF o coeficientes de par espectral de línea LSP en un rango de frecuencia correspondiente a la señal de banda alta; una primera subunidad de procesamiento de randomización, configurada para llevar a cabo procesamiento de randomización en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas, donde ambos M y N son números naturales; y una cuarta subunidad de obtención, configurada para obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
Opcionalmente, la primera unidad de obtención incluye: una quinta subunidad de obtención, configurada para obtener M coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente ; una segunda subunidad de procesamiento de randomización, configurada para llevar a cabo procesamiento de randomización en los M coeficientes, donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas; y una sexta subunidad de obtención, configurada para obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
Haciendo referencia ahora a la Figura 8, opcionalmente, el aparato además incluye: un módulo de optimización 605, configurado para: antes de que el primer módulo de decodificación 602 obtenga la primera trama de CN, cuando las tramas de historia adyacentes al SID son tramas vocales codificadas, si una energía promedio de las señales de banda alta o una parte de las señales de banda alta que se decodifican a partir de las tramas vocales codificadas es menor que una energía promedio de las señales de ruido de banda alta o una parte de las señales de ruido de banda alta que se generan localmente, multiplicar las señales de ruido de banda alta de las L tramas subsecuentes iniciando desde el SID por un factor de suavizado menor que 1, para obtener una nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
Correspondientemente, el primer módulo de decodificación 602 está específicamente configurado para obtener una cuarta trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID, y la nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
La modalidad del aparato que se proporciona por la presente invención aporta los siguientes efectos benéficos: un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja o un parámetro de banda alta; si el SID incluye el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda baja, genera localmente un parámetro de ruido de banda alta, y obtiene una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente; si el SID incluye el parámetro de banda alta, decodifica el SID para obtener un parámetro de ruido de banda alta, genera localmente un parámetro de ruido de banda baja, y obtiene una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente; y si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad del cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
Modalidad 8 Haciendo referencia a la Figura 9, esta modalidad proporciona un sistema para procesar datos de audio, donde el sistema incluye el aparato anterior 500 para codificar datos de audio y el aparato anterior 600 para decodificar datos de audio.
Las soluciones técnicas que se proporcionan por las modalidades de la presente invención aportan los siguientes efectos benéficos: se obtiene una trama de ruido actual de una señal de audio, y la trama de ruido actual se descompone en una señal de ruido de banda baja y una señal de ruido de banda alta; después se codifica y transmite la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua, y se codifica y transmite la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua. Un decodificador obtiene una trama de descriptor de inserción de silencio SID, y determina si el SID incluye un parámetro de banda baja y/o un parámetro de banda alta; si el SID incluye el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda baja, genera localmente un parámetro de ruido de banda alta, y obtiene una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente; si el SID incluye el parámetro de banda alta, decodifica el SID para obtener un parámetro de ruido de banda alta, genera localmente un parámetro de ruido de banda baja, y obtiene una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido por decodificación y el parámetro de ruido de banda baja generado localmente; y si el SID incluye el parámetro de banda alta y el parámetro de banda baja, decodifica el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtiene una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por decodificación. De esta forma, se utilizan diferentes maneras de procesamiento para la señal de banda alta y la señal de banda baja, se puede reducir la complejidad del cálculo y se pueden guardar bits codificados bajo una premisa de no bajar la calidad subjetiva de un codee, y los bits que se guardan ayudan a lograr un objetivo de reducir un ancho de banda de transmisión o mejorar la calidad de codificación general, resolviendo de esta manera un problema de codificación y transmisión de súper banda ancha.
El aparato y sistema que se proporcionan por las modalidades pueden pertenecer específicamente a la misma idea que las modalidades del método. El proceso de implementación específico del aparato y sistema se ha descrito a detalle en las modalidades del método y los detalles no se describen repetidamente en este documento.
El método y aparato para procesar datos de audio en las modalidades anteriores se pueden aplicar a un codificador de audio o un decodificador de audio. Los codees de audio se pueden aplicar ampliamente a diferentes dispositivos electrónicos, tales como un teléfono móvil, un aparato inalámbrico, un asistente de datos personal (PDA, Personal Data Assistant) , una computadora de mano o portátil, un receptor de GPS o dispositivo de naveqación, una cámara, un reproductor de audio/video, una videocámara, un grabador de video, y dispositivo de vigilancia. Generalmente, tal dispositivo electrónico incluye un codificador de audio o un decodificador de audio. El codificador o decodificador de audio se pueden implementar directamente al utilizar un circuito digital o chip, por ejemplo, un procesador de señal digital (DSP, Digital Signal Processor) , o implementar al utilizar un código de software para manejar un procesador para que ejecute un procedimiento en el código de software.
Una persona experimentada en la materia puede entender que todos o parte de los pasos de las modalidades se pueden implementar por medio de hardware o un programa que instruye a hardware relevante. El programa se puede almacenar en un medio de almacenamiento legible por computadora. El medio de almacenamiento puede incluir: una memoria de sólo lectura, un disco magnético, o un disco óptico.

Claims (44)

NOVEDAD DE LA INVENCIÓN Habiendo descrito la presente invención como antecede, se considera como una novedad y, por lo tanto, se reclama como propiedad lo contenido en las siguientes: REIVINDICACIONES
1. Un método para procesar datos de audio, en donde el método comprende: obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta; y codificar la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua y transmitir la señal de ruido de banda baja codificada al utilizar el primer mecanismo de transmisión discontinua, y codificar la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua, en donde una política para enviar una primera trama de descriptor de inserción de silencio, SID, del primer mecanismo de transmisión discontinua es diferente de una política para enviar una segunda trama de SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua .
2. El método de acuerdo con la reivindicación 1, caracterizado porque el primer SID comprende un parámetro de banda baja de la trama de ruido, y el segundo SID comprende un parámetro de banda baja o un parámetro de banda alta de la trama de ruido.
3. El método de acuerdo con la reivindicación 1 ó 2, caracterizado porque la codificación de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua comprende: determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida; de ser así, y se satisface una condición de envío de la política para enviar el segundo SID, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse .
4. El método de acuerdo con la reivindicación 3, caracterizado porque determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida comprende: obtener un espectro de la señal de ruido de banda alta, dividir el espectro en al menos dos sub-bandas, y cuando una energía promedio de cualquier primera sub-banda en las sub-bandas no es menor que una energía promedio de una segunda sub-banca en las sub-bandas, en donde una banda de frecuencia en la cual se ubica la segunda sub-banda es mayor que una banda de frecuencia en la cual se ubica la primera sub-banda, confirmar que la señal de ruido de banda alta no tiene estructura espectral preestablecida; de otra forma, confirmar que la señal de ruido de banda alta tiene una estructura espectral preestablecida.
5. El método de acuerdo con la reivindicación 1 ó 2, caracterizado porque la codificación de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua comprende: generar un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación, en donde la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido, y la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando un SID que comprende un parárr.etro de ruido de banda alta es enviado por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; de ser así, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse.
6. El método de acuerdo con la reivindicación 5, caracterizado porque: la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido comprende que : la primera relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja de la trama de ruido; y que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de ruido de banda alta se envíe por última vez antes de la trama de ruido comprende que : la segunda relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que el SID que comprende el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido; o que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido comprende que: la primera relación es una relación de una energía promedio ponderada de las señales de ruido de banda alta de la trama de ruido y una trama de ruido antes de la trama de ruido con respecto a una energía promedio ponderada de las señales de ruido de banda baja de la trama de ruido y la trama de ruido antes de la trama de ruido; y que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido comprende que : la segunda relación es una relación de una energía promedio ponderada de señales de banda alta con respecto a una energía promedio ponderada de señales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento en que el SID comprende el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido.
7. El método de acuerdo con la reivindicación 5 ó 6, caracterizado porque la generación de un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación comprende: calcular por separado un valor logarítmico de la primera relación y un valor logarítmico de la segunda relación; y calcular un valor absoluto de una diferencia entre el valor logarítmico de la primera relación y el valor logarítmico de la segunda relación, para obtener el valor de extensión de desviación.
8. El método de acuerdo con la reivindicación 1 ó 2, caracterizado porque la codificación de la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar un segundo mecanismo de transmisión discontinua comprende: determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido, satisface una condición restablecida; de ser asi, codificar un SID de la señal de ruido de banda alta de la trama de ruido al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta de la trama de ruido no necesita codificarse y transmitirse.
9. El método de acuerdo con la reivindicación 8, caracterizado porque la estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido comprende: un promedio ponderado de espectros de las señales de ruido de banda alta antes de la trama de ruido.
10. El método de acuerdo con cualquiera de las reivindicaciones 3 a 8, caracterizado porque la condición de envío en la política para enviar el segundo SID del segundo mecanismo de transmisión discontinua además comprende: el primer mecanismo de transmisión discontinua que satisface una condición para enviar el primer SID.
11. Un método para procesar datos de audio, en donde el método comprende: obtener, por medio de un decodificador, una trama de descriptor de inserción de silencio, SID, y determinar si el SID comprende un parámetro de banda baja o un parámetro de banda alta; cuando el SID comprende el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort, CN, de acuerdo con el parámetro de ruido de banda baja obtenido al decodificar el parámetro de ruido de banda alta generado localmente; cuando el SID comprende el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido al decodificar y generar localmente el parámetro de ruido de banda baja; y cuando el SID comprende el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación.
12. El método de acuerdo con la reivindicación 11, caracterizado porque cuando el SID comprende el parámetro de banda baja, antes de decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por la decodificación y el parámetro de ruido de banda alta generado localmente, el método además comprende : cuando el decodificador está en un primer estado de generación de ruido de confort, estado de CNG, entrar, por medio del decodificador , a un segundo estado de CNG.
13. El método de acuerdo con la reivindicación 11, caracterizado porque cuando el SID comprende el parámetro de banda alta y el parámetro de banda baja, antes de decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación, el método además comprende: cuando el decodificador está en un segundo estado de CNG, entrar, por medio del decodificador, a un primer estado de CNG.
14. El método de acuerdo con cualquiera de las reivindicaciones 11 a 13, caracterizado porque determinar si el SID comprende un parámetro de banda baja y/o un parámetro de banda alta comprende: cuando el número de bits del SID es menor que un primer umbral preestablecido, confirmar que el SID comprende el parámetro de banda alta; cuando el número de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, confirmar que el SID comprende el parámetro de banda baja; y cuando el número de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, confirmar que el SID comprende el parámetro de banda alta y el parámetro de banda baja; o cuando el SID comprende un primer identificador, confirmar que el SID comprende el parámetro de banda alta; cuando el SID comprende un segundo identificador, confirmar que el SID comprende el parámetro de banda baja; y cuando el SID comprende un tercer identificador, confirmar que el SID comprende el parámetro de banda baja y el parámetro de banda alta .
15. El método de acuerdo con cualquiera de las reivindicaciones 11 a 14, caracterizado porque generar localmente un parámetro de ruido de banda alta comprende: obtener por separado una energía promedio ponderada de una señal de ruido de banda alta y un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID; y obtener la señal de ruido de banda alta de acuerdo con la energía promedio ponderada obtenida de la señal de ruido de banda alta y el coeficiente de filtro de síntesis obtenido de la señal de ruido de banda alta en el momento correspondiente al SID.
16. El método de acuerdo con la reivindicación 15, caracterizado porque obtener una energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID comprende: obtener una energía de una señal de banda baja de la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación; calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de banda alta se recibe antes del SID, para obtener una primera relación; obtener, de acuerdo con la energía de la señal de banda baja de la primera trama de CN y la primera relación, una energía de la señal de ruido de banda alta en el momento correspondiente al SID; y llevar a cabo promediación ponderada en la energía de la señal de ruido de banda alta en el momento correspondiente al SID y una energía de una señal de banda alta de una trama de CN almacenada en memoria intermedia localmente, para obtener la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN.
17. El método de acuerdo con la reivindicación 16, caracterizado porque calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando se recibe un SID que incluye un parámetro de banda alta antes del SID, para obtener una primera relación, comprende: calcular una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que se recibe el SID que comprende el parámetro de banda alta antes del SID, para obtener la primera relación; o calcular una relación de una energía promedio ponderada de la señal de ruido de banda alta con respecto a una energía promedio ponderada de la señal de ruido de banda baja en el momento en que se recibe el SID que comprende el parámetro de banda alta antes del SID, para obtener la primera relación.
18. El método de acuerdo con la reivindicación 16 ó 17, caracterizado porque: cuando la energía de la señal de ruido de banda alta en el momento correspondiente al SID es mayor que una energía de una señal de banda alta de una trama de CN previa que se almacena en memoria intermedia localmente, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una primera tasa; de otra forma, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una segunda tasa, en donde la primera tasa es mayor que la segunda tasa.
19. El método de acuerdo con la reivindicación 15, caracterizado porque obtener la energía promedio ponderada de una señal de ruido de banda alta en un momento correspondiente al SID comprende: seleccionar una señal de banda alta de una trama vocal con una energía de señal de banda alta mínima de tramas vocales dentro de un período preestablecido de tiempo antes del SID; y obtener, de acuerdo con una energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN; o seleccionar señales de banda alta de N tramas vocales con una energía de señal de banda alta menor que un umbral preestablecido de tramas vocales dentro de un período de tiempo preestablecido antes del SID; y obtener, de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN .
20. El método de acuerdo con cualquiera de las reivindicaciones 15 a 19, caracterizado porque obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID comprende: distribuir M coeficientes de frecuencia espectral de inmitancia, ISF, o coeficientes de par espectral de inmitancia, ISP, o coeficientes de frecuencia espectral de línea, LSF, o coeficientes de par espectral de línea, LSP, en un rango de frecuencia correspondiente a una señal de banda alta; llevar a cabo procesamiento de randomización en los coeficientes, en donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas, en donde ambos M y N son números naturales; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
21. El método de acuerdo con cualquiera de las reivindicaciones 15 a 19, caracterizado porque obtener un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID comprende: obtener coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente ; llevar a cabo procesamiento de randomización en los M coeficientes, en donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas; y obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
22. El método de acuerdo con cualquiera de las reivindicaciones 15 a 21, caracterizado porque antes de obtener una primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente, el método de más comprende: cuando las tramas de historia adyacentes al SID son tramas vocales codificadas, cuando una energía promedio de las señales de banda alta o una parte de las señales de banda alta que se decodifican a partir de las tramas vocales codificadas es menor que una energía promedio de las señales de ruido de banda alta o una parte de las señales de ruido de banda alta que se generan localmente, multiplicar las señales de ruido de banda alta de las L tramas subsecuentes iniciando desde el SID por un factor de suavizado menor que 1, para obtener una nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente; y obtener la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación y el parámetro de ruido de banda alta generado localmente comprende : obtener una cuarta trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID, y la nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
23. Un aparato para codificar datos de audio, en donde el aparato comprende: un módulo de obtención, configurado para obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de ruido de banda baja y una señal de ruido de banda alta; y un módulo de transmisión, configurado para codificar la señal de ruido de banda baja al utilizar un primer mecanismo de transmisión discontinua y transmitir la señal de ruido de banda baja codificada al utilizar el primer mecanismo de transmisión discontinua, y codificar la señal de ruido de banda alta al utilizar un segundo mecanismo de transmisión discontinua y transmitir la señal de ruido de banda alta codificada al utilizar el segundo mecanismo de transmisión discontinua, en donde una política para enviar una primera trama de descriptor de inserción de silencio, SID, del primer mecanismo de transmisión discontinua es diferente de una política para enviar una segunda trama de SID del segundo mecanismo de transmisión discontinua, o una política para codificar un primer SID del primer mecanismo de transmisión discontinua es diferente de una política para codificar un segundo SID del segundo mecanismo de transmisión discontinua.
24. El aparato de acuerdo con la reivindicación 23, caracterizado porque el primer SID comprende un parámetro de banda baja de la trama de ruido, y el segundo SID comprende un parámetro de banda baja o un parámetro de banda alta de la trama de ruido.
25. El aparato de acuerdo con la reivindicación 23 ó 24, caracterizado porque el módulo de transmisión comprende: una primera unidad de transmisión, configurada para determinar si la señal de ruido de banda alta tiene una estructura espectral preestablecida; de ser así, y se satisface una condición de envío de la política para enviar el segundo SID, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse .
26. El aparato de acuerdo con la reivindicación 25, caracterizado porque la primera unidad de transmisión comprende : una primera subunidad de determinación, configurada para obtener un espectro de la señal de ruido de banda alta, dividir el espectro en al menos dos sub-bandas, y cuando una energía promedio de cualquier primera sub-banda en las sub-bandas no es menor que una energía promedio de una segunda sub-banda en las sub-bandas, en donde una banda de frecuencia en la cual se ubica la segunda sub-banda es mayor que una banda de frecuencia en la cual se ubica la primera sub-banda, confirmar que la señal de ruido de banda alta no tiene estructura espectral preestablecida; de otra forma, confirmar que la señal de ruido de banda alta tiene una estructura espectral preestablecida.
27. El aparato de acuerdo con la reivindicación 23 ó 24, caracterizado porque el modelo de transmisión comprende: una segunda unidad de transmisión, configurada para generar un valor de extensión de desviación de acuerdo con una primera relación y una segunda relación, en donde la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido, y la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento cuando un SID que comprende un parámetro de ruido de banda alta es enviado por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; de ser así, codificar un SID de la señal de ruido de banda alta al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta no necesita codificarse y transmitirse.
28. El aparato de acuerdo con la reivindicación 27, caracterizado porque: la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido comprende que: la primera relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja de la trama de ruido; y que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido comprende que : la segunda relación es una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que el SID que comprende el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido; o que la primera relación es una relación de una energía de la señal de ruido de banda alta con respecto a una energía de la señal de ruido de banda baja de la trama de ruido comprende que: la primera relación es una relación de una energía promedio ponderada de las señales de ruido de banda alta de la trama de ruido y una trama de ruido antes de la trama de ruido con respecto a una energía promedio ponderada de las señales de ruido de banda baja de la trama de ruido y la trama de ruido antes de la trama de ruido; y que la segunda relación es una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido comprende que : la segunda relación es una relación de una energía promedio ponderada de señales de banda alta con respecto a una energía promedio ponderada de señales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento en que el SID comprende el parámetro de ruido de banda alta se envía por última vez antes de la trama de ruido.
29. El aparato de acuerdo con la reivindicación 27 ó 28, caracterizado porque la segunda unidad de transmisión comprende : una subunidad de cálculo, configurada para calcular por separado un valor logarítmico de la primera relación y un valor logarítmico de la segunda relación; y calcular un valor absoluto de una diferencia entre el valor logarítmico de la primera relación y el valor logarítmico de la segunda relación, para obtener el valor de extensión de desviación.
30. El aparato de acuerdo con la reivindicación 23 ó 24, caracterizado porque el primer módulo de transmisión comprende: una tercera unidad de transmisión, configurada para determinar si una estructura espectral de la señal de ruido de banda alta de la trama de ruido, en comparación con una estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido, satisface una condición restablecida; de ser así, codificar un SID de la señal de ruido de banda alta de la trama de ruido al utilizar la política para codificar el segundo SID, y enviar el SID; y de no ser así, determinar que la señal de ruido de banda alta de la trama de ruido no necesita codificarse y transmitirse.
31. El aparato de acuerdo con la reivindicación 30, caracterizado porque la estructura espectral promedio de las señales de ruido de banda alta antes de la trama de ruido comprende: un promedio ponderado de espectros de las señales de ruido de banda alta antes de la trama de ruido.
32. El aparato de acuerdo con cualquiera de las reivindicaciones 25 a 31, caracterizado porque la condición de envío en la política para enviar el segundo SID del segundo mecanismo de transmisión discontinua además comprende: el primer mecanismo de transmisión discontinua que satisface una condición para enviar el primer SID.
33. Un aparato para decodificar datos de audio, en donde el aparato comprende: un módulo de obtención, configurado para obtener una trama de descriptor de inserción de silencio, SID, y determinar si el SID comprende un parámetro de banda baja o un parámetro de banda alta; un primer módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención comprende el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort, CN, de acuerdo con el parámetro de ruido de banda baja obtenido al decodificar el parámetro de ruido de banda alta generado localmente; un segundo módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención comprende el parámetro de banda alta, decodificar el SID para obtener un parámetro de ruido de banda alta, generar localmente un parámetro de ruido de banda baja, y obtener una segunda trama de CN de acuerdo con el parámetro de ruido de banda alta obtenido al decodificar y generar localmente el parámetro de ruido de banda baja; y un tercer módulo de decodificación, configurado para: cuando el SID obtenido por el módulo de obtención comprende el parámetro de banda alta y el parámetro de banda baja, decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación.
34. El aparato de acuerdo con la reivindicación 32, caracterizado porque el primer módulo de decodificación está de más configurado para: antes de decodificar el SID para obtener un parámetro de ruido de banda baja, generar localmente un parámetro de ruido de banda alta, y obtener una primera trama de ruido de confort CN de acuerdo con el parámetro de ruido de banda baja obtenido por la decodificación y el parámetro de ruido de banda alta generado localmente, cuando el aparato está en un primer estado de generación de ruido de confort CNG, entrar a un segundo estado de CNG.
35. El aparato de acuerdo con la reivindicación 32, caracterizado porque el tercer módulo de decodificación está de más configurado para: antes de decodificar el SID para obtener un parámetro de ruido de banda alta y un parámetro de ruido de banda baja, y obtener una tercera trama de CN de acuerdo con el parámetro de ruido de banda alta y el parámetro de ruido de banda baja obtenidos por la decodificación, cuando el aparato está en un segundo estado de CNG, entrar a un primer estado de CNG.
36. El aparato de acuerdo con cualquiera de las reivindicaciones 33 a 35, caracterizado porque el módulo de obtención comprende: una primera unidad de confirmación, configurada para: cuando el número de bits del SID es menor que un primer umbral preestablecido, confirmar que el SID comprende el parámetro de banda alta; cuando el número de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, confirmar que el SID comprende el parámetro de banda baja; y cuando el número de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, confirmar que el SID comprende el parámetro de banda alta y el parámetro de banda baja; o una segunda unidad de confirmación, configurada para: cuando el SID comprende un primer identificador, confirmar que el SID comprende el parámetro de banda alta; cuando el SID comprende un segundo identificador, confirmar que el SID comprende el parámetro de banda baja; y cuando el SID comprende un tercer identificador, confirmar que el SID comprende el parámetro de banda baja y el parámetro de banda alta .
37. El aparato de acuerdo con cualquiera de las reivindicaciones 33 a 36, el primer módulo de decodificación comprende : una primera unidad de obtención, configurada para obtener por separado una energía promedio ponderada de una señal de ruido de banda alta y un coeficiente de filtro de síntesis de la señal de ruido de banda alta en un momento correspondiente al SID; y una segunda unidad de obtención, configurada para obtener la señal de ruido de banda alta de acuerdo con la energía promedio ponderada obtenida de la señal de ruido de banda alta y el coeficiente de filtro de síntesis obtenido de la señal de ruido de banda alta en el momento correspondiente al SID.
38. El aparato de acuerdo con la reivindicación 37, caracterizado porque la primera unidad de obtención comprende : una primera subunidad de obtención, configurada para obtener una energía de una señal de banda baja de la primera trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación; una subunidad de cálculo, configurada para calcular una relación de una energía de una señal de ruido de banda alta con respecto a una energía de una señal de ruido de banda baja en un momento en que un SID que comprende un parámetro de banda alta se recibe antes del SID, para obtener una primera relación; una segunda subunidad de obtención, configurada para obtener, de acuerdo con la energía de la señal de banda baja de la primera trama de CN y la primera relación, una energía de la señal de ruido de banda alta en el momento correspondiente al SID; y una tercera subunidad de obtención, configurada para llevar a cabo promediación ponderada en la energía de la señal de ruido de banda alta en el momento correspondiente al SID y una energía de una señal de banda alta de una trama de CN almacenada en memoria intermedia localmente, para obtener la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN.
39. El aparato de acuerdo con la reivindicación 38, caracterizado porque la subunidad de cálculo está específicamente configurada para: calcular una relación de una energía instantánea de la señal de ruido de banda alta con respecto a una energía instantánea de la señal de ruido de banda baja en el momento en que se recibe el SID que comprende el parámetro de banda alta antes del SID, para obtener la primera relación; o calcular una relación de una energía promedio ponderada de la señal de ruido de banda alta con respecto a una energía promedio ponderada de la señal de ruido de banda baja en el momento en que se recibe el SID que comprende el parámetro de banda alta antes del SID, para obtener la primera relación.
40. El aparato de acuerdo con la reivindicación 38 ó 39, caracterizado porque: cuando la energía de la señal de ruido de banda alta en el momento correspondiente al SID es mayor que una energía de una señal de banda alta de una trama de CN previa que se almacena en memoria intermedia localmente, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una primera tasa; de otra forma, la energía de la señal de banda alta de la trama de CN previa que se almacena en memoria intermedia localmente se actualiza en una segunda tasa, en donde la primera tasa es mayor que la segunda tasa.
41. El aparato de acuerdo con la reivindicación 37, caracterizado porque la primera unidad de obtención comprende : una primera subunidad de selección, configurada para seleccionar una señal de banda alta de una trama vocal con una energía de señal de banda alta mínima de tramas vocales dentro de un período preestablecido de tiempo antes del SID; y obtener, de acuerdo con una energía de la señal de banda alta de la trama vocal con la energía de señal de banda alta mínima entre las tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN; o una segunda subunidad de selección, configurada para seleccionar señales de banda alta de N tramas vocales con una energía de señal de banda alta menor que un umbral preestablecido de tramas vocales dentro de un período de tiempo preestablecido antes del SID; y obtener, de acuerdo con una energía promedio ponderada de las señales de banda alta de las N tramas vocales, la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID, en donde la energía promedio ponderada de la señal de ruido de banda alta en el momento correspondiente al SID es una energía de señal de banda alta de la primera trama de CN .
42. El aparato de acuerdo con cualquiera de las reivindicaciones 37 a 41, caracterizado porque la primera unidad de obtención comprende: una subunidad de distribución, configurada para distribuir M coeficientes de frecuencia espectral de inmitancia, ISF, o coeficientes de par espectral de inmitancia, ISP, o coeficientes de frecuencia espectral de línea, LSF, o coeficientes de par espectral de línea, LSP, en un rango de frecuencia correspondiente a una señal de banda alta; una primera subunidad de procesamiento de randomización, configurada para llevar a cabo procesamiento de randomización en los M coeficientes, en donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia después de cada N tramas, en donde ambos M y N son números naturales; y una cuarta subunidad de obtención, configurada para obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
43. El aparato de acuerdo con cualquiera de las reivindicaciones 37 a 41, caracterizado porque la primera unidad de obtención comprende: una quinta subunidad de obtención, configurada para obtener M coeficientes de ISF o coeficientes de ISP o coeficientes de LSF o coeficientes de LSP de una señal de ruido de banda alta almacenada en memoria intermedia localmente ; una segunda subunidad de procesamiento de randomización, configurada para llevar a cabo procesamiento de randomización en los M coeficientes, en donde una característica de la randomización es: provocar que cada coeficiente entre los M coeficientes se acerque gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un rango preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los coeficientes cambia después de cada N tramas; y una sexta subunidad de obtención, configurada para obtener, de acuerdo con los coeficientes de filtro obtenidos por procesamiento de randomización, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID.
44. El aparato de acuerdo con cualquiera de las reivindicaciones 37 a 43, caracterizado porque el aparato además comprende: un módulo de optimización, configurado para: antes de que el primer módulo de decodificación obtenga la primera trama de CN, cuando las tramas de historia adyacentes al SID son tramas vocales codificadas, cuando una energía promedio de las señales de banda alta o una parte de las señales de banda alta que se decodifican a partir de las tramas vocales codificadas es menor que una energía promedio de las señales de ruido de banda alta o una parte de las señales de ruido de banda alta que se generan localmente, multiplicar las señales de ruido de banda alta de las L tramas subsecuentes iniciando desde el SID por un factor de suavizado menor que 1, para obtener una nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente; en donde el primer módulo de decodificación está específicamente configurado para obtener una cuarta trama de CN de acuerdo con el parámetro de ruido de banda baja obtenido por decodificación, el coeficiente de filtro de síntesis de la señal de ruido de banda alta en el momento correspondiente al SID, y la nueva energía promedio ponderada de las señales de ruido de banda alta generadas localmente.
MX2014007968A 2011-12-30 2012-12-28 Metodo, aparato, y sistema para procesar datos de audio. MX338445B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110455836.7A CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和系统
PCT/CN2012/087812 WO2013097764A1 (zh) 2011-12-30 2012-12-28 音频数据的处理方法、装置和系统

Publications (2)

Publication Number Publication Date
MX2014007968A true MX2014007968A (es) 2015-01-26
MX338445B MX338445B (es) 2016-04-15

Family

ID=48678198

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2014007968A MX338445B (es) 2011-12-30 2012-12-28 Metodo, aparato, y sistema para procesar datos de audio.

Country Status (18)

Country Link
US (6) US9406304B2 (es)
EP (1) EP2793227B1 (es)
JP (2) JP6072068B2 (es)
KR (2) KR101770237B1 (es)
CN (1) CN103187065B (es)
AU (1) AU2012361423B2 (es)
BR (1) BR112014016153B1 (es)
CA (3) CA3059322C (es)
ES (1) ES2610783T3 (es)
HK (1) HK1199543A1 (es)
IN (1) IN2014KN01436A (es)
MX (1) MX338445B (es)
MY (1) MY173976A (es)
PT (1) PT2793227T (es)
RU (3) RU2617926C1 (es)
SG (2) SG10201609338SA (es)
WO (1) WO2013097764A1 (es)
ZA (2) ZA201404996B (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US9136763B2 (en) * 2013-06-18 2015-09-15 Intersil Americas LLC Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode
KR102121642B1 (ko) * 2014-03-31 2020-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
US10163453B2 (en) 2014-10-24 2018-12-25 Staton Techiya, Llc Robust voice activity detector system for use with an earphone
GB2532041B (en) 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
CN105681512B (zh) * 2016-02-25 2019-02-01 Oppo广东移动通信有限公司 一种降低语音通话功耗的方法及装置
CN105721656B (zh) * 2016-03-17 2018-10-12 北京小米移动软件有限公司 背景噪声生成方法及装置
ES2745018T3 (es) 2016-12-12 2020-02-27 Kyynel Oy Procedimiento versátil de selección de canal para red inalámbrica
US10504538B2 (en) * 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
US10540983B2 (en) * 2017-06-01 2020-01-21 Sorenson Ip Holdings, Llc Detecting and reducing feedback
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding
CN113571072B (zh) * 2021-09-26 2021-12-14 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品
CN117711434B (zh) * 2023-12-20 2024-10-22 书行科技(北京)有限公司 音频处理方法及装置、电子设备及计算机可读存储介质

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103065B1 (en) * 1998-10-30 2006-09-05 Broadcom Corporation Data packet fragmentation in a cable modem system
US6424938B1 (en) 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
EP1715712B1 (en) * 1998-11-24 2009-03-25 Telefonaktiebolaget LM Ericsson (publ) Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
WO2001033814A1 (en) * 1999-11-03 2001-05-10 Tellabs Operations, Inc. Integrated voice processing system for packet networks
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US7920697B2 (en) 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6691805B2 (en) 2001-08-27 2004-02-17 Halliburton Energy Services, Inc. Electrically conductive oil-based mud
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
JP4572123B2 (ja) * 2005-02-28 2010-10-27 日本電気株式会社 音源供給装置及び音源供給方法
CN101087319B (zh) * 2006-06-05 2012-01-04 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
US7809559B2 (en) * 2006-07-24 2010-10-05 Motorola, Inc. Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP2008139447A (ja) * 2006-11-30 2008-06-19 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
CN101246688B (zh) 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
BRPI0818927A2 (pt) * 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
DE102008009719A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
WO2011103924A1 (en) * 2010-02-25 2011-09-01 Telefonaktiebolaget L M Ericsson (Publ) Switching off dtx for music
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
JP2012215198A (ja) * 2011-03-31 2012-11-08 Showa Corp 回転構造体
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
KR101690899B1 (ko) * 2012-12-21 2016-12-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성

Also Published As

Publication number Publication date
HK1199543A1 (en) 2015-07-03
US20160300578A1 (en) 2016-10-13
US9892738B2 (en) 2018-02-13
CA2861916C (en) 2019-11-19
CN103187065A (zh) 2013-07-03
US20230352035A1 (en) 2023-11-02
EP2793227A4 (en) 2015-03-18
US20180137869A1 (en) 2018-05-17
US20220044692A1 (en) 2022-02-10
SG10201609338SA (en) 2016-12-29
IN2014KN01436A (es) 2015-10-23
US11183197B2 (en) 2021-11-23
PT2793227T (pt) 2016-12-29
BR112014016153B1 (pt) 2021-01-12
MX338445B (es) 2016-04-15
EP2793227A1 (en) 2014-10-22
CA3059322C (en) 2023-01-10
JP6072068B2 (ja) 2017-02-01
JP6462653B2 (ja) 2019-01-30
CN103187065B (zh) 2015-12-16
KR20140109456A (ko) 2014-09-15
RU2641464C1 (ru) 2018-01-17
ZA201600247B (en) 2016-03-30
US12100406B2 (en) 2024-09-24
AU2012361423A1 (en) 2014-07-31
AU2012361423B2 (en) 2016-01-28
KR20170002704A (ko) 2017-01-06
WO2013097764A1 (zh) 2013-07-04
MY173976A (en) 2020-03-02
KR101770237B1 (ko) 2017-08-22
ZA201404996B (en) 2016-06-29
US9406304B2 (en) 2016-08-02
RU2579926C1 (ru) 2016-04-10
US20200098378A1 (en) 2020-03-26
BR112014016153A8 (pt) 2017-07-04
JP2015507764A (ja) 2015-03-12
US10529345B2 (en) 2020-01-07
JP2017062512A (ja) 2017-03-30
CA3059322A1 (en) 2013-07-04
CA3181066A1 (en) 2013-07-04
SG11201403686SA (en) 2014-10-30
ES2610783T3 (es) 2017-05-03
US20140316774A1 (en) 2014-10-23
CA2861916A1 (en) 2013-07-04
BR112014016153A2 (pt) 2017-06-13
KR101693280B1 (ko) 2017-01-05
RU2617926C1 (ru) 2017-04-28
US11727946B2 (en) 2023-08-15
EP2793227B1 (en) 2016-10-26

Similar Documents

Publication Publication Date Title
US20230352035A1 (en) Method, Apparatus, and System for Processing Audio Data
KR102636396B1 (ko) 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
US11037581B2 (en) Signal processing method and device adaptive to noise environment and terminal device employing same
WO2023197809A1 (zh) 一种高频音频信号的编解码方法和相关装置
US20190198033A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
WO2024051412A1 (zh) 语音编码、解码方法、装置、计算机设备和存储介质
EP2774148A1 (en) Bandwidth extension of audio signals
CN112951252B (zh) 一种lc3音频码流的混音方法、装置、介质及设备

Legal Events

Date Code Title Description
FG Grant or registration