ES2610783T3 - Método y aparato para procesar datos de audio - Google Patents
Método y aparato para procesar datos de audio Download PDFInfo
- Publication number
- ES2610783T3 ES2610783T3 ES12861377.5T ES12861377T ES2610783T3 ES 2610783 T3 ES2610783 T3 ES 2610783T3 ES 12861377 T ES12861377 T ES 12861377T ES 2610783 T3 ES2610783 T3 ES 2610783T3
- Authority
- ES
- Spain
- Prior art keywords
- noise
- band
- sid
- signal
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000012545 processing Methods 0.000 title claims abstract description 55
- 230000005540 biological transmission Effects 0.000 claims abstract description 120
- 230000007246 mechanism Effects 0.000 claims abstract description 69
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 238000003780 insertion Methods 0.000 claims abstract description 16
- 230000037431 insertion Effects 0.000 claims abstract description 16
- 230000003595 spectral effect Effects 0.000 claims description 57
- 230000015572 biosynthetic process Effects 0.000 claims description 40
- 238000003786 synthesis reaction Methods 0.000 claims description 40
- 230000001755 vocal effect Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 23
- 108010001267 Protein Subunits Proteins 0.000 claims description 20
- 238000009499 grossing Methods 0.000 claims description 9
- 238000013459 approach Methods 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 13
- 230000007774 longterm Effects 0.000 description 12
- 230000005284 excitation Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 6
- 101150011258 Crppa gene Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 101100379142 Mus musculus Anxa1 gene Proteins 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101000995014 Archaeoglobus fulgidus (strain ATCC 49558 / DSM 4304 / JCM 9628 / NBRC 100126 / VC-16) Iron-sulfur flavoprotein AF_1436 Proteins 0.000 description 1
- 206010021403 Illusion Diseases 0.000 description 1
- 101000995013 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Iron-sulfur flavoprotein MJ0731 Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
Abstract
Un método para procesar datos de audio, en donde el método comprende: obtener una trama de ruido de una señal de audio, y descomponer la trama de ruido en una señal de banda baja de ruido y una señal de banda alta de ruido; y codificar la señal de banda baja de ruido utilizando un primer mecanismo de transmisión discontinua y transmitir la señal de banda baja de ruido codificada utilizando el primer mecanismo de transmisión discontinua, y codificar la señal de banda alta de ruido utilizando un segundo mecanismo de transmisión discontinua y transmitir la señal de banda alta de ruido codificada utilizando el segundo mecanismo de transmisión discontinua, en donde una política para enviar una primera trama de descriptor de inserción de silencio, SID, del primer mecanismo de transmisión discontinua es diferente de una política para enviar un segundo SID del segundo mecanismo de transmisión discontinua; en donde la codificación de la señal de banda alta de ruido utilizando un segundo mecanismo de transmisión discontinua y transmitiendo la señal de banda alta de ruido codificada utilizando el segundo mecanismo de transmisión discontinua comprende: generar un valor de extensión de desviación en conformidad con una primera relación y una segunda relación, en donde la primera relación es una relación de una energía de la señal de banda alta de ruido a una energía de la señal de banda baja de ruido de la trama de ruido, y la segunda relación es una relación de una energía de una señal de banda alta de ruido a una energía de una señal de banda baja de ruido en un momento cuando un SID, que comprende un parámetro de banda alta de ruido, se envía por última vez antes de la trama de ruido; y determinar si el valor de extensión de desviación alcanza un umbral preestablecido; si la respuesta es afirmativa, codificar un SID de la señal de banda alta de ruido utilizando la política para codificar el segundo SID, y enviar el SID; y si la respuesta es negativa, determinar que la señal de banda alta de ruido no necesita codificarse ni transmitirse.
Description
5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Metodo y aparato para procesar datos de audio CAMPO DE LA INVENCION
La presente invencion se refiere al campo de las tecnolog^as de comunicaciones y en particular, a un metodo y aparato para procesar datos de audio.
ANTECEDENTES DE LA INVENCION
En el campo de las comunicaciones digitales, existen amplias necesidades de aplicaciones para la transmision de voces, imagenes, audios y videos, tales como llamadas de telefono movil, conferencias de audioMdeo, television de difusion general y actividades de entretenimiento multimedia. Una voz es digitalizada y luego, transferida desde un terminal a otro terminal por intermedio de una red de comunicaciones vocales. En este caso, los terminales pueden ser telefonos moviles, terminales telefonicos digitales o terminales de vocales o cualesquiera otros tipos. Ejemplos de terminales telefonicos digitales son telefonos VoIP o telefonos ISDN, ordenadores y telefonos de comunicacion por cable. Para reducir los recursos ocupados en el proceso de memorizar o transmitir senales de audio, un extremo emisor realiza un procesamiento de compresion sobre senales de audio antes de transmitir las senales de audio a un extremo transceptor, y el extremo transceptor realiza un procesamiento de descompresion para restablecer las senales de audio y reproducir las senales de audio.
En la comunicacion vocal, una voz esta incluida en solamente un 40 % del tiempo y en otro tiempo, existe solamente silencio o ruido de fondo. Para salvaguardar los anchos de banda de transmision y evitar un consumo innecesario de ancho de banda en un periodo de silencio o de ruido de fondo, emerge una tecnologfa de DTX/CNG (Sistema de Transmision Discontinua/Generacion de Ruido de Confort). Simplemente, DTX/CNG significa no codificar tramas de ruido continuamente, sino realizar una codificacion solamente una vez en un intervalo de varias tramas en un periodo de ruido/silencio en conformidad con una polftica establecida, en donde una tasa binaria codificada suele ser muy inferior a una tasa binaria de codificacion de trama vocal. Una trama de ruido codificada a dicha baja tasa se refiere como una trama SID (alarma de Descriptor de Insercion de Silencio). Un decodificador restablece las tramas de ruido de fondo continuo en el extremo de decodificacion en conformidad con tramas SIDs recibidas de forma discontinua. Dicho ruido de fondo continuamente restablecido no es una reproduccion fiel del ruido de fondo de un extremo de codificacion, sino que tiene como objetivo evitar que se cause un deterioro de la calidad en la audiencia en la mayor medida posible, de modo que un usuario no se sienta incomodo cuando escucha el ruido. El ruido de fondo restablecido se refiere como un CN (Comfort Noise - ruido de fondo) y el metodo para restablecer el CN en el extremo de decodificacion se refiere como una generacion de ruido de confort.
En la tecnica anterior, ITU-T G.718 es un nuevo estandar de codec de banda ancha, que incluye un sistema DTX/CNG de banda ancha. El sistema de puede enviar un SID en conformidad con un intervalo fijo, y puede tambien ajustar, de forma adaptativa, el intervalo de envfo de SID conforme a un nivel de ruido estimado. Una trama SID de G.718 incluye 16 parametros ISP y los parametros de energfa de excitacion. Este grupo de parametros de ISP (Par Espectral de Inmitancia) representa una envolvente espectral sobre el ancho de banda de una banda ancha completa, y una energfa de excitacion se obtiene mediante un filtro de analisis representado por este grupo de parametros ISP. Al final de la decodificacion, la G.718 estima, en funcion de los parametros ISP obtenidos decodificando un SID en un estado CNG, un coeficiente LPC requerido para CNG, estima, en conformidad con los parametros de energfa de excitacion obtenidos mediante decodificacion de la trama SID, una energfa de excitacion requerida para CNG, y utiliza el ruido blanco ajustado en ganancia para excitar un filtro de smtesis de CNG para obtener una CN reconstruida.
Sin embargo, para una envolvente espectral de banda superancha, el ancho de banda de la banda superancha es extremadamente ancha; cuando la tecnica anterior se extiende a un sistema DTX/CNG de banda superancha, mas cargas de calculo y bits se necesitan consumir para calcular y codificar la docena anadida de parametros ISP, puesto que una envolvente espectral de banda superancha completa necesita codificarse para un SID. Puesto que las senales de banda alta de ruido (que se refiere a una gama de frecuencia por encima de la banda ancha en este caso) no suelen ser perceptualmente sensibles en la audiencia, las cargas de calculo y los bits consumidos para esta parte de las senales no son rentables, por lo que se reduce la eficiencia de codificacion del codec.
El documento US 2008/0195383 A1 da a conocer una senal de control DTX de banda estrecha y una senal de control DTX de banda ancha.
SUMARIO DE LA INVENCION
Para resolver un problema de transmision y codificacion de banda superancha, las formas de realizacion de la presente invencion dan a conocer un metodo y un aparato para procesar datos de audio. Las soluciones tecnicas son como sigue:
En conformidad con un aspecto de la idea inventiva, se da a conocer un metodo para procesar datos de audio segun se establece en la reivindicacion 1.
5
10
15
20
25
30
35
40
45
50
55
60
65
En conformidad con un aspecto de la idea inventiva, se da a conocer un metodo para procesar datos de audio segun se establece en la reivindicacion 6.
Segun otro aspecto de la idea inventiva, se da a conocer un aparato para codificar datos de audio segun se establece en la reivindicacion 15.
Segun otro aspecto de la idea inventiva, se proporciona un aparato para decodificar datos de audio segun se establece en la reivindicacion 20. Formas de realizacion preferidas se establecen en las reivindicaciones subordinadas.
Las soluciones tecnicas dadas a conocer por las formas de realizacion de la presente invencion proporcionan los efectos ventajosos siguientes: Una trama de ruido actual se descompone en una senal de banda baja de ruido y una senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua y la senal de banda alta de ruido se codifica y transmite utilizando un segundo mecanismo de transmision discontinua; un decodificador obtiene una trama de descriptor de insercion de silencio SID y determina si el SID incluye un parametro de banda baja y/o un parametro de banda alta; y diferentes maneras de decodificacion de ruido se utilizan en conformidad con los resultados de determinacion diferentes. De este modo, se utilizan diferentes maneras de codificacion y de decodificacion para la senal de banda alta y para la senal de banda baja, con lo que se puede reducir la complejidad del calculo y los bits codificados se pueden salvaguardar bajo una condicion de no reducir la calidad subjetiva de un codec y los bits que se salvaguardan pueden ayudar a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, con lo que se resuelve un problema de codificacion de banda superancha y su transmision.
BREVE DESCRIPCION DE LOS DIBUJOS
Para describir las soluciones tecnicas en las formas de realizacion de la presente invencion con mayor claridad, a continuacion se introducen brevemente los dibujos adjuntos requeridos para describir las formas de realizacion. Evidentemente, los dibujos adjuntos en la descripcion siguiente ilustran simplemente algunas formas de realizacion de la presente invencion y un experto en esta tecnica puede derivar todavfa otros dibujos a partir de estos dibujos adjuntos sin necesidad de esfuerzos creativos.
- La Figura 1
- es un diagrama de flujo de un metodo para procesar datos de audio en conformidad con la forma de
- realizacion 1
- de la presente invencion;
- La Figura 2
- es un diagrama de flujo de un metodo para procesar datos de audio en conformidad con la forma de
- realizacion 2
- de la presente invencion;
- La Figura 3
- es un diagrama de flujo de un metodo para procesar datos de audio en conformidad con la forma de
- realizacion 3
- de la presente invencion;
- La Figura 4
- es un diagrama de flujo de un metodo para procesar datos de audio en conformidad con la forma de
realizacion 4 de la presente invencion;
La Figura 5 es un diagrama esquematico de un aparato para codificar datos de audio en conformidad con la forma de realizacion 6 de la presente invencion;
La Figura 6 es un diagrama esquematico de otro aparato para codificar datos de audio en conformidad con la forma de realizacion 6 de la presente invencion;
La Figura 7 es un diagrama esquematico de un aparato para decodificar datos de audio en conformidad con la forma de realizacion 7 de la presente invencion;
La Figura 8 es un diagrama esquematico de otro aparato para decodificar datos de audio en conformidad con la forma de realizacion 7 de la presente invencion; y
La Figura 9 es un diagrama esquematico de un sistema para procesar datos de audio en conformidad con la forma de realizacion 8 de la presente invencion.
DESCRIPCION DETALLADA DE LAS FORMAS DE REALIZACION
Para hacer mas claros los objetivos, las soluciones tecnicas y las ventajas de la presente invencion, a continuacion se describen, ademas, las formas de realizacion de la presente invencion en detalle haciendo referencia a los dibujos adjuntos. Las formas de realizacion 3, 5 y 8 no comprenden todas las caractensticas necesarias para poner en practica la invencion.
Forma de realizacion 1
5
10
15
20
25
30
35
40
45
50
55
60
Haciendo referencia a la Figura 1, esta forma de realizacion da a conocer un metodo para procesar datos de audio, en donde el metodo incluye lo siguiente:
101. Obtener una trama de ruido de una senal de audio, y descomponer la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido.
102. Codificar y transmitir la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua y codificar y transmitir la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua, en donde una polftica para enviar una primera trama de descriptor de insercion de silencio SID del primer mecanismo de transmision discontinua es diferente de una polftica para enviar un segundo SID del segundo mecanismo de transmision discontinua, o una polftica para codificar un primer SlD del primer mecanismo de transmision discontinua es diferente de una polftica para codificar un segundo SID del segundo mecanismo de transmision discontinua.
En esta forma de realizacion, el primer SID incluye un parametro de banda baja de la trama de ruido y el segundo SID incluye un parametro de banda baja o un parametro de banda alta de la trama de ruido.
De modo opcional, en esta forma de realizacion, la codificacion y transmision de la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua incluye:
determinar si la senal de banda alta de ruido tiene una estructura espectral preestablecida; si la respuesta es afirmativa, y se satisface una condicion de envfto de la polftica para enviar el segundo SID, codificar un SID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si la respuesta no es afirmativa, determinar que la senal de banda alta de ruido no necesita codificarse y transmitirse.
La determinacion de si la senal de banda alta de ruido tiene una estructura espectral preestablecida incluye:
obtener un espectro de la senal de banda alta de ruido, dividiendo el espectro en al menos dos sub-bandas, y si una energfa media de cualesquiera primera sub-banda en las sub-bandas no es inferior a una energfa media de una segunda sub-banda entre las sub-bandas, en donde una banda de frecuencia en la que esta situada la segunda sub-banda es mas alta que una banda de frecuencia en la que esta situada la primera sub-banda, confirmar que la senal de banda alta de ruido no tiene ninguna estructura espectral preestablecida; de no ser asf, confirmar que la senal de banda alta de ruido tiene una estructura espectral preestablecida.
En esta forma de realizacion, la codificacion y transmision de la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua incluye:
generar un valor de extension de desviacion en conformidad con una primera relacion y una segunda relacion, en donde la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido, y la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en el momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido; y
determinar si el valor de extension de desviacion alcanza un umbral preestablecido; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si la respuesta no es afirmativa, determinar que la senal de banda alta de ruido no necesita codificarse y transmitirse.
De modo opcional, que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que:
la primera relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido de la trama de ruido; y
en correspondencia, que la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en el momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido incluye que:
la segunda relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido.
Como alternativa, que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que:
5
10
15
20
25
30
35
40
45
50
55
60
65
la primera relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido de la trama de ruido y una trama de ruido anterior a la trama de ruido a una energfa de media ponderada de las senales de banda baja de ruido de la trama de ruido y la trama de ruido anterior a la trama de ruido; y
en correspondencia, que la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en el momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido incluye que:
la segunda relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido a una energfa media ponderada de senales de banda baja de ruido de una trama de ruido y una trama de ruido anterior a la trama de ruido en el momento cuando el SID que incluye el parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido.
En esta forma de realizacion, la generacion de un valor de extension de desviacion en conformidad con una primera relacion y a una segunda relacion incluye:
calcular, por separado, un valor logantmico de la primera relacion y un valor logantmico de la segunda relacion; y
calcular un valor absoluto de una diferencia entre el valor logantmico de la primera relacion y el valor logantmico de la segunda relacion, para obtener el valor de extension de desviacion.
De modo opcional, en esta forma de realizacion, la codificacion y transmision de la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua incluye:
determinar si una estructura espectral de la senal de banda alta de ruido de la trama de ruido, en comparacion con una estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido, satisface una condicion preestablecida; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido de la trama de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si la respuesta no es afirmativa, determinar que la senal de banda alta de ruido de la trama de ruido no necesita codificarse y transmitirse.
La estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido incluye: una media ponderada de espectros de las senales de banda alta de ruido antes de la trama de ruido.
En esta forma de realizacion, la condicion de envfo en la polftica para enviar el segundo SID del segundo mecanismo de transmision discontinua incluye, ademas: el primer mecanismo de transmision discontinua satisface una condicion para enviar el primer SID.
La forma de realizacion del metodo dada a conocer por la presente invencion aporta los efectos ventajosos siguientes: Una trama de ruido actual de una senal de audio se obtiene y la trama de ruido actual se descompone en una senal de banda baja de ruido y una senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua, y la senal de banda alta de ruido se codifica y transmita utilizando un segundo mecanismo de transmision discontinua. De este modo, se utilizan diferentes maneras de procesamiento para la senal de banda alta y la senal de banda baja, puede reducirse la complejidad del calculo y los bits codificados pueden salvaguardarse bajo la condicion de no reducir la calidad subjetiva de un codec, y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, con lo que se resuelve un problema de codificacion y transmision de banda superancha.
Forma de realizacion 2
Haciendo referencia a la Figura 2, esta forma de realizacion da a conocer un metodo para procesar datos de audio, en donde el metodo incluye lo siguiente:
201. Un decodificador obtiene una trama de descriptor de insercion de silencio SID, y determina si el SID incluye un parametro de banda baja o un parametro de banda alta.
202. Si el SID incluye el parametro de banda baja, decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido y obtener una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado.
203. Si el SID incluye el parametro de banda alta, decodificar el SID para obtener una senal de banda alta de ruido, un parametro de banda baja de ruido generado localmente y obtener una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenida por decodificacion y el parametro de banda baja de ruido localmente generado.
5
10
15
20
25
30
35
40
45
50
55
60
65
204. Si el SID incluye el parametro de banda alta y el parametro de banda baja, decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido mediante codificacion.
De modo opcional, en esta forma de realizacion, si el SID incluye el parametro de banda baja, antes de decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido y obtener una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente, el metodo incluye, ademas:
si el decodificador esta en un primero estado de generacion de ruido de confort CNG, entrar, mediante el decodificador, en un segundo estado CNG.
De modo opcional, en esta forma de realizacion, si el SID incluye el parametro de banda alta y el parametro de banda baja, antes de la decodificacion del SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtener una tercera trama Cn en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido por decodificacion, el metodo incluye, ademas:
si el decodificador esta en un segundo estado CNG, entrar, mediante el decodificador, en un primer estado CNG.
De modo opcional, en esta forma de realizacion, la determinacion de si el SID incluye un parametro de banda baja y/o un parametro de banda alta, incluye:
si el numero de bits del SID es inferior que un primer umbral preestablecido, confirmar que el SID incluye el parametro de banda alta; si el numero de bits del SID es superior que un primer umbral preestablecido e inferior que un segundo umbral preestablecido, confirmar que el SID incluye el parametro de banda baja; y si el numero de bits del SID es superior que un segundo umbral preestablecido e inferior que un tercer umbral preestablecido, confirmar que el SID incluye el parametro de banda alta y el parametro de banda baja; o
si el SID incluye un primer identificador, confirmar que el SID incluye el parametro de banda alta; si el SID incluye un segundo identificador, confirmar que el SID incluye el parametro de banda baja; y si el SID incluye un tercer identificador, confirmar que el SID incluye el parametro de banda baja y el parametro de banda alta.
En esta forma de realizacion, la generacion local de un parametro de banda alta de ruido incluye:
obtener, por separado, una energfa media ponderada de una senal de banda alta de ruido y un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID; y
obtener la senal de banda alta de ruido en conformidad con la energfa media ponderada obtenida de la senal de banda alta de ruido y el coeficiente de filtro de smtesis obtenido de la senal de banda alta de ruido en el momento correspondiente al SID.
En esta forma de realizacion, la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID incluye:
obtener una energfa de una senal de banda baja de la primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion:
calcular una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta se recibe antes del SID, para obtener una primera relacion;
obtener, en conformidad con la energfa de la senal de banda baja de la primera trama CN y la primera relacion, una energfa de la senal de banda alta de ruido en el momento correspondiente al SID; y
realizar una promediacion ponderada sobre la energfa de la senal de banda alta de ruido en el momento correspondiente al SID y una energfa de una senal de banda alta de una trama CN memorizada localmente, para obtener la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
De modo opcional, en esta forma de realizacion, el calculo de una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta se recibe antes del SID, para obtener una primera relacion, incluye:
5
10
15
20
25
30
35
40
45
50
55
60
65
calcular una relacion de una ene^a instantanea de la senal de banda alta de ruido a una ene^a instantanea de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta se recibe antes del SID, para obtener la primera relacion; o
calcular una relacion de una energfa media ponderada de la senal de banda alta de ruido a una energfa media ponderada de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta se recibe antes del SID, para obtener la primera relacion.
Cuando la energfa de la senal de banda alta de ruido en el momento correspondiente al SID es superior que una energfa de una senal de banda baja de una trama CN precedente que se memoriza localmente, la energfa de la senal de banda alta de la trama CN anterior que esta localmente memorizada se actualiza en una primera tasa; de no ser asf, la energfa de la senal de banda alta de la trama CN anterior que esta localmente memorizada se actualiza en una segunda tasa, en donde la primera tasa es mayor que la segunda tasa.
De modo opcional, en esta forma de realizacion, la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID incluye:
seleccionar una senal de banda alta de una trama de voz con una energfa de senal de banda alta minima a partir de las tramas vocales dentro de un periodo de tiempo preestablecido antes del SID; y
obtener, en conformidad con una energfa de la senal de banda alta de la trama vocal con la energfa de senal de banda alta minima a partir de las tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN; o
seleccionar senales de banda alta de N tramas de voz con una energfa de senal de banda alta inferior que un umbral preestablecido a partir de las tramas de voz dentro de un periodo de tiempo preestablecido antes del SID; y
obtener, en conformidad con una energfa media ponderada de las de banda alta de las N tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
De modo opcional, en esta forma de realizacion, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID incluye:
distribuir M coeficientes ISF (Frecuencia Espectral de Inmitancia) o coeficientes ISP o coeficientes LSF (Frecuencia Espectral de Lmea) o coeficientes LSP (Par Espectral de Lmea) en un margen de frecuencias correspondiente a una senal de banda alta;
realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas, en donde los valores M y N son numeros naturales; y
obtener, en conformidad con los coeficientes de filtro obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
De modo opcional, en esta forma de realizacion, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID incluye:
obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido memorizada localmente;
realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas; y
obtener, en conformidad con los coeficientes de filtro obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
De modo opcional, en esta forma de realizacion, antes de la obtencion de una primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente, el metodo incluye, ademas:
5
10
15
20
25
30
35
40
45
50
55
60
65
cuando las tramas de registro historico adyacentes al SID son tramas vocales codificadas, si una energfa media de las senales de banda alta o una parte de senales de banda alta que se decodifican a partir de las tramas vocales codificadas es inferior que una energfa media de las senales de baro una parte de las senales de banda alta de ruido que se generan localmente, multiplicar las senales de banda alta de ruido de L tramas posteriores comenzando desde el SID por un factor de alisado menor que 1, para obtener una nueva energfa media ponderada de las senales de banda alta de ruido localmente generadas; y
en correspondencia, la obtencion de una primera trama CN en conformidad con el parametro de banda baja obtenido por decodificacion y el parametro de banda alta de ruido localmente generado incluye:
obtener una cuarta trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID, y la nueva energfa media ponderada de las senales de banda alta de ruido localmente generadas.
La forma de realizacion del metodo dada a conocer por la presente invencion aporta los efectos ventajosos siguientes: Un decodificador obtiene una trama de descriptor de insercion de silencio SID y determinar si el SID incluye un parametro de banda baja y/o un parametro de banda alta; si el SID incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, genera localmente un parametro de banda alta de ruido y obtiene una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado; si el SID incluye el parametro de banda alta, decodifica el SID para obtener un parametro de banda alta de ruido, genera localmente un parametro de banda baja de ruido, y obtiene una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido generado localmente; y si el SID incluye el parametro de banda alta y el parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtiene una tercera trama CN en conformidad con un parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido por decodificacion. De este modo, se utiliza diferentes maneras de procesamiento para la senal de banda alta y la senal de banda baja, puede reducirse la complejidad del calculo y los bits codificados pueden salvaguardarse bajo la condicion de no disminuir la calidad subjetiva de un codec y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, con lo que se resuelve un problema de codificacion y transmision de banda superancha.
Forma de realizacion 3
Esta forma de realizacion da a conocer un metodo para procesar datos de audio. En un extremo de codificacion, prescindiendo de que sea un espectro de ruido CNG de banda baja o un espectro de ruido CNG de banda alta, en general, se pierde una estructura armonica y por lo tanto, en una senal de banda alta CNG, lo que es perceptualmente efectivo en la audiencia de que es principalmente una energfa de la senal de banda alta CNG y no una estructura espectral de la senal de banda alta CNG. Por lo tanto, en la transmision DTX de una senal de banda superancha, en numerosos casos, resulta innecesario transmitir un espectro de senal de banda alta en un SID; en cambio, un metodo adecuado para utilizarse para construir un espectro de banda alta localmente en un extremo de decodificacion. El espectro de banda alta localmente construido no dara lugar a una distorsion perceptual obvia. De este modo, las cargas de calculo y los bits para calcular y codificar el espectro de banda alta se salvaguardan en el extremo de codificacion. Asimismo, para otras senales de ruido, puede existir una estructura armonica en una senal de banda alta correspondiente y construir un espectro de banda alta localmente en el extremo de decodificacion solamente puede causar un problema de deterioro de la calidad perceptual en la conmutacion entre el segmento CNG y un segmento vocal. Por lo tanto, para dicho ruido, necesita transmitirse un parametro espectral en un SID. Puede deducirse que un sistema DTX/CNG que tiene en cuenta la eficiencia y la calidad debe ser capaz seleccionar, de forma adaptativa, la codificacion o no seleccionar para codificar un parametro espectral de banda alta en un SID en el extremo de codificacion en conformidad con una cara de banda alta de ruido de fondo y reconstruir una trama CNG en el extremo de decodificacion utilizando diferentes metodo de decodificacion en conformidad con los diferentes tipos de SIDs. En esta forma de realizacion, un metodo para procesar datos de audio se da a conocer y que incluye lo siguiente: un espectro de banda alta de ruido se analiza y clasifica; un decodificador construye, a ciegas, un espectro de senal de banda alta; cuando un SID no incluye un parametro de energfa de banda alta, el decodificador estima una energfa de senal de banda alta; y el decodificador conmuta entre diferentes modulos CNG, y asf sucesivamente. Con referencia a la Figura 3, en particular, un metodo para procesar datos de audio en un extremo codificador en conformidad con esta forma de realizacion incluye:
301. Un codificador obtiene una trama de ruido de una senal de audio, y descompone la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido.
En esta forma de realizacion, debido a las diferentes reglas de codificacion del codificador, el codificador obtiene una trama de ruido de una senal de audio y la trama de ruido puede ser una trama de ruido actual o puede ser una trama de ruido memorizada en el extremo del codificador, lo que no esta espedficamente limitado en esta forma de realizacion. En esta forma de realizacion, senales de audio de entrada de banda superancha muestreadas a la frecuencia de 32 kHz se utilizan a modo de ejemplo. El codificador realiza primero el procesamiento de entramado sobre las senales de audio de
5
10
15
20
25
30
35
40
45
50
55
60
entrada, a modo de ejemplo, 20 ms (o 640 puntos de muestreo) se utilizan como una trama. Para la trama actual (en esta forma de realizacion, la trama actual se refiere a una trama actual a codificar), el codificador realiza primero un filtrado de paso alto. En general, una banda de paso se refiere a frecuencias superior a 50 Hz. La trama actual del filtrado de paso alto se descompone en una senal de banda baja so y una senal de banda alta si mediante un filtro especular en cuadratura QMF (Quadrature Mirror Filter) como filtro de analisis. La senal de banda baja so se muestrea a 16 kHz y representa un espectro de 0-8 kHz de la trama actual. La senal de banda alta si se muestrea tambien a 16 kHz, y representa un espectro de 8-16 kHz de la trama actual. Cuando un detector VAD (Voice Activity Detector, detector de actividad vocal) indica que la trama actual es una trama de senal de primer plano, es decir, una trama de senal vocal, el codificador realiza una codificacion vocal sobre la trama actual. En esta forma de realizacion, habida cuenta que el codificador que codifica la trama vocal codificada pertenece al alcance de la tecnica anterior, y por ello sus detalles no se describen repetidamente en esta forma de realizacion. El detector VAD indica que el codificador entra en un estado de trabajo DTX cuando la trama actual es una trama de ruido. En esta forma de realizacion, la trama de ruido se refiere a una trama de ruido de fondo o a una trama de silencio.
En esta forma de realizacion, en el estado de trabajo DTX, un controlador DTX decide, en conformidad con una polftica de envfo de SID, si codificar y enviar un SID de la senal de banda baja de la trama actual o no hacerlo. En esta forma de realizacion, la polftica para enviar un SID de una senal de banda baja es como sigue: (1) enviar un SID en una primera trama de ruido despues de una trama vocal codificada y establecer un identificador de envfo de SID flagSID a 1; (2) en un periodo de ruido, enviar una trama SID en una N-esima trama despues de cada trama SID y establecer indicadores flagSID a 1 en la trama, en donde N es un numero entero mayor que 1 y es una entrada externa para el codificador; y (3) en el periodo de ruido, no enviar ningun SID en otras tramas y establecer los indicadores flagSID a 0. En esta forma de realizacion, la polftica para enviar un SID de una senal de banda baja es similar a la de la tecnica anterior y por ello no se describe en detalle en la presente invencion.
302. Determinar si la senal de banda alta de la trama de ruido actual satisface una condicion de codificacion y transmision preestablecida; si la respuesta es afirmativa, realizar la etapa 304; si no es afirmativa, realizar la etapa 303.
En esta forma de realizacion, la determinacion de si la senal de banda alta de la trama de ruido actual satisface una condicion de codificacion y transmision preestablecida incluye: determinar si la senal de banda alta de ruido tiene una estructura espectral preestablecida; si la respuesta es afirmativa, y se satisface una condicion de envfo de una polftica para enviar el segundo SID, codificar un SID de la senal de banda alta de ruido utilizando la polftica de codificacion del segundo SID, y enviar el SID; y si no es asf, determinar que la senal de banda alta de ruido no necesita codificarse ni transmitirse. La determinacion de si la senal de banda alta de ruido tiene una estructura espectral preestablecida incluye: obtener un espectro de la senal de banda alta de ruido, dividiendo el espectro en al menos dos sub-bandas, y si una energfa media de cualquier primera sub-banda entre las sub-bandas no es inferior a una energfa media de una segunda sub-banda entre las sub-bandas, en donde una banda de frecuencias en la que esta situada la segunda sub-banda es mas alta que la banda de fresen la que esta situada la primera sub-banda, confirmar que la senal de banda alta de ruido no tiene ninguna estructura espectral preestablecida; de no ser asf, confirmar que la senal de banda alta de ruido tiene una estructura espectral preestablecida.
En esta forma de realizacion, en el estado de trabajo DTX, el codificador realiza el analisis espectral sobre la senal de banda alta s1 de la trama de ruido actual para determinar si s1 tiene una estructura espectral aparente, es decir, una estructura espectral preestablecida. Un metodo especftico en esta forma de realizacion es como sigue: un muestreo descendente para 12.8 kHz se realiza sobre s1, y se realiza una FFT de 256 puntos sobre la senal muestreada en sentido descendente para obtener un espectro C(i), en donde i=0,...127. C(i) se divide en cuatro sub-bandas de una anchura igual y una energia E(i) de cada sub-banda se calcula a este respecto. Cada sub-banda es cualquier primera
£(0= £c(/),
sub-banda anteriormente mencionada. en donde i=0,...3, 1(i) y h(i), respectivamente, representan un
ftmite superior y un ftmite inferior de la i-esima sub-banda 1(i)={0, 32, 64, 96}, y h(i)={31, 63, 95, 127}. Si se satisface la siguiente condicion, se comprueba:
E(i)>VE(j) j > i (l)
en donde E(j) es la segunda sub-banda anteriormente mencionada. Si se satisface la formula anterior (1), es decir, si la energfa de cualquier primera sub-banda entre las sub-bandas no es inferior a la energfa de la segunda sub-banda entre las sub-bandas, se considera que la senal de banda alta no tiene una estructura espectral aparente; de no ser asf, la senal de banda alta tiene una estructura espectral aparente. Si la senal de banda alta tiene una estructura espectral aparente, una polftica de DTX es enviar un parametro de banda alta. En esta forma de realizacion, si un identificador de envfo de parametro de banda alta flaghb no es 1, flaghb=1 se establece en la siguiente ocasion cuando flagSID=1; de no ser asf, flaghb=0.
En esta forma de realizacion, cuando se satisface la condicion de envfo de SID, si es necesario, o no, codificar y transmitir la senal de banda alta de la trama de ruido actual puede determinarse utilizando la estructura espectral de la senal de banda alta de la trama de ruido actual, y la determinacion de si la senal de banda alta de ruido tiene una estructura espectral preestablecida y si la senal de banda baja de ruido satisface la condicion de envfo de SID se utiliza
5
10
15
20
25
30
35
40
45
50
55
60
como una primera condicion de determinacion. De modo opcional, en esta forma de realizacion, la determinacion de si la senal de banda alta de la trama de ruido actual satisface una condicion de codificacion y envfo preestablecida incluye: generar un valor de extension de desviacion en conformidad con una primera relacion y una segunda relacion, en donde la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido, y la segunda relacion es una relacion de una energfa de una senalizacion de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido; y la determinacion de si el valor de extension de desviacion alcanza un umbral preestablecido o no; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID y enviar el SID; y si la respuesta no es afirmativa, determinar que la senal de banda alta de ruido no necesita codificarse ni transmitirse. De modo opcional, el hecho de que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que: la primera relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido de la trama de ruido; y en correspondencia, la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de la senal de banda baja de ruido en un momento cuando un SID, que incluye un parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido incluye que: la segunda relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido en el momento cuando el SID, que incluye el parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido. Como alternativa, el hecho de que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que: la primera relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido de la trama de ruido y una trama de ruido antes de la trama de ruido a una energfa media ponderada de las senales de banda baja de ruido de la trama de ruido y la trama de ruido antes de la trama de ruido; y en correspondencia, que la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido incluye que: la segunda relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido en el momento cuando el SID que incluye el parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido. En esta forma de realizacion, preferentemente, la generacion de un valor de extension de desviacion en conformidad con una primera relacion y una segunda relacion, incluye: calcular por separado un valor logantmico de la primera relacion y un valor logantmico de la segunda relacion; y calcular un valor absoluto de una diferencia entre el valor logantmico de la primera relacion y el valor logantmico de la segunda relacion, para obtener el valor de extension de desviacion.
Mas concretamente, en esta forma de realizacion, la determinacion de si el valor de extension de desviacion alcanza un umbral preestablecido puede realizarse en la manera siguiente:
En el estado de trabajo DTX, el codificador calcula por separado las energfas logantmicas ei y eo de la senal de banda alta si y la senal de banda baja so de la trama actual.
Las medias de movimiento a largo plazo eia y eoa de ei y eo en el extremo de codificacion son actualizadas:
en donde, sign[.] representa una funcion de signo, M/N[.] representa una funcion de mmimo, |.| representa una funcion de valor absoluto, form x(-1) representa un valor de una trama anterior x, y a=0.1 es un factor de olvido que decide si una velocidad de actualizacion es alta o baja. La trama anterior es el SID que se envfa por ultima vez antes de la trama de ruido actual e incluye el parametro de banda alta de ruido. En esta forma de realizacion, una magnitud de actualizacion de eia y eoa esta limitada. Si una variacion de energfa entre ex de la trama de ruido actual y exa de la trama anterior es mayor que 3 dB, exa de la trama actual se actualiza en 3 dB. Cuando el codificador entra en el estado de trabajo de DTX por primera vez, exa se inicializada como ex de la trama actual. El codificador comprueba si una desviacion entre la relacion (esto es, la primera relacion) de la energfa de la senal de banda alta a la energfa de la senal de banda baja de la trama de ruido actual y la relacion (la segunda relacion) de la energfa de la banda alta a la energfa de la banda baja en el momento cuando el SID que incluye el parametro de banda alta, se envfa por ultima vez alcanza una extension, es decir, comprueba si se satisface la condicion siguiente:
en donde, eoa y eia respectivamente representan una energfa logantmica de banda alta y una energfa logantmica de banda baja en el momento cuando la trama SID que incluye el parametro de banda alta se envfa por ultima vez. Si la formular anterior (4) se satisface, la senal de banda alta de ruido necesita codificarse y transmitirse. Si el parametro de banda alta envfa el indicador flaghb=o, se establece flaghb=i.
5
10
15
20
25
30
35
40
45
50
55
En esta forma de realizacion, la promediacion de movimiento a largo plazo es un tipo de calculo de la media ponderada, que no esta espedficamente limitada en esta forma de realizacion.
En esta forma de realizacion, la determinacion de si el valor de extension de desviacion alcanza un umbral preestablecido puede utilizarse como una segunda condicion de determinacion. En un proceso de puesta en practica espedfico, para determinar si la senal de banda alta de ruido necesita codificarse y transmitirse, simplemente necesita determinarse la primera condicion de determinacion o la segunda condicion de determinacion, lo que no esta espedficamente limitado en esta forma de realizacion.
En esta forma de realizacion, la segunda condicion de determinacion es opcional. Una finalidad de realizar esta etapa es prestar asistencia a un extremo de decodificacion en la estimacion, a nivel local, de la energfa del ruido de banda alta en funcion de la energfa de la banda baja de ruido y la relacion de la energfa de la banda alta de ruido a la energfa de la banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta se envfa por ultima vez. Mas concretamente, si el valor de extension de desviacion no se calcula en el extremo de codificacion, una trama vocal con una energfa de senal de banda alta minima puede obtenerse en el extremo de decodificacion, a partir de las tramas vocales dentro de un periodo de tiempo antes de la trama de ruido actual, y la energfa del ruido de banda alta actual se estima localmente en conformidad con una energfa de una senal de banda alta de la trama vocal con la energfa de senal de banda alta minima entre las tramas vocales dentro del periodo de tiempo antes de la trama de ruido actual. A modo de ejemplo, la energfa de la senal de banda alta de la trama vocal con la energfa de senal de banda alta minima entre las tramas vocales dentro del periodo de tiempo antes de que se seleccione la trama de ruido actual como la energfa del ruido de banda alta actual. De forma alternativa, las senales de banda alta de N tramas vocales con una energfa de senal de banda alta inferior a un umbral preestablecido se seleccionan de entre las tramas vocales dentro de un periodo de tiempo preestablecido antes del SlD; y la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID se obtiene en conformidad con una energfa media ponderada de las senales de banda alta de las N tramas vocales. Mas concretamente, no se establece ninguna limitacion en esta forma de realizacion.
303. Transmitir la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua.
En esta forma de realizacion, preferentemente, la transmision de la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua incluye: En el estado de trabajo DTX, el codificador realiza un analisis de prediccion lineal lpc(i), en donde i=0,1,...,l5. Los coeficientes LPC se transforman a QoS ISP para obtener 16 coeficientes ISP isp(i), en donde i=0,1,...,15, y los coeficientes ISP se memorizan. Si un SID se codifica en la trama actual, es decir, flagSD=1, un coeficiente ISP de la mediana se busca en los coeficientes ISP memorizados de las N tramas de registro incluyendo la trama actual. Un metodo es como sigue: en primer lugar, calcular una distancia 5 desde un coeficiente ISP de cada trama a un coeficiente ISP de otra trama:
-jv+i is . ■ . . ■
j*k,k=0,-l,...-N + l (5);
j=o i=o .
a continuacion, seleccionar un coeficiente ISP de una trama con el mas pequeno valor 5 como un coeficiente ISP ispSID(i) a codificarse, en donde i=0,...,15; transformar ispaD(i) a un coeficiente ISF isfSID(i), cuantificar el isfaD(i), obtener y encapsular un grupo de indices cuantizados idxISF en el SID; decodificar localmente el idxISF; obtener un coeficiente ISF decodificado ISF'(i), en donde i=0,...,15; transformar ISF'(i) a un coeficiente SIP isp'(i), en donde i=0,...,15, memorizar el isp'(i); para cada trama de ruido, actualizar una media movil a largo plazo de los coeficientes ISP decodificados del extremo de codificacion utilizando el isp'(i) memorizado:
top* (0 = a • hpJ‘1,(i) + (!-«)■ isp'ij)
i'= 0,1,... 15
(6)
en donde, preferentemente, a=0.9, e ispa(i) se inicializa como isp'(i) de un primer SID; transformar ispa(i) a un coeficiente LPC Ipca(i), obtener un filtro de analisis A(Z); filtrar la senal de banda baja s0 de cada trama de ruido por el A(Z) para obtener una senal residual r(i), en donde i=0,1,...319, y calcular una energfa residual logantmica er:
En esta forma de realizacion, er esta memorizada. Cuando el indicador flagSID de la trama de ruido actual es 1, una energia logaritmica media eso se calcula en funcion de er memorizada de las M tramas de registro historico incluyendo la
-M+1
trama de ruido actual: *=° en donde w-i(k) es un grupo de coeficientes positivos M-
dimensionales y su suma es inferior a 1. eSID es objeto de cuantizacion y se obtiene un mdice cuantizado idxe.
5
10
15
20
25
30
35
40
45
50
55
60
65
En esta forma de realizacion, en el estado de trabajo DTX, cuando el indicador flagsiD=1, si flaghb=0, solamente se codifica un parametro de banda baja y se env^a en una trama SID y en este caso, la trama SID esta formada por los indices idxISF e idxe, y se refiere como una trama SID pequena por conveniencia.
En esta forma de realizacion, la polftica para codificar y transmitir una senal de banda baja de ruido es similar a una polftica para codificar y transmitir una senal de banda ancha de ruido en la tecnica anterior. Solamente una breve introduccion se proporciona en esta forma de realizacion. El proceso de puesta en practica espedfico no se describe en detalle en esta forma de realizacion. En esta forma de realizacion, la senal de banda alta de ruido de la trama de ruido actual no necesita codificarse y solamente la senal de banda baja de ruido se codifica. Por lo tanto, se reduce una carga de calculo en el extremo de codificacion y se salvaguardan los bits de transmision.
304. Transmitir la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua, y transmitir la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua.
En esta forma de realizacion, si flaghb=1, ademas de que necesita codificarse un parametro de banda baja, tambien necesita codificarse un parametro de banda alta en un SlD. La codificacion de un parametro de banda baja de ruido de banda baja es el mismo que el modo de codificacion en la etapa 303, y por ello, no se describen aqu detalles de forma repetida en esta forma de realizacion. En esta forma de realizacion, preferentemente, el metodo para codificar un parametro de banda alta es como sigue: solamente cuando el codificador esta en el estado de trabajo DTX y flagSiD=1, el codificador realiza un analisis de prediccion lineal de 10° orden sobre la senal de banda alta si de la trama actual y obtiene 10 coeficientes de prediccion lineal lpc(i), en donde i=0,1,...,9. lpc(i) esta ponderada:
lpcv(i) = wi(i)-lpc{i) i = .9 (8)
y un coeficiente LPC ponderado lpcw(i) se obtiene, en donde W2(i) representa un grupo de factores de ponderacion 9- dimensionales que son mas pequenos o iguales a 1. lpcw(i) se transforma en un coeficiente LSP para obtener 10 coeficientes LSP lspw (i), en donde i=0,1,..., 9, y una media movil a largo plazo de lspw (i) del extremo de codificacion se actualiza en conformidad con Ispw (i).
lspa(i) = a-lspi-l)(i)+Q-a)-lsp„(i) i = 0,1,. .9 (9)
en donde, preferentemente, a=0.9, y lspa (i) se inicializa como lspw (i) de la trama actual cada vez cuando flaghb cambia desde 0 a 1. Cuando el SID necesita incluir parametros de banda alta, lspa (i) es objeto de cuantizacion y se obtiene un grupo de indices cuantizados idxLSP. Una media movil a largo plazo e1a de energfas logarftmicas de las senales de banda alta en el extremo de codificacion es objeto de cuantizacion y se obtiene un mdice idxE cuantizado. En este caso, el SID esta formado por los indices idx^F, idxe, idxLSP, e idxE. En esta forma de realizacion, el SID formado por los indices idx^F, idxe, idxLSP e idxE se refiere como un SID grande.
De modo opcional, lspa (i) puede actualizarse tambien continuamente en el estado de trabajo DTX. Es decir, sin importar si el valor de flaghb es 1 o 0, se actualiza lspa (i) Mas concretamente, el metodo para actualizar lspa (i) cuando flaghb=0 es el mismo que el metodo anterior cuando flaghb=1, y los detalles no se describen repetidamente en esta forma de realizacion.
En esta forma de realizacion, un principio de la polftica para codificar una senal de banda alta de ruido es similar al principio de la polftica para codificar una senal de banda baja de ruido. Solamente se proporciona una breve introduccion en esta forma de realizacion. El proceso de puesta en practica espedfico no se describe con detalle en esta forma de realizacion.
En esta forma de realizacion, cuando la condicion para codificar y transmitir una senal de banda alta de ruido se satisface, la codificacion y la transmision de la senal de banda alta de ruido se realizan siempre simultaneamente con la codificacion y transmision de una senal de banda baja de ruido. Sin embargo, de forma opcional, la codificacion y transmision de la senal de banda alta de ruido no se puede realizar tampoco simultaneamente con la codificacion y transmision de la senal de banda baja de ruido. Es decir, cuando se envfa el SID, pueden existir tres posibles casos: (1) Solamente se codifica y transmite la senal de banda baja de la trama de ruido actual; (2) solamente la senal de banda alta de la trama de ruido actual se codifica y transmite; y (3) la senal de banda baja y la senal de banda alta de la trama de ruido actual se codifican y transmiten simultaneamente y en este caso, la condicion de envfo en la polftica para enviar el segundo SID del segundo mecanismo de transmision discontinua incluye, ademas: el primer mecanismo de transmision discontinua ha de satisfacer la primera condicion de envfo de SID. Los tres casos de envfo de SID no estan espedficamente limitados en esta forma de realizacion.
En esta forma de realizacion, las etapas 302 a 304 son espedficamente etapas de codificacion y transmision de la senal de banda baja de ruido utilizando el primer mecanismo de transmision discontinua, y la codificacion y transmision de la senal de banda alta de ruido utilizando el segundo mecanismo de transmision discontinua, en donde una polftica para enviar una primera trama de descriptor de insercion de silencio SID del primer mecanismo de transmision discontinua es
5
10
15
20
25
30
35
40
45
50
55
60
65
diferente de una polftica para enviar un segundo SID del segundo mecanismo de transmision discontinua, o una polftica para codificar un primer SID del primer mecanismo de transmision discontinua es diferente de una polftica para codificar un segundo SID del segundo mecanismo de transmision discontinua.
La forma de realizacion del metodo dado a conocer por la presente invencion aporta los efectos ventajosos siguientes: Una trama de ruido actual de una senal de audio se obtiene, y la trama de ruido actual se descompone en una senal de banda baja de ruido y una senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua y la senal de banda alta de ruido se codifica y transmite utilizando un segundo mecanismo de transmision discontinua. De este modo, diferentes maneras de procesamiento se utilizan para la senal de banda alta y para la senal de banda baja, puede reducir la complejidad del calculo y los bits codificados pueden salvaguardarse bajo una condicion de no disminuir la calidad subjetiva de un codec y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar una calidad de codificacion global, con lo que se resuelve un problema de codificacion y transmision de banda superancha.
Forma de realizacion 4
Esta forma de realizacion da a conocer un metodo para procesar datos de audio. En comparacion con el procesamiento de una senal de ruido en un extremo codificador, un extremo decodificador puede determinar, en conformidad con un flujo de bits recibido, si una trama actual es una trama vocal codificada o un SID o una trama NO_DATA. La trama NO_DATA es una trama que indica que el extremo de codificacion no codifica ni envfa un SID en un periodo de ruido. Cuando la trama actual es un SID, el decodificador puede determinar, ademas, en conformidad con el numero de bits del SID, si el SID incluye un parametro de banda baja y/o banda alta. De modo opcional, el decodificador puede tambien determinar, en conformidad con un identificador espedfico insertado en el SID, si el SID incluye un parametro de banda baja y/o un parametro de banda alta. Lo que antecede requiere que un bit indicador adicional debe anadirse cuando se codifica el SID. A modo de ejemplo, cuando se inserta un primer identificador en el SID, identifica que el SID incluye solamente un parametro de banda alta; cuando se inserta un segundo identificador, identifica que el SID incluye solamente un parametro de banda baja, y cuando se inserta un tercer identificador, identifica que el SID incluye un parametro de banda alta y un parametro de banda baja. Si la trama actual es una trama vocal codificada, el decodificador decodifica la trama vocal. El proceso de procesamiento espedfico es similar al de la tecnica anterior y no se describe en detalle en esta forma de realizacion. Cuando la trama actual es un SID o una trama NO_DATA, el decodificador selecciona, en conformidad con un estado de trabajo espedfico de CNG, un metodo correspondiente para reconstruir una trama CN. En esta forma de realizacion, CNG tiene dos estados de trabajo: un estado CNG de semicodificacion correspondiente a una trama SID pequena, esto es, un primer estado CNG, y un estado CNG de decodificacion completa correspondiente a una trama SID grande, esto es, un segundo estado CNG. En el estado CNG de decodificacion completa, el decodificador reconstruye una trama CN en conformidad con un parametro de banda alta de ruido y un parametro de banda baja de ruido obtenido por decodificacion de una trama SID grande. En el estado CNG de semi- decodificacion, el decodificador reconstruye una trama CN en conformidad con un parametro de banda alta de ruido obtenido decodificando una trama SID pequena y un parametro de banda alta de ruido estimado a nivel local. Cuando la trama actual en el extremo de decodificacion es una trama SID grande, si un indicador de estado de trabajo de CNG flagoNG es 0 (indicando el estado CNG de semi-decodificacion), el indicador de estado de trabajo CNG flagoNG se establece a 1 (indicando el estado CNG de decodificacion completa); de no ser asf, el estado original permanece sin cambiar. De modo similar, cuando la trama actual en el extremo de decodificacion es una trama SID pequena, si el indicador de estado de trabajo de CNG flagCNG es 1, el indicador de trabajo de trabajo CNG flagCNG se establece a 0; de no ser asf, el estado original permanece sin cambiar. Haciendo referencia a la Figura 4, concretamente esta forma de realizacion da a conocer un metodo para procesar datos de audio en un extremo decodificador, en donde el metodo incluye lo siguiente:
401. Un decodificador obtiene un SID, y si el SID incluye un parametro de banda alta y un parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtiene una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion.
En esta forma de realizacion, despues de recibir una trama vocal codificada enviada por un extremo codificador, el extremo decodificador determina primero el tipo de la trama vocal, de modo que diferentes maneras de decodificacion se utilicen, en forma correspondiente, en conformidad con diferentes tipos de tramas vocales. Mas concretamente, si el numero de bits de SID es menor que un primer umbral preestablecido, se confirma que el SID incluye el parametro de banda alta; si el numero de bits del SID es mayor que un primer umbral preestablecido e inferior que segundo umbral preestablecido, se confirma que el SID incluye el parametro de banda baja; y si el numero de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, se confirma que el SID incluye el parametro de banda alta y el parametro de banda baja. Como alternativa, si el SID incluye un primer identificador, se confirma que el SID incluye el parametro banda alta; si el SID incluye un segundo identificador, se confirma que el SID incluye el parametro de banda baja; o si el SID incluye un tercer identificador, se confirma que el SID incluye el parametro de banda baja y el parametro de banda alta.
5
10
15
20
25
30
35
40
45
50
En esta forma de realizacion, si el SID incluye el parametro de banda alta y el parametro de banda baja, el SID se decodifica para obtener el parametro de banda alta de ruido y el parametro de banda baja de ruido, y se obtiene la tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion. Mas concretamente, el decodificador decodifica el SID para obtener una energfa logantmica de excitacion eo de banda baja decodificada, un coeficiente ISF de banda baja isfd(i), una energfa logantmica de banda alta Ed, y un coeficiente LSP de banda alta lspd(i). isfd(i) se transforma en un coeficiente ISP ispd(i), y eo y Ed se transforman en energfas ed y Ed, en donde Ed = 10° d y ed = 2eD, y luego, ispd(i), ed, lspd(i), y Ed son objeto de memorizacion.
En esta forma de realizacion, cuando el decodificador esta en el estado de trabajo CNG y flagcNG=1, sin importar si la trama actual es un SID o una trama NO_DATA, el ispd(i) memorizado, ed, lspd(i) y Ed se utilizan para actualizar la media movil a largo plazo de cada uno de los valores ispd(i), ed, lspd(i), y Ed memorizados en el extremo de decodificacion:
isPcnii) ~ a ■ ispc^(i) + (1 - a) ■ ispd (i) i = 0,1,... 15
lspCN{i) = {i-lspic"{i) + (\-f3)-lspd(i) i = 0,1,...9 ^
eOf=/&-e&)+(l-0)-e,
Ecn
en donde, a=0.9, y ^=0.7. Ecn se memoriza para una memoria de energfa de banda alta Elold. Una pequena ene^a aleatoria se anade sobre la base de ecN, y se obtiene una energfa de excitacion final e'cN utilizada para reconstruir una senal de banda baja de ruido: e'cN = (1 + 0.000011 • RND • ecN) • ecN, en donde RND representa un numero aleatorio dentro de un margen de [-32767, 32767]. En esta forma de realizacion, se genera una secuencia de ruido blanco de 320 puntos exc0(i) en donde i=0,1,...319. e'cN se utiliza para realizar un ajuste de ganancia sobre exc0(i) para obtener exco(i), es decir, exco(i) se multiplica por un coeficiente de ganancia Go, de modo que la energia de exc'o(i) sea igual a e'cN, en
donde i=0 se transforma a un coeficiente LPC para obtener un filtro de sintesis 1/Ao(Z), la
excitacion ajustada en ganancia exco(i) se utiliza para excitar el filtro 1/A(Z) para obtener una senal cN de banda baja s'0 que reconstruye en el extremo de decodificacion y se muestra a una frecuencia de 16 kHz, y una energfa de s'0 se calcula y memoriza para una memoria de energfa de banda baja E0old.
En esta forma de realizacion, el procesamiento de la senal de banda alta de ruido en el extremo de decodificacion es similar al procesamiento de una senal de banda baja de ruido. Se genera otra secuencia de ruido blanco de 320 puntos exc-i(i) en donde i=0,1,...319, lspcN(i) se transforma en un coeficiente LPc para obtener un filtro de sintesis 1/A-i(Z), y exc-i(i) se utiliza para excitar el filtro 1/A-i(Z) para obtener una senal cN de banda alta no ajusta en ganancia s~-i(i). s~-i(i) se multiplica por los coeficientes de ganancia G1 y G2, en donde G2=0.8, y una senal de cN de banda alta s'1 que se reconstruye en el extremo de decodificacion y se muestrea a 16 kHz se obtiene a este respecto, en donde
. En esta forma de realizacion, la finalidad de G2 es realizar una supresion de energfa sobre la senal de ruido reconstruida en alguna medida.
En esta forma de realizacion, en el extremo decodificador, s'0 y s'1 se pasan a traves de un filtro de sintesis QMF y por ultimo, se obtiene una primera trama cN que se reconstruye por el decodificador y se muestra a una frecuencia de 32 kHz.
402. Si el SID incluye el parametro de banda baja, decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido y obtener una primera trama cN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado.
En esta forma de realizacion, cuando el decodificador esta en el estado de trabajo cNG y flagcNG=0, no importa si la trama actual es un SID o una trama NO_DATA, una senal cN de banda baja s'0 que se reconstruye en el extremo de decodificacion se muestra a una frecuencia de 16 kHz se obtiene en conformidad con el mismo metodo que se utiliza cuando flagcNG=1, es decir, el metodo en la etapa 402, que no se describe con mas detalle en esta forma de realizacion.
En esta forma de realizacion, una senal de banda alta de la primera cN se obtiene todavfa utilizando el metodo de excitacion de filtro de sintesis utilizando ruido blanco, con la excepcion de una energfa de la senal de banda alta de la primera trama cN y un coeficiente de filtro de sintesis se obtienen realizando una estimacion a nivel local. En esta forma de realizacion, la generacion a nivel local de un parametro de banda alta de ruido incluye: obtener, por separado, una
5
10
15
20
25
30
35
40
45
50
55
60
ene^a media ponderada de una senal de banda alta de ruido y un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID; y obtener la senal de banda alta de ruido en conformidad con la energfa media ponderada obtenida de la senal de banda alta de ruido y el coeficiente de filtro de smtesis obtenido de la senal de banda alta de ruido en el momento correspondiente al SID.
En esta forma de realizacion, la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID incluye: obtener una energfa de una senal de banda baja de la primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion; calcular una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta se recibe antes del SID, para obtener una primera relacion; obtener, en conformidad con la energfa de la senal de banda baja de la primera trama CN y la primera relacion, una energfa de la senal de banda alta de ruido en el momento correspondiente al SID; y realizar promediacion ponderada sobre la energfa de la senal de banda alta de ruido en el momento correspondiente al SID y una energfa de una senal de banda alta de una trama CN localmente memorizada, para obtener la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN. De modo opcional, calcular una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta se recibe antes del SID, para obtener una primera relacion, incluye: calcular una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantaneas de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta, es recibido antes del SID, para obtener la primera relacion; o bien, calcular una relacion de una energfa media ponderada de la senal de banda alta de ruido a una energfa media ponderada de la senal de banda baja de ruido en el momento cuando el SID, que incluye el parametro de banda alta es recibido antes del SID, para obtener la primera relacion. La energfa instantanea es la energfa obtenida por decodificacion. Cuando la energfa de la senal de banda alta de ruido en el momento correspondiente al SID es mayor que una energfa de una senal de banda alta de una trama CN anterior que esta localmente memorizada, la energfa de la senal de banda alta de la trama CN anterior que esta localmente memorizada se actualiza en una primera tasa; de no ser asf, la energfa de la senal de banda alta de la trama CN anterior que esta localmente memorizada se actualiza en una segunda tasa, en donde la primera tasa es mayor que la segunda tasa.
Mas concretamente, en esta forma de realizacion, la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID puede ponerse en practica utilizando el metodo siguiente:
obtener una energfa Eo de la senal de banda baja de la primera trama CN s'o en conformidad con el parametro de banda baja de ruido obtenido por decodificacion; estimar, en conformidad con la energfa Elold de la senal de banda alta y Eoold de la senal de banda baja de la trama CN anterior en el estado CNG de decodificacion completa y Eo, una energia E~i de la
e; =
\
'\tsid
Eo ’
serial de banda alta de ruido en el momento correspondiente al SID, en donde x J y la actualizacion de una media movil a largo plazo Ecn de energias de serial CN de banda alta del extremo de decodificacion utilizando E~i:
E -A-E^[)+(l-A)-E~
G* cn y J 1 ’ en donde un coeficiente A es una variable, cuando E~i>Ecn, A=0.98; de no ser asi, A=0.9,
en donde A=0.98 es una primera tasa y A=0.9 es una segunda tasa.
En esta forma de realizacion, si un valor de extension de desviacion no se calcula en el extremo de codificacion, de modo opcional, la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID incluye: seleccionar una de banda alta de una trama vocal con una energfa de senal de banda alta minima a partir de las tramas vocales dentro de un periodo de tiempo preestablecido antes del SID; y obtener, en conformidad con una energfa de la senal de banda alta de la trama vocal con la energfa de senal de banda alta minima entre las tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID; o bien, seleccionar senal de banda alta de N tramas vocales con una energfa de senal de banda alta menor que un umbral preestablecido a partir de las tramas vocales dentro de un periodo de tiempo preestablecido antes del SID; y obtener, en conformidad con una energfa media ponderada de las senales de banda alta de las N tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
En esta forma de realizacion, preferentemente, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID incluye: distribuir M coeficientes ISF de frecuencia espectral de inmitancia o coeficientes ISP de par espectral de inmitancia o coeficientes LSF de frecuencia espectral de lmea o coeficientes LSP de par espectral de lmea en una gama de frecuencia correspondiente a una senal de banda alta; realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caracteristica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente; en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, con el valor objetivo de cada coeficiente entre los M coeficientes cambiando despues de cada N tramas y N puede ser
5
10
15
20
25
30
35
40
45
50
una variable; y obtener, en conformidad con los coeficientes de filtro obtenidos mediante el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al
SID.
Mas concretamente, en esta forma de realizacion, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID puede ponerse en practica utilizando el metodo siguiente:
Nueve coeficientes ISF isfexi(i) se distribuyen uniformemente en una banda de frecuencias de -16 kHz correspondiente a coeficientes ISF de banda baja isfd(14), en donde i=0,1,...8:
'■*/„, O') = «/; (14) + 0.1 ■ (/ +1) • (16000 - (14)) i = 0,1,.. .8 (11)
isfext(i) se transforma a una banda de frecuencias de 0-8 kHz, e isfext(i) se obtiene:
isfat (0= itfext (0 - 8000 I =0,1,... 8 (12)
isfext(i) se aleatoriza utilizando un grupo de factores de aleatorizacion 9 dimensiones R(i), en donde i=0,1,...8, y se obtiene un coeficiente ISF aleatorizado isf1(i):
= R{i) • (fc/„(l) - «C(0» + ¥ji) i = 0,1,-8
en donde, R(i) se obtiene en conformidad con la formula siguiente (14):
R(i) = a ■ + {\~ct) R,(i) i = 0,1,...8
en donde, a=0.8, y Rt(i):
fl + 0.1-JWD(i)
U(’o(0
mod(e«f, 10) = 0 mod(c«f, 10) 0
(13)
(14)
(15)
En la formula anterior, (15), RND representa un grupo de secuencias de numeros aleatorios 9-dimensiones y los numeros aleatorios de cada dimension son diferentes entre sf y todos caen dentro de un margen de [-1, 1]. cnt es un contador de tramas. En el estado de trabajo de CNG, cuando flagcNG=0, para cada trama SID o trama NO_DATA, se anade 1 al contador. mod(cnt, 10) representa cnt mod 10. En otra forma de realizacion, cuando Rt(i) se calcula, 10 en mod(cnt, 10) puede ser tambien una variable, a modo de ejemplo,
«r(0 =
l + 0.1-AMD(i)
N = ■
[ 10 + 5 -RND
I
mod(c«/, N) = 0 mod {cnt, N) * 0 mod(cn/, Ar(_l>) = 0 mod(cn^, * 0
/' = 0,1,...8
(16)
en donde, RND representa un numero aleatorio dentro de un margen de [-1, 1], que no esta espedficamente limitado en esta forma de realizacion.
En esta forma de realizacion, un coeficiente ISF de banda baja isfd(15) se utiliza como isfi(9), y se sincroniza con un coeficiente ISF aleatorizado isfi(i), en donde i=0,1,...8, para formar un coeficiente ISF de filtro de 10° orden, que luego se transforma en un coeficiente LPC lpc1(i), en donde i=0,1,...9. lpc1(i) se multiplica por un grupo de factores de ponderacion 10 dimensionales W(i)={0.6699, 0.5862, 0.5129, 0.4488, 0.3927, 0.3436, 0.3007, 0.2631, 0.2302, 0.2014}, y un coeficiente LPC ponderado lpc~1(i) se obtiene, es decir, se estima un filtro de smtesis 1/A~1(Z).
En estas forma de realizacion, se genera una secuencia de ruido blanco de 320 puntos exc2(i) en donde i=0,1,...319, y exc2(i) se utiliza para excitar el filtro 1/A~1(Z) para obtener una senal CN de banda alta no ajustada en ganancia s~1(i). s~1(i) se multiplica por los coeficientes de ganancia G3 y G4, en donde G4=0.6, y una senal CN de banda alta s'1 que se reconstruye en el extremo de decodificacion y se muestra a una frecuencia de 16 kHz se obtiene a este respecto, en
donde
Si la trama actual es un SID, es necesario transformar lpc~1(i) a un coeficiente LSP lsp~1(i), y utilizar lsp~1(i) para
5
10
15
20
25
30
35
40
45
50
55
60
actualizar una media movil a largo plazo de coeficientes LSP de senales de banda alta de las tramas CN memorizadas en el extremo de decodificacion:
lspa<i) = P'lsp£\i)+(l-0)-lsp;(i)
(17)
en donde, 6=0.7.
En esta forma de realizacion, de modo opcional, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID incluye: obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido memorizada localmente; realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas; y obtener, en conformidad con los coeficientes de filtro obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID. Mas concretamente, no se establece ninguna limitacion en esta forma de realizacion.
En esta forma de realizacion, despues de que se obtenga el parametro de banda baja y el parametro de banda alta s'o y s'1 se pasan a traves de un filtro de smtesis QMF y por ultimo, una primera trama CN que se reconstruye por el decodificador y se muestra a 32 kHz se obtiene a este respecto.
Ademas, en esta forma de realizacion, de modo opcional, antes de que se obtenga la primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente, el parametro de banda alta de ruido generado localmente puede optimizarse todavfa mas, de modo que se pueda obtener un ruido de confort de mejor efecto. Una etapa de optimizacion espedfica incluye: cuando las tramas de registro historico adyacentes al SID son tramas vocales codificadas, si una energfa media de las senales de banda alta o una parte de las senales de banda alta que se decodifican a partir de las tramas vocales codificadas, es menor que una energfa media de senales de banda alta de ruido o una parte de las senales de banda alta de ruido que se generan localmente, multiplicar las senales de banda alta de ruido de las L tramas posteriores comenzando desde el SID por un factor de alisado menor que 1, para obtener una nueva energfa media ponderada de las senales de banda alta de ruido localmente generadas; y en correspondencia, la obtencion de una primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente incluye: obtener una cuarta trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID y la nueva energfa media ponderada de las senales de banda alta de ruido generadas localmente.
En esta forma de realizacion, cuando una trama antes de que el SID actual sea una trama vocal codificada, y una energfa Esp de una senal de banda alta de la trama vocal codificada se inferior a una energfa Es'i de s'1, es necesario efectuar un alisado de energfas de senales de banda alta del SID actual y varios SIDs posteriores (50 tramas en esta forma de realizacion). Un metodo de alisado especifico es: multiplicar s'i de la trama actual por una ganancia Gs, para
Gs = Jl-0.02-(50-cnt)-(l-E% ),
obtener s'is alisado ' ' ^ en donde, cnt es un contador de trama, 1 se anade al
r-1
contador para cada trama comenzando desde la primera trama CN despues de la trama vocal codificada, y es una energia de una senal de banda alta alisada de una trama anterior y se inicializa como Esp cuando cnt=1. El proceso de
p-\
alisado se realiza en solamente hasta 50 tramas. En este periodo, si ^ es mayor que Es-i, el proceso de alisado se termina. De modo opcional, E>< y Es-i pueden representar tambien energias de solamente una parte de tramas, lo que no esta espeaficamente limitado en esta forma de realizacion. En esta forma de realizacion, s'o y s'i (o s'is) se pasan a traves de un filtro de smtesis QMF y por ultimo, se obtiene una trama CN que se reconstruye por el decodificador y se muestra a una frecuencia de 32 kHz.
403. Si el SID incluye el parametro de banda alta, decodificar el SID para obtener un parametro de banda alta de ruido, generar localmente un parametro de banda baja de ruido y obtener una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido mediante decodificacion y el parametro de banda baja de ruido generado localmente.
En esta forma de realizacion, si el SID incluye el parametro de banda alta, el SID se decodifica para obtener el parametro de banda alta, y un parametro de banda baja de ruido se genera localmente, y una segunda trama CN se obtiene en conformidad con el parametro de banda alta obtenido por decodificacion y el parametro de banda baja de ruido localmente generado. El metodo para decodificar el parametro de banda alta es el mismo que el metodo en la etapa 401, y sus detalles no se describen repetidamente en esta forma de realizacion. El metodo para generar localmente el parametro de banda baja es el mismo que el metodo para generar localmente un parametro de banda ancha, y los detalles no se describen repetidamente en esta forma de realizacion.
5
10
15
20
25
30
35
40
45
50
55
60
La forma de realizacion del metodo dada a conocer por la presente invencion aporta los efectos ventajosos siguientes: un decodificador obtiene una trama de descriptor de insercion de silencio SID, y determina si el SID incluye un parametro de banda baja y/o un parametro de banda alta; si el SID incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, genera localmente un parametro de banda alta de ruido y obtiene una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado; si el SID incluye el parametro de banda alta, decodifica el SID para obtener un parametro de banda alta de ruido, genera localmente un parametro de banda baja de ruido y obtiene una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido localmente generado; y si el SID incluye el parametro de banda alta y el parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y el parametro de banda baja de ruido y obtiene una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion. De este modo, diferentes maneras de procesamiento se utilizan para la senal de banda alta y la senal de banda baja, puede reducir la complejidad del calculo y los bits codificados se pueden salvaguardar bajo una condicion de no disminuir la calidad subjetiva de un codec, y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, con lo que se resuelve un problema de codificacion y transmision de banda superancha. Ademas, antes de que se obtenga la segunda trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado, el parametro de banda alta de ruido localmente generado puede optimizarse todavfa mas, de modo que se pueda obtener el ruido de confort de un mejor efecto. Con lo tanto se optimiza ademas el rendimiento del decodificador.
Forma de realizacion 5
Esta forma de realizacion da a conocer un metodo para procesar datos de audio. Lo mismo que en el metodo para procesar datos de audio en la forma de realizacion 2, un extremo codificador obtiene una trama de ruido de una senal de audio, y descompone la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido. Sin embargo, de modo opcional, la determinacion de si la senal de banda alta de la trama de ruido satisface, o no, una condicion de codificacion y transmision preestablecida incluye: determinar si una estructura espectral de la senal de banda alta de ruido de la trama de ruido, en comparacion con una estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido, satisface una condicion preestablecida; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido de la trama de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si no es afirmativa, determinar que la senal de banda alta de ruido de la trama de ruido no necesita codificarse ni transmitirse. La estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido incluye: una media ponderada de espectros de las senales de banda alta de ruido antes de la trama de ruido. En esta forma de realizacion, la determinacion de si una estructura espectral de la senal de banda alta de ruido de la trama de ruido, en comparacion con una estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido, satisface, o no, una condicion preestablecida, se utiliza como una tercera condicion para determinar si codificar y transmitir la senal de banda alta de ruido.
En esta forma de realizacion, de modo opcional, de modo opcional, si para codificar y transmitir la senal de banda alta de ruido puede determinarse tambien utilizando una segunda condicion de determinacion, que no esta espedficamente limitada en esta forma de realizacion.
En esta forma de realizacion, DTX decide si codificar y transmitir un parametro de banda alta, es decir, el establecimiento del indicador flaghb puede decidirse utilizando las condiciones siguientes: (1) si se satisface una tercera condicion de determinacion o no; si la respuesta es afirmativa, establecer el indicador flaghb a 0; si no es asf, establecer el indicador flaghb a 1; y (2) si se satisface, o no, la segunda condicion de determinacion; si no se satisface, establecer flaghb a 0; y si se satisface, establecer flaghb a 1.
En esta forma de realizacion, un metodo espedfico para poner en practica la tercera condicion de determinacion puede ser como sigue: El codificador obtiene un coeficiente LSP de 10° orden lsp(i) de la senal de banda alta de ruido si de la trama de ruido actual, en donde i=0,...9, y opcionalmente, el coeficiente puede ser tambien un coeficiente LSF o ISF o ISP, lo que no esta espeaficamente limitado en esta forma de realizacion. El coeficiente LSP o LSF o ISF o ISP es solamente una diferente manera de representacion en un dominio distinto, pero todos ellos representan un coeficiente de filtro de smtesis, lo que no esta espedficamente limitado en esta forma de realizacion. lsp(i) se utiliza para actualizar una media movil a tal respecto:
lspa (O - • l$Pa (0 + (1 - a) lsp(i) i = 0,.. .9 (18)
en donde, lspa(i) es una media movil a largo plazo de lsp(i). Una distorsion espectral entre lspa(i) e lspa(i) actuales en un momenta cuando una trama de SID, que incluye un parametro de banda alta, se envia por ultima vez es objeto de
Av = E(&A.(0-fcp;)2. .
calculo aplicando: '-° en donde, D|Sp representa la distorsion espectral y representa
lspa(i) en el momento cuando la trama SID que incluye el parametro de banda alta se envfa por ultima vez. Si Dlsp es
5
10
15
20
25
30
35
40
45
50
55
60
menor que un determinado umbral, se establece flaghb=0; de no ser as^ se establece flaghb=1.
En esta forma de realizacion, un metodo de trabajo para codificar el parametro de banda baja y/o el parametro de banda alta por el codificador cuando sea necesario, es esencialmente el mismo que el metodo de trabajo en la forma de realizacion 3 y por ello, los detalles no se describen repetidamente en esta forma de realizacion.
En esta forma de realizacion, cuando un decodificador esta en un estado de trabajo CNG y donde flagcNG=0, es necesario generar localmente una senal de banda alta de ruido. El metodo para obtener una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente a un SID es el mismo que el metodo descrito en la forma de realizacion 4, por lo que aqu no se describen repetidamente sus detalles en esta forma de realizacion. Sin embargo, en esta forma de realizacion, preferentemente, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID incluye: obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido memorizada localmente; realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo sea un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambie despues de cada N tramas; y obtener, en conformidad con los coeficientes de filtro obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID. Mas concretamente, la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID puede ponerse en practica en la forma siguiente:
Suponiendo lsp'(i)=lspcN(i), en donde i=0,...9, lspcN(i) es una media movil a largo plazo de los coeficientes LSP de las senales de banda alta de tramas CN que se memorizan localmente en el extremo de decodificacion. El procesamiento de aleatorizacion se realiza sobre lsp'(i) utilizando el mismo metodo descrito en la forma de realizacion 4 y se obtiene lspi(i):
| lsp, (0) = fl(0)(l- Ispi (0)) + lsp\0) (
[ispi 0) = (0 ■ (V (0 - lsP 0 -1)) + lsP 0) /' = 1,. ..9
lspi(i) se transforma a un coeficiente LPC lpci(i), y se obtiene un filtro de smtesis i/A~i(Z) despues de la ponderacion con w(i) utilizando el mismo metodo descrito en la forma de realizacion 4. En esta forma de realizacion, se genera una secuencia de ruido blanco de 320 puntos exc2(i) en donde i=0,1,...319, y exc2(i) se utiliza para excitar el filtro i/A~i(Z) para obtener una senal CN de banda alta no ajustada en ganancia s~i(i). s~i (i) se multiplica por un coeficiente de ganancia G3, y una senal de banda alta s'i de una trama CN que se reconstruye en el extremo de decodificacion y se muestrea a i6 kHz se obtiene a este respecto. En esta forma de realizacion, cuando la trama actual es un SID, el lspi(i) obtenido utilizando este metodo no se utiliza para actualizar la media movil a largo plazo de los coeficientes LSP de las senales de banda alta de las tramas CN que son memorizadas en el extremo de decodificacion.
En esta forma de realizacion, cuando el codificador codifica una trama SID grande, cuando una media movil a largo plazo eia de energfas logantmicas de senal de banda alta es objeto de cuantizacion en el extremo de codificacion, realizandose la cuantizacion despues de que eia sea atenuada (es decir, despues de que se sustraiga un valor). Por lo tanto, en este caso, en la decodificacion, es innecesario multiplicar s~i(i) por G2 o G4 en la forma de realizacion 4. Otras etapas del extremo de decodificacion en esta forma de realizacion son similares a las etapas en las formas de realizacion anteriores, y por ello, sus detalles no de describen repetidamente en esta forma de realizacion.
La forma de realizacion del metodo dado a conocer por la presente invencion aporta los efectos ventajosos siguientes: se obtiene una trama de ruido actual de una senal de audio y la trama de ruido actual se descompone en una senal de banda baja de ruido y una senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua, y la senal de banda alta de ruido se codifica y transmite utilizando un segundo mecanismo de transmision discontinua. Un decodificador obtiene una trama de descriptor de insercion de silencio SID, y determina si el SID incluye un parametro de banda baja y/o un parametro de banda alta; si el SID incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, genera localmente un parametro de banda alta de ruido y obtiene una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente; si el SID incluye el parametro de banda alta, decodifica el SID para obtener un parametro banda alta de ruido, genera localmente un parametro de banda baja de ruido y obtiene una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido localmente generado; y si el SID incluye el parametro de banda alta y el parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtiene una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido por decodificacion. De este modo, se utilizan diferentes maneras de procesamiento para la senal de banda alta y para la senal de banda baja, se puede reducir la complejidad del calculo y los bits codificados pueden salvaguardarse bajo una condicion de no perjudicar la calidad subjetiva de un codec. Y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un
5
10
15
20
25
30
35
40
45
50
55
60
65
ancho de banda de transmision o mejorar la calidad de codificacion global, con lo que se resuelve un problema de codificacion y transmision de banda superancha.
Forma de realizacion 6
Haciendo referencia a la Figura 5, esta forma de realizacion da a conocer un aparato para codificar datos de audio, en donde el aparato incluye: un modulo de obtencion 501 y un modulo de transmision 502.
El modulo de obtencion 501 esta configurado para obtener una trama de ruido de una senal de audio y descomponer la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido.
El modulo de transmision 502 esta configurado para codificar y transmitir la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua, y codificar y transmitir la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua, en donde una polftica para enviar una primera trama de descriptor de insercion de silencio SID del primer mecanismo de transmision discontinua es diferente de una polftica para enviar un segundo SID del segundo mecanismo de transmision discontinua, o una polftica para codificar un primer SID del primer mecanismo de transmision discontinua es diferente de una polftica para codificar un segundo SID del segundo mecanismo de transmision discontinua.
En esta forma de realizacion, el primer SID incluye un parametro de banda baja de la trama de ruido y el segundo SID incluye un parametro de banda baja y/o un parametro de banda alta de la trama de ruido.
De modo opcional, haciendo referencia a la Figura 6, el modulo de transmision 502 incluye:
una primera unidad de transmision 502a, configurada para determinar si la senal de banda alta de ruido tiene una estructura espectral preestablecida; si la respuesta es afirmativa y se satisface una condicion de envfo de la polftica para enviar el segundo SID, codificar un identificador ID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si no es asf, determinar que la senal de banda alta de ruido no necesita codificarse ni transmitirse.
En esta forma de realizacion, la primera unidad de transmision 502a incluye:
una primera sub-unidad de determinacion, configurada para obtener un espectro de la senal de banda alta de ruido, dividir el espectro en al menos dos sub-bandas, y si una energfa media de cualquier primera sub-banda en las sub- bandas no es menor que una energfa media de una segunda sub-banda en las sub-bandas, en donde una banda de frecuencias en la que esta situada la segunda sub-banda es mas alta que una banda de frecuencias en la que esta situada la primera sub-banda, confirmar que la senal de banda alta de ruido no tiene ninguna estructura espectral preestablecida; de no ser asf, confirmar que la senal de banda alta de ruido tiene una estructura espectral preestablecida.
Haciendo referencia a la Figura 6, el modulo de transmision 502 incluye:
una segunda unidad de transmision 502b, configurada para generar un valor de extension de desviacion en conformidad con una primera relacion y un segunda relacion, en donde la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido, y la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en el momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido; y determinar si el valor de extension de desviacion alcanza un umbral preestablecido; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID y enviar el SID; y si no es asf, determinar que la senal de banda alta de ruido no necesita codificarse ni transmitirse.
De modo opcional, el hecho de que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que:
la primera relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido de la trama de ruido; y
en correspondencia, el hecho de que la segunda relacion es una relacion de una energfa de senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido incluye que:
la segunda relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido.
Como alternativa, el hecho de que la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido incluye que:
5
10
15
20
25
30
35
40
45
50
55
60
65
la primera relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido de la trama de ruido y una trama de ruido antes de la trama de ruido a una energfa media ponderada de las senales de banda baja de ruido de la trama de ruido y la trama de ruido antes de la trama de ruido; y
en correspondencia, el hecho de que la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido incluye que:
la segunda relacion es una relacion de una energfa media ponderada de senales de banda alta a una energfa media ponderada de senales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento cuando el SID que incluye el parametro de banda alta de ruido se envfa por ultima vez antes de la trama de ruido.
De modo opcional, en esta forma de realizacion, la segunda unidad de transmision 502b incluye:
una sub-unidad de calculo, configurada para calcular, por separado, un valor logantmico de la primera relacion y un valor logantmico de la segunda relacion; y calcular un valor absoluto de una diferencia entre el valor logantmico de la primera relacion y el valor logantmico de la segunda relacion, para obtener el valor de extension de desviacion.
Haciendo referencia a la Figura 6, de modo opcional, en esta forma de realizacion, el modulo de transmision 502 incluye:
una tercera unidad de transmision 502c, configurada para determinar si una estructura espectral de la senal de banda alta de ruido de la trama de ruido, en comparacion con una estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido, satisface una condicion preestablecida; si la respuesta es afirmativa, codifica un SID de la senal de banda alta de ruido de la trama de ruido utilizando la polftica para codificar el segundo SID y envfa el SID; y si no es asf, determinar que la senal de banda alta de ruido de la trama de ruido no necesita codificarse ni transmitirse.
En esta forma de realizacion, de modo opcional, la estructura espectral media de las senales de banda alta de ruido antes de la trama de ruido incluye: una media ponderada de espectros de las senales de banda alta de ruido antes de la trama de ruido.
De modo opcional, en esta forma de realizacion, la condicion de envfo en la polftica para enviar el segundo SID del segundo mecanismo de transmision discontinua incluye, ademas: el primer mecanismo de transmision discontinua que satisface una condicion para enviar el primer SID.
La forma de realizacion del aparato dado a conocer por la presente invencion aporta los efectos ventajosos siguientes: Una trama de ruido actual de una senal de audio se obtiene, y la trama de ruido actual se descompone en una senal de banda baja de ruido y un senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua y la senal de banda alta de ruido se codifica y transmite utilizando un segundo mecanismo de transmision discontinua. De este modo, se utilizan diferentes maneras de procesamiento para la senal de banda alta y la senal de banda baja, se puede reducir la complejidad del calculo y los bits codificados pueden salvaguardarse bajo una condicion de no disminuir la calidad subjetiva de un codec, y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, resolviendo de este modo un problema de codificacion y transmision de banda superancha.
Forma de realizacion 7
Haciendo referencia a la Figura 7, esta forma de realizacion da a conocer un aparato para decodificar datos de audio, en donde el aparato incluye: un modulo de obtencion 601, un primer modulo de decodificacion 602, un segundo modulo de decodificacion 603 y un tercer modulo de decodificacion 604.
El modulo de obtencion 601 esta configurado para determinar si una trama de descriptor de insercion de silencio SID actual recibida incluye un parametro de banda baja o un parametro de banda alta.
El primer modulo de decodificacion 602 esta configurado para: si el SID obtenido por el modulo de obtencion 601 incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido, y obtener una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente.
El segundo modulo de decodificacion 603 esta configurado para: si el SID obtenido por el modulo de obtencion 601 incluye el parametro de banda alta, decodificar el SID para obtener un parametro de banda alta de ruido, generar localmente un parametro de banda baja de ruido, y obtener una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido generado localmente.
5
10
15
20
25
30
35
40
45
50
55
60
65
El tercer modulo de decodificacion 604 esta configurado para: si el SID obtenido por el modulo de obtencion 601 incluye el parametro de banda alta y el parametro de banda baja, decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion.
De modo opcional, en esta forma de realizacion, el primer modulo de decodificacion 602 esta configurado, ademas, para: antes de decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido, y obtener una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente, si el decodificador esta en un primer estado de generacion de ruido de confort CNG, entrar en un segundo estado CNG.
De modo opcional, en esta forma de realizacion, el tercer modulo de decodificacion 604 esta configurado, ademas, para: antes de decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido que se obtienen por decodificacion, si el decodificador esta en un segundo estado CNG, entrar en un primer estado CNG.
De modo opcional, el modulo de obtencion 601 incluye:
una primera unidad de confirmacion, configurada para: si el numero de bits del SID es menor que un primer umbral preestablecido, confirmar que el SID incluye el parametro de banda alta; si el numero de bits del SID es mayor que un primer umbral preestablecido y menor que un segundo umbral preestablecido, confirmar que el SID incluye el parametro de banda baja; y si el numero de bits del SID es mayor que un segundo umbral preestablecido y menor que un tercer umbral preestablecido, confirmar que el SID incluye el parametro de banda alta y el parametro de banda baja; o
una segunda unidad de confirmacion, configurada para: si el SID incluye un primer identificador, confirmar que el SID incluye el parametro de banda alta; si el SID incluye un segundo identificador, confirmar que el SID incluye el parametro de banda baja; y si el SID incluye un tercer identificador, confirmar que el SID incluye el parametro de banda baja y el parametro de banda alta.
En esta forma de realizacion, el primer modulo de codificacion 602 incluye:
una primera unidad de obtencion, configurada para obtener, por separado, una energfa media ponderada de una senal de banda alta de ruido y un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID; y
una segunda unidad de obtencion, configurada para obtener la senal de banda alta de ruido en conformidad con la energfa media ponderada obtenida de la senal de banda alta de ruido y el coeficiente de filtro de smtesis obtenido de la senal de banda alta de ruido en el momento correspondiente al SID.
La primera unidad de obtencion incluye:
una primera sub-unidad de obtencion, configurada para obtener una energfa de una senal de banda baja de la primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion;
una sub-unidad de calculo, configurada para calcular una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID que incluye un parametro de banda alta se recibe antes del SID, para obtener una primera relacion;
una segunda sub-unidad de obtencion, configurada para obtener, en conformidad con la energfa de la senal de banda baja de la primera trama CN y la primera relacion, una energfa de la senal de banda alta de ruido en el momento correspondiente al SID; y
una tercera sub-unidad de obtencion, configurada para realizar una promediacion ponderada sobre la energfa de la senal de banda alta de ruido en el momento correspondiente al SID y una energfa de una senal de banda alta de ruido de una trama CN memorizada localmente, para obtener la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
La sub-unidad de calculo esta espedficamente configurada para:
calcular una relacion de una energfa instantanea de la senal de banda alta de ruido a una senal instantanea de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta se recibe antes del SID, para obtener la primera relacion; o
5
10
15
20
25
30
35
40
45
50
55
60
65
calcular una relacion de una ene^a media ponderada de la senal de banda alta de ruido a una energfa media ponderada de la senal de banda baja de ruido en el momento cuando el SID que incluye el parametro de banda alta se recibe antes del SID, para obtener la primera relacion.
Cuando la energfa de la senal de banda alta de ruido en el momento correspondiente al SID es mayor que una energfa de una senal de banda alta de una trama CN anterior que se memoriza localmente, la energfa de la senal de banda alta de la trama CN anterior que se memoriza localmente se actualiza en una primera tasa; de no ser asf, la energfa de la senal de banda alta de la trama CN anterior que esta localmente memorizada se actualiza en una segunda tasa, en donde la primera tasa es mayor que la segunda tasa.
De modo opcional, la primera unidad de obtencion incluye:
una primera sub-unidad de seleccion, configurada para seleccionar una senal de banda alta de una trama vocal con una energfa de senal de banda alta minima procedente de las tramas vocales dentro de un periodo de tiempo preestablecido antes del SID, y obtener, en conformidad con una energfa de la senal de banda alta de la trama vocal con la energfa de senal de banda alta minima entre las tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN; o
una segunda sub-unidad de seleccion, configurada para seleccionar senales de banda alta de N tramas vocales con una energfa de senal de banda alta menor que un umbral preestablecido procedente de tramas vocales dentro de un periodo de tiempo preestablecido antes del SID; y obtener, en conformidad con una energfa media ponderada de las senales de banda alta de las N tramas vocales, la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
De modo opcional, la primera unidad de obtencion incluye:
una sub-unidad de distribucion, configurada para distribuir M coeficientes ISF de frecuencia espectral de inmitancia o coeficientes ISP de par espectral de inmitancia o coeficientes LSF de frecuencia espectral de lmea o coeficientes LSP de par espectral de lmea en una gama de frecuencias correspondiente a una senal de banda alta;
una primera sub-unidad de procesamiento de aleatorizacion, configurada para realizar el procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas, en donde M y N son numeros naturales; y
una cuarta sub-unidad de obtencion, configurada para obtener, en conformidad con los coeficientes de filtro obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
De modo opcional, la primera unidad de obtencion incluye:
una quinta sub-unidad de obtencion, configurada para obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido memorizada localmente;
una segunda sub-unidad de procesamiento de aleatorizacion, configurada para realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en un margen preestablecido adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas; y
una sexta sub-unidad de obtencion, configurada para obtener, en conformidad con los coeficientes de filtros obtenidos por el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
Haciendo referencia a la Figura 8, de modo opcional, el aparato incluye, ademas:
un modulo de optimizacion 605, configurado para: antes de que el primer modulo de decodificacion 602 obtenga la primera trama CN, cuando las tramas de registro historico adyacentes al SID son tramas vocales codificadas, si una energfa media de las senales de banda alta o una parte de las senales de banda alta que se decodifican a partir de las tramas vocales codificadas es menor que una energfa media de senales de banda alta de ruido o una parte de la senales de banda alta de ruido que se generan localmente, multiplicar las senales de banda alta de ruido de las L tramas posteriores comenzando desde el SID por un factor de alisado menor que 1, para obtener una nueva energfa media ponderada de las senales de banda alta de ruido generadas localmente.
5
10
15
20
25
30
35
40
45
50
55
60
65
En correspondencia, el primer modulo de decodificacion 602 esta configurado espedficamente para obtener un cuarta trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID y la nueva energfa media ponderada de las senales de banda alta de ruido generadas localmente.
La forma de realizacion del aparato dado a conocer por esta forma de realizacion aporta los efectos ventajosos siguientes: un decodificador obtiene una trama de descriptor de insercion de silencio SID, y determina si el SID incluye un parametro de banda baja o un parametro de banda alta; si el SID incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, genera localmente un parametro de banda alta de ruido y obtiene una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado; si el SID incluye el parametro de banda alta de ruido, decodifica el SID para obtener un parametro de banda alta de ruido, genera localmente un parametro de banda baja de ruido, y obtiene una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido generado localmente; y si el SID incluye el parametro de banda alta y el parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtiene una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido que se obtiene por decodificacion. De este modo, se utilizan diferentes maneras de procesamiento para la senal de banda alta y la senal de banda baja, se puede reducir la complejidad del calculo y los bits codificados pueden salvaguardarse bajo una condicion de no disminuir la calidad subjetiva de un codec, y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, resolviendo de este modo un problema de codificacion y transmision de banda superancha.
Forma de realizacion 8
Haciendo referencia a la Figura 9, esta forma de realizacion da a conocer un sistema para procesar datos de audio, en donde el sistema incluye el aparato anterior 500 para codificar datos de audio y el aparato 600 anterior para decodificar datos de audio.
Las soluciones tecnicas dadas a conocer por las formas de realizacion de la presente invencion aportan los efectos ventajosos siguientes. Una trama de ruido actual de una senal de audio se obtiene, y la trama de ruido actual se descompone en una senal de banda baja de ruido y una senal de banda alta de ruido; a continuacion, la senal de banda baja de ruido se codifica y transmite utilizando un primer mecanismo de transmision discontinua y la senal de banda alta de ruido se codifica y transmite utilizando un segundo mecanismo de transmision discontinua. Un decodificador obtiene una trama de descriptor de insercion de silencio SID, y determina si el SID incluye un parametro de banda baja y/o un parametro de banda alta; si el SID incluye el parametro de banda baja, decodifica el SID para obtener un parametro de banda baja de ruido, genera localmente un parametro de banda alta de ruido, y obtiene una primera trama de ruido de confort CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado; si el SID incluye el parametro de banda alta, decodifica el SID para obtener un parametro de banda alta de ruido, genera localmente un parametro de banda baja de ruido y obtiene una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido localmente generado; y si el SID incluye el parametro de banda alta y el parametro de banda baja, decodifica el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtiene una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido por decodificacion. De este modo, se utilizan diferentes maneras de procesamiento para la senal de banda alta y la senal de banda baja, se puede reducir la complejidad del calculo y los bits codificados pueden salvaguardarse bajo una condicion de no disminuir la calidad subjetiva de un codec, y los bits que se salvaguardan ayudan a conseguir un objetivo de reducir un ancho de banda de transmision o mejorar la calidad de codificacion global, resolviendo de este modo un problema de codificacion y transmision de banda superancha.
El aparato y sistema dados a conocer por las formas de realizacion pueden pertenecer espedficamente a la misma idea que las formas de realizacion del metodo. El proceso de puesta en practica espedfica del aparato y sistema se ha descrito en detalle en las formas de realizacion del metodo y por ello sus detalles no se describen aqu repetidamente.
El metodo y aparato para procesar datos de audio en las formas de realizacion anteriores pueden aplicarse a un codificador de audio o a un decodificador de audio. Los codecs de audio puede aplicarse ampliamente a varios dispositivos electronicos, tales como un telefono movil, un aparato inalambrico, un asistente de datos personal (PDA), un ordenador portatil o transportable, un receptor GPS o un dispositivo de navegacion, una camara, un reproductor de audioMdeo, una camara camcorder, una grabadora de video y un dispositivo de vigilancia. En general, dicho dispositivo electronico incluye un codificador de audio o un decodificador de audio. El codificador o decodificador de audio puede implantarse directamente utilizando un circuito digital o circuito integrado, a modo de ejemplo, un DSP (procesador de senal digital) o ponerse en practica utilizando un codigo informatico para activar un procesador para realizar un procedimiento en el codigo informatico.
Un experto en esta tecnica puede entender que la totalidad o una parte de las etapas de las formas de realizacion pueden ponerse en practica por hardware o un programa informatico que proporcione instrucciones a un hardware
pertinente. El programa puede memorizarse en un soporte de memorizacion legible por ordenador. El soporte de memorizacion puede incluir: una memoria de solamente lectura, un disco magnetico o un disco optico.
10
Claims (28)
- 5101520253035404550556065REIVINDICACIONES1. Un metodo para procesar datos de audio, en donde el metodo comprende:obtener una trama de ruido de una senal de audio, y descomponer la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido; ycodificar la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua y transmitir la senal de banda baja de ruido codificada utilizando el primer mecanismo de transmision discontinua, y codificar la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua y transmitir la senal de banda alta de ruido codificada utilizando el segundo mecanismo de transmision discontinua, en donde una polftica para enviar una primera trama de descriptor de insercion de silencio, SID, del primer mecanismo de transmision discontinua es diferente de una polftica para enviar un segundo SID del segundo mecanismo de transmision discontinua;en donde la codificacion de la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua y transmitiendo la senal de banda alta de ruido codificada utilizando el segundo mecanismo de transmision discontinua comprende:generar un valor de extension de desviacion en conformidad con una primera relacion y una segunda relacion, en donde la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido, y la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID, que comprende un parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido; ydeterminar si el valor de extension de desviacion alcanza un umbral preestablecido; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido utilizando la polftica para codificar el segundo SID, y enviar el SID; y si la respuesta es negativa, determinar que la senal de banda alta de ruido no necesita codificarse ni transmitirse.
- 2. El metodo segun la reivindicacion 1, en donde el primer SID comprende un parametro de banda baja de la trama de ruido, y el segundo SID comprende un parametro de banda baja o un parametro de banda alta de la trama de ruido.
- 3. El metodo segun la reivindicacion 1 o 2, en donde: la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido comprende que:la primera relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido de la trama de ruido; yque la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido es un momento cuando un SID, que comprende un parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido comprende que:la segunda relacion es una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido en el momento cuando el SID, que comprende el parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido; oque la primera relacion es una relacion de una energfa de la senal de banda alta de ruido a una energfa de la senal de banda baja de ruido de la trama de ruido comprende que:la primera relacion es una relacion de una energfa media ponderada de senales de banda alta de ruido de la trama de ruido y una trama de ruido antes de la trama de ruido, a una energfa media ponderada de senales de banda baja de ruido de la trama de ruido y la trama de ruido antes de la trama de ruido; yque la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID, que comprende un parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido comprende que:la segunda relacion es una relacion de una energfa media ponderada de senales de banda alta a una energfa media ponderada de senales de banda baja de una trama de ruido y una trama de ruido antes de la trama de ruido en el momento cuando el SID, que comprende el parametro de banda alta de ruido, se envfa por ultima vez antes de la trama de ruido.
- 4. El metodo segun cualquiera de las reivindicaciones 1 a 3, en donde la generacion de un valor de extension de desviacion en conformidad con una primera relacion y una segunda relacion comprende:calcular, por separado, un valor logarftmico de la primera relacion y un valor logarftmico de la segunda relacion; y5101520253035404550556065calcular un valor absoluto de una diferencia entre el valor logantmico de la primera relacion y el valor logantmico de la segunda relacion, para obtener el valor de extension de desviacion.
- 5. El metodo segun cualquiera de las reivindicaciones 1 a 4, en donde la condicion de envm en la polftica para enviar el segundo SID del segundo mecanismo de transmision discontinua comprende ademas: el primer mecanismo de transmision discontinua que satisface una condicion para enviar el primer SID.
- 6. Un metodo para procesar datos de audio, en donde el metodo comprende:obtener, por un decodificar, una trama del descriptor de insercion de silencio, SID, y determinar si el SID comprende un parametro de banda baja o un parametro de banda alta;cuando el SID comprende el parametro de banda baja, decodificar el SID para obtener un parametro de banda baja de ruido, generando localmente un parametro de banda alta de ruido, y obtener una primera trama de ruido de confort, CN, en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y con el parametro de banda alta de ruido localmente generado;cuando el SID comprende el parametro de banda alta, decodificar el SID para obtener un parametro de banda alta de ruido, generar localmente un parametro de banda baja de ruido, y obtener una segunda trama CN en conformidad con el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido localmente generado; ycuando el SID comprende el parametro de banda alta y el parametro de banda baja, decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenido por decodificacion;en donde la generacion local de un parametro de banda alta de ruido comprende:obtener, por separado, una energfa media ponderada de una senal de banda alta de ruido y un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID; yobtener la senal de banda alta de ruido en conformidad con la energfa media ponderada obtenida de la senal de banda alta de ruido y el coeficiente de filtro de smtesis obtenido de la senal de banda alta de ruido en el momento correspondiente al SID; yen donde la obtencion de una energfa media ponderada de una senal de banda alta de ruido en un momento correspondiente al SID comprende:obtener una energfa de una senal de banda baja de la primera trama CN en conformidad con el parametro de banda baja de ruido obtenido por decodificacion;calcular una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID, que comprende un parametro de banda alta, se recibe antes del SID, para obtener una primera relacion;obtener, en conformidad con la energfa de la senal de banda baja de la primera trama CN y la primera relacion, una energfa de la senal de banda alta de ruido en el momento correspondiente al SID; yrealizar una promediacion ponderada sobre la energfa de la senal de banda alta de ruido en el momento correspondiente al SID y una energfa de una senal de banda alta de una trama CN localmente memorizada, para obtener la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
- 7. El metodo segun la reivindicacion 6, en donde cuando el SID comprende el parametro de banda baja, antes de la decodificacion del SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido, y obtener una primera trama CN de ruido de confort en conformidad con el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado, el metodo comprende ademas:cuando el decodificador esta en un primer estado de generacion de ruido de confort, CNG, introducir, por el decodificador, un segundo estado CNG.
- 8. El metodo segun la reivindicacion 6, en donde cuando SID comprende el parametro de banda alta y el parametro de banda baja, antes de la decodificacion del SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el5101520253035404550556065parametro de banda baja de ruido obtenido por decodificacion, el metodo comprende, ademas:cuando el decodificador esta en un segundo estado CNG, introducir, por el decodificador, un primer estado CNG.
- 9. El metodo segun cualquiera de las reivindicaciones 6 a 8, en donde la determinacion de si el SID comprende un parametro de banda baja y/o u parametro de banda alta comprende:cuando el numero de bits del SID es inferior a un primer umbral preestablecido, confirmar que el SID comprende el parametro de banda alta; cuando el numero de bits del SID es superior a un primer umbral preestablecido e inferior a un segundo umbral preestablecido, confirmar que el SID comprende el parametro de banda baja; y cuando el numero de bits del SID es superior a un segundo umbral preestablecido e inferior que un tercer umbral preestablecido, confirmar que el SID comprende el parametro de banda alta y el parametro de banda baja; ocuando el SID comprende un primer identificador, confirmar que el SID comprende el parametro de banda alta; cuando el SID comprende un segundo identificador, confirmar que el SID comprende el parametro de banda baja; y cuando el SID comprende un tercer identificador, confirmar que el SID comprende el parametro de banda baja y el parametro de banda alta.
- 10. El metodo segun cualquiera de las reivindicaciones 6 a 9, en donde el calculo de una relacion de una energfa de una senal de banda alta de ruido a una energfa de una senal de banda baja de ruido en un momento cuando un SID, que comprende un parametro de banda alta, se recibe antes del SID, para obtener una primera relacion, comprende:calcular una relacion de una energfa instantanea de la senal de banda alta de ruido a una energfa instantanea de la senal de banda baja de ruido en el momento cuando SID, que comprende el parametro de banda alta, se recibe antes del SID, para obtener la primera relacion; ocalcular una relacion de una energfa media ponderada de la senal de banda alta de ruido a una energfa media ponderada de la senal de banda baja de ruido en el momento cuando el SID, que comprende el parametro de banda alta, se recibe antes del SID, para obtener la primera relacion.
- 11. El metodo segun cualquiera de las reivindicaciones 6 a 10, en donde: cuando la energfa de la senal de banda alta de ruido en el momento correspondiente al SID es superior a una energfa de una senal de banda alta de una trama CN precedente que esta memorizada localmente en una memoria intermedia, la energfa de la senal de banda alta de la trama CN precedente que esta memorizada localmente en una memoria intermedia se actualiza a una primera tasa; de no ser asf, la energfa de la senal de banda alta de la trama CN precedente que es memorizada localmente en memoria intermedia se actualiza a una segunda tasa, en donde la primera tasa es superior a la segunda tasa.
- 12. El metodo segun una cualquiera de las reivindicaciones 6 a 11, en donde la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID comprende:distribuir M coeficientes de frecuencia espectral de inmitancia, ISF, o coeficientes de par espectral de inmitancia ISP o coeficientes de frecuencia espectral de lmea, LSF, o coeficientes de par espectral de lmea, LSP en una gama de frecuencias correspondiente a una senal de banda alta;realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: llevar cada coeficiente entre los M coeficientes a aproximarse gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor un valor dentro de una gama preestablecida adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas, en donde M y N son numeros naturales; yobtener segun los coeficientes de filtro obtenidos mediante el procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
- 13. El metodo segun cualquiera de las reivindicaciones 6 a 11, en donde la obtencion de un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID comprende:obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido localmente memorizada;realizar un procesamiento de aleatorizacion de los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor en una gama preestablecida adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas; yobtener, en conformidad con los coeficientes de filtro obtenidos por un procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.5101520253035404550556065
- 14. El metodo segun cualquiera de las reivindicaciones 6 a 13, en donde antes de obtener una primera trama CN segun el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado, el metodo comprende, ademas:cuando tramas de registro historico adyacentes al SID son tramas vocales codificadas, cuando una energfa media de las senales de banda alta o una parte de las senales de banda alta que se decodifican a partir de las tramas vocales codificadas, es inferior a una energfa media de las senales de banda alta de ruido o una parte de las senales de banda alta de ruido que se generan localmente, multiplicar las senales de banda alta de ruido de L tramas posteriores a partir del SID por un factor de alisado inferior a 1, para obtener una nueva energfa media ponderada de las senales de banda alta de ruido localmente generadas; yla obtencion de una primera trama CN segun el parametro de banda baja de ruido obtenido mediante decodificacion y el parametro de banda alta de ruido localmente generado comprende:obtener una cuarta trama CN segun el parametro de banda baja de ruido obtenido por decodificacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente de SID y la nueva energfa media ponderada de las senales de banda alta de ruido localmente generadas.
- 15. Un aparato para codificar datos de audio, en donde el aparato comprende:un modulo de obtencion, configurado para obtener una trama de ruido de una senal de audio y descomponer la trama de ruido en una senal de banda baja de ruido y una senal de banda alta de ruido; yun modulo de transmision, configurado para codificar la senal de banda baja de ruido utilizando un primer mecanismo de transmision discontinua y transmitir la senal de banda baja de ruido codificada utilizando un primer mecanismo de transmision discontinua, y codificar la senal de banda alta de ruido utilizando un segundo mecanismo de transmision discontinua y transmitir la senal de banda alta de ruido codificada utilizando un segundo mecanismo de transmision discontinua, en donde una polftica de envfo de una primera trama de descriptor de insercion de silencio, SID del primer mecanismo de transmision discontinua es diferente de una polftica para enviar un segundo SID del segundo mecanismo de transmision discontinua;en donde el modulo de transmision comprende:una segunda unidad de transmision, configurada para generar un valor de extension de desviacion segun una primera relacion y una segunda relacion, en donde la primera relacion es una relacion entre una enajenacion de la senal de banda alta de ruido y una energfa de la senal de banda baja de ruido de la trama de ruido, y siendo la segunda relacion una relacion entre una energfa de una senal de banda alta de ruido y una energfa de una senal de banda baja de ruido en un momento en que un SID que comprende un parametro de banda alta de ruido se envfa una ultima vez antes de la trama de ruido; y para determinar si el valor de extension de desviacion alcanza un umbral preestablecido; si la respuesta es afirmativa, codificar un SID de la senal de banda alta de ruido utilizando la polftica de codificacion del segundo SID, y enviar un SID codificado; y si la respuesta no es afirmativa, determinar que la senal de banda alta de ruido no se debe codificar ni transmitir.
- 16. El aparato segun la reivindicacion 15, en donde el primer SID comprende un parametro de banda baja de la trama de ruido, y el segundo SID comprende un parametro de banda baja o un parametro de banda alta de la trama de ruido.
- 17. El aparato segun la reivindicacion 15 o 16, en donde: la primera relacion es una relacion entre una energfa de la senal de banda alta de ruido y una energfa de la senal de banda baja de ruido de la trama de ruido comprende:la primera relacion es una relacion entre una energfa instantanea de la senal de banda alta de ruido y una energfa instantanea de la senal de banda baja de ruido de la trama de ruido; yque la segunda relacion es una relacion de una energfa de una senal de banda alta de ruido y una energfa de una senal de banda baja de ruido en un momento en que un SID que comprende un parametro de banda alta de ruido se envfa una ultima vez antes de la trama de ruido, comprende:la segunda relacion es una relacion entre una energfa instantanea de la senal de banda alta de ruido y una energfa instantanea de la senal de banda baja de ruido en el momento en que el SID que comprende el parametro de banda alta de ruido se envfa una ultima vez antes de la trama de ruido; oque la primera relacion es una relacion entre una energfa de la senal de banda alta de ruido y una energfa de la senal de banda baja de ruido de la trama de ruido comprende:la primera relacion es una relacion entre una energfa media ponderada de las senales de banda alta de ruido de la trama de ruido y una trama de ruido que precede a la trama de ruido y una energfa media ponderada de senales de banda baja5101520253035404550556065de ruido de la trama de ruido y de la trama de ruido que precede a la trama de ruido; yque la segunda relacion es una relacion entre una energfa de una senal de banda alta de ruido y una energfa de una senal de banda baja de ruido cuando un SID que comprende un parametro de banda alta de ruido se envfa una ultima vez antes de la trama de ruido comprende que:la segunda relacion es una relacion de una energfa media ponderada de senales de banda alta y una energfa media ponderada de senales de banda baja de una trama de ruido y de una trama de ruido que precede a la trama de ruido en el momento en que el SID que comprende el parametro de banda alta de ruido se envfa una ultima vez antes de la trama de ruido.
- 18. El aparato segun cualquiera de las reivindicaciones 15 a 17, en donde la segunda unidad de transmision comprende:una sub-unidad de calculo, configurada para calcular por separado un valor logarftmico de la primera relacion y un valor logarftmico de la segunda relacion; y para calcular un valor absoluto de una diferencia entre el valor logarftmico de la primera relacion y el valor logarftmico de la segunda relacion, para obtener el valor de extension de desviacion.
- 19. El aparato segun una cualquiera de las reivindicaciones 15 a 18, en donde la condicion de envm dentro de la polftica de envm del segundo SID del segundo mecanismo de transmision discontinua comprende, ademas:el primer mecanismo de transmision discontinua satisface una condicion para enviar el primer SID.
- 20. Un aparato para decodificar datos de audio, en donde el aparato comprende:un modulo de obtencion, configurado para obtener una trama de descriptor de insercion de silencio, SID y para determinar si el SID comprende un parametro de banda baja o un parametro de banda alta;un primer modulo de decodificacion, configurado para: cuando el SID obtenido por el modulo de obtencion comprende el parametro de banda baja, decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido y obtener una primera trama de ruido de confort, CN, segun el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido localmente generado;un segundo modulo de decodificacion, configurado para: cuando el SID obtenido por el modulo de obtencion comprende el parametro de banda alta, decodificar el SID para obtener un parametro de banda alta de ruido, generar localmente un parametro de banda baja de ruido y obtener una segunda trama CN segun el parametro de banda alta de ruido obtenido por decodificacion y el parametro de banda baja de ruido localmente generado; yun tercer modulo de decodificacion, configurado para: cuando el SID obtenido por el modulo de obtencion comprende el parametro de banda alta y el parametro de banda baja, decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido y obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion;en donde el primer modulo de decodificacion comprende:una primera unidad de obtencion, configurada para obtener, por separado, una energfa media ponderada de una senal de banda alta de ruido y un coeficiente de filtro de smtesis de la senal de banda alta de ruido en un momento correspondiente al SID; yuna segunda unidad de obtencion, configurada para obtener la senal de banda alta de ruido en conformidad con la energfa media ponderada obtenida de la senal de banda alta de ruido y el coeficiente de filtro de smtesis obtenido de la senal de banda alta de ruido en el momento correspondiente al SID; yen donde la primera unidad de obtencion comprende:una primera sub-unidad de obtencion, configurada para obtener una energfa de una senal de banda baja de la primera trama CN segun el parametro de banda baja de ruido obtenido por decodificacion;una sub-unidad de calculo, configurada para calcular una relacion entre una energfa de una senal de banda alta de ruido y una energfa de una senal de banda baja de ruido en un momento en que un SID que comprende un parametro de banda alta es recibido antes del SID, para obtener una primera relacion;una segunda sub-unidad de obtencion, configurada para obtener, en conformidad con la energfa de la senal de banda baja de la primera trama CN y la primera relacion, una energfa de la senal de banda alta de ruido en el momento correspondiente al SID; y5101520253035404550556065una tercera sub-unidad de obtencion, configurada para realizar una media ponderada de la energfa de la senal de banda alta de ruido en el momento correspondiente al SID y de una energfa de una senal de banda alta de una trama CN memorizada localmente en memoria intermedia, para obtener la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID, en donde la energfa media ponderada de la senal de banda alta de ruido en el momento correspondiente al SID es una energfa de senal de banda alta de la primera trama CN.
- 21. El aparato segun la reivindicacion 20, en donde el primer modulo de decodificacion esta configurado, ademas, para: antes de decodificar el SID para obtener un parametro de banda baja de ruido, generar localmente un parametro de banda alta de ruido, y obtener una primera trama de ruido de confort, CN, segun el parametro de banda baja de ruido obtenido por decodificacion y el parametro de banda alta de ruido generado localmente, cuando el aparato esta en un primer estado de generacion de ruido de confort CNG, entrar en un segundo estado CNG.
- 22. El aparato segun la reivindicacion 20, en donde el tercer modulo de obtencion esta configurado, ademas, para: antes de decodificar el SID para obtener un parametro de banda alta de ruido y un parametro de banda baja de ruido, y de obtener una tercera trama CN en conformidad con el parametro de banda alta de ruido y el parametro de banda baja de ruido obtenidos por decodificacion, cuando el aparato esta en un segundo estado CNG, entrar en un primer estado CNG.
- 23. El aparato segun cualquiera de las reivindicaciones 20 a 22, en donde el modulo de obtencion comprende:una primera unidad de confirmacion, configurada para: cuando el numero de bits del SID es inferior a un primer umbral preestablecido, confirmar que el SID comprende el parametro de banda alta; cuando el numero de bits del SID es superior a un primer umbral preestablecido e inferior a un segundo umbral preestablecido, confirmar que el SID comprende el parametro de banda baja; y cuando el numero de bits del SID es superior a un segundo umbral preestablecido e inferior a un tercer umbral preestablecido, confirmar que el SID comprende el parametro de banda alta y el parametro de banda baja; ouna segunda unidad de confirmacion, configurada para: cuando el SID comprende un primer identificador, confirmar que el SID comprende el parametro de banda alta; cuando el SID comprende un segundo identificador, confirmar que el SID comprende un segundo identificador, confirmar que el SID comprende el parametro de banda baja; y cuando el SID comprende un tercer identificador, confirmar que el SID comprende el parametro de banda baja y el parametro de banda alta.
- 24. El aparato segun cualquiera de las reivindicaciones 20 a 23, en donde la sub-unidad de calculo esta configurada especficamente para:calcular una relacion entre una energfa instantanea de la senal de banda alta de ruido y una energfa instantanea de la senal de banda baja de ruido en el momento en que el SID que comprende el parametro de banda alta es recibido antes del SID, para obtener la primera relacion; ocalcular una relacion entre una energfa media ponderada de la senal de banda alta de ruido y una energfa media ponderada de la senal de banda baja de ruido en el momento en que el SID que comprende el parametro de banda alta es recibido antes del SID, para obtener la primera relacion.
- 25. El aparato segun cualquiera de las reivindicaciones 20 a 24, en donde cuando la energfa de la senal de banda alta de ruido en el momento correspondiente al SID es superior a una energfa de una senal de banda alta de una trama CN precedente que esta memorizada localmente en una memoria intermedia, la energfa de la senal de banda alta de la trama CN precedente que esta memorizada localmente en memoria intermedia se actualiza a una primera tasa; de no ser asf, la energfa de la senal de banda alta de la trama CN precedente que esta memorizada localmente en memoria intermedia se actualiza a una segunda tasa, siendo la primera tasa superior a la segunda tasa.
- 26. El aparato segun cualquiera de las reivindicaciones 20 a 25, en donde la primera unidad de obtencion comprende:una sub-unidad de distribucion, configurada para distribuir M coeficientes de frecuencia espectral de inmitancia ISF o coeficientes de par espectral de inmitancia, ISP, o coeficientes de frecuencia espectral de lmea, LSF o coeficientes de par espectral de lmea LSP, dentro de una gama de frecuencias correspondiente a una senal de banda alta;una primera sub-unidad de procesamiento de aleatorizacion, configurada para realizar un procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor dentro de una gama preestablecida adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de N tramas, en donde los valores M y N son numeros naturales; yun cuarta sub-unidad de obtencion, configurada para obtener, en conformidad con los coeficientes de filtro obtenidos por un procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento5101520253035correspondiente al SID.
- 27. El aparato segun cualquiera de las reivindicaciones 20 a 25, en donde la primera unidad de obtencion comprende:una quinta sub-unidad de obtencion, configurada para obtener M coeficientes ISF o coeficientes ISP o coeficientes LSF o coeficientes LSP de una senal de banda alta de ruido memorizada localmente en memoria intermedia;una segunda sub-unidad de procesamiento de aleatorizacion, configurada para realizar el procesamiento de aleatorizacion sobre los M coeficientes, en donde una caractenstica de la aleatorizacion es: hacer que cada coeficiente entre los M coeficientes se aproxime gradualmente a un valor objetivo correspondiente a cada coeficiente, en donde el valor objetivo es un valor dentro de una gama preestablecida adyacente a un valor de coeficiente, y el valor objetivo de cada coeficiente entre los M coeficientes cambia despues de cada N tramas; yuna sexta sub-unidad de obtencion, configurada para obtener, en conformidad con los coeficientes de filtro obtenidos por un procesamiento de aleatorizacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID.
- 28. El aparato segun cualquiera de las reivindicaciones 20 a 27, en donde el aparato comprende, ademas:un modulo de optimizacion, configurado para: antes de que el primer modulo de decodificacion obtenga la primera trama CN, cuando las tramas de registro historico adyacentes al SID son tramas vocales codificadas, cuando una energfa media de senales de banda alta o de una parte de senales de banda alta que son decodificadas a partir de las tramas vocales codificadas es inferior a una energfa media de senales de banda alta de ruido o de una parte de las senales de banda alta de ruido que se generan localmente, multiplicar las senales de banda alta de ruido de L tramas posteriores a partir del SID por un factor de alisado inferior a 1, para obtener una nueva energfa media ponderada de las senales de banda alta de ruido generadas localmente; en dondeel primer modulo de decodificacion esta configurado espedficamente para obtener una cuarta trama CN segun el parametro de banda baja de ruido obtenido por decodificacion, el coeficiente de filtro de smtesis de la senal de banda alta de ruido en el momento correspondiente al SID y la nueva energfa media ponderada de las senales de banda alta de ruido generadas a nivel local.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110455836 | 2011-12-30 | ||
CN201110455836.7A CN103187065B (zh) | 2011-12-30 | 2011-12-30 | 音频数据的处理方法、装置和系统 |
PCT/CN2012/087812 WO2013097764A1 (zh) | 2011-12-30 | 2012-12-28 | 音频数据的处理方法、装置和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2610783T3 true ES2610783T3 (es) | 2017-05-03 |
Family
ID=48678198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES12861377.5T Active ES2610783T3 (es) | 2011-12-30 | 2012-12-28 | Método y aparato para procesar datos de audio |
Country Status (18)
Country | Link |
---|---|
US (6) | US9406304B2 (es) |
EP (1) | EP2793227B1 (es) |
JP (2) | JP6072068B2 (es) |
KR (2) | KR101770237B1 (es) |
CN (1) | CN103187065B (es) |
AU (1) | AU2012361423B2 (es) |
BR (1) | BR112014016153B1 (es) |
CA (3) | CA3059322C (es) |
ES (1) | ES2610783T3 (es) |
HK (1) | HK1199543A1 (es) |
IN (1) | IN2014KN01436A (es) |
MX (1) | MX338445B (es) |
MY (1) | MY173976A (es) |
PT (1) | PT2793227T (es) |
RU (3) | RU2617926C1 (es) |
SG (2) | SG10201609338SA (es) |
WO (1) | WO2013097764A1 (es) |
ZA (2) | ZA201404996B (es) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CN104217723B (zh) * | 2013-05-30 | 2016-11-09 | 华为技术有限公司 | 信号编码方法及设备 |
US9136763B2 (en) * | 2013-06-18 | 2015-09-15 | Intersil Americas LLC | Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode |
KR102121642B1 (ko) * | 2014-03-31 | 2020-06-10 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램 |
US10163453B2 (en) | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
GB2532041B (en) | 2014-11-06 | 2019-05-29 | Imagination Tech Ltd | Comfort noise generation |
CN105681512B (zh) * | 2016-02-25 | 2019-02-01 | Oppo广东移动通信有限公司 | 一种降低语音通话功耗的方法及装置 |
CN105721656B (zh) * | 2016-03-17 | 2018-10-12 | 北京小米移动软件有限公司 | 背景噪声生成方法及装置 |
ES2745018T3 (es) | 2016-12-12 | 2020-02-27 | Kyynel Oy | Procedimiento versátil de selección de canal para red inalámbrica |
US10504538B2 (en) * | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
CN117711434B (zh) * | 2023-12-20 | 2024-10-22 | 书行科技(北京)有限公司 | 音频处理方法及装置、电子设备及计算机可读存储介质 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7103065B1 (en) * | 1998-10-30 | 2006-09-05 | Broadcom Corporation | Data packet fragmentation in a cable modem system |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
EP1715712B1 (en) * | 1998-11-24 | 2009-03-25 | Telefonaktiebolaget LM Ericsson (publ) | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6549587B1 (en) * | 1999-09-20 | 2003-04-15 | Broadcom Corporation | Voice and data exchange over a packet based network with timing recovery |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
WO2001033814A1 (en) * | 1999-11-03 | 2001-05-10 | Tellabs Operations, Inc. | Integrated voice processing system for packet networks |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US7920697B2 (en) | 1999-12-09 | 2011-04-05 | Broadcom Corp. | Interaction between echo canceller and packet voice processing |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6691085B1 (en) | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
US6691805B2 (en) | 2001-08-27 | 2004-02-17 | Halliburton Energy Services, Inc. | Electrically conductive oil-based mud |
US7319703B2 (en) * | 2001-09-04 | 2008-01-15 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
FR2859566B1 (fr) * | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
JP4572123B2 (ja) * | 2005-02-28 | 2010-10-27 | 日本電気株式会社 | 音源供給装置及び音源供給方法 |
CN101087319B (zh) * | 2006-06-05 | 2012-01-04 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US7809559B2 (en) * | 2006-07-24 | 2010-10-05 | Motorola, Inc. | Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
JP2008139447A (ja) * | 2006-11-30 | 2008-06-19 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号装置 |
CN101246688B (zh) | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
DE102008009719A1 (de) | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009718A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
WO2011103924A1 (en) * | 2010-02-25 | 2011-09-01 | Telefonaktiebolaget L M Ericsson (Publ) | Switching off dtx for music |
US20110228946A1 (en) * | 2010-03-22 | 2011-09-22 | Dsp Group Ltd. | Comfort noise generation method and system |
JP2012215198A (ja) * | 2011-03-31 | 2012-11-08 | Showa Corp | 回転構造体 |
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
KR101690899B1 (ko) * | 2012-12-21 | 2016-12-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성 |
-
2011
- 2011-12-30 CN CN201110455836.7A patent/CN103187065B/zh active Active
-
2012
- 2012-12-28 SG SG10201609338SA patent/SG10201609338SA/en unknown
- 2012-12-28 PT PT128613775T patent/PT2793227T/pt unknown
- 2012-12-28 EP EP12861377.5A patent/EP2793227B1/en active Active
- 2012-12-28 CA CA3059322A patent/CA3059322C/en active Active
- 2012-12-28 AU AU2012361423A patent/AU2012361423B2/en active Active
- 2012-12-28 RU RU2016100179A patent/RU2617926C1/ru active
- 2012-12-28 MY MYPI2014001949A patent/MY173976A/en unknown
- 2012-12-28 KR KR1020167036611A patent/KR101770237B1/ko active IP Right Grant
- 2012-12-28 WO PCT/CN2012/087812 patent/WO2013097764A1/zh active Application Filing
- 2012-12-28 RU RU2014131387/08A patent/RU2579926C1/ru active
- 2012-12-28 BR BR112014016153-4A patent/BR112014016153B1/pt active IP Right Grant
- 2012-12-28 ES ES12861377.5T patent/ES2610783T3/es active Active
- 2012-12-28 KR KR1020147020836A patent/KR101693280B1/ko active Application Filing
- 2012-12-28 CA CA3181066A patent/CA3181066A1/en active Pending
- 2012-12-28 CA CA2861916A patent/CA2861916C/en active Active
- 2012-12-28 MX MX2014007968A patent/MX338445B/es active IP Right Grant
- 2012-12-28 SG SG11201403686SA patent/SG11201403686SA/en unknown
- 2012-12-28 JP JP2014549344A patent/JP6072068B2/ja active Active
-
2014
- 2014-06-30 US US14/318,899 patent/US9406304B2/en active Active
- 2014-07-08 IN IN1436KON2014 patent/IN2014KN01436A/en unknown
- 2014-07-08 ZA ZA2014/04996A patent/ZA201404996B/en unknown
- 2014-12-31 HK HK14113112.0A patent/HK1199543A1/xx unknown
-
2016
- 2016-01-12 ZA ZA2016/00247A patent/ZA201600247B/en unknown
- 2016-06-21 US US15/188,518 patent/US9892738B2/en active Active
- 2016-12-27 JP JP2016252612A patent/JP6462653B2/ja active Active
-
2017
- 2017-04-18 RU RU2017113357A patent/RU2641464C1/ru active
-
2018
- 2018-01-11 US US15/867,977 patent/US10529345B2/en active Active
-
2019
- 2019-11-27 US US16/697,822 patent/US11183197B2/en active Active
-
2021
- 2021-10-21 US US17/507,200 patent/US11727946B2/en active Active
-
2023
- 2023-06-29 US US18/344,445 patent/US12100406B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2610783T3 (es) | Método y aparato para procesar datos de audio | |
US20200294514A1 (en) | Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus | |
RU2673847C2 (ru) | Системы и способы передачи избыточной информации кадра | |
ES2955855T3 (es) | Generación de señal de banda alta | |
TW201724087A (zh) | 對信號的包絡進行寫碼的設備及對其進行解碼的設備 | |
WO2010111876A1 (zh) | 一种信号去噪的方法和装置及音频解码系统 | |
ES2688037T3 (es) | Aparato y procedimientos de conmutación de tecnologías de codificación en un dispositivo | |
ES2637031T3 (es) | Decodificador para la atenuación de regiones de señal reconstruidas con baja precisión | |
CN112951252A (zh) | 一种lc3音频码流的混音方法、装置、介质及设备 |