ES2276671T3 - Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. - Google Patents

Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. Download PDF

Info

Publication number
ES2276671T3
ES2276671T3 ES00909432T ES00909432T ES2276671T3 ES 2276671 T3 ES2276671 T3 ES 2276671T3 ES 00909432 T ES00909432 T ES 00909432T ES 00909432 T ES00909432 T ES 00909432T ES 2276671 T3 ES2276671 T3 ES 2276671T3
Authority
ES
Spain
Prior art keywords
signal
value
audio signal
samples
numerical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00909432T
Other languages
English (en)
Inventor
Catherine Colomes
Eric Monteux
Stephane Pefferkorn
Thierry Alpert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telediffusion de France ets Public de Diffusion
Orange SA
Original Assignee
Telediffusion de France ets Public de Diffusion
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9902821A external-priority patent/FR2790845A1/fr
Application filed by Telediffusion de France ets Public de Diffusion, France Telecom SA filed Critical Telediffusion de France ets Public de Diffusion
Application granted granted Critical
Publication of ES2276671T3 publication Critical patent/ES2276671T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/12Arrangements for observation, testing or troubleshooting

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Procedimiento de control de la calidad de una señal audio numérica, caracterizado porque ese procedimiento consiste en detectar en esa señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo y defasaje relativo a las vías izquierda y derecha de esa señal audio numérica, lo que permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas.

Description

Procedimiento de control de la calidad de una señal audio numérica difundida con un programa audiovisual.
La invención concierne a un procedimiento de control de la calidad de una señal audio numérica distribuida por difusión de un programa de vídeo o de audio.
Con la multiplicación de los intercambios y de la difusión de informaciones, los métodos de codificación audio numéricos empleados por los servicios de teledifusión han permitido reducir la cantidad de informaciones a transmitir por programa, y en consecuencia, aumentar el número de programas teledifundidos por las vías de teledifusión. En contraparte, esta reducción puede provocar una pérdida irremediable de la calidad de las informaciones, es decir del sonido, con relación a la fuente. La importancia de los defectos introducidos depende a la vez del flujo asignado al codificador, de la complejidad de la señal sonora, así como de los problemas unidos a la transmisión de la
señal.
Por razones técnicas y/o de responsabilidad relativa a los procedimientos de teledifusión, es necesario, para satisfacer las exigencias de los usuarios, evaluar el nivel de la calidad de la señal audio.
En la actualidad, métodos de evolución subjetivos de equipos, por apreciación o vigilancia humana, son utilizados. Estos métodos son sin embargo pesados de llevar a la práctica, y poco confiables. Además, la puesta en práctica de tales métodos en continuo no es muy fácil, en razón de las implicaciones subjetivas frente al personal llamado a asegurar la ejecución.
Métodos por análisis diferencial han sido también desarrollados. Estos métodos están basados en un sistema auditivo humano de percepción, que pone en juego una fuente sonora de referencia y la fuente sonora a evaluar.
Tal solución se revela sin embargo poco práctica ya que es necesario disponer de la fuente de referencia.
Otros modos de operación, basados en el conocimiento a priori de los defectos engendrados por la cadena de los procesos codificación/transmisión/decodificación, pueden permitir, por métodos estadísticos, apreciar la calidad de la señal audio numérica transmitida, midiendo la tasa de aparición de esos defectos.
Tales modos de operación han sido descritos por los documentos WO 98/06196, DE 30 34 582 o DE 33 11 645.
El documento WO 98/06196 describe un procedimiento de evaluación de la calidad de una señal vocal transmitida, a partir de un análisis de la función de transferencia del sistema de comunicación y de las potencias espectrales de señales a frecuencias determinadas. El procedimiento antes citado no hace ningún llamado a la detección de ruidos específicos.
Los documentos DE 30 34 582 y DE 33 11 645 proponen un tratamiento del ruido de crujido, introducido por un defecto de codificación, por tratamiento analógico previo al proceso de conversión analógico-numérico.
La presente invención tiene como objeto remediar los inconvenientes de las metodologías antes citadas para la puesta en práctica de un procedimiento de control de la calidad de una señal audio numérica enteramente automatizado, en ausencia de la utilización de una fuente de referencia.
Otro objeto de la presente invención es igualmente la puesta en práctica de un procedimiento de control automatizado de la calidad de una señal audio numérica susceptible de ser realizada de manera continua o pseudo-continua, el carácter pseudo-continuo de esta puesta en práctica entendiéndose por una puesta en práctica periódica con un período de repetición suficientemente bajo para asegurar a los usuarios la percepción de una teledifusión con cualidades constantes en el curso de la teledifusión de uno o varios programas sucesivos.
Otro objetivo de la presente invención es igualmente la puesta en práctica de un procedimiento de control de la calidad de una señal audio numérica en continuo que permite además, a partir de procesos de control de calidad de esa señal distinta, relativos a defectos distintos de esa señal, asegurar un control de calidad global, traduciéndose por un confort de escucha hasta hoy desigual de los programas teledifundidos.
El procedimiento de control de la calidad de una señal audio numérica, objeto de la presente invención, es destacable ya que el mismo consiste, en una señal audio numérica mono- o estereofónica, en detectar en esa señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo y defasaje relativo a las vías izquierda y derecha de esa señal audio numérica, lo que permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas.
Según un aspecto del procedimiento, objeto de la presente invención, la etapa que consiste en detectar en esa señal audio numérica una señal parásita tal como un breve corte consiste en detectar en una sucesión de muestras sucesivas de esa señal numérica un decrecimiento rápido del nivel de energía de esa señal audio numérica hacia una energía nula, revelando de esta forma una ausencia de reverberación de esa señal audio numérica.
Según otro aspecto del procedimiento, objeto de la presente invención, la etapa que consiste en detectar en esa señal audio numérica una señal parásita tal como un silbido consiste en detectar en esa señal numérica un aumento súbito y transitorio de la energía espectral de esa señal audio numérica en una banda de frecuencias donde la frecuencia baja está comprendida entre 4,5 kHz y 6,5 kHz y donde la frecuencia alta puede alcanzar hasta 20 kHz.
Según otro aspecto del procedimiento objeto de la presente invención, la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un bordoneo consiste en detectar en esa señal parásita un ruido rosa en una banda de frecuencias comprendida entre 0 y 1100 Hz y de nivel sensiblemente constante en esta banda de frecuencias.
Según otro aspecto del procedimiento, objeto de la presente invención, la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un defasaje entre las vías de la señal audio numérica consiste en calcular el valor de defasaje entre las vías de la señal audio numérica a partir de la función de inter-correlación de la señal audio numérica presente en cada una de las vías y en comparar el valor de defasaje calculado con un valor umbral.
Según otro aspecto del procedimiento, objeto de la presente invención, la etapa que consiste en discriminar el modo mono- o estereofónico de la señal transmitida consiste en detectar cambios súbitos y breves de contexto de modo mono- o estereofónico de la señal transmitida, o recíprocamente, a partir de una comparación de las energías de las vías derecha e izquierda.
El procedimiento de control de la calidad de una señal audio numérica objeto de la presente invención encuentra aplicación en cualquier tipo de señal audio numérica sometida a un proceso de codificación, de transmisión y luego de decodificación, las operaciones de codificación/decodificación pudiendo ser asimiladas en operaciones de compresión/descompresión, en particular de señales de radio difusión numérica tal como el D.A.B., o en señales de la vía de audiofrecuencia de una señal de televisión numérica por ejemplo.
Será mejor comprendido con la lectura de la descripción y con la observación de los dibujos a continuación en los cuales, además de la figura 1 relativa a las técnicas anteriores:
- la figura 2a representa, a título de ejemplo no limitativo, un organigrama general que ilustra las etapas que permiten la puesta en práctica del procedimiento objeto de la presente invención;
- la figura 2b representa, a título de ejemplo no limitativo, un organigrama general que ilustra las etapas que permiten la puesta en práctica del procedimiento objeto de la presente invención, en una variante de la figura 2a en la cual una detección del carácter monofónico o estereofónico de la señal audio numérica transmitida es efectuada;
- la figura 3a representa, a título de ejemplo no limitativo, un organigrama general que ilustra las etapas que permiten la puesta en práctica del procedimiento objeto de la presente invención, en una variante no limitativa en la cual una calidad global de la señal es puesta en evidencia;
- la figura 3b representa, a título de ejemplo no limitativo, un organigrama general que ilustra las etapas que permiten la puesta en práctica del procedimiento objeto de la presente invención, en una variante de aquella ilustrada en la figura 3a y en la cual ordenes de prioridad distintos son introducidos para las diferentes señales parásitas susceptibles de afectar la señal audio numérica;
- la figura 3c representa, a título de ejemplo no limitativo, un proceso de gestión específico de los ordenes de prioridad asignados a las señales parásitas tales como el silbido, el defasaje y el bordoneo, susceptible de ser llevado a la práctica en el marco de la variante de realización presentada en la figura 3a o 3b;
- la figura 4 representa, a título de ejemplo no limitativo, un organigrama relativo al proceso de discriminación del carácter monofásico o estereofónico de la señal audio numérica transmitida;
- la figura 5a representa, a título de ejemplo no limitativo, un proceso susceptible de ser puesto en práctica para asegurar la detección de un breve corte de la señal audio numérica;
- la figura 5b representa, a título de ejemplo no limitativo, un organigrama relativo a las etapas que permiten llevar a cabo la detección de un breve corte de la señal audio numérica, de conformidad con el proceso ilustrado en la figura 5a;
- la figura 6a representa, a título de ejemplo no limitativo, un proceso susceptible de ser puesto en práctica para asegurar la detección de un silbido que afecta la señal audio numérica;
- la figura 6b representa, a título de ejemplo no limitativo, un organigrama relativo a las etapas que permiten la puesta en práctica de la detección de un silbido que afecta la señal audio numérica; de conformidad con el proceso ilustrado en la figura 6a;
\newpage
- la figura 7a representa, a título de ejemplo no limitativo, un proceso susceptible de ser puesto en práctica para asegurar la detección de un bordoneo que afecta la señal audio numérica;
- la figura 7b representa, a título de ejemplo no limitativo, un organigrama relativo a las etapas que permiten la puesta en práctica de la detección de un bordoneo que afecta la señal audio numérica; de conformidad con el proceso ilustrado en la figura 7a;
- la figura 8a representa, a título ilustrativo, un organigrama relativo a las etapas que permiten la puesta en práctica de la detección de un defasaje que afecta las vías derecha e izquierda de la señal audio numérica;
- la figura 8b representa, a título de ejemplo no limitativo, un detalle de la puesta en práctica de una etapa del organigrama de la figura 8a;
- la figura 8c representa, a título puramente ilustrativo, una etapa de cálculo puesto en práctica en el marco del procedimiento, objeto de la presente invención, representado en la figura 8b;
- la figura 9 representa un dispositivo conforme al objeto de la invención.
Previamente a la descripción propiamente dicha del procedimiento, objeto de la presente invención, diferentes elementos relativos a las condiciones de transmisión y de distribución de las señales audio numéricas serán descritos en unión con la figura 1.
De una manera general, con referencia a la figura antes citada, se indica que los programas, programa audio numérico o canal de audio de programa vídeo o de TV numérico, programas Pr_{1}, Pr_{2}, Pr_{3}, son sometidos a un proceso de compresión y luego, después del multiplexaje MUX, a una transmisión propiamente dicha por teledifusión por vía hertziana por ejemplo.
Con la recepción, la señal audio numérica es en primer lugar demultiplexada DMUX y luego sometida a un proceso de descompresión que restablece los programas, los programas sometidos a las operaciones sucesivas de compresión, multiplexaje, transmisión, demultiplexaje, descompresión, es decir de hecho programas audio numéricos codificados/decodificados, denotados \tilde{P}r_{1}, \tilde{P}r_{2}, \tilde{P}r_{3}, son entonces sometidos a la distribución ente los usuarios. En el marco de una transmisión de tipo DAB, por Digital Audio Broadcasting, la señal audio numérica está subdividida en tramas que comprenden por ejemplo, para una compresión de tipo MPEG1 LII, 1152 muestras de la longitud de la trama transmitida dependiendo de la tasa de compresión o del flujo de codificación utilizado. La trama codificada comprende bits de sincronización S_{inc} de los bits de código de corrección de errores CRC y finalmente los bits de datos audio numéricos propiamente dichos. De una manera general, la señal audio numérica antes citada, para cada programa considerado Pr_{1} a Pr_{3} es tanto una señal monofónica, como una señal estereofónica. Cuando la señal es monofónica, esa señal está presente de manera idéntica en las vías derecha e izquierda del canal audio numérico, y llegado el caso a un valor de defasaje cercano. Cuando por el contrario, la señal es estereofónica, cada vía izquierda y derecha del canal audio numérico transmite una señal audio numérica que le es propia a fin de restituir las condiciones de registro en
estudio.
El procedimiento de control de la calidad de una señal audio numérica en distribución, conforme al objeto de la presente invención, es puesto en práctica en una señal audio numérica codificada/decodificada, es decir sometidas al conjunto de los tratamientos sucesivos descritos en unión con la figura 1. Será ahora descrito en primer lugar en unión con las figuras 2a y 2b.
Así como es representado en la figura 2a, el procedimiento, objeto de la presente invención, es aplicado a la señal audio numérica codificada/decodificada precedentemente citada, designada par ADS, esa señal corresponde a los programas \tilde{P}r_{1}, \tilde{P}r_{2}, \tilde{P}r_{3}, antes citados.
Según una característica particularmente ventajosa del procedimiento objeto de la presente invención, el mismo consiste en detectar en esa señal audio numérica una al menos de las señales parásitas tales como la señal de breve corte, de silbido, de bordoneo, de defasaje relativo de las vías izquierda y derecha de esa señal audio numérica. Se recuerda que la señal parásita de breve corte es designada por "muda" en lenguaje anglosajón.
En la figura 2a, se ha representado, a título puramente ilustrativo, las operaciones de detección de una señal de breve corte en la etapa 101, de detección de un silbido en la etapa 102, de detección de un bordoneo en la etapa 103 y de detección de un defasaje en la etapa 104, el defasaje entendiéndose, claro está, por un defasaje relativo entre las vías izquierda y derecha G, D, del canal audio numérico.
La detección de esas señales parásitas entendiéndose de preferencia una detección independiente de cada una de ellas, la operación de detección pudiendo permitir el establecimiento de una variable lógica representativa de la presencia, respectivamente de la ausencia de esa señal parásita. En la figura 2a, a título puramente ilustrativo, las variables lógicas correspondientes son denotadas P_{1}, P_{2}, P_{3}, P_{4} para las operaciones 101, 102, 103, 104 de detección de las señales parásitas antes citadas, los valores complementados de estas variables lógicas representando la ausencia de una señal parásita por ejemplo.
Además, y de conformidad con un aspecto particularmente remarcable del procedimiento, objeto de la presente invención, tal como es ilustrado en la figura 2a, la detección de una al menos de las señales antes citadas permite engendrar una señal de alarma, esta operación estando representada en las etapas 105, 106 de la figura 2a.
A título de ejemplo no limitativo y en un modo ilustrativo, la señal A, señal de accionamiento de una señal de alarma de potencia, puede por ejemplo corresponder tal y como es representado en la etapa 105, a une combinación lógica OU del conjunto de las señales P_{1}, P_{2}, P_{3}, P_{4}, la señal de alarma de potencia propiamente dicha, tal como una señal sonora, visual u otra, siendo emitida en la etapa 106 siguiente.
Con referencia a la figura 2a, se indica que, de conformidad con un aspecto particularmente remarcable del procedimiento, objeto de la presente invención, la detección de una de las señales antes citadas permite por ejemplo la emisión de la señal de alarma considerada.
Se comprende en particular que durante la emisión de esa señal de alarma, la explotación de la red de teledifusión es entonces informada de la existencia de una señal parásita que perturba de manera significativa las condiciones de la teledifusión y puede en consecuencia tomar cualquier medida de forma de modificar por ejemplo tanto la codificación del canal de transmisión, como cualquier operación que juzgue necesaria.
Según otro aspecto particularmente remarcable del procedimiento, objeto de la presente invención, tal como el representado en la figura 2b, el mismo puede consistir además en discriminar el modo de transmisión mono o estereofónico de la señal audio numérica ADS.
Así como es representado de manera puramente ilustrativa en la figura 2b, el procedimiento objeto de la presente invención puede entonces comprender una etapa 100 que consiste en discriminar el carácter mono o estereofónico de la señal ADS antes citada. De preferencia, pero de manera no limitativa, esta etapa de discriminación del carácter mono o estéreo de la señal ADS es realizada previamente a la realización de las etapas 101, 102, 103, 104 de las señales parásitas. En efecto, en función del carácter mono o estereofónico de la señal audio numérica transmitida ADS, diferentes condiciones pueden ser aplicadas para la realización de la detección de las señales parásitas, específicamente en la etapa 104 que consiste en detectar el defasaje relativo entre las vías izquierda y derecha del canal audio numérico.
En esas condiciones, y así como es representado en la figura 2b, la etapa 105 de constitución de una señal lógica de accionamiento de alarma puede consistir en establecer una señal que verifica la relación A1 = P_{1} O P_{2} O P_{3} O P_{4} cuando la señal es monofónica o A2 = P_{1} O P_{2} O P_{3} O P’_{4}, cuando la señal es estereofónica.
Se comprende por ejemplo que las señales P_{4} y P’_{4} pueden ser señales lógicas sometidas a condiciones de valor de defasaje diferentes según si la señal es mono- o estereofónica. La señal de accionamiento de alarma A1, A2 permite entonces engendrar la señal de potencia en la etapa 106 así como es mencionado precedentemente en la descripción.
Claro está, el procedimiento, objeto de la presente invención, debe permitir, de manera preferencial, la puesta en práctica de un control de calidad global de la señal audio numérica ADS. Por calidad global de la señal audio numérica, se entiende una calidad que permite el mejor confort de escucha para los usuarios, teniendo en cuenta la naturaleza de las señales parásitas y claro está, llegado el caso, del carácter mono- o estereofónico de la señal audio numérica ADS transmitida.
Se comprende en particular que las señales parásitas antes citadas pueden, en función de las condiciones de transmisión, no presentar la misma importancia relativamente a la degradación introducida en las condiciones de escucha de la señal audio numérica transmitida.
Con ese fin, y con referencia a la figura 3a, se indica que el procedimiento, objeto de la presente invención, a fin de establecer un control de calidad global de la señal audio numérica, puede consistir, en una ventana temporal deslizante de longitud determinada, es decir en una sucesión de muestras sucesivas de la señal audio numérica observada en esta ventana deslizante, para efectuar en combinación diferentes operaciones que apuntan a ponderar el valor relativo a cada señal parásita detectada frente a la degradación introducida en las condiciones de escucha antes citadas.
Así como es representado en la figura 3a, el procedimiento, objeto de de la presente invención, puede entonces consistir en descontar el número de ocurrencias N_{M} de señales parásitas de breve corte durante una duración T_{M} de observación de esa señal audio numérica y en comparar el número de ocurrencia N_{M} con un valor de umbral determinado S_{M}. En la figura 3a, se ha representado la operación antes citada como consistiendo, a partir de la etapa 101 precedentemente descrita en unión con las figuras 2a y 2b de detección de un breve corte y de una etapa 101a de inicialización del número de ocurrencias N_{M} con el valor cero, durante la existencia de un breve corte en respuesta a la etapa 101, en provocar el paso al valor N_{M} = N_{M}+1 en la etapa 101b por incremento de una unidad seguido de esta detección, esto durante toda la duración T_{M} de observación de la señal audio numérica. Al final de esta duración, una prueba de comparación del valor N_{M} incrementado final es efectuada en la etapa 101c frente al valor de umbral S_{M} antes citado. En respuesta positiva en la etapa de comparación 101c, una señal de defecto P_{1}* es entonces engendrada, esa señal de defecto corresponde a una degradación de la calidad global de la señal audio numérica.
Además, así como es representado en la figura 3a antes citada, el procedimiento según la invención consiste igualmente en descontar el número de ocurrencias N_{s} de señales parásitas de silbido durante una duración T_{s} de observación de la señal audio numérica ADS y en comparar el número de ocurrencias N_{s} con un valor de umbral determinado S_{s}. En la figura 3a, y de manera análoga al proceso de detección de breve corte, para la señal parásita de silbido la etapa 102a designa la inicialización de N_{s} en el valor cero, 102b designa el incremento de N_{s} en el valor N_{s}+1 y 102c designa la comparación de N_{s} con el valor de umbral S_{s}. Por comparación positiva en la etapa 102c, una señal lógica P_{2}* correspondiente a la degradación de la calidad global de la señal por un ruido de silbido es entonces engendrada.
El procedimiento objeto de la presente invención, consiste en operar de la misma forma para el ruido parásito de bordoneo y el ruido de defasaje.
En esas condiciones, así como es representado en la figura 3a, el mismo consiste en detectar durante una duración \tau_{D} el valor de defasaje \varphi y el número de ocurrencias que deben ser a lo mínimo igual a N_{D} de esos valores de defasaje en un número determinado D de cálculos de defasaje y luego en comparar el valor de defasaje \varphi calculado con un valor de umbral determinado S_{D}.
Igualmente en lo que concierne a las señales parásitas de bordoneo, el procedimiento objeto de la invención consiste en descontar el número de ocurrencias N_{B} de señales parásitas de bordoneo durante una duración \tau_{B} de observación de esa señal audio numérica y en comparar el número de ocurrencias N_{B} con un valor de umbral S_{B}.
En la figura 3a, de manera análoga a las señales parásitas de breve corte y de silbido, para la señal parásita de bordoneo, 103a designa la inicialización del valor N_{B} en el valor cero, 103b el incremento de este valor N_{B} al valor N_{B}+1, 103c designa la comparación del número de ocurrencias de bordoneos N_{B} con el valor de umbral determinado S_{B}. Para una respuesta positiva a la prueba 103c, un señal P_{3}* de presencia de una señal de bordoneo que afecta la calidad global de la señal audio numérica es engendrada. De igual forma, 104a designa la inicialización de N_{D} en el valor cero, 104b designa el incremento de N_{D} al valor N_{D+1}, 104c designando la comparación del valor de defasaje calculado \varphi con el valor de umbral determinado S_{D}. A una respuesta positiva a la prueba 104c, una señal P_{4}* es engendrada, la cual representa la presencia de una señal parásita de defasaje que afecta la calidad global de la señal ADS.
Claro está y de manera no limitativa, así como es representado en la figura 3a, el conjunto de las señales P_{1}*, P_{2}*, P_{3}* y P_{4}* puede, en la etapa 105, ser combinado de la misma manera que en el caso de la figura 2a. La señal de accionamiento de la alarma A verifica entonces la relación A = P_{1}* O P_{2}* O P_{3}* O P_{4}*, la señal de alarma de potencia siendo emitida en la etapa 106.
En el modo de realización del procedimiento objeto de la presente invención, tal como es representado en la figura 3a, cada señal salida de las pruebas de comparación 101c, 102c, 103c y 104c juega sensiblemente el mismo papel en lo que concierne a la puesta en práctica de la señal de accionamiento de la alarma A en la etapa 105. Sin embargo, es por supuesto posible adaptar el papel de cada una de esas señales, tanto a partir de los valores de ventana o duración de la observación de la señal audio numérica ADS, como a partir de cada valor de umbral frente a la cual la comparación es efectuada en las etapas antes citadas.
No obstante, y de conformidad con un aspecto particularmente remarcable del procedimiento objeto de la presente invención, para establecer un control de calidad global de la señal ADS, la etapa que consiste en emitir la señal de alarma está preferentemente condicionada a un orden de prioridad de los pasos de los valores de umbral antes citados.
Tal modo de realización preferencial es ahora descrito en unión con la figura 3b. En la figura 3b, las mismas referencias designan por supuesto los mismos elementos que en el caso de la figura 3a.
De una manera general, y así como es representado de manera no limitativa en la figura 3b, el acondicionamiento a un orden de prioridad de los pasos de cada una de las señales parásitas antes citadas puede por ejemplo ser efectuado privilegiando una de las señales parásitas en lo que concierne a su contribución a la señal de accionamiento de alarma A en la etapa 105 y, en definitiva, a la contribución de esa señal parásita en la degradación de la calidad global de la señal audio numérica ADS. En la figura 3b, a título de ejemplo, la señal parásita de breve corte P_{1}* es considerada plus molesta que una o la otra de las señales parásitas P_{2}*, P_{3}* o P_{4}* relativas a los ruidos de silbido, de bordoneo, respectivamente de defasaje. En esas condiciones, la señal de accionamiento de alarma A puede verificar la relación lógica:
A = P_{1}* ET(P_{2}* O P_{3}* O P_{4}*)
Claro está, ordenes de prioridad decrecientes pueden ser asignados al paso antes citado para los números de ocurrencias de las señales parásitas en función de la importancia relativa decreciente de esas señales relativamente a la degradación de la calidad global de escucha de la señal audio numérica. Tal modo de realización no limitativa será descrito ahora en unión con la figura 3c relativamente por ejemplo a las señales parásitas de silbido, de bordoneo y de defasaje, siendo entendido que la señal parásita de breve corte es considerada como prioritaria por ejemplo. En esas condiciones, el modo de realización de la figura 3c puede corresponder, de manera no limitativa, a una gestión específica de las señales parásitas de silbido P_{2}*, de bordoneo P_{3}* o de defasaje P_{4}* en el modo de realización de la figura 3b, la señal de breve corte siendo considerada como presentando una prioridad máxima.
Así como es representado en la figura 3c, para una sucesión de muestras corriente de la señal de audio numérica ADS, el procedimiento puede consistir, en una etapa 200 para observar los parásitos de silbido en una ventana temporal deslizante de duración T_{s}, y luego, en una etapa 201, para efectuar una detección de al menos S_{s} silbidos durante la duración de la observación. Claro está, esas operaciones 200 y 201 pueden corresponder a las operaciones 102, 102a, 102b, 102c de la figura 3b. A una respuesta positiva a la prueba 201, la señal parásita P_{2}* es engendrada.
Sin embargo, así como es representado en la figura 3c, la detección del defasaje en la etapa 203 puede estar condicionada a la ausencia de una señal parásita de silbido, es decir a la respuesta negativa a la prueba 201 antes citada. Así, en la etapa 203, el defasaje es calculado D veces la duración T_{D}. A una respuesta positiva en la etapa de comparación 203, una etapa 205 es efectuada en la cual un valor de defasaje \varphi aparece N_{D} veces en el número determinado de cálculo D. A una respuesta positiva en la etapa 205, la comparación del valor de \varphi con el valor de umbral S_{D} es efectuada en la etapa 206. Las etapas 203, 205 y 206 pueden corresponder con las etapas 104, 104a, 104b y 104c de la figura 3b. A una respuesta positiva en la etapa de comparación 206, la señal P_{4}* es entonces engendrada.
Por el contrario, a una respuesta negativa en la etapa 203, una etapa 204 es realizada, la cual consiste en detectar la señal parásita de bordoneo. La etapa 204 puede corresponder a las etapas 103, 103a, 103b y 103c de la figura 3b. A una respuesta negativa en la etapa 204 antes citada, el procedimiento es entonces re-actualizado para la sucesión de muestras siguiente a la señal audio numérica ADS.
Por el contrario, a una respuesta positiva en la etapa 204, la señal parásita de bordoneo P_{3}* es engendrada, esa señal siendo susceptible de engendrar la señal de accionamiento de alarma A.
Con la observación de la figura 3c, se constata cómo ordenes de prioridad decreciente son atribuidos sucesivamente a la señal de silbido, de defasaje y de bordoneo.
Claro está, la gestión del bloque de las señales parásitas antes citadas con sus prioridades relativas correspondientes puede ser efectuada tanto de conformidad con la etapa 105 representada en la figura 3b, como, llegado el caso, de conformidad con la etapa 105 representada en la figura 3a.
En fin, se indica que en las figuras 3a y 3b, no se ha representado la etapa 100 de detección del carácter mono- o estereofónico de la señal audio numérica ADS a fin de no sobrecargar el dibujo. Por supuesto en los ejemplos de realización del procedimiento, objeto de la presente invención según las figuras 3b y 3c, la detección del carácter mono- o estereofónico de la señal puede ser efectuada.
Diferentes modos de llevar a cabo los procesos de detección de las señales parásitas y del carácter mono- o estereofónico de la señal audio numérica ADS precedentemente mencionados serán ahora descritos en unión con la figura 4 y las figuras siguientes.
La figura 4 es relativa a un modo de operación específico de detección del carácter mono- o estereofónico de la señal audio numérica antes citada.
Cuando una señal audio numérica ADS es transmitida en las dos vías de canal, vías derecha e izquierda, de un canal audio numérico, y transmitida en modo monofónico, las señales presentes en las vías de derecha y de izquierda son idénticas al valor de un defasaje de bajo valor cercano. La identidad de la señal en las dos vías es en general mantenida durante un cierto tiempo. Una observación experimental de la naturaleza de esas señales en esas dos vías ha podido mostrar que cuando existe un cambio súbito y corto del modo de transmisión de la señal audio numérica, tal como por ejemplo el paso del modo monofónico al modo estereofónico y luego el regreso al modo monofónico, tales cambios revelan la presencia de defectos. En caso contrario, el contexto de la transmisión no está llamado a evolucionar sin cese en el curso del tiempo. En consecuencia y con referencia a la figura 4, la etapa que consiste en discriminar el modo de transmisión mono- o estereofónico de la señal audio numérica ADS consiste en detectar cambios súbitos y breves de contexto de modo de transmisión mono- o estereofónico, o de manera recíproca, comparando las variaciones de energía de las dos vías izquierda y derecha.
En la figura 4, se ha representado una etapa que consiste en un cálculo de contexto de transmisión mono- o estereofónico seguido de una etapa de verificación de ese contexto que permite atribuir tanto el carácter monofónico, como el carácter estereofónico a la señal audio numérica transmitida.
En un modo de realización específico particularmente ventajoso no limitativo, tal como es representado en la figura 4, la discriminación del modo de transmisión mono- o estereofónico puede comprender, para cada sucesión de muestras sucesivas de rango n, cada sucesión de muestras siendo determinada por un corte en sucesiones de N muestras en una etapa 300 en las vías izquierda y derecha de la señal audio numérica ADS, una etapa 301 de cálculo de las energías respectivas de las vías derecha e izquierda de la señal de transmisión, esas energías siendo denotadas E_{n,g} para la vía izquierda y E_{n,d} para la vía derecha. El índice n designa el rango de la sucesión de muestras corriente considerada.
La etapa 301 antes citada es entonces seguida de una etapa 302 que consiste en calcular la relación M_{n} de las energías derecha e izquierda con M_{n} = E_{n,g}/E_{n,d}.
Esta etapa 302 es ella misma seguida por etapas 303, 304 y 305, las cuales permiten el cálculo de una variable binaria C_{n}, variable de contexto representativa del contexto de emisión en modo mono- o estereofónico.
La etapa 303 consiste en comparar el valor de la relación de las energías M_{n} con un primer y un segundo valor de umbral, denotados Umbral_{1} respectivamente Umbral_{2}, según la relación Umbral_{1} < Mn < Umbral_{2}. A una respuesta positiva a la prueba de comparación 303 antes citada, a la variable de contexto C_{n} es atribuida en la etapa 304 el valor 0 representativo de un contexto de modo monofónico, y a la variable de contexto C_{n} es por el contrario atribuido el valor 1 de otro modo, en la etapa 305. El valor 1 de la variable de contexto C_{n} es representativo de un contexto de modo estereofónico. Las etapas 300, 301, 302, 303, 304, 305 descritas en unión con la figura 4 constituyen la etapa de cálculo de contexto precedentemente mencionado en la descripción.
La etapa de verificación de contexto precedentemente citada es entonces constituida por ejemplo, así como es representado en la figura 4, por una etapa 306 que consiste en efectuar en un número determinado de muestras sucesivas el cálculo de un cúmulo del valor de las variables binarias de contexto C_{n} sucesivas en un número C de sucesiones de muestras consecutivas. Ese cúmulo es representativo de la aritmética de las variables de contexto sobre el número C de sucesiones de muestras. La etapa 306 es entonces seguida por la etapa 307 que consiste en comparar, por comparación de superioridad, el valor de esta suma, es decir el valor de ese cúmulo, en un valor límite, denotado Límite, que constituye un valor de referencia. A una respuesta positiva a la comparación de superioridad antes citada en la etapa 307, al modo transmisión de la señal audio numérica ADS es atribuido el modo estereofónico, mientas que a una respuesta negativa es atribuido a ese modo de transmisión el modo monofónico. El modo de operación del proceso descrito en unión con la figura 4 puede ser justificado de la manera a continuación.
Cuando la señal está en modo estereofónico, la diferencia entre las energías de las dos vías izquierda y derecha no es nula. Así, para determinar el contexto mono- o estereofónico, la distancia entre la energía de cada vía derecha e izquierda es calculada. Las energías respectivas pueden entonces verificar la relación:
1
En esas relaciones, D_{n,i} y G_{n,i} representan el valor de la amplitud de cada muestra de rango i de la sucesión de muestras de rango n de la señal audio numérica ADS.
A fin de no considerar una señal estereofónica que pasa por cero como una señal monofónica, la variable de contexto C_{n} es entonces sumada a un número C de sucesiones de muestras sucesivas durante la operación de verificación de contexto. El modo de transmisión es entonces estereofónico si el cúmulo de las variables de contexto es al menos igual al valor límite que constituye el valor de referencia.
Un ejemplo de valor numérico será ahora dado para una aplicación al código numérico de tipo MPEG1 LII transmitido por medio de un canal de radiodifusión numérico. En tal ejemplo de aplicación, el número de cada sucesión de muestras N puede estar comprendido entre 256 y 1024 muestras, los valores de umbral, Umbral_{1} y Umbral_{2} pueden estar comprendidos entre
Umbral_{1} \in [0,95; 0,9999]
Umbral_{2} \in [1,0001; 1,05]
C \in [20; 60]
y el valor límite de comparación a la prueba 307:
Límite\in [l5;45].
Un proceso preferencial de detección de una señal parásita tal como un breve corte será ahora descrito en unión con las figuras 5a y 5b.
En primer lugar, se recuerda que un breve corte es una interrupción muy breve de la señal audio numérica que constituye un silencio numérico, la señal audio numérica ADS siendo en ese caso remplazada por ceros o de muy bajos valores en razón de un problema de transmisión, tal como la pérdida de sincronización por ejemplo, impidiendo el decodificador, es decir el operador de descompresión, reconstruir la sucesión de muestras constitutiva de la señal audio numérica.
En consecuencia, y con referencia a la figura 5a, la cual representa la amplitud de las muestras de la señal audio numérica para una secuencia de música de jazz transmitida y recibida en límite de zona de servicio, un breve corte, o Mudo, está caracterizado por una ausencia total de sonido durante varios milisegundos, 25 ms en la figura 5a.
Por el contrario, cualquier sonoridad destinada a ser escuchada posee un mínimo de reverberación. El fenómeno de reverberación es un fenómeno debido a las múltiples reflexiones del sonido en las paredes tales como los muros y los techos que rodean cualquier fuente sonora. Ese fenómeno de reverberación existe siempre, incluso, pero en una menor medida, en campo libre.
De conformidad con un aspecto particularmente remarcable del procedimiento objeto de la presente invención, la etapa que consiste en detectar en la señal audio numérica ADS una señal parásita tal como un breve corte, consiste en detectar en una sucesión de muestras sucesivas de esa señal numérica un decrecimiento rápido del nivel de energía de esa señal audio numérica hacia una energía nula. Tal forma de señal revela de hecho la ausencia de reverberación de esa señal audio numérica y, en consecuencia, la introducción de un breve corte.
Así, y en una realización específica particularmente ventajosa non limitativa del procedimiento objeto de la presente invención, tal como es representado en la figura 5b, la etapa que consiste en detectar en la señal audio numérica una señal parásita tal como un breve corte comprende una etapa que consiste en determinar separadamente en cada vía izquierda y derecha del canal audio numérico, para una pluralidad de sucesiones de N muestras sucesivas, la energía media E_{n} de la señal transportada por esta vía, n designando el rango de cada sucesión de muestras.
Con referencia a la figura 5b, se indica que el corte de cada vía sobre la señal audio numérica ADS es efectuado en una etapa 400, la cual es seguida por una etapa 401 de cálculo de la energía temporal E_{n} de la sucesión de muestras considerada.
La energía media E_{n} en cada vía verifica entonces la relación:
2
En la relación precedente, se indica que x[i] representa la muestra temporal de rango i de la sucesión de N muestras, n designando el rango de esta sucesión de muestras. En este caso, las ventanas temporales, es decir las sucesiones de muestras sucesivas, están sin recubrimiento.
La etapa 401 de la figura 5b es entonces seguida por una etapa 402 que consiste en comparar la evolución de la energía media para sucesiones de N muestras sucesivas, la etapa 402 pudiendo corresponder por ejemplo en una verificación de una relación de inferioridad del valor de la energía media E_{n} al valor Umbral_{1}.
La existencia de una señal parásita de breve corte 405 es revelada si una al menos de las energías medias es inferior al Umbral_{1} y si, así como es representado en la etapa 403, una o varias energías medias vecinas a esta energía media nula son superiores a un valor de umbral determinado. La etapa 403 corresponde a una etapa de comparación de la energía media de la sucesión de muestras de rango n-k, denotada E_{n-k}, a un valor de umbral \Delta, \Delta = 31 dB. E_{n-k} designa la o las energías medias vecinas.
Si por el contrario, la respuesta en la etapa de comparación 402 es negativa, el proceso es repetido mediante el retorno a la etapa 401 para una sucesión de muestras de rango n+1 por el bucle de retorno 404. El valor de cada energía media E_{n} es entonces memorizado para una pluralidad de sucesiones de muestras sucesivas a fin de permitir la continuidad de los cálculos.
Un ejemplo de aplicación a la codificación audio numérica de tipo MPEG1 LII es ahora dada a continuación.
En este tipo de codificación, los breves cortes corresponden a silencios numéricos de longitud múltiple de 1152 muestras numéricas. En ese caso, el parámetro N, número de muestras constitutivas de una sucesión de muestras, vale 256, lo que permite asegurar la detección de la zona más pequeña de las muestras de bajos valores, o sea Umbral_{1} = 3, \Delta = 31 dB con k = 2. En ese caso, la comparación con la etapa 403 puede ser efectuada por el cálculo del valor:
\DeltaE = 10.LOG_{10} [E_{n-2}]-31,
Si el valor \DeltaE es superior a cero, \DeltaE > 0, entonces existe una señal parásita de breve corte.
Una descripción más detallada de un proceso especifico de detección de una señal parásita tal como un silbido será ahora dada en unión con las figuras 6a y 6b.
De una manera más particular, así como es representado en la figura 6a. Se indica que la presencia de tal señal parásita corresponde a un aumento súbito y transitorio de la energía espectral de la señal audio numérica en una banda de frecuencias relativamente ancha que no exceda sin embargo 15 a 16 kHz. De preferencia, y según un aspecto remarcable del procedimiento objeto de la presente invención, la etapa que consiste en detectar en la señal audio numérica ADS una señal parásita tal como un silbido consiste en detectar en esa señal audio numérica un aumento súbito y transitorio de la energía espectral de esa señal audio numérica en una banda de frecuencia cuya frecuencia baja está comprendida entre 4,5 y 6,5 kHz y cuya frecuencia alta puede alcanzar hasta 20 kHz. Esa señal parásita de silbido es provocada por errores del código corrector de errores en la reconstrucción de la sucesión de muestras audio numéricas. Un modo de realización específico de un proceso de detección de las señales parásitas de silbido será ahora descrito en unión con la figura 6b, ese proceso estando basado en la detección de las variaciones de energía espectral de la señal audio numérica.
Así como es representado en la figura 6b antes citada, la señal audio numérica ADS es ante todo cortada en sucesiones sucesivas de N muestras, cada sucesión siendo una sucesión de rango n dada sometida a una verificación de la energía media de cada sucesión, así como es representado en la etapa 500 de la figura 6b. Con ese fin, la etapa 500 es subdividida en una etapa 500a de corte de la señal en sucesiones de rango n comprendiendo cada una N muestras, las muestras de cada sucesión siendo designadas por e(i).
La etapa 500a es seguida por una etapa 500b que consiste en calcular la energía temporal media de cada sucesión de rango n, Emed_{n} = \sum\limits_{i=1}^{N}e(i). La energía media de cada sucesión de muestras es comparada por relación de superioridad con un primer valor de umbral, Umbral_{1}, relación:
Emed_{n} > Umbral_{1}
en la etapa siguiente 500c.
A una respuesta negativa en la etapa 500c, el proceso es conducido a la etapa 500b, la energía de al menos una sucesión corriente de rango n siendo considerada como insuficiente. Si no, a una respuesta positiva en la etapa 500c, una etapa 500d es conducida, la cual consiste en comparar según una comparación de superioridad la relación de la energía de la sucesión corriente y la energía de una sucesión inmediatamente vecina, no adyacente, de rango n-2, con un segundo valor de umbral, Umbral_{2} según la relación:
\frac{Emed_{n}}{Emed_{n-2}} > Umbral_{2}
A una respuesta negativa a la comparación de la prueba 500d, el proceso es conducido a la etapa de cálculo de la energía temporal media, la energía de la sucesión corriente y de la sucesión vecina siendo parecidas.
A una respuesta positiva a la comparación de la prueba 500d, la energía media de dos tramas vecinas siendo creciente, y la relación superior al segundo valor de umbral, el proceso de detección de silbido es proseguido, la etapa 500 habiendo sido satisfecha. La etapa 500 antes citada es entonces seguida por una etapa que consiste en calcular en una sucesión de muestras de la señal audio numérica la composición espectral de esa señal definida como el valor de componentes de frecuencias en sub-bandas de frecuencia central f_{i}, el valor de los componentes de frecuencias siendo designados por S_{n}(i), n designando el rango de la sucesión de muestras considerada. Los valores S_{n}(i) tienen un ancho de banda \deltaf. La etapa antes citada es realizada y representada en la figura 6b por las etapas 501 que consisten de hecho en calcular el espectro de la señal por transformada de Fourier, los componentes en sub-bandas siendo denotados S_{n}(i). En la etapa 502, se limita en ese espectro el valor de la frecuencia a un valor más allá del valor F kHz, o sea el valor 4,5 kHz y se efectúa un corte del intervalo 4,5 kHz, hasta 20 kHz en intervalos de frecuencias de amplitud múltiple de \deltaf kHz.
La etapa 502 es seguida por una etapa 503 que consiste en buscar la sub-banda \deltaf de energía máxima en cada uno de los intervalos antes citados, definidos precedentemente en la etapa 502. Esta sub-banda \deltaf es denotada S_{n}(imax) y permite centrar nuevamente el conjunto de los intervalos definidos en la etapa 502 alrededor de la sub-banda de energía máximo considerada.
La etapa 503 es seguida por una etapa 504 que consiste en calcular la energía media de cada intervalo centrado nuevamente alrededor de la banda de energía máxima para la sucesión de muestras de rango n considerado.
En la etapa 504, la energía de cada intervalo es denotada E_{n}(sb) y verifica la relación:
3
La etapa 504 es entonces seguida por una etapa 505 que consiste en calcular la relación entre la energía E_{n}(sb) de los intervalos para la sucesión de muestras corrientes y para una pluralidad de sucesiones precedentes, E_{n-s}(sb) de muestras sucesivas. La relación antes citada se escribe:
4
En la relación precedente, s indica el pasado temporal relativo a s espectros de frecuencias relativas a un número dado de sucesiones de muestras correspondientes.
La etapa 505 antes citada es seguida por una etapa 506 que consiste en calcular un valor de contraste auditivo, denotado C_{n,sb}. El valor del contraste auditivo verifica la relación:
5
En esta relación, R_{n}(sb+i) con i = -\nu y i \neq -p, -(p-1), ..., 0, ..., p-1, p, p designando un valor arbitrario, designa el valor de la relación para los intervalos vecinos de la misma sucesión de muestras de rango n y del mismo espectro S_{n}.
En la etapa 506, el contraste auditivo C_{n,sb} es comparado con un primer valor de umbral de silbido, denotado S_{1}, por comparación de superioridad. A una respuesta negativa a la comparación antes citada, una etapa de retorno 508 conduce a la sucesión de muestras de rango n+1 siguiente y en particular a la etapa 501 de cálculo del espectro de la señal por transformada de Fourier.
Por el contrario, a una respuesta positiva en la etapa de comparación antes citada de la etapa 506, una etapa 507 es prevista, la cual consiste en calcular un parámetro de proximidad denotado P_{n,sb} que verifica la relación:
6
La etapa 507 comprende entonces una etapa de comparación del parámetro de proximidad P_{n,sb} a un segundo valor de umbral de silbido S_{2}, P_{n,sb} > S_{2}. A una respuesta negativa a la comparación de la etapa 507 antes citada, un bucle de retorno 509 permite volver a la etapa 501 de cálculo del espectro de la señal por transformada de Fourier para la sucesión de muestras siguiente de rango n+1.
Por el contrario, a una respuesta positiva a la prueba de comparación de la etapa 507, la presencia de una señal parásita de silbido es revelada. Se nota claro está que la presencia de la señal parásita de silbido es revelada en la etapa 510 si las comparaciones de superioridad del valor de contraste auditivo C_{n,sb} y del parámetro de proximidad P_{n,sb} frente al primer umbral S_{1} respectivamente del segundo umbral S_{2} son los dos verificados.
Un justificativo del modo de realización de la detección de los silbidos en el modo de realización de la figura 6b será dado a continuación.
El cálculo del espectro de la señal en la etapa 501 puede ser realizado a partir de transformadas de Fourier rápidas.
Los valores de los componentes de frecuencias S_{n}(i) de la descomposición en sub-bandas de la sucesión de muestras de rango n son observados en intervalos de frecuencias de amplitud múltiple de \deltaf kHz y su evolución temporal es así estudiada en un pasado temporal de s espectros. Esas operaciones son realizadas en las étapas 502, 503, 504 y 505.
En cada uno de los intervalos salidos de la descomposición, el máximo de la energía de una sub-banda de rango dado es buscada. Los intervalos son entonces centrados nuevamente alrededor de la frecuencia, es decir el rango i que soporta ese máximo, y los medios de la energía E_{n}(sb) son calculados por la sucesión de muestras de rango n consideradas. La evolución de la energía para cada uno de esos nuevos intervalos es observado a partir de la relación R_{n}(sb) y el criterio de contraste auditivo C_{n,sb} es entonces calculado observando el comportamiento de la relación antes citada con relación a la cercanía. La presencia de un silbido es verificada si el valor de contraste auditivo es superior al primer valor de umbral y si el parámetro de proximidad es superior al segundo valor de umbral.
En las relaciones precedentes, \nu indique el índice de los intervalos vecinos de igual espectro Sn relativo a la misma sucesión de muestras n, p designa el número de sub-bandas de un lado al otro del máximo no tomadas en cuenta en el cálculo del valor de contraste y k designa el número de intervalos.
Para una codificación audio numérica de tipo MPEG1 LII transmitida en radiodifusión numérica el cálculo de las transformadas de Fourier puede ser efectuado en una longitud que va de 256 a 4096 muestras, el recubrimiento mínimo estando de 25 a 75%. Los intervalos tienen una amplitud de frecuencia \Deltaf \in [500 Hz, 1500 Hz], el pasado temporal de observación es S \in [1,4] en número de espectros sucesivos, es decir de sucesiones de muestras sucesivas.
En la cercanía \nu \in [1,6] y p \in [0,4]. Los valores de umbral son S_{1} \in [50,1000] y S_{2} \in [2,20].
Además y de manera no limitativa, para efectuar el proceso de detección de silbido, el procedimiento objeto de la presente invención, puede igualmente consistir en efectuar una etapa de filtrado de los componentes espectrales en sub-bandas no audibles al oído humano. En esas condiciones, ese modo de operación permite tener en cuenta propiedades psico-acústicas de la señal audio numérica, los espectros de energía siendo previamente multiplicados por el umbral absoluto de audición, según la formulación de la norma francesa ISO 226 de 1987, prolongada más allá de 12,5 kHz.
Una descripción más detallada del proceso de detección de una señal parásita tal como un bordoneo será ahora dada en unión con las figuras 7a y 7b.
El defecto de bordoneo introducido en las señales audio numéricas es debido a la diferencia de protección en la trama audio numérica acordada para los bits sensibles tales como los bits de sincronización y los bits de código de corrección de error, mientras que los bits restantes de la trama están menos bien protegidos. Así, cuando la trama es reconstruida después de la descompresión, los datos audio numéricos pueden ser erróneos debido al hecho de esa menos buena protección.
Durante la puesta en práctica del procedimiento objeto de la presente invención, investigaciones conducidas en presencia de ruidos o bordoneos han permitido constatar que durante la aparición de ese defecto, al espectro de la señal se adiciona un ruido rosa de baja frecuencia.
En consecuencia, y de conformidad con un aspecto particularmente ventajoso del procedimiento, objeto de la presente invención, y con referencia a la figura 7a, la etapa consistente en detectar en la señal audio numérica una señal parásita tal como un bordoneo consiste en detectar en esa señal parásita un ruido rosa en una banda de frecuencias comprendida entre 0 y 1100 Hz y de nivel sensiblemente constante en esta banda de frecuencias. Con referencia a la figura 7a, se indica que el nivel sensiblemente constante del ruido rosa introducido durante la aparición de este defecto es del orden de 40 dB. La figura 7a representa así el espectro de una señal audio numérica ante la aparición del ruido rosa, en trazo mixto durante la aparición del ruido rosa, en trazo por puntos, y después de la aparición del ruido rosa, en trazo continuo. Un modo específico de detección del defecto de bordoneo que permite la detección del ruido rosa antes citado será ahora descrito a título ilustrativo, en unión con la figura 7b.
El proceso de detección antes citado es llevado a la práctica en al menos una vía izquierda o derecha del canal audio numérico. El mismo consiste en una etapa 700, así como es representado en la figura precitada, en cortar en sucesiones de N muestras la señal audio numérica ADS y luego, en una etapa 701, para calcular en la sucesión de muestras considerada la composición espectral de esa señal audio numérica definida como el valor S_{n}(i) de componente de frecuencia en sub-bandas de frecuencia central f_{i}, n designando el rango de la sucesión de muestras. Se comprende en particular que la etapa 701 representada en la figura 7b puede ventajosamente ser realizada de la misma manera que la etapa 501 de la figura 6b, una sola descomposición por transformada de Fourier siendo entonces realizada para el conjunto de los dos procesos de detección. La etapa 701 precedentemente mencionada es entonces seguida de una etapa 702 que consiste en calcular, para un número determinado k de frecuencia central f_{i} del campo de las bajas frecuencias, es decir comprendida entre 0 y 1100 Hz, una primera \alpha_{i,n} y una segunda \beta_{i,n} relación de los valores de componentes de frecuencia en sub-bandas para la sucesión de muestras corrientes y la sucesión de muestras precedentes, respectivamente para la sucesión de muestras corrientes y la sucesión de muestras siguientes. Así, la primera relación \alpha_{i,n} verifica la relación \alpha_{i,n} = \frac{S_{n}(i)}{S_{n-1} (i)} y la segunda relación \beta_{i,n} verifica la relación \beta_{i,n} = \frac{S_{n}(i)}{S_{n+1} (i)}.
En las relaciones precedentes, S_{n-1}(i) es relativo a la sucesión de muestras precedentes y S_{n+1} (i) es relativa a la sucesión de muestras siguientes frente a la sucesión de muestras corrientes S_{n}(i). En la etapa 702, la primera y la segunda relación \alpha_{i,n} y \beta_{i,n} son entonces comparadas con un primer valor de umbral de bordoneo, denotado S’_{1}. A una respuesta negativa a la comparación de la etapa 702, un retorno 703 es efectuado a la puesta en práctica de la etapa 702 para la componente en sub-bandas de rango i que corresponde a la misma sucesión de rango n.
A una respuesta positiva a la prueba de comparación de la etapa 702, una etapa 704 es realizada, esta etapa consiste en someter la comparación de las primera y segunda relaciones a un criterio de proporción p/k del número p de comparaciones verificadas con relación a la totalidad de las k comparaciones efectuadas para las k frecuencias centrales f_{i} de los componentes en sub-bandas consideradas. La relación p/k puede ser expresada en valores de P%. A una respuesta negativa de la comparación de las primera y segunda relaciones al criterio de proporción antes citado, un retorno por un bucle 708 es efectuado a la etapa 701 de cálculo del espectro de la señal para la sucesión de muestras de rango n+1 siguiente.
Por el contrario, a una respuesta positiva a la comparación de la etapa 704, una etapa 705 es realizada, la cual consiste en discriminar, entre los valores en sub-bandas S_{n}(i) de los componentes de frecuencia en sub-bandas, el valor máximo S_{n}(i_{máx}) para los componentes en sub-bandas de los valores de componentes de frecuencia relativos a la sucesión de muestras corriente de rango n. La etapa 705 es entonces seguida por una etapa 706 que consiste en calcular la relación del valor máximo antes citado con el valor de la raya de frecuencia situado en el mismo índice i_{máx} del espectro de la sucesión n-1 de muestras, esa relación verificando la relación:
7
La relación antes citada es entonces comparada con un segundo valor de umbral de bordoneo, denotado S’_{2}. La comparación con el segundo valor de umbral de bordoneo S’_{2} es una comparación de inferioridad. A una respuesta negativa a la comparación antes citada, un bucle de retorno 709 conduce a la etapa 701 para la sucesión de muestras de rango siguiente n+1.
De esta forma, las etapas 702, 704, 705 y 706, a una respuesta positiva a las comparaciones frente a los umbrales de bordoneos S’_{1} y S’_{2}, comparación de superioridad frente a S’_{1} y comparación de inferioridad frente a S’_{2}, relaciones \alpha_{i,n} y \beta_{i,n}, respectivamente de la relación M_{n,i}, permiten concluir una posible existencia de una señal parásita de bordoneo. La etapa 706, en ese caso, es entonces seguida por una etapa 707 de análisis estadístico que consiste por ejemplo en determinar la ocurrencia múltiple de una señal parásita de bordoneo posible en una duración de observación dada \tau_{b} de s segundos.
Para realizar la etapa 707, la misma puede consistir en repetir las operaciones precedentes de discriminación de la existencia de una comparación de superioridad de las primera y segunda relaciones al primer valor de umbral de bordoneo S’_{1} y de existencia de una composición de inferioridad de la relación M_{n,i} al segundo valor de umbral S’_{2}. En el curso de la repetición de esas operaciones en la etapa 707, una variable binaria de pre-detección de la existencia de una señal parásita de bordoneo es memorizada. A esta variable binaria es atribuido el valor 1 cuando los criterios de comparación de superioridad y de inferioridad son satisfechos y si no el valor 0.
Además, un descuento en la duración \tau_{b} = s segundos del número de ocurrencias de la variable binaria de pre-detección al valor 1 es efectuado. Ese número, denotado NV_{pd}, es comparado con un tercer valor de umbral de bordoneo S’_{3} por comparación de superioridad. A una respuesta negativa a esta comparación, NV_{pd} > S’_{3}, un retorno 710 por un bucle es realizado a la etapa 701 para la sucesión de muestras de rango n+1 siguiente.
Por el contrario, a una respuesta positiva a la prueba frente al tercer umbral de bordoneo S’_{3} y realizado en la etapa 707, una señal parásita de bordoneo es revelada cuando esta comparación en este tercer valor de umbral de bordoneo es verificada. La presencia de la señal parásita de bordoneo es obtenida en la etapa 711.
Un justificativo del proceso de detección de las señales parásitas de bordoneo será dado a continuación.
En una primera parte, se indica que cuando la proporción de rayas de frecuencia para los cuales las primeras relaciones \alpha_{i,n} y \beta_{i,n} son superiores al mismo valor de umbral de bordoneo S’_{1} y superiores al valor P% antes citado, entonces puede existir un ruido parásito de bordoneo en la sucesión de muestras de rango n considerado. Aunque esta condición parece necesaria, la misma sin embargo no parece ser suficiente.
Para que haya detección de una señal parásita de bordoneo, otras condiciones deben ser verificadas, en particular la comparación que interviene en la raya más energética de la porción de espectro de frecuencias estudiadas. Esta segunda condición concierne a la comparación de la relación M_{n,i} con el segundo valor de umbral de bordoneo S’_{2}.
Finalmente, la propiedad de la señal unida al modo estereofónico de esta última es puesta en práctica durante la tercera comparación con el tercer valor de umbral. Así, solamente puede haber detección de una señal parásita de bordoneo si las dos comparaciones relativas a los umbrales de bordoneo S’_{1} y S’_{2} son satisfechos en una sola de las dos vías de la señal audio numérica para la sucesión de muestras corriente de rango n.
El análisis estadístico es efectuado en la etapa 707 y las decisiones son memorizadas a lo largo de una ventana temporal de amplitud \tau_{b} = s segundos. Si en esta ventana temporal el número de detección de todas las vías confundidas sobrepasa el valor de umbral S’_{3}, entonces hay efectivamente una señal parásita de bordoneo. Los valores de los parámetros precedentemente descritos son ahora dados en el caso de una codificación audio numérica MPEG1 LII transmitida por un canal de radiodifusión numérico.
En ese caso, el cálculo de las transformadas de Fourier puede ser efectuado de la misma manera como se describió precedentemente en la descripción. La amplitud del espectro observado puede ser de 500 Hz hasta 1,5 kHz en bajas frecuencias, el número de espectros memorizados siendo igual a 3, es decir para la sucesión de muestras precedente de rango n-1, la sucesión de muestras corriente de rango n y la sucesión de muestras siguiente de rango n+1:
- la banda de frecuencias puede estar comprendida entre [0 Hz, 1500 Hz]
- el primer valor de umbral de bordoneo S’_{1} \in [1,2]
- P% \geq 25%
- el segundo valor de bordoneo S’_{2} \in [1,2]
- \tau_{b} = s, s \in [1s,10s]
- el tercer valor de umbral de bordoneo S’_{3} \in [1,10].
Una descripción más detallada de un procesos que permite la detección de una seña parásita tal como un defasaje entre vías de la señal numérica será ahora descrito en unión con las figuras 8a a 8c.
La presencia de una señal parásita tal como un defasaje entre las vías izquierda y derecha, defasaje relativo entre las vías antes citadas de un canal audio numérico es provocado por el deslizamiento de fase de la señal presente en cada una de las vías. Tal defecto y la señal parásita correspondiente solo puede aparecer previamente a la codificación audio numérica y a la compresión de la señal, pero esta se encuentra sin embargo repercutida a todo lo largo de la cadena de difusión.
Cuando la señal audio numérica ADS es monofónica, una cierta separación de fase entre las vías derecha e izquierda puede ser tolerado. Algunos suministradores de programas pretenden de esta forma simular un efecto estereofónico. Sin embargo, más allá de un cierto valor de separación de fase, el efecto no es más aceptable para los oyentes. Cuando, por el contrario, la señal es estereofónica, el valor de fase a no sobrepasar puede ser diferente.
Así, con referencia a la figura 8a, la etapa que consiste en detectar en la señal audio numérica una señal parásita tal como un defasaje entre las vías derecha e izquierda de la señal numérica puede consistir, en una etapa A, en calcular el valor de defasaje entre las vías de la señal audio numérica a partir de la función de inter-correlación de la señal audio numérica presente en cada una de las vías derecha e izquierda del canal audio numérico. La etapa A antes citada es seguida por una etapa B que consiste en comparar el valor de defasaje calculado a un valor de umbral. El defasaje relativo entre vías es denotado \varphi y el valor de umbral es denotado \varphi_{max}, este valor variando en función del modo de transmisión mono o estereofónico de la señal.
Un modo de puesta en práctica específico no limitativo del proceso de detección de la señal parásita de defasaje será ahora dado en unión con las figuras 8b y 8c.
Con referencia a la figura 8b, se indica que el procedimiento conforme al objeto de la presente invención consiste, en una etapa 800, en cortar la señal audio numérica en sucesión de muestras de N muestras, cada sucesión comprendiendo el rango n. Ese corte es efectuado claro está en las vías izquierda y derecha de la señal audio numérica ADS. La etapa 800 antes citada es seguida por una etapa que consiste en calcular, en la sucesión de muestras antes citada, número N de muestras dadas, la función de inter-correlación entre la señal audio numérica presente en la vía izquierda y en la vía derecha. La etapa de cálculo de la función de inter-correlación precedentemente citada puede ser realizada gracias a una etapa 801 de cálculo de los espectros complejos de las vías izquierda y derecha por transformada de Fourier, valor de la componente de frecuencia i de la sucesión de muestras de rango n. Esta etapa 801 es seguida por una etapa 802 de multiplicación de un espectro de una vía por el conjugado del espectro de la otra vía, y luego por una etapa 803 de cálculo propiamente dicho de la transformada de Fourier inversa para obtener la función de inter-correlación. Las operaciones efectuadas en las etapas 801, 802, 803 no serán descritas en detalle ya que las mismas corresponden a operaciones clásicas en tratamiento de señal numérica. La etapa antes citada, a continuación de la etapa 803, es seguida por una etapa 804 que consiste en determinar el rango i de la muestra de la función de inter-correlación, muestra denotada corr(i), correspondiente al valor máximo corr(i) de esta función de inter-correlación. Esta etapa de búsqueda de máximo puede ser realizada a partir de una función de selección sobre el valor de las muestras de la función de inter-correlación.
La etapa 804 es entonces seguida por una etapa 805 que consiste, a partir de un valor de atenuación A determinado, en determinar el rango atenuado i_{inf}, i_{sup} de las muestras corr(i_{inf}) y corr(i_{sup}) de la función de inter-correlación distribuidas de un lado al otro del rango i de la muestra máxima corr(i) y que corresponde a un valor atenuado del valor A con relación al valor máximo de esta función de inter-correlación.
La etapa 805 consiste igualmente en calcular una primera relación del valor máximo al valor atenuado inferior, esta primera relación escribiéndose \frac{corr(i)}{corr(i_{inf})} y luego una segunda relación del valor máximo al valor atenuado superior, esta segunda relación verificando la relación \frac{corr(i)}{corr(i_{sup})}.
La etapa 805 consiste finalmente en comparar el valor de la primera y de la segunda relación antes citada con un primer valor de umbral, denotado S''_{1}. Por comparación de igualdad o de superioridad a este valor de umbral, el contraste izquierda/derecha de la señal audio numérica entre la vía izquierda y la vía derecha es entonces considerada como significativa. Ese contraste es significativo porque los índices de valor inferior y superior distribuidos de un lado al otro del máximo de la función de inter-correlación existen así como el valor de su relación, esos valores pudiendo ser entonces comparados con el primer valor de umbral de defasaje S''_{1}. En el caso donde esos índices no existen, en respuesta negativa a la prueba de comparación realizada en la etapa 805, un bucle 806 de retorno conduce el procedimiento a la etapa 801 para la sucesión de muestras siguientes de rango n+1.
A una respuesta positiva a la comparación realizada en la etapa 805, los índices inferiores y superiores existen, esta etapa 805 es seguida por una etapa 807 que consiste en buscar el rango denotado j del segundo máximo relativo corr(j)
de la función de inter-correlación.
Con referencia a la figura 8c, en la cual se ha representado la amplitud de la función de inter-correlación en función del tiempo, es decir de las muestras sucesivas que representan esta función de inter-correlación. Se ha representado el primer máximo correspondiente a la muestra i, o sea corr(i), los valores atenuados del valor A y de índice i_{inf} y i_{sup} y correspondientes, así como el segundo máximo de índice j. El valor de la atenuación R corresponde a la diferencia entre el máximo maximorum de la función de inter-correlación y ese segundo máximo. El índice j del segundo máximo de la función de inter-correlación es buscado en los intervalos [0; i_{inf}] y [i_{sup}; i_{inf}].
La etapa 807 es entonces seguida por una etapa 808 consistente en calcular un parámetro de contraste izquierdo/derecho C_{g,d} relación entre el valor máximo corr(i) y el valor de segundo máximo corr(j). El valor de contraste izquierdo/derecho verifica la relación:
C_{g,d} = \frac{corr(i)}{corr(j)}
La etapa 808 comprende igualmente una comparación del valor del parámetro de contraste C_{g,d} antes citado con un segundo valor de umbral del defasaje, denotado S''_{2}. A una respuesta negativa a la comparación antes citada, un retorno por un bucle de retorno es efectuado en la etapa 801 para la sucesión de muestras siguiente de rango n+1.
Por el contrario, a una respuesta positiva a la comparación de la etapa 808 antes citada, las operaciones precedentes sucesivas a la comparación de la primera y de la segunda relación en el primer valor máximo de la función de inter-correlación, es decir las etapas 805, 807 y 808, son repetidas de forma de determinar en los rangos sucesivos el rango que presenta la mayoría de las ocurrencias. Esas operaciones son realizadas, por ejemplo en una etapa 809, donde el resultado relativo al valor i del máximo de la función de inter-correlación es establecido en una tabla, y en una etapa 810 donde un análisis estadístico es efectuado sobre el número de ocurrencias en esa tabla. En la etapa 810, si un valor i tiene una ocurrencia superior o igual A un tercer valor de umbral de defasaje S''3, entonces, y en respuesta positiva a esta comparación de superioridad, al defasaje relativo de las vías izquierda y derecha del canal audio numérico es atribuido un valor correspondiente a aquel del rango que presenta la mayoría de las ocurrencias, es decir el valor del rango i. Esta atribución es realizada en la etapa 811. Por el contrario, si ninguna ocurrencia es superior o igual al tercer valor de umbral de defasaje S''3, entonces, un bucle 812 conduce a la sucesión de muestras siguiente de rango n±l. Un justificativo del proceso de operación descrito en unión con las figuras 8b y 8c será ahora dado a continuación.
En lo que concierne al cálculo de la función de inter-correlación, este puede ser estimado entre las señales presentes en las vías izquierda y derecha por un medio temporal que verifica la relación:
8
En esta relación, \Gamma(k) designa el valor de la función de inter-correlación en el punto k, G(q) y D(q+k) designa la muestra de la vía izquierda respectivamente derecha de rango q y q+k correspondiente. En esta relación, k varía de 0 a N-1.
La complejidad en tiempo de cálculo de este estimador según la relación antes citada es proporcional a N^{2}. El cálculo de la convolución circular por FFT complejo tal como es descrito con las etapas 801, 802 y 803 permite llevar la complejidad de cálculo al valor (2N) .Log_{2}(2N).
Para una codificación audio numérica de tipo MPEG1 LII transmitida por un canal de radiodifusión numérico, las longitudes de observación y de cálculo N y K pueden ambas ser iguales a 32768, un valor mínimo siendo igual a 1024.
El valor de umbral de cálculo de defasaje S''_{1} está comprendido entre S''_{1} \in [2,100].
El valor del segundo umbral de cálculo de defasaje S''2 está comprendido entre S''_{2} \in [1,5].
El tamaño de la tabla de resultados realizada en la etapa 810 para efectuar el análisis estadístico del rango i correspondiente al máximo de la función de inter-correlación puede ser 10 valores sucesivos.
El valor del tercer umbral de cálculo de defasaje S''_{3} puede por ejemplo ser tomado igual a 5.
Un dispositivo de control de la calidad de una señal audio numérica que lleva a cabo el procedimiento objeto de la presente invención precedentemente descrito en la descripción será ahora descrito en unión con la figura 9.
\newpage
Con referencia a la figura antes citada, se indica que el dispositivo de control de la calidad de una señal audio numérica objeto de la presente invención comprende al menos un módulo 1 de conversión de la señal audio numérica ADS en un señal numérica de formato especializado. A título de ejemplo no limitativo, se indica que el módulo 1 de conversión de la señal audio numérica en un señal numérica de formato especializado puede ser realizado por medio de un circuito IRD de calidad profesional que recibe la señal audio numérica ADS a partir de una primera entrada de tipo BIS, para banda inter-satélite, o a partir de una entrada de tipo MPEG2 TS. Claro está, la puesta en práctica de tal módulo no es indispensable en tanto que, ese módulo puede ser reemplazado por un receptor DAB por ejemplo, por Digital Audio Broadcasting. El módulo de conversión 1 de la señal audio numérica en una señal numérica de formato especializado expide esa señal al formato UER/AES.
Además, el dispositivo objeto de la presente invención tal como es representado en la figura 9 comprende un conjunto de tipo ordenador portátil que comprende al menos un módulo 2 de adquisición de los componentes de audio frecuencias izquierda y derecha, ese módulo 2 de adquisición recibe la señal numérica de formato especializado expedida por el módulo 1 de conversión de la señal audio numérica en señal numérica de formato especializado. El módulo 2 de adquisición de los componentes de audio frecuencias izquierda y derecha expide entonces una señal audio numérica especializada para cada una de las vías izquierda y derecha, denotadas RL en la figura 9.
El módulo 2 de adquisición de los componentes de audio frecuencias es seguido por un módulo 3 de detección de defecto de codificación y de transmisión que recibe la señal audio numérica especializada para cada una de las vías izquierda y derecha expedidas por el módulo 2 antes citado. Este permite detectar una al menos de las señales parásitas tales como breve corte, silbido, bordoneo, defasaje relativo de las vías izquierda y derecha y así expedir una señal de detección, de conformidad con el procedimiento objeto de la presente invención.
Además, un módulo de gestión 4 del tipo interfase hombre máquina recibe la señal de detección y permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas antes citadas.
Así como es representado en la figura 9, se indica que el dispositivo objeto de la presente invención puede comprender un módulo 5 de cálculo y de detección de parámetros complementarios, ese módulo de cálculo recibiendo la señal numérica de formato especializado expedida por el módulo 1 y expidiendo una señal representativa de parámetros complementarios tales como modo mono o estéreo, valores del flujo de bits da la señal audio numérica. Este es piloteado por el módulo 3 de detección de defectos de codificación y de transmisión.
De una manera general, se indica que el conjunto de los módulos 2, 3, 4 y 5 puede ser realizado por medio de un micro ordenador, el cual por esta razón está representado en puntos en la figura 9. En particular, el sistema de gestión del tipo plataforma interfase hombre máquina permite asegurar un control a distancia del módulo 1 de conversión de la señal audio numérica en una señal numérica de formato especializado.
Así, el sistema constituido por el micro ordenador realiza el tratamiento de los datos, suministra los resultados y los ordena permitiendo la gestión de las diferentes señales a tratar por el módulo 1 de conversión al formato especializado.
Así, el módulo 2 de adquisición de los componentes puede ser realizado por una tarjeta dedicada de tipo PCI inter-conectada al módulo 1 de conversión de formato. La adquisición de los componentes de audio de las vías izquierda y derecha es así realizada a partir de la señal audio numérica al formato especializado UER/AES. Los datos numéricos suministrados por el módulo 2, y por lo tanto por la tarjeta de tipo PCI, son tratados por el módulo 3 de detección de defectos, el cual claro está permite implementar bajo forma lógica las diferentes etapas del procedimiento objeto de la presente invención tal como es descrito precedentemente en la descripción.
A título de ejemplo no limitativo, el conjunto de los elementos lógicos correspondientes puede ser implantado en memoria muerta, llamada a la memoria viva del micro-ordenador y accionada a partir del módulo de gestión 4 que constituye la interfase hombre máquina IHM antes citada.
El conjunto de los elementos lógicos antes citados permite detectar en la señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo, defasaje relativo de las vías izquierda y derecha de esa señal audio numérica y engendrar una señal de alarma en presencia de una al menos de las señales parásitas.
Finalmente, el módulo 5 suministra resultados complementarios tales como la detección del modo de transmisión mono o estéreo, el flujo de bits de la señal audio numérica a partir de los resultados expedidos por el módulo 3 así como señales UER/AES expedidas por el módulo 1.

Claims (20)

1. Procedimiento de control de la calidad de una señal audio numérica, caracterizado porque ese procedimiento consiste en detectar en esa señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo y defasaje relativo a las vías izquierda y derecha de esa señal audio numérica, lo que permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas.
2. Procedimiento según la reivindicación 1, caracterizado porque el mismo consiste además en discriminar el modo de transmisión mono- o estereofónico de esa señal.
3. Procedimiento según la reivindicación 1 o 2, caracterizado porque, con el fin de la puesta en práctica de un control de la calidad global de dicha señal audio numérica, el mismo consiste, en combinación, en una ventana temporal deslizante que permite la observación de una sucesión de muestras sucesivas de dicha señal audio numérica:
- en descontar el número de ocurrencias N_{M} de señales parásitas de breve corte durante una duración T_{M} de observación de esa señal audio numérica y a comparar el número de ocurrencia N_{M} con un valor de umbral determinado S_{M};
- en descontar el número de ocurrencias N_{s} de señales parásitas de silbido durante una duración T_{s} de observación de esa señal audio numérica, y en comparar el número de ocurrencias N_{s} con un valor de umbral determinado S_{s};
- en detectar durante una duración \tau_{D}, el valor de defasaje \varphi y el número de ocurrencias N_{D} de esos valores de defasaje en un número determinado D de cálculos de defasaje y en comparar el valor de defasaje \varphi calculado con un valor de umbral S_{D} determinado;
- en descontar el número de ocurrencias N_{B} de señales parásitas de bordoneo durante una duración \tau_{B} de observación de esa señal audio numérica y en comparar el número de ocurrencias N_{B} con un valor de umbral S_{B};
- en emitir una señal de alarma de degradación de calidad de transmisión de dicha señal audio numérica en paso de uno al menos de los valores de umbral determinado por el número de ocurrencias correspondiente descontadas.
4. Procedimiento según la reivindicación 3, caracterizado porque la etapa que consiste en emitir dicha señal de alarma es condicionada a un orden de prioridad de dichos pasos
5. Procedimiento según la reivindicación 4, caracterizado porque ordenes de prioridad decreciente son asignados a los pasos por los números de ocurrencias de las señales parásitas de breve corte, de silbido, de defasaje y de bordoneo respectivamente.
6. Procedimiento según la reivindicación 2 a 5, caracterizado porque dicha etapa que consiste en discriminar el modo mono- o estereofónico de la señal transmitida consiste en detectar cambios súbitos y breves de contexto de modo mono- o estereofónico, o de manera recíproca, de la señal transmitida.
7. Procedimiento según la reivindicación 6, caracterizado porque la etapa que consiste en discriminar el modo de transmisión mono- o estereofónico comprende, para una transmisión de la señal audio numérica en modo mono o estereofónico, para cada sucesión de muestras sucesiva de rango n:
- una etapa de cálculo de las energías respectivas de las vías derecha e izquierda del canal de transmisión;
- una etapa de cálculo de la relación M_{n} de las energías derecha e izquierda;
- una etapa de cálculo de una variable binaria C_{n} de contexto, a la variable binaria C_{n} siendo atribuido el valor 0 representativo de un contexto de modo monofónico si la relación M_{n} de las energías está comprendido entre un primer y un segundo valor de umbral, y si no un valor 1 representativo de un contexto de modo estereofónico;
- una etapa de verificación del contexto que consiste, en un número determinado de muestras sucesivas, a calcular un cúmulo del valor de las variables binarias C_{n} sucesivas y en comparar el valor de ese cúmulo con un valor de referencia, y por comparación de superioridad de ese cúmulo con este valor de referencia, a atribuir al modo de transmisión el modo estereofónico y si no el modo monofónico.
8. Procedimiento según una de las reivindicaciones precedentes, caracterizado porque que la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un breve corte, consiste en detectar, en una sucesión de muestras sucesivas de esa señal numérica, un decrecimiento rápido del nivel de energía de esa señal audio numérica hacia una energía sensiblemente nula, que revela una ausencia be reverberación de esa señal audio numérica.
9. Procedimiento según la reivindicación 8, caracterizado porque la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un breve corte comprende:
- una etapa que consiste en determinar separadamente en cada vía estereofónica, para una pluralidad de sucesiones de N muestras sucesivas, la energía media E_{n} de la señal transportada por esta vía, n designando el rango de cada sucesión de muestras;
- una etapa que consiste en comparar la evolución de la energía media para sucesiones de N muestras sucesivas, la existencia de una señal parásita de corte breve siendo revelada si una al menos de las energías medias es sensiblemente nula y si una o varias energías medias vecinas a esta energía media sensiblemente nula son superiores a un valor de umbral determinado.
10. Procedimiento según una de las reivindicaciones precedentes, caracterizado porque que la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un silbido, consiste a detectar en esa señal audio numérica un aumento súbito y transitorio de la energía espectral de esa señal audio numérica en una banda de frecuencias cuya frecuencia baja está comprendida entre 4,5 kHz y 6,5 kHz y cuya frecuencia alta puede alcanzar hasta 20 kHz.
11. Procedimiento según la reivindicación 10, caracterizado porque la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un silbido comprende al menos:
- una etapa que consiste en calcular en una sucesión de muestras de la señal audio numérica la composición espectral de esa señal audio numérica definida como el valor S_{n}(i) de componentes de frecuencias en sub-bandas de frecuencia central f_{i} y de ancho de banda \deltaf, n designando el rango de la sucesión de muestras;
- una etapa que consiste en calcular el valor medio de la energía E_{n}(sb) de un intervalo de dichas sub-bandas para la sucesión de muestras de rango n dada;
- una etapa de cálculo de un valor de contraste auditivo C_{n,sb} a partir del valor de la relación R_{n}(sb) = \frac{E_{n}(sb)}{E_{n-S}(sb)} entre la energía E_{n}(sb) de este intervalo para la sucesión corriente y para una pluralidad de sucesiones precedentes E_{n-s}(sb) de muestras, el valor de contraste auditivo C_{n,sb} verificando la relación:
9
donde R_{n}(sb+i), i = -\nu designando el valor de la relación para las sub-bandas vecinas de la misma sucesión de muestras de rango n y del mismo espectro S_{n};
- una etapa de comparación del valor de contraste auditivo C_{n,sb} con un primer valor de umbral de silbido S_{1},
C_{n,sb} > S_{1};
- una etapa de cálculo de un parámetro de proximidad P_{n,sb} verificando la relación:
10
- una etapa de comparación del parámetro de proximidad P_{n,sb} con un segundo valor de umbral de silbido S_{2},
P_{n,sb} > S_{2}, la presencia de una señal parásita de silbido siendo revelada si las comparaciones de superioridad del valor de contraste auditivo C_{n,sb} y del parámetro de proximidad P_{n,sb} son ambos verificados.
12. Procedimiento según la reivindicación 11, caracterizado porque el mismo comprende además, previamente a la etapa de cálculo, en una sucesión de muestras de la señal audio numérica, de la composición espectral de esa señal:
- una etapa de cálculo, en esta sucesión de muestras e(i) de la energía temporal media,
Emed_{n} = \sum\limits_{i=1}^{N}e(i);
\newpage
\global\parskip0.950000\baselineskip
- una primera etapa de comparación de superioridad del valor calculado de esta energía temporal media con un primer valor de umbral, Umbral_{1}, el proceso siendo conducido a la etapa de cálculo de la energía temporal media, la energía de al menos una sucesión corriente de rango n siendo considerada como insuficiente, y, a una respuesta positiva a dicha primera etapa de comparación,
- una segunda etapa de comparación de superioridad de la relación de la energía de la sucesión corriente a la energía de una sucesión inmediatamente vecina, no adyacente, de rango n-2, con un segundo valor de umbral, Umbral_{2}, el proceso a una respuesta negativa a esta segunda etapa de comparación siendo conducido a la etapa de cálculo de la energía temporal media, la energía de la sucesión corriente y de la sucesión vecina siendo similares, el proceso a una respuesta positiva a esta segunda etapa de comparación, siendo continuado, la energía de dos sucesiones vecinas siendo creciente.
13. Procedimiento según la reivindicación 11, caracterizado porque el mismo comprende además una etapa de filtrado de los componentes espectrales en sub-bandas non audibles al oído humano.
14. Procedimiento según una de las reivindicaciones precedentes, caracterizado porque que la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un bordoneo consiste en detectar en esa señal parásita un ruido rosa en una banda de frecuencias comprendida entre 0 y 1100 Hz y de nivel sensiblemente constante en esta banda de frecuencias.
15. Procedimiento según la reivindicación 14, caracterizado porque la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un bordoneo comprende en al menos una vía izquierda o derecha de esa señal:
- una etapa que consiste en calcular en un sucesión de muestras de la señal audio numérica la composición espectral de esa señal audio numérica definida como el valor S_{n}(i) de componentes de frecuencias en sub-bandas de frecuencia central f_{i}, n designando el rango de la sucesión de muestras;
- en calcular, para un número determinado k de frecuencias centrales f_{i} del campo de las bajas frecuencias, una primera y una segunda relación de los valores de componente de frecuencias en sub-bandas para la sucesión de muestras corriente y la sucesión de muestras precedente \alpha_{i,n} = \frac{S_{n}(i)}{S_{n-1} (i)} respectivamente la sucesión de muestras corriente y la sucesión de muestras siguiente \beta_{i,n} = \frac{S_{n}(i)}{S_{n+1} (i)};
- en comparar el valor de las primera y segunda relaciones con un primer valor de umbral de bordoneo S’_{1};
- en someter la comparación de las primera y segundas relaciones a un criterio de proporción p/k del número p de comparaciones verificadas con relación a la totalidad de las k comparaciones efectuadas para las k frecuencias centrales f_{i} y, si ese criterio de proporción es verificado;
- en discriminar, entre los valores S_{n}(i) de componentes de frecuencias en sub-bandas, el valor máximo S_{n}(i_{máx}) de los valores de componentes de frecuencias relativas a la sucesión de muestras corriente;
- en calcular la relación de dicho valor máximo con el valor correspondiente al índice i_{max} del espectro de la sucesión precedente S_{n-1}(i_{máx}), M_{i,n} = \frac{S_{n}(i_{máx})}{S_{n-1}(i_{máx})}, y en comparar el valor de esa relación con un segundo valor de umbral de bordoneo S’_{2} ;
- en discriminar, en al menos una vía de transmisión en modo estereofónico de la señal audio numérica, la existencia de una comparación de superioridad de las primera y segunda relaciones \alpha_{i,n} y \beta_{i,n} con el primer valor de umbral de bordoneo S’_{1} y la existencia de una comparación de inferioridad de la relación de los valores máximos M_{n,i} con el segundo valor de umbral de bordoneo S’_{2};
- en repetir las operaciones precedentes y en memorizar periódicamente en una duración s determinada una variable binaria de pre-detección de la existencia de una señal parásita de bordoneo, a la variable binaria de pre-detección siendo atribuida al valor 1 cuando dichos criterios de comparación de superioridad y de inferioridad son satisfechos, y si no el valor 0;
- en descontar en la duración s determinada el número NV_{pd} de la variable binaria de pre-detección en el valor 1 y en comparar ese número con un tercer valor de umbral de bordoneo S’_{3}, NV_{pd} > S’_{3}, la presencia de una señal parásita de bordoneo siendo revelada si la comparación de superioridad del número NV_{pd} de la variable binaria de pre-detección en este tercer valor de umbral de bordoneo es verificado.
16. Procedimiento según una de las reivindicaciones precedentes, caracterizado porque que la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un defasaje entre vías de la señal numérica consiste:
\global\parskip0.990000\baselineskip
- en calcular el valor de defasaje entre vías de la señal audio numérica a partir de la función de inter-correlación de la señal audio numérica presente en cada una de dichas vías;
- en comparar el valor de defasaje calculado con un valor de umbral.
17. Procedimiento según la reivindicación 16, caracterizado porque la etapa que consiste en detectar, en esa señal audio numérica, una señal parásita tal como un defasaje relativo de las vías izquierda y derecha de la señal audio numérica comprende las etapas que consisten:
- en calcular en un número de muestras dado, la función de inter-correlación entre la señal audio numérica presente en la vía izquierda y en la vía derecha;
- en determinar el rango i de la muestra corr(i) correspondiente al valor máximo corr(i) de esta función de inter-correlación;
- en determinar a partir de un valor de atenuación A determinado el rango atenuado (i_{inf}), (i_{sup}) de las muestras de la función de inter-correlación distribuidas de un lado al otro del rango de la muestra máxima corr(i) y correspondiendo a un valor atenuado corr(i_{inf}), corr(i_{sup}) del valor A con relación al valor máximo de la función de inter-correlación;
- en calcular una primera relación \frac{corr(i)}{corr(i_{inf})} y una segunda relación \frac{corr(i)}{corr(i_{sup})}, del valor máximo con el valor atenuado inferior respectivamente superior;
- a comparar el valor de la primera y de la segunda relación con un primer valor de umbral de defasaje S''_{1} y, por comparación de igualdad o de inferioridad a este valor de umbral, el contraste de la señal audio numérica entre la vía de izquierda y vía de derecha siendo significativa,
- en determinar el rango (j) del segundo máximo relativo corr(j) de la función de inter-correlación;
- en calcular un parámetro de contraste C, en relación con el rango de valor máximo y con el rango de valor de segundo máximo de la función de inter-correlación;
- comparar el valor del parámetro de contraste C con un segundo valor de umbral de defasaje S''2, y por criterio de comparación de superioridad a este segundo valor de umbral,
- en repetir las operaciones precedentes sucesivas a la comparación de la primera y de la segunda relación con el primer valor máximo de la función de inter-correlación y en determinar en los rangos sucesivos el rango que presenta la mayoría de las ocurrencias, al defasaje relativo de las vías izquierda y derecha siendo atribuido un valor correspondiente a aquel del rango que presenta la mayoría de las ocurrencias.
18. Dispositivo de control de la calidad de una señal audio numérica, que comprende al menos:
- un módulo de conversión (1) de dicha señal audio numérica en una señal numérica de formato especializado
- un módulo de adquisición (2) de componentes de audio frecuencias izquierda y derecha que reciben dicha señal numérica de formato especializado que expide una señal audio numérica especializada para cada una de las vías izquierda y derecha;
- un módulo de detección (3) de defecto de codificación y de transmisión que recibe la señal audio numérica especializada para cada una de las vías izquierda y derecha y que permite detectar una al menos de las señales parásitas tales como breve corte, silbido, bordoneo, defasaje relativo a las vías izquierda y derecha, y expedir una señal de detección;
- un módulo de gestión (4) tipo interfase hombre máquina que recibe la señal de detección y que permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas.
19. Dispositivo según la reivindicación 18, caracterizado porque el mismo comprende además un módulo de cálculo y de detección de parámetros complementarios, ese módulo de cálculo y de detección recibiendo dicha señal numérica de formato especializado y dicha señal de detección y expidiendo una señal representativa de parámetros complementarios tales como modo mono o estéreo, valor del flujo de bits.
20. Programa que comprende instrucciones que permite detectar en una señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo, defasaje relativo de las vías izquierda y derecha de esa señal audio numérica y engendrar una señal de alarma en presencia de uno al menos de las señales parásitas.
ES00909432T 1999-03-08 2000-03-06 Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. Expired - Lifetime ES2276671T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FR9902821A FR2790845A1 (fr) 1999-03-08 1999-03-08 Procede de controle de la qualite d'un signal audionumerique distribue
FR9902821 1999-03-08
FR9904179A FR2790900B3 (fr) 1999-03-08 1999-04-02 Procede de controle de la qualite d'un signal audionumerique distribue
FR9904179 1999-04-02

Publications (1)

Publication Number Publication Date
ES2276671T3 true ES2276671T3 (es) 2007-07-01

Family

ID=26234851

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00909432T Expired - Lifetime ES2276671T3 (es) 1999-03-08 2000-03-06 Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual.

Country Status (5)

Country Link
EP (1) EP1159795B1 (es)
DE (1) DE60031767T2 (es)
ES (1) ES2276671T3 (es)
FR (1) FR2790900B3 (es)
WO (1) WO2000054441A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114125474A (zh) * 2020-08-31 2022-03-01 西梅科技(北京)有限公司 视频片段生成方法、装置和电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3034582C2 (de) * 1980-09-13 1982-09-02 Institut für Rundfunktechnik GmbH, 8000 München Verfahren zum Erkennen von auf digitalen Übertragungswegen auftretenden Signalstörungen
DE3311645A1 (de) * 1983-03-30 1984-10-11 Institut für Rundfunktechnik GmbH, 8000 München Verfahren zum erkennen von knackstoerungen
GB2260243A (en) * 1991-10-03 1993-04-07 British Broadcasting Corp Signal monitoring apparatus
DE4324292C1 (de) * 1993-07-21 1995-02-02 Detecon Gmbh Verfahren zur Ermittlung einer die Qualität einer digitalen Sprachübertragung kennzeichnenden Größe
DE59410225D1 (de) * 1994-11-25 2003-02-06 T Mobile Deutschland Gmbh Verfahren zur Ermittlung einer die Qualität einer digitalen Sprachübertragung kennzeichnenden Grösse
DE59712013D1 (de) * 1996-08-02 2004-11-18 Ascom Ag Bern Verfahren und anordnung zum beurteilen der qualität eines übertragenen sprachsignals

Also Published As

Publication number Publication date
FR2790900A1 (fr) 2000-09-15
FR2790900B3 (fr) 2001-04-27
DE60031767D1 (de) 2006-12-21
WO2000054441A1 (fr) 2000-09-14
EP1159795B1 (fr) 2006-11-08
DE60031767T2 (de) 2007-09-20
EP1159795A1 (fr) 2001-12-05

Similar Documents

Publication Publication Date Title
ES2317297T3 (es) Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares.
KR970007661B1 (ko) 스테레오포닉 오디오 신호의 입력세트 코딩방법
Noll Wideband speech and audio coding
FI115938B (fi) Laite ja menetelmä koodien sisällyttämiseksi audiosignaaleihin ja niiden dekoodaus
ES2323275T3 (es) Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares.
Thiede et al. A new perceptual quality measure for bit-rate reduced audio
Colomes et al. A perceptual model applied to audio bit-rate reduction
JP3418198B2 (ja) オーディオ信号の聴覚に適応した品質評価方法および装置
JPH0651795A (ja) 信号量子化装置及びその方法
US6421802B1 (en) Method for masking defects in a stream of audio data
Morel et al. A laboratory study on total noise annoyance due to combined industrial noises
Yu et al. Preferred listening levels of mobile phone programs when considering subway interior noise
ES2276671T3 (es) Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual.
Estreder et al. Improved Aures tonality metric for complex sounds
Jurgen Broadcasting with digital audio
Davidson et al. Low-complexity transform coder for satellite link applications
Brandenburg Introduction to perceptual coding
ES2228914T3 (es) Procedimiento para la cancelacion de errores de transmision en datos de audio digitales.
US11121721B2 (en) Method of error concealment, and associated device
KR101426596B1 (ko) 오디오 인코딩 방법
Sheffield et al. The effects of degraded audio on memory for speech passages
Baina et al. Quality of MPEG2 signal on a simulated digital terrestrial television
Colomes et al. A perceptual objective measurement system (POM) for the quality assessment of perceptual codecs
US20240196143A1 (en) Systems and methods for assessing hearing health based on perceptual processing
Sheffield et al. Results from subjective testing of the HD codec at 16-96 kbps